institut für physik physikalisches grundpraktikum · einfache lineare regression ist das...
Post on 30-Aug-2018
219 Views
Preview:
TRANSCRIPT
Institut für PhysikInstitut für PhysikPhysikalisches GrundpraktikumPhysikalisches Grundpraktikum
Regressionsanalyse: Anpassung von Regressionsanalyse: Anpassung von Modellfunktionen an Messwerte und Modellfunktionen an Messwerte und Extraktion physikalisch relevanter Extraktion physikalisch relevanter
Größen/ParameterGrößen/Parameter
Notwendige Vorbemerkungen INotwendige Vorbemerkungen I
Datenanalyse: oft Erhebung von Daten, die einen bestimmten bzw. vermuteten funktionalenZusammenhang zwischen den gemessenen Variablen (Eingangsgröße x, Aus-gangsgröße y) aufweisen
Mathematiker vermuten, Physiker wissen (bzw. glauben zu wissen)….Regressionsanalyse:statistisches Analyseverfahren zur Feststellung funktionaler Beziehungen zwischen einer abhängigen und einer oder mehreren unabhängigen Variablen
Anmerkungen:Nur im einfachsten Fall ist das Modell eine Gerade y = a·x + b !Grundsätzlich sollte man den Typ der Modellfunktion y = f(x) immer vorher
festlegen und auch gute Gründe haben, eine bestimmte Funktion zur „Kurven-anpassung“ zu verwenden!
Die hochproblematische Vorgehensweise, alle möglichen Funktionen „auf Verdacht“ durchzuprobieren und dann die "beste" auszuwählen, liefert häufig (z.B. bedingt durch „Ausreißer“) unbrauchbare Approximationen bzw. wissenschaftlich falsche (unsinnige) Ergebnisinterpretationen!
Ein tiefer gehendes Verständnis erfordert eine kritische und intensive Auseinandersetzung mit mathematisch-statistischen Begriffen und Methoden; für die uns hier aber leider nur (viel zu) wenig Zeit zur Verfügung steht! → CP, SP
Notwendige Vorbemerkungen IINotwendige Vorbemerkungen IIEs gibt verschiedene Kenngrößen der Statistik, um die Beziehung zwischen zwei Variablen zu beschreiben.
Kovarianz: ungeeignet, abhängig von Skalierung!
Pearsonscher Korrelationskoeffizient als Maß für (lineare!) Korrelation:
Bedeutung der Korrelation oft überbewertet: Ein hoher Korrelationskoeffizient bedeutet nicht immer eine hohe Korrelation!
Fatale Wirkung eines einzigen„Ausreißers“!
Karl Pearson(1857-1936)
Notwendige Vorbemerkungen IIINotwendige Vorbemerkungen IIIBedeutung der Korrelation oft überbewertet: Ein kleiner Korrelationskoeffizient bedeutet notwendigerweise auch nicht, dass es keinerlei Beziehung zwischen zwei Variablen gibt!
Eine Korrelation zwischen zwei Variablen zu beobachten, kann sehr leicht dazu verleiten, eine kausale Beziehung zwischen diesen Variablen zu sehen.Oft ist allerdings kein kausaler Zusammenhang vorhanden, wie im folgenden Beispiel:Die Schuhgröße ist zum Kalziumgehalt der Knochen korreliert. (Kinder haben weniger Kalzium in den Knochen als Erwachsene und natürlich ist die Schuhgröße von Kindern i.d.R. auch viel kleiner als die von Erwachsenen…..)
unkorrelierter Datensatz offensichtlicherZusammenhang
Datenvisualisierung ist sinnvoll!Datenvisualisierung ist sinnvoll!
Notwendige Vorbemerkungen IVNotwendige Vorbemerkungen IVBerechnung eines Regressionsmodells:Brauchen objektives Maß für die Zuverlässigkeit!Bestimmtheitsmaß (engl. coefficient of determination, auch goodness of fit):
Bestimmung der Verkleinerung des Vorhersagefehlers der Ausgangsgröße y, wenn man die Information aus den Werten der Eingangsgröße x in das Modell aufnimmt
definiert die Größe der Streuung von y, die durch x erklärt werden kann (Für die einfache lineare Regression ist das Bestimmtheitsmaß das Quadrat des Korrelationskoeffizienten)
Kritikpunkte:zeigt zwar die Qualität der linearen Approximation, jedoch nicht, ob das Modell
richtig spezifiziert wurde (Modelle, die mittels kleinster Quadrate geschätzt wurden, werden die höchsten r2 erhalten)
sagt nichts über die statistische Signifikanz des ermittelten Zusammenhangs und der einzelnen Regressoren aus (zusätzlicher Signifikanztest notwendig)
hohe Empfindlichkeit gegenüber Trends→ Residuenanalyse, Signifikanztest (insbes. Χ2-Test) und VisualisierungBrauchbare Online-Bücher zum Nachschlagen und Lesen:http://www.statistics4u.info/fundstat_germ/index.htmlhttp://de.wikibooks.org/wiki/Mathematik:_Statistik:_Regressionsanalysehttp://de.wikibooks.org/wiki/Mathematik:_Numerik
( ) ( )
( )( )10 2
1
2
1
2
1
2
2 ≤≤−
−−−==
∑
∑∑
=
== rySchätzwertundyMittelwertmityy
yyyyrB in
ii
n
iii
n
ii
ProblemstellungProblemstellungVollständige Messung:Eingangsgröße x; Ausgangsgröße yErfassung einer endlichen Menge von Messwertepaaren xi,yi = f(xi),einschließlich der vorhandenen Messunsicherheiten ∆xi und ∆yi(die auch abgeschätzt sein können)
Untersuchung/Ermittlung derModellfunktion bzw. physikalischen Gesetzmäßigkeit
y = f(x) als Hypothese
Prüfung einer Hypothesey = f(x) ist bekannt
mit physikalisch relevanten Parametern
Aufstellung einer Hypothesey = f(x) ist unbekannt
mit Parametern unbekannter Bedeutung
Ermittlung aller Parameter mitzugehörigen Unsicherheiten;
Extraktion physikalisch relevanterParameter/Größen
Ermittlung von Parametern mitzugehörigen Unsicherheiten;
Prüfung auf physikalisch relevanteInformation
Bestätigung oder Verwerfen der HypotheseAA BB
Beispiele aus VeröffentlichungenBeispiele aus Veröffentlichungen
Quelle: eigene Arbeiten in PHYSICAL REVIEW B
AA
AA
BB
Beispiel im Grundpraktikum IIBeispiel im Grundpraktikum II
Untersuchung des Verhaltens eines Drehspulmessinstrumentes;Bestimmung des realen Innenwiderstandes RA;
Prüfung der Gültigkeit von Knotensatz und Maschensatz
Schaltungsaufbau
Eingangsgröße
Ausgangsgröße
Erfassung einer MessreiheErfassung einer MessreiheVollständige Datentabelle:
Amperemeter: Messbereich 100 µA, 5 µA Teilung, Genauigkeitsklasse 1,5%½ Skalenteil Ableseunsicherheit → ∆I ≈ 3 µA GesamtunsicherheitDekadenwiderstände:10 x 10 Ω; 10 x 100 Ω; 10 x 1 kΩ; 10 x 10 kΩ mit jeweils 0,1% Fehlerklasse(größter Teilwiderstand der kaskadierten Dekaden dominiert Messunsicherheit!)
i Rx (Ω) Kombination I (µA) ∆Rx (Ω) ∆I (µA)1 480 4x100+8x10 30.0 1 32 990 9x100+9x10 47.5 1 33 1470 1x1k+4x100+7x10 57.0 10 34 1970 1x1k+9x100+7x10 65.0 10 35 3780 3x1k+7x100+8x10 78.0 10 36 4770 4x1k+7x100+7x10 82.0 10 37 10100 1x10k+1x100 90.0 100 38 13880 1x10k+3x1k+8x100+8x10 92.0 100 39 21900 2x10k+1x1k+9x100 95.0 100 3
10 68300 6x10k+8x1k+3x100 97.5 100 3
cov(Rx,I) = 251617.9 und r(Rx,I) = 0.59384881Syntax in EXCEL: KOVAR(x;y) und PEARSON(x;y)
Bestenfalls Tendenz erkennbar, aber Beziehung zwischen Bestenfalls Tendenz erkennbar, aber Beziehung zwischen RRxx und I ?und I ?
0
50
100
0 20000 40000 60000
Dekadenwiderstandswert Rx (Ω)
Stro
mst
ärke
I (µ
A)
Grafische DarstellungGrafische Darstellung
„Streudiagramm“ mit Messunsicherheiten („Fehlerkreuzen“) der Einzelpunkte:
Funktionale Beziehung (svw. physikalische Gesetzmäßigkeit) I = Funktionale Beziehung (svw. physikalische Gesetzmäßigkeit) I = f(Rf(R) ) zwischen Stromstärke und Widerstand gesucht!zwischen Stromstärke und Widerstand gesucht!
??
Einfachster (aber Einfachster (aber völlig unsinnigervöllig unsinniger) Ansatz) Ansatz
Regression mithilfe eines Polynoms der Ordnung N-1 bei einer Anzahl von N Stützstellen: „mathematisch exakte“ Lösung möglich (Regressionspolynom „trifft“ alle Stützstellen exakt)
-200
-100
0
100
200
0 25 50
Widerstand R (kΩ)
Stro
mst
ärke
I (µ
A)
Anpassung für 10 Stützstellen mit Polynom 9. Grades:"exakte" Beschreibung mit Bestimmtheitsmaß R2 = 1
„Oszillatorisches“ Verhalten von Polyno-men hoher Ordnung; Sinn und physika-lische Relevanz dieser Modellfunktion ist äußerst fragwürdig! Quatsch!
→→ „…„…Physiker wissenPhysiker wissen…“…“
∑−
=
⋅=1
0
)(N
i
ii RaRI
„„Erraten“ der Abhängigkeit I = Erraten“ der Abhängigkeit I = f(Rf(R))Linearisierung der empirischen Versuchsdaten durch geeignete Skalierung oder Koordi-natentransformation:R → R-1 und I → I-1 (meist nicht einfach erkennbar bzw. elementar!)Hypothese über die Modellfunktion:I-1 ~ R-1 bzw. I-1 = a·R-1 + b; b mit Einheit (A-1), a mit Einheit (V·A-2)Aufgaben:Numerische Bestimmung der Modellparameter a und b (einschließlich Unsicherheiten), Validierung des Modells (mathematisch-statistische Beurteilung der „Güte“, Betrachtung der Betrachtung der physikalischen Relevanz!physikalischen Relevanz!)
0
0.01
0.02
0.03
0 0.0005 0.001 0.0015 0.002
Leitfähigkeit G = R-1 (S)
Inve
rse
Stro
mst
ärke
I-1 (1
06 A-1)
"steilste" Gerade
"flachste" Gerade
"beste" (ausgleichende) Gerade
III
∆⋅=⎟⎠⎞
⎜⎝⎛∆ 2
11 RRR
∆⋅=⎟⎠⎞
⎜⎝⎛∆ 2
11
Einfaches grafisches Verfahren möglich für eine grobe Abschätzung:Die ausgleichende Gerade muss durch den Schwerpunkt der Punktwolke verlaufen, ihre Lage ist aber sehr subjektiv!
Transformation der MessreiheTransformation der Messreihe
Veränderte Datentabelle:
i Rx-1 (Ω-1) I-1 (µA-1) ∆Rx
-1 (Ω-1) ∆I-1 (µA-1)1 0.002083333 0.033333333 4.34028E-06 0.0033333332 0.001010101 0.021052632 1.0203E-06 0.001329643 0.000680272 0.01754386 4.6277E-06 0.0009233614 0.000507614 0.015384615 2.57672E-06 0.0007100595 0.00026455 0.012820513 6.99868E-07 0.0004930976 0.000209644 0.012195122 4.39504E-07 0.0004461637 9.90099E-05 0.011111111 9.80296E-07 0.000370378 7.20461E-05 0.010869565 5.19064E-07 0.0003544429 4.56621E-05 0.010526316 2.08503E-07 0.00033241
10 1.46413E-05 0.01025641 2.14367E-08 0.000315582
r(Rr(Rxx--11,I,I--11) = 0.999831421 ) = 0.999831421 ≈≈ 11
Klare positive lineare Korrelation! Klare positive lineare Korrelation! →→ Beziehung zwischen Beziehung zwischen RRxx
--11 und Iund I--11 existent;existent;wahrscheinlich linear mit positivem Anstiegwahrscheinlich linear mit positivem Anstieg
Hier nur aus Bequemlichkeit nicht sachgerecht gerundet…
Ableitung der Abhängigkeit IAbleitung der Abhängigkeit I--11 = f(R= f(R--11))
Die folgerichtige Anwendung von • Knotensatz, • Maschensatz und • Ohmschem Gesetzliefert eine physikalisch begründete Modellfunktion (Gesetzmäßigkeit) I-1 = f(R-1).Die bisher noch unbekannten Parameter „Steigung“ und „Achsenabschnitt“ haben eine reale physikalische Bedeutung.
IA-1
Rx-1
I0-1
~ RAI0-1
Problemstellung der linearen RegressionProblemstellung der linearen Regression
Eingangsgröße x
Aus
gang
sgrö
ße y „Messpunkt“ (xi; yi)
„Schätzpunkt“ (xi; ŷi)
Messunsicherheiten hier noch unberücksichtigt!
Funktion y = f(x) = a·x+b mit den Parametern a und b für „beste Beschreibung“ gesucht: Was heißt „beste Beschreibung“? Offensichtlich für die geringste (mittlere) Abweichung der ausgleichenden Geraden von den Messwerten!Residuum als „Vorhersagefehler“: εi = yi – ŷi = yi – (a·xi+b)Bedingung ∑ εi = 0 hinreichend und sinnvoll? Nein!!! Keine eindeutige Lösung…Idee von Laplace mit ∑εi= min. sehr „unhandlich“….
→ Methode der kleinsten Quadrate nach C.F. Gauß (mit 18 J. schon!): ∑ εi2 = min.
Lösungsverfahren für lineare RegressionLösungsverfahren für lineare RegressionAnnahmen bzw. Voraussetzungen:•Zusammenhang zwischen x und y ist linear (Unterscheidung zwischen linearen, krummlinigen bzw. kurvilinearen und nichtlinearen Zusammenhängen; kurvilineareZusammenhänge in lineare transformierbar, nichtlineare nicht!)•einzelne Messungen voneinander unabhängig; zeitlicher Trend während der Messun-gen oder eine gemeinsame Korrelation mit dritter Variabler nicht existent•Eigenschaft der „Homoskedastizität“ (gut an Residuen sichtbar): Werte der Ausgangs-größe y sind für jede Eingangsgröße x „normal verteilt“ (Gauß); die zugehörige Standardabweichung sy ist von x unabhängig bzw. konstant und x ist „fehlerfrei“ (giltbeides „streng genommen“ nicht!) → wird gern „stillschweigend“ übergangenBerechnung:Berücksichtigung von sy als (konstanter) „Störgröße“Minimierung der Summe der „Fehlerquadrate“
liefert lineares Gleichungssystem in a und b (vgl. lineare Algebra)Berechnung und Lösung im „blauen Skript“ (Nachlesen!)Wichtiger allgemeingültiger Hinweis:Eine „Gewichtung“ ist bei konstantem sy zwar für die numerischen Werte von a und b wirkungslos – aber nicht für ihre Unsicherheiten (Standardabweichungen) sa und sb!!!
ysbxay ++⋅=ˆ
( )( )
00
min22
=∂∂
=∂∂
→++⋅−== ∑∑
bSund
aS
sbxaySi
yiii
iε
1. Beispiel für Bedeutung der Gewichtung1. Beispiel für Bedeutung der Gewichtung
0.0000 0.0005 0.0010 0.0015 0.00200.000
0.005
0.010
0.015
0.020
0.025
0.030
0.035
Ergebnis mit Gewichtung: a = (11.16 ± 0.35)b = (0.0099 ± 0.0002)
Ergebnis ohne Gewichtung:a = (11.16 ± 0.07)b = (0.00994±0.00006)
Aus
gang
sgrö
ße y
Eingangsgröße xVergleich zeigt:Ohne „Gewichtung“ (d.h. Berücksichtigung von sy) völlig unrealistische Unsicherheiten (Standardabweichungen) für die Parameter!
2. Beispiel für Bedeutung der Gewichtung2. Beispiel für Bedeutung der Gewichtung
Vergleich zeigt:„Gewichtung“ (d.h. Berücksichtigung von variablen sy) berücksichtigt Messpunkte unterschiedlicher Messunsicherheit entsprechend → Gerade mit anderen Parametern (andere Lage)→ Achsenabschnitt „sicherer“ wegen „besserer“ Messwerte in Achsnähe; Anstieg auch „sicherer“
0.0000 0.0005 0.0010 0.0015 0.00200.000
0.005
0.010
0.015
0.020
0.025
0.030
0.035
Ergebnis mit variabler Gewichtung: a = (10.8 ± 0.2)b = (0.01004 ± 0.00009)
Ergebnis mit gemittelter konstanter Gewichtung:a = (11.16 ± 0.35)b = (0.0099±0.0002)
Aus
gang
sgrö
ße y
Eingangsgröße x
Weitere AnmerkungenWeitere AnmerkungenStandardabweichungen (Unsicherheiten) siIn der Praxis „echte“ Statistik meist nicht üblich bzw. viel zu aufwändig (im Grund-praktikum ohnehin!) - deshalb eher grobe Abschätzung „nach oben“ als pythagoräischeSumme von unkorrelierten systematischen und zufälligen Messunsicherheiten („kombinierte Standardabweichung) als i.a. „Überschätzung“ (vgl. Versuch F1)Residuenanalyse in grafischer Form:
Bestätigt die Überschätzung und zeigt kein „Muster“!
-0.004
-0.002
0
0.002
0.004
0 0.001 0.002
Eingangsgröße x
Abw
eich
ung
der
Aus
gang
sgrö
ßeAbschätzung
Residuum
Ergebnis der RegressionErgebnis der Regression
Feststellungen:offensichtlich Modellfunktion bzw. physikalische Gesetzmäßigkeit anhand der Messdaten bestätigtausgleichende Funktion beschreibt charakteristischen Verlauf innerhalb der Grenzen der
Messunsicherheiten hinreichend „exakt“ („Fehlerkreuze werden alle geschnitten; vgl. statistische Sicherheit bei Annahme der Gültigkeit der Normalverteilung für die Unsicherheiten der Messwerte)
Residuen (Abweichung zwischen Messwert und Prognose lt. Modellfunktion) sind alle geringer als die abgeschätzte Unsicherheit; Abschätzung „nach oben“ also realistisch
kritische Messgröße ist hier die Stromstärke, nicht der Widerstand
0
50
100
0 25 50
Widerstand Rx (kΩ)
Stro
mst
ärke
I (µ
A)
1
0
+=
RR
IIA
Institut für PhysikInstitut für PhysikPhysikalisches GrundpraktikumPhysikalisches Grundpraktikum
Regressionsanalyse: Anpassung von Regressionsanalyse: Anpassung von Modellfunktionen an Messwerte und Modellfunktionen an Messwerte und Extraktion physikalisch relevanter Extraktion physikalisch relevanter
Größen/ParameterGrößen/Parameter
Fortsetzung und „Fortsetzung und „DemystifizierungDemystifizierung“ von “ von numerischen Anpassungsergebnissennumerischen Anpassungsergebnissen
Rückgriff auf vorige VorlesungRückgriff auf vorige VorlesungUnter den Annahmen bzw. Voraussetzungen:„streuende“ Werte der Ausgangsgröße y sind für jede (festgehaltene) Eingangsgröße x normal verteilt (Gauß); zugehörige Standardabweichungen sy sind für jeden Wert von von x voneinander unabhängig (also auch wieder Zufallsvariablen)
ysbxay ++⋅=ˆ
Homoskedastizität HeteroskedastizitätAbweichungen der Datenpunkte von der Modelfunktion (hier Gerade):als Störterme bzw. Residuen bezeichnet, wahrscheinlichkeitstheoretisch jeweils Zufalls-variablenaber Heteroskedastizität: einfache Kleinstquadratmethode liefert nicht effizienteste Schätzwerte (d.h. kleinstmögliche Varianz bzw. Standardabweichung) für die Regres-sionsparameterAusweg: Normierung der Daten bzw. Varianzen → Gewichtung mit (variablen) sy
-2 im linearen Gleichungssystem für die Regressionsparameter (s. Skript!)
ResiduenbetrachtungResiduenbetrachtungStandardabweichungen (Unsicherheiten) siIn der Praxis „echte“ Statistik meist nicht üblich bzw. viel zu aufwändig - deshalb eher grobe Abschätzung „nach oben“ als pythagoräische Summe von unkorrelierten systematischen und zufälligen Messunsicherheiten („kombinierte Standardabweichung“) Residuenanalyse in grafischer Form:
Offene Probleme:•Sind die Residuen im statistischen Sinne tatsächlich „zufällig“ verteilt?•Welche Wahrscheinlichkeitsdichte beschreibt adäquat die (renormierte) Residuen-verteilung am besten? Ist das eine Gaußsche Normalverteilung (als Hypothese)?•Wie kann man das testen und quantitativ „messen“? → χ2-Test
-0.004
-0.002
0
0.002
0.004
0 0.001 0.002
Eingangsgröße x
Abw
eich
ung
der
Aus
gang
sgrö
ße
Abschätzung
Residuum
Überlegungen zum χÜberlegungen zum χ22--TestTestMotivation:Vergleich empirischer Daten mit einer angenommenen (theoretischen) Wahrscheinlich-keitsverteilung und Bestimmung der zugehörigen VerteilungsparameterHier ganz konkret:empirische Daten = renormierte Residuentheoretische Verteilung = Gaußsche Normalverteilung (Mittelwert 0?) als zu überprüfende sog. Nullhypothese
Einfachste Möglichkeit zur Überprüfung:grafischer „Vergleich“ eines Häufigkeits-Histogramms der renormierten Residuen mit einer angepassten Verteilung, die aus der Gaußschen Normalverteilung berechnet wurde
Schon ähnlich gezeigt:
„Suggestivfrage“:Ist dieses einfache „Verfahren“ genügend zuverlässig und aussagekräftig?
Überlegungen zum χÜberlegungen zum χ22--TestTest
Probleme:i.a. doch viel zu wenig Datenpunkte bzw. Residuen für ein Histogrammvisueller Vergleich nur erster Anhaltspunkt und nicht wirklich objektivfehlende statistische Rechtfertigung und fehlendes quantitatives Maß für die Richtigkeit der NullhypotheseSchlussfolgerung:→ objektive quantitative Prüfgröße, die den Grad der Übereinstimmung zwischen empirischer und theoretischer (parametrischer) Verteilung beziffert→ χ2-Test als statistisch begründeter Verteilungs- oder Anpassungstest
Grundlagen zum χGrundlagen zum χ22--TestTestDefinition der Prüfgröße χ2
misst die Größe der Abweichung von der Nullhypothese
k(xj) als empirisch ermittelte absolute Häufigkeiten undhj=n·Pj als theoretisch zu erwartende Häufigkeiten gemäß der Wahrscheinlichkeitsdichte
unmittelbare Folgerungen aus der Nullhypothese:→ wenn beide Verteilungen identisch, dann auftretende Differenzen durch rein zufällige Abweichungen (d.h. bei Wiederholung von Messreihen unterschiedliche Werte von χ2) → weichen empirische Häufigkeiten k(xj) „zu stark“ von den mit hj=n·Pj zu erwartenden ab, so wird die Nullhypothese abgelehnt werden müssen
Wahrscheinlichkeitsdichtefunktion f(χ2) der χ2-Werte:nicht analytisch berechenbar, nur mit numerischen Methoden zu ermitteln und i.a. tabellarisch angegeben
( )∑
= ⋅
⋅−=
N
j j
jjp Pn
Pnxk
1
22 )(
χ
⎟⎟⎠
⎞⎜⎜⎝
⎛⋅−
−⋅⋅
== 2
2
2 2)(exp
21)()(
sxx
sxfxP
π
Wahrscheinlichkeitsdichte f(χWahrscheinlichkeitsdichte f(χ22))
Wahrscheinlichkeitsdichtefunktion f(χ2)für verschiedene Freiheitsgrade f
Wahrscheinlichkeitsdichtefunktion f(χ2) hat nur einen einzigen Parameter:Anzahl der Freiheitsgrade
N als Klassenanzahl r als Anzahl von Parametern der theoretischen Verteilung
Mittelwert und Varianz
Konvergenz für wachsende f gegen die Gaußsche Normalverteilung mit Parametern wie oben
Additivität: zwei unabhängige Größen χ2-verteilt (jeweils mit den Freiheits-graden f1 und f2) → Summe beider Größen χ2-verteilt mit dem Freiheits-grad f1+f2
rNf −−= 1
f=2χ fs ⋅= 22
Irrtumswahrscheinlichkeit Irrtumswahrscheinlichkeit αα
Zuordnung zwischen (vorgegebenem) Freiheitsgrad f und einer bestimmten Irrtums-wahrscheinlichkeit α (nur mit numerischen Verfahren bestimmbar, tabelliert)
→ statistische Betrachtungsweise: keine einfachen „Ja/Nein-Aussagen“, sondern stets Wahrscheinlichkeitsaussagen!
Definition mit
( ) 22
2
χχαχ
dfp
∫∞
=
6,064,353,001,611,150,8310,5545
4,883,362,191,060,7110,4840,2974
3,672,371,420,5840,3520,2160,1153
2,411,390,7130,2110,1030,0510,0202
1,070,4550,1480,0163,93(-3)0,82(-4)1,57(-4)1
0,300,500,700,900,950,9750,99αf
Zurück zum „Rechenbeispiel“Zurück zum „Rechenbeispiel“
Wir irren uns hier mit einer sehr geringen Wahrscheinlichkeit!→ Hypothese ist „mit hoher Wahrscheinlichkeit“ richtig für Normalverteilung und folgerichtig auch für die gewählte Modellfunktion→ Größe „Chi^2“ muss möglichst minimiert werden
0.0000 0.0005 0.0010 0.0015 0.0020
0.010
0.015
0.020
0.025
0.030
0.035Modell: Gerade y = ax + bChi^2 = 0.03382R^2 = 0.99868a = (10.8 ± 0.2)b = (0.01004 ± 0.00009)
Aus
gang
sgrö
ße y
Eingangsgröße x
Vorsätzlich „unrichtiges“ ModellVorsätzlich „unrichtiges“ Modell
Wir irren uns hier mit einer um Größenordnungen höheren Wahrscheinlichkeit!→ Hypothese ist „mit hoher Wahrscheinlichkeit“ falsch für Normalverteilung und folgerichtig auch für die gewählte Modellfunktion (wie zu erwarten!)
0.0000 0.0005 0.0010 0.0015 0.00200.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
Modell: UrsprungsgeradeChi^2 = 350.58953R^2 = -14.37778a = 33.1UNSINNIG! ITERATION NICHT KONVERGENT!
Aus
gang
sgrö
ße y
Eingangsgröße x
„„Subtileres“ Beispiel: Beugung am GitterSubtileres“ Beispiel: Beugung am Gitter
gkk
λα ⋅=)sin(
Beziehung zwischen Gitterperiode g, Wellenlänge λ und Beugungsordnung k (↑ Wellenoptik im 3. Fachsemester)
Oberflächliche AuswertungOberflächliche Auswertungder Beugung am Gitterder Beugung am Gitter
-0.6
-0.4
-0.2
0
0.2
0.4
0.6
-10 -5 0 5 10
Beugungsordnung k
Beug
ungs
win
kel s
in (α
k') Lineare Regression mit sin(αk') = k·g-1·546,074 nm
g = (10,0010 ± 0,0017) µmχ2 = 82,13778R2 = 0,99994
Auf den „ersten flüchtigen Blick“ ein wunderschönes Ergebnis:g liegt sehr nahe am Referenzwert und hat eine sehr kleine UnsicherheitBestimmtheitsmaß R2 liegt sehr dicht am IdealwertAusgleichsgerade liegt praktisch ideal→ Aber der Wert von χ2 „stimmt den aufmerksamen Physiker sehr misstrauisch“!
Nähere BetrachtungNähere Betrachtung
In dieser Darstellung wird das bestehende Problem schon viel deutlicher – der Unterschied zeigt sich mit zunehmender Beugungsordnung k. Man erhält man für beide Seiten „ganz unerwartet“ deutlich verschiedene Ergebnisse für den Anstieg der Ursprungsgeraden! Woran liegt es, dass das verwendete Modell so unbefriedigend ist?
0
0.2
0.4
0 5 10
Beugungsordnung k
Beug
ungs
win
kel
sin (α k
) linke Seiterechte Seite
Lineare Regression für linke Seite:sin(αk') = 0.054965 k
R2 = 0.999991
Lineare Regression für rechte Seite:sin(αk') = 0.054239 k
R2 = 0.999992
Neue Überlegungen zum ModellNeue Überlegungen zum ModellIm vorhandenen experimentellen Aufbau ist es praktisch unmöglich, das Beugungsgitter so auszurichten, dass die Gitterebene exakt senkrecht zur optischen Achse steht. Durch die Verkippung werden alle Beugungsordnungen systematisch versetzt.
gGitternormale
optische Achse
Gittersubstrat (Glas)
Gitter
virtuelles Gitter
β
0. Ordnung
1. Ordnung
-1. Ordnung
gkk
λβα ⋅=+ )sin()sin(Neues Modell:
Neues ZwischenergebnisNeues Zwischenergebnis
gkk
λβα ⋅=+ )sin()sin(Neues Modell:
bg
kk +⋅=λα )sin(
Vereinfachung wegen konstantem Winkel β zu:
Numerische Resultate:χ2 = 15,62443R2 = 0,99998b = (-0,00193 ± 0,00008)g = (10,0008 ± 0,0024) µm
Auf die grafische Darstellung wurde hier (ausnahmsweise) verzichtet…
Dieses Ergebnis ist wegen der erheblichen Reduzierung von χ2 qualitativ deutlich besser bzw. erheblich vertrauenswürdiger – auch wenn g etwas „unsicherer“ geworden ist (alles im Vergleich zum ersten Ergebnis).
Der letzte „Feinschliff“ des ModellsDer letzte „Feinschliff“ des Modells
gGitternormale
optische Achse
Gittersubstrat (Glas)
Gitter
virtuelles Gitter
β
0. Ordnung
1. Ordnung
-1. Ordnung
Berücksichtigung des Parallelversatzes für die 0. Beugungsordnung:
( )⎟⎟⎠
⎞⎜⎜⎝
⎛−⋅−= βλαα sinarcsin0 g
kk( ) ( )g
kkλβαα ⋅=+− sinsin '
0
Das EndergebnisDas Endergebnis
0.7
0.9
1.1
1.3
1.5
1.7
1.9
-10 -5 0 5 10
Beugungsordnung k
Sche
inba
rer
Beu
gung
swin
kel
α k'
-0.0006
-0.0003
0
0.0003
0.0006
Res
iduu
m
MesswerteAnpassungResiduen
g = (10,0053 ± 0,0017) µmGitterkonstante
α0 = (1,2730 ± 0,0011) = (72,94 ± 0,06)°Scheinbarer Winkel der Nullposition
β = (0,026 ± 0,001) = (1,51 ± 0,06)°Neigungswinkel der Gitternormalen
χ2 = 1,18916Chi-Quadrat-Test
σn = 0,00029Standardabweichung der Anpassung
R2 = 1Güte der Anpassung
Mathematiker vermuten, Physiker wissen (bzw. glauben zu wissen)….
KonfidenzKonfidenz-- und und PrädiktionsintervallePrädiktionsintervalle
Wenn man das Konfidenzintervall für eine Regressionsgerade grafisch darstellt, erhält man dafür einen hyperbolischen Verlauf: Das Konfidenzintervall hängt ganz offensichtlich vom x-Wert ab. Je weiter er sich vom Schwerpunkt der „Datenpunkt-wolke“ entfernt, desto breiter wird der „Konfidenzschlauch“ (begrenzt durch innere blaue Kurven). Damit ist auch klar, warum eine Extrapolation stets unsicherer ist als eine Interpolation. Allgemein kann die „Schlauchbreite“ auch noch lokal variieren; insbesondere bei sehr inhomogen über x verteilten Datenpunkten!(Für beliebige Anpassungen mit anderen Funktionen gilt sinngemäß dasselbe.)
svw. Prädiktions- bzw. Vorhersage-Intervall
Konfidenz = Vertrauen
Ein anderes schönes Beispiel:Ein anderes schönes Beispiel:Brechung an einem PrismaBrechung an einem Prisma
Metalldampflampe
Vgl. Versuche „O9 Reflexion und Brechung“ bzw. „O3 Prismenspektrometer“
Spektralzerlegung von weißem polychromatischem Licht
natürliches Tageslicht
Glühlampe
Wellenlänge (nm)
Optische Dispersion: n = n (Optische Dispersion: n = n (λλ))
allg. Beziehung
minimale Ablenkung
Bessere Lösung, da nur eine Messgröße (außer ε)!Möglichst präzise Winkelmessung erforderlich!
Orientierungsdarstellung n = n(Orientierungsdarstellung n = n(λλ))
1.70
1.71
1.72
1.73
1.74
1.75
1.76
1.77
400 450 500 550 600 650 700
Wellenlänge (nm)
Bre
chun
gsin
dex
n
Eingezeichnete Kurve nur zur Orientierung!
4min
min
108)()()( −⋅≈∂∂
+∂
∂≤ ε
εδ
δununnu
%05.07.1
108)( 4
≈⋅
≤−
nnu
Anpassung n = n(Anpassung n = n(λλ))
Physikalisch begründete benutzerdefinierte Funktion auszuwählen!
Anpassung n = n(Anpassung n = n(λλ) mit Gewichtung) mit Gewichtung
Vergleich mit ReferenzwertenVergleich mit Referenzwerten
1.61
1.62
1.63
1.64
1.65
400 450 500 550 600 650 700
Wellenlänge λ (nm)
Bre
chun
gsin
dex
n Referenzdaten
Messdaten
Sellmeier-Modellfunktion (ein Term)
Messergebnisse an Flintglas SCHOTT F2
Manipuliert oder mit Sachargumenten überzeugt Manipuliert oder mit Sachargumenten überzeugt worden?worden?
Vollständige Gewichtung:Vollständige Gewichtung:mit Unsicherheiten behaftete Eingangsmit Unsicherheiten behaftete Eingangs-- und und
AusgangsgrößenAusgangsgrößen
Bisherige Betrachtungen:für die Regression mit Gewichtung y = f(x) nur die Unsicherheiten der Ausgangsgröße sy berücksichtigtEingangsgröße hat aber (objektiv bedingt) ebenso eine Unsicherheit sx (nur in ganz seltenen Fällen nicht), die nicht „ad hoc“ vernachlässigt werden darf(Feststellungen gelten für die allermeisten verfügbaren Software-Lösungen zur Regressionsrechnung, auch für QtiPlot und ORIGIN™!)Problem:Wie wirkt sich eine Unsicherheit sx auf die Ausgangsgröße y aus und wie kann man das in der Regressionsanalyse berücksichtigen?Lösungsansatz:bekannte und physikalisch begründete funktionale Abhängigkeit y = f(x)„Störung“ der Eingangsgröße x um δx → „Störung“ der Ausgangsgröße y um δy gemäß der Beziehung δy = f‘(x)·δx
Mit der (hypothetischen) Annahme, dass y „fehlerfrei“ vzw. „beliebig genau und sicher“ gemessen werden könnte: Allein aus der Unsicherheit sx von x folgt über den eindeutigen kausalen Zusammenhang y = f(x) eine Unsicherheit in y von f‘(x)·sx !
Vollständige Gewichtung:Vollständige Gewichtung:mit Unsicherheiten behaftete Eingangsmit Unsicherheiten behaftete Eingangs-- und und
AusgangsgrößenAusgangsgrößenWeitere Annahme:Die beiden Größen x und y werden z.B. mit verschiedenen Messgeräten oder Messmethoden erfasst. Dann gibt es gute Gründe dafür, ihre jeweiligen (ursprüng-lichen) Messunsicherheiten als unkorrelierte Größen anzusehen!Folgerung:Zur Messunsicherheit sy der Ausgangsgröße kann pythagoräisch ein Beitrag der Form f‘(x)·sx addiert werden, so dass sich daraus eine „resultierende“ (kombinierte) Unsicherheit ergibt. Diese Größe kann zur (vollständigen) Gewichtung in der Regression eingesetzt werden.
Anmerkung:Beim Geradenausgleich y = a·x+b ist selbstverständlich f‘(x) = aProblematisch ist aber, dass uns f‘(x) nicht „ad hoc“ bekannt ist, sondern erst mithilfe der Regression berechnet wird…Idee:Wir machen eine erste Abschätzung für f‘(x), berechnen die sy‘ und gehen damit in die Regression (0. Iterationsschritt). Den so verbesserten Wert von f‘(x) verwenden wir im nächsten Iterationsschritt für dieselbe Prozedur usw. usf. Und die Abbruchbedingung?Sehr „kitzlig“ wird es für nichtlineare Funktionen y = f(x), weil mehr zu berechnen ist…
( ) ( )22 )('' xyy sxfss ⋅+=
IterationsprozedurIterationsprozedurDatenvorbereitung:
Eingabe von x und y (ggf. Linearisierung)Berechnung von sx und sy
Vorgabe der parametrischen Modellfunktion f(x)
Erste Schätzung für Parameter und f‘(x)
Berechnung der sy‘Regression mit Gewichtung nach den sy‘
Neuberechnung von f‘(x) entsprechendden verbesserten Parametern
Überprüfung der Abbruchbedingung(zweckmäßig: Veränderung der Unsicherheiten von Parametern)
Abbruch bei „Erfolg“ Schleife
Konvergenzverhalten?!
Manueller Test für die Manueller Test für die GeradenanpassungGeradenanpassung
0
10
20
30
40
50
0 50 100
Eingangsgröße x
Aus
gang
sgrö
ße y
Hier „gutartiges“ Konvergenzverhalten zu beobachten gewesen:Abbruchbedingung (unveränderte 2. signifikante Ziffer der Unsicherheit im Anstieg) bereits nach 4 Iterationsschritten erfüllt!
schwarz: Fehlerbalken für ursprüngliche Unsicherheitenrot: Fehlerbalken mit Beitrag der a·sx
FazitFazit des Problemsdes Problems
Die uns unmittelbar zur Verfügung stehende Software leistet diese Form der Gewichtung nicht. Auch eine entsprechende kommerzielle Lösung ist nicht bekannt.
Eine fertige Lösung existiert derzeit (noch) nicht und erfordert einen ganz erheblichen Arbeitsaufwand für die Programmierung.
In Einzelfällen kann auf diese spezielle Gewichtung u.U. ganz verzichtet werden, weil die Eingangsgrößen x „fehlerfrei“ bzw. „sicher“ sind (z.B. Ganzzahligkeit bei Beugungsordnungen) oder auch dann, wenn die Bedingung sy>>f‘(x)·sx erfüllt ist (sehr schwache Abhängigkeit f(x)).
Im Grundpraktikum werden wir uns mit der Gewichtung nach den Unsicherheiten der Ausgangsgrößen begnügen müssen.
Dieses numerische Problem bleibt ggf. der LV CP I+II vorbehalten.
top related