1 statisik lv nr.: 1852 ws 2005/06 20. dezember 2005
TRANSCRIPT
![Page 1: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/1.jpg)
1
STATISIK
LV Nr.: 1852
WS 2005/06
20. Dezember 2005
![Page 2: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/2.jpg)
2
Theorie
• Schätzen– Punktschätzer– Intervallschätzer– Eigenschaften
• Testen– Einführung– Hypothesen– Fehlentscheidungen– Spezielle Tests
![Page 3: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/3.jpg)
3
Schätzverfahren
• Schluss von der Grundgesamtheit auf eine Stichprobe: Inklusionsschluss (direkter Schluss)
• Schluss von einer Stichprobe auf Parameter einer Grundgesamtheit: Repräsentationsschluss (indirekter Schluss)
• Unterscheidung: – Punktschätzer (einziger Schätzwert)– Intervallschätzer (Konfidenzintervall)
![Page 4: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/4.jpg)
4
Schätzverfahren
• Punktschätzer: Für den zu schätzenden Parameter wird nur ein einziger Schätzwert angegeben. – Bsp. Schätze das unbekannte arithm. Mittel einer
Grundgesamtheit μ durch das arithm. Mittel der Stichprobe
• Vorsicht: Die in einer Stichprobe realisierten Merkmalsausprägungen sind zufallsabhängig, Punktschätzer stimmen daher nur in den seltensten Fällen mit dem wahren Parameter überein.
x
![Page 5: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/5.jpg)
5
Schätzverfahren
• Intervallschätzer: Ausgehend von einer Stichprobe wird ein Intervall bestimmt, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit liegt (Konfidenzintervall).
• Irrtumswahrscheinlichkeit ≤ α
• Konfidenzintervall zum Niveau 1-α (Vertrauensbereich od. Vertrauensintervall)
![Page 6: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/6.jpg)
6
Schätzverfahren
• Ges: Konfidenzintervall für das arithm. Mittel: ZV
• Symmetrische Wahrscheinlichkeitsintervall
• Symmetrie: z(α /2) = –z(1-α/2)
daher: z = –z(1-α/2) und –z = z(α /2) und
α α1
2 2
X-μW(z n z ) 1- α
σ
2X~N(μ,σ )
α1)zσμXzσW(μ XX
![Page 7: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/7.jpg)
7
Schätzverfahren
• In diesem Wahrscheinlichkeitsintervall liegt das arithm. Mittel mit der Wahrscheinlichkeit 1- α.
• Gesucht ist ist aber nicht das Ws-Intervall der ZV, sondern das Konfidenzintervall für das unbekannte arithm. Mittel µ der Grundgesamtheit. – Varianz σ² der Grundgesamtheit bekannt– Varianz σ² der Grundgesamtheit unbekannt
![Page 8: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/8.jpg)
8
Schätzverfahren
• Konfidenzintervall für µ bei bekannter Varianz σ² der Grundgesamtheit:
Konkreter Stichprobenmittelwert XX zσxμzσx
x
![Page 9: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/9.jpg)
9
Schätzverfahren
• Konfidenzintervall für µ bei unbekannter Varianz σ² der Grundgesamtheit:
• Statt der unbekannte Varianz σ² wird die Stichprobenvarianz S² verwendet.
• Zufallsvariable:
T ist t- verteilt mit v=n-1 Freiheitsgradenn
SμX
T
![Page 10: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/10.jpg)
10
Verteilungen
• Es gilt:– Ist T der Quotient einer Standardnormalverteilung und
der Quadratwurzel des Mittelwerts von n quadrierten unabhängigen N(0,1)-verteilten ZV Xi, dann folgt T einer t-Verteilung mit v=n Freiheitsgraden.
• Zufallsvariable:
T ist t- verteilt mit v=n Freiheitsgraden T~tn
• t-Verteilung ist symmetrisch
0
n2i
i=1
XT=
1X
n
![Page 11: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/11.jpg)
11
Verteilungen
• t- Verteilung mit v Freiheitsgraden:– Erwartungswert (für n>1):
E(T) = 0– Varianz (für n>2):
Var(T) = n / (n-2)
• Für n→∞ geht die t-Verteilung in die N(0,1) über.
• Approximation durch N(0,1)-Vt für n ≥ 30
![Page 12: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/12.jpg)
12
• Wahrscheinlichkeitsintervall für das arithm. Mittel bei unbekannter Varianz:
• Wobei t = t(1-α/2);n-1 = – t(α/2);n-1 die Punkte sind, bei denen die Verteilungsfunktion der t- Verteilung mit n-1 Freiheitsgraden die Werte 1-α/2 bzw. α/2 besitzt.
Schätzverfahren
α α;n-1 1- ;n-1
2 2
X-μW(t t ) 1- α
S
n
![Page 13: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/13.jpg)
13
• Konfidenzintervall für das arithm. Mittel bei unbekannter Varianz:
Konkreter Stichprobenmittelwert
Konkrete Stichprobenvarianz
Schätzverfahren
x
XX σ̂txμσ̂tx
Xσ̂
![Page 14: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/14.jpg)
14
Schätzverfahren
• Konfidenzintervall für den Anteilswert:
• Ann. genügend großer Stichprobenumfang, d.h. Approximation durch N-Vt möglich, E(P) = θ und Var(P) = σP
²
• Standardisierte ZV:
P
P-θZ=
σ
![Page 15: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/15.jpg)
15
Schätzverfahren
• Wahrscheinlichkeitsintervall:
• Konfidenzintervall:
• Ist σP unbekannt, verwendet man stattdessen die Stichprobenvarianz des Anteilswertes als Schätzer.
α α1
P2 2
P-θW(z z ) 1- α
P Pp-zσ θ p+zσ
![Page 16: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/16.jpg)
16
Schätzverfahren
• Konfidenzintervall für die Varianz
• ZV (n-1)S² / σ² ist χ² verteilt mit v=n-1 Freiheitsgraden
• Wahrscheinlichkeitsintervall:
• Konfidenzintervall:
22 2α α
;n-1 1- ;n-1P2 2
(n-1)SW(χ χ ) 1- α
σ
2 2
2 2α α
1- ;n-1 ;n-12 2
(n-1)S (n-1)S;
χ χ
![Page 17: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/17.jpg)
17
Stichprobenumfang
• Bisher: – Geg: Stichprobenumfang n, Sicherheitsgrad 1-α– Ges: Konfidenzintervall
• Jetzt: – Geg: Konfidenzintervall, Sicherheitsgrad 1-α– Ges: Stichprobenumfang
• Absoluter Fehler Δμ = zσX ist ein Maß für die Genauigkeit der Schätzung
• Breite des Konfidenzintervalls: 2Δμ
![Page 18: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/18.jpg)
18
Stichprobenumfang
• Frage: Welchen Stichprobenumfang benötigt man, um einen Parameter (arithm. Mittel) bei vorgegebener Genauigkeit und vorgegebenem Sicherheitsgrad zu schätzen?
2
22
μ)(
σzn
![Page 19: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/19.jpg)
19
Eigenschaften von Schätzern
Eigenschaften von Schätzfunktionen:
• Erwartungstreue
• Effizienz
• Konsistenz
• Suffizienz
![Page 20: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/20.jpg)
20
Eigenschaften von Schätzern
• Erwartungstreue
• Eine Schätzfunktion heißt erwartungstreu (unverzerrt, unbiased), wenn ihr Erwartungswert mit dem wahren Parameter übereinstimmt.
• Bedingung:
• Es gilt:
Θ)Θ̂E(
μ)XE( 22 σ)E(S
![Page 21: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/21.jpg)
21
Eigenschaften von Schätzern
• Effizienz:
• Von 2 erwartungstreuen Schätzfunktionen gilt jene als effizienter (wirksamer), die die kleinere Varianz aufweist.
• Eine Schätzfunktion heißt effizient, wenn folgende Bedingungen erfüllt sind:
Θ)Θ̂E( )Θ̂Var()Θ̂Var( *
tionSchätzfunk treueerwartungsbeliebigeΘ̂*
![Page 22: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/22.jpg)
22
Eigenschaften von Schätzern
• Konsistenz:
• Eine Schätzfunktion heißt konsistent, wenn der Schätzwert bei laufender Vergrößerung des Stichprobenumfangs (n→∞ oder n→N) mit dem zu schätzenden Parameter zusammenfällt.
![Page 23: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/23.jpg)
23
Eigenschaften von Schätzern
• Suffizienz:
• Eine Schätzfunktion heißt suffizient (erschöpfend), wenn sie sämtliche Informationen über den zu schätzenden Parameter, welche die Stichprobe enthält ausschöpft.
![Page 24: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/24.jpg)
24
Schätzverfahren
• Methode der Kleinsten Quadrat
• Maximum Likelihood
• Momentenmethode
![Page 25: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/25.jpg)
25
Konfidenzintervall
• Ausgehend von dem Ergebnis einer Stichprobe wird ein Intervall angegeben, in dem der zu schätzende Parameter der Grundgesamtheit mit einer bestimmten vorgegebenen Wahrscheinlichkeit (1-α) liegt.
![Page 26: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/26.jpg)
26
Konfidenzintervall
• Bsp. Arithmetisches Mittel (ist bei N-Vt. Grundgesamtheit bzw. bei genügend großem Stichprobenumfang N-Vt.). Der wahre Parameter µ liegt mit der Wahrscheinlichkeit (1-α) im Intervall
XX
zσX;zσX
![Page 27: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/27.jpg)
27
KonfidenzintervallKonfidenzintervall für den Parameter µ (bei N-Vt. des Stichprobenmittelwertes)
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Stichprobenmittelwert
Dic
hte
der
N(0
,1)
1-α = 0,95
α/2 = 0,025
Konfidenzintervall
α/2 = 0,025
x-z(α/2)σ x+z(1-α/2)σ
![Page 28: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/28.jpg)
28
Konfidenzintervall
• Bsp. Körpergröße: – Mittelwert =173,42– Standardabweichung = 9,54 – N = 73– 2-seitiges KI zum Niveau α=0,05
Wahrscheinlichkeit, dass der wahre Parameter im KI liegt ist 0,95. Quantile der t-Vt: t=±1,99 Quantil der N(0,1)-Vt: z=±1,96
KI [171,19 ≤ µ ≤ 175,65] t-VtKI [171,23 ≤ µ ≤ 175,61] N(0,1)-Vt
![Page 29: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/29.jpg)
29
Statistische Tests
• Fragen: – Besteht ein Zusammenhang zw. dem
Geschlecht und dem Rauchverhalten?– Ist der Ausschussanteil kleiner als 5%?– Ist die mittlere Länge eines Werkstücks, das
von zwei verschiedenen Maschinen hergestellt wird, gleich?
– Soll ein neues Medikament zugelassen werden?– Stammen Daten aus einer N-Vt
Grundgesamtheit?– …
![Page 30: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/30.jpg)
30
Statistische Tests
• Deskriptive Analyse der Daten– Lage- und Streuungsmassen– Kontingenztafeln – Korrelationsmaße– Verteilungsdiagramme– …
• Statistischer Test, um eine theoretisch abgesicherte Entscheidung zu treffen.
![Page 31: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/31.jpg)
31
Statistische Tests
Einführung:
• Testen von Hypothesen (Annahmen, Behauptungen)
• Statistischer Test: Verfahren, mit dessen Hilfe sich bestimmte Hypothesen auf ihre Richtigkeit hin überprüfen lassen.
• Statistische Testverfahren basieren auf Stichprobentheorie
![Page 32: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/32.jpg)
32
Statistische Tests
Einführung:• Ziel: Richtigkeit von Aussagen über die
Verteilung einer Zufallsvariablen überprüfen. • Entscheidungsgrundlage: Ergebnis eines
zufälligen Vorgangs.• Daher: Entscheidungen nicht immer richtig• Aber: Beim Vorliegen einiger der möglichen
Verteilungen ist die Wahrscheinlichkeit falsch zu entscheiden beschränkt.
![Page 33: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/33.jpg)
33
Statistische Tests: Hypothesen
Hypothesen:
• Annahmen, Behauptungen, Aussagen über unbekannte Grundgesamtheit
• 2 Arten von Hypothesen:– Parameterhypothesen, Überprüfung durch
Parametertests– Verteilungshypothesen, Überprüfung durch
Verteilungstests
![Page 34: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/34.jpg)
34
Statistische Tests: Hypothesen
Formulierung von Hypothesen:
• Nullhypothese H0 (Ausgangshypothese)
• Alternativhypothese H1 (Gegenhypothese)
![Page 35: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/35.jpg)
35
Statistische Tests: Hypothesen
Bsp.• Anteile:
– H0: Ausschussanteil = 10%
– H1: Ausschussanteil > 10%
• Mittelwerte: – H0: Mittlere Länge eines Werkstücks = 5cm
– H1: Mittlere Länge eines Werkstücks 5cm
• Gruppenvergleich: – H0: Gruppe 1 und Gruppe 2 sind gleich
– H1: Gruppe 1 und Gruppe 2 sind ungleich
![Page 36: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/36.jpg)
36
Statistische Tests
• Entscheidung für H0 oder H1 basiert auf einer Stichprobe x1,…,xn
• Wahrscheinlichkeitsaussage ob H0 zutrifft oder nicht.
• Frage: H0 ablehnen (verwerfen) oder H0 nicht ablehnen?
![Page 37: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/37.jpg)
37
Statistische Tests
Mögliche Fehlentscheidungen:
• Fehler 1. Art (α-Fehler): obwohl H0 korrekt ist wird H0 abgelehnt
• Fehler 2. Art (β-Fehler): obwohl H0 falsch ist wird H0 nicht abgelehnt.
![Page 38: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/38.jpg)
38
Statistische Tests
• Fehlentscheidungen
Trifft zu
EntscheidungH0 H1
H0Richtige
EntscheidungFehler 2. Art (β -Fehler)
H1Fehler 1. Art
(α-Fehler)Richtige
Entscheidung
![Page 39: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/39.jpg)
39
Statistische Tests
Problem bei Fehlentscheidungen:
• Falsche Entscheidung
• Man weiß nicht, ob man in einer konkreten Situation einen Fehler macht, sondern nur welcher Art dieser ist.
![Page 40: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/40.jpg)
40
Statistische Tests
• Signifikanzniveau eines Tests α:– Die Wahrscheinlichkeit eine Fehler 1. Art zu
machen ist höchstens α, daher „Test zum Niveau α“ - egal mit welcher Wahrscheinlichkeit ein Fehler 2. Art begangen wird.
![Page 41: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/41.jpg)
41
Statistische Tests
• Trifft H0 zu und entscheidet man sich für H1, dann ist die Wahrscheinlichkeit dabei einen Fehler zu machen ≤ α (α bekannt, wird festgelegt).
• Trifft H1 zu und entscheidet man sich für H0, dann ist die Wahrscheinlichkeit dabei eine Fehler zu machen = β (β unbekannt).
![Page 42: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/42.jpg)
42
Statistische TestsFehler 1. Art und Fehler 2. Art
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6
x
f(x)
N(0,1) N(3,1)
Fehler 1. Art
Fehler 2. Art
µ0=0 µ1=3
![Page 43: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/43.jpg)
43
Statistische Tests
• D.h. durch Festlegen des α-Niveaus ist nur die Entscheidung für H1 abgesichert.
• Bei Entscheidung für H1: – H1 ist richtig, – H1 ist falsch, ich mache einen Fehler mit
Wahrscheinlichkeit ≤ α.
• Daher: Formuliere H0 so, dass sie abgelehnt werden soll. bzw. in H0 soll diejenige Annahme festgelegt werden, der die größere Bedeutung zukommt.
![Page 44: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/44.jpg)
44
Statistische Tests
• Bsp. Medikamententest H0: Medikament ist nicht wirksam gegen H1: Medikament wirkt. – Fehler 1. Art: das Medikament wirkt nicht, man
glaubt aber dass es wirkt– Fehler 2. Art: das Medikament wirkt, man
glaubt aber dass es unwirksam ist.
Wähle α=0,01 (sehr klein), da Risiko ein nichtwirksames Medikament als wirksam einzustufen sehr groß ist.
![Page 45: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/45.jpg)
45
Statistische Tests
• Arten von Hypothesen:
• Einseitige Hypothesen– H0: θ ≤ θ0 gegen H1: θ > θ0
– H0: θ ≥ θ0 gegen H1: θ < θ0
• Zweiseitige Hypothesen– H0: θ = θ0 gegen H1: θ ≠ θ0
• Verteilungshypothesen:– H0: bestimmten Vt. gegen H1: nicht diese Vt.
![Page 46: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/46.jpg)
46
Statistische Tests
• Arten von Testproblemen:– Einseitige Testprobleme
• Tests für einseitige Hypothesen
– Zweiseitige Testprobleme• Tests für zweiseitige Hypothesen
– Anpassungstests• Test für Verteilungshypothesen
![Page 47: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/47.jpg)
47
Statistische Tests
• Gütefunktion oder Macht g(θ): Wahrscheinlichkeit sich für H1 zu entscheiden, falls θ der wahre Parameter ist.
• Test zum Niveau α:– g(θ) ≤ α für alle θ H0
– g(θ) ≥ α für alle θ H1
– Ist θ H1, ist 1-g(θ) Wahrscheinlichkeit für den Fehler 2. Art.
– Funktion 1-g(θ) heißt Operationscharakteristik (OC)
![Page 48: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/48.jpg)
48
Statistische TestsGütefunktion (einseitiger Test)
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
499 499,5 500 500,5 501 501,5 502
µ
g(µ
)
µ0=500
![Page 49: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/49.jpg)
49
Statistische TestsOperationscharaktersitik OC Kurve (einseitiger Test)
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
499,5 500 500,5 501 501,5 502
µ
Feh
ler
2.A
rt =
1-g
(µ)
µ0=500
![Page 50: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/50.jpg)
50
Statistische Tests
• Trennschärfe eines Tests:– Steilheit der OC Kurve 1-g(θ)– Es gilt: Je größer die Stichprobe umso besser
die Trennschärfe.
![Page 51: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/51.jpg)
51
Statistische TestsOperationscharaktersitik OC Kurve (einseitiger Test),
unterschiedliche Stichprobengrößen n (n=9, n=100, n=10000)
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,65
0,70
0,75
0,80
0,85
0,90
0,95
1,00
499,5 500 500,5 501 501,5 502
µ
Feh
ler
2.A
rt =
1-g
(µ)
µ0=500
![Page 52: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/52.jpg)
52
Statistische Tests
• Vorgehensweise bei statistischen Tests (I):– Formulierung von H0 und H1 und Festlegen des
Signifikanzniveaus– Festlegung einer geeigneten Prüfgröße und
Bestimmung der Testverteilung unter H0.– Bestimmung des kritischen Bereichs– Berechnung der Prüfgröße (=Teststatistik)– Entscheidung und Interpretation
![Page 53: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/53.jpg)
53
Statistische Tests
• Vorgehensweise bei statistischen Tests (II):– Formulierung von H0 und H1 und Festlegen des
Signifikanzniveaus– Festlegung einer geeigneten Prüfgröße und
Bestimmung der Testverteilung unter H0.– Berechnung der Prüfgröße (=Teststatistik)– Bestimmung des p-Wertes der Teststatistik– Entscheidung und Interpretation
![Page 54: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/54.jpg)
54
Statistische Tests
• p-Wert– Anstatt den kritischen Bereich bzw. die
kritischen Werte zu bestimmen, Berechnung des „p-Wertes“.
– p-Wert (p-value): Niveau, bei dem der Test gerade noch abgelehnt hätte.
– Vergleich des p-Wertes mit dem vorher festgesetzten Niveau α.
– Entscheidung: Lehne H0 ab, wenn p-Wert < α
![Page 55: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/55.jpg)
55
Statistische Tests
• Einseitige Tests (I)– H0: θ ≤ θ0 gegen H1: θ > θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.– Bestimmung des kritischen Bereichs bzw. des
kritischen Werts (c)
– T > c, lehne H0 ab
– T ≤ c, lehne H0 nicht ab
![Page 56: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/56.jpg)
56
Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Prüfgröße
Dic
hte
de
r T
es
tve
rte
ilun
g
1-α = 0,95
α = 0,05
Kritischer BereichH0 ablehnen
H0 nicht ablehnen
Kritischer Wert: c
![Page 57: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/57.jpg)
57
Statistische Tests
• Einseitige Tests (II)– H0: θ ≤ θ0 gegen H1: θ > θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.– Bestimmung des p-Wertes
– p < α, lehne H0 ab
– p ≥ α, lehne H0 nicht ab
![Page 58: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/58.jpg)
58
Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Prüfgröße
Dic
hte
der
Tes
tver
teil
un
g
1-α = 0,95
α = 0,05
Kritischer BereichH0 ablehnen
H0 nicht ablehnen
Kritischer Wert: c
Prüfgröße=1,64 p-Wert=0,05
![Page 59: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/59.jpg)
59
Statistische Tests
• Einseitige Tests (I)– H0: θ ≥ θ0 gegen H1: θ < θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.– Bestimmung des kritischen Bereichs bzw. des
kritischen Werts (c)
– T < c, lehne H0 ab
– T ≥ c, lehne H0 nicht ab
![Page 60: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/60.jpg)
60
Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Prüfgröße
Dic
hte
de
r T
es
tve
rte
ilun
g
1-α = 0,95
α = 0,05
Kritischer BereichH0 ablehnen
H0 nicht ablehnen
Kritischer Wert: c
![Page 61: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/61.jpg)
61
Statistische Tests
• Einseitige Tests (II)– H0: θ ≥ θ0 gegen H1: θ < θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.– Bestimmung des p-Wertes
– p < α, lehne H0 ab
– p ≥ α, lehne H0 nicht ab
![Page 62: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/62.jpg)
62
Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Prüfgröße
Dic
hte
der
Tes
tver
teil
un
g
1-α = 0,95
α = 0,05
Kritischer BereichH0 ablehnen
H0 nicht ablehnen
Kritischer Wert: c
Prüfgröße=-1,64 p-Wert=0,05
![Page 63: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/63.jpg)
63
Statistische Tests
• Zweiseitige Tests (I)– H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.– Bestimmung des kritischen Bereichs bzw. der
kritischen Werte (cu und co)
– T < cu oder T > co, lehne H0 ab
– cu ≤ T ≤ co, lehne H0 nicht ab
![Page 64: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/64.jpg)
64
Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Prüfgröße
Dic
hte
de
r T
es
tve
rte
ilun
g
1-α = 0,95
α/2 = 0,025
Kritischer Bereich
H0 ablehnen
H0 nicht ablehnen
Kritischer Wert: co
Kritischer Bereich
H0 ablehnen
α/2 = 0,025
Kritischer Wert: cu
![Page 65: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/65.jpg)
65
Statistische Tests
• Zweiseitige Tests (II)– H0: θ = θ0 gegen H1: θ ≠ θ0 und α = 0,05
– Teststatistik (T) und deren Verteilung unter H0
bestimmen.– Bestimmung des p-Wertes
– p < α, lehne H0 ab
– p ≥ α, lehne H0 nicht ab
![Page 66: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/66.jpg)
66
Statistische TestsTestverteilung = Stichprobenverteilung der Prüfgröße
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-3 -2,5 -2 -1,5 -1 -0,5 0 0,5 1 1,5 2 2,5 3
Prüfgröße
Dic
hte
der
Tes
tver
teil
un
g
1-α = 0,95
α/2 = 0,025
Kritischer Bereich
H0 ablehnen
H0 nicht ablehnen
Kritischer Wert: co
Kritischer Bereich
H0 ablehnen
α/2 = 0,025
Kritischer Wert: cu
Prüfgröße= -1,96, +1,96 p-Wert=0,05
![Page 67: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/67.jpg)
67
Statistische Tests
• Kritischer Wert: Wert auf der Achse
• p-Wert: Fläche unter der Dichte
• Entscheidung: – Lehne H0 ab, wenn Prüfgröße im kritischen
Bereich
– Lehen H0 ab, wenn p-Wert der Prüfgröße < α
![Page 68: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/68.jpg)
68
χ² Unabhängigkeitstest
Chi-Quadrat (χ²) Unabhängigkeitstest
• Teste ob 2 nominalskalierte Merkmale voneinander unabhängig sind.
• Bsp. Sind Geschlecht und Rauchverhalten voneinander unabhängig?
![Page 69: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/69.jpg)
69
χ² Unabhängigkeitstest
Chi-Quadrat (χ²) Unabhängigkeitstest
• H0: die beiden Merkmale sind voneinander unabhängig.
• H1: die beiden Merkmale sind nicht voneinander unabhängig, d.h. sie sind voneinander abhängig
• Festlegen des Signifikanzniveaus α.
![Page 70: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/70.jpg)
70
χ² Unabhängigkeitstest
• Kontingenztafel:– Absolute Häufigkeiten der
Merkmalsausprägungen
A \ B b1 ... bs ∑
a1 h11 … h1s h1.
: : : :
ar hr1 … hrs hr.
∑ h.1 ... h.s h.. = n
![Page 71: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/71.jpg)
71
χ² Unabhängigkeitstest
• Bsp. 4-Felder Tafel:– Absolute Häufigkeiten der
Merkmalsausprägungen
Raucher Nichtraucherweiblich 9 32 41männlich 5 27 32
14 59 73
![Page 72: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/72.jpg)
72
χ² Unabhängigkeitstest
Prüfgröße und Testverteilung:
• Prinzip: Vergleiche die Werte, die man unter Unabhängigkeit der Merkmale erwarten würde (he), mit den tatsächlich beobachteten Werten (ho).
• Wenn H0 gilt, welche Werte würde man erwarten?
• Berechung der unter H0 erwarteten absoluten Häufigkeiten.
![Page 73: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/73.jpg)
73
χ² Unabhängigkeitstest
• Unter H0 erwartete absoluten Häufigkeiten
• Interpretation der relativen Häufigkeiten als Wahrscheinlichkeiten
• Dann: unter H0 erwartete absoluten Häufigkeiten
o oi je h h
h =n
![Page 74: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/74.jpg)
74
χ² Unabhängigkeitstest
• Bsp. Geschlecht - Rauchverhalteno oi je h h
h =n
ho
Geschlecht j nw 9 32 41m 5 27 32
14 59 73
Raucher
he
Geschlecht j nw 7,9 33,1 41m 6,1 25,9 32
14 59 73
Raucher
![Page 75: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/75.jpg)
75
χ² Unabhängigkeitstest
• Teststatistik χ²:– Abweichung der beobachteten Häufigkeiten
von den erwartete Häufigkeiten
2o er sij ij2
ei=1 j=1 ij
h hχ =
h
![Page 76: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/76.jpg)
76
χ² Unabhängigkeitstest
Verteilung der Teststatistik χ²:
• χ²-Verteilung mit v = (r-1)·(s-1) Freiheitsgraden
![Page 77: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/77.jpg)
77
χ² Unabhängigkeitstest
Kritischer Bereich:
• Signifikanzniveau α
• Kritischer Wert: α-Quantil der χ²(r-1)·(s-1) Verteilung
• Lehne H0 ab, wenn gilt:
Wert der Teststatistik > kritischer Wert
![Page 78: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/78.jpg)
78
χ² Unabhängigkeitstest
Bsp. Geschlecht – Rauchverhalten: Teststatistik χ²
• Verteilung der Teststatistik: χ²1
Chi-Quadrat Verteilung mit einem Freiheitsgrad
2o e2 2ij ij2
ei=1 j=1 ij
h hχ = 0,5
h
![Page 79: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/79.jpg)
79
χ² Unabhängigkeitstest
Bsp. Geschlecht – Rauchverhalten:
• Kritischer Wert: 0,05-Quantil der χ²1 Vt. = 3,84
• Entscheidung:
(I) Teststatistik = 0,5 < 3,84 = kritischer Wert. Also: Lehne H0 nicht ab.
(II) p-Wert = 0,496 > 0,05. Also: Lehne H0 nicht ab.
• Interpretation: Geschlecht und Rauchverhalten sind voneinander unabhängig.
![Page 80: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/80.jpg)
80
χ² Homogenitätstest
Chi-Quadrat (χ²) Homogenitätstest
• Betrachte zwei Gruppen bzw. Stichproben.
• Teste, ob die Stichproben aus der gleichen Grundgesamtheit stammen.
![Page 81: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/81.jpg)
81
χ² Homogenitätstest
Chi-Quadrat (χ²) Homogenitätstest
• H0: die beiden Stichproben stammen aus der gleichen Grundgesamtheit.
• H1: die beiden Stichproben stammen nicht aus der gleichen Grundgesamtheit.
• Festlegen des Signifikanzniveaus α.
![Page 82: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/82.jpg)
82
χ² Homogenitätstest
Bsp. Geschlecht – Rauchverhalten
• H0: Das Rauchverhalten der beiden Gruppen stimmt überein.
• H1: Das Rauchverhalten der beiden Gruppen stimmt nicht überein.
![Page 83: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/83.jpg)
83
χ² Homogenitätstest
Prüfgröße und Testverteilung:
• Prinzip: Vergleiche die Werte, die man unter H0 (gleiche Grundgesamtheit) erwarten würde (he), mit den tatsächlich beobachteten Werten (ho).
• Wenn H0 gilt, welche Werte würde man erwarten?
• Berechung der unter H0 erwarteten absoluten Häufigkeiten.
![Page 84: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/84.jpg)
84
χ² Homogenitätstest
• Unter H0 erwartete absoluten Häufigkeiteno oi je h h
h =n
![Page 85: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/85.jpg)
85
χ² Homogenitätstest
• Teststatistik χ²:– Abweichung beobachteten Häufigkeiten und
erwartete Häufigkeiten
• Verteilung der Teststatistik χ²:
χ²-Verteilung mit v = (r-1)·(s-1) Freiheitsgraden
2o er sij ij2
ei=1 j=1 ij
h hχ =
h
![Page 86: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/86.jpg)
86
χ² Homogenitätstest
Bsp. Geschlecht – Rauchverhalten:• Teststatistik χ² = 0,5• Verteilung der Teststatistik: χ²1 • Entscheidung:
– (I) χ² = 0,5 < 3,84. Lehne H0 nicht ab. – (II) p-Wert = 0,496 > 0,05. Lehne H0 nicht ab.
• Interpretation: die beiden Gruppen (Männer, Frauen) stammen aus der gleichen Grundgesamtheit, sie sind homogen.
![Page 87: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/87.jpg)
87
χ² Tests
χ² Unabhängigkeits- und Homogenitätstests:
• Teststatistik und Testverteilung sind gleich
• Nullhypothese und Interpretation sind verschieden. – Test auf Unabhängigkeit (die Merkmale sind
unabhängig voneinander)– Test auf Homogenität (die Stichproben
stammen aus der gleichen Grundgesamtheit).
![Page 88: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/88.jpg)
88
χ² Tests
χ² Unabhängigkeits- und Homogenitätstests:
• Für die Approximation durch die χ²-Vt. sollten die erwarteten Häufigkeiten jeder Zelle 5 sein und keine der Zellen sollte unbesetzt sein.
• Sind die Voraussetzungen verletzt, kann man einen exakten Test durchführen
(siehe Hartung S. 414ff)
![Page 89: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/89.jpg)
89
Anpassungstests
Test einer Verteilungshypothese – Nichtparametrische Testverfahren
• Betrachtet Unterschied zw. Stichproben-Vt. und theoretischer Verteilung.
• „Anpassungstest“ weil die Güte der Anpassung einer theoretischen Vt. an eine empirische Vt. überprüft wird.
![Page 90: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/90.jpg)
90
Anpassungstests
χ² Anpassungstest:
• H0: die Grundgesamtheit gehorcht einer bestimmten Verteilung.
• Vorgehensweise: – Bestimme die unter H0 zu erwartenden
Häufigkeiten he und vergleiche sie mit den beobachteten Häufigkeiten ho.
– Abweichung groß – Entscheidung gegen H0, Abweichung klein – Entscheidung für H0.
![Page 91: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/91.jpg)
91
Anpassungstests
χ² Anpassungstest:
• Teststatistik:
k ... Anzahl der Merkmalsausprägungen (diskrete Merkmale) bzw. Anzahl der Klassen (stetigen Merkmalen)
• Testverteilung: χ²v verteilt mit v=n-1
• Es gilt wieder: he sollten 5 sein.
k
1iei
2ei
oi2
h
)h(hχ
![Page 92: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/92.jpg)
92
Anpassungstests
χ² Anpassungstest:
• Entscheidung: – Bestimmung des kritischen Bereichs,
χ² > kritischer Wert, lehne H0 ab
– Bestimmung des p-Wertes,
p-Wert < α lehne H0 ab
![Page 93: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/93.jpg)
93
Anpassungstest
• Bsp. χ² Anpassungstest:– H0: Augenfarbe ist gleichverteilt
– H1: Augenfarbe ist nicht gleichverteilt
– α = 0,05
• Teststatistik: 8,583 > 5,991 (0,05 Quantil der χ²2 Verteilung) => H0 ablehnen
• p-Wert: 0,014 < 0,05 => H0 ablehnen
Merkmal ho he
1 35 242 22 243 15 24
72 72
![Page 94: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/94.jpg)
94
Anpassungstests
Kolmogorov-Smirnov- Anpassungstest:
• Test zur Beurteilung der Güte der Anpassung einer erwarteten theoretischen Verteilung an eine beobachtete empirische Verteilung.
• H0: die Grundgesamtheit gehorcht einer bestimmten Verteilung.
• Prinzip: Abweichung empirische- von der theoretische Verteilungsfunktion.
![Page 95: 1 STATISIK LV Nr.: 1852 WS 2005/06 20. Dezember 2005](https://reader036.vdocuments.pub/reader036/viewer/2022062318/55204d7649795902118cafb9/html5/thumbnails/95.jpg)
95
Anpassungstests
Kolmogorov-Smirnov- Anpassungstest: • Prüfgröße (D):
– größte beobachtete absolute Abweichung der theoretischen von der empirischen Verteilungsfunktion.
• Testverteilung: – „Kolmogorov-Smirnov- Verteilung“, hängt nur
vom Stichproben-umfang n ab (1-α Quantile in Tabelle nachschlagen).
• Entscheidung: – D > kritischer Wert (aus Tabelle), lehne H0 ab.