hypothesen - 1 prüfung statistischer hypothesen die inferenzstatistische hypothesenprüfung erlaubt...
TRANSCRIPT
Hypothesen - 1
Prüfung statistischer Hypothesen
Die inferenzstatistische Hypothesenprüfung erlaubt Aus-sagen über Hypothesen in einer Population, aus welcher die untersuchten Stichproben gezogen wurden.
Hierbei schätzt man über Stichprobenkennwerte Populations-kennwerte und führt mit Hilfe dieser Schätzungen eine Hypothesenprüfung durch.
Hypothesen - 2
Was sind statistische Hypothesen?
Statistische Hypothesen sind Erwartungen über Unterschiede zwischen oder Zusammenhänge von Variablen, die vor einer Untersuchung formuliert werden.
Beispiele für statistische Hypothesen:• Frauen sind ängstlicher als Männer.• Frauen und Männer unterscheiden sich nicht in Ihrer
Ängstlichkeit.
Gerichtet/ Ungerichtet?H0?
Hypothesen - 4
Nullhypothese und Alternativhypothese
Bei statistischen Tests werden immer – unabhängig von der Erwartung des beteiligten Forschers – zwei gegensätzliche Hypothesen formuliert:
(a) Die Nullhypothese (H0) besagt, dass es keinen Unter-schied zwischen zwei Populationen (bzw. keinen Zu-sammenhang zwischen zwei Merkmalen) gibt.
(b) Die Alternativhypothese (H1) besagt dagegen, dass es einen Unterschied (bzw. einen Zusammenhang) gibt.
Es kann also immer nur eine von beiden Hypothesen zutreffen!
Die beiden statistischen Hypothesen (H0und H1) werden unabhängig von den tatsächlichen inhaltlichen Erwartungen formuliert.
Zwei Formen der Alternativhypothese• Formale Schreibweise1. Ungerichtete Alternativhypothese:
H1: μ1≠ μ2H0: μ1= μ2
2. Gerichtete Alternativhypothese (1.Möglichkeit):H1: μ1> μ2H0: μ1≤ μ2
Gerichtete Alternativhypothese (2. Möglichkeit):H1: μ1< μ2H0: μ1≥ μ2
=> Die H0 hängt also von der Auswahl der H1 ab!
Zwei Fehler bei der Hypothesenprüfung
Je nach der Entscheidung kann man zwei Fehler machen:
α-Fehler/ Fehler erster Art1. Man entscheidet sich für die H1, obgleich zwischen
den Populationsmittelwerten kein Unterschiedexistiert („α-Fehler“ bzw. „Fehler erster Art“).
Ablehnung der richtigen Nullhypothese
Bsp.: Es wird die bessere Wirkung eines neuen, teueren Medikaments angenommen, obwohl es in der Population keinen besseren Therapieeffekt gibt (großes N!).
Zwei Fehler bei der Hypothesenprüfung
2. „β-Fehler“ bzw. „Fehler zweiter Art“ Man entscheidet sich für die H0, obgleich es auf
Populationsebene einen bedeutsamen Unterschiedgibt
Beibehaltung der falschen Nullhypothese Bei einer Studie mit N=10 soll der Einfluss des
Mobilfunktelefonierens auf die Aufmerksamkeit der Fahrer während der Autofahrt überprüft werden. Aufgrund der kleinen Stichprobe kommt es zu keinen signifikanten Ergebnissen
Für beide Fehlertypen sollte vor einer Untersuchung die gewünschte Wahrscheinlichkeit festgelegt werden!
Hypothesen - 7
Das α-Niveau
Das α-Niveau gibt an, wie „unwahrscheinlich“ die H0 sein muss, damit die H1 angenommen wird.
Wenn p ≤ α, wird die H1 angenommen.
Konventionen für das α-Niveau:p ≤ 0.05 „signifikantes“ (statistisch bedeutsames) Ergebnis α ≤ 0.01 „hoch signifikantes“ Ergebnis α ≤ 0.10 „marginal signifikantes“ Ergebnis
Hypothesen - 8
Das β-Niveau
Das β-Niveau gibt an, wie wahrscheinlich es ist, dass in der Population kein Unterschied besteht, obwohl der Test zu einem signifikanten Ergebnis kommt.
Mit der Wahrscheinlichkeit β wird also die H0 fälschlicher-weise angenommen.
In vielen statistischen Untersuchungen wird nicht beachtet, dass der β-Fehler viel zu groß ist, um die Ergebnisse zu interpretieren. Wir werden später besprechen, wie man den β-Fehler verkleinern kann!
Hypothesen - 9
Statistische Entscheidungen
In der Populationgilt die
TestergebnisEnt-
scheidungH0 H1
p > α „H0“
p < α „H1 “
korrekt
korrekt
β-Fehler
α-Fehler
Drei Formen des t-Tests
1)Der t-Test für unabhängige Stichproben: Dieser Test prüft, ob sich die Mittelwerte von zwei Gruppen
unterscheiden
(2)Der t-Test für abhängige StichprobenDieser Test prüft, ob sich der Mittelwert einer Stichprobe zu
zwei Messzeitpunktenunterscheidet
(3)Der Ein-Gruppen t-TestDieser Test prüft, ob sich der Mittelwert einer Gruppe von
einem vorgegeben Wert unterscheidet
Hypothesen – 10
Der t-Test für unabhängige Stichproben
Mit dem t-Test für unabhängige Stichproben wird ver-glichen, ob sich zwei Populationsmittelwerte voneinander unterscheiden.
Der t-Test gehört zu den parametrischen Testverfahren. Parametrische Testverfahren setzen eine bestimmte Verteilungsform (in der Regel die Normalverteilung) des untersuchten Merkmals voraus.
Daher bildet die Normalverteilung des untersuchten Merkmals eine Vorraussetzung für den t-Tests.
Hypothesen – 11
Der Kennwert des t-Tests
Der t-Test prüft die bedingte Wahrscheinlichkeit
21 xxx
Kennwert des t-Tests ist die Differenz der Mittelwerte der beiden Stichproben:
)|( 0Hp x
Wenn gilt p < α, wird die H0 verworfen und damit die H1 angenommen.
Hypothesen – 12
Stichprobenkennwerteverteilung unter der H0
Um die Wahrscheinlichkeit zu bestimmen, wird eine theo-retische Stichprobenkennwerteverteilung der Mittel-wertsdifferenzen unter der Nullhypothese gebildet.
-10 -5 0 5 100.0
0.1
0.2
0.3
0.4
x1 x2
Die theoretische Verteilung von Mittel-wertsdifferenzen ist nur bei großen Stich-proben normalverteilt.
Bei kleineren Stichproben ergibt sich eine „schmalgipfligere“ Verteilung.
65.37
84.47
m
w
x
x
19.10 xgesucht: p(Δx)
Hypothesen – 13
Der Standardfehler der Stichprobenkennwerteverteilung
Der Standardfehler der Stichprobenkennwerteverteilung des t-Tests hängt von den Standardabweichungen und den Größen der beiden Teilstichproben ab:
2
22
1
21
21 NNxx
Hypothesen – 14
Der Standardfehler der Stichprobenkennwerteverteilung
Achtung: Zur Bestimmung der Wahrscheinlichkeit eines solchen Wertes darf nicht die Standardnormalverteilungs-tabelle angewandt werden, da die Mittelwertsdifferenz nicht normalverteilt ist!
33.421 xx
19.10 mw xx
Jetzt kann der empirische Mittelwertsunterschied mit dem Standardfehler der verglichen werden:
Hypothesen – 15
Die t-Verteilung
21
21
xxdf
xxt
Analog zum Vorgehen bei der z-Standardisierung wird auch hier der Kennwert durch die Streuung geteilt. Dieses Verhältnis bildet die Teststatistik des t-Tests:
df steht für „degree of freedom“, also für die Freiheitsgrade.
Hypothesen – 16
Die Freiheitsgrade der t-Verteilung
Die Freiheitsgrade der t-Verteilung berechnen sich als:
221 NNdf
Dabei beeinflussen die Freiheitsgrade die Form der t-Ver-teilung: Bei vielen Freiheitsgraden (df > 120) ist die t-Verteil-ung nahezu identisch mit der z-Verteilung. Je weniger Frei-heitsgrade gegeben sind, desto schmalgipfliger wird diet-Verteilung.
Hypothesen – 18
Aus einer Tabelle für die t-Verteilung (siehe Leonhart, S 438ff)wird ein kritischer t-Wert in Abhängigkeit der Freiheitsgrade und des α-Niveaus festgelegt.
39.2)99.(
67.1)95.(
60
60
pt
pt Weil keine Werte für df=76 angegeben sind, nehmen wir die nächst kleinere Zahl. So ergibt sich ein „konservativer“ Test.
Entscheidung über die Nullhypothese
Wenn temp > tkrit, kann die H0 verworfen werden.
Der t-Test für unabhängige Stichproben
(1) Formulierung der (inhaltlichen und statistischen) Hypothesen
(2) Operationalisierung des Merkmals(3) Erfassung des gleichen Merkmal in zwei
unabhängigen Stichproben(4) Berechnung der Mittelwerte in beiden Stichproben(5) Schätzung der Populationsvarianzen(6) Berechnung des Standardfehlers der
Mittelwertsdifferenz(7) Berechnung des empirischen t-Werts(8) Bestimmung des kritischen t-Werts(9) Entscheidung über H0 und H1
Hinweise:
Bei einer gerichteten Hypothese sollte die Differenz immer so gebildet werden, dass der als kleiner erwartete Wert von größeren Wert subtrahiert wird.
Wenn die Hypothese zutrifft, muss der empirische t-Wert dann positiv sein.
Bei einer ungerichteten Hypothese spielt die Richtung der Subtraktion keine Rolle (man nimmt den Betrag).
(1) Formulierung der (inhaltlichen und statistische) Hypo-thesen
(2) Operationalisierung des Merkmals
(3) Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben
(4) Berechnung der Mit-telwerte in beiden Stichproben
(5) Schätzung der Pop-ulationsvarianzen
(6) Berechnung des Stan-dardfehlers der Mittelwertsdifferenz
(7) Berechnung des empirischen t-Werts
(8) Bestimmung des kritischen t-Werts
(9) Entscheidung über H0 und H1
Der t-Test für unabhängige Stichproben
Der t-Test - 2
Inhaltliche Hypothese: Wörter werden besser erinnert, wenn sie tiefer verarbeitet werden.
Statistische Hypothesen:
H0: μemo = μstruk
H1: μemo > μstruk
Operationalisierung des Merkmals:Die Erinnerungsleistung wird als Anzahl der Wörter bestimmt, die in einem free recall Test erinnert werden.
(1) Formulierung der (inhaltlichen und statistische) Hypo-thesen
(2) Operationalisierung des Merkmals
(3) Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben
(4) Berechnung der Mit-telwerte in beiden Stichproben
(5) Schätzung der Pop-ulationsvarianzen
(6) Berechnung des Stan-dardfehlers der Mittelwertsdifferenz
(7) Berechnung des empirischen t-Werts
(8) Bestimmung des kritischen t-Werts
(9) Entscheidung über H0 und H1
Der t-Test für unabhängige Stichproben
Der t-Test - 3
strukturell emotional
6 11
8 7
4 9
4 11
8 7
6
5
30
5
84486
sx
9
5
45
5
7119711
ex
(1) Formulierung der (inhaltlichen und statistische) Hypo-thesen
(2) Operationalisierung des Merkmals
(3) Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben
(4) Berechnung der Mit-telwerte in beiden Stichproben
(5) Schätzung der Pop-ulationsvarianz
(6) Berechnung des Standardfehlers der Mittelwertsdifferenz
(7) Berechnung des empirischen t-Werts
(8) Bestimmung des kritischen t-Werts
(9) Entscheidung über H0 und H1
Der t-Test für unabhängige Stichproben
Der t-Test - 4
strukturell emotional
6 11
8 7
4 9
4 11
8 76sx 9ex
244
16
15
)6(5
1
2
i i
s
x
244
16
15
)9(5
1
2
i i
e
x
(1) Formulierung der (inhaltlichen und statistische) Hypo-thesen
(2) Operationalisierung des Merkmals
(3) Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben
(4) Berechnung der Mit-telwerte in beiden Stichproben
(5) Schätzung der Pop-ulationsvarianz
(6) Berechnung des Standardfehlers der Mittelwertsdifferenz
(7) Berechnung des empirischen t-Werts
(8) Bestimmung des kritischen t-Werts
(9) Entscheidung über H0 und H1
Der t-Test für unabhängige Stichproben
Der t-Test - 5
6sx 9ex
2s 2s
26.16.15
4
5
4
22
s
s
e
exx NNse
(1) Formulierung der (inhaltlichen und statistische) Hypo-thesen
(2) Operationalisierung des Merkmals
(3) Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben
(4) Berechnung der Mit-telwerte in beiden Stichproben
(5) Schätzung der Pop-ulationsvarianz
(6) Berechnung des Standardfehlers der Mittelwertsdifferenz
(7) Berechnung des empirischen t-Werts
(8) Bestimmung des kritischen t-Werts
(9) Entscheidung über H0 und H1
Der t-Test für unabhängige Stichproben
Der t-Test - 6
26.1 se xx
38.226.1
38
)2(
t
xxt
se
es
xx
seNN
6sx 9ex
2s 2s
(1) Formulierung der (inhaltlichen und statistische) Hypo-thesen
(2) Operationalisierung des Merkmals
(3) Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben
(4) Berechnung der Mit-telwerte in beiden Stichproben
(5) Schätzung der Pop-ulationsvarianz
(6) Berechnung des Standardfehlers der Mittelwertsdifferenz
(7) Berechnung des empirischen t-Werts
(8) Bestimmung des kritischen t-Werts
(9) Entscheidung über H0 und H1
Der t-Test für unabhängige Stichproben
Der t-Test - 7
38.28 t
Festlegung des Alphaniveaus:α = .05
Art des Tests: einseitig vs. zweiseitigeinseitig (wegen der gerichteten Alternativ-Hypothese)
Ein- vs. Zweiseitiges Testen
Der t-Test 8
-3 -2 -1 0 1 2 30
0.1
0.2
0.3
0.4
p = 1-
tkrit
-3 -2 -1 0 1 2 30
0.1
0.2
0.3
0.4
p = 1-
tkrit
H0
H1
H1
H1
H0
Einseitiger Test:Signifikant, wenn
)1( kritemp tt
Zweiseitiger Test:Signifikant, wenn
)2/1(|| kritemp tt
Betrag von t, d.h. das Vorzeichen spielt keine Rolle!
Der t-Test - 9
Die t-Verteilungp=.800 p=.900 p=.950 p=.975 p=.990
1 1,376 3,078 6,314 12,706 31,821 63,6572 1,061 2,920 2,920 4,303 6,965 9,9253 0,978 2,353 2,353 3,182 4,541 5,8414 0,941 2,132 2,132 2,776 3,747 4,6045 0,920 2,015 2,015 2,571 3,365 4,0326 0,906 1,943 1,943 2,447 3,143 3,7077 0,896 1,895 1,895 2,365 2,998 3,4998 0,889 1,860 1,860 2,306 2,896 3,3559 0,883 1,833 1,833 2,262 2,821 3,250
10 0,879 1,812 1,812 2,228 2,764 3,16920 0,860 1,725 1,725 2,086 2,528 2,84530 0,854 1,697 1,697 2,042 2,457 2,75040 0,851 1,684 1,684 2,021 2,423 2,70450 0,849 1,676 1,676 2,009 2,403 2,67860 0,848 1,671 1,671 2,000 2,390 2,66070 0,847 1,667 1,667 1,994 2,381 2,64880 0,846 1,664 1,664 1,990 2,374 2,63990 0,846 1,662 1,662 1,987 2,368 2,632
100 0,845 1,660 1,660 1,984 2,364 2,626200 0,843 1,653 1,653 1,972 2,345 2,601
1000 0,842 1,646 1,646 1,962 2,330 2,581
df p=.995
-3 -2 -1 0 1 2 30
0.1
0.2
0.3
0.4
1-
tkrit
α = .05t(8) = 1.86 (einseitig)t(8) = 2.31 (zweis.)
α = .01t(8) = 2.90 (einseitig)t(8) = 3.36 (zweis.)
(1) Formulierung der (inhaltlichen und statistische) Hypo-thesen
(2) Operationalisierung des Merkmals
(3) Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben
(4) Berechnung der Mit-telwerte in beiden Stichproben
(5) Schätzung der Pop-ulationsvarianz
(6) Berechnung des Standardfehlers der Mittelwertsdifferenz
(7) Berechnung des empirischen t-Werts
(8) Bestimmung des kritischen t-Werts
(9) Entscheidung über H0 und H1
Der t-Test für unabhängige Stichproben
Der t-Test - 10
86.1)8(
38.2)8(
krit
emp
t
t
Fazit: Der Test hat gezeigt, dass Wörter besser erinnert werden, wenn sie emotional verarbeitet wurden, als wenn sie strukturell verarbeitet wurden.
Voraussetzungen des t-Tests für unabhängige Stichproben:
(1)Intervallskalenniveau der Variable
(2)Normalverteilung des Merkmals in der Grundgesamtheit
(3)„Varianzhomogenität“ (Gleiche Varianzen des Merkmals in beiden Populationen)
(4)Unabhängigkeit der Stichproben
Der t-Test für abhängige Stichproben
Definition: Stichproben werden als abhängig bezeichnet, wenn die Ziehung eines Merkmalsträgers in die erste Stichprobe die Zugehörigkeit eines Merkmalsträgers zur zweiten Stichprobe beeinflusst.
Abhängige Stichproben ergeben sich durch Messwieder-holung oder Parallelisierung bzw. Matching.
Warum parallelisiert man Stichproben?
Ein Test für abhängige Stichproben hat eine höhere Power (Teststärke), d.h. es ist wahrscheinlicher, dass ein bestehender Unterschied nachgewiesen werden kann!
Der t-Test für abhängige Stichproben
Nun wird die Verteilung der mittleren Differenzen benötigt. Diese berechnet sich nach dem Standardfehler für den Mittelwert wie folgt:
Nd
d
xx
ˆˆ
1
)(ˆ 1
2
N
xxmit
N
iddi
xd
Anschließend wird die mittlere Differenz an dem Standard-fehler relativiert. Das Ergebnis dieser Standardisierung ist wiederum t-verteilt.
t-Tests für abh. Stichproben - 8dx
dN
xt
1
HypothesenDie statistischen Hypothesen des t-Test für abhängige Stichproben
beziehen sich auf den Mittelwert der Differenzen aller Personen
Vorteil: Es ist nun unerheblich, ob innerhalb der Messzeitpunktegroße Varianz gegeben ist
Ungerichtete Hypothese:– H0: μ= 0– H1: μ≠ 0
Gerichtet Hypothese (1):– H0: μ≤ 0– H1: μ> 0
Gerichtet Hypothese (2):– H0: μ≥ 0– H1: μ< 0