hypothesen - 1 prüfung statistischer hypothesen die inferenzstatistische hypothesenprüfung erlaubt...

Hypothesen - 1

Prüfung statistischer Hypothesen

Die inferenzstatistische Hypothesenprüfung erlaubt Aus-sagen über Hypothesen in einer Population, aus welcher die untersuchten Stichproben gezogen wurden.

Hierbei schätzt man über Stichprobenkennwerte Populations-kennwerte und führt mit Hilfe dieser Schätzungen eine Hypothesenprüfung durch.

Hypothesen - 2

Was sind statistische Hypothesen?

Statistische Hypothesen sind Erwartungen über Unterschiede zwischen oder Zusammenhänge von Variablen, die vor einer Untersuchung formuliert werden.

Beispiele für statistische Hypothesen:• Frauen sind ängstlicher als Männer.• Frauen und Männer unterscheiden sich nicht in Ihrer

Ängstlichkeit.

Gerichtet/ Ungerichtet?H0?

Hypothesen - 4

Nullhypothese und Alternativhypothese

Bei statistischen Tests werden immer – unabhängig von der Erwartung des beteiligten Forschers – zwei gegensätzliche Hypothesen formuliert:

(a) Die Nullhypothese (H0) besagt, dass es keinen Unter-schied zwischen zwei Populationen (bzw. keinen Zu-sammenhang zwischen zwei Merkmalen) gibt.

(b) Die Alternativhypothese (H1) besagt dagegen, dass es einen Unterschied (bzw. einen Zusammenhang) gibt.

Es kann also immer nur eine von beiden Hypothesen zutreffen!

Die beiden statistischen Hypothesen (H0und H1) werden unabhängig von den tatsächlichen inhaltlichen Erwartungen formuliert.

Zwei Formen der Alternativhypothese• Formale Schreibweise1. Ungerichtete Alternativhypothese:

H1: μ1≠ μ2H0: μ1= μ2

2. Gerichtete Alternativhypothese (1.Möglichkeit):H1: μ1> μ2H0: μ1≤ μ2

Gerichtete Alternativhypothese (2. Möglichkeit):H1: μ1< μ2H0: μ1≥ μ2

=> Die H0 hängt also von der Auswahl der H1 ab!

Zwei Fehler bei der Hypothesenprüfung

Je nach der Entscheidung kann man zwei Fehler machen:

α-Fehler/ Fehler erster Art1. Man entscheidet sich für die H1, obgleich zwischen

den Populationsmittelwerten kein Unterschiedexistiert („α-Fehler“ bzw. „Fehler erster Art“).

Ablehnung der richtigen Nullhypothese

Bsp.: Es wird die bessere Wirkung eines neuen, teueren Medikaments angenommen, obwohl es in der Population keinen besseren Therapieeffekt gibt (großes N!).

Zwei Fehler bei der Hypothesenprüfung

2. „β-Fehler“ bzw. „Fehler zweiter Art“ Man entscheidet sich für die H0, obgleich es auf

Populationsebene einen bedeutsamen Unterschiedgibt

Beibehaltung der falschen Nullhypothese Bei einer Studie mit N=10 soll der Einfluss des

Mobilfunktelefonierens auf die Aufmerksamkeit der Fahrer während der Autofahrt überprüft werden. Aufgrund der kleinen Stichprobe kommt es zu keinen signifikanten Ergebnissen

Für beide Fehlertypen sollte vor einer Untersuchung die gewünschte Wahrscheinlichkeit festgelegt werden!

Hypothesen - 7

Das α-Niveau

Das α-Niveau gibt an, wie „unwahrscheinlich“ die H0 sein muss, damit die H1 angenommen wird.

Wenn p ≤ α, wird die H1 angenommen.

Konventionen für das α-Niveau:p ≤ 0.05 „signifikantes“ (statistisch bedeutsames) Ergebnis α ≤ 0.01 „hoch signifikantes“ Ergebnis α ≤ 0.10 „marginal signifikantes“ Ergebnis

Hypothesen - 8

Das β-Niveau

Das β-Niveau gibt an, wie wahrscheinlich es ist, dass in der Population kein Unterschied besteht, obwohl der Test zu einem signifikanten Ergebnis kommt.

Mit der Wahrscheinlichkeit β wird also die H0 fälschlicher-weise angenommen.

In vielen statistischen Untersuchungen wird nicht beachtet, dass der β-Fehler viel zu groß ist, um die Ergebnisse zu interpretieren. Wir werden später besprechen, wie man den β-Fehler verkleinern kann!

Hypothesen - 9

Statistische Entscheidungen

In der Populationgilt die

TestergebnisEnt-

scheidungH0 H1

p > α „H0“

p < α „H1 “

korrekt

korrekt

β-Fehler

α-Fehler

Drei Formen des t-Tests

1)Der t-Test für unabhängige Stichproben: Dieser Test prüft, ob sich die Mittelwerte von zwei Gruppen

unterscheiden

(2)Der t-Test für abhängige StichprobenDieser Test prüft, ob sich der Mittelwert einer Stichprobe zu

zwei Messzeitpunktenunterscheidet

(3)Der Ein-Gruppen t-TestDieser Test prüft, ob sich der Mittelwert einer Gruppe von

einem vorgegeben Wert unterscheidet

Hypothesen – 10

Der t-Test für unabhängige Stichproben

Mit dem t-Test für unabhängige Stichproben wird ver-glichen, ob sich zwei Populationsmittelwerte voneinander unterscheiden.

Der t-Test gehört zu den parametrischen Testverfahren. Parametrische Testverfahren setzen eine bestimmte Verteilungsform (in der Regel die Normalverteilung) des untersuchten Merkmals voraus.

Daher bildet die Normalverteilung des untersuchten Merkmals eine Vorraussetzung für den t-Tests.

Hypothesen – 11

Der Kennwert des t-Tests

Der t-Test prüft die bedingte Wahrscheinlichkeit

21 xxx

Kennwert des t-Tests ist die Differenz der Mittelwerte der beiden Stichproben:

)|( 0Hp x

Wenn gilt p < α, wird die H0 verworfen und damit die H1 angenommen.

Hypothesen – 12

Stichprobenkennwerteverteilung unter der H0

Um die Wahrscheinlichkeit zu bestimmen, wird eine theo-retische Stichprobenkennwerteverteilung der Mittel-wertsdifferenzen unter der Nullhypothese gebildet.

-10 -5 0 5 100.0

0.1

0.2

0.3

0.4

x1 x2

Die theoretische Verteilung von Mittel-wertsdifferenzen ist nur bei großen Stich-proben normalverteilt.

Bei kleineren Stichproben ergibt sich eine „schmalgipfligere“ Verteilung.

65.37

84.47

m

w

x

x

19.10 xgesucht: p(Δx)

Hypothesen – 13

Der Standardfehler der Stichprobenkennwerteverteilung

Der Standardfehler der Stichprobenkennwerteverteilung des t-Tests hängt von den Standardabweichungen und den Größen der beiden Teilstichproben ab:

2

22

1

21

21 NNxx

Hypothesen – 14

Der Standardfehler der Stichprobenkennwerteverteilung

Achtung: Zur Bestimmung der Wahrscheinlichkeit eines solchen Wertes darf nicht die Standardnormalverteilungs-tabelle angewandt werden, da die Mittelwertsdifferenz nicht normalverteilt ist!

33.421 xx

19.10 mw xx

Jetzt kann der empirische Mittelwertsunterschied mit dem Standardfehler der verglichen werden:

Hypothesen – 15

Die t-Verteilung

21

21

xxdf

xxt

Analog zum Vorgehen bei der z-Standardisierung wird auch hier der Kennwert durch die Streuung geteilt. Dieses Verhältnis bildet die Teststatistik des t-Tests:

df steht für „degree of freedom“, also für die Freiheitsgrade.

Hypothesen – 16

Die Freiheitsgrade der t-Verteilung

Die Freiheitsgrade der t-Verteilung berechnen sich als:

221 NNdf

Dabei beeinflussen die Freiheitsgrade die Form der t-Ver-teilung: Bei vielen Freiheitsgraden (df > 120) ist die t-Verteil-ung nahezu identisch mit der z-Verteilung. Je weniger Frei-heitsgrade gegeben sind, desto schmalgipfliger wird diet-Verteilung.

Hypothesen – 18

Aus einer Tabelle für die t-Verteilung (siehe Leonhart, S 438ff)wird ein kritischer t-Wert in Abhängigkeit der Freiheitsgrade und des α-Niveaus festgelegt.

39.2)99.(

67.1)95.(

60

60

pt

pt Weil keine Werte für df=76 angegeben sind, nehmen wir die nächst kleinere Zahl. So ergibt sich ein „konservativer“ Test.

Entscheidung über die Nullhypothese

Wenn temp > tkrit, kann die H0 verworfen werden.


(1) Formulierung der (inhaltlichen und statistischen) Hypothesen

(2) Operationalisierung des Merkmals(3) Erfassung des gleichen Merkmal in zwei

unabhängigen Stichproben(4) Berechnung der Mittelwerte in beiden Stichproben(5) Schätzung der Populationsvarianzen(6) Berechnung des Standardfehlers der

Mittelwertsdifferenz(7) Berechnung des empirischen t-Werts(8) Bestimmung des kritischen t-Werts(9) Entscheidung über H0 und H1

Hinweise:

Bei einer gerichteten Hypothese sollte die Differenz immer so gebildet werden, dass der als kleiner erwartete Wert von größeren Wert subtrahiert wird.

Wenn die Hypothese zutrifft, muss der empirische t-Wert dann positiv sein.

Bei einer ungerichteten Hypothese spielt die Richtung der Subtraktion keine Rolle (man nimmt den Betrag).

(1) Formulierung der (inhaltlichen und statistische) Hypo-thesen

(2) Operationalisierung des Merkmals

(3) Erfassung des glei-chen Merkmal in zwei unabhängigen Stichproben

(4) Berechnung der Mit-telwerte in beiden Stichproben

(5) Schätzung der Pop-ulationsvarianzen

(6) Berechnung des Stan-dardfehlers der Mittelwertsdifferenz

(7) Berechnung des empirischen t-Werts

(8) Bestimmung des kritischen t-Werts

(9) Entscheidung über H0 und H1


Der t-Test - 2

Inhaltliche Hypothese: Wörter werden besser erinnert, wenn sie tiefer verarbeitet werden.

Statistische Hypothesen:

H0: μemo = μstruk

H1: μemo > μstruk

Operationalisierung des Merkmals:Die Erinnerungsleistung wird als Anzahl der Wörter bestimmt, die in einem free recall Test erinnert werden.





(5) Schätzung der Pop-ulationsvarianzen

(6) Berechnung des Stan-dardfehlers der Mittelwertsdifferenz





Der t-Test - 3

strukturell emotional

6 11

8 7

4 9

4 11

8 7

6

5

30

5

84486

sx

9

5

45

5

7119711

ex





(5) Schätzung der Pop-ulationsvarianz

(6) Berechnung des Standardfehlers der Mittelwertsdifferenz





Der t-Test - 4

strukturell emotional

6 11

8 7

4 9

4 11

8 76sx 9ex

244

16

15

)6(5

1

2

i i

s

x

244

16

15

)9(5

1

2

i i

e

x











Der t-Test - 5

6sx 9ex

2s 2s

26.16.15

4

5

4

22

s

s

e

exx NNse











Der t-Test - 6

26.1 se xx

38.226.1

38

)2(

t

xxt

se

es

xx

seNN

6sx 9ex

2s 2s











Der t-Test - 7

38.28 t

Festlegung des Alphaniveaus:α = .05

Art des Tests: einseitig vs. zweiseitigeinseitig (wegen der gerichteten Alternativ-Hypothese)

Ein- vs. Zweiseitiges Testen

Der t-Test 8

-3 -2 -1 0 1 2 30

0.1

0.2

0.3

0.4

p = 1-

tkrit

-3 -2 -1 0 1 2 30

0.1

0.2

0.3

0.4

p = 1-

tkrit

H0

H1

H1

H1

H0

Einseitiger Test:Signifikant, wenn

)1( kritemp tt

Zweiseitiger Test:Signifikant, wenn

)2/1(|| kritemp tt

Betrag von t, d.h. das Vorzeichen spielt keine Rolle!

Der t-Test - 9

Die t-Verteilungp=.800 p=.900 p=.950 p=.975 p=.990

1 1,376 3,078 6,314 12,706 31,821 63,6572 1,061 2,920 2,920 4,303 6,965 9,9253 0,978 2,353 2,353 3,182 4,541 5,8414 0,941 2,132 2,132 2,776 3,747 4,6045 0,920 2,015 2,015 2,571 3,365 4,0326 0,906 1,943 1,943 2,447 3,143 3,7077 0,896 1,895 1,895 2,365 2,998 3,4998 0,889 1,860 1,860 2,306 2,896 3,3559 0,883 1,833 1,833 2,262 2,821 3,250

10 0,879 1,812 1,812 2,228 2,764 3,16920 0,860 1,725 1,725 2,086 2,528 2,84530 0,854 1,697 1,697 2,042 2,457 2,75040 0,851 1,684 1,684 2,021 2,423 2,70450 0,849 1,676 1,676 2,009 2,403 2,67860 0,848 1,671 1,671 2,000 2,390 2,66070 0,847 1,667 1,667 1,994 2,381 2,64880 0,846 1,664 1,664 1,990 2,374 2,63990 0,846 1,662 1,662 1,987 2,368 2,632

100 0,845 1,660 1,660 1,984 2,364 2,626200 0,843 1,653 1,653 1,972 2,345 2,601

1000 0,842 1,646 1,646 1,962 2,330 2,581

df p=.995

-3 -2 -1 0 1 2 30

0.1

0.2

0.3

0.4

1-

tkrit

α = .05t(8) = 1.86 (einseitig)t(8) = 2.31 (zweis.)

α = .01t(8) = 2.90 (einseitig)t(8) = 3.36 (zweis.)











Der t-Test - 10

86.1)8(

38.2)8(

krit

emp

t

t

Fazit: Der Test hat gezeigt, dass Wörter besser erinnert werden, wenn sie emotional verarbeitet wurden, als wenn sie strukturell verarbeitet wurden.

Voraussetzungen des t-Tests für unabhängige Stichproben:

(1)Intervallskalenniveau der Variable

(2)Normalverteilung des Merkmals in der Grundgesamtheit

(3)„Varianzhomogenität“ (Gleiche Varianzen des Merkmals in beiden Populationen)

(4)Unabhängigkeit der Stichproben

Der t-Test für abhängige Stichproben

Definition: Stichproben werden als abhängig bezeichnet, wenn die Ziehung eines Merkmalsträgers in die erste Stichprobe die Zugehörigkeit eines Merkmalsträgers zur zweiten Stichprobe beeinflusst.

Abhängige Stichproben ergeben sich durch Messwieder-holung oder Parallelisierung bzw. Matching.

Warum parallelisiert man Stichproben?

Ein Test für abhängige Stichproben hat eine höhere Power (Teststärke), d.h. es ist wahrscheinlicher, dass ein bestehender Unterschied nachgewiesen werden kann!

Der t-Test für abhängige Stichproben

Nun wird die Verteilung der mittleren Differenzen benötigt. Diese berechnet sich nach dem Standardfehler für den Mittelwert wie folgt:

Nd

d

xx

ˆˆ

1

)(ˆ 1

2

N

xxmit

N

iddi

xd

Anschließend wird die mittlere Differenz an dem Standard-fehler relativiert. Das Ergebnis dieser Standardisierung ist wiederum t-verteilt.

t-Tests für abh. Stichproben - 8dx

dN

xt

1

HypothesenDie statistischen Hypothesen des t-Test für abhängige Stichproben

beziehen sich auf den Mittelwert der Differenzen aller Personen

Vorteil: Es ist nun unerheblich, ob innerhalb der Messzeitpunktegroße Varianz gegeben ist

Ungerichtete Hypothese:– H0: μ= 0– H1: μ≠ 0

Gerichtet Hypothese (1):– H0: μ≤ 0– H1: μ> 0

Gerichtet Hypothese (2):– H0: μ≥ 0– H1: μ< 0

hypothesen - 1 prüfung statistischer hypothesen die inferenzstatistische hypothesenprüfung erlaubt...

Documents