tutorat statistik ii im ss 09 einfaktorielle varianzanalyse ch-langrock@t-online.de
Post on 05-Apr-2015
108 Views
Preview:
TRANSCRIPT
Tutorat Statistik II im SS 09einfaktorielle Varianzanalyse
ch-langrock@t-online.de
Memo: Mediator- & Moderatoranalyse
Was fällt euch noch ein?
Memo
- Spezielle Verwendungen der Methode Regressionsanalyse
- Funktion Mediatoranalyse: Vermittlung der gemeinsamen Varianz über Drittvariablen sichtbar machen
- Die vier Schritte der Mediatoranalyse- Funktion Moderatoranalyse: Beinflussung der „Höhe“
des Zusammenhangs zwischen zwei Variablen durch (eine) dritte Variable prüfen
- Zentraler mathematischer Unterschied:Bei der Mediatoranalyse müssen alle Variablen korrelieren, bei der Moderatoranalyse soll die Drittvariable nicht mit Prädiktor/UV korrelieren
Thema: einfaktorielle Varianzanalyse
Gliederung
Die Varianzanalyse wird mit ANOVA = Analysis of Variance abgekürzt
I. Anwendung und Funktion der ANOVAII. Verknüpfung: Effekte, ALM & ANOVAIII. Berechnung der ANOVAIV. Hypothesen & VoraussetzungenV. Effektgrößen & Formalia
I. ANOVA: Anwendung & Funktion
ANOVA: Was und wozu?
Ziel: Vergleich von Mittelwerten
Warum kein t-Test?!
Einfaktorielle ANOVA mit zwei Gruppen entspricht dem t-Test (F=t²)
strukturell bildhaft
5 12
7 7
3 8
4 10
6 13
M=5 M=10
Alpha-Fehler-Kumulierung
Wenn drei Gruppen verglichen werden sollen, sind verschie-dene Vergleiche möglich:
(1) struk vs. bild: t(8) = -3.73; p = .006
(2) struk vs. emo: t(8) = -9.04; p = .000
(3) bild vs. emo: t(8) = -1.69; p = .129
Bei jedem der 3 Vergleiche besteht die Gefahr fälschlicher-weise einen signifikanten Effekt zu finden (α = 0.05)!
strukturell bildhaft emotional
5 12 12
7 7 11
3 8 12
4 10 12
6 13 13
M=5 M=10 M=12
Gruppen Vergleiche Kumulierter
α-Fehler3 3 0.1434 6 0.2645 10 0.4016 15 0.5377 21 0.6598 28 0.7629 36 0.842
10 45 0.90111 55 0.94012 66 0.96613 78 0.98214 91 0.99115 105 0.995
Alpha-Fehler-Kumulierung
Der kumulierte α-Fehler gibt die Wahrscheinlichkeit an, mindestens einen statistisch bedeutsamen Gruppenunterschied zu finden, obwohl in der Population die H0 gilt (alle Gruppen sind gleich).
Bereits bei 5 Gruppen nähern wir uns dem Zufallsniveau!
Bonferroni-KorrekturMit der Bonferroni-Korrektur wird das α-Fehler-Niveau für jeden einzelnen Test soweit herabgesetzt, dass der kumulierte Fehler nur noch 0.05 beträgt.
Beispiel: 5 Gruppen 10 Tests αadj = 0.05 / 10 = 0.005
Nachteil: sehr niedriges Alpha-Niveau bei den einzelnen Tests geringe Power (großer β-Fehler)
Bessere Alternative: Berechnung einer Varianzanalyse
Testsadj N
ANOVA: Was und wozu?
o Die Varianzanalyse ist ein Verfahren zur Berechnung von Mittelwertsunterschieden zwischen Gruppen → t - Test
o Die Varianzanalyse wird verwendet, wenn man effizient und mit geringem Beta-Fehler (hoher Power) prüfen will, ob sich mehr als zwei Gruppenmittelwerte signifikant voneinander unterscheiden
Übersicht ANOVA
Begriffsklärung 1
o Einfaktoriell: Die ANOVA beinhaltet eine UV, die beliebig viele Stufen haben kann
o Beispiel: Ich untersuche ob sich die Extraversionswerte (AV) der Probanden in Abhängigkeit von der Haarfarbe unterscheiden (UV, hier mit 4 Stufen: braun, schwarz, blond, rot)
o Mehrfaktoriell: Die ANOVA beinhaltet mehr als zwei UVs oder Faktoren, deren Wirkung auf die AV untersucht wird
o Beispiel: Als zusätzliche UV in meiner Extraversionsstudie nehme ich den ebenfalls vierstufigen Faktor Haarlänge auf
Damit werden auch Wechselwirkungen (Interaktionseffekte) zwischen den Faktoren analysierbar
Welche Methode zur Analyse von Wechselwirkungen kennt ihr bereits?
Begriffsklärung 2
o Feste Effekte: Die UV ist nominalskaliert
o Zufällige Effekte: Die UV ist intervallskaliert
Die Implikationen für Berechnung und Interpretation der ANOVA werden später im Semester behandelt. Wissbegierigen sei vorab Leonhart S. 327-330 empfohlen.
Begriffsklärung 3
Begriffsklärung 4
o Univariat: Wir untersuchen eine AV in Abhängigkeit der UV
o Multivariat: Wir untersuchen mehrere AV
Beispiel: Der Einfluss des Geburtszeitpunkts (UV, dichotom: Sommer/Winter) auf IQ, Lebenszufriedenheit und Größe (AVs)
II. Effekte, ALM & ANOVA
Effekte
Effekt: Abweichung eines Gruppenmittelwerts vom Gesamtmittelwert → Gruppenzahl = Anzahl der Faktorstufen
Mathematisch:
Gesamtmittelwert
Mittelwert Gruppe 2
Mittelwert Gruppe 1
→ ALM
Beispiel: Effekte
Strukturgleichung des ALM
ikikkiii
kikkiii
eaxbxbxby
axbxbxby
...23.12211
...23.12211
...
...ˆ
Effekte im ALM
ALM in Matrizenform
Dummy- und Effektkodierung
o Die Varianzanalyse verwendet k-1 (k=Gruppen) Variablen um die Zugehörigkeit zu einer Gruppe in einer Designmatrix darzustellen
o Die Dummykodierung „spart“, indem sie von einem Nulleffekt für eine Gruppe ausgeht
o Die Effektkodierung macht sich die Tatsache zur Nutze, dass sich alle Effekte zu Null addieren:
Dummykodierung
Effektkodierung
III. Berechnung der ANOVA
Berechnung der ANOVA
- Quadratsummenzerlegung
- F-Test & Interpretation
Quadratsummenzerlegung
Basis der Methode: Varianz
1ˆ
1
2
2
n
yy
df
SSMS
n
ii
Quadratsumme
Freiheitsgrade
MS: Mittlere Quadratsumme
Quadratsummenzerlegung
Gesamt-Quadratsumme (SStotal)
Quadratsumme innerhalb der Gruppen (SSwithin , SSError)
Quadratsumme zwischen den Gruppen (SSbetween, SSTreatment)
n
i
p
jij yy
1 1
2
n
i
p
jjij yy
1 1
2
p
jjj yyn
1
2
Gesamt-Quadratsumme
strukturell bildhaft
y11=5 y12=12
y21=7 y22=7
y31=3 y32=8
y41=4 y42=10
y51=6 y52=13
M1=5 M2=10
G=7.5
n
i
p
jijtotal yySS
1 1
2
2
222
222
222
7.5)-(13
7.5)-(107.5)-(8 7.5)-(7
7.5)-(12 7.5)-(6 7.5)-(4
7.5)-(37.5)-(7 7.5)-(5
totalSS
98.50
30.25 6.25 0.25 0.25 20.25
2.25 12.25 20.25 0.25 6.25
totalSS
94.109
5.98ˆ 2 total
1
ˆ
1 1
2
2
pn
yy
df
SS
n
i
p
jij
total
totaltotal
y
strukturell bildhaft
y11=5 y12=12
y21=7 y22=7
y31=3 y32=8
y41=4 y42=10
y51=6 y52=13
M1=5 M2=10
G=7.5
Gesamtvarianz
Varianz innerhalb der Gruppen
5.48
36ˆ 2 within
n
i
p
jjijwithin yySS
1 1
2strukturell bildhaft
y11=5 y12=12
y21=7 y22=7
y31=3 y32=8
y41=4 y42=10
y51=6 y52=13
M1=5 M2=10
G=7.536
904 9 4 1 1 4 4 0
10)²-(13 10)²-(10 10)²-(8 10)²-(7 10)²-(12
5)²-(6 5)²-(4 5)²-(3 5)²-(7 5)²-(5
withinSS
8210 pNdfwithin
Varianz zwischen den Gruppen
50.621
50.62ˆ 2 between
p
jjjbetween yynSS
1
2strukturell bildhaft
y11=5 y12=12
y21=7 y22=7
y31=3 y32=8
y41=4 y42=10
y51=6 y52=13
M1=5 M2=10
G=7.550.62
25.3125.31
(2.5)5 (-2.5)5
7.5)-(105 7.5)-(5522
22
betweenSS
1121 pdfbetween
Zwischenergebnisse
Gesamtvarianz 94.109
50.98ˆ 2
total
totaltotal df
SS
50.48
36ˆ 2
within
withinwithin df
SS
50.621
50.62ˆ 2
between
betweenbetween df
SS
Varianz innerhalb
Varianz zwischen
Additivität
Quadratsummen sind additiv
innerhalbzwischentotal QSQSQS
Freiheitsgrade sind additiv
innerhalbzwischentotal dfdfdf
Varianzen sind nicht additiv222 ˆˆˆ innerhalbzwischentotal
F-Test & Interpretation
Der F-Test
Vergleich zweier Varianzen (→ multiple Regression)
H0: Varianzen gleich groß F=1
H1: Zählervarianz (=erklärte Varianz) größer F>1
Femp > Fkrit Varianzen signifikant verschieden!
2
2
, ˆ
ˆ
innerhalb
zwischendfdf innerhalbzwischen
F
Abgleich: empirischer & kritischer Wert
o Analog zum t-Test wird der berechnete empirische Wert mit einem kritischen Wert aus einer Tabelle verglichenDie H1 gilt wenn Femp > Fkrit Die H0 gilt wenn Femp ≤ Fkrit
o Im Unterschied zum t-Test hängt der kritische F-Wert von Zähler- und Nennerfreiheitsgraden ab
Am Beispiel
o Femp (1, 8) = 62,5 : 4,5 = 13,89o Fkrit (1, 8) = 5,32; α = .05o Femp > Fkrit
Es gilt die H1
50.48
36ˆ 2
within
withinwithin df
SS
50.621
50.62ˆ 2
between
betweenbetween df
SS
Varianz innerhalb
Varianz zwischen
→ Leonhart S. 658 ff.
Varianzanalyse: rechnerisches Vorgehen im Überblick
o Gruppen- und Gesamtmittelwerte bildeno Quadratsummen berechnen
= „Vorstufe“ der Varianzo Freiheitsgrade berechneno Mittlere Quadratsummen berechnen
= Varianzo F-Bruch bilden, Vergleich mit krit. F-Werto Interpretation: Entscheidung für H0 oder H1
IV. Hypothesen& Voraussetzungen
Nullhypothese der ANOVA
H0: Alle Mittelwerte sind gleich: μ1 = μ2 = … = μp μi = μj (für alle i,j)
bzw.
H0: Alle Effekte sind NullH0: α1 = α2 = … = αp = 0 αi = 0 (für alle i)
bzw.
H0: Die Varianz der Effekte ist NullH0: σ²α = 0 oder σ²Effekt=0
H1: Mindestens zwei Mittelwerte sind verschiedenμi ≠ μj (für mind. ein Paar i, j)
bzw.
H1: Mindestens ein Effekt ist ungleich Nullαi ≠ 0 (für mindestens ein i)
bzw.
H1: Varianz der Effekte ist größer als Nullσ²α > 0 oder σ²Effekt>0
Mittels ANOVA sind nur ungerichtete Alternativhypothesen möglich
Alternativhypothese der ANOVA
Voraussetzungen der ANOVA
(1) Intervallskalierte, normalverteilte AV
(2) Mindestens 20 Elemente pro Gruppe
(3) Ähnlich Gruppengrößen in den Zellen
(4) Varianzhomogenität
5.1min
max n
n
Prüfung der Varianzhomogenität
Zur Überprüfung der Varianzhomogenität stehen verschie-dene Tests zur Verfügung:
a) Barlett-Test (sehr empfindlich gegenüber der Verletzungen der Normalverteilung)
b) Levene-Test (relativ unempfindlich gegenüber Verletzungen der Normalverteilung)
c) Fmax-Statistik (Hartley Test, nur bei gleichen Gruppen-Größen)
Levene-Test
Der Levene-Test ist eine Varianzanalyse über die Ab-weichung der individuellen Messwerte vom Gruppenmittelwert:
H0:
jijij yyd
jddd ...21
Wird der Levene-Test signifikant (p < 0.05), dann ist die Annahme der Varianzgleichheit verletzt.
Varianzanalyse ist robust
D.h. bei Verletzungen der Annahmen resultieren meistens trotzdem sinnvolle Ergebnisse (Insbesondere bei großen Stichproben).
Wenn nur einzelne Annahmen verletzt sind, können die Ergebnisse einer ANOVA dennoch verwendet werden.
Allerdings muss dann berichtet werden, dass die Annahmen verletzt sind, damit der Leser weiß, das die Ergebnisse mit Vorsicht zu interpretieren sind!
V. Effektgrößen & Formalia
Effektgrößen
o Was war noch gleich Cohens d?
o Auch bei der ANOVA lässt sich die praktische Relevanz von Effekten durch Berechnungen vergleichen.
o Eta² gibt an, wie viel % der Varianz der AV durch die UV erklärt wird.
Alternativ: Berechnung aus F-Wert
Formalia: F-Tests in Forschungsdokumentationen
Konventionen:- Nötige Infos: F- und p-Wert bzw. p-Niveau,
Zähler- und Nennerfreiheitsgrade- F- und p-Wert : exakt zwei Nachkommastellen;
Ausnahme: p-Wert bei n.s.
Signifikante Ergebnisse:(F[2, 37] = 5.34; p < .01)Nicht-signifkante Ergebnisse: (F[2, 37] = 1.44; p=.25) oder (F[2, 37] = 1.44; n.s.)
Vielen Dank für eure Aufmerksamkeit!
Arbeitsblatt Aufgabe 1
In einer Untersuchung zur Lesekompetenz in verschiedenen Ländern ergibt sich folgender Datensatz:
Land A Land B Land C
y11 = 80 y12 = 35 y13 = 70
y21 = 75 y22 = 50 y23 = 75
y31 = 60 y31 = 60 y33 = 75
y41 = 65 y42 = 40 y43 = 45
a. Formulieren Sie die Null- und die Alternativhypothese für eine ANOVA
b. Berechnen Sie die Quadrat-summen (total, within, between)
c. Berechnen Sie die mittleren Quadratsummen (…)
d. Berechnen Sie den empirischen F-Wert
e. Geben Sie den kritischen F-Wert an (-> 4,26)
f. Entscheiden Sie sich für eine der Hypothesen
Lösung (a)
H0: µa = µb = µc oder…
H0: Die Lesekompetenz unterscheidet sich nicht
H1: µi ≠ µj für mindestens ein Paar i,j oder…
H1: Die Lesekompetenz unterscheidet sich zwischen mindestens zwei Ländern
Lösung (b)
MA = 70; MB = 46,25; MC = 66,25
Mges = 60,83
SStotal = 2541,67
SSwithin = 1237,5
SSbetween = 1304,17
p
jjjbetween yynSS
1
2
n
i
p
jjijwithin yySS
1 1
2
n
i
p
jijtotal yySS
1 1
2
Lösung (c)
MStotal = 2541,67 : 11 = 231,06
MSwithin = 1237,5 : 9 = 137,5
MSbetween = 1304,17 : 2 = 625,08
11 pnNdftotal
Lösung (d,e,f)
d. Femp (2, 9) = 625,8 : 137,5 = 4,74
e. Fkrit (2, 9) = 4,26; α = .05
f. Da Femp > Fkrit gilt die H1
2
2
, ˆ
ˆ
innerhalb
zwischendfdf innerhalbzwischen
F
Arbeitsblatt Aufgabe 3
Berechnen Sie den Levene-Test für die Daten aus Aufgabe 1
Land A Land B Land C
y11 = 80 y12 = 35 y13 = 70
y21 = 75 y22 = 50 y23 = 75
y31 = 60 y31 = 60 y33 = 75
y41 = 65 y42 = 40 y43 = 45
Lösung
Land A Land B Land C
d11 = 10 d12 = 11,25 d13 = 3,75
d21 = 5 d22 = 3,75 d23 = 8,75
d31 = 10 d31 = 13,75 d33 = 8,75
d41 = 5 d42 = 6,25 d43 = 21,25
MA = 7,5; MB = 8,75; MC = 10,63
Mges = 8,96
Lösung 2
SStotal = 274,88SSwithin = 254,69SSbetween = 19,79
MStotal = 24,95MSwithin = 28,3MSbetween = 9,9
Lösung 3
o Femp (2, 9) = 0,35
o Fkrit (2, 9) = 4,26; α = .05
Da Femp < Fkrit gilt die H0, die Annahme der Varianzhomogenität ist nicht verletzt
top related