analysis of variance (anova) 1/2 - stat.ethz.chย ยท anova = spezialfall einer linearen regression g...
Post on 30-Oct-2019
8 Views
Preview:
TRANSCRIPT
||Seminar fรผr Statistik 16.10.2014Markus Kalisch 1
ANalysis Of VAriance (ANOVA) 1/2
||Seminar fรผr Statistik
ANOVA 1: Zwei Medikamente zur Blutdrucksenkung und
Placebo (Faktor). Gibt es einen sign. Unterschied in der
Wirkung (kontinuierlich)?
๐ ~ ๐ + ๐
ANOVA 2: Zwei Medikamente zur Blutdrucksenkung,
Placebo (Faktor) und Geschlecht (Faktor). Gibt es einen
sign. Unterschied in der Wirkung (kontinuierlich) (evtl.
geschlechterspezifisch)?
๐ ~ ๐1 + ๐2 + ๐
16.10.2014((Vorname Nachname)) 2
ANOVA - Idee
1-weg ANOVA
2-weg ANOVA
||Seminar fรผr Statistik
ANOVA = ยซVarianzanalyseยป
Macht Aussagen รผber Mittelwerte (analysiert dazu
Varianzen)
ANOVA = Spezialfall einer Linearen Regression
๐๐๐๐ก. ๐๐๐๐๐๐๐๐ ~ ๐ญ๐๐๐๐๐๐๐ + ๐น๐โ๐๐๐
Verallgemeinerung des t-Test (2 Gruppen โ viele
Gruppen)
Historisch: Sehr verbreitet; heute: Immer noch extrem
verbreitet
16.10.2014Markus Kalisch 3
ANOVA: Mรถgliche Missverstรคndnisse
||Seminar fรผr Statistik 16.10.2014Markus Kalisch 4
Wdh: Ungepaarter t-Test
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-10
05
10
M P
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-10
-50
5
M P
D
๐
๐D
๐ก โ๐ท
๐; ๐๐๐๐๐ ๐ป0 ๐ ๐ก๐๐๐๐ก: ๐ก โผ ๐ก๐โ1 โ ๐(0,1)
D: โStreuungโ zwischen MW (โSignalโ)
๐: โStreuungโ um MW (โFehlerโ)
||Seminar fรผr Statistik 16.10.2014Markus Kalisch 5
ANOVA: Idee
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-50
51
02
0
M1 M2 P
Streuung zwischen Gruppen:
โBetween-Sum-of-Squaresโ (๐๐๐ต)RSS der Gruppenmittelwerte (rote Kreuze)
um den totalen Mittelwert (blaue Linie)
๐๐๐ต = ๐ โ
๐=1
๐
๐๐. โ ๐..2
Streuung innerhalb Gruppen:
โWithin-Sum-of-Squaresโ (๐๐๐)
RSS der Einzelbeobachtungen
(schwarze Kreise) um die einzelnen
Mittelwerte (rote Kreuze)
๐๐๐ =
๐=1
๐
๐=1
๐
๐๐๐ โ ๐๐.2
๐: ๐ด๐๐ง๐โ๐ ๐บ๐๐ข๐๐๐๐ 3๐: ๐ด๐๐ง๐โ๐ ๐ต๐๐๐. ๐๐๐ ๐บ๐๐ข๐๐๐ 10Ann: ๐ in jeder Gruppe gleich
๐3.
๐2.๐1. ๐..
Teststatistik โ๐๐๐ต
๐๐๐
||Seminar fรผr Statistik
In welchem Bild ist die Teststatistik der ANOVA grรถsser ?
16.10.2014Markus Kalisch 6
ANOVA: Teststatistik
A
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-10
05
15
M1 P
B
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-10
05
15
M1 P
||Seminar fรผr Statistik
๐๐๐ = ๐ + ๐ผ๐ + ๐๐๐ , ๐๐๐ ~ ๐ 0, ๐2 ๐๐๐
Technische Nebenbedingung: ๐=1๐๐ผ๐ = 0
๐ป0: ๐ผ1 = ๐ผ2 = โฏ = ๐ผ๐ = 0
Teststatistik: ๐ =๐๐๐ต/(๐โ1)
๐๐๐/(๐โ ๐โ1 )=๐๐๐ต
๐๐๐
Theorie: Falls ๐ป0 stimmt
๐ ~ ๐น๐โ1,๐โ ๐โ1
Damit kann ein Hypothesentest mit den รผblichen 6
Schritten durchgefรผhrt werden
16.10.2014Markus Kalisch 7
ANOVA: Modell
โMean Squaresโ
โDegrees of freedom (Df)โ
โAnalyse der
Varianzenโ
||Seminar fรผr Statistik
Angenommen: ๐๐ ~ ๐ 0,1 , ๐ = 1,โฆ๐ alle unabhรคngig
๐ด =
๐=1
๐
๐๐2
Chi-Quadrat-Verteilung mit ๐ Freiheitsgraden: A ~ ๐๐ Angenommen: ๐ด ~ ฮง๐, ๐ต ~ ฮง๐ unabhรคngig
๐ =๐ด/๐
๐ต/๐
F-Verteilung mit ๐ und ๐ Freiheitsgraden ๐ ~ ๐น๐;๐
16.10.2014Markus Kalisch 8
Exkurs: Verteilungen
||Seminar fรผr Statistik 16.10.2014Markus Kalisch 9
Beispiel in R: ANOVA-Tabelle
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-50
51
02
0
M1 M2 P
๐ = 3, ๐ = 10
๐ โ 1 = 2g*(p-1)=27
๐๐๐ต = 872.3๐๐๐ = 642.1
๐๐๐ต =872.3
2= 436.1
๐๐๐ =642.1
27= 23.8
๐น =436.1
23.8= 18.34
||Seminar fรผr Statistik
Falls ANOVA signifikant: Zwischen welchen Gruppen sind
signifikante Unterschiede ?
โ t-Tests fรผr alle Gruppenpaare
Problem: Multiples Testen
Bei ๐ Gruppen gibt es ๐2=๐(๐โ1)
2t-Tests
Bsp: ๐ = 20 โ 190 Tests auf 5%-Niveau
Kรถnnten etwa 0.05 โ 190 โ 10 falsch positive Tests haben
Lรถsung: t-Test korrigieren (z.B. Bonferroni, โฆ)
16.10.2014Markus Kalisch 10
Wo ist der Unterschied ?
Teil 1: Paarweise Tests
||Seminar fรผr Statistik
Vorteil:
- Vertrauensintervalle fรผr Differenzen der
Gruppenmittelwerte
- Wa., dass alle wahren Differenzen in den
Vertrauensintervallen liegen: 95%
Alternative zum paarweisen t-Test
Empfehlung: Tukey HSD verwenden
16.10.2014Markus Kalisch 11
Beliebte Alternative bei ANOVA:Tukeyโs Honestly Significant Difference (HSD) Test
||Seminar fรผr Statistik 16.10.2014Markus Kalisch 12
Beispiel in R: TukeyHSD
-15 -10 -5 0 5 10
P-M
2P
-M1
M2
-M1
95% family-wise confidence level
Differences in mean levels of g Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-50
51
02
0M1 M2 P
M2 ist deutlich wirksamer als M1
M1 und M2 sind deutlich
wirksamer als Placebo
||Seminar fรผr Statistik
Bisher: Differenz von zwei Gruppen
Jetzt: Linearkombination von beliebigen Gruppen
Bsp: Sind die beiden Medikamente im Mittel besser als
das Placebo ?
16.10.2014Markus Kalisch 13
Wo ist der Unterschied ?
Teil 2: Allgemeine Kontraste
||Seminar fรผr Statistik
Vektor mit wahren
Gruppenmittelwerten:
๐ = ๐๐1, ๐๐2, ๐๐๐
Kontraste-Matrix ๐พ
Parameter-Vektor ๐
๐ป0: ๐พ โ ๐ = ๐
Praxis: Benutzer definiert ๐พ und ๐; Computer berechnet
p-Werte fรผr Hypothesen und korrigiert fรผr mult. Testen
16.10.2014Markus Kalisch 14
Kontraste: Notation
Medikament
Se
nku
ng
Blu
tdru
ck [
mm
Hg
]
-50
51
02
0
M1 M2 P
||Seminar fรผr Statistik
(Alternative zu TukeyHSD)
16.10.2014Markus Kalisch 15
Konstraste โ Bsp 1: Paarweise Vergleiche
K ๐ m
๐๐2 โ ๐๐1 = 0๐๐ โ ๐๐1 = 0๐๐ โ ๐๐2 = 0
||Seminar fรผr Statistik
Funktion โglhtโ (General Linear Hypotheses Test) im
package โmultcompโ
16.10.2014Markus Kalisch 16
Kontraste โ Bsp 1: R
Approx. 95%-VI fรผr Unterschied M1 vs. M2:
5.67 ยฑ 2 โ 2.181
||Seminar fรผr Statistik 16.10.2014Markus Kalisch 17
Kontraste โ Bsp 2:
Gruppe der Medikamente vs. Placebo
0.5 โ ๐๐1 + 0.5 โ ๐๐2 โ ๐๐ = 0๐๐2 โ ๐๐1 = 0
Medikamente vs. Placebo
Medikamente untereinander
||Seminar fรผr Statistik 16.10.2014Markus Kalisch 18
Kontraste โ Bsp 2: R
Die Medikamente sind deutlich
wirksamer als Placebo
M2 ist deutlich wirksamer als M1
||Seminar fรผr Statistik
Angenommen, es gibt zwei Medikamente (M1, M2) und
auch zwei mรถgliche Formen von Placebo (P1, P2). Folgende
Matrix ist dann eine mรถgliche Kontrastmatrix fรผr die
Vergleiche:
(M1, M2) vs. (P1, P2)
M1 vs. M2
P1 vs. P2
16.10.2014Markus Kalisch 19
Kontraste
โข Ja
โข Nein
||Seminar fรผr Statistik
Wenige Kontraste โ viel Macht
Software: Korrektur fรผr multiples Testen innerhalb von
einem Funktionsaufruf (aber nicht bei mehreren
Funktionsaufrufen mit verschiedenen Kontrasten)
Deshalb: Einen Satz von Kontrasten definieren, dann
auswerten; anschliessend keinen neuen Satz von
Kontrasten mehr untersuchen
16.10.2014Markus Kalisch 20
Grundregeln fรผr Kontraste
||Seminar fรผr Statistik
๐๐๐ = ๐ + ๐ผ๐ + ๐๐๐ , ๐๐๐ ~ ๐ 0, ๐2 ๐๐๐
1. Daten in jeder Gruppe normalverteilt
2. Gleiche Varianz in Gruppen
3. Unabhรคngige Fehler ๐๐๐
In R: Funktion โplotโ wie bei Linearer Regression
Vorteil: โBalanciertes Experimentโ (gleiche Anzahl pro Gruppe):
ANOVA ist robuster gegen Abweichungen obiger Annahmen
16.10.2014Markus Kalisch 21
Residuenanalyse bei ANOVA
top related