einführung in die statistik - tu-chemnitz.de t-test.pdf · prof. dr. günter daniel rey 4. t-test...
Post on 09-Aug-2019
212 Views
Preview:
TRANSCRIPT
Prof. Dr. Günter Daniel Rey
Professur Psychologie digitaler LernmedienInstitut für Medienforschung Philosophische Fakultät
Einführung in die Statistik
t-Test
24. t-TestProf. Dr. Günter Daniel Rey
• Zufallsstichproben generieren• Zentrale Verteilung abtragen• Kritischen und empirischen t-Wert bestimmen• Inferenzstatistische Entscheidung treffen• Nonzentrale Verteilung abtragen• Beta und Teststärke• Voraussetzungen und Arten von t-Tests• Schritte bei der Durchführung eines t-Tests• Praktische Bedeutsamkeit
Überblick
34. t-TestProf. Dr. Günter Daniel Rey
• Statistik als Suche nach Mustern in Zahlen• Deskriptivstatistik: Zahlenmuster werden dargestellt und beschrieben• Inferenzstatistik: Zahlenmuster werden gegen den Zufall und zur
Generalisierung (auf die Population) abgesichert• Nullhypothese (H0) vs. Alternativhypothese (H1)• Statistische Signifikanz: Wahrscheinlichkeit, dass das gefundene Ergebnis
oder extremere Ergebnisse bei Gültigkeit der Nullhypothese eintreten• Beispiel: Wahrscheinlichkeit ermitteln, dass die Auswirkungen eines
Medikaments durch einen Placeboeffekt zustande gekommen sind• Weiteres Beispiel: Wahrscheinlichkeit ermitteln, dass die Beachtung der
Leserichtung in interaktiven Visualisierungen die Lernleistungen erhöht
Inferenzstatistik (z.B. Bortz & Schuster, 2010)
44. t-TestProf. Dr. Günter Daniel Rey
Inferenzstatistik (Rey, 2017)
Transferleistung
• Beispiel: Leserichtungseffekt in Computersimulationen (Rey, 2009)
54. t-TestProf. Dr. Günter Daniel Rey
Häufigkeit
Mittelwerts-differenz
Zufallsstichproben generieren (Rey, 2017)
64. t-TestProf. Dr. Günter Daniel Rey
0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4
Wahrschein-lichkeitsdichte
t-Wert
Zentrale Verteilung abtragen (Rey, 2017)
74. t-TestProf. Dr. Günter Daniel Rey
Kritischen und empirischen t-Wert bestimmen (Rey, 2017)
0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4
Wahrschein-lichkeitsdichte
t-Wert
84. t-TestProf. Dr. Günter Daniel Rey
0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4
Wahrschein-lichkeitsdichte
t-Wert
Kritischen und empirischen t-Wert bestimmen (Rey, 2017)
Empirischer t-Wert
Kritischer t-Wert
Empirischen t-Wert berechnen:
𝑡 =𝑛 ∙ 𝑚
𝑛 + 𝑚∙ҧ𝑥 − ത𝑦
𝑠
𝑡 =56 ∙ 57
56 + 57∙5.71 − 4.75
1.83
𝑡 = 2.77
94. t-TestProf. Dr. Günter Daniel Rey
0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4
Wahrschein-lichkeitsdichte
Inferenzstatistische Entscheidung treffen (Rey, 2017)
Kritischer t-Wert
t-Wert
H1H0
Vermutung
Wirklichkeit
H1
H0
Empirischer t-Wert
Alpha
104. t-TestProf. Dr. Günter Daniel Rey
0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4
Wahrschein-lichkeitsdichte
t-Wert
Inferenzstatistische Entscheidung treffen (Rey, 2017)
Alpha
H1H0
Vermutung
Wirklichkeit
H1
H0
Kritischer t-Wert
Empirischer t-Wert
1 – Alpha
114. t-TestProf. Dr. Günter Daniel Rey
0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4
Wahrschein-lichkeitsdichte
t-Wert
Nonzentrale Verteilung abtragen (Rey, 2017)
1 – Alpha
Alpha
H1H0
Vermutung
Wirklichkeit
H1
H0
Kritischer t-Wert
Empirischer t-Wert
124. t-TestProf. Dr. Günter Daniel Rey
Wahrschein-lichkeitsdichte
t-Wert0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4
Beta und Power (Rey, 2017)
1 – Alpha
Alpha
H1H0
Vermutung
Wirklichkeit
H1
H0
Kritischer t-Wert
Empirischer t-Wert
Beta
134. t-TestProf. Dr. Günter Daniel Rey
0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4
Wahrschein-lichkeitsdichte
t-Wert
Empirischer t-Wert
Beta und Power (Rey, 2017)
1 – Alpha Beta
Alpha Power
H1H0
Vermutung
Wirklichkeit
H1
H0
Kritischer t-Wert
Power
144. t-TestProf. Dr. Günter Daniel Rey
Wahrschein-lichkeitsdichte
t-Wert0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4
Vier Entscheidungen & dazugehörige Wahrscheinlichkeiten (Rey, 2017)
1 – Alpha Beta
Alpha Power
H1H0
Vermutung
Wirklichkeit
H1
H0
Kritischer t-Wert
154. t-TestProf. Dr. Günter Daniel Rey
• Alphafehler: Irrtümliche Entscheidung zugunsten der H1
• Alpha: Wahrscheinlichkeit zum Alphafehler• 1 – Alpha: Gegenwahrscheinlichkeit zur
Alphafehlerwahrscheinlichkeit; inhaltlich: die korrekte Entscheidung zugunsten der H0
• Betafehler: Irrtümliche Entscheidung zugunsten der H0
• Beta: Wahrscheinlichkeit zum Betafehler • Teststärke (Power bzw. 1 – Beta): Gegen-
wahrscheinlichkeit zur Betafehlerwahr-scheinlichkeit; inhaltlich: die korrekte Entscheidung zugunsten der H1
Vier Entscheidungen & dazugehörige Wahrscheinlichkeiten (Rey, 2017)
1 – Alpha Beta
Alpha Power
H1H0
Vermutung
Wirklichkeit
H1
H0
164. t-TestProf. Dr. Günter Daniel Rey
• Statistische Signifikanz: Wahrscheinlichkeit, dass das gefundene Ergebnis oder extremere Ergebnisse bei Gültigkeit der Nullhypothese eintreten
• Konventionen für die Entscheidungsfindung auf Basis der berechneten Wahrscheinlichkeit (p-Wert)
Signifikanzniveau
Nicht signifikant Signifikant Sehr
signifikantHoch
signifikantp-Wert > 5% ≤ 5% ≤ 1% ≤ 0.1%
Abkürzung n.s. * ** ***
174. t-TestProf. Dr. Günter Daniel Rey
• Intervallskalenniveau der abhängigen Variable: Überprüfung aufwändig und schwierig
• Normalverteilung der abhängigen Variable in der Population: Überprüfung z. B. mittels Shapiro-Wilk-Test
• Varianzhomogenität als Gleichheit der Populationsvarianzen, aus denen die beiden Stichproben stammen: Überprüfung mittels Levene-Test
• Überprüfung der drei Voraussetzungen in der Forschungspraxis (leider) eher unüblich
Voraussetzungen des t-Tests (z.B. Rasch, Friese, Hofmann & Naumann, 2014)
184. t-TestProf. Dr. Günter Daniel Rey
• Bei Verletzungen einer der drei genannten Voraussetzungen kann statt des t-Tests (parametrisches Verfahren) u. a. ein nonparametrisches Verfahren verwendet werden
• Allerdings reagiert der t-Test unter folgenden Bedingungen relativ robust gegenüber Verletzungen der Voraussetzungen• Ungefähr gleichgroße Stichproben der beiden Gruppen• Hinreichend große Stichproben (n1 = n2 > 30)
• In der Praxis werden selten nonparametrische Verfahren genutzt
Voraussetzungen des t-Tests (z.B. Rasch, Friese, Hofmann & Naumann, 2014)
194. t-TestProf. Dr. Günter Daniel Rey
• Einseitige vs. zweiseitige Testung• Einseitige Testung bei gerichteten, zweiseitige Testung bei
ungerichteten Hypothesen• Höhere Teststärke bei einseitiger Testung
• Unabhängige vs. abhängige Stichproben• U.a. bei Messwiederholungen liegen abhängige Stichproben vor• In diesem Fall Berechnung des t-Wertes über die Differenzen der
Messwerte• t-Test für eine Stichprobe (Einstichprobentest; engl. one-sample t-
test)• Überprüfung, ob Stichprobe aus einer bestimmten Population
stammt
Arten von t-Tests (z. B. Rasch, Friese, Hofmann & Naumann, 2014)
204. t-TestProf. Dr. Günter Daniel Rey
Beispiele für t-Tests in Fachzeitschriften
Quelle: Huff, Bauhoff und Schwan (2012)
Quelle: Huff, Bauhoff und Schwan (2012)
Quelle: Mayer, Mathias und Wetzell (2002)
214. t-TestProf. Dr. Günter Daniel Rey
Rey.participoll.com
In einer Studie werden 200 Ehepaare jeweils gemeinsam befragt. Es soll überprüft werden, ob sich die Lerngewohnheiten von Frauen und Männern unterscheiden.Welche Art von t-Test kann hier eingesetzt werden? A: Unabhängiger t-Test mit einseitiger Testung B: Unabhängiger t-Test mit zweiseitiger Testung C: Abhängiger t-Test mit einseitiger Testung D: Abhängiger t-Test mit zweiseitiger Testung E: Einstichprobentest
Arten von t-Tests
0
vote at Rey.participoll.com
A B C D E
224. t-TestProf. Dr. Günter Daniel Rey
• Aufstellen einer Hypothese• Prüfung der inferenzstatistischen Voraussetzungen• Festlegung eines Populationseffekts• Festlegung des Signifikanzniveaus• Stichprobenumfangsplanung• Bestimmung von tkrit
• Prüfung des temp auf Signifikanz• Interpretation des Ergebnisses
Schritte bei der Durchführung eines t-Tests (z.B. Rasch et al., 2014)
234. t-TestProf. Dr. Günter Daniel Rey
• Neben der statistischen Signifikanz bzw. Bedeutsamkeit ist die praktische Bedeutsamkeit von zentraler Bedeutung
• Bezieht sich auf die Angabe einer Effektgröße bzw. Effektstärke• Beispiel: Medikament beseitigt selbst starke Kopfschmerzen• Konventionen für Effektgrößen (Cohen, 1988)
Praktische Bedeutsamkeit (z.B. Cohen, 1988)
Effektgröße Kleiner Effekt Mittlerer Effekt Großer Effektd 0.20 0.50 0.80
ηp² 0.01 0.06 0.14r 0.10 0.30 0.50
244. t-TestProf. Dr. Günter Daniel Rey
Zusammenfassung
Wahrschein-lichkeitsdichte
t-Wert0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4
1 – Alpha Beta
Alpha Power
H1H0
Vermutung
Wirklichkeit
H1
H0
Kritischer t-Wert
254. t-TestProf. Dr. Günter Daniel Rey
• Rey, G. D. (2017). Methoden der Entwicklungspsychologie. Datenerhebung und Datenauswertung (2., überarbeitete Auflage). Norderstedt: BoD.• Hypothesenüberprüfung (S. 115-128)
• Rasch, B., Friese, M., Hofmann, W., & Naumann, E. (2014). Quantitative Methoden 1: Einführung in die Statistik für Psychologen und Sozialwissenschaftler (4. Aufl.). Heidelberg: Springer.• Inferenzstatistik (S. 21-30)• Der t-Test (S. 33-75)
Prüfungsliteratur
264. t-TestProf. Dr. Günter Daniel Rey
• Bortz, J., & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7. Aufl.). Berlin: Springer.• Hypothesentesten (S. 97-115)• Tests zur Überprüfung von Unterschiedshypothesen (S. 117-136)
• Eid, M., Gollwitzer, M., & Schmitt, M. (2017). Statistik und Forschungsmethoden (5. Aufl.). Weinheim: Beltz.• Grundlagen der Inferenzstatistik (S. 217-277)• Vergleich zweier Stichprobenmittelwerte (S. 331-343)
• Leonhart, R. (2017). Lehrbuch Statistik. Einstieg und Vertiefung(4. Auflage). Bern: Huber.• Einführung in die inferenzstatistische Hypothesenprüfung (S.
177-210)• Einfache parametrische Testverfahren (S. 211-228)
Weiterführende Literatur I
274. t-TestProf. Dr. Günter Daniel Rey
• Sedlmeier, P., & Renkewitz, F. (2018). Forschungsmethoden und Statistik: Ein Lehrbuch für Psychologen und Sozialwissenschaftler (3. Aufl.). München: Pearson.• Inferenzstatistik (S. 309-428)
• Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2. ed.). Hillsdale, NJ: Erlbaum.
• Richardson, J. T. E. (2011). Eta squared and partial eta squared as measures of effect size in educational research. Educational Research Review, 6, 135-147.
• Razali, N. M., & Wah, Y. B. (2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal ofStatistical Modeling and Analytics, 2, 21-33.
Weiterführende Literatur II
top related