einführung in die statistik - tu-chemnitz.de t-test.pdf · prof. dr. günter daniel rey 4. t-test...

Prof. Dr. Günter Daniel Rey

Professur Psychologie digitaler LernmedienInstitut für Medienforschung Philosophische Fakultät

Einführung in die Statistik

t-Test

24. t-TestProf. Dr. Günter Daniel Rey

• Zufallsstichproben generieren• Zentrale Verteilung abtragen• Kritischen und empirischen t-Wert bestimmen• Inferenzstatistische Entscheidung treffen• Nonzentrale Verteilung abtragen• Beta und Teststärke• Voraussetzungen und Arten von t-Tests• Schritte bei der Durchführung eines t-Tests• Praktische Bedeutsamkeit

Überblick

• Statistik als Suche nach Mustern in Zahlen• Deskriptivstatistik: Zahlenmuster werden dargestellt und beschrieben• Inferenzstatistik: Zahlenmuster werden gegen den Zufall und zur

Generalisierung (auf die Population) abgesichert• Nullhypothese (H0) vs. Alternativhypothese (H1)• Statistische Signifikanz: Wahrscheinlichkeit, dass das gefundene Ergebnis

oder extremere Ergebnisse bei Gültigkeit der Nullhypothese eintreten• Beispiel: Wahrscheinlichkeit ermitteln, dass die Auswirkungen eines

Medikaments durch einen Placeboeffekt zustande gekommen sind• Weiteres Beispiel: Wahrscheinlichkeit ermitteln, dass die Beachtung der

Leserichtung in interaktiven Visualisierungen die Lernleistungen erhöht

Inferenzstatistik (z.B. Bortz & Schuster, 2010)

Inferenzstatistik (Rey, 2017)

Transferleistung

• Beispiel: Leserichtungseffekt in Computersimulationen (Rey, 2009)

Häufigkeit

Mittelwerts-differenz

Zufallsstichproben generieren (Rey, 2017)

-4 -3 -2 -1 0 1 2 3 4

Wahrschein-lichkeitsdichte

t-Wert

Zentrale Verteilung abtragen (Rey, 2017)

Kritischen und empirischen t-Wert bestimmen (Rey, 2017)

-4 -3 -2 -1 0 1 2 3 4

t-Wert

-4 -3 -2 -1 0 1 2 3 4

t-Wert

Kritischen und empirischen t-Wert bestimmen (Rey, 2017)

Empirischer t-Wert

Kritischer t-Wert

Empirischen t-Wert berechnen:

𝑡 =𝑛 ∙ 𝑚

𝑛 + 𝑚∙ҧ𝑥 − ത𝑦

𝑡 =56 ∙ 57

56 + 57∙5.71 − 4.75

𝑡 = 2.77

-4 -3 -2 -1 0 1 2 3 4

Inferenzstatistische Entscheidung treffen (Rey, 2017)

Kritischer t-Wert

t-Wert

Vermutung

Wirklichkeit

Empirischer t-Wert

-4 -3 -2 -1 0 1 2 3 4

t-Wert

Inferenzstatistische Entscheidung treffen (Rey, 2017)

Vermutung

Wirklichkeit

Kritischer t-Wert

Empirischer t-Wert

1 – Alpha

-4 -3 -2 -1 0 1 2 3 4

t-Wert

Nonzentrale Verteilung abtragen (Rey, 2017)

1 – Alpha

Vermutung

Wirklichkeit

Kritischer t-Wert

Empirischer t-Wert

t-Wert0

-4 -3 -2 -1 0 1 2 3 4

Beta und Power (Rey, 2017)

1 – Alpha

Vermutung

Wirklichkeit

Kritischer t-Wert

Empirischer t-Wert

-4 -3 -2 -1 0 1 2 3 4

t-Wert

Empirischer t-Wert

Beta und Power (Rey, 2017)

1 – Alpha Beta

Alpha Power

Vermutung

Wirklichkeit

Kritischer t-Wert

t-Wert0

-4 -3 -2 -1 0 1 2 3 4

Vier Entscheidungen & dazugehörige Wahrscheinlichkeiten (Rey, 2017)

1 – Alpha Beta

Alpha Power

Vermutung

Wirklichkeit

Kritischer t-Wert

• Alphafehler: Irrtümliche Entscheidung zugunsten der H1

• Alpha: Wahrscheinlichkeit zum Alphafehler• 1 – Alpha: Gegenwahrscheinlichkeit zur

Alphafehlerwahrscheinlichkeit; inhaltlich: die korrekte Entscheidung zugunsten der H0

• Betafehler: Irrtümliche Entscheidung zugunsten der H0

• Beta: Wahrscheinlichkeit zum Betafehler • Teststärke (Power bzw. 1 – Beta): Gegen-

wahrscheinlichkeit zur Betafehlerwahr-scheinlichkeit; inhaltlich: die korrekte Entscheidung zugunsten der H1

Vier Entscheidungen & dazugehörige Wahrscheinlichkeiten (Rey, 2017)

1 – Alpha Beta

Alpha Power

Vermutung

Wirklichkeit

• Statistische Signifikanz: Wahrscheinlichkeit, dass das gefundene Ergebnis oder extremere Ergebnisse bei Gültigkeit der Nullhypothese eintreten

• Konventionen für die Entscheidungsfindung auf Basis der berechneten Wahrscheinlichkeit (p-Wert)

Signifikanzniveau

Nicht signifikant Signifikant Sehr

signifikantHoch

signifikantp-Wert > 5% ≤ 5% ≤ 1% ≤ 0.1%

Abkürzung n.s. * ** ***

• Intervallskalenniveau der abhängigen Variable: Überprüfung aufwändig und schwierig

• Normalverteilung der abhängigen Variable in der Population: Überprüfung z. B. mittels Shapiro-Wilk-Test

• Varianzhomogenität als Gleichheit der Populationsvarianzen, aus denen die beiden Stichproben stammen: Überprüfung mittels Levene-Test

• Überprüfung der drei Voraussetzungen in der Forschungspraxis (leider) eher unüblich

Voraussetzungen des t-Tests (z.B. Rasch, Friese, Hofmann & Naumann, 2014)

• Bei Verletzungen einer der drei genannten Voraussetzungen kann statt des t-Tests (parametrisches Verfahren) u. a. ein nonparametrisches Verfahren verwendet werden

• Allerdings reagiert der t-Test unter folgenden Bedingungen relativ robust gegenüber Verletzungen der Voraussetzungen• Ungefähr gleichgroße Stichproben der beiden Gruppen• Hinreichend große Stichproben (n1 = n2 > 30)

• In der Praxis werden selten nonparametrische Verfahren genutzt

Voraussetzungen des t-Tests (z.B. Rasch, Friese, Hofmann & Naumann, 2014)

• Einseitige vs. zweiseitige Testung• Einseitige Testung bei gerichteten, zweiseitige Testung bei

ungerichteten Hypothesen• Höhere Teststärke bei einseitiger Testung

• Unabhängige vs. abhängige Stichproben• U.a. bei Messwiederholungen liegen abhängige Stichproben vor• In diesem Fall Berechnung des t-Wertes über die Differenzen der

Messwerte• t-Test für eine Stichprobe (Einstichprobentest; engl. one-sample t-

test)• Überprüfung, ob Stichprobe aus einer bestimmten Population

stammt

Arten von t-Tests (z. B. Rasch, Friese, Hofmann & Naumann, 2014)

Beispiele für t-Tests in Fachzeitschriften

Quelle: Huff, Bauhoff und Schwan (2012)

Quelle: Mayer, Mathias und Wetzell (2002)

Rey.participoll.com

In einer Studie werden 200 Ehepaare jeweils gemeinsam befragt. Es soll überprüft werden, ob sich die Lerngewohnheiten von Frauen und Männern unterscheiden.Welche Art von t-Test kann hier eingesetzt werden? A: Unabhängiger t-Test mit einseitiger Testung B: Unabhängiger t-Test mit zweiseitiger Testung C: Abhängiger t-Test mit einseitiger Testung D: Abhängiger t-Test mit zweiseitiger Testung E: Einstichprobentest

Arten von t-Tests

vote at Rey.participoll.com

A B C D E

• Aufstellen einer Hypothese• Prüfung der inferenzstatistischen Voraussetzungen• Festlegung eines Populationseffekts• Festlegung des Signifikanzniveaus• Stichprobenumfangsplanung• Bestimmung von tkrit

• Prüfung des temp auf Signifikanz• Interpretation des Ergebnisses

Schritte bei der Durchführung eines t-Tests (z.B. Rasch et al., 2014)

• Neben der statistischen Signifikanz bzw. Bedeutsamkeit ist die praktische Bedeutsamkeit von zentraler Bedeutung

• Bezieht sich auf die Angabe einer Effektgröße bzw. Effektstärke• Beispiel: Medikament beseitigt selbst starke Kopfschmerzen• Konventionen für Effektgrößen (Cohen, 1988)

Praktische Bedeutsamkeit (z.B. Cohen, 1988)

Effektgröße Kleiner Effekt Mittlerer Effekt Großer Effektd 0.20 0.50 0.80

ηp² 0.01 0.06 0.14r 0.10 0.30 0.50

Zusammenfassung

t-Wert0

-4 -3 -2 -1 0 1 2 3 4

1 – Alpha Beta

Alpha Power

Vermutung

Wirklichkeit

Kritischer t-Wert

• Rey, G. D. (2017). Methoden der Entwicklungspsychologie. Datenerhebung und Datenauswertung (2., überarbeitete Auflage). Norderstedt: BoD.• Hypothesenüberprüfung (S. 115-128)

• Rasch, B., Friese, M., Hofmann, W., & Naumann, E. (2014). Quantitative Methoden 1: Einführung in die Statistik für Psychologen und Sozialwissenschaftler (4. Aufl.). Heidelberg: Springer.• Inferenzstatistik (S. 21-30)• Der t-Test (S. 33-75)

Prüfungsliteratur

• Bortz, J., & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler (7. Aufl.). Berlin: Springer.• Hypothesentesten (S. 97-115)• Tests zur Überprüfung von Unterschiedshypothesen (S. 117-136)

• Eid, M., Gollwitzer, M., & Schmitt, M. (2017). Statistik und Forschungsmethoden (5. Aufl.). Weinheim: Beltz.• Grundlagen der Inferenzstatistik (S. 217-277)• Vergleich zweier Stichprobenmittelwerte (S. 331-343)

• Leonhart, R. (2017). Lehrbuch Statistik. Einstieg und Vertiefung(4. Auflage). Bern: Huber.• Einführung in die inferenzstatistische Hypothesenprüfung (S.

177-210)• Einfache parametrische Testverfahren (S. 211-228)

Weiterführende Literatur I

• Sedlmeier, P., & Renkewitz, F. (2018). Forschungsmethoden und Statistik: Ein Lehrbuch für Psychologen und Sozialwissenschaftler (3. Aufl.). München: Pearson.• Inferenzstatistik (S. 309-428)

• Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2. ed.). Hillsdale, NJ: Erlbaum.

• Richardson, J. T. E. (2011). Eta squared and partial eta squared as measures of effect size in educational research. Educational Research Review, 6, 135-147.

• Razali, N. M., & Wah, Y. B. (2011). Power comparisons of Shapiro-Wilk, Kolmogorov-Smirnov, Lilliefors and Anderson-Darling tests. Journal ofStatistical Modeling and Analytics, 2, 21-33.

Weiterführende Literatur II

einführung in die statistik - tu-chemnitz.de t-test.pdf · prof. dr. günter daniel rey 4. t-test...

Documents

derecho administrativo i - preguntas tipo test.pdf

heat test.pdf

klinika 2 test.pdf

tabellen und abbildungen - tu-chemnitz.de tabellen...

kid's box placement test.pdf

klinika 1 test.pdf

da1_2001_tema8_da diagnóstico y test.pdf

arthur e.powell - a mentális test.pdf

angst als auslöser von alten mustern. angst blockiert...

การสร้างข้อสอบในระบบ...

statistik tabel statistik

training zur aussprache von prosodischen mustern modul h2...

potenziale herausforderungen und perspektiven … ·...

statistik pertanian -...

ฝ่ายตรวจสอบความเสี...

conelson model test.pdf

tai lieu huong dan drive test.pdf

statistik s2 sains (statistik deskriptif)

statistik harga pedesaan subdit statistik harga pedesan...

language assessment test.pdf · online test...