Download - Formulierung und Überprüfung von Hypothesen
Formulierung und Überprüfung von
Hypothesen
Statistische Kennwerte
• z.B.: arithmetisches Mittel beschreibt STICHPROBE hinsichtlich der zentralen Tendenz
mehr oder weniger genaue Beschreibung
Nun aber:
• Eigenschaften einer Population werden zunächst postuliert und dann überprüft
• Überprüfung anhand einer Stichprobe
Stichprobenergebnisse
• Starke Zufallsschwankungen!
• Wie weit darf Stichprobe von der Behauptung (Hypothese) abweichen um noch mit der Theorie über einzustimmen?
zentrale Frage
Beispiel: folgende Behauptung
Die durchschnittliche Unterrichtsleistungen von Schülern, die nach einer herkömmlichen Methode unterrichtet wurden, sind schlechter als die Durchschnittsleistungen von Schülern, die nach einer neuen Methode unterrichtet wurden! (Alternativhypothese – H1)
H0
Nullhypothese:
Die neue Methode ist genauso gut oder schlechter wie die alte Methode!
kein Unterschied
(null und nichtig…)
Das Ergebnis der Untersuchung bezieht sich nur auf die Stichprobe während die Hypothesen die Verhältnisse in der Population beschreiben!
Es besteht immer die Möglichkeit, dass die Stichprobenauswahl ZUFÄLLIG nicht mit der Population übereinstimmt!
Hypothesen
• H0: μ0≥ μ1 Die Unterrichtsmethoden unterscheiden sich nicht oder die neue Methode ist sogar schlechter!
• H1: μ0< μ1 Die neue Methode ist besser als die herkömmliche Methode!
Es gilt:
Nur wenn die Realität „praktisch“ nicht mit der Nullhypothese zu erklären ist, darf sie zugunsten der neuen Alternativhypothese verworfen werden.
Fehlerarten bei statistischen Entscheidungen
Wahrer Sachverhalt:
H0
Wahrer Sachverhalt:
H1
durch einen stat. Test fällt eine Entscheidung für die Nullhypothese H0
Richtige Entscheidung
beta (Fehler 2. Art, falsch negativ)
durch einen stat.Test fällt eine Entscheidung für die alternative Hypothese H1
alpha (Fehler 1. Art, falsch positiv)
Richtige Entscheidung
SIGNIFIKANZAUSSAGENÜberprüfung der neuen Lernmethode anhand einer Stichprobe
Das Ergebnis zeigt, dass tatsächlich im Durchschnitt bessere Leistungen mit der neuen Methode erbracht wurden! (Annahme des Beispiels)
Ist das Ergebnis rein ZUFÄLLIG oder nicht?
ALLGEMEIN lautet die Frage:
Die Wahrscheinlichkeit, mit der das gefundene Ergebnis oder extremere Ergebnisse bei Gültigkeit von H0 eintreten, bezeichnet man als α-Fehlerwahrscheinlichkeit oder Irrtumswahrscheinlichkeit.
Je geringer der Wert desto unwahrscheinlicher die H0!
Bestimmung der Irrtumswahrscheinlichkeit
Die Verteilung der Mittelwerte in einer zufällig gezogenen Stichprobe (nach der alten Methode unterrichtet) hat Normalform. (nach zentralem Grenzwerttheorem…)
Bestimmung der Irrtumswahrscheinlichkeit
Der Lernerfolg der nach der neuen Methode unterrichteten Stichprobe ist durch ein „x quer“ markiert!
… wurde im Bsp. als besser angenommen
Bestimmung der Irrtumswahrscheinlichkeit
graue Fläche P besagt, mit welcher Wahrscheinlichkeit die gleiche oder bessere Durchschnittsleistung auch von der „alten“ Methode erzielt werden könnte!
Bestimmung der Irrtumswahrscheinlichkeit
graue Fläche P gibt daher die Wahrscheinlichkeit an, mit der wir uns bei der Entscheidung für H1 bei einem Ergebnis „x quer“ irren würden.....
die Irrtumswahrscheinlichkeit
Zur Rechnung - ANGABE
herkömmliche Methode - durchschnittlich erzielter Lernerfolg: μ0=40(z.B.: Anzahl der gelösten Aufgaben)Streuung der Leistung: σ=0,8
bei einer Stichprobe von Schülern (n=100), die mit der neuen Methode unterrichtet wurden, ergab sich eine durchschnittliche Leistung von x=42.
Nun ist zu überprüfen:
Mit welcher Wahrscheinlichkeit hätten 100 Schüler auch mit der herkömmlichen Methode eine durchschnittliche Leistung von 42 oder besser erzielen können!
Es besteht nämlich die Möglichkeit, dass die neue Methode nicht besser ist, sondern nur per ZUFALL eine derartige Leistung erbracht wurde.
z-Transformation
Durch die z-Transformation können sämtliche Normalverteilungen standardisiert werden, d.h. auf einen Standard gebracht werden.
Wir bezeichnen deshalb die Normalverteilung mit μ=0 und σ=1 als Standardnormalverteilung.
z-Transformation
Es muss deshalb lediglich ermittelt werden, welcher z-Wert in der Standardnormalverteilung (Mittelwert (Mittelwert = 0 und Streuung = 1)= 0 und Streuung = 1) dem gefundenen x-Wert (bei uns 42) in unserer Verteilung (μ0=40 und σ=0,8)
entspricht!
z-Transformation
0
x
z
Für das Beispiel ergibt sich folgender z-Wert:
50,28,0
40420
xz
Nachschlagen in der Standardnormalverteilungstabelle:
Standardnormalverteilung
z-Wert Φ(-z) Φ(z)
Nach der Tabelle schneidet dieser z-Wert 0,62% von der Normalverteilungsfläche ab!
Ergebnis
… gefärbter Flächenanteil bzw. Wahrscheinlichkeit dafür, dass das gefundene oder ein extremeres Ergebnis auch bei der Gültigkeit der H0 hätte auftreten können beträgt somit P=0,62%
= Wahrscheinlichkeit, dass wir H0 fälschlich verwerfen = Irrtumswahrscheinlichkeit
x=42 ist nur sehr schwer mit H0 in Einklang zu bringen!
Interpretation
P=0,62%
…wenn 10000 Stichproben nach der herkömmlichen Methode unterrichtet werden, können wir nur in ca. 62 Fällen mit einer durchschnittlichen Leistung von 42 rechnen
…schlechter Beleg für H0
Interpretation
P=0,62%
…es bleibt nun dem Forscher überlassen, ob er bereit ist sich für die H1 zu entscheiden und sich dabei mit einer Wahrscheinlichkeit von 0,62% irrt!
Das Signifikanzniveau
Wegen der Vergleichbarkeit und der Qualität statistisch abgesicherter Entscheidungen hat sich daher folgendes Niveau eingebürgert:
H0 ist erst dann zu verwerfen, wenn die Irrtumswahrscheinlichkeit P kleiner oder gleich 5% ist(Medizin: 1%)
Das Signifikanzniveau• Beträgt die Wahrscheinlichkeit des
gefundenen oder eines extremeren Untersuchungsergebnisses unter der Annahme, die H0 sei richtig, höchstens 5%, so wird dieses Ergebnis als signifikant bezeichnet.
• Beträgt diese Wahrscheinlichkeit höchstens 1%, so ist das Ergebnis sehr signifikant.
ACHTUNG
Eine statistische Hypothesenprüfung führt NICHT zur Wahrheit, sondern nur zu Wahrscheinlichkeiten!
… bei der Entscheidung für die H1 müssen wir immer mit einem -Fehler rechnen!
… einen -Fehler in Kauf nehmen
Einseitige und zweiseitige Tests
Eine Hypothese kann gerichtet oder ungerichtet sein!
Am Beispiel der Unterrichtsmethoden:gerichtet: die eine Methode ist besser als die
andere Methode einseitiger TestUngerichtet: beide Methoden unterscheiden
sich
Einseitiger Test
für die H0
für die H0
Einseitiger TestNun könnte man den Wert, der die 5% - Grenze markiert suchen!
Gesucht: z-Wert, der die 5% - Grenze markiert
z1- = z0,95 = 1,65 ist der Wert, der von der rechten Seite der Standardnormalverteilung genau 5% abschneidet!
z-Wert Φ(-z) Φ(z)
Nach der Tabelle schneidet dieser z-Wert 5% von der Normalverteilungsfläche ab!
xCRIT = μ0 + z1- · σ = 40 + 1,65 · 0,8 = 41,32
Interpretation
Alle Werte, die mindestens so groß sind (x≥41,32) befinden sich im Ablehnungsbereich für H0
xCRIT = μ0 + z1- · σ = 40 + 1,65 · 0,8 = 41,32
Zweiseitiger Test
Die beiden Methoden unterscheiden sich! (ungerichtete Hypothese)
x-Werte, die deutlich kleiner oder größer sind als μ0 deuten auf die Richtigkeit der H1
Zweiseitiger Test
Die Grenzen müssen nun so gewählt werden, dass an beiden Seiten der Verteilung INSGESAMT 5% abgeschnitten werden, also an beiden Seiten jeweils 2,5%.
Zweiseitiger Test
43,388,0)96,1(40
96,1
20
025,02
)2(
zx
zz
CRIT
57,418,096,140
96,1
)21(0
975,021
)21(
zx
zz
CRIT
Interpretation
x-Werte, die kleiner oder gleich 38,43 und größer oder gleich 41,57 sind führen zu einer Ablehnung der H0
Fortsetzung des Beispiels:
Nun ist ein -Fehlerniveau von 1% zu wählen:
Einseitiger Test:
Zweiseitiger Test:
z-Wert Φ(-z) Φ(z)
Einseitiger Test – Lösung:1% - Grenze
1% - Grenze
z-Wert der die 1% - Grenze markiert ist gesucht!
z1- = z0,99 = 2,33
xCRIT = μ0 + z1- · σ = 40 + 2,33 · 0,8 = 41,864
z-Wert Φ(-z) Φ(z)
Zweiseitiger Test – Lösung: 1% - Grenze
936,378,0)58,2(40
58,2
20
005,02
)2(
zx
zz
CRIT
064,428,058,240
58,2
)21(0
995,021
)21(
zx
zz
CRIT
Beispiel 1:Zwei Unterrichtsmethoden werden miteinander verglichen. herkömmliche Methode (A) - durchschnittlich erzielter Lernerfolg: μ0=12(z.B.: Anzahl der gelösten Aufgaben)Streuung der Leistung: σ=1,2
Bei einer Stichprobe von Schülern, die mit der neuen Methode (B) unterrichtet wurden, ergab sich eine durchschnittliche Leistung von x=13.
a) In wie viel Prozent der Fällen erbringen auch Schüler mit Methode A diese Leistung?b) Ist A wirklich schlechter?c) Suche jenen kritischen Wert, der mit einer Irrtumswahrscheinlichkeit von 5% B als die bessere Methode identifiziert.
Beispiel 2:Frau Prof. Katschnig behauptet, dass bei ständiger Anwesenheit in der Übung im durchschnitt nur 10 Studenten die Prüfung nicht schaffen. (Streuung = 3,13)
Nun stellt sich die Frage ab wie vielen durchgefallenen Studenten die Behauptung nicht mehr haltbar ist (bei einer Irrtumswahrscheinlichkeit von 5%)!
DANKE FÜR IHRE AUFMERKSAMKEIT