vorlesung: biometrie für studierende der veterinärmedizin 12.1.2006 1 prinzipien des statistischen...
TRANSCRIPT
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
1
Prinzipien des statistischen Testens
• Entscheidungsfindung
• Exakter Binomialtest als Beispiel
• Statistische Tests– Nullhypothese– Alternativhypothese– Fehlentscheidungen
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
2
Ausgangspunkt:
Forschungshypothese
Beispiele:
1. Klinische Studien:These: Neues Präparat größere therapeutische Wirkung als die herkömmlichen
2. Geburtshypothese:These: mehr Jungen- als Mädchengeburten
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
3
Überprüfung solcher Fragestellungen anhand empirischer Forschung
Beachte:Fragestellungen
- Aussagen über Grundgesamtheit (GG)- formuliert über Parameter der GG- nicht vollständig überprüfbar, i.d.R. nur die Konsequenzen- zur empirischen Überprüfung Operationalisierung notwendig,
d.h. Festlegung beobachtbarer Variablen, die zur Erfassung der eigentlichen Fragestellung geeignet sind z.B. bessere Heilung bedingt durch neues Medikament, messbar über Veränderung bestimmter Laborparameter
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
4
Dabei wichtig:Festlegung von
Zur empirischen Überprüfung notwendig:- Festlegung eines Prüfplans- Kontrolle von Störvariablen (Confounder)
zusätzliche Einflussgrößen auf abh. Variablen und mit interessierender Einflussgröße assoziiert
- Einhaltung des Prüfplans- Abweichungen notieren
Einflussvariable (unabhängig)Verabreichung des Medikaments
Zielvariablen (abhängig)Veränderung relevanter Laborparameter
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
5
Von Interesse:
Ist beobachtetes Phänomen in Stichproben (Heilung unter Medikament) reines Zufallsprodukt oder mit großer Sicherheit aufMedikament zurückzuführen?
Dazu notwendig:Formale Entscheidungsregel
Statistischer Test
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
6
Beispiel: Exakter Binomialtest
Vermutung: mehr Jungen- als Mädchengeburten
Studienplan: Zähle Geburten (keine Mehrlinge) getrennt nachGeschlecht innerhalb von 24 Stunden in
einemKrankenhaus 10 Geburten
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
7
Überlegung:
• Jungen- und Mädchengeburten gleich wahrscheinlich
• Was ist bei 6 Jungen und 4 Mädchen?gleich wahrscheinlich?
• Jedes dieser Ereignisse möglich, auch wenn Anzahl in Wirklichkeit gleich Wahrscheinlichkeiten dafür aber gering mehr Jungen als Mädchen
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
8
Formale Beschreibung
Damit:Aussagen über Verhältnis Jungen- und Mädchengeburtenformulierbar über :
)1P(X mit sonst 0
geborenwir Junge 1 X ii
Mädchen als Jungenmehr 21
Mädchen und Jungen viele gleich 21
statistisches Testproblem
Nullhypothese vs. Alternativhypothese
21
:H0 vs. (Forschungshypothese)21
:H1
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
9
Zur Überprüfung des Testproblems:
Verdichtung der Info aus Stichprobe in Prüfgröße bzw. Teststatistik
Wichtig:
Anhand Teststatistik Entscheidung darüber, ob eher H0 oder H1 für Grundgesamtheit zutrifft, d.h. H0 und H1 Aussagen über GG undnicht über die Stichprobe
10
1iiXY Jungender Anzahl :Prüfgröße
Hier:
Falls Y > c
für geeigneten „kritischen“ Wert c Entscheidung für H1!
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
10
Aber:Wie ist c zu wählen?
Dazu:Annahme gerechtfertigt, dass Geburten unabhängig
)5.0,10n( Binomial~X0H
i
y 0 1 2 3 4 5
P(Y=y) 0.001 0.01 0.044 0.117 0.205 0.246
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
11
B (10, 0.1)
0
0,05
0,1
0,15
0,2
0,25
0,3
0 1 2 3 4 5 6 7 8 9 10
Skizze:
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
12
Außerdem:
Unter H0 erwartet: 5 Jungengeburten d.h. Y > 5 spricht für H1
Aber wie groß müssen Werte sein, dass ihr Zustandekommen unter H0 extrem unwahrscheinlich ist?
Was ist „extrem unwahrscheinlich“? üblich: 0.01, 0.05, 0.1 Signifikanzniveau
Konstruktion des sogenannten Ablehnungsbereichs,der alle Werte enthält,- die für H1 sprechen- deren Wahrscheinlichkeit insgesamt
Simulation mit R
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
13
Beispiel:
Ablehnungsbereich enthält alle y-Werte, also Anzahl vonJungengeburten, die- größer 5- zusammengenommen unter H0 eine Wahrscheinlichkeit von höchstens 0.1 besitzen
Da
)5.0,10( Bin~Y,1.0,5.0,10n0H
{8,9,10}C bereichAblehnungs
1.0117.0 rten)Jungengebu 7(P
055.0044.0 rten)Jungengebu 8(P
011.0 01.0 rten)Jungengebu 9(P
001.0 rten)Jungengebu 10(P
0
0
0
0
H
H
H
H
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
14
Interpretation:
8, 9, 10 Jungengeburten sind unter der Annahme, dass Jungen-und Mädchengeburten gleich wahrscheinlich sind, nur mit einerWahrscheinlichkeit von höchstens 10% möglich
so klein, dass Schluss naheliegend: H1 gilt!
Man sagt:
H0 kann zugunsten von H1 verworfen werden.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
15
Damit:Statistischer Test
liefert
objektive Entscheidung
aber Vorsicht!statistischer Test kann nur entscheiden, ob Ergebnis im statistischen Sinn signifikant, also statistisch bedeutend, aber nicht, ob auch unter substanzwissenschaftlichen Gesichtspunkt
„H0 beibehalten“bzw. „Beobachtungen liefern stat.nicht signifikantes Ergebnis“
„H0 ablehnen“bzw. „Beobachtungen liefern statistisch signifikantes Ergebnis“
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
16
Also:Stat. Signifikanz nicht immer gleich biologischer RelevanzBewertung der Biologischen Relevanz eventuell unter Einbeziehungder Nebenkriterien (z.B. positive / negative Nebenwirkungen, Wohlbefinden des Patienten, Allgemeinzustand)
Abb. 1:Statistische Signifikanz und biologische Relevanz
Wichtig: Inhaltliche Interpretierbarkeit der Ergebnisse
Statistische Signifikanz
ja nein
Biologische Relevanz
ja + -
nein - +
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
17
Beispiel:Biologisch relevante Blutdrucksenkung (BDS), wenn BDS > 10/5 mmHg bei Patienten mit leichtem bis mittelschwerem Bluthochdruck.Blutdruck vorher Blutdruck nachher(„Baseline“) („nach Gabe der Mittels“)
Y0 Y1
Biolog. Relevanz Stat. Signifikanz
ja ja
ja nein
nein ja
nein nein 010
010
010
010
H von Ablehnung-Nicht und 10/5 YY
H von Ablehnung und 10/5 YY
H von Ablehnung-Nicht und 10/5 YY
H von Ablehnung und 10/5 YY
011
010
:H
:H
mmHg 5/10
wenn Relevant, ischlogbio
10
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
18
Außerdem möglich:Fehlentscheidungen
Test entscheidet- mehr Jungen- als Mädchengeburten, obwohl tatsächlich gleich
viele- gleich viele Jungen- und Mädchengeburten, obwohl tatsächlich
mehr Jungen,
d.h.
- H0 wird verworfen, obwohl H0 wahr Fehler 1. Art (-Fehler)
- H0 wird beibehalten, obwohl H1 wahr Fehler 2. Art (-Fehler)
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
19
Damit sind folgende Ausgänge eines Tests möglich:
Abb. 2:
Hypothese
wahr nicht wahr
Test
lehnt abFehler 1. Art
(-Fehler)richtig
lehnt nicht ab richtigFehler 2. Art
(-Fehler)
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
20
Beachte:stat. Test med. Testbei beiden Fehlentscheidungen möglich
Testproblem bei med. Test (Diagnose)
H0: Patient gesund vs. H1: Patient krank
Ziel:med. Test mit großer Genauigkeit bei Einstufung von• gesundem Patienten als gesund
hohe Spezifität geringe Wahrscheinlichkeit für Fehler 1. Art
• krankem Patienten als krank hohe Sensitivität geringe Wahrscheinlichkeit für Fehler 2. Art
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
21
Merke:
• Konstruktion statistischer Tests so, dass Kontrolle über Wahrscheinlichkeit für Fehler 1. Art durch kleine vorgegebene obere Schranke Signifikanzniveau Sicherheitswahrscheinlichkeit 1 -
• keine Kontrolle über Wahrscheinlichkeit für Fehler 2. Art Suche nach bestem Test: unter allen Tests zum Niveau für vorliegendes Testproblem derjenige mit geringster Wahrscheinlichkeit für Fehler 2. Art
• Fallzahl-Bestimmung durch Festlegung der „Power“ des Tests bei einem bestimmten Wirkunterschied unter Berücksichtigung der Streuung des Hauptzielkriteriums. Power: Funktion, die abhängt vom wahren Wirkunterschied (|1-0| im BDS-Beispiel) und der Streuung.
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
22
Damit:
• Nullhypothese höchstens mit Wahrscheinlichkeit fälschlicherweise verworfen
• Wahrscheinlichkeit für den Fehler 2. Art nicht vorgegeben abhängig von gewählter Alternative, je näher wahrer Parameter an (nicht wahrem) Wert aus H0, desto größer Wahrscheinlichkeit für Fehler 2. Art
Ungleichbehandlung beider Fehlerarten Grund für Formulierung eigentlicher Forschungsfrage als
statistische Alternative: Entscheidung für H1 durch statistisch abgesichert!
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
23
Zur Veranschaulichung:
Steht Angeklagter vor Gericht, so lautetH0: „Angeklagter ist unschuldig“undH1: „Angeklagter ist schuldig“
H0 und H1 so formuliert, da Gericht Schuld des Angeklagtenbeweisen muss, nicht Angeklagter Unschuld
Fehler 1. Art: Unschuldiger wird verurteiltFehler 2. Art: Schuldiger wird nicht verurteilt
Vorlesung: Biometrie für Studierende der Veterinärmedizin
12.1.2006
24
Beachte:
Wichtig für Auswahl eines „besten“ statistischen Tests:
Verteilungsmodell
hängt ab
vom Skalenniveau und Wertebereichder Ausprägungen der interessierenden Größe