Download - Wykład 7 Przedział ufności dla 1 – 2
Wykład 7Przedział ufności dla 1 – 2
• Skonstruujemy przedział ufności dla 1 – 2
• Przypomnienie: PU dla : y t/2 SEy =
(estymator) (kwantyl)(SE)
• Estymator dla 1 - 2 : y1-y2
• Potrzebujemy t/2 : Ile użyć stopni swobody? (Skomplikowane; wzoru nie trzeba pamiętać, będzie na ściądze.)
• df=
22 21 2
4 41 2
1 21 1
SE SE
SE SE
n n
• Liczba stopni swobody wyliczona z poprzedniego wzoru nie powinna być większa niż n1 + n2 – 2; przy szybkich, zgrubnych obliczeniach często stosujemy df = n1 + n2 –2.
• Nie powinna być mniejsza niż mniejsza z wartości (n1 -1) i (n2 -1).
• Stosujemy ``nieuśredniony’’ SE (o ile w zadaniu nie będzie specjalnie wymagane any użyć (U)SE).
• PU na poziomie ufności (1-) dla 1 - 2
• (y1-y2) t(df)/2 SE(y1-y2)
Przykład (cd)
• Skonstruuj 95% PU dla 1 - 2
y1 –y2 = 75 – 55 = 20
• SE1 = 1.690 ; SE2 = 1.826
• df=
• Oblicz przedział ufności jeszcze raz wykorzystując ``uśredniony’’ SE.
Przykład 2 - 95% PU dla 1 - 2
• Rośliny hodowane w różnych warunkach oświetleniowych.
Ciemno Jasno
n 22 21
y 1.76 2.46
SE 0.5 0.7
• “1” – populacja/próba hodowana przy słabym oświetleniu
• “2” – populacja/próba hodowana przy silnym oświetleniu
• Oblicz 95% PU dla 1 - 2.
Przedziały ufności: Interpretacja
• Nasz PU zawiera wartości zarówno dodatnie jak i ujemne ? Jak to zinterpretować ?
Testowanie hipotez
• Idea• Chcemy odpowiedzieć na pytanie naukowe
dotyczące pewnej (lub pewnych) populacji• Decyzję podejmujemy w oparciu o próbę -
dysponujemy tylko pewnym fragmentem informacji
• W rezultacie możemy popełnić błąd przy podejmowaniu decyzji
• Chcemy zminimalizować p-stwo błędu
• Typowe pytania:
• Pytania o wartości parametrów
• Dla populacji o rozkładzie Bernoulliego. Czy p-stwo sukcesu wynosi ½ (czy moneta jest symetryczna) ?
• Czy p-stwo sukcesu wynosi p0 ? (p0 – pewna konkretna, interesująca nas wartość)
• Dla rozkładu normalnego:Czy średnia w populacji wynosi 0? Czy średnia w populacji wynosi 93? Czy średnia w populacji wynosi 0 ? (0 –
konkretna, interesująca nas wartość).
• Dla dwóch populacji normalnychCzy średnie wartości cechy w obu populacjach
są sobie równe ?Czy różnica między średnimi w obu
populacjach wynosi 0?Czy różnica między średnimi w obu
populacjach wynosi 0 ?
• Na te pytania są dwie możliwe odpowiedzi – tak albo nie (prawda albo fałsz).
• Pytania dotyczą całej populacji, do której na ogół nie mamy dostępu. Nasza decyzja, którą podejmujemy w oparciu o próbę, jest obarczona pewnym błędem.
• Sposób formułowania odpowiedzi• Zamiast prawda mówimy• ``W oparciu o tę próbę nie możemy wykluczyć
postawionej hipotezy’’ .• Przykład: Przeprowadzone badania nie
potwierdzają, że badane populacje mają różny średni poziom badanej cechy. (Nie można wykluczyć, że nie ma różnicy).
• Zamiast Nie mówimy
• Jest to mało prawdopodobne albo bardziej precyzyjnie
• Gdyby postawiona hipoteza była prawdziwa to uzyskany wynik (z próby) byłby bardzo mało prawdopodobny. Dlatego odrzucamy tę hipotezę (ale możemy się mylić).
• Przykład: Przeprowadzone badanie potwierdza tezę, że badane populacje różnią się średnią wartością badanej cechy (odrzucamy hipotezę o równości średnich).
Analogia (K. Simonsen, Purdue): wykrywacz dymu
• Instalujemy wykrywacze dymu aby ostrzegły nas przed pożarem.
• Nie są to idealne wykrywacze pożarów. Reagują na cząstki dymu w powietrzu.
• Mogą być w dwu możliwych stanach – CICHO i GŁOŚNO
• Nasz dom może być w dwu możliwych stanach – SPOKÓJ albo POŻAR
• Możemy podjąć dwie decyzje: zostać albo uciekać
• System ostrzegania może popełnić dwa błędy
• Jest GŁOŚNO choć nie ma ognia (na przykład przypaliliśmy grzankę)
• Jest CICHO choć jest pożar (zła lokalizacja, koniec baterii,…)
• Decyzję uzależniamy od stanu wykrywaczy dymu (CICHO – zostajemy, GŁOŚNO – uciekamy).
• Na ogół nie ma ognia, wykrywacz jest CICHO, więc nie reagujemy (dobra decyzja).
• Czasami nie ma ognia a wykrywacz jest GŁOŚNO, więc uciekamy (zła decyzja – strata czasu) – błąd I rodzaju.
• Czasami jest pożar a wykrywacz jest CICHO więc zostajemy (zła decyzja – niebezpieczeństwo) – błąd II rodzaju.
• Czasami jest pożar i wykrywacz jest GŁOŚNO więc uciekamy (dobra decyzja).
Notacja:• Hipotezy
• Stan wyjściowy, ``SPOKÓJ’’, określamy nazwą hipotezy zerowej
• Drugi możliwy stan, ``POŻAR’’, określamy nazwą hipotezy alternatywnej
• H0 to skrót dla hipotezy zerowej
• HA to skrót dla hipotezy alternatywnej
• Decyzje
• Decyzje zawsze wyrażamy w stosunku do hipotezy zerowej H0:
• Decyzja ``uciekamy’’ odpowiada odrzuceniu H0, tzn. odrzucamy stanowisko, że nie ma pożaru.
• Decyzja ``zostajemy’’ odpowiada nie odrzuceniu H0.
• Decyzję podejmujemy w oparciu o zachowanie wykrywacza dymu, który dalej będziemy nazywać statystyką testową.
• Gdy wykrywacz jest GŁOŚNO to mówimy, że wynik testu jest ``istotny’’. Istotny wynik powoduje odrzucenie H0.
• Gdy wykrywacz jest CICHO to wynik testu jest ``nieistotny’’ i nie odrzucamy H0.
Podsumowanie analogii• Hipotezy: SPOKÓJ = H0 ; POŻAR = HA ;• Statystyka testowa: • CICHO = nieistotna; • GŁOŚNO = istotna;• Decyzja: zostajemy = nie odrzucamy H0; • uciekamy = odrzucamy H0
• Błąd I rodzaju: (uciekamy choć nie ma pożaru) = (odrzucamy H0 choć jest prawdziwa)
• Błąd II rodzaju: (zostajemy choć jest pożar) = (nie odrzucamy H0 choć prawdziwa jest HA)
• Zauważmy, że H0 jest bardziej precyzyjna niż HA: gdy HA jest prawdziwa to pożar może być dowolnej wielkości
• Wykrywacze dymu mają pewną ustaloną czułość – reagują na określoną ilość dymu w powietrzu.
• Jeżeli wykrywacz jest zbyt czuły to będzie często powodował fałszywe alarmy (błędy I rodzaju).
• Jeżeli nie jest dość czuły to nie będzie się włączał kiedy potrzeba – błędy II rodzaju.
• Zwiększając czułość zmniejszamy p-stwo błędu II rodzaju ale zwiększamy p-stwo błędu I rodzaju. Dobór czułości testu powinien zależeć od konsekwencji błędów.
• Jak opisać czułość testu ?
• „Poziom istotności” (α) to p-stwo błędu I rodzaju. Poziom istotności powinno się ustalić jeszcze przed przeprowadzeniem eksperymentu.
• β – p-stwo błędu II rodzaju (zależy np. od wielkości pożaru)
Hipoteza zerowa H0
• Prosta i specyficzna • Będziemy ją odrzucali albo nie• Przykłady:
• = 0• = 0 (-0 = 0)• 1 = 2 (1–2 = 0)• 1 - 2 = 0 • p = p0 • Aby kontrolować błąd I rodzaju musimy znać
rozkład statystyki testowej przy H0.
Hipoteza alternatywna HA
• W pewnym sensie przeciwna do H0
• Na ogół bardziej ogólna niż H0 (nieznany rozmiar pożaru)
• „odrzucenie H0" oznacza, że wierzymy w HA
• „nie odrzucenie H0" oznacza, że nie mamy dowodów przemawiających za HA
• Nie jest to to samo co udowodnienie prawdziwości H0 (tego nie potrafimy zrobić).
• Przykłady HA:
0
> 0
< 0
1 2 (1 - 2 0)
1 > 2 (1 - 2 > 0)
1 < 2 (1 - 2 < 0)
• Rozkład statystyki testowej przy HA powinien być inny niż przy H0 (wykrywacz powinien być GŁOŚNO gdy mamy pożar).
Przykład ilustracyjny
• Załóżmy, że mamy próbę z populacji o rozkładzie normalnym. Niech (nieznane) oznacza jego średnią. Chcemy przetestować
• H0: = 5
• Przeciwko alternatywie
• HA: 5
• Możemy skonstruować przedział ufności dla w oparciu o dane. Taki przedział ufności powinien zawierać .
• Zatem jeżeli przedział ufności nie zawiera 5 to odrzucimy H0 na korzyść HA.
• Jeżeli przedział ufności zawiera 5 to oznacza, że nie możemy odrzucić H0. Ponieważ jednak PU zawiera także wiele innych wartości niż 5 nie możemy również stwierdzić, że H0 jest prawdziwa.
• PU na poziomie (1-) jest dany wzorem
y t/2 SE. Sprawdzimy, czy zawiera on 5.
• Tak więc równoważnie wyznaczamy statystykę testową (y – 5)/SE i sprawdzamy czy zawiera się ona w przedziale –t/2 and +t/2
• Jeżeli tak to statystyka jest nieistotna i nie odrzucamy H0.
• Jeżeli nie to statystyka jest istotna i odrzucamy H0. Zbiór (-∞ , –t/2) U (+t/2 , ∞) nazywamy obszarem krytycznym. Jeżeli statystyka testowa znajdzie się w obszarze krytycznym to odrzucamy H0.
• Zauważmy, że postać statystyki testowej zależy od H0 (stąd pochodzi 5).
• Rozkład statystyki testowej przy H0
ma rozkład
• My zastępujemy przez SE .
• (y-)/SE ma rozkład Studenta z n-1 stopniami swobody.
• Tak więc, jeżeli H0 jest prawdziwa to = 5
i (y-5)/SE ma rozkład
n
y
• Zwykle statystykę testową tak wybieramy abyśmy umieli policzyć jej rozkład przy H0.
• Co się stanie jeżeli prawdziwa jest HA ?
• Wtedy ≠ 5 i rozkład statystyki (y-5) będzie skoncentrowany w okolicach
(-5) zamiast w okolicach 0.
Poziom istotności
• Poziom istotności - = P-stwo błędu I rodzaju (odrzucenie H0 gdy jest prawdziwa).
• Załóżmy, że H0 jest prawdziwa. Jakie jest p-stwo, że statystyka testowa znajdzie się w zbiorze krytycznym (-∞ , –t/2) U (+t/2 ,∞).
• α wybieramy przed przystąpieniem do testowania. Typowe wartości α to 0.05, 0.01 lub 0.1. Możemy jednak stosować inne wartości. Wybór α powinien zależeć od konsekwencji błędów I i II rodzaju.
• Wartość krytyczna – wartość leżąca na granicy obszaru krytycznego.
• W naszym przykładzie rozbiliśmy zbiór krytyczny na dwie symetryczne części
(-∞ , –t/2) i (+t/2 ,∞). Postępujemy tak ponieważ HA, ≠ 5 , jest symetryczna (niekierunkowa). Jesteśmy zainteresowani alternatywami dla których < 5 lub > 5.
• Czasami rozważamy alternatywy kierunkowe, takie jak HA: > 5. W tym przypadku obszar krytyczny ma postać