Download - Wykład 7 Przedział ufności dla 1 – 2

Wykład 7Przedział ufności dla 1 – 2

• Skonstruujemy przedział ufności dla 1 – 2

• Przypomnienie: PU dla : y t/2 SEy =

(estymator) (kwantyl)(SE)

• Estymator dla 1 - 2 : y1-y2

• Potrzebujemy t/2 : Ile użyć stopni swobody? (Skomplikowane; wzoru nie trzeba pamiętać, będzie na ściądze.)

• df=

22 21 2

4 41 2

1 21 1

SE SE

SE SE

n n

• Liczba stopni swobody wyliczona z poprzedniego wzoru nie powinna być większa niż n1 + n2 – 2; przy szybkich, zgrubnych obliczeniach często stosujemy df = n1 + n2 –2.

• Nie powinna być mniejsza niż mniejsza z wartości (n1 -1) i (n2 -1).

• Stosujemy ``nieuśredniony’’ SE (o ile w zadaniu nie będzie specjalnie wymagane any użyć (U)SE).

• PU na poziomie ufności (1-) dla 1 - 2

• (y1-y2) t(df)/2 SE(y1-y2)

Przykład (cd)

• Skonstruuj 95% PU dla 1 - 2

y1 –y2 = 75 – 55 = 20

• SE1 = 1.690 ; SE2 = 1.826

• df=

• Oblicz przedział ufności jeszcze raz wykorzystując ``uśredniony’’ SE.

Przykład 2 - 95% PU dla 1 - 2

• Rośliny hodowane w różnych warunkach oświetleniowych.

Ciemno Jasno

n 22 21

y 1.76 2.46

SE 0.5 0.7

• “1” – populacja/próba hodowana przy słabym oświetleniu

• “2” – populacja/próba hodowana przy silnym oświetleniu

• Oblicz 95% PU dla 1 - 2.

Przedziały ufności: Interpretacja

• Nasz PU zawiera wartości zarówno dodatnie jak i ujemne ? Jak to zinterpretować ?

Testowanie hipotez

• Idea• Chcemy odpowiedzieć na pytanie naukowe

dotyczące pewnej (lub pewnych) populacji• Decyzję podejmujemy w oparciu o próbę -

dysponujemy tylko pewnym fragmentem informacji

• W rezultacie możemy popełnić błąd przy podejmowaniu decyzji

• Chcemy zminimalizować p-stwo błędu

• Typowe pytania:

• Pytania o wartości parametrów

• Dla populacji o rozkładzie Bernoulliego. Czy p-stwo sukcesu wynosi ½ (czy moneta jest symetryczna) ?

• Czy p-stwo sukcesu wynosi p0 ? (p0 – pewna konkretna, interesująca nas wartość)

• Dla rozkładu normalnego:Czy średnia w populacji wynosi 0? Czy średnia w populacji wynosi 93? Czy średnia w populacji wynosi 0 ? (0 –

konkretna, interesująca nas wartość).

• Dla dwóch populacji normalnychCzy średnie wartości cechy w obu populacjach

są sobie równe ?Czy różnica między średnimi w obu

populacjach wynosi 0?Czy różnica między średnimi w obu

populacjach wynosi 0 ?

• Na te pytania są dwie możliwe odpowiedzi – tak albo nie (prawda albo fałsz).

• Pytania dotyczą całej populacji, do której na ogół nie mamy dostępu. Nasza decyzja, którą podejmujemy w oparciu o próbę, jest obarczona pewnym błędem.

• Sposób formułowania odpowiedzi• Zamiast prawda mówimy• ``W oparciu o tę próbę nie możemy wykluczyć

postawionej hipotezy’’ .• Przykład: Przeprowadzone badania nie

potwierdzają, że badane populacje mają różny średni poziom badanej cechy. (Nie można wykluczyć, że nie ma różnicy).

• Zamiast Nie mówimy

• Jest to mało prawdopodobne albo bardziej precyzyjnie

• Gdyby postawiona hipoteza była prawdziwa to uzyskany wynik (z próby) byłby bardzo mało prawdopodobny. Dlatego odrzucamy tę hipotezę (ale możemy się mylić).

• Przykład: Przeprowadzone badanie potwierdza tezę, że badane populacje różnią się średnią wartością badanej cechy (odrzucamy hipotezę o równości średnich).

Analogia (K. Simonsen, Purdue): wykrywacz dymu

• Instalujemy wykrywacze dymu aby ostrzegły nas przed pożarem.

• Nie są to idealne wykrywacze pożarów. Reagują na cząstki dymu w powietrzu.

• Mogą być w dwu możliwych stanach – CICHO i GŁOŚNO

• Nasz dom może być w dwu możliwych stanach – SPOKÓJ albo POŻAR

• Możemy podjąć dwie decyzje: zostać albo uciekać

• System ostrzegania może popełnić dwa błędy

• Jest GŁOŚNO choć nie ma ognia (na przykład przypaliliśmy grzankę)

• Jest CICHO choć jest pożar (zła lokalizacja, koniec baterii,…)

• Decyzję uzależniamy od stanu wykrywaczy dymu (CICHO – zostajemy, GŁOŚNO – uciekamy).

• Na ogół nie ma ognia, wykrywacz jest CICHO, więc nie reagujemy (dobra decyzja).

• Czasami nie ma ognia a wykrywacz jest GŁOŚNO, więc uciekamy (zła decyzja – strata czasu) – błąd I rodzaju.

• Czasami jest pożar a wykrywacz jest CICHO więc zostajemy (zła decyzja – niebezpieczeństwo) – błąd II rodzaju.

• Czasami jest pożar i wykrywacz jest GŁOŚNO więc uciekamy (dobra decyzja).

Notacja:• Hipotezy

• Stan wyjściowy, ``SPOKÓJ’’, określamy nazwą hipotezy zerowej

• Drugi możliwy stan, ``POŻAR’’, określamy nazwą hipotezy alternatywnej

• H0 to skrót dla hipotezy zerowej

• HA to skrót dla hipotezy alternatywnej

• Decyzje

• Decyzje zawsze wyrażamy w stosunku do hipotezy zerowej H0:

• Decyzja ``uciekamy’’ odpowiada odrzuceniu H0, tzn. odrzucamy stanowisko, że nie ma pożaru.

• Decyzja ``zostajemy’’ odpowiada nie odrzuceniu H0.

• Decyzję podejmujemy w oparciu o zachowanie wykrywacza dymu, który dalej będziemy nazywać statystyką testową.

• Gdy wykrywacz jest GŁOŚNO to mówimy, że wynik testu jest ``istotny’’. Istotny wynik powoduje odrzucenie H0.

• Gdy wykrywacz jest CICHO to wynik testu jest ``nieistotny’’ i nie odrzucamy H0.

Podsumowanie analogii• Hipotezy: SPOKÓJ = H0 ; POŻAR = HA ;• Statystyka testowa: • CICHO = nieistotna; • GŁOŚNO = istotna;• Decyzja: zostajemy = nie odrzucamy H0; • uciekamy = odrzucamy H0

• Błąd I rodzaju: (uciekamy choć nie ma pożaru) = (odrzucamy H0 choć jest prawdziwa)

• Błąd II rodzaju: (zostajemy choć jest pożar) = (nie odrzucamy H0 choć prawdziwa jest HA)

• Zauważmy, że H0 jest bardziej precyzyjna niż HA: gdy HA jest prawdziwa to pożar może być dowolnej wielkości

• Wykrywacze dymu mają pewną ustaloną czułość – reagują na określoną ilość dymu w powietrzu.

• Jeżeli wykrywacz jest zbyt czuły to będzie często powodował fałszywe alarmy (błędy I rodzaju).

• Jeżeli nie jest dość czuły to nie będzie się włączał kiedy potrzeba – błędy II rodzaju.

• Zwiększając czułość zmniejszamy p-stwo błędu II rodzaju ale zwiększamy p-stwo błędu I rodzaju. Dobór czułości testu powinien zależeć od konsekwencji błędów.

• Jak opisać czułość testu ?

• „Poziom istotności” (α) to p-stwo błędu I rodzaju. Poziom istotności powinno się ustalić jeszcze przed przeprowadzeniem eksperymentu.

• β – p-stwo błędu II rodzaju (zależy np. od wielkości pożaru)

Hipoteza zerowa H0

• Prosta i specyficzna • Będziemy ją odrzucali albo nie• Przykłady:

• = 0• = 0 (-0 = 0)• 1 = 2 (1–2 = 0)• 1 - 2 = 0 • p = p0 • Aby kontrolować błąd I rodzaju musimy znać

rozkład statystyki testowej przy H0.

Hipoteza alternatywna HA

• W pewnym sensie przeciwna do H0

• Na ogół bardziej ogólna niż H0 (nieznany rozmiar pożaru)

• „odrzucenie H0" oznacza, że wierzymy w HA

• „nie odrzucenie H0" oznacza, że nie mamy dowodów przemawiających za HA

• Nie jest to to samo co udowodnienie prawdziwości H0 (tego nie potrafimy zrobić).

• Przykłady HA:

0

> 0

< 0

1 2 (1 - 2 0)

1 > 2 (1 - 2 > 0)

1 < 2 (1 - 2 < 0)

• Rozkład statystyki testowej przy HA powinien być inny niż przy H0 (wykrywacz powinien być GŁOŚNO gdy mamy pożar).

Przykład ilustracyjny

• Załóżmy, że mamy próbę z populacji o rozkładzie normalnym. Niech (nieznane) oznacza jego średnią. Chcemy przetestować

• H0: = 5

• Przeciwko alternatywie

• HA: 5

• Możemy skonstruować przedział ufności dla w oparciu o dane. Taki przedział ufności powinien zawierać .

• Zatem jeżeli przedział ufności nie zawiera 5 to odrzucimy H0 na korzyść HA.

• Jeżeli przedział ufności zawiera 5 to oznacza, że nie możemy odrzucić H0. Ponieważ jednak PU zawiera także wiele innych wartości niż 5 nie możemy również stwierdzić, że H0 jest prawdziwa.

• PU na poziomie (1-) jest dany wzorem

y t/2 SE. Sprawdzimy, czy zawiera on 5.

• Tak więc równoważnie wyznaczamy statystykę testową (y – 5)/SE i sprawdzamy czy zawiera się ona w przedziale –t/2 and +t/2

• Jeżeli tak to statystyka jest nieistotna i nie odrzucamy H0.

• Jeżeli nie to statystyka jest istotna i odrzucamy H0. Zbiór (-∞ , –t/2) U (+t/2 , ∞) nazywamy obszarem krytycznym. Jeżeli statystyka testowa znajdzie się w obszarze krytycznym to odrzucamy H0.

• Zauważmy, że postać statystyki testowej zależy od H0 (stąd pochodzi 5).

• Rozkład statystyki testowej przy H0

ma rozkład

• My zastępujemy przez SE .

• (y-)/SE ma rozkład Studenta z n-1 stopniami swobody.

• Tak więc, jeżeli H0 jest prawdziwa to = 5

i (y-5)/SE ma rozkład

n

y

• Zwykle statystykę testową tak wybieramy abyśmy umieli policzyć jej rozkład przy H0.

• Co się stanie jeżeli prawdziwa jest HA ?

• Wtedy ≠ 5 i rozkład statystyki (y-5) będzie skoncentrowany w okolicach

(-5) zamiast w okolicach 0.

Poziom istotności

• Poziom istotności - = P-stwo błędu I rodzaju (odrzucenie H0 gdy jest prawdziwa).

• Załóżmy, że H0 jest prawdziwa. Jakie jest p-stwo, że statystyka testowa znajdzie się w zbiorze krytycznym (-∞ , –t/2) U (+t/2 ,∞).

• α wybieramy przed przystąpieniem do testowania. Typowe wartości α to 0.05, 0.01 lub 0.1. Możemy jednak stosować inne wartości. Wybór α powinien zależeć od konsekwencji błędów I i II rodzaju.

• Wartość krytyczna – wartość leżąca na granicy obszaru krytycznego.

• W naszym przykładzie rozbiliśmy zbiór krytyczny na dwie symetryczne części

(-∞ , –t/2) i (+t/2 ,∞). Postępujemy tak ponieważ HA, ≠ 5 , jest symetryczna (niekierunkowa). Jesteśmy zainteresowani alternatywami dla których < 5 lub > 5.

• Czasami rozważamy alternatywy kierunkowe, takie jak HA: > 5. W tym przypadku obszar krytyczny ma postać

Download - Wykład 7 Przedział ufności dla 1 – 2

Top Related