statystyka i do Świadczalnictwoserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfstatystyka testow ą...

17
STATYSTYKA I DOŚWIADCZALNICTWO Wyklad 3

Upload: others

Post on 13-Jul-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

STATYSTYKA I DOŚWIADCZALNICTWO Wykład 3

Page 2: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

Estymacja przedziałowa – przedziały ufności

Przedział ufności jest przedziałem liczbowym zawierającym z

określonym prawdopodobieństwem (zazwyczaj bliskim 1) nieznaną

wartość szacowanego parametru np. średnią dla populacji

1–α współczynnik ufności (lub poziom ufności) – prawdopodobieństwo

tego, że przedział ufności pokrywa nieznaną wartość szacowanego

parametru

Im wyższa jest wartość współczynnika ufności, tym większa jest długość przedziału.

Wartość α nazywamy poziomem istotności

Page 3: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

Przedział ufności dla średniej w populacji o rozkładzie normalnym

α−=+<<−−α−α

1}tXmtX{Pn

S1n,n

S1n,

)tX;tX(n

S1n,n

S1n, −α−α

+−

1, −ntα - wartość odczytana z tablic rozkładu Studenta dla poziomu

istotności α oraz n–1 stopni swobody

Page 4: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

Przybliżony przedział ufności dla frakcji (parametru p) w rozkładzie

dwupunktowym (zero-jedynkowym)

u1-α/2 – kwantyl rzędu 1-α/2; wartość z tablicy dystrybuanty rozkładu X~N(0,1)

dla α=0,05 u1-α/2 =1,96

Page 5: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

Weryfikacja (testowanie) hipotez statystycznych

sprawdzenie określonych przypuszczeń (założeń) wysuniętych w stosunku do parametrów lub rozkładu populacji generalnej na podstawie próby.

Hipotezy możemy podzielić na

– dotyczące typu rozkładu populacji

– dotyczące parametrów rozkładu (który jest znany)

Page 6: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

Test statystyczny – reguła postępowania, która pozwala na przyjęcie (nieodrzucenie) bądź odrzucenie sprawdzanej hipotezy

Procedura testowania hipotez polega na tym, że zakładamy pewną

hipotezę zerową (H0), którą uznajemy za możliwą. Następnie

sprawdzamy, czy ona może być prawdziwa przy pomocy testu

statystycznego. Jeśli podczas weryfikacji hipotezy odrzucimy hipotezę

zerową to przyjmujemy przeciwną do niej hipotezę alternatywną (H1).

Możliwe do popełnienia błędy przy testowaniu hipotez:

Błąd I rodzaju– błąd odrzucenia, występuje, gdy odrzucamy hipotezę,

natomiast jest ona prawdziwa

Błąd II rodzaju – błąd przyjęcia, występuje gdy przyjmujemy hipotezę,

natomiast jest ona fałszywa

Prawdopodobieństwo popełnienia błędu I rodzaju nazywamy

poziomem istotności (α) (przyjmujemy najczęściej α=0,05)

Page 7: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

Test t do porównania średniej z normą (rozkład normalny)

Hipoteza zerowa H0: m = m0 Hipoteza alternatywna H1: m ≠ m0

(uwaga: zamiast symbolu m oznaczającego średnią dla populacji używamy również zamiennie symbolu µ)

założenie:

zmienna ma rozkład normalny

Przykłady zastosowań:

Sprawdzenie, czy urządzenie pakujące pewien produkt w opakowania po 1 kg

średnio pakuje dokładnie 1 kg

(badana zmienna: waga netto produktu)

Page 8: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

Funkcja testowa:

x

0emp

S

mxt

−=

Sx – błąd standardowy

x Średnia dla próby

m0 - zakładana wartość („norma”)

n

sSx =

Page 9: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

Wartość temp. porównujemy z wartością tkryt. i na tej podstawie stwierdzamy,

czy średnia może być równa „normie” (zakładanej wartości), czy też nie.

Wartość krytyczna tα,ν, dla rozkładu t-studenta, gdzie α jest przyjętym

poziomem istotności (najczęściej 0,05), a ν liczbą stopni swobody, czyli

liczebność próby pomniejszona o 1 (n - 1)

Jeżeli |temp|> tα,ν to hipotezę H0 odrzucamy i przyjmujemy hipotezę

alternatywną H1: m ≠ m0 a więc stwierdzamy że średnia różni się istotnie od

„normy” (zakładanej wartości)

W programach statystycznych zamiast wartości krytycznej podawana jest wartość p (p-value). Decyzję o tym, czy hipotezę zerową odrzucamy, czy też nie podejmujemy na podstawie wartości p. Jeżeli p<α to hipotezę zerową odrzucamy i przyjmujemy hipotezę alternatywną, a jeśli p>α to hipotezy zerowej nie odrzucamy. Przyjęło się, że wartość α ustalamy równą 0,05.

Page 10: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

Test t do porównania średnich dwóch populacji (niezależnych)

Hipoteza zerowa H0: m1= m2 Hipoteza alternatywna H1: m1 ≠ m2

założenia:

zmienne mają rozkład normalny

wariancje dla porównywanych populacji są sobie równe: σ12= σ2

2

(jeśli to założenie nie jest spełnione stosujemy zmodyfikowaną wersję testu t uwzględniającą nierówność wariancji)

Przykłady zastosowań:

Porównanie wysokości plonów dwóch odmian roślin uprawnych

(badana zmienna: plon)

Porównanie skuteczności dwóch leków obniżających ciśnienie krwi

(zmienna: ciśnienie krwi)

Page 11: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

Funkcja testowa:

r

21emp

S

xxt

−=

Sr – błąd różnicy średnich

1x

2x

Średnia dla pierwszej populacji na podstawie próby

Średnia dla drugiej populacji na podstawie próby

+=

21

2 11

nnSS er

gdzie wspólna wariancja:

)1n()1n(

XvarXvarS

21

212e

−+−

+=

∑=

−=

n

i

i )xx(Xvar1

2jest sumą kwadratów odchyleń od średniej

Page 12: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

Wartość temp. porównujemy z wartością tkryt. i na tej podstawie stwierdzamy,

czy średnie mogą być równie, czy też nie.

Wartość krytyczna tα,ν, dla rozkładu t-studenta, gdzie α jest przyjętym

poziomem istotności (najczęściej 0,05), a ν liczbą stopni swobody, czyli

liczebność 2 prób pomniejszona o 2 (n1 +n2 -2)

Jeżeli |temp|> tα,ν to hipotezę H0 odrzucamy i przyjmujemy hipotezę

alternatywną H1: m1 ≠ m2 a więc stwierdzamy że średnie różnią się istotnie

W programach statystycznych zamiast wartości krytycznej podawana jest wartość p (p-value). Decyzję o tym, czy hipotezę zerową odrzucamy, czy też nie podejmujemy na podstawie wartości p. Jeżeli p<α to hipotezę zerową odrzucamy i przyjmujemy hipotezę alternatywną, a jeśli p>α to hipotezy zerowej nie odrzucamy. Przyjęło się, że wartość α ustalamy równą 0,05.

Page 13: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

test F - porównanie wariancji 2 populacji pod względem zmienności (wartości wariancji)

Hipoteza zerowa H0: σ12= σ2

2 Hipoteza alternatywna H1: σ12 ≠ σ2

2

Założenie: zmienne mają rozkład normalny

Funkcja testowa 22

21

emps

sF =

Wartość krytyczna Fα,ν,u dla rozkładu F-Fishera, gdzie α jest przyjętym

poziomem istotności (najczęściej 0,05), a ν i u liczbami stopni

swobody, czyli liczebnością próby pierwszej (n1-1) i drugiej (n2 -1)

Gdzie wartość s12>s2

2

Page 14: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

Test t do porównania dwóch frakcji (parametrów p) w rozkładzie dwupunktowym (zerojedynkowym)

Hipoteza zerowa H0: p1= p2 Hipoteza alternatywna H1: p1 ≠ p2

Przykłady zastosowań:

Porównanie dwóch odmian pod względem udziału roślin porażonych przez pewną

chorobę

Porównanie udziału osób kupujących pewien produkt w dwóch regionach

Page 15: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

Funkcja testowa:

n

)p1(p

n

m

n

m

u 2

2

1

1

emp−

=

21

21

21

21 ,nn

nnn

nn

mmp

+

⋅=

+

+=

Gdzie:

n1 i n2 – liczebność elementów w populacji

pierwszej i drugiej poddanych ocenie

m1 i m2 – liczebność elementów w populacji

pierwszej i drugiej spełniających określone

kryteria

Page 16: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

Wartość uemp. porównujemy z wartością ukryt. i na tej podstawie

stwierdzamy, czy średnie mogą być równie, czy też nie.

Wartość krytyczna u1-α/2, dla rozkładu normalnego standardowego, gdzie α

jest przyjętym poziomem istotności (najczęściej 0,05)

Jeżeli |uemp|> ukryt. to hipotezę H0 odrzucamy i przyjmujemy hipotezę

alternatywną H1: p1 ≠ p2 a więc stwierdzamy że parametry p (frakcje) różnią

się statystycznie istotnie

W programach statystycznych zamiast wartości krytycznej podawana jest wartość p (p-value). Decyzję o tym, czy hipotezę zerową odrzucamy, czy też nie podejmujemy na podstawie wartości p. Jeżeli p<α to hipotezę zerową odrzucamy i przyjmujemy hipotezę alternatywną, a jeśli p>α to hipotezy zerowej nie odrzucamy. Przyjęło się, że wartość α ustalamy równą 0,05.

u1-α/2 dla α=0,05 u1-α/2 =1,96

Page 17: STATYSTYKA I DO ŚWIADCZALNICTWOserwis.netstrefa.pl/ogrodnictwo/dzienne/3.pdfStatystyka testow ą jest warto ść U. Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w

test U Manna-Whitneya - porównanie średnich 2 populacji o dowolnychrozkładach

Test U Manna-Whitneya (nazywany również testem rang Wilcoxona) służy

do porównania zgodności dwóch rozkładów. Wykorzystywany jest natomiast

najczęściej do porównania median. Jeśli rozkłady są symetryczne i ich

wariancje są równe lub bliskie to uzasadnione jest stosowanie tego testu

jako alternatywy dla testu t przy braku założenia normalności rozkładów.

Dlatego też ten test stosuje się często do porównania średnich dla dwóch

populacji o innych rozkładach niż normalne. Statystyka testową jest wartość U.

Hipoteza zerowa jest taka sama jak w przypadku testu t, czyli w hipotezie

zerowej przyjmujemy, że średnie nie różnią się. Jeśli ją odrzucimy to

przyjmujemy hipotezę alternatywną, czyli stwierdzamy, że występuje różnica

między średnimi.

Przykład zastosowania:

Porównanie wyników z odpowiedzi z ankiety między kobietami a

mężczyznami

Zmienna: odpowiedź w skali od 1-5