8. metoda uzoraka · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili...
TRANSCRIPT
Josipa Perkov, prof., pred.
8. METODA UZORAKA8. METODA UZORAKA8. METODA UZORAKA8. METODA UZORAKA
Josipa Perkov, prof., pred.
� Prikupljanje podataka o obilježjima svih jedinica statističkog skupa
često je preskupo ili zahtijeva previše vremena, a katkad nije ni
moguće, kao na primjer za beskonačne skupove – u takvim
slučajevima vrši se reprezentativno promatranje kojim se obuhvaća
samo dio jedinica statističkog skupa
� Pojava koja se želi upoznati ili istražiti tom metodom zove se
populacija ili osnovni skup, a njezin dio koji se u tu svrhu ispituje
zove se uzorak
� Uzorak je reprezentativan ako po svojim osnovnim karakteristikama
nalikuje na populaciju (umanjena slika osnovnog skupa)
Josipa Perkov, prof., pred.
� Nužno je sastaviti jasan i precizan plan odabira elemenata u uzorak
� Plan sadrži:
� ciljeve istraživanja,
� određivanje statističkog skupa - utvrditi što je jedinica skupa, opseg
skupa, definirati skup pojmovno, prostorno i vremenski
� određivanje okvira izbora:
� popis jedinica osnovnog skupa iz kojeg se izabire uzorak, npr.
registri poslovnih subjekata,
� popis jedinica izbora uzoraka koje obuhvaćaju više elemenata
osnovnog skupa, npr., istražujemo li pomoću uzorka stavove
punoljetnog pučanstva, jedinica izbora može biti osoba, ali i
kućanstvo ili stambena zgrada
Josipa Perkov, prof., pred.
� podatke koje treba prikupiti,
� model uzorka (nacrt, dizajn):
� troškovi,
� osobitosti osnovnih skupova,
� način izbora elemenata u uzorak za svaki izbor,
� utvrđuju se izrazi za statističko-analitičke veličine iz uzorka,
među kojima su i izrazi za veličine pogrešaka zbog primjene
uzorka
� raspoloživa sredstva,
� postupke prikupljanja podataka
Josipa Perkov, prof., pred.
� Uzorkom se dolazi do procjene karakteristika osnovnog skupa, a
statističkom metodom određuje se pouzdanost i preciznost te procjene
– svi ti postupci čine metodu koja se zove metoda uzoraka
� Metodu uzoraka koristimo za:
(1) procjenu karakteristika populacije,
(2) donošenje odluke da li da se prihvati ili odbaci određena
pretpostavka (hipoteza) koja se odnosi na neku karakteristiku
populacije
Josipa Perkov, prof., pred.
� S obzirom na način izbora jedinica, razlikuje se:
NAMJERNI UZORAK – potrebno je dobro poznavati populaciju
kako bi se za uzorak mogli izabrati oni elementi koji će osigurati
takvu strukturu uzorka s obzirom na sva relevantna obilježja kakvu
ima i populacija
� izabiru se jedinice prema odluci istraživača (anketara)
� ispituju se dostupni članovi skupa
� izabiru se jedinice u sklopu kvota – kvota uzorak
� prigodan izbor uzorka
Ne može se brojčano izraziti veličina pogreške, pa se primjenjuju metode deskriptivne statistike
Josipa Perkov, prof., pred.
SLUČAJNI UZORAK
� svaki član skupa ima vjerojatnost izbora u uzorak veću od nule
� podaci se analiziraju prema načelima inferencijalne statistike
(procjenjuju se nepoznati parametri i testiraju hipoteze o njima i
oblicima rasporeda osnovnih skupova)
� mogu se izračunati pogreške nastale primjenom uzorka – važno za
prosudbu kakvoće zaključivanja
� Izbor se vrši pomoću tablice slučajnih brojeva ili sistematskim
izborom
Josipa Perkov, prof., pred.
METODA UZORAKA
PROCJENA
PARAMETARA
POPULACIJE
POMOĆU UZORKA
TESTIRANJE HIPOTEZA
O NEKIM
KARAKTERISTIKAMA
•projektiranje veličine uzorka
•interval procjene AS populacije
•interval procjene totala populacije
•interval procjene proporcije populacije
•testiranje hipoteze o nepoznatoj AS
•ispitivanje jednakosti AS dvaju populacija
•testiranje hipoteza o nepoznatoj proporciji
•testiranje hipoteze o jednakosti dvaju ili
više populacija s pomoću χ2 - testa
Josipa Perkov, prof., pred.
PROCJENA ARITMETIČKE SREDINE
OSNOVNOG SKUPA
� Aritmetička sredina populacije µ je parametar koji se procjenjuje:
� Brojem:
npr. zanimaju li nas prosječna primanja stanovnika nekog područja, možemo izabrati uzorak od n stanovnika tog područja, izračunati AS uzorka i zaključiti da su ona istovjetna prosječnim primanjima stanovnika cijelog područja
� Intervalom:
formiramo interval određene širine, ovisno o željenoj pouzdanosti(ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. veća je vjerojatnost da će se u njemu naći AS populacije
Josipa Perkov, prof., pred.
� Interval procjene AS populacije gradimo tako da AS uzorka s jedne
strane dodamo, a s druge strane oduzmemo stanoviti broj
zi standardnih pogrešaka procjene – broj ovisi o željenoj pouzdanosti
intervalne procjene
� Broj zi se naziva koeficijent pouzdanosti procjene (koeficijent
povjerenja)
� Najčešće se formiraju intervali procjene s 95%-tnom pouzdanosti, a u
tom slučaju koeficijent povjerenja iznosi 1.96 (očitava se iz tablice
površine ispod normalne krivulje: 0.95 : 2 = 0.4750)
Josipa Perkov, prof., pred.
� Interval procjene AS glasi:
Središnja točka intervala je AS uzorka x oko koje se gradi
interval, sa željom da se u njemu nađe AS populacije µ
P = pouzdanost
γ (gama) = vjerojatnost pogreške u procjeni AS populacije
(1 − γ) = pouzdanost intervalne procjene
{ }2 2
1x x
P x z x zγ γ− σ ≤ µ ≤ + σ = − γ
Josipa Perkov, prof., pred.
Osim koeficijenta povjerenja, mora se izračunati i standardna
pogreška AS. U izrazima za njezino računanje koriste se sljedeći
simboli:
= standardna pogreška procjene AS populacije
σ = standardna devijacija populacije (ako je otprilike poznata)
s = standardna devijacija uzorka
= standardna devijacija populacije procijenjena pomoću uzorka
N = opseg populacije
n = opseg uzorka
f = frakcija izbora - odnos veličine uzorka i veličine
populacije, tj. f = n / N. Recipročna vrijednost frakcije izbora
N / n zove se korak izbora
xσ
σ̂
Josipa Perkov, prof., pred.
Izraz za standardnu pogrešku
aritmetičke sredine populacije Uvjeti za primjenu izraza
xn
σσ = σ poznata i f < 0.05
1x
N n
Nn
σ −σ =
− σ poznata i f ≥ 0.05
ˆx
n
σσ = σ nije poznata i f < 0.05
ˆ
1x
N n
Nn
σ −σ =
− σ nije poznata i f ≥ 0.05
1x
s
nσ =
− σ nije poznata i f < 0.05
11x
s N n
Nn
−σ =
−− σ nije poznata i f ≥ 0.05
Josipa Perkov, prof., pred.
� za uzorke veće od 30 jedinica koeficijent pouzdanosti z uzimamo iz
tablice površina ispod normalne razdiobe:
z = 1.96 (uz 95% pouzdanosti procjene)
z = 2.58 (uz 99% pouzdanosti procjene)
� za uzorke manje od 30 jedinica koeficijent pouzdanosti z ne možemo
uzeti iz tablice površina ispod normalne razdiobe već ga uzimamo iz
Studentove tablice za k = n − 1 stupnjeva slobode, uz željenu
vjerojatnost procjene (najčešće 0.95 ili 0.99)
Josipa Perkov, prof., pred.
� studentova distribucija tabelirana je tako da se iz tablice očitava koeficijent t za određenu proporciju jedinica koje se odbacuju s njezina desnog kraja
� u predkoloni tablice su navedeni stupnjevi slobode, a u zaglavlju su koeficijenti t za proporcije jedinica 0.10, 0.05, 0.025, 0.01 i 0.005 smještenih na desnom kraju distribucije
� želimo li npr. napraviti intervalnu procjenu AS populacije s 95%
pouzdanosti, moramo formirati interval takve širine da se u njemu nađe
proporcija od 0.95 jedinica Studentove distribucije. U tom je slučaju
proporcija preostalih jedinica smještenih na krajevima distribucije
1 − 0.95 = 0.05. Na desnom kraju distribucije se tada nalazi proporcija
jedinica 0.05 : 2 = 0.025 pa ćemo traženi koeficijent pouzdanosti naći u
stupcu t.025 i u retku koji odgovara broju stupnjeva slobode u
konkretnom slučaju (veličini uzorka umanjenoj za jedan)
Josipa Perkov, prof., pred.
� želimo li npr. intervalnu procjenu s 95%-tnim povjerenjem, a uzorak
je veličine 20, traženi se koeficijent pouzdanosti (povjerenja) nalazi u
tabeli Kritične vrijednosti t, Studentove distribucije na presjeku 19.
retka i stupca t.025 i iznosi 2.093
Josipa Perkov, prof., pred.
PRIMJER 1. Na otoku koji ima 1620 domaćinstava slučajno smo
izabrali 100 domaćinstava i zabilježili za svako od njih koliko hektara
obradive zemlje posjeduje. Izračunali smo aritmetičku sredinu tog
uzorka koja je iznosila 1.83 ha. Pomoću standardne devijacije tog
uzorka procijenili smo standardnu devijaciju populacije i dobili 1.36
ha. Izračunajte s 99% pouzdanosti kolika je prosječna površina
obradive zemlje svih domaćinstava na tom otoku.
N = 1620, n = 100, x = 1.83, = 1.36,
99% pouzdanosti ⇒ z = 2.58
σ̂
1000.06
1620
n
N= = > 0.05
Josipa Perkov, prof., pred.
Traženi je interval procjene:
ˆ 1.36 1620 1000.13
1 1620 1100x
N n
Nn
σ − −σ = ⋅ = ⋅ =
− −
{ }2 2
1x x
P x z x zγ γ− σ ≤ µ ≤ + σ = − γ
{ }1.83 2.58 0.13 1.83 2.58 0.13 0.99P − ⋅ ≤ µ ≤ + ⋅ =
{ }1.49 2.17 0.99P ≤ µ ≤ =
Prosječna površina obradive zemlje na promatranom otoku nalazi
se između 1.49 ha i 2.17 ha uz 99% pouzdanosti
Josipa Perkov, prof., pred.
PRIMJER 2. Od 186 elemenata jednog osnovnog skupa slučajno smo
izabrali 20 jedinica. Aritmetička sredina tog uzorka iznosi 2.5, a
standardna devijacija je 1.204. Uz 95% pouzdanosti procijenite
aritmetičku sredinu promatrane populacije.
N = 186, n = 20, x = 2.5, s = 1.204
95% pouzdanosti ⇒ t = 2.093
200.11
186
n
N= = > 0.05
Josipa Perkov, prof., pred.
Traženi je interval procjene:
AS promatrane populacije nalazi se između 1.96 i 3.04 uz 95%
pouzdanosti
1.204 186 200.26
1 186 11 20 1x
s N n
Nn
− −σ = ⋅ = ⋅ =
− −− −
{ }2 2
1x x
P x t x tγ γ
− σ ≤ µ ≤ + σ = − γ
{ }2.5 2.093 0.26 2.5 2.093 0.26 0.95P − ⋅ ≤ µ ≤ + ⋅ =
{ }1.96 3.04 0.95P ≤ µ ≤ =
Josipa Perkov, prof., pred.
PROCJENA TOTALA
OSNOVNOG SKUPA
� Total T je zbroj vrijednosti numeričke varijable konačnog osnovnog
skupa. Ako konačni osnovni skup ima N elemenata, tada je AS
populacije:
odatle slijedi da se u procjeni totala populacije može pogriješiti N
puta onoliko koliko se griješi u procjeni njezine AS
1
N
i
i
xT
N N
=µ = =∑
T N= ⋅µ⇒
Josipa Perkov, prof., pred.
� kao procjena totala populacije brojem (simbol ) služi nam AS
uzorka pomnožena opsegom populacije, tj.
� za intervalnu procjenu totala potrebna je i standardna pogreška totala
(simbol )
T̂
T̂ N x= ⋅
T̂σ
ˆ xTNσ = ⋅σ
Josipa Perkov, prof., pred.
� interval procjene totala osnovnog skupa glasi:
ili, za mali uzorak (n < 30):
{ }ˆ ˆ2 2
ˆ ˆ 1T T
P T z T T zγ γ− σ ≤ ≤ + σ = − γ
{ }ˆ ˆ2 2
ˆ ˆ 1T T
P T t T T tγ γ− σ ≤ ≤ + σ = − γ
Josipa Perkov, prof., pred.
PRIMJER 3. U svrhu ispitivanja vremena potrebnog za dolazak na
rad, od 915 djelatnika jedne tvrtke anketirano je 150 osoba. Pomoću
tog uzorka dobiveni su ovi rezultati: prosječno vrijeme je 47 minuta, a
standardna pogreška AS uzorka 0.0747. Izračunajte 99% pouzdan
interval procjene totala osnovnog skupa, tj. ukupno vrijeme potrebno za
dolazak na rad svih djelatnika promatrane tvrtke.
N = 915, n = 150, x = 47, = 0.0747
99% pouzdanosti ⇒ z = 2.58
xσ
ˆ 915 47 43005T N x= ⋅ = ⋅ =
Josipa Perkov, prof., pred.
Interval procjene:
ˆ 915 0.0747 68.35xT
Nσ = ⋅σ = ⋅ =
{ }ˆ ˆ2 2
ˆ ˆ 1T T
P T z T T zγ γ− σ ≤ ≤ + σ = − γ
{ }43005 2.58 68.35 43005 2.58 68.35 0.99P T− ⋅ ≤ ≤ + ⋅ =
{ }42829 43181 0.99P T≤ ≤ =
Ukupno vrijeme potrebno za dolazak na rad svih djelatnika
promatrane tvrtke nalazi se između 42829 minuta i 43181 minuta uz
99% pouzdanosti
Josipa Perkov, prof., pred.
� Proporcija konačnog osnovnog skupa je parametar koji označava
omjer članova skupa s određenim oblikom obilježja M i opsega skupa
N, tj.
� proporciju preostalih N − M jedinica koje nemaju traženo obilježje
označavamo sa q:
PROCJENA PROPORCIJE
OSNOVNOG SKUPA
Mp
N=
N Mq
N
−=
Vrijedi: p + q = 1
Josipa Perkov, prof., pred.
� procjenitelj proporcije osnovnog skupa brojem je proporcija uzorka:
, gdje je m broj članova uzorka s određenim oblikom
obilježja, a n veličina uzorka
� Standardna pogreška računa se pomoću izraza:
ˆm
pn
=
ˆn m
qn
−=
ˆ
ˆ ˆ
1p
p q
n
⋅σ =
−ako je f < 0.05
ˆ
ˆ ˆ
1 1p
p q N n
n N
⋅ −σ = ⋅
− −ako je f ≥ 0.05
Josipa Perkov, prof., pred.
� interval procjene proporcije za velike uzorke:
� za male uzorke procjenjivanje na ovakav način nije moguće
� kao kriterij za dovoljnu veličinu uzorka može se primijeniti pravilo:
{ }ˆ ˆ2 2
ˆ ˆ 1p pP p z p p zγ γ− σ ≤ ≤ + σ = − γ
ˆ ˆn p q⋅ ⋅ > 9
Josipa Perkov, prof., pred.
PRIMJER 4. Građevinski poduzetnik treba preuzeti pošiljku od 5000
keramičkih pločica. Između 200 pločica, izabranih na slučajan način iz
pošiljke, nađeno je 40 pločica druge klase. Uz pouzdanost od 90%
procijenite proporciju pločica druge klase u cijeloj pošiljci.
Kako je tražena pouzdanost 90% , iz tablice za površinu ispod normalne
krivulje treba očitati koeficijent pouzdanosti z za površinu koja iznosi
polovinu pouzdanosti, tj. za 0.90 : 2 = 0.45. Među površinama
navedenim u tablicama nema površine koja iznosi točno 0.45, pa ćemo
potražiti onu koja je najbliža tom broju. U ovom su slučaju to dvije
površine: 0.4495 i 0.45053, pa se možemo odlučiti ili za z = 1.64 ili
z = 1.65
40ˆ 0.2
200p = =
Josipa Perkov, prof., pred.
� Konstruirat ćemo interval pouzdanosti s koeficijentom z = 1.64
� interval pouzdanosti:
2000.04
5000
nf
N= = = < 0.05
ˆ
ˆ ˆ 0.2 0.80.028
1 200 1p
p q
n
⋅ ⋅σ = = =
− −
{ }ˆ ˆ2 2
ˆ ˆ 1p pP p z p p zγ γ− σ ≤ ≤ + σ = − γ
{ }0.2 1.64 0.028 0.2 1.64 0.028 0.90P p− ⋅ ≤ ≤ + ⋅ =
{ }0.172 0.228 0.90P p≤ ≤ =
Uz pouzdanost 90% procjenjujemo da se udio pločica druge klase u
cijeloj pošiljci kreće između 17.2 i 22.8%
Josipa Perkov, prof., pred.
PITANJA ZA USMENI DIO ISPITA:
1. Metoda uzorka
2. Odabir uzorka
3. Plan odabira elemenata u uzorak
4. Procjena karakteristika populacije pomoću
uzorka