8. metoda uzoraka · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili...

31
Josipa Perkov, prof., pred. 8. METODA UZORAKA 8. METODA UZORAKA 8. METODA UZORAKA 8. METODA UZORAKA

Upload: others

Post on 04-Nov-2019

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

8. METODA UZORAKA8. METODA UZORAKA8. METODA UZORAKA8. METODA UZORAKA

Page 2: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� Prikupljanje podataka o obilježjima svih jedinica statističkog skupa

često je preskupo ili zahtijeva previše vremena, a katkad nije ni

moguće, kao na primjer za beskonačne skupove – u takvim

slučajevima vrši se reprezentativno promatranje kojim se obuhvaća

samo dio jedinica statističkog skupa

� Pojava koja se želi upoznati ili istražiti tom metodom zove se

populacija ili osnovni skup, a njezin dio koji se u tu svrhu ispituje

zove se uzorak

� Uzorak je reprezentativan ako po svojim osnovnim karakteristikama

nalikuje na populaciju (umanjena slika osnovnog skupa)

Page 3: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� Nužno je sastaviti jasan i precizan plan odabira elemenata u uzorak

� Plan sadrži:

� ciljeve istraživanja,

� određivanje statističkog skupa - utvrditi što je jedinica skupa, opseg

skupa, definirati skup pojmovno, prostorno i vremenski

� određivanje okvira izbora:

� popis jedinica osnovnog skupa iz kojeg se izabire uzorak, npr.

registri poslovnih subjekata,

� popis jedinica izbora uzoraka koje obuhvaćaju više elemenata

osnovnog skupa, npr., istražujemo li pomoću uzorka stavove

punoljetnog pučanstva, jedinica izbora može biti osoba, ali i

kućanstvo ili stambena zgrada

Page 4: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� podatke koje treba prikupiti,

� model uzorka (nacrt, dizajn):

� troškovi,

� osobitosti osnovnih skupova,

� način izbora elemenata u uzorak za svaki izbor,

� utvrđuju se izrazi za statističko-analitičke veličine iz uzorka,

među kojima su i izrazi za veličine pogrešaka zbog primjene

uzorka

� raspoloživa sredstva,

� postupke prikupljanja podataka

Page 5: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� Uzorkom se dolazi do procjene karakteristika osnovnog skupa, a

statističkom metodom određuje se pouzdanost i preciznost te procjene

– svi ti postupci čine metodu koja se zove metoda uzoraka

� Metodu uzoraka koristimo za:

(1) procjenu karakteristika populacije,

(2) donošenje odluke da li da se prihvati ili odbaci određena

pretpostavka (hipoteza) koja se odnosi na neku karakteristiku

populacije

Page 6: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� S obzirom na način izbora jedinica, razlikuje se:

NAMJERNI UZORAK – potrebno je dobro poznavati populaciju

kako bi se za uzorak mogli izabrati oni elementi koji će osigurati

takvu strukturu uzorka s obzirom na sva relevantna obilježja kakvu

ima i populacija

� izabiru se jedinice prema odluci istraživača (anketara)

� ispituju se dostupni članovi skupa

� izabiru se jedinice u sklopu kvota – kvota uzorak

� prigodan izbor uzorka

Ne može se brojčano izraziti veličina pogreške, pa se primjenjuju metode deskriptivne statistike

Page 7: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

SLUČAJNI UZORAK

� svaki član skupa ima vjerojatnost izbora u uzorak veću od nule

� podaci se analiziraju prema načelima inferencijalne statistike

(procjenjuju se nepoznati parametri i testiraju hipoteze o njima i

oblicima rasporeda osnovnih skupova)

� mogu se izračunati pogreške nastale primjenom uzorka – važno za

prosudbu kakvoće zaključivanja

� Izbor se vrši pomoću tablice slučajnih brojeva ili sistematskim

izborom

Page 8: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

METODA UZORAKA

PROCJENA

PARAMETARA

POPULACIJE

POMOĆU UZORKA

TESTIRANJE HIPOTEZA

O NEKIM

KARAKTERISTIKAMA

•projektiranje veličine uzorka

•interval procjene AS populacije

•interval procjene totala populacije

•interval procjene proporcije populacije

•testiranje hipoteze o nepoznatoj AS

•ispitivanje jednakosti AS dvaju populacija

•testiranje hipoteza o nepoznatoj proporciji

•testiranje hipoteze o jednakosti dvaju ili

više populacija s pomoću χ2 - testa

Page 9: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

PROCJENA ARITMETIČKE SREDINE

OSNOVNOG SKUPA

� Aritmetička sredina populacije µ je parametar koji se procjenjuje:

� Brojem:

npr. zanimaju li nas prosječna primanja stanovnika nekog područja, možemo izabrati uzorak od n stanovnika tog područja, izračunati AS uzorka i zaključiti da su ona istovjetna prosječnim primanjima stanovnika cijelog područja

� Intervalom:

formiramo interval određene širine, ovisno o željenoj pouzdanosti(ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. veća je vjerojatnost da će se u njemu naći AS populacije

Page 10: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� Interval procjene AS populacije gradimo tako da AS uzorka s jedne

strane dodamo, a s druge strane oduzmemo stanoviti broj

zi standardnih pogrešaka procjene – broj ovisi o željenoj pouzdanosti

intervalne procjene

� Broj zi se naziva koeficijent pouzdanosti procjene (koeficijent

povjerenja)

� Najčešće se formiraju intervali procjene s 95%-tnom pouzdanosti, a u

tom slučaju koeficijent povjerenja iznosi 1.96 (očitava se iz tablice

površine ispod normalne krivulje: 0.95 : 2 = 0.4750)

Page 11: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� Interval procjene AS glasi:

Središnja točka intervala je AS uzorka x oko koje se gradi

interval, sa željom da se u njemu nađe AS populacije µ

P = pouzdanost

γ (gama) = vjerojatnost pogreške u procjeni AS populacije

(1 − γ) = pouzdanost intervalne procjene

{ }2 2

1x x

P x z x zγ γ− σ ≤ µ ≤ + σ = − γ

Page 12: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

Osim koeficijenta povjerenja, mora se izračunati i standardna

pogreška AS. U izrazima za njezino računanje koriste se sljedeći

simboli:

= standardna pogreška procjene AS populacije

σ = standardna devijacija populacije (ako je otprilike poznata)

s = standardna devijacija uzorka

= standardna devijacija populacije procijenjena pomoću uzorka

N = opseg populacije

n = opseg uzorka

f = frakcija izbora - odnos veličine uzorka i veličine

populacije, tj. f = n / N. Recipročna vrijednost frakcije izbora

N / n zove se korak izbora

σ̂

Page 13: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

Izraz za standardnu pogrešku

aritmetičke sredine populacije Uvjeti za primjenu izraza

xn

σσ = σ poznata i f < 0.05

1x

N n

Nn

σ −σ =

− σ poznata i f ≥ 0.05

ˆx

n

σσ = σ nije poznata i f < 0.05

ˆ

1x

N n

Nn

σ −σ =

− σ nije poznata i f ≥ 0.05

1x

s

nσ =

− σ nije poznata i f < 0.05

11x

s N n

Nn

−σ =

−− σ nije poznata i f ≥ 0.05

Page 14: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� za uzorke veće od 30 jedinica koeficijent pouzdanosti z uzimamo iz

tablice površina ispod normalne razdiobe:

z = 1.96 (uz 95% pouzdanosti procjene)

z = 2.58 (uz 99% pouzdanosti procjene)

� za uzorke manje od 30 jedinica koeficijent pouzdanosti z ne možemo

uzeti iz tablice površina ispod normalne razdiobe već ga uzimamo iz

Studentove tablice za k = n − 1 stupnjeva slobode, uz željenu

vjerojatnost procjene (najčešće 0.95 ili 0.99)

Page 15: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� studentova distribucija tabelirana je tako da se iz tablice očitava koeficijent t za određenu proporciju jedinica koje se odbacuju s njezina desnog kraja

� u predkoloni tablice su navedeni stupnjevi slobode, a u zaglavlju su koeficijenti t za proporcije jedinica 0.10, 0.05, 0.025, 0.01 i 0.005 smještenih na desnom kraju distribucije

� želimo li npr. napraviti intervalnu procjenu AS populacije s 95%

pouzdanosti, moramo formirati interval takve širine da se u njemu nađe

proporcija od 0.95 jedinica Studentove distribucije. U tom je slučaju

proporcija preostalih jedinica smještenih na krajevima distribucije

1 − 0.95 = 0.05. Na desnom kraju distribucije se tada nalazi proporcija

jedinica 0.05 : 2 = 0.025 pa ćemo traženi koeficijent pouzdanosti naći u

stupcu t.025 i u retku koji odgovara broju stupnjeva slobode u

konkretnom slučaju (veličini uzorka umanjenoj za jedan)

Page 16: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� želimo li npr. intervalnu procjenu s 95%-tnim povjerenjem, a uzorak

je veličine 20, traženi se koeficijent pouzdanosti (povjerenja) nalazi u

tabeli Kritične vrijednosti t, Studentove distribucije na presjeku 19.

retka i stupca t.025 i iznosi 2.093

Page 17: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

PRIMJER 1. Na otoku koji ima 1620 domaćinstava slučajno smo

izabrali 100 domaćinstava i zabilježili za svako od njih koliko hektara

obradive zemlje posjeduje. Izračunali smo aritmetičku sredinu tog

uzorka koja je iznosila 1.83 ha. Pomoću standardne devijacije tog

uzorka procijenili smo standardnu devijaciju populacije i dobili 1.36

ha. Izračunajte s 99% pouzdanosti kolika je prosječna površina

obradive zemlje svih domaćinstava na tom otoku.

N = 1620, n = 100, x = 1.83, = 1.36,

99% pouzdanosti ⇒ z = 2.58

σ̂

1000.06

1620

n

N= = > 0.05

Page 18: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

Traženi je interval procjene:

ˆ 1.36 1620 1000.13

1 1620 1100x

N n

Nn

σ − −σ = ⋅ = ⋅ =

− −

{ }2 2

1x x

P x z x zγ γ− σ ≤ µ ≤ + σ = − γ

{ }1.83 2.58 0.13 1.83 2.58 0.13 0.99P − ⋅ ≤ µ ≤ + ⋅ =

{ }1.49 2.17 0.99P ≤ µ ≤ =

Prosječna površina obradive zemlje na promatranom otoku nalazi

se između 1.49 ha i 2.17 ha uz 99% pouzdanosti

Page 19: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

PRIMJER 2. Od 186 elemenata jednog osnovnog skupa slučajno smo

izabrali 20 jedinica. Aritmetička sredina tog uzorka iznosi 2.5, a

standardna devijacija je 1.204. Uz 95% pouzdanosti procijenite

aritmetičku sredinu promatrane populacije.

N = 186, n = 20, x = 2.5, s = 1.204

95% pouzdanosti ⇒ t = 2.093

200.11

186

n

N= = > 0.05

Page 20: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

Traženi je interval procjene:

AS promatrane populacije nalazi se između 1.96 i 3.04 uz 95%

pouzdanosti

1.204 186 200.26

1 186 11 20 1x

s N n

Nn

− −σ = ⋅ = ⋅ =

− −− −

{ }2 2

1x x

P x t x tγ γ

− σ ≤ µ ≤ + σ = − γ

{ }2.5 2.093 0.26 2.5 2.093 0.26 0.95P − ⋅ ≤ µ ≤ + ⋅ =

{ }1.96 3.04 0.95P ≤ µ ≤ =

Page 21: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

PROCJENA TOTALA

OSNOVNOG SKUPA

� Total T je zbroj vrijednosti numeričke varijable konačnog osnovnog

skupa. Ako konačni osnovni skup ima N elemenata, tada je AS

populacije:

odatle slijedi da se u procjeni totala populacije može pogriješiti N

puta onoliko koliko se griješi u procjeni njezine AS

1

N

i

i

xT

N N

=µ = =∑

T N= ⋅µ⇒

Page 22: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� kao procjena totala populacije brojem (simbol ) služi nam AS

uzorka pomnožena opsegom populacije, tj.

� za intervalnu procjenu totala potrebna je i standardna pogreška totala

(simbol )

T̂ N x= ⋅

T̂σ

ˆ xTNσ = ⋅σ

Page 23: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� interval procjene totala osnovnog skupa glasi:

ili, za mali uzorak (n < 30):

{ }ˆ ˆ2 2

ˆ ˆ 1T T

P T z T T zγ γ− σ ≤ ≤ + σ = − γ

{ }ˆ ˆ2 2

ˆ ˆ 1T T

P T t T T tγ γ− σ ≤ ≤ + σ = − γ

Page 24: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

PRIMJER 3. U svrhu ispitivanja vremena potrebnog za dolazak na

rad, od 915 djelatnika jedne tvrtke anketirano je 150 osoba. Pomoću

tog uzorka dobiveni su ovi rezultati: prosječno vrijeme je 47 minuta, a

standardna pogreška AS uzorka 0.0747. Izračunajte 99% pouzdan

interval procjene totala osnovnog skupa, tj. ukupno vrijeme potrebno za

dolazak na rad svih djelatnika promatrane tvrtke.

N = 915, n = 150, x = 47, = 0.0747

99% pouzdanosti ⇒ z = 2.58

ˆ 915 47 43005T N x= ⋅ = ⋅ =

Page 25: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

Interval procjene:

ˆ 915 0.0747 68.35xT

Nσ = ⋅σ = ⋅ =

{ }ˆ ˆ2 2

ˆ ˆ 1T T

P T z T T zγ γ− σ ≤ ≤ + σ = − γ

{ }43005 2.58 68.35 43005 2.58 68.35 0.99P T− ⋅ ≤ ≤ + ⋅ =

{ }42829 43181 0.99P T≤ ≤ =

Ukupno vrijeme potrebno za dolazak na rad svih djelatnika

promatrane tvrtke nalazi se između 42829 minuta i 43181 minuta uz

99% pouzdanosti

Page 26: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� Proporcija konačnog osnovnog skupa je parametar koji označava

omjer članova skupa s određenim oblikom obilježja M i opsega skupa

N, tj.

� proporciju preostalih N − M jedinica koje nemaju traženo obilježje

označavamo sa q:

PROCJENA PROPORCIJE

OSNOVNOG SKUPA

Mp

N=

N Mq

N

−=

Vrijedi: p + q = 1

Page 27: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� procjenitelj proporcije osnovnog skupa brojem je proporcija uzorka:

, gdje je m broj članova uzorka s određenim oblikom

obilježja, a n veličina uzorka

� Standardna pogreška računa se pomoću izraza:

ˆm

pn

=

ˆn m

qn

−=

ˆ

ˆ ˆ

1p

p q

n

⋅σ =

−ako je f < 0.05

ˆ

ˆ ˆ

1 1p

p q N n

n N

⋅ −σ = ⋅

− −ako je f ≥ 0.05

Page 28: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� interval procjene proporcije za velike uzorke:

� za male uzorke procjenjivanje na ovakav način nije moguće

� kao kriterij za dovoljnu veličinu uzorka može se primijeniti pravilo:

{ }ˆ ˆ2 2

ˆ ˆ 1p pP p z p p zγ γ− σ ≤ ≤ + σ = − γ

ˆ ˆn p q⋅ ⋅ > 9

Page 29: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

PRIMJER 4. Građevinski poduzetnik treba preuzeti pošiljku od 5000

keramičkih pločica. Između 200 pločica, izabranih na slučajan način iz

pošiljke, nađeno je 40 pločica druge klase. Uz pouzdanost od 90%

procijenite proporciju pločica druge klase u cijeloj pošiljci.

Kako je tražena pouzdanost 90% , iz tablice za površinu ispod normalne

krivulje treba očitati koeficijent pouzdanosti z za površinu koja iznosi

polovinu pouzdanosti, tj. za 0.90 : 2 = 0.45. Među površinama

navedenim u tablicama nema površine koja iznosi točno 0.45, pa ćemo

potražiti onu koja je najbliža tom broju. U ovom su slučaju to dvije

površine: 0.4495 i 0.45053, pa se možemo odlučiti ili za z = 1.64 ili

z = 1.65

40ˆ 0.2

200p = =

Page 30: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

� Konstruirat ćemo interval pouzdanosti s koeficijentom z = 1.64

� interval pouzdanosti:

2000.04

5000

nf

N= = = < 0.05

ˆ

ˆ ˆ 0.2 0.80.028

1 200 1p

p q

n

⋅ ⋅σ = = =

− −

{ }ˆ ˆ2 2

ˆ ˆ 1p pP p z p p zγ γ− σ ≤ ≤ + σ = − γ

{ }0.2 1.64 0.028 0.2 1.64 0.028 0.90P p− ⋅ ≤ ≤ + ⋅ =

{ }0.172 0.228 0.90P p≤ ≤ =

Uz pouzdanost 90% procjenjujemo da se udio pločica druge klase u

cijeloj pošiljci kreće između 17.2 i 22.8%

Page 31: 8. METODA UZORAKA · formiramo interval odre đene širine, ovisno o željenoj pouzdanosti (ili povjerenju) procjene – što je interval širi, procjena je pouzdanija, tj. ve ća

Josipa Perkov, prof., pred.

PITANJA ZA USMENI DIO ISPITA:

1. Metoda uzorka

2. Odabir uzorka

3. Plan odabira elemenata u uzorak

4. Procjena karakteristika populacije pomoću

uzorka