statistika 2016/17 · 2016-12-19 · statistika 2016/17 testiranje statističkih hipoteza o...

Post on 28-Jan-2020

5 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Statistika 2016/17

Testiranje statističkih hipoteza o parametrima osnovnog skupa

Testiranje statističkih hipoteza o parametrima osnovnog skupa

1.Formulacija statističkih hipoteza,

2. Izbor statistike testa i rasporeda verovatnoća,

3. Izbor nivoa značajnosti testa,

4.Formulisanje pravila odlučivanja,

5. Izvlačenje uzorka i izračunavanje statistike testa,

6.Donošenje odluke o statističkoj hipotezi.

Testiranje statističkih hipoteza o parametrima osnovnog skupa

Nulta hipoteza H0:ϴ = ϴ0

Alternativna hipoteza H1:ϴ < ϴ0 (Jednostrana) H1:ϴ ≠ ϴ0 (Dvostrana)

Prosta H:ϴ = ϴ0

Složena H:ϴ > ϴ0

Statistička hipoteza

Statistička hipoteza ili istraživačka hipoteza?

},,{ 2 P

Formulisati nultu i alternativnu hipotezu:

Prosečan vek trajanja sijalice iznosi 1000 h. H0:µ = 1000 H1:µ ≠ 1000 Prosečan broj škartova na proizvodnoj traci je manji od 100. H0:µ ≥ 1000 H1:µ < 1000 Verovatnoća za pobedu na glasanju je veća od 50%. H0:P ≤ 0,5 H1:P > 0,5 Procenat pozitivnih reakcija na uvođenje novog proizvoda nije manji od 75%. H0:P ≥ 0,75 H1:P < 0,75

Stvarna situacija Odluka nakon testiranja o H0

Prihvaćena Odbačena

Istinita H0 Ispravna odluka

(1-α)

Greška I vrste (α)

[nivo značajnosti]

Neistinita H0 Greška II vrste

(β)

Ispravna odluka (1-β)

[moć testa]

Testiranje aritmetičke sredine za poznatu varijansu

n

X2

H0:µ = 1000 H1:µ ≠ 1000

H0:µ ≥ 1000 H1:µ < 1000

H0:µ ≤ 1000 H1:µ > 1000

O d re đ i va n j e k r i t i č n e o b l a s t i :

ima standardizovan normalan raspored (CGT)

Primer

• U bankomatu treba ostaviti dovoljnu količinu novca tokom vikenda. Međutim, banka ne želi da ostavi prevelike zalihe novca i smatra da je prosečan iznos po transakciji normalno raspoređen sa sredinom 300 n.j. i standardnom devijacijom 100 n.j.

• Da li se uz nivo pouzdanosti 95% može smatrati da je procena banke o prosečnom iznosu ispravna, ako je na osnovu 36 slučajno izabranih transakcija prosečan iznos 340 n.j.?

[H0:µ ≤ 300; H1:µ > 300] [u0=2,4 > 1,645 → H0 se odbacuje]

p - vrednost

• Najmanji nivo značajnosti pri kojem se nulta hipoteza može odbaciti na osnovu uzorka.

(p < α → H0 se odbacuje) (p ≥ α → H0 se prihvata)

Ilustracija za H0:µ ≤ µ0 H1:µ > µ0

p - vrednost

Za prethodni primer:

0082,0

)4,2(

36

100

300340

)340(

UP

UP

XPp

Moć testa

Odrediti moć testa ako je stvarna prosečna transakcija 340 n.j.

Moć testa H0 se odbacuje ako je

36

100645,1300

645,10

x

u

225,0

)76,0(

36

100

34041,327

)340|41,327(

UP

UP

XP

Testiranje aritmetičke sredine osnovnog skupa za nepoznatu varijansu

Prosečan broj realizovanih kredita iznosi najmanje 50?

Prosečna novčana vrednost računara iznosi 50000 n.j.?

Prosečno vreme pripreme ispita je manje od 20 sati?

Testiranje aritmetičke sredine osnovnog skupa za nepoznatu varijansu

Veličina uzorka

Statistika testa

Normalan

raspored

Studentov

t-raspored

Xs

Xu 0

0

Xs

Xt 00

U praktičnim primenama za n ≥ 30 Studentov raspored aproksimira se normalnim. Uzorci sa n < 30 nazivaju se “mali uzorci”.

U 50 na slučajan način izabranih dana tokom godine, zabeležen je broj realizovanih kredita u jednoj banci. Prosečan broj realizovanih kredita iznosi 24,74 uz ocenu standardne greške 0,5755. a) Da li se uz nivo pouzdanosti od 95% može smatrati da je

prosečan broj reaizovanih kredita manji od 25? b) Da li se uz nivo pouzdanosti od 99% može smatrati da je

prosečan broj reaizovanih kredita veći od 23? c) Uz nivo pouzdanosti od 90% proveriti da li se može smatrati da

prosečan broj realizovanih kredita iznosi 24? Zadatak rešiti na dva načina: i. Poređenjem statistike testa i tablične vrednosti ii. Izračunavanjem p - vrednosti

Primer

Testiranje proporcije osnovnog skupa

Statistika testa

'

00

'

ps

Ppu

Proporcija pozitivno ocenjenih fakultativnih izleta u turističkoj agenciji je veća od 50%?

Udeo stanovnika koji vrši kupovinu u hipermarketima iznosi 30%?

Manje od 60% studenata redovno pohađa nastavu?

Sa verovatnoćom većom od 60% Google Chrome je omiljeni internet pretraživač?

Testiranje razlike aritmetičkih sredina dva skupa na osnovu uzorka

(nezavisni uzorci)

Da li postoje statistički značajne razlike u prosečnom broju sklopljenih proizvoda između dve smene radnika?

Da li se može smatrati da je prosečnan iznos računa u hipermarketu u dva dana podjednak?

Da li se može smatrati da je razlika prosečnog ostvarenog broja bodova između studenata grupe A za 5 veći od studenata grupe B?

Da li se može smatrati da je razlika prosečnog ostvarenog broja bodova između studenata grupe A najmanje za 5 veći od studenata grupe B?

Ocena standardne greške rasporeda razlike aritmetičkih sredina uzoraka

“pretpostavka o jednakim varijansama”

“pretpostavka o različitim varijansama”

F-test o jednakosti varijansi H0: σ1

2 = σ22

H0: σ12 ≠ σ2

2

Testiranje razlike aritmetičkih sredina dva skupa na osnovu uzorka

(nezavisni uzorci)

Ocena standardne greške rasporeda razlike aritmetičkih sredina uzoraka

“pretpostavka o jednakim varijansama”

2121

2

2

2

1

)(

11

2

)1()1(21

21 nnnn

nns

uu

XX

Broj stepeni slobode: 221 nn

Testiranje razlike aritmetičkih sredina dva skupa na osnovu uzorka

(nezavisni uzorci)

Ocena standardne greške rasporeda razlike aritmetičkih sredina uzoraka

“pretpostavka o različitim varijansama”

Broj stepeni slobode:

2

2

1

2

)(

21

21 nns

uu

XX

2

2

2

2

2

1

2

1

2

2

2

1

2

21

21

1

1

1

1

nnnn

nn

uu

uu

Testiranje razlike aritmetičkih sredina dva skupa na osnovu uzorka

(nezavisni uzorci)

Veličine uzoraka

Statistika testa

Normalan

raspored

Studentov

t-raspored

)(

021210

21

)(

XXs

XXu

)(

021210

21

)(

XXs

XXt

Testiranje razlike aritmetičkih sredina dva skupa na osnovu uzorka

(nezavisni uzorci)

Testiranje razlike aritmetičkih sredina dva skupa na osnovu uzorka

(zavisni uzorci)

Da li je došlo do promene u prosečnom radnom učinku pre i posle promene?

Da li je došlo do promene u prosečnom broju bodova na prvom i drugom kolokvijumu?

Testiranje razlike aritmetičkih sredina dva skupa na osnovu uzorka

(zavisni uzorci)

dyx

yxdyx

yxdyx

yxdyx

nnnnn

.........

22222

11111

Na vrednostima d1, d1,..., dn sprovodi se testiranje aritmetičke sredine

Analiza varijanse jednog faktora varijabiliteta

• Statistički metod za utvrđivanje statistički značajnih razlika u prosečnim vrednostima između 3 ili više grupa (modaliteti faktora).

Prodavac audio opreme zabeležio je prodaju 3 proizvođača opreme:

Da li uz verovatnoću 95% postoje statistički značajne razlike u prosečnoj prodaji audio uređaja između različitih proizvođača? Ako je potrebno, preporučiti prodavcu koji proizvod u budućnosti ne treba da poručuje.

Proizvođač Prodaja

A1 9 6 8 9 11 11

A2 10 9 7 6 8 8

A3 10 9 7 10 13 11

Proizvođač Prodaja

A1 9 6 8 9 11 11

A2 7 6 4 3 5 5

A3 10 9 7 10 13 11

Prodavac audio opreme zabeležio je prodaju 3 proizvođača opreme:

Da li uz verovatnoću 95% postoje statistički značajne razlike u prosečnoj prodaji audio uređaja između različitih proizvođača? Ako je potrebno, preporučiti prodavcu koji proizvod u budućnosti ne treba da poručuje.

tetvarijabili

Rezidualni

tetvarijabili

Faktorski

tetvarijabili

Ukupan

m

i

n

j

iij

m

i

n

j

i

m

i

n

j

ij

iii

xxxxxx1 1

2

1 1

2

1 1

2 )()()(

• Osnovne pretpostavke:

– Varijanse grupa su jednake

– Grupe imaju normalan raspored

• Hipoteze:

– H0: aritmetičke sredine grupa su jednake

– H1: neke dve aritmetičke sredine se razlikuju

Izvor varijacija

Suma kvadrata odstupanja

Broj stepeni slobode

Ocena varijanse

Statistika testa

Kritična vrednost

Između grupa

m – 1

Odnos ocena

varijansi

Unutar grupa

n – m – –

Total n – 1 – – –

mn

SV R

R

1

m

SV A

A ),,( 21 rrF

m

i

iiA xxnS1

2)(

m

i

n

j

iijR

i

xxS1 1

2)(

m

i

n

j

ijT

i

xxS1 1

2)(

O d re đ i va n j e k r i t i č n e o b l a s t i :

Analiza varijanse sa dva faktora varijabiliteta

• Statistički metod za utvrđivanje statistički značajnih razlika u prosečnim vrednostima između grupa (modaliteti faktora A) i blokova (modaliteti faktora B) podataka.

Proizvođač Prodavnica

B1 B2 B3 B4 B5 B6

A1 9 6 8 9 11 11

A2 7 6 4 3 5 5

A3 10 9 7 10 13 11

Prodavac audio opreme je zabeležio prodaju 3 proizvođača u 6 prodavnica:

Da li uz verovatnoću 95% postoje statistički značajne razlike u prosečnoj prodaji audio uređaja između različitih proizvođača i između različitih prodavnica?

• Hipoteze:

– H0: aritmetičke sredine grupa (faktor A) su jednake

– H1: neke dve aritmetičke sredine se razlikuju

• Hipoteze:

– H0: aritmetičke sredine blokova (faktor B) su jednake

– H1: neke dve aritmetičke sredine se razlikuju

Izvor varijacija

Suma kvadrata odstupanja

Broj stepeni slobode

Ocena varijanse

Statistika testa

Tablična vrednost

Između grupa

m – 1 Odnos ocena

varijansi

Između blokova

s – 1 Odnos ocena

varijansi

Rezidual (m–1)(s–1) – –

Total n – 1 – – –

)1)(1(

sm

SV R

R

1

m

SV A

A ),,( rrF

m

i

iA xxsS1

2)(

m

i

s

j

ijT xxS1 1

2)(

s

j

jB xxmS1

2)(1

s

SV B

B

BATR SSSS

),,( rrF

O d re đ i va n j e k r i t i č n e o b l a s t i :

top related