poslovna statistika

298
POSLOVNA STATISTIKA Prof. dr Dušan Joksimović Megatrend univerzitet primenjenih nauka, Beograd, 2006.

Upload: -

Post on 29-Dec-2015

126 views

Category:

Documents


3 download

DESCRIPTION

Poslovna statistika

TRANSCRIPT

Page 1: Poslovna statistika

Prof. dr Dušan Joksimović rođen je 1966. godine u Beogradu.Diplomirao je na Elektrotehničkom fakultetu u Beogradu 1991. godine. Na istom fakultetu je magistrirao 1995. godine i doktorirao 2001. godine.Učesnik je više domaćih i inostranih kongresa i konferencija i ima preko trideset objavljenih ra-dova u domaćim i međunarodnim stručnim pub-likacijama.

Naučni je saradnik Instituta za fiziku i vanredni profesor na Fakulte-tu za poslovne studije Megatrend univerziteta primenjenih nauka za predmete Poslovna matematika i Poslovna statistika.

cyan magenta yellow black

POSLOVNA STATISTIKA

Prof. dr Dušan Joksimović

ISBN 86-7747-205-3 Megatrend univerzitet primenjenih nauka, Beograd, 2006.

Pro

f. d

r D

uša

n J

oks

imo

vić

• PO

SLO

VN

A S

TATI

STIK

A

Page 2: Poslovna statistika

Prof. dr Dušan Joksimović

POSLOVNASTATISTIKA

Megatrend univerzitet primenjenih nauka, Beograd, 2006.

Page 3: Poslovna statistika

Prof. dr Dušan JoksimovićPOSLOVNA STATISTIKARecenzenti:

Dr Nebojša Romčević,viši naučni saradnik Instituta za fiziku u BeograduDr Nenad Ignjatović,viši naučni saradnik Instituta tehničkih nauka SANU u Beogradu

Izdaje i štampa:Megatrend univerzitet primenjenih nauka, Beograd, Makedonska 21

Za izdavača:Nevenka Trifunović, izvršni direktor

Direktor izdavačke delatnosti:Dragan Karanović

Lektor:Irina Milutinović

Tehnički urednik:Prof. dr Dušan Joksimović

Dizajn koricaBranimir Trošić

Tiraž:1000 primeraka

Copyright:© 2005 Megatrend univerzitetprimenjenih nauka - BeogradIzdavač zadržava sva prava.Reprodukcija pojedinih delovaili celine ove publikacijenije dozvoljena!

ISBN 86-7747-205-3

Odlukom Komisije za izdavačku delatnost Megatrend univerziteta primenjenih nauka broj 158/44 (23.1.2006) rukopis je odobren za štampu

i upotrebu u nastavi kao udžbenik.

Page 4: Poslovna statistika

SADRŽAJ ............................................................................................................str.

UVOD .................................................................................................................................71. DESKRIPTIVNA STATISTIČKA ANALIZA ..........................................................101.1. Uređivanje i prikazivanje podataka .....................................................................101.2. Izračunavanje parametara raspodele obeležja ....................................................201.2.1. Parametri srednje vrednosti (mere srednje vrednosti) ................................201.2.2. Parametri varijabiliteta (mere disperzije) ......................................................321.2.3. Parametri oblika rasporeda (mere oblika rasporeda) ...................................53

2. OSNOVNI POJMOVI TEORIJE VEROVATNOĆE ..............................................562.1. Algebra događaja. ...................................................................................................582.2. Verovatnoća ............................................................................................................612.2.1. Definicija verovatnoće ......................................................................................612.2.2. Osobine verovatnoće ........................................................................................642.2.3. Elementi kombinatorike ...................................................................................68

2.2.3.1. Varijacije od n elemenata k-te klase .........................................................692.2.3.2. Permutacije od n elemenata ......................................................................712.2.3.3. Kombinacije od n elemenata k-te klase ...................................................73

3. RASPODELE SLUČAJNIH PROMENLJIVIH .......................................................773.1. Raspodele diskretnih slučajnih promenljivih .....................................................793.1.1. Parametri diskretnih slučajnih promenljivih ................................................85

3.1.1.1. Parametri centralne tendencije diskretneslučajne promenljive ..................................................................................86

3.1.1.2. Parametri varijabiliteta diskretneslučajne promenljive ..................................................................................90

3.1.1.3. Parametri oblika rasporeda diskretneslučajne promenljive ..................................................................................93

3.1.2. Primeri nekih raspodela diskretnihslučajnih promenljivih ......................................................................................95

3.1.2.1. Binomna raspodela, B(n,p) .......................................................................953.1.2.2. Hipergeometrijska raspodela, H(N,N1,n) ................................................973.1.2.3. Puasonova raspodela. P(λ) ................................................................... 100

3.2. Raspodele neprekidnih slučajnih promenljivih ...............................................1043.2.1. Parametri neprekidnih slučajnih promenljivih ...........................................109

3.2.1.1. Parametri centralne tendencije neprekidneslučajne promenljive ................................................................................109

3.2.1.2. Parametri varijabiliteta neprekidneslučajne promenljive .................................................................................111

3.2.1.3. Parametri oblika rasporeda neprekidne slučajnepromenljive ................................................................................................113

Page 5: Poslovna statistika

3.2.2. Primeri nekih raspodela neprekidnihslučajnih promenljivih ...................................................................................115

3.2.2.1. Normalna (Gausova) raspodela, N(μ,σ2) ...............................................1153.2.2.2. Studentova raspodela (t-raspodela), tv ..................................................1213.2.2.3. Hi-kvadrat raspodela, χv2 ........................................................................124

3.3. Neke osobine matematičkog očekivanja E(X)i Varijanse Var(X) slučajne promenljive X .......................................................127

4. UZORAK I STATISTIKE UZORKA ......................................................................1284.1. Prost slučajni uzorak ............................................................................................1294.2. Raspodele parametara uzorka ............................................................................1334.2.1. Raspodela aritmetičke sredine uzoraka X ....................................................1394.2.2. Raspodela razlike aritmetičkih sredina uzoraka, X1 — X2 ..........................1464.2.3. Raspodela proporcije uzoraka Pr ..................................................................1474.2.4. Raspodela varijanse uzoraka,

S2 -μ poznato, S 2c -μ nepoznato .....................................................................150

5. STATISTIČKO OCENJIVANJE ..............................................................................1525.1. Tačkaste ocene ......................................................................................................1535.2. Intervalne ocene ...................................................................................................1575.2.1. Intervalna ocena aritmetičke sredine populacije, μ ....................................1585.2.2. Intervalna ocena razlike aritmetičkih sredina

populacija, μ1 — μ2 ...........................................................................................1645.2.3. Intervalna ocena proporcije populacije π ....................................................1675.2.4. Intervalna ocena varijanse populacije, σ2 .....................................................170

6. TESTIRANJE PARAMETARSKIHSTATISTIČKIH HIPOTEZA ...................................................................................174

6.1. Testiranje aritmetičke sredine populacije ,μ .....................................................1816.2. Testiranje razlike aritmetičkih sredina populacije, μ1 — μ2 .............................1946.3. Testiranje proporcije populacije, π .....................................................................1996.4. Testiranje varijanse populacije σ2 .......................................................................203

7. REGRESIJA I KORELACIJA ...................................................................................2107.1. Prosta linearna regresija i korelacija ..................................................................2147.1.1. Ocenjivanje parametara α i β iz uzoračkih podataka .................................2167.1.2. Standardna greška regresije, se .......................................................................2187.1.3. Standardna greška ocene nagiba regresione krive, sb .................................2197.1.4. Koeficijent determinacije, r2 ..........................................................................2207.1.5. Koeficijent proste linearne korelacije u uzorku, r .......................................2217.1.6. Standardna greška ocene koeficijenta

proste linearne korelacije, sr ..........................................................................222

Page 6: Poslovna statistika

7.1.7. Korišćenje linearnog regresionog modelaza predviđanje vrednosti zavisnog obeležja ...............................................223

7.1.8. Interval predviđanja prosečne vrednosti zavisnogobeležja Y, za datu vrednost nezavisnog obeležja X=xp .............................224

7.1.9. Interval predviđanja individualne vrednostizavisnog obeležja Y, za datu vrednost nezavisnog obeležja X=xp .................225

7.2. Kvadratna regresija i korelacija ...........................................................................2277.2.1. Standardna greška kvadratne regresije, se ....................................................2307.2.2. Koeficijent determinacije kvadratne regresije, r2 ........................................230

7.3. Logaritamska regresija i korelacija .....................................................................2317.4. Eksponencijalna regresija i korelacija ................................................................232

8. INDEKSI.....................................................................................................................2408.1. Individualni indeksi .............................................................................................241

8.1.1. Individualni bazni indeksi, Bi ........................................................................2418.1.2. Individualni lančani indeksi, Li .....................................................................2438.1.3. Srednji tempo porasta, S .................................................................................2448.1.4. Srednji tempo pada, P .....................................................................................246

8.2. Grupni agregatni indeksi .....................................................................................2478.2.1. Metod prosečnih odnosa (srednje vrednosti) .............................................2478.2.2. Metod agegata ..................................................................................................249

8.2.2.1. Neponderisani metod agregata ..............................................................2508.2.2.2. Ponderisani metod agregata ...................................................................252

8.2.2.2.1. Lespeyers-ov metod ......................................................................2528.2.2.2.2. Pasche-ov metod ...........................................................................2548.2.2.2.3. Fisher-ov metod (idealni metod) ................................................2558.2.2.2.4. Marshal-Edgworth-ov metod .....................................................257

9. ANALIZA VREMENSKIH SERIJA ........................................................................2609.1. Dekompozicija vremenskih serija ......................................................................2619.1.1. Metod pokretnih proseka (pokretnih sredina), PP ....................................2639.1.2. Određivanje trenda, T(i) ................................................................................2689.1.3. Određivanje ciklične komponente, C(i) .......................................................2719.1.4. Određivanje sezonske komponente, S(i) ......................................................2739.1.5. Određivanje rezidualne komponente, R(i) ..................................................2769.1.6. Određivanje desezonirane serije DX (i) .......................................................278

9.2. Prognoza vremenske serije..................................................................................2819.2.1. Eksponencijalno poravnanje .........................................................................281

LITERATURA ...............................................................................................................288TABELE ..........................................................................................................................291

Page 7: Poslovna statistika

Poslovna statistika

7

UVOD

- Kratak istorijat statisti ke analize. Po eci statisti ke analize datiraju nekoliko vekova pre naše ere. Prva poznata prebrojavanja sprovedena su u Kini oko 4000 godina pre nove ere i u Egiptu oko 3000 godina pre nove ere, dok su prvi organizovani popisi vršeni u starom veku u Rimskoj republici. U srednjem veku vršeni su uglavnom popisi zemljišta i stoke i u nekim evropskim zemljama registri ro enih, umrlih i ven anih lica. Prvi sistematski organizovani popisi stanovništva vršeni su krajem XVIII veka. Sama re „statistika” prvi put je upotrebljena u prvoj polovini XVIII veka u radovima Gotfrida A envala(Gottfried Achenwal), profesora univerziteta u Getingenu. Po eci statistike kao nau ne discipline skoro istovremeno datiraju od XVII veka u Nema koj i Engleskoj.Po etkom XIX veka dolazi do naglog razvoja statisti kih teorija, najviše zahvaljuju i razvoju teorije verovatno e i složenijih matemati kih analiza. Naravno, vrtoglavi razvoj sistema elektronskih ra unara u drugoj polovini XX veka, inicirao je ogroman skok u aspektu primene statisti kih metoda u, sada ve , gotovo svim analizama bilo kojih masovnih pojava.

U današnje vreme statistika predstavlja simbiozu slede ih komponenti:

- deskriptivna statistika koja se bavi prikupljanjem, obradom i prezentiranjem ve postoje ih podataka;

- statisti ka analiza koja predstavlja skup statisti kih metoda pomo ukojih se vrši kvantitativna analiza me usobnih odnosa izme u pojava koje imaju masovni karakter i pomo u kojih se donose odre enizaklju ci i definišu zakonitosti ponašanja posmatranih pojava;

- statisti ka teorija koja pronalazi nove statisti ke metode i usavršava ve postoje e.

- Predmet statisti kog istraživanja. Statistika istražuje pojave koje su po svojoj prirodi varijabilne, koje imaju masovni karakter i ije ponašanje u masi, na našem nivou intelektualnog razvoja, nije unapred odre eno egzaktnim uzro no-posledi nim zakonitostima. Posmatranjem i analiziranjem pojava na velikom broju slu ajeva, statistika donosi odre ene zaklju ke o masovnom ponašanju tih pojava, te se naj eš e i predstavlja kao nau ni metod kvantitativnog istraživanja masovnih pojava.

Page 8: Poslovna statistika

Poslovna statistika

8

- Statisti ki skup (populacija, osnovni skup). Skup svih elemenata na kojima se odre ena pojava statisti ki posmatra zove se statisti ki skup (populacija, osnovni skup). Pojedina ni elementi iz kojih se statisti ki skup sastoji zovu se elementi statisti kog skupa (statisti ke jedinice). Definisanje statisti kogskupa u svakom konkretnom slu aju zavisi od prirode pojave koja se želi statisti ki analizirati, od cilja istraživanja i od raspoloživih mogu nostiposmatranja, ali se uvek mora voditi ra una o tome da statisti ki skup bude relativno homogen, odnosno da elementi statisti kog skupa imaju bar jednu zajedni ku osobinu. Što elementi skupa imaju više zajedni kih osobina, to je statisti ki skup homogeniji. Tako e, prilikom definisanja statisti kog skupa, mora se voditi ra una o tome da elementi skupa budu istovrsni, ali, naravno, ne i istovetni. U ovom odžbeniku emo broj lanova populacije (broj elemenata statisti kog skupa) obeležavati sa N.

- Uzorak. Uglavnom je nemogu e, a mahom uvek ekonomski i prostorno-vremenski neopravdano, vršiti statisti ku analizu na itavom statisti kom skupu. Zbog toga se vrlo esto iz itavog statisti kog skupa vrši odabir nekih elemenata skupa (vrši se uzorkovanje skupa) na kojima se sprovodi dalja statisti ka analiza, koja rezultira odre enim kvantitativnim zaklju cima koji važe za itav statisti ki skup. Na ini na koji se vrši uzorkovanje skupa nisu proizvoljni, ve moraju ispuniti odre ene zahteve, koji e biti analizirani u ovom udžbeniku. Podskup statisti kog skupa dobijen uzorkovanjem njegovih elemenata zove se uzorak. Broj lanova uzorka (broj elemata uzorka) u ovom udžbeniku emo obeležavati sa n.

- Obeležje. Osobine po kojima se jedinice statisti kog skupa ili uzorka razlikuju, a koje su predmet statisti ke analize, zovu se obeležja i obi no se dele na atributna (opisna) i numeri ka.

- Atributna obeležja su obeležja koja se izražavaju opisno (zanimanje, boja kose, pol, itd.).

- Numeri ka obeležja su obeležja koja se izražavaju broj ano i mogu biti prekidna (diskretna) i neprekidna (kontinualna).

- Prekidna numeri ka obeležja su ona obeležja koja mogu imati samo izolovane vrednosti (broj prodatih automobila, broj ro enih, broj lanova porodice, itd.).

Page 9: Poslovna statistika

Poslovna statistika

9

- Neprekidna numeri ka obeležja su ona obeležja koja mogu imati bilo koju vrednost unutar nekog intervala (visina, težina, potrošnja goriva, itd.).

U ovom udžbeniku emo objasniti neke od statisti kih metoda koje se koriste u analizi numeri kih obeležja, dok se analizom atributnih obeležja ne emo baviti.

Generalno, statisti ki metodi analize masovnih pojava se mogu svrstati u dve grupe: deskriptivna statisti ka analiza i analiti ka statistika.

- Deskriptivna statisti ka analiza obuhvata metode prikupljanja, sre ivanja i prikazivanja podataka iz statisti kog skupa ili iz uzorka, i metode odre ivanjaodre enih parametara statisti kog skupa ili uzorka, naravno onih parametara koji su relevantni za opis ponašanja posmatranog obeležja u posmatranom skupu.

- Analiti ka statistika se bavi objašnjavanjem i procenjivanjem varijabiliteta, statisti kim zaklju ivanjima na onovu uzorka i predvi anjima ponašanja posmatranog obeležja u budu nosti.

Tako e, metodi statisti ke analize mogu se podeliti na stati ke i dinami ke.

- Metodi stati ke statisti ke analize analiziraju promene obeležja unutar osnovnog skupa (populacije) u okviru jednog trenutka (ili intervala vremena).

- Metodi dinami ke statisti ke analize analiziraju vremensku zavisnost obeležja.

Page 10: Poslovna statistika

Poslovna statistika

10

1. DESKRIPTIVNA STATISTI KA ANALIZA

1.1. Ure ivanje i prikazivanje podataka

Dobijeni podaci o vrednostima obeležja koje imaju ispitivani elementi populacije (ili uzorka) predstavljaju niz neure enih numeri kih podataka.

Postupak njihovog ure ivanja predstavlja njihovo predstavljanje po veli ini od najmanje do najve e vrednosti. Tako ure en niz vrednosti posmatranog obeležja predstavlja ure enu statisti ku seriju, iji emo i-ti lan obeležavati sa ix , i obi no ih nazivamo negrupisanim podacima.

Prikazivanje ure enih podataka može biti tabelarno (u vidu tabela) i grafi ko(u vidu grafikona).

Da bi se ure eni podaci prikazali tabelarno ili grafi ki, neophodno je prvo ih grupisati, odnosno odrediti klase po kojima e se raspore ivati elementi populacije (ili uzorka). U zavisnosti od osobina obeležja koje se ispituje, klase mogu biti diskretne (ispitivana obeležja su diskretna) ili intervalne (ispitivanaobeležja su neprekidna).

Diskretna klasa, kod diskretnih obeležja, odre uje onu grupu lanovapopulacije koja ima istu vrednost obeležja, dok intervalna klasa, kod neprekidnih obeležja, odre uje onu grupu lanova populacije koja ima vrednosti unutar istog, unapred odre enog intervala vrednosti obeležja.

Klasni intervali intervalnih klasa obi no su iste širine (u analizama koje e biti sprovedene u ovom udžbeniku, klasni intervali moraju biti iste širine).

Donja i gornja granica klasnog intervala moraju biti jasno i nedvosmisleno odre ene i moraju o uvati kontinualnu prirodu vrednosti posmatranog obeležja, odnosno moraju biti u vidu poluotvorenih intervala koji se ne preklapaju ( iji je presek prazan skup), i koji prekrivaju itavu oblast mogu ihposmatranih vrednosti obeležja ( ija je unija itav interval mogu ih vrednosti obeležja).

Dakle, kod diskretnih obeležja, klase su odre ene vrednostima obeležja koje se pojavljuju u ure enoj seriji, dok kod neprekidnih obeležja, klase (njihov broj, odnosno klasni interval) odre uje osoba koja vrši statisti ku analizu.

Page 11: Poslovna statistika

Poslovna statistika

11

Broj klasa nadalje emo obeležavati sa K.

Ne postoji jasno definisano pravilo po kome bi se trebalo rukovoditi prilikom odre ivanja broja intervalnih klasa, ve odre eni broj preporuka.

Neke od njih su:

a) po Sturgesovoj formuli NK log3.31

b)

21500

17,12500,200

12,9200,100

10,7100,60

8,660,40

KN

KN

KN

KN

KN

c)

za bilo koje N važi 15,5K .

Predstavnik i-te klase (obeležava emo ga sa ,ix ) kod diskretnih klasa

predstavlja vrednost obeležja koje odre uje i-tu klasu, dok kod neprekidnih klasa predstavlja sredinu i-tog klasnog intervala.

Širina i-tog klasnog intervala (obeležava emo je sa i) predstavlja razliku izme u po etka (i+1)-og i po etka i-tog klasnog intervala. U analizama koje e biti sprovedene u ovom udžbeniku, intervalne klase moraju biti izabrane tako da su im širine me usobno iste, pa emo širinu klasnog intervala obeležavati sa .

Tabelarno, odnosno grafi ko prikazivanje ure enih podataka, u stvari, predstavlja prikazivanje odre enog broja pojavljivanja vrednosti datog obeležja u ispitivanoj populaciji (uzorku), to jest prikazivanje slede ihfrekvencija:

Page 12: Poslovna statistika

Poslovna statistika

12

- Apsolutna frekvencija i-te klase – obeleži emo je sa fi – kojapredstavlja ukupan broj lanova populacije (uzorka) koji imaju vrednost obeležja odre enu i-tom klasom (i = 1, 2, ..., K).

O igledno je da važi NfK

i

i

1

.

- Relativna frekvencija i-te klase – obeleži emo je sa pi, – kojapredstavlja relativan broj lanova populacije (uzorka) koji imaju vrednost obeležja odre enu i-tom klasom ( i = 1,2,...,K ), to jest

N

fp i

i .

O igledno je da važi 11

K

i

ip .

- Kumulativna frekvencija i-te klase – obeleži emo je sa Ki –

odre ena sa „ ” ukoliko se radi o diskretnim klasama ili intervalnim klasama ija je gornja granica zatvorena, ili sa „ ”ukoliko se radi o intervalnim klasama ija je gornja granica otvorena. Ova kumulativna frekvencija predstavlja ukupan broj lanova populacije (uzorka) koji imaju vrednost obeležja manju ili

jednaku od vrednosti obeležja i-te diskretne klase, ili od vrednosti gornje granice i-te intervalne klase ija je gornja granica zatvorena, odnosno predstavlja ukupan broj lanova populacije (uzorka) koji imaju vrednost obeležja manju od vrednosti gornje granice i-te intervalne klase ija je gornja granica otvorena (i = 1, 2, ..., K).

O igledno je da važi NK K .

- Kumulativna frekvencija i-te klase – obeleži emo je sa Wi –

odre ena sa „ ” ukoliko se radi o diskretnim klasama ili intervalnim klasama ija je donja granica zatvorena, ili sa „ ”ukoliko se radi o intervalnim klasama ija je donja granica otvorena. Ova kumulativna frekvencija predstavlja ukupan broj lanova populacije (uzorka) koji imaju vrednost obeležja ve u ili

jednaku od vrednosti obeležja i-te diskretne klase, ili od vrednosti donje granice i-te intervalne klase ija je donja granica zatvorena, odnosno predstavlja ukupan broj lanova populacije (uzorka) koji imaju vrednost

Page 13: Poslovna statistika

Poslovna statistika

13

obeležja ve u od vrednosti donje granice i-te intervalne klase ija je donja granica otvorena (i = 1, 2, ..., K).

O igledno je da važi .1 NW

Naravno, sve gore navedeno važi i za uzorak, uz injenicu da je tada N=n.

Grafi ki prikaz frekvencija daje se u vidu grafikona u pravouglom Dekartovom koordinatnom sistemu (x, y), gde se na x-osu nanose vrednosti obeležja i-teklase, a na y-osu vrednost frekvencije koja se predstavlja (recimo fi).

Kod diskretnih obeležja (diskretnih klasa) taj grafi ki prikaz je u vidu izlomljenih pravih linija koje spajaju ta ke ( ,

ix , fi) (ukoliko predstavljamo

apsolutnu frekvenciju fi) i naziva se poligon.

Kod neprekidnih obeležja (intervalnih klasa) taj grafi ki prikaz je u vidu pravougaonika ija je širina jednaka širini klasnog intervala, a visina nad i-tim klasnim intervalom jednaka vrednosti i-te frekvencije koja se predstavlja (recimo fi).

Primer 1.1.1. Anketirana je populacija od 50 studenata o broju položenih ispita i telesnoj težini. Dobijeni su slede i rezultati:

a) broj položenih ispita:

7 4 12 3 7 8 6 5 9 9 10 11 6 7 8 6 9 4 5 5 7 3 9 8 6 8 7 6 8 9 6 7 4 10 11 11 12 6 7 7 8 4 10 11 4 12 6 7 8 9

Page 14: Poslovna statistika

Poslovna statistika

14

b) težina (u kg):

57 84 112 83 77 68 96 105 90 69 102 71 68 72 78 76 89 74 55 85 87 73 89 78 67 68 74 69 80 79 66 67 64 104 110 91 92 68 75 77 82 64 101 91 64 62 65 73 81 91

Prikazati tabelarno i grafi ki apsolutnu frekvenciju, relativnu frekvenciju, kumulativne frekvencije odre ene sa „manje do jednako od” i „ve e do jednako od”, za oba obeležja.

Rešenje:

a)

Tabelarni prikaz dat je u Tabeli 1.1.1.a.

Broj

položenih

ispita

Apsolutna

frekvencija

fi

Relativna

frekvencija

pi

Kumulativna

frekvencijaKi

Kumulativna

frekvencijaWi

3 2 2/50 2 50

4 5 5/50 7 48

5 3 3/50 10 43

6 8 8/50 18 40

7 9 9/50 27 32

8 7 7/50 34 23

9 6 6/50 40 16

10 3 3/50 43 10

11 4 4/50 47 7

12 3 3/50 50 3

fi=50 pi=1

Tabela 1.1.1.a.

Page 15: Poslovna statistika

Poslovna statistika

15

Grafi ki prikaz apsolutne, relativne i kumulativnih frekvencija dat je na

slede im slikama.

0

1

2

3

4

5

6

7

8

9

10

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Broj položenih ispita

Ap

so

lutn

a f

re

kv

en

cij

a

Slika 1.1.1.a. Grafi ki prikaz apsolutne frekvencije

0

0.02

0.04

0.06

0.08

0.1

0.12

0.14

0.16

0.18

0.2

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Broj položenih ispita

Rela

tivn

a f

rekven

cija

Slika 1.1.1.b. Grafi ki prikaz relativne frekvencije

Page 16: Poslovna statistika

Poslovna statistika

16

0

5

10

15

20

25

30

35

40

45

50

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Broj položenih ispita

Ku

mu

lati

vn

a f

rekven

cija

<=

1.1.1.c. Grafi ki prikaz kumulativne frekvencije ( )

0

5

10

15

20

25

30

35

40

45

50

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Broj položenih ispita

Ku

mu

lati

vn

a f

rekven

cija

>=

1.1.1.d. Grafi ki prikaz kumulativne frekvencije ( )

Page 17: Poslovna statistika

Poslovna statistika

17

b)

Imaju i u vidu preporuke date u ovom udžbeniku o grupisanju neprekidnih

vrednosti obeležja u intervalne klase i injenicu da je najmanja težina u

populaciji 55 kg, a najve a 112 kg, podatke o težini iz ove populacije emo

grupisati u sedam klasa širine 10 kg, po ev od 50 kg.

Tabelarni prikaz je dat u Tabeli 1.1.1.b.

Interval

težine (kg)

Apsolutna

frekvencija

fi

Relativna

frekvencija

pi

Kumulativna

frekvencija <

Ki

Kumulativna

frekvencijaWi

50 -60 2 2/50 2 50

60 -70 14 14/50 16 48

70 -80 13 13/50 29 34

80 -90 9 9/50 38 21

90 -100 6 6/50 44 12

100 -110 4 4/50 48 6

110 -120 2 2/50 50 2

fi=50 pi=1

Tabela 1.1.1.b.

Grafi ki prikaz apsolutne, relativne i kumulativnih frekvencija dat je na

slede im slikama.

Page 18: Poslovna statistika

Poslovna statistika

18

0

2

4

6

8

10

12

14

Ap

so

lutn

a f

re

kv

en

cij

a

Slika 1.1.1.e. Grafi ki prikaz apsolutne frekvencije

0

0.04

0.08

0.12

0.16

0.2

0.24

0.28

Re

lati

vn

a f

re

kv

en

cij

a

Slika 1.1.1.f. Grafi ki prikaz relativne frekvencije

50 60 70 80 90 100 110 120 (kg)

Težina

50 60 70 80 90 100 110 120 (kg)

Težina

Page 19: Poslovna statistika

Poslovna statistika

19

0

5

10

15

20

25

30

35

40

45

50

Ku

mu

lati

vn

a f

re

kv

en

cij

a

<

Slika 1.1.1.g. Grafi ki prikaz kumulativne frekvencije (<)

0

5

10

15

20

25

30

35

40

45

50

Ku

mu

lati

vn

a f

re

kv

en

cij

a

>=

Slika 1.1.1.h. Grafi ki prikaz kumulativne frekvencije ( )

50 60 70 80 90 100 110 120 (kg)

Težina

50 60 70 80 90 100 110 120 (kg)

Težina

Page 20: Poslovna statistika

Poslovna statistika

20

1.2. Izra unavanje parametara raspodele obeležja

Ure ivanje i prikazivanje podataka analizirano u prethodnom odeljku 1.1, samo je priprema podataka za njihovu dalju obradu. Naime, da bi se izveli odre eni zaklju ci o raspodeli ispitivanog obeležja u populaciji, ili u uzorku, pa kasnije na osnovu toga i u celoj populaciji, neophodno je izra unati neke veli ine (parametre, pokazatelje, mere) koji na neki na in prezentuju ponašanje raspodeljenosti obeležja u posmatranoj populaciji.

Uopšteno, ti parametri se mogu podeliti u tri osnovne grupe:

- parametri srednje vrednosti (mere srednje vrednosti ili centralne tendencije);

- parametri varijabiliteta (mere disperzije); - parametri oblika rasporeda (mere oblika rasporeda).

Neki od parametara koje emo izra unavati isto e se ozna avati i za populaciju i za uzorak, dok e neki imati razli ite oznake u zavisnosti od toga da li se radi o populaciji ili uzorku.

Tako e, neke od formula po kojima e se ra unati parametri, bi e identi ne i za populaciju i za uzorak, dok e se neke razlikovati.

U ovom trenutku italac treba da obrati pažnju na te razlike i da ih prihvati bez dodatnih objašnjenja, uz napomenu da e se u kasnijim delovima udžbenika adekvatno razjasniti potreba za ovim razlikama.

1.2.1. Parametri srednje vrednosti (mere srednje vrednosti)

Parametre srednje vrednosti možemo podeliti na izra unate i pozicione.

Izra unati su:

- aritmeti ka sredina, - geometrijska sredina, - harmonijska sredina.

Pozicioni su:

Page 21: Poslovna statistika

Poslovna statistika

21

- modus, - medijana.

Zavisnost prirode promene ispitivanog obeležja nam diktira koji emo od gore pomenuta tri izra unata parametra srednje vrednosti da koristimo kao relevantnu meru srednje vrednosti datog obeležja u posmatranoj populaciji (uzorku).

Kada je priroda promene posmatranog obeležja linearno zavisna, koristi emo aritmeti ku sredinu kao meru srednje vrednosti. Linearna zavisnost promene ogleda se u tome da je ukupna grupna vrednost obeležja jednaka aritmeti kom zbiru obeležja svakog lana grupe ponaosob (visina, težina, broj prodatih automobila, broj poena na ispitu...). Ovakva priroda promene je najzastupljenija u svakodnevnom životu.

Kada je priroda promene posmatranog obeležja direktno proporcionalna,koristi emo geometrijsku sredinu kao meru srednje vrednosti. Direktna proporcionalnost promene ogleda se u tome da je ukupna grupna vrednost obeležja jednaka proizvodu obeležja svakog lana grupe ponaosob (procenat...).

Kada je priroda promene posmatranog obeležja obrnuto proporcionalna,koristi emo harmonijsku sredinu kao meru srednje vrednosti. Obrnuta proporcionalnost promene ogleda se u tome da se grupna vrednost obeležja smanjuje kada se pove ava broj lanova grupe i obrnuto (vreme završetka nekog posla u odnosu na broj ljudi koji ga istovremeno rade i sl.).

- Aritmeti ka sredina. Aritmeti ku sredinu bilo kojih N brojeva x1, x2, ..., xN

obeležavamo sa ___

X i izra unavamo po formuli:

N

xxxX N...21___

.

Od sada pa nadalje u ovom udžbeniku, aritmeti ku sredinu populacije emo

obeležavati sa , dok emo aritmeti ku sredinu uzorka obeležavati sa ___

X .Kada podatke nismo grupisali u klase važi:

Page 22: Poslovna statistika

Poslovna statistika

22

.1___

1

n

x

XN

xn

i

i

N

i

i

Kada smo podatke grupisali u klase važi:

.1

,

___1

,

n

xf

XN

xfK

i

ii

K

i

ii

Imaju i u vidu da je predstavnik diskretne klase ,ix jednak vrednosti obeležja

koje imaju svi lanovi te klase (u i-toj klasi fi lanova ima vrednost xi koja je jednaka ,

ix ), zaklju ujemo da je aritmeti ka sredina u istoj seriji podataka

diskretnih obeležja identi na bez obzira na to da li su podaci grupisani ili ne, dok za neprekidna obeležja to ne možemo da tvrdimo jer je kod grupisanih neprekidnih obeležja predstavnik i-te klase ,

ix , sredina i-tog klasnog intervala,

a sama raspodela obeležja u i-toj klasi ne mora biti takva da je njihova aritmeti ka sredina baš sredina tog klasnog intervala.

Primer 1.2.1.1. Za podatke iz Primera 1.1.1. izra unati aritmeti ku sredinu broja položenih ispita i težine anketiranih studenata

a) negrupišu i podatke, b) grupišu i podatke.

Rešenje:

i)

Ako ne grupišemo podatke, za aritmeti ku sredinu broja položenih

ispita dobijamo:

44.750

50

1i

ix

a za aritmeti ku sredinu težine studenata dobijamo:

Page 23: Poslovna statistika

Poslovna statistika

23

.26.7950

50

1 kg

xi

i

ii)

Ako grupišemo podatke, za aritmeti ku sredinu broja položenih ispita

dobijamo:

44.750

12311410396877968534532

10

1

,

N

xfi

ii

naravno, istu vrednost kao i kada nismo grupisali podatke, jer je obeležje

diskretnog tipa.

Ako grupišemo podatke, za aritmeti ku sredinu težine studenata

dobijamo:

.6.7950

1152105495685975136514552

7

1

,

kg

N

xfi

ii

Kao što smo i o ekivali, aritmeti ka sredina grupisanih podataka se razlikuje

od aritmeti ke sredine negrupisanih jer je težina obeležje neprekidnog tipa.

Aritmeti ka sredina se ponekad naziva i moment prvog reda.

Generalno, moment reda k ozna avamo sa mk i izra unavamo po formuli:

N

x

m

N

i

k

i

k1 za negrupisane podatke,

Page 24: Poslovna statistika

Poslovna statistika

24

N

xf

m

kK

i

ii

k1

,

za grupisane podatke.

- Aritmeti ka sredina aritmeti kih sredina. Neka je dato m razli itihpopulacija (ili uzorka), i neka je broj lanova svake od ovih populacija (uzorka) Ni (odnosno ni), i neka je aritmeti ka sredina svake od ovih populacija (uzorka)

i (odnosno iX___

), tada je, ako sve ove populacije (uzorke) spojimo u jednu, aritmeti ka sredina novodobijene populacije (uzorka) jednaka:

m

i

i

m

i

ii

m

i

i

m

i

ii

n

Xn

X

N

N

1

1

___

___

1

1__

.

Primer 1.2.1.2. Prose na visina svih 220 devojaka na prvoj godini studija je 168 cm, a prose na visina svih180 muškaraca na prvoj godini je 182 cm. Kolika je prose na visina studenta prve godine?

Rešenje:

Prose na visina studenta na prvoj godini studija je

.3.174180220

182180168220

1

1_

cm

N

N

m

i

i

m

i

ii

- Geometrijska sredina. Geometrijsku sredinu bilo kojih N brojeva x1, x2, ...,

xN obeležavamo sa G i izra unavamo po formuli:

NNxxxG ...21 .

Page 25: Poslovna statistika

Poslovna statistika

25

Kada želimo da iskažemo geometrijsku sredinu kao meru srednje vrednosti odre enog obeležja u populaciji (ili uzorku), onda važi:

za negrupisane podatke NNxxxG ...21 ,

za grupisane podatke Kf

K

ff K

xxxG ,,2

,1 ...21 ,

gde je: G - reprezent geometrijske sredine koji pravilno predstavlja direktno proporcionalnu prirodu promene datog obeležja;

xi - reprezent vrednosti obeležja koje pravilno predstavlja direktno proporcionalnu prirodu promene datog obeležja (i = 1, 2, ..., N);

,ix - reprezent predstavnika i-te klase koji pravilno predstavlja direktno

proporcionalnu prirodu promene datog obeležja (i = 1, 2, ..., K).

Formule za geometrijsku sredinu uzorka su identi ne uz uslov N=n.

Primer 1.2.1.3. U poslednje etiri godine cena neke robe se menjala na slede ina in: prve godine pove ala se za 10%, druge se pove ala za 12%, tre e godine se smanjila za 5% i etvrte godine se smanjila za 17%. Kakva je prose naprocentualna godišnja promena cene ove robe u ovom periodu?

Rešenje:

Ukoliko sa p predstavimo decimalni zapis procentualne promene od p%,

odnosno100

%pp , onda je

(1+ p) pravilni reprezent porasta od p%, a

(1 - p) pravilni reprezent smanjenja od p%,

pa je reprezent geometrijske sredine procentualne godišnje promene cena u

ovom periodu

99278,083,095,012,11,14G .

Page 26: Poslovna statistika

Poslovna statistika

26

Zaklju ujemo da se u ovom etvorogodišnjem periodu ovakvim promenama

cena robe prose no godišnje smanjivala 0,722%.

- Harmonijska sredina. Harmonijsku sredinu bilo kojih N brojeva x1, x2, ..., xN obeležavamo sa H i izra unavamo po formuli:

Nxxx

NH

1...

11

21

.

Kada želimo da iskažemo harmonijsku sredinu kao meru srednje vrednosti odre enog obeležja u populaciji (ili uzorku), onda važi:

za negrupisane podatke: N

i ix

NH

1

1

za grupisane podatke: K

i i

i

x

f

NH

1,

.

Formule za harmonijsku sredinu uzorka su identi ne uz uslov N=n.

Primer 1.2.1.4. Osoba A uradi jedan posao rade i sam za 10 asova. Osoba B za 12 asova, a osoba C za 9 asova. Ako su osobe A, B i C iz iste grupacije ljudi, koliko je srednje vreme potrebno da jedan ovek iz te grupacije sam uradi taj posao?

Rešenje:

Pošto je vreme za koje bi se završio taj posao obrnuto proporcionalno broju

ljudi iz te grupacije koji bi ga istovremeno obavljali (što više ljudi istovremeno radi na tom poslu, to e vreme izrade posla biti manje), to je srednje vreme

potrebno da jedan ovek iz te grupacije sam uradi taj posao jednako:

Page 27: Poslovna statistika

Poslovna statistika

27

9

1

12

1

10

13

H asova=10,19 asova.

Izme u harmonijske, geometrijske i harmonijske sredine izra unate nad istim skupom brojeva, važi slede a nejedna ina:

____

XGH .

- Modus. Za negrupisane podatke modus (M0) je vrednost obeležja koje se naj eš e javlja u seriji.

Za grupisane podatke diskretnog tipa, modus (M0) je tako e vrednost obeležja koje se naj eš e javlja u seriji, što u ovom slu aju predstavlja vrednost klase ija je apsolutna frekvencija najve a.

Za grupisane podatke neprekidnog tipa modus (M0) nalazimo tako što prvo prona emo modalnu klasu, kao klasu ija je apsolutna frekvencija najve a.Zatim modus izra unavamo po formuli:

11

1

0

0000

00

0

MMMM

MM

Mffff

ffLM ,

gde je:

0ML - po etak modalne klase,

0Mf - apsolutna frekvencija modalne klase,

10Mf - apsolutna frekvencija klase pre modalne,

10Mf - apsolutna frekvencija klase posle modalne,

- širina klasnog intervala.

Vrednost modusa neprekidnih podataka grupisanih u klase može se dobiti i grafi kim putem kao apscisa ta ke preseka prave koja je odre ena ta kama

100, MM fL i

00, MM fL i prave odre ene ta kama

00, MM fL i

100, MM fL (Slika 1.2.1).

Page 28: Poslovna statistika

Poslovna statistika

28

Slika 1.2.1.

Interesantno je napomenuti da ako bi se konstruisala parabola koja prolazi kroz tri sredine gornjih strana pravougaonika, apscisa maksimuma te parabole bi se poklopila sa modusom.

Ukoliko se svaki podatak u seriji pojavljuje isti broj puta, odnosno ukoliko su sve apsolutne frekvencije me usobno jednake, onda modus ne postoji.

Ukoliko postoji samo jedan modus, kažemo da je serija, odnosno raspodela unimodalna. Ukoliko postoje dva modusa, onda kažemo da je serija, odnosno raspodela bimodalna, a ako postoji više od dva modusa, onda seriju, odnosno raspodelu proglašavamo polimodalnom.

Primer 1.2.1.5. Za podatke iz Primera 1.1.1. izra unati modus:

a) broja položenih ispita, b) težine anketiranih studenata.

fMo

fMo+1

fMo-1

LMo Mo LMo+

fi

xi

Page 29: Poslovna statistika

Poslovna statistika

29

Rešenje:

a)

Kako je najfrekventnija klasa klasa u kojoj se nalaze lanovi populacije koji

imaju sedam položenih ispita, to je modus ove unimodalne raspodele

Mo=7.

b)

Najfrekventnija klasa, odnosno modalna klasa, je klasa 60 -700 kg, pa je modus

.23,69101314214

21460

11

1kg

ffff

ffLM

oooo

oo

o

MMMM

MM

Mo

- Medijana. Za negrupisane podatke medijana (Me) je vrednost obeležja koje se nalazi u sredini ure ene statisti ke serije. Dakle, broj lanova populacije (uzorka) koji su manji od Me te populacije (tog uzorka) jednak je broju lanovate populacije (tog uzorka) koji su ve i od Me te populacije (tog uzorka).

Ukoliko je broj lanova ure ene statisti ke serije neparan, 12 kN , tada je

medijana jednaka vrednosti 2

1N-og lana te serije, a ukoliko je broj

lanova ure ene statisti ke serije paran, kN 2 , tada je medijana jednaka

aritmeti koj sredini 2

N-og i 1

2

N-og lana te serije.

Odnosno, za negrupisane podatke važi:

.2

2

12

122

2

1

NN

e

Ne

xx

MkN

xMkN

Page 30: Poslovna statistika

Poslovna statistika

30

Za grupisane podatke diskretnog tipa, Me tako e predstavlja vrednost obeležja koje se nalazi u sredini ure ene statisti ke serije. Izra unavanje vrednosti Me je

u ovom slu aju isto kao i za negrupisane podatke, samo se vrednosti 2

1N-

og lana (ukoliko je 12 kN ), odnosno 2

N-og i 1

2

N-og lana

(ukoliko je kN 2 ), nalaze iz tabelarne predstave ure ene serije.

Za grupisane podatke neprekidnog tipa, Me je vrednost koja deli histogram na dva dela jednakih površina. Naravno da i tada važi da je broj lanovapopulacije (uzorka) koji su manji od tako odre ene Me jednak broju lanova te populacije (tog uzorka) koji su ve i od Me .

Da bismo odredili Me za grupisane podatke neprekidnog tipa, potrebno je prvo da prona emo medijalnu klasu Me,kl.

Medijalnu klasu Me,kl. odre ujemo iz uslova:

klekle M

i

i

M

i

i fN

f,,

1

1

1 2.

Medijanu Me odre ujemo iz jedna ine

kle

kle

kle

M

M

i

i

Mef

fN

LM

,

,

,

1

12,

gde je:

kleML,

- po etak medijalne klase,

klMf,0

- apsolutna frekvencija medijalne klase,

N - broj lanova populacije,

if - apsolutna frekvencija i-te klase,

- širina klasnog intervala.

Formule za medijanu Me uzorka su identi ne uz uslov N=n.

Page 31: Poslovna statistika

Poslovna statistika

31

Primer 1.2.1.6. Za podatke iz Primera 1.1.1. izra unati medijanu:

a) broja položenih ispita, b) težine anketiranih studenata.

Rešenje:

a)

Populacija sadrži paran broj lanova, N=50, pa medijanu nalazimo kao

aritmeti ku sredinu 25. i 26. lana serije ure ene u rastu i poredak.

Analiziraju i kumulativnu frekvenciju Ki , vidimo da se i 25. i 26. lan serije

ure ene u rastu i poredak nalaze u klasi u kojoj se nalaze lanovi populacije

koji su položili sedam ispitai, pa je medijana ove raspodele

.72

77

22625 XX

M e

b)

Kako je 252

50

2

N, to je medijalna klasa 70 -80 kg, pa je medijana

.92,761013

162570

2

,

,

,

1

1 kgf

fN

LM

kle

kle

kle

M

M

i

i

Me

Page 32: Poslovna statistika

Poslovna statistika

32

1.2.2. Parametri varijabiliteta (mere disperzije)

Parametre varijabiliteta možemo podeliti na apsolutne i relativne.

Apsolutni su:

- interval varijacije, - interkvartilna razlika, - srednje apsolutno odstupanje, - srednje kvadratno odstupanje (varijansa), - standardna devijacija.

Relativni su:

- koeficijent varijacije, - normalizovano standardno odstupanje.

- Interval varijacije. Interval varijacije (Iv) je interval vrednosti obeležja u kome se nalaze vrednosti obeležja svih lanova populacije (uzorka).

Kod negrupisanih podataka, kao i kod grupisanih podataka diskretnog tipa, izra unava se kao razlika najve e i najmanje vrednosti obeležja u ispitivanoj populaciji (uzorku):

minmax xxIv .

Kod grupisanih podataka neprekidnog tipa, izra unava se kao razlika gornje granice poslednje klase i donje granice prve klase.

Primer 1.2.2.1. Za podatke iz Primera 1.1.1. izra unati interval varijacije:

c) broja položenih ispita d) težine anketiranih studenata.

Rešenje:

a)

Interval varijacije je 9312minmax xxIv položenih ispita.

Page 33: Poslovna statistika

Poslovna statistika

33

b)

Interval varijacije je .7050120minmax kgxxIv

- Interkvartilna razlika. Pre nego što definišemo interkvartilnu razliku, definisa emo slede e pojmove: kvartil, decil i percentil.

- Kvartili su brojevi, koje emo obeležavati sa )3,...,1(iQi , sa

osobinom da i-ti kvartil (Qi) deli interval varijacije u odnosu .4: ii

To zna i da Qi predstavlja vrednost obeležja od koje %25i elemenata populacije (uzorka) ima vrednost manju ili jednaku od Qi. O igledno da je

eMQ2 .

Za negrupisane podatke, kao i za grupisane podatke diskretnog tipa, i-ti kvartil izra unavamo po formuli:

3,...,1

14

11

4

11

4

12

4

11

4

1

i

xxN

iN

ixQN

iN

iN

ii

gde je sa ozna en ceo deo broja .

U suštini, ova formula zna i slede e:

ukoliko je 14

1Ni ceo broj, tada je vrednost i-tog kvartila jednaka

vrednosti 14

1Ni -og lana ure ene statisti ke serije.

A ukoliko 14

1Ni nije ceo broj, tada se vrednost i-tog kvartila dobija

linearnom interpolacijom vrednosti 14

1Ni -og i 2

4

1Ni -og lana

ure ene statisti ke serije.

Page 34: Poslovna statistika

Poslovna statistika

34

Da bismo odredili vrednost i-tog kvartila (Qi) za grupisane podatke neprekidnog tipa, neophodno je prvo odrediti klasu i-tog kvartila kliQ , , iz

slede eg uslova:

klikli Q

i

i

Q

i

i fN

if,,

1

1

1 4i=1,...,3.

Vrednost Qi i=1,...,3 odre ujemo iz jedna ine

kli

kli

kli

Q

Q

i

i

Qif

fN

i

LQ

,

,

,

1

14

gde je:

kliQL,

- po etak klase i-tog kvartila,

kliQf,

- apsolutna frekvencija klase i-tog kvartila,

N - broj lanova populacije,

if - apsolutna frekvencija i-te klase,

- širina klasnog intervala.

Formule za Qi uzorka su identi ne uz uslov N=n.

- Decili su brojevi, koje emo obeležavati sa )9,...,1(iDi , sa

osobinom da i-ti decil (Di) deli interval varijacije u odnosu .10: ii

To zna i da Di predstavlja vrednost obeležja od koje %10i elemenata populacije (uzorka) ima vrednost manju ili jednaku od Di. O igledno da je

eMD5 .

Za negrupisane podatke, kao i za grupisane podatke diskretnog tipa, i-ti decil izra unavamo po formuli:

9,...,1

110

11

10

11

10

12

10

11

10

1

i

xxN

iN

ixDN

iN

iN

ii

Page 35: Poslovna statistika

Poslovna statistika

35

gde je sa ozna en ceo deo broja .

U suštini, ova formula zna i slede e:

ukoliko je 110

1Ni ceo broj, tada je vrednost i-tog decila jednaka

vrednosti 110

1Ni -og lana ure ene statisti ke serije.

A ukoliko 110

1Ni nije ceo broj, tada se vrednost i-tog decila dobija

linearnom interpolacijom vrednosti 110

1Ni -og i 2

10

1Ni -og lana

ure ene statisti ke serije.

Da bismo odredili vrednost i-tog decila (Di) za grupisane podatke neprekidnog tipa, neophodno je prvo odrediti klasu i-tog decila kliD , , iz slede eg uslova:

klikli D

i

i

D

i

i fN

if,,

1

1

1 10i=1,...,9.

Vrednost Di i=1,...,9 odre ujemo iz jedna ine

kli

kli

kli

D

D

i

i

Dif

fN

i

LD

,

,

,

1

110,

gde je:

kliDL,

- po etak klase i-tog decila,

kliDf,

- apsolutna frekvencija klase i-tog decila,

N - broj lanova populacije,

if - apsolutna frekvencija i-te klase,

- širina klasnog intervala.

Formule za Di uzorka su identi ne uz uslov N=n.

Page 36: Poslovna statistika

Poslovna statistika

36

- Percentili su brojevi, koje emo obeležavati sa )99,...,1(iPi ,

sa osobinom da i-ti percentil (Pi) deli interval varijacije u odnosu .100: ii

To zna i da Pi predstavlja vrednost obeležja od koje %1i elemenata populacije (uzorka) ima vrednost manju ili jednaku od Pi. O igledno da je

eMP50 .

Za negrupisane podatke, kao i za grupisane podatke diskretnog tipa, i-tipercentil izra unavamo po formuli:

99,...,1

1100

11

100

11

100

12

100

11

100

1

i

xxN

iN

ixPN

iN

iN

ii

gde je sa ozna en ceo deo broja .

U suštini, ova formula zna i slede e:

ukoliko je 1100

1Ni ceo broj, tada je vrednost i-tog percentila jednaka

vrednosti 1100

1Ni -og lana ure ene statisti ke serije.

A ukoliko 1100

1Ni nije ceo broj, tada se vrednost i-tog percentila dobija

linearnom interpolacijom vrednosti 1100

1Ni -og i 2

100

1Ni -og lana

ure ene statisti ke serije.

Da bismo odredili vrednost i-tog percentila (Pi) za grupisane podatke neprekidnog tipa, neophodno je prvo odrediti klasu i-tog percentila kliP , , iz

slede eg uslova:

klikli P

i

i

P

i

i fN

if,,

1

1

1 100i=1,...,99.

Vrednost Pi i=1,...,99 odre ujemo iz jedna ine

Page 37: Poslovna statistika

Poslovna statistika

37

kli

kli

kli

P

P

i

i

Pif

fN

i

LP

,

,

,

1

1100 ,

gde je:

kliPL,

- po etak klase i-tog percentila,

kliPf,

- apsolutna frekvencija klase i-tog percentila,

N - broj lanova populacije,

if - apsolutna frekvencija i-te klase,

- širina klasnog intervala.

Formule za Pi uzorka su identi ne uz uslov N=n.

Interkvartilna razlika Iq predstavlja interval vrednosti obeležja u kome se nalazi 50% središnih vrednosti ure ene serije, i izra unava se po formuli

257513 PPQQI q .

Ona isklju uje 25% podataka sa najnižim vrednostima i 25% podataka sa najvišim vrednostima.

U nekim literaturama se esto definiše i pojam polukvartilne razlike (semikvartilna razlika) i ona je polovina interkvartilne razlike, odnosno važi

semikvartilna razlika2qI

.

Primer 1.2.2.2. Za podatke iz Primera 1.1.1. izra unati interkvartilnu razliku, tre i decil i trideset peti percentil:

a) broja položenih ispita, b) težine anketiranih studenata.

Rešenje:

Kako je N=50, važi slede e:

Page 38: Poslovna statistika

Poslovna statistika

38

a)

14

15012

4

15011

4

1501

1 14

15011

4

1501 xxxQ

66625.0625.0

25.1325.13

1314131

25.1325.1425.131

xxxQ

xxxQ

14

15032

4

15031

4

1503

3 14

15031

4

1503 xxxQ

99975.0975.0

75.3775.37

3738373

75.3775.3875.373

xxxQ

xxxQ

pa je interkvartilna razlika 36913 QQI q položena ispita.

Tre i decil iznosi:

.6667.067.0

7.157.15

110

15031

10

1503

151615

7.157.167.153

110

15032

10

15031

10

1503

3

xxx

xxxD

xxxD

Trideset peti percentil iznosi:

.15.66715.0615.0

15.1815.18

1100

150351

100

15035

181918

15.1815.1915.1835

1100

150352

100

150351

100

15035

35

xxx

xxxP

xxxP

Page 39: Poslovna statistika

Poslovna statistika

39

b)

Kako je 5,124

50

4

N to je klasa prvog kvartila 60 -70 kg, pa je prvi

kvartil Q1

kgf

fN

LQ

kl

kl

kl

Q

Q

i

i

Q 5.671014

25,1260

4

,1

,1

,1

1

11 .

Kako je 5,374

503

4

3 Nto je klasa tre eg kvartila 80 -90 kg, pa

je tre i kvartil Q3

kgf

fN

LQ

kl

kl

kl

Q

Q

i

i

Q 44.89109

295,3780

4

3

,3

,3

3,

1

13 .

Interkvartilna razlika je .94.215.6744.8913 kgQQI q

Kako je 1510

503

10

3 N to je klasa tre eg decila 60 -70 kg, pa je

tre i decil D3

.29.691014

21560

10

3

,3

,3

,3

1

13 kg

f

fN

LD

kl

kl

kl

D

D

i

i

D

Kako je 5.17100

5035

100

35 N to je klasa trideset petog percentila

70 -80 kg, pa je trideset peti percentil P35

.12.7013

165.1770

10035

,

,

,

1

135 kg

f

fN

LP

kli

kli

kli

P

P

i

i

P

Page 40: Poslovna statistika

Poslovna statistika

40

- Srednje apsolutno odstupanje

Srednje apsolutno odstupanje (AD) možemo odrediti u odnosu na aritmeti kusredinu, modus i medijanu.

Srednje apsolutno odstupanje od aritmeti ke sredine ozna avamo sa )(AD

ukoliko je u pitanju populacija, odnosno sa )(__

xAD ukoliko je u pitanju uzorak.

Za negrupisane podatke se izra unava po formuli:

N

x

AD

N

i

i

1)( za populaciju,

n

xx

xAD

n

i

i

1

__

__

)( za uzorak,

dok se za grupisane podatke izra unava po formuli:

N

xf

AD

K

i

ii

1

,

)( za populaciju,

n

xxf

xAD

K

i

ii

1

__,

__

)( za uzorak.

Srednje apsolutno odstupanje od modusa ozna avamo sa )( oMAD i za

negrupisane podatke populacije se izra unava po formuli:

N

Mx

MAD

N

i

oi

o1)(

dok se za grupisane podatke izra unava po formuli:

Page 41: Poslovna statistika

Poslovna statistika

41

N

Mxf

MAD

K

i

oii

o1

,

)( .

Formule za AD(Mo) uzorka su identi ne uz uslov N=n.

Srednje apsolutno odstupanje od medijane ozna avamo sa )( eMAD i za

negrupisane podatke populacije se izra unava po formuli:

N

Mx

MAD

N

i

ei

e1)(

dok se za grupisane podatke izra unava po formuli:

N

Mxf

MAD

K

i

eii

o1

,

)( .

Formule za AD(Me) uzorka su identi ne uz uslov N=n.

Interesantno je napomenuti da zbir N

AxN

i

i

1 ima minimum kada je eMA ,

odnosno za negrupisane podatke je srednje apsolutno odstupanje od medijane najmanje.

Primer 1.2.2.3. Za podatke iz Primera 1.1.1. izra unati srednje apsolutno odstupanje od aritmeti ke sredine

a) broja položenih ispita, b) težine anketiranih studenata.

Podatke analizirati kao grupisane.

Page 42: Poslovna statistika

Poslovna statistika

42

Rešenje:

a)

Srednje apsolutno odstupanje broja položenih ispita od aritmeti ke

sredine je

9552,150

56.4356.3456.2350

56.1656.0744.0944.1844.2344.3544.4250

44.712344.711444.710344.79644.78750

44.77944.76844.75344.74544.732

10

1

,

N

xf

AD i

ii

b)

Srednje apsolutno odstupanje težine od aritmeti ke sredine je

.536.1250

4.3524.2544.1564.596.4136.14146.24250

6.7911526.79105450

6.799566.798596.7975136.7965146.79552

7

1

,

kg

N

xf

AD i

ii

Page 43: Poslovna statistika

Poslovna statistika

43

- Srednje kvadratno odstupanje (varijansa)

Srednje kvadratno odstupanje (varijansu) emo posebno izra unavati i obeležavati u zavisnosti od toga da li ra unamo varijansu populacije ili uzorka. Razlozi zbog kojih se na in izra unavanja varijanse populacije razlikuje od na ina izra unavanja varijanse uzorka, bi e objašnjen u kasnijim poglavljima ovog udžbenika.

- Varijansa populacije

Varijansu populacije obeležavamo sa 2 i izra unavamo po formuli:

N

xN

i

i

1

2

2 za negrupisane podatke,

N

xfK

i

ii

1

2,

2 za grupisane podatke.

Imaju i u vidu da važi slede e:

21

2

21

2

1

2

11

2

1

22

1

2

2

22

N

x

N

x

NN

x

N

x

N

xx

N

x

N

i

i

N

i

i

N

i

N

i

i

N

i

i

N

i

ii

N

i

i

i

Page 44: Poslovna statistika

Poslovna statistika

44

21

2,

21

2,

1

2

1

,

1

2,

1

2,2,

1

2,

2

2

2

N

xf

N

xf

N

f

N

xf

N

xf

N

xxf

N

xf

K

i

ii

K

i

ii

K

i

i

K

i

ii

K

i

ii

K

i

iii

K

i

ii

varijansa populacije se može izra unavati i po slede im (tzv. radnim) formulama:

21

2

2

N

xN

i

i

za negrupisane podatke,

21

2,

2

N

xfK

i

ii

za grupisane podatke.

-Varijansa uzorka

Na in izra unavanja i obeležavanja varijanse uzorka zavisi od toga da li je aritmeti ka sredina populacije ( ), iz koje je uzorak uzet, poznata ili ne.

U slu aju kada je aritmeti ka sredina populacije ( ) poznata, varijansu uzorka obeležavamo sa 2s i izra unavamo po formuli:

21

2

1

2

2

n

x

n

x

s

n

i

i

n

i

i

za negrupisane podatke,

Page 45: Poslovna statistika

Poslovna statistika

45

21

2,

1

2,

2

n

xf

n

xf

s

K

i

ii

K

i

ii

za grupisane podatke.

U slu aju kada je aritmeti ka sredina populacije ( ) nepoznata, varijansu uzorka obeležavamo sa 2

cs i izra unavamo po formuli:

11

2__

2

n

xx

s

n

i

i

c za negrupisane podatke,

11

2__,

2

n

xxf

s

K

i

ii

c za grupisane podatke,

gde je sa __

x obeležena aritmeti ka sredina ispitivanog uzorka.

Imaju i u vidu da važi slede e:

1112

1

112

11

2

1

1

2__22____

__1

2

1

2__

1__

1

2

1

2____2

1

2__

n

xnx

n

xn

n

xnx

n

x

n

x

n

x

xn

x

n

xxxx

n

xx

n

i

i

n

i

i

n

i

n

i

i

n

i

i

n

i

ii

n

i

i

i

Page 46: Poslovna statistika

Poslovna statistika

46

1112

1

112

1

1

2

1

2__

1

2,2______

1

2,

1

2__

1

,

__1

2,

1

2____,2,

1

2__,

n

xnxf

n

xn

n

xnx

n

xf

n

xf

n

xf

xn

xf

n

xxxxf

n

xxf

K

i

ii

K

i

ii

K

i

i

K

i

ii

K

i

ii

K

i

iii

K

i

ii

varijansa uzorka se, u slu aju ne poznavanja aritmeti ke sredine populacije, može izra unavati i po slede im formulama:

11

2__2

2

n

xnx

s

n

i

i

c za negrupisane podatke,

1

2__

1

2,

2

n

xnxf

s

K

i

ii

c za grupisane podatke.

Primer 1.2.2.4. Za podatke iz Primera 1.1.1. izra unati varijansu:

a) broja položenih ispita, b) težine anketiranih studenata.

Podatke analizirati kao grupisane i smatrati da se radi o populaciji.

Page 47: Poslovna statistika

Poslovna statistika

47

Rešenje:

a)

Varijansa broja položenih ispita je

6864.550

56.4356.3456.2356.1656.07

50

44.0944.1844.2344.3544.42

50

44.712344.711444.710344.79644.787

50

44.77944.76844.75344.74544.732

22222

22222

22222

22222

10

1

2,

2

N

xfi

ii

b)

Varijansa težine je

.84,22450

4.3524.2544.156

50

4.596.4136.14146.242

50

6.7911526.7910546.79956

50

6.798596.7975136.7965146.79552

222

2222

222

2222

7

1

2,

2

N

xfi

ii

Page 48: Poslovna statistika

Poslovna statistika

48

- Standardna devijacija

Standardna devijacija je kvadratni koren varijanse i obeležava se i izra unavapo slede im formulama:

- standardna devijacija populacije ( )

2

- standardna devijacija uzorka kada je poznato (s)

2ss

- standardna devijacija uzorka kada nije poznato ( cs )

2cc ss .

Primer 1.2.2.5. Za podatke iz Primera 1.1.1. izra unati standardnu devijaciju:

a) broja položenih ispita, b) težine anketiranih studenata.

Podatke analizirati kao grupisane i smatrati da se radi o populaciji.

Rešenje:

Imaju i u vidu rešenje Primera 1.2.2.4. dobijamo:

a)

standardna devijacija broja položenih ispita iznosi

38.26864.52

b)

standardna devijacija težine studenata iznosi

.99.1484.2242 kg

Page 49: Poslovna statistika

Poslovna statistika

49

Aritmeti ka sredina i standardna devijacija u nekoj meri odre uju raspored vrednosti obeležja analiziranih podataka u populaciji (uzorku). Naime, na osnovu ebiševljeve teoreme, koju ovde ne emo prezentovati, definisano je slede e pravilo, poznato kao ebiševljevo pravilo:

u k standardnih devijacija oko aritmeti ke sredine nalazi se bar

%1001

12k

vrednosti obeležja podataka analizirane populacije (uzorka).

Ovo pravilo važi za k 1 , k R.

Dakle:

- bar %75%1002

11

2 podataka ima vrednost obeležja u intervalu

2 standardne devijacije oko aritmeti ke sredine;

- bar %89,88%1003

11

2 podataka ima vrednost obeležja u

intervalu 3 standardne devijacije oko aritmeti ke sredine;

- bar %75,93%1004

11

2 podataka ima vrednost obeležja u

intervalu 4 standardne devijacije oko aritmeti ke sredine.

- Koeficijent varijacije

Koeficijent varijacije obeležavamo sa Cv i izra unavamo po slede im formulama:

- koeficijent varijacije populacije

vC

- koeficijent varijacije uzorka kada je poznato

Page 50: Poslovna statistika

Poslovna statistika

50

__

x

sCv

- koeficijent varijacije uzorka kada nije poznato

__

x

sC c

v .

Kada koeficijent varijacije izražavamo u procentima, obeležavamo ga sa Cv% i izra unavamo po formuli

%.100% vv CC

Koeficijent varijacije je relativni parametar koji ukazuje na nivo homogenosti posmatranog obeležja u populacija (uzorku). Što je koeficijent varijacije ve i,to je homogenost manja, odnosno populacija (uzorak) je nestabilnija u aspektu vrednosti posmatranog obeležja. Pomo u ovog parametra može se upore ivatihomogenost razli itih obeležja u razli itim populacijama (uzorcima). Ovaj parametar, dakle, opisuje svojstvo itave populacije, pa se esto kaže da ima integralni karakter.

Primer 1.2.2.6. Za podatke iz Primera 1.1.1. izra unati koeficijent varijacije:

a) broja položenih ispita, b) težine anketiranih studenata.

Podatke analizirati kao grupisane i smatrati da se radi o populaciji.

Rešenje:

a)

Koeficijent varijacije broja položenih ispita iznosi

%32%

32.044.7

38.2

v

v

C

C

Page 51: Poslovna statistika

Poslovna statistika

51

b)

Koeficijent varijacije težine iznosi

%8.18%

188.06.79

99.14

v

v

C

C

Raspodeljenost broja položenih ispita ovih studenata nestabilnija je od

raspodeljenosti njihovih težina.

- Normalizovano standardno odstupanje

Normalizovano standardno odstupanje je relativni parametar koji ukazuje na odstupanje odre enog (i-tog) lana populacije (uzorka) u odnosu na aritmeti ku sredinu te populacije (uzorka), imaju i u vidu i stepen stabilnosti vrednosti obeležja u toj populaciji (uzorka). Pomo u ovog parametra mogu se upore ivati individualni lanovi iz razli itih populacija.

Normalizovano standardno odstupanje i-tog lana, ija je vrednost obeležja xi,obeležavamo sa Zi i izra unavamo po slede im formulama:

- Zi i-tog lana populacije

ii

xZ ,

- Zi i-tog lana uzorka kada je poznato

s

xxZ i

i

__

,

- Zi i-tog lana kada nije poznato

c

ii

s

xxZ

__

.

Page 52: Poslovna statistika

Poslovna statistika

52

Primer 1.2.2.7. Student koji pripada populaciji iz Primera 1.1.1. ima 75 kg. i položio je 7 ispita. Na i normalizovano odstupanje:

a) broja položenih ispita, b) težine

ovog studenta.

Rešenje:

a)

Normalizovano odstupanje broja položenih ispita ovog studenta iznosi

185.038.2

44.77ii

xZ .

b)

Normalizovano odstupanje težine ovog studenta iznosi

307.099.14

6.7975ii

xZ .

Ovaj student je i u jednom i u drugom slu aju ispod proseka svoje

populacije, ali više odstupa u težini nego u položenim ispitima.

Page 53: Poslovna statistika

Poslovna statistika

53

1.2.3. Parametri oblika rasporeda (mere oblika rasporeda)

Mere oblika rasporeda su mera simetrije i mera spljoštenosti. U ovom udžbeniku analizira emo samo mere oblika rasporeda za populaciju, dok se analizom mera oblika rasporeda uzorka ne emo baviti.

Mera simetrije se izražava pomo u koeficijenta simetrije, dok se mera spljoštenosti izražava pomo u koeficijenta spljoštenosti. I jedan i drugi koeficijent se izra unavaju pomo u centralnih momenata.

- Centralni moment reda k ozna avamo sa Mk i izra unavamo po formuli:

N

x

M

N

i

k

i

k1 za negrupisane podatke,

N

xf

M

kK

i

ii

k1

,

za grupisane podatke.

- Koeficijent simetrije ozna avamo sa 3 i izra unavamo po formuli:

33

3

M.

Ukoliko je:

3=0 zaklju ujemo da je raspodela vrednosti obeležja simetri na; tada je tako e oe MM ;

Page 54: Poslovna statistika

Poslovna statistika

54

3 0 zaklju ujemo da je raspodela vrednosti obeležja pozitivno asimetri na (asimetrija udesno); tada je tako e oe MM ;

3 0 zaklju ujemo da je raspodela vrednosti obeležja negativno asimetri na (asimetrija ulevo); tada je tako e oe MM

(Slika 1.2.3.1).

a) Simetri an raspored

b) Pozitivno asimetri an raspored

c) Negativno asimetri an raspored

Slika 1.2.3.1. Oblici rasporeda frekvencija u smislu simetrije

U praksi se esto koristi slede a podela:

1.03 smatra se da nema asimetrije,

25.01.0 3 mala asimetrija,

5.025.0 3 srednja asimetrija,

35.0 jaka asimetrija.

fi

xi3=0=Me=M0

3 0Me M0

3 0Me M0

a b c

Page 55: Poslovna statistika

Poslovna statistika

55

- Koeficijent spljoštenosti ozna avamo sa 4 i izra unavamo po formuli:

44

4

M.

Ukoliko je:

4=3 zaklju ujemo da je raspodela vrednosti obeležja normalno spljoštena;

3 3 zaklju ujemo da je raspodela vrednosti obeležja izdužena, odnosno ima spljoštenost manju od normalne;

3 0 zaklju ujemo da raspodela vrednosti obeležja ima spljoštenost ve u od normalne.

Zadatak 1.2.3.1. Za podatke iz Primera 1.1.1. izra unati mere oblika rasporeda (koeficijent simetrije i spljoštenosti):

c) broja položenih ispita, c) težine anketiranih studenata.

Podatke analizirati kao grupisane i smatrati da se radi o populaciji.

Page 56: Poslovna statistika

Poslovna statistika

56

2. OSNOVNI POJMOVI TEORIJE VEROVATNO E

Na današnjem nivou razvoja ljudske svesti „slu ajnost” kao pojava tretira se dvojako.

Pobornici takozvanog kauzalnog shvatanja, mišljenja su da su sva dešavanja u univerzumu (a tu spadaju i ponašanja ljudskog uma) deterministi ka, odnosno uzro no-posledi na. Za pojedine pojave, otkrivanje njihovih uzroka i na ina(zakonitosti) po kojima uzroci deluju na pojavu kao posledicu, „preveli” su tu pojavu iz domena slu ajne pojave u domen potpuno odre ene pojave, ije su mesto, veli ina i trenutak pojave, u našem etvorodimenzionalnom prostorno-vremenskom okruženju, potpuno opisani. Na primer, sigurno je da je pojava Halejeve komete na nebu za nekog posmatra a od pre hiljadu godina bila jedan slu ajan doga aj. Danas, putanja Halejeve komete je potpuno opisana i vreme i mesto njene pojave potpuno su odre eni, a ne slu ajni. Svako otkrivanje uzro no-posledi ne zavisnosti odre enih pojava utemeljilo je odre enufundamentalnu nau nu teoriju (opšta teorija relativnosti, teorija elektromagnetizma, i sl.), u okviru kojih se analiza vrši po utvr enim i nepromenjlivim pravilima, opisanim kroz odre ene matemati ke jedna ine, i gde „slu ajnost” kao pojam uopšte ne postoji. Ovakav pristup smatra da su odre eni „slu ajni” doga aji, u stvari, doga aji ije mnogobrojne i složene uzro no-posledi ne veze sa poznatim i nepoznatim uzrocima još nismo otkrili. Zbog toga vreme, prostor i formu njihovog pojavljivanja ne možemo predvideti, pa ih nazivamo „slu ajnim”, dok oni to u stvari nisu.

Pristalice drugog pristupa smatraju da slu ajnost zaista postoji u univerzumu, i da je „slu ajno” pojavljivanje, pojavljivanje bez ikakvog uzroka i zakonitosti odre enih doga aja, jedna od fundamentalnih karakteristika univerzuma. Po tom pristupu, kauzalnost odre enih pojava nije postulat, ve „slu ajnost”veoma velike verovatno e. Toliko velike da je vreme u kome analiziramo, pa i živimo po toj kauzalnosti, izuzetno kratko, pa je verovatno a da se do sada pojavio doga aj koji bi opovrgnuo odre eni kauzalni zakon veoma mala. Zbog toga se jedan takav doga aj, „perpetum mobile”, „slu ajno” nije ni pojavio, te otud „zabluda” o deterministi nosti univerzuma. Nau na utemeljenost ovakvog pristupa ogleda se u Hajzenbergovoj relaciji neodre enosti i raznim kvantnim teorijama.

Najve i mislioci današnjeg vremena nisu se egzaktno opredelili ni za jedan od ovih pristupa, ve pokušavaju da objedine ova dva pristupa u neku jedinstvenu

Page 57: Poslovna statistika

Poslovna statistika

57

teoriju, a do tada se koriste zakonitostima jednog ili drugog pristupa u zavisnosti od prirode analiziranih pojava.

Bez obzira kako tretiramo slu ajnost, ona ima svoje zakonitosti i upravo je teorija verovatno e matemati ka teorija koja analizira te zakonitosti na modelima stvarnih pojava, dok je statisti ka teorija, pogotovu njen metod uzorkovanja, uspostavljavanje veze izme u stvarnih pojava i matemati kihmodela.

Uopšteno, svi matemati ki modeli stvarnih pojava koje analiziramo metodama verovatno e, svrstavaju se u kategoriju statisti kog eksperimenta, a to je eksperiment koji zadovoljava slede e uslove:

3. može se ponavljati (realno ili misaono) proizvoljan broj puta pod istim uslovima;

4. unapred je definisano šta se registruje u eksperimentu i poznati su svi mogu i ishodi, kojih može biti kona no mnogo, i prebrojivo ili neprebrojivo beskona no mnogo;

5. ishod svakog budu eg pojedina nog eksperimenta nije unapred poznat.

Nad ishodima ovakvog eksperimenta, statisti kog eksperimenta, definišemo slede e pojmove:

- elementarni doga aj je skup iji je element svaki mogu i pojedina niishod statisti kog eksperimenta;

- siguran doga aj je skup svih ishoda eksperimenta, odnosno skup svih elementarnih doga aja, i obeležava emo ga sa S;

- doga aj (ili slu ajan doga aj) je svaki podskup sigurnog doga aja,odnosno svaki podskup skupa S, i njih emo obeležavati velikim slovima A, B, C...

Važno je ista i da su doga aji definisani kao skupovi i da se teorija verovatno e primenjuje na ovako definisanim doga ajima.

Nemogu doga aj u nekom statisti kom eksperimentu je bilo koja pojava koja nije podskup sigurnog doga aja, i obeležavamo ga kao prazan skup .

Jedan od uobi ajenih primera statisti kog eksperimenta je bacanje kockice za jamb (kocka ije su strane obeležene brojevima od 1 do 6), gde se registruje broj koji je pao sa gornje strane kocke.

Page 58: Poslovna statistika

Poslovna statistika

58

Kod ovog statisti kog eksperimenta postoji šest elementarnih doga aja;obeležimo ih sa Ai (i = 1, 2, ..., 6), gde je:

11A - pala je jedinica;

22A - pala je dvojka;

66A - pala je šestica.

Siguran doga aj je skup

,6,5,4,3,2,1S - da padne bilo koji ceo broj od 1 do 6, uklju uju i i 1 i 6.

Recimo, doga aj da padne paran broj ve i od 3 je skup koji emo obeležiti sa Bi iji su elementi

6,4B i svakako da je .SB

Doga aj da padne broj ve i od 26 je nemogu doga aj.

2.1. Algebra doga aja

Kako su doga aji definisani kao skupovi, to se operacije sa doga ajima u skupu S definišu na isti na in kao i operacije sa skupovima.

- Podskup doga aja. Kažemo da je doga aj A podskup doga aja B ukoliko su svi elementarni doga aji koji ine doga aj A istovremeno i elementarni doga aji koji ine doga aj B, i to zapisujemo

BA .

U tom slu aju kažemo da doga aj A implicira doga aj B, da je doga aj A deo doga aja B ...- Jednakost (ekvivalentnost) doga aja. Doga aji A i B su jednaki ukoliko je

ABBA i tada zapisujemo .BA

Page 59: Poslovna statistika

Poslovna statistika

59

- Suprotan doga aj. Suprotan doga aj doga aju A je doga aj koji se realizuje kada se prilikom izvo enja statisti kog eksperimenta ne realizuje doga aj A. Suprotan doga aj je skup koji se sastoji od svih elementarnih doga aja statisti kog eksperimenta, koji ne pripadaju doga aju A . Obeležava

se sa __

A i važi

ASA \__

gde je sa „ \ ” ozna ena operacija „razlika skupova”.

- Zbir doga aja. Zbir doga aja A i B , u oznaci A+B, predstavlja doga aj koji se realizuje u pojavi bar jednog od doga aja A ili B. Skup koji predstavlja doga aj A+B je skup .BA

Uopšte, zbir kona no mnogo doga aja A1, A2, ..., An, u oznaci n

i

iA1

,

predstavlja doga aj koji se realizuje u pojavi bar jednog od doga aja Ai,

(i=1,2,...,n). Skup koji predstavlja doga ajn

i

iA1

je skup n

i

iA1

.

Doga aji A1, A2, ..., An, ine potpun sistem doga aja ukoliko se bar jedan od

njih pojavi pri realizaciji eksperimenta, to jest ako važi .1

SAn

i

i

- Proizvod doga aja. Proizvod doga aja A i B, u oznaci BA , predstavljadoga aj koji se realizuje pojavom i doga aja A i doga aja B. Skup koji predstavlja doga aj BA , je skup .BA

Uopšte, proizvod kona no mnogo doga aja A1, A2, ..., An, u oznaci n

i

iA1

,

predstavlja doga aj koji se realizuje istovremenom pojavom svih doga aja Ai,

(i=1,2,...,n). Skup koji predstavlja doga ajn

i

iA1

, je skup n

i

iA1

.

Za doga aje A i B kažemo da se isklju uju (uzajamno isklju ivi doga aji,

nesaglasni doga aji) ako se ne mogu istovremeno dogoditi, odnosno ako je BA .

Uopšte, doga aji A1, A2, ... su uzajamno isklju ivi ako je ji AA za svako

i , j=1,2,..., i j.

Page 60: Poslovna statistika

Poslovna statistika

60

Ukoliko doga aji A1, A2, ..., An, ine potpun sistem doga aja i me usobno su

isklju ivi, onda doga aji A1, A2, ..., An, ine potpun sistem hipoteza prirealizaciji eksperimenta.

- Razlika doga aja. Razlika doga aja A i B , u oznaci A-B, predstavljadoga aj koji se realizuje kada se realizuje doga aj A i ne realizuje doga aj B.Skup koji predstavlja doga aj A-B, jeste skup .\ BA

Iz definicije razlike doga aja sledi __

BABA .

Primer 2.1.1. Obeležimo sa A doga aj da prilikom bacanja kockice za jamb padne paran broj ve i od 2, a sa B doga aj da padne broj ve i od 3.

Na i A+B, .,,,__

ABBABAA

Rešenje:

Kako je po uslovu zadatka 6,4A , a 6,5,4B , to je

6,4

5,3,2,1

6,5,4__

BA

A

BA

BA

.5AB

Page 61: Poslovna statistika

Poslovna statistika

61

2.2. Verovatno a

Kako je intuitivno jasno da se neki „slu ajni” doga aji javljaju eš e (ili re e)od nekih drugih „slu ajnih” doga aja, pojavila se potreba za uvo enjem odre ene mere koja bi na pravi na in predstavljala meru da se odre eni„slu ajni” doga aj desi. Ta mera, odnosno broj koji dodeljujemo odre enom „slu ajnom” doga aju, a koji predstavlja meru pojavljivanja tog doga aja,nazivamo verovatno om tog doga aja.

2.2.1. Definicija verovatno e

Za razne vrste doga aja definisale su se razne verovatno e, ali je 1933. godine ruski matemati ar A. N. Kolmogorov, postavio jednu sveobuhvatnu, tzv. aksiomatsku definiciju verovatno e, koja glasi:

- Aksiomatska definicija verovatno e. Neka je dat skup S. Funkcija P koja svaki podskup skupa S preslikava na skup R, za koju važi

Aksioma 1. 1SP (normiranost)

Aksioma 2. 0APSA (nenegativnost)

Aksioma 3. Ako su A1, A2, A3,... podskupovi iz S , takvi da važi

(i j) Ai Aj= , onda važi jednakost 11 i

i

i

i APAP .

(aditivnost) naziva se verovatno om na skupu S.

Ova aksiomatska definicija verovatno e je preambiciozna za nivo ovog udžbenika, pa je ne emo koristiti u našim izra unavanjima, ve emo verovatno u izra unavati ili na osnovu tzv. klasi ne definicije verovatno e (apriori verovatno a) ili na osnovu statisti ke definicije verovatno e (aposteriori verovatno a), u zavisnosti od prirode slu ajnog doga aja ijuverovatno u izra unavamo. Naravno, i klasi na i statisti ka definicija verovatno e su u saglasnosti sa aksiomatskom definicijom, odnosno predstavljaju njene specijalne slu ajeve.

Page 62: Poslovna statistika

Poslovna statistika

62

- Klasi na definicija verovatno e. Neka skup S sadrži njednakoverovatnih elementarnih doga aja. Ako skup A sadrži m elementarnih

doga aja, tada je verovatno a doga aja A, u oznaci P(A), jednaka n

mAP .

Elementarne doga aje koji odre uju doga aj A nazivamo povoljnim ishodima

za doga aj A.

Ova klasi na definicija se može koristiti kada su svi elementarni doga ajijednako verovatni i kada ih ima prebrojivo kona no mnogo. Zove se još i apriori verovatno a jer se može izra unati pre izvo enja statisti kogeksperimenta.

Primer 2.2.1.1. Na i verovatno u da prilikom bacanje kocke za jamb padne paran broj ve i od 2.

Rešenje:

Skup svih elementarnih doga aja je u ovom slu aju 6,5,4,3,2,1S , a traženi

doga aj, obeležimo ga sa A, odre en je slede im elementarnim doga ajima

6,4A , pa je verovatno a ovog doga aja .3

1

6

2)(AP

injenica da je za doga aje kod kojih se može primeniti klasi na definicija verovatno e, relativna frekvencija pojavljivanja odre enog doga aja u velikom broju eksperimenata veoma bliska verovatno i, omogu ava nam da pretpostavimo da i u opštem slu aju postoji neka konstanta oko koje se koleba relativna frekvencija pojavljivanja nekog „slu ajnog” doga aja. Prirodno je tu konstantu nazvati verovatno om, u ovom slu aju statisti kom verovatno om

posmatranog doga aja.

- Statisti ka definicija verovatno e. Ukoliko se prilikom velikog broja ponavljanja statisti kog eksperimenta zapazi da se relativna frekvencija doga aja A skoro za svaku veliku seriju eksperimenata samo neznatno razlikuje od neke (generalno nepoznate) konstante, kažemo da je ta konstanta statisti ka verovatno a doga aja A.

ebiševljev i Hin inov Zakon velikih brojeva, koji ovde ne emo izlagati, dozvoljava nam da statisti ku verovatno u doga aja A možemo dovoljno

Page 63: Poslovna statistika

Poslovna statistika

63

dobro oceniti relativnom frekvencijom pojavljivanja doga aja A u velikoj seriji statisti kih eksperimenata.

Dakle, ako je m broj pojavljivanja doga aja A u seriji od n statisti kiheksperimenata, onda je statisti ka verovatno a, P(A), približno jednaka

n

mAP )( ,

i važi slede e: 1)(lim0 APn

mPn .

Ova poslednja formula zna i da kada broj realizacije statisti kog eksperimenta teži u beskona nost, verovatno a da relativna frekvencija teži statisti koj

verovatno i, teži jedinici.

Statisti ka verovatno a se zove još i a posteriori verovatno a jer se izra unavaposle izvo enja statisti kog eksperimenta.

Primer 2.2.1.2. Proizvo a automobilskih guma je testirao izdržljivost svojih guma na pre enih 20.000 km. Od 150.000 ispitivanih guma, njih 900 nije izdržalo 20.000 km. Kolika je verovatno a da guma ovog proizvo a a ne izdrži put od 20.000 km.

Rešenje:

Na osnovu statisti ke definicije verovatno e, verovatno a da guma ovog

proizvo a a ne izdrži put od 20.000 km je .006.0150000

900

Page 64: Poslovna statistika

Poslovna statistika

64

2.2.2. Osobine verovatno e

Osobine verovatno e koje emo ovde prikazati su dokazive iz aksiomatske definicije verovatno e, ali ih ne emo dokazivati ve samo navesti.

Neka je dat skup elementarnih doga aja S i neka je na njemu definisana verovatno a P. Tada za SBA, važi slede e:

1. 1)(0 AP (Verovatno a je uvek broj izme u 0 i 1.)

2. P( )=0 (Verovatno a nemogu eg doga aja je 0.)

3. 1)()(__

APAP (Zbir verovatno a doga aja i njemu suprotnog

doga aja je 1.)

4. )()()()( BAPBPAPBAP (Verovatno a zbira dva

doga aja jednaka je zbiru verovatno a tih doga aja umanjenom za verovatno u proizvoda tih doga aja.)

Primer 2.2.2.1. Neka su A i B doga aji kod kojih je verovatno a P(A) = 0.45, P(B) = 0.30, a P(AB) = 0.25. Na i verovatno u da se dogodi bar jedan od doga aja A i B.

Rešenje:

Doga aj da se dogodi bar jedan od doga aja A i B je doga aj A+B, pa

je verovatno a tog doga aja jednaka

5.025.030.045.0)()()()( BAPBPAPBAP

5. )()()( BAPAPBAP (Verovatno a doga aja „A

razlika B” jednaka je razlici verovatno e doga aja A i doga aja

BA .)

Page 65: Poslovna statistika

Poslovna statistika

65

Primer 2.2.2.2. Neka su A i B doga aji kod kojih je verovatno a P(A) = 0.45, P(B) = 0.30, a P(AB) = 0.25. Na i verovatno u da se dogodi doga aj A a ne dogodi doga aj B.

Rešenje:

Doga aj da se dogodi doga aj A a ne dogodi doga aj B, je doga aj

A-B, pa je verovatno a tog doga aja jednaka

20.025.045.0)()()( BAPAPBAP .

6. Uslovna verovatno a. Uslovna verovatno a doga aja A, pod uslovom

da se dogodio doga aj B, P(B) 0, ozna ava se sa P(A B) i definiše sa

P(A B)=)(

)(

BP

BAP.

Primer 2.2.2.3. Neka su A i B doga aji kod kojih je verovatno a P(A) = 0.45, P(B) = 0.30, a P(AB) = 0.25. Na i verovatno u da se dogodi doga aj A pod uslovom da se dogodio doga aj B.

Rešenje:

Verovatno a da se dogodi doga aj A pod uslovom da se dogodio

doga aj B iznosi

P(A B)= .83.030.0

25.0

)(

)(

BP

BAP

7. Nezavisnost doga aja. Za doga aje A i B kažemo da su nezavisni ako

je

)()()( BPAPBAP .

O igledno da za ove doga aje važi

Page 66: Poslovna statistika

Poslovna statistika

66

P(A B)= )()(

)()(

)(

)(AP

BP

BPAP

BP

BAP.

Primer 2.2.2.4. Neka su A i B doga aji kod kojih je verovatno a P(A) = 0.45, P(B) = 0.30, a P(AB) = 0.25. Da li su doga aji A i B nezavisni doga aji?

Rešenje:

Kako je

25.0)(

135.030.045.0)()(

BAP

BPAP

to je

)()()( BPAPBAP ,

pa ovi doga aji nisu nezavisni.

8. Formula totalne verovatno e. Ako H1, H2, ..., Hn ine potpun sistem

hipoteza u odnosu na doga aj A, tada je

n

i

AP1

)( P(A Hi) P(Hi).

Primer 2.2.2.5. etiri kooperanta proizvode jedan deo nekog aparata. Kooperant A podmiruje 30% potreba, B 20% a C i D po 25 % potreba. Uo eno je da kooperant A šalje fabrici 10% neispravnih delova, B 15%, C 5% i D 8% neispravnih delova. Na i verovatno u da je u slu ajnoizabrani aparat ugra en neispravan deo.

Rešenje:

Ozna imo sa

A – doga aj ugra eni deo je od kooperanta A;B – doga aj ugra eni deo je od kooperanta B;

Page 67: Poslovna statistika

Poslovna statistika

67

C – doga aj ugra eni deo je od kooperanta C;D – doga aj ugra eni deo je od kooperanta D.

N – ugra eni deo je neispravan.

Sada je po uslovu zadatka

P(A)=0.3 P(N A)=0.1

P(B)=0.2 P(N B)=0.15

P(C)=0.25 P(N C)=0.05

P(D)=0.25 P(N D)=0.08

pa je

P(N)= P(A) P(N A)+ P(B) P(N B)+ P(C) P(N C)+ P(D) P(N D)=

0.3 0.1+0.2 0.15+0.25 0.05+0.25 0.08=0.0925.

Verovatno a da je ugra eni deo neispravan je 0.0925.

9. Bajesova formula. Ako H1, H2, ..., Hn ine potpun sistem hipoteza u

odnosu na doga aj A, i neka je P(A) 0, tada za i=1, 2, ..., n važi

P(Hi A)=n

j

jj

iiii

HHP

HHP

AP

HHP

1

)P(A)(

)P(A)(

)(

)P(A)(.

Primer 2.2.2.6. Ako je u prethodnom, Primeru 2.2.2.5, uo eno da je ugra en neispravan deo, kolika je verovatno a da taj neispravni deo poti e od kooperanta B?

Rešenje:

Po uslovu zadatka važi

P(B N)= .32.00925.0

15.02.0

)(

)P(N)(

NP

BBP

Verovatno a da neispravni deo poti e od kooperanta B je 0.32.

Page 68: Poslovna statistika

Poslovna statistika

68

2.2.3. Elementi kombinatorike

Prilikom odre ivanja verovatno e klasi nom definicijom potrebno je prebrojati doga aje, pri emu se esto koristimo kombinatorikom. Sve kombinatorne formule mogu se izvesti iz dva osnovna pravila: pravila

zbira i pravila proizvoda.

- Pravilo zbira. Ako se predmet jedne vrste može izabrati na n1 na ina,predmet druge vrste na n2 na ina, ..., predmet k-te vrste na nk na ina, onda se jedan predmet bez obzira na vrstu može izabrati na n1+n2+...+nk razli itihna ina.

- Pravilo proizvoda. Ako se predmet jedne vrste može izabrati na n1 na ina,predmet druge vrste na n2 na ina, ..., predmet k-te vrste na nk na ina, onda se kpredmeta razli ite vrste (odnosno iz svake vrste po jedan predmet) može izabrati na n1 n2 ... nk razli itih na ina.

Primer 2.2.3. Na prvoj godini studija ima 250 devojaka i 220 muškaraca. Na koliko razli itih na ina možemo izabrati jednog studenta sa ove godine, a na koliko razli itin na ina možemo izabrati plesni par na ovoj godini?

Rešenje:

Jednog studenta možemo izabrati na 250+220=470 razli itih na ina.

Jedan plesni par možemo izabrati na 250 220=55 000 razli itih na ina.

Page 69: Poslovna statistika

Poslovna statistika

69

2.2.3.1. Varijacije od n elemenata k-te klase

- Varijacije od n elemenata k-te klase bez ponavljanja k

nV (k<n)

Varijacije od n elemenata k-te klase bez ponavljanja, k

nV (k<n),

predstavljaju broj koji pokazuje na koliko se razli itih na ina može iz jednog osnovnog skupa od n razli itih elemenata izabrati k puta pojedan element, ali tako da se posle svakog izbora izabrani element nevra a u osnovni skup i ne u estvuje u slede em izboru.

Neka je, na primer, osnovni skup od n 4 elemenata skup

naaa ,...,, 21 .

Jedna njegova varijacija 4-te klase bez ponavljanja je, na primer, a1,a2,a3,a4, druga a2,a1,a3,a4, tre a a1,a2,a3,an, itd.

Formulu za broj k

nV emo dobiti slede im rasu ivanjem.

U prvom izboru imamo n mogu nosti, u drugom n-1 mogu unost, u tre em n-2 mogu nosti, ..., u k-tom n-k+1 mogu nost, to je po pravilu proizvoda:

121 knnnnV k

n .

- Varijacije od n elemenata k-te klase sa ponavljanjem k

nV__

Varijacije od n elemenata k-te klase sa ponavljanjem, k

nV__

, predstavljaju broj koji pokazuje na koliko se razli itih na ina može iz jednog osnovnog skupa od n razli itih elemenata izabrati k puta po jedan element, ali tako da se posle svakog izbora izabrani element vra a uosnovni skup i ravnopravno u estvuje u slede em izboru.

Neka je, na primer, osnovni skup od n 4 elemenata skup

naaa ,...,, 21 .

Page 70: Poslovna statistika

Poslovna statistika

70

Jedna njegova varijacija 4-te klase sa ponavljanjem je, na primer, a1,a1,a3,a4, druga a2,a1,a3,a1, tre a a1,a2,a3,an , itd.

Formulu za broj k

nV__

dobi emo slede im rasu ivanjem.

Kako je pri svakom izboru sastav osnovnog skupa isti i sadrži nrazli itih elemenata, to pri svakom izboru imamo n mogu nosti za izbor, pa je po pravilu proizvoda

k

k

k

n nnnnV ...__

.

Primer 2.2.3.1. U jednom odeljenju u kome se nalazi 30 u enika,biramo predsednika, sekretara i blagajnika. Na koliko razli itih na inato možemo da u inimo ukoliko:

a) jedna osoba može da obavlja više funkcija; b) jedna osoba može da obavlja samo jednu

funkciju?

Rešenje:

a)

Kako jedna osoba može da obavlja više od jedne funkcije, to u ovom

slu aju iz skupa od 30 elemenata biramo 3, ali sa ponavljanjem, pa je

broj na ina

33

30

__

30V .

b)

Kako jedna osoba ne može da obavlja više od jedne funkcije, to u ovom

slu aju iz skupa od 30 elemenata biramo 3, ali bez ponavljanja, pa je

broj na ina

282930330V .

Page 71: Poslovna statistika

Poslovna statistika

71

2.2.3.2. Permutacije od n elemenata

- Permutacije od n elemenata bez ponavljanja, Pn

Permutacije od n elemenata bez ponavljanja, Pn, predstavljaju broj koji pokazuje na koliko se razli itih na ina može razmestiti svih n razli itihelemenata osnovnog skupa.

Neka je, na primer, osnovni skup od n = 4 elemenata skup .,,, 4321 aaaa

Jedna njegova permutacija bez ponavljanja je, na primer, a1,a2,a3,a4,

druga a2,a1,a3,a4, tre a a1,a2,a4,a3, itd. Lako je zaklju iti da je taj broj jednak broju varijacija od n elemenata n-te klase bez ponavljanja, n

nV = n!.

Dakle Pn=n!.

Primer 2.2.3.2.1. Na polici se nalazi 15 razli itih knjiga. Na koliko razli itih na ina ih možemo razmestiti?

Rešenje:

Broj razli itih razmeštaja 15 razli itih knjiga na polici je jednak broju permutacija od 15 elemenata bez ponavljanja, P15=15!.

- Permutacije od n elemenata sa ponavljanjem, n

nnn kP ,...,, 21

Neka odre eni skup ima n elemenata, takvih da me u njima ima krazli itih vrsta. Neka i- ta vrsta (i = 1, 2, ..., k) sadrži ni elemenata koji se, naravno, me usobno ne razlikuju. O igledno da tada važi n=n1+n2+...+nk.

Permutacije od n elemenata sa ponavljanjem jednog ovakvog skupa, obeležavaju se sa n

nnn kP ,...,, 21

i predstavljaju broj koji pokazuje na koliko

razli itih na ina možemo ovakav skup od n elemenata da rasporedimo na n mesta.

Page 72: Poslovna statistika

Poslovna statistika

72

Neka je, na primer, osnovni skup od n elemenata skup koji se sastoji od dve vrste elemenata, i a-ova i n – i b-ova,

ini

bbbaaa ,...,,,,...,, .

Jedna njegova permutacija sa ponavljanjem je, na primer,

ini

bbbaaa ,...,,,,..., , druga abbbaaa

ini

,,...,,,,...,,1

, itd.

Formulu za broj n

nnn kP ,...,, 21

dobi emo slede im rasu ivanjem.

Kada bi svih n elemenata bilo me usobno razli ito, broj razli itihrazmeštaja ovakvog skupa predstavljao bi broj permutacija od nelemenata bez ponavljanja, odnosno !.nPn

Kako se u našem slu aju elementi iste vrste ne razlikuju, to se rasporedi koji se dobijaju permutovanjem elemenata iste vrste tako e ne erazlikovati. Broj takvih rasporeda je prema pravilu proizvoda n1! n2!nk!, pa tako e prema pravilu proizvoda važi

n1! n2! nk!n

nnn kP ,...,, 21

= n! ,

odakle sledi da je traženi broj na ina rasporeda elemenata ovakvog skupa

.!!!

!

21,...,, 21

k

n

nnnnnn

nP

k

Primer 2.2.3.2.2. U kutiji se nalazi 5 plavih, 3 žute i 4 crvene kuglice. Svih 12 kuglica raspore ujemo u red. Koliko ima razli itih rasporeda?

Rešenje:

Broj razli itih rasporeda iznosi .!3!4!5

!12124,3,5P

Page 73: Poslovna statistika

Poslovna statistika

73

2.2.3.3. Kombinacije od n elemenata k-te klase

- Kombinacije od n elemenata k-te klase bez ponavljanja, k

nC (k<n)

Kombinacije od n elemenata k-te klase bez ponavljanja, k

nC (k<n),

predstavljaju broj koji pokazuje koliko se razli itih podskupova od kelemenata mogu izabrati iz jednog osnovnog skupa od n razli itihelemenata, gde se elementi u podskupu ne mogu ponavljati.

Neka je, na primer, osnovni skup od n 4 elemenata skup

naaa ,...,, 21 .

Jedna njegova kombinacija 4-te klase bez ponavljanja je, na primer, skup 4321 ,,, aaaa , druga skup naaaa ,,, 321 , tre a nn aaaa ,,, 121

itd.

Formulu za broj k

nC dobi emo slede im rasu ivanjem.

Ako bismo elemente svakog takvog podskupa od k elementa permutovali, ukupan broj svih takvih permutacija po svim takvim podskupovima bio bi jednak broju varijacija od n elemenata k-te klase bez ponavljanja )( k

nV . Kako je broj permutacija po jednom takvom

podskupu od k elemenata jednak k!, a broj takvih podskupova jednak k

nC , to po pravilu proizvoda važi:

k

n

k

n VkC ! , pa je

k

n

k

knnnn

k

VC

k

nk

n !

121

!.

Page 74: Poslovna statistika

Poslovna statistika

74

Izrazk

n se naziva binomni koeficijent i važi:

.0;10

;;!!

!

k

nnk

n

nn

kn

n

k

n

knk

n

k

n

Primer 2.2.3.3.1. U jednom odeljenju nalazi se 30 u enika. Pod pretpostavkom da svi znaju da igraju preferans, koliko razli itih ekipa za igranje preferansa možemo imati u ovom odeljenju? (Preferans je kartaška igra koju igraju samo tri igra a.)

Rešenje:

U ovom odeljenju ima !3

282930

3

30330C mogu ih razli itih

ekipa za igranje preferansa.

- Kombinacije od n elemenata k-te klase sa ponavljanjem,k

nC__

Kombinacije od n elemenata k-te klase sa ponavljanjem, k

nC__

,predstavljaju broj koji pokazuje koliko se razli itih podskupova od kelemenata mogu izabrati iz jednog osnovnog skupa od n razli itihelemenata, gde se elementi u podskupu mogu ponavljati.

Neka je, na primer, osnovni skup od n 4 elemenata skup

naaa ,...,, 21 .

Page 75: Poslovna statistika

Poslovna statistika

75

Jedna njegova kombinacija 4-te klase sa ponavljanjem je, na primer, skup 4321 ,,, aaaa , druga skup 4311 ,,, aaaa , tre a 1111 ,,, aaaa ,

itd.

Formulu za broj k

nC__

dobi emo slede om analogijom.

Neka je osnovni skup od n elemenata skup naaa ,...,, 21 .

Zamislimo da smo u jednoj dubokoj kutiji postavili n – 1 pregradu, kao na slici 2.2.3.3.

Slika 2.2.3.3.

Tih n – 1 pregrada odre uju n nezavisnih prostora, koje smo obeležili slovima a1, a2, ..., an. Zamislimo da u tako pregra enu kutiju ubacujemo k kuglica. Tih k kuglica e se nekako rasporediti u ovih n prostora.

Zabeležimo te rasporede na slede i na in: ako su na primer 4 kuglice pale u prostor a1 a preostalih k – 4 kuglica u prostor an-2 , onda takav raspored obeležimo slede im podskupom od k elemenata

4

2221111 ,...,,,,,,k

nnn aaaaaaa .

1 2 n-2 n-1 pregrada

a1 a2 an-1 an

Page 76: Poslovna statistika

Poslovna statistika

76

Ovo upravo i jeste jedan podskup od k elemenat izabran iz osnovnog skupa od n elemenata sa ponavljanjem. Ukupan broj svih rasporeda uba enih k kuglica u ovako pregra enu kutiju i ovako zabeleženih, predstavlja ukupan broj svih podskupova od k elemenata izabranih iz osnovnog skupa naaa ,...,, 21 , dakle predstavlja broj kombinacija od n

elemenata k-te klase sa ponavljanjem.

Sa druge strane, ukupan broj svih rasporeda uba enih k kuglica u ovako pregra enu kutiju, jednak je broju razli itih rasporeda k kuglica i n – 1

pregrade, odnosno jednak je broju permutacija sa ponavljanjem skupa koji sadrži k+n-1 element od kojih su k iste vrste (kuglice) i n – 1 istevrste (pregrade), a to je, kao što smo ranije pokazali:

k

kn

nk

knP nk

nk

1

!1!

!111, .

Dakle, važi

k

kn

nk

knPC nk

nk

k

n

1

!1!

!111,

__

.

Primer 2.2.3.3.2. Osmoro ljudi ulazi u zgradu koja ima etiri ulaza. Na koliko razli itih na ina oni mogu u i u zgradu u smislu broja ljudi koji ulaze na razli itim ulazima?

Rešenje:

Obeležimo svaku osobu koja u e na i-tom ulazu (i=1,2,3,4) brojem i.

Ovim na inom dobijamo nizove dužine osam od etiri elementa. Na

primer, ako su tri osobe ušle na prvom ulazu, a pet na tre em, dobijamo

slede i niz dužine osam 1,1,1,3,3,3,3,3. Kako redosled ne igra nikakvu

ulogu i brojevi se ponavljaju, dobijeni nizovi ine broj kombinacija od

etiri elementa osme klase sa ponavljanjem, kojih ima

.8

11

8

1848

4

___

C

Page 77: Poslovna statistika

Poslovna statistika

77

3. RASPODELE SLU AJNIH PROMENLJIVIH

U mnogim statisti kim eksperimentima elementarni doga aji su sami po sebi realni brojevi, kao u našem primeru bacanja kockice za jamb. Naravno, postoje i statisti ki eksperimenti kod kojih elementarni doga aji nisu realni brojevi.

Na primer, ako prilikom bacanja dva nov i a sa „G” obeležimo da se na posmatranom nov i u pojavila „glava” a sa „P” – „pismo”, skup svih elementarnih doga aja ovog eksperimenta je ),(),,(),,(,, PPGPPGGGS

gde, kao što vidimo, elementarni doga aji nisu realni brojevi.

Radi lakše analize u oblasti verovatno e, veoma je poželjno da sve elementarne doga aje izražavamo pomo u realnih brojeva, koji e samim tim sadržavati i informaciju o verovatno i pojavljivanja elementarnih doga aja koje predstavljaju.

Zbog toga je potrebno po nekom pravilu od interesa, u datoj situaciji preslikati skup svih elementarnih doga aja na skup realnih brojeva tako da se svaki elementarni doga aj iz skupa svih mogu ih ishoda preslika u jedan realan broj, kome se pridružuje verovatno a jednaka zbiru verovatno a pojavljivanja svih elementarnih doga aja koji se u njega slikaju (svih originala).

Neka u našem interesu to pravilo preslikavanja bude zadato sa „broj

pojavljivanja „pisma” u bacanju dva nov i a”. Tada se elementarni doga aj(G,G) preslikava u 0, (G,P) i (P,G) u 1, a (P,P) u 2, pa se itav skup S na ovaj na in preslikava na skup 2,1,0 . Nazovimo taj skup X.

Dakle, tada je

2,1,0),(),,(),,(,, XPPGPPGGGS pismabroj

i važi:

.4

1,()2(

2

1

4

1

4

1),((),(()),(),,(()1(

4

1)),(()0(

PPPXP

GPPPGPGPPGPXP

GGPXP

Page 78: Poslovna statistika

Poslovna statistika

78

Upravo se jedno ovakvo preslikavanje skupa svih elementarnih doda aja zoveslu ajna promenljiva.

- Slu ajna promenljiva

Slu ajna promenljiva je funkcija koja svaki elementarni doga aj statisti kogeksperimenta preslikava u jedan realan broj, kome se pridružuje verovatno ajednaka zbiru verovatno a pojavljivanja svih elementarnih doga aja koji se u njega slikaju.

Skup svih realnih brojeva na koji se slika skup svih elementarnih doga aja (S)obeležavamo velikim slovima X , Y , Z , ..., i vrlo esto se sam taj skup svih slika slu ajne promenljive naziva, tako e, slu ajna promenljiva. Ovaj naziv je veoma odoma en u našoj i stranoj literaturi, tako da emo ga i mi koristiti. Konkretne realizacije slu ajne promenljive obeležava emo malim slovima x, y,

z, ..., tako da kad napišemo X = x, to zna i da je slu ajna promenljiva X uzelavrednost x.

U našem primeru slu ajna promenljiva je 2,1,0X , a njene konkretne

realizacije su .2,1,0 321 xxx

Slu ajna promenljiva može biti diskretna i neprekidna.

- Diskretna slu ajna promenljiva. Ako slu ajna promenljiva uzima kona anbroj vrednosti ili prebrojivo beskona an broj vrednosti, onda se ona naziva diskretna slu ajna promenljiva.

Naš malopre ašnji primer je primer diskretne slu ajne promenljive, jer slu ajnapromenljiva uzima kona an broj vrednosti – tri vrednosti.

- Neprekidna slu ajna promenljiva. Ako slu ajna promenljiva može da uzme bilo koju vrednost iz nekog intervala vrednosti, onda se ona naziva neprekidna

slu ajna promenljiva.

Primer neprekidne slu ajne promenljive je, recimo, slu ajna promenljiva visina ljudi na našoj planeti. Ta slu ajna promenljiva je neprekidna jer može uzeti bilo koju vrednost iz, recimo, intervala (30 cm-250 cm).

Page 79: Poslovna statistika

Poslovna statistika

79

3.1. Raspodele diskretnih slu ajnih promenljivih

Diskretna slu ajna promenljiva je potpuno definisana ako je data njena raspodela verovatno a ili njena funkcija raspodele verovatno a.

- Raspodela verovatno a diskretne slu ajne promenljive. Ako slu ajnapromenljiva X može da uzme kona an broj vrednosti x1, x, ..., xn sa

verovatno ama p1, p2,..., pn, , gde je 11

n

i

ip , onda skup parova brojeva

nixXPpx iii ,...,2,1,)(, , odnosno šematski prikaz

n

i

i

n

np

ppp

xxxX

121

21 1,...

....

predstavlja raspodelu verovatno e slu ajne promenljive X.

Ukoliko slu ajna promenljiva X može da uzme beskona an broj vrednosti x1, x,

..., xn, ... sa verovatno ama p1, p2, ..., pn, ..., gde je 11i

ip , onda skup parova

brojeva nixXPpx iii ,...,2,1,)(, ,... odnosno šematski prikaz

121

21 1,...

...

i

i

n

np

ppp

xxxX ,

predstavlja raspodelu verovatno e slu ajne promenljive X.

Raspodela verovatno e slu ajne promenljive X grafi ki se može predstaviti poligonom raspodela verovatno e ili dijagramom raspodela verovatno e.

- Poligon raspodela verovatno e. Poligon raspodela verovatno e se dobija spajanjem ta aka (xi, pi) i=1,2,...,n u koordinatnom sistemu na ijoj apscisi se nanose vrednosti xi slu ajne promenljive X, a na ordinati odgovaraju everovatno e pi, kao na slici 3.1.1.

Page 80: Poslovna statistika

Poslovna statistika

80

Slika 3.1.1. Poligon raspodele verovatno a

- Dijagram raspodela verovatno e. Dijagram raspodela verovatno e dobijase spajanjem ta aka (xi,0) i (0, pi) i=1,2,...,n u koordinatnom sistemu na ijoj se apscisi nanose vrednosti xi slu ajne promenljive X, a na ordinati odgovaraju everovatno e pi, kao na slici 3.1.2.

Slika 3.1.2. Dijagram raspodele verovatno a

x1 x2 .... xn-1 xn xi

pi

p2

pn-1

p1

pn

x1 x2 .... xn-1 xn xi

pi

p2

pn-1

p1

pn

Page 81: Poslovna statistika

Poslovna statistika

81

Primer 3.1.1. Na i raspodelu verovatno a slu ajne promenljive „broj

pojavljivanja „pisma” u bacanju dva nov i a” i predstaviti poligon i dijagram raspodele.

Rešenje:

Kao što je ranije analizirano, raspodela verovatno e ove slu ajne

promenljive, koju smo obeležili sa X, je

4

1

2

1

4

1

210X .

Poligon raspodele verovatno a je dat na slici 3.1.3.a.

Slika 3.1.3.a. Poligon raspodele

Dijagram raspodele verovatno a dat je na slici 3.1.3.b.

0 1 2 xi

pi

0.5

0.25

Page 82: Poslovna statistika

Poslovna statistika

82

Slika 3.1.3.b. Dijagram raspodele

- Funkcija raspodele verovatno a diskretne slu ajne promenljive. Akoslu ajna promenljiva X može da uzme kona an broj vrednosti x1, x,..., xn sa

verovatno ama p1, p2, ..., pn , gde je 11

n

i

ip , ili beskona an broj vrednosti x1,

x, ..., xn, ..., sa verovatno ama p1, p2, ..., pn, ... , gde je 11i

ip , onda

verovatno a da ta slu ajna promenljiva bude manja od neke realne vrednosti x,predstavlja vrednost funkcije raspodele verovatno a te slu ajne promenljive u ta ki x i obeležava se sa F(x).

Dakle, funkcija raspodele verovatno a F(x) slu ajne promenljive X je realna funkcija )(xFx , definisana sa:

.),()( xxXPxF

(Napomena. U nekim udžbenicima funkcija raspodele verovatno a definiše se kao ).()( xXPxF )

Iz definicije funkcije raspodele F(x), zaklju ujemo da važi slede e:

0 1 2 xi

pi

0.5

0.25

Page 83: Poslovna statistika

Poslovna statistika

83

ixx

ipxF )( ,

odnosno

xx

xxxppp

xxxpp

xxxp

xx

xF

n

nnn

1

0

)(

1121

3221

211

1

.

Grafi ka predstava funkcije raspodele verovatno a data je na slici 3.1.4.

Slika 3.1.4. Funkcija raspodele verovatno a

Neke od osobina funkcije raspodele verovatno a diskretne slu ajnepromenljive su:

Osobina 1. Funkcija raspodele verovatno a diskretne slu ajnepromenljive je prekidna funkcija, ije su ta ke prekida upravo one vrednosti koje slu ajna promenljiva može uzeti sa odre enim verovatno ama. U tim

F(x)

1 1

1

n

i

ip

p1+p2

p1

0x1 x2 x3 xn-1 xn x

Page 84: Poslovna statistika

Poslovna statistika

84

ta kama prekida, ovako definisana funkcija raspodele verovatno a je neprekidna sa leve strane, a prekidna sa desne.

Osobina 2. Oblast definisanosti ove funkcije je itav skup R i važi:

1)(0

1)(lim

0)(lim

xFRx

xF

xF

x

x

Osobina 3. Funkcija raspodele diskretne slu ajne promenljive je neopadaju a funkcija, tj. važi

)()(),( bFaFbaRba .

Primer 3.1.2. Na i funkciju raspodele verovatno a slu ajnepromenljive „broj pojavljivanja „pisma” u bacanju dva nov i a” i predstaviti je grafi ki.

Rešenje:

Na osnovu definicije, funkcija raspodele verovatno a ove slu ajne

promenljive je

x

x

x

x

xF

21

214

3

104

1

00

)( .

Page 85: Poslovna statistika

Poslovna statistika

85

Grafik ove funkcije raspodele verovatno a dat je na slede oj slici 3.1.5.

3.1.1. Parametri diskretnih slu ajnih promenljivih

Kao što smo rekli, raspodela verovatno a diskretne slu ajne promenljive ili funkcija raspodele verovatno a diskretne slu ajne promenljive, u potpunosti opisuju slu ajnu promenljivu. Me utim, u mnogim slu ajevima nije neophodno opisati slu ajnu promenljivu potpuno, ve je dovoljno ukazati na pojedine parametre koji u odre enoj meri karakterišu bitne osobine analizirane raspodele.

Kao i u slu aju deskriptivne statisti ke analize, ti parametri se mogu svrstati u tri grupe:

- parametri srednje vrednosti (mere srednje vrednosti ili centralne tendencije);

- parametri varijabiliteta (mere disperzije); - parametri oblika rasporeda (mere oblika rasporeda).

1 2 xSlika 3.1.5. Funkcija raspodele verovatno a

F(x)

1

0.75

0.25

Page 86: Poslovna statistika

Poslovna statistika

86

Parametri prve grupe reprezentuju centar rasturanja vrednosti slu ajnepromenljive, parametri druge grupe mere vrednost tog rasturanja oko centra rasturanja, a parametri tre e grupe ukazuju na oblik rasturanja posmatrane raspodele.

3.1.1.1. Parametri centralne tendencije diskretne slu ajnepromenljive

Parametri centralne tendencije diskretne slu ajne promenljive koje emo mi navesti su matemati ko o ekivanje, modus i medijana.

- Matemati ko o ekivanje. Matemati ko o ekivanje diskretneslu ajne promenljive X esto se naziva i srednja vrednost slu ajnepromenljive X. Mi ga obeležavamo sa E(X) i odre ujemo ga na slede ina in:

ako slu ajna promenljiva X može da uzme kona an broj vrednosti x1,

x,..., xn sa verovatno ama p1, p2, ..., pn, , gde je 11

n

i

ip , onda njeno

matemati ko o ekivanje uvek postoji i jednako je

.)(1

n

i

ii pxXE

Ako slu ajna promenljiva X može da uzme beskona an broj vrednosti

x1, x, ..., xn, ... sa verovatno ama p1, p2, ..., pn, ..., , gde je 11i

ip ,

onda

i) ukoliko red 1i

ii px konvergira, matemati ko o ekivanje te

slu ajne promenljive postoji i jednako je 1

)(i

ii pxXE ;

ii) ukoliko red 1i

ii px divergira, matemati ko o ekivanje te

slu ajne promenljive ne postoji.

Page 87: Poslovna statistika

Poslovna statistika

87

Matemati ko o ekivanje se još naziva i moment prvog reda diskretneslu ajne promenljive. U opštem slu aju moment k-tog reda diskretneslu ajne promenljive X ozna avamo sa mk(X) i nalazimo po formuli

n

i

i

k

ik pxXm1

)(

odnosno

1

)(i

i

k

ik pxXm ukoliko red 1i

i

k

i px konvergira.

- Modus. Modus diskretne slu ajne promenljive X obeležavamo sa Mo(X) i ona predstavlja najverovatniju vrednost (ukoliko je unimodalna raspodela) ili najverovatnije vrednosti (ukoliko je polimodalna raspodela) diskretne slu ajne promenljive X. Zna i Mo(X)

predstavlja vrednosti slu ajne promenljive X u kojima raspodela verovatno a te slu ajne promenljive P(X=x) ima maksimum.

- Medijana. Medijanu diskretne slu ajne promenljive X obeležavamo sa Me(X) i ona predstavlja sve one vrednosti slu ajne promenljive X za koje važi slede e:

.5.0))((5.0))(( XMXPXMXP ee

Primer 3.1.1.1. Na i matemati ko o ekivanje, modus i medijanu slu ajne promenljive „broj pojavljivanja „pisma” u bacanju dva

nov i a”.

Rešenje:

Kao što je ranije analizirano, raspodela verovatno e ove slu ajne

promenljive, koju smo obeležili sa X, je

4

1

2

1

4

1

210X ,

Page 88: Poslovna statistika

Poslovna statistika

88

pa je:

matemati ko o ekivanje

14

12

2

11

4

10)(

3

1i

ii pxXE .

Modus iznosi

Mo(X) = 1

jer samo za X=1 raspodela verovatno a ima maksimum 2

1)1(XP .

Medijana iznosi

Me(X) = 1

jer samo za X = 1 važi slede e:

.5.04

3

2

1

4

1)1()0()1(

5.04

1)0()1(

XPXPXP

XPXP

Primer 3.1.1.2. Na i medijanu slu ajne promenljiva X ija je raspodela

verovatno a .

4

1

4

1

4

1

4

1

3210X

Rešenje:

Medijana ove slu ajne promenljive je bilo koji broj iz zatvorenog

intervala 2,1 , odnosno Me(X) 2,1 .

Naime, za Me(X)=1 važi:

Page 89: Poslovna statistika

Poslovna statistika

89

.5.02

1

4

1

4

1)1()0()1(

5.04

1)0()1(

XPXPXP

XPXP

Za Me(X) (1,2) važi:

.5.02

1

4

1

4

1)1()0()(

5.02

1

4

1

4

1)1()0()(

XPXPMXP

XPXPMXP

e

e

Za Me(X)=2 važi:

.5.04

3

4

1

4

1

4

1)2()1()0()2(

5.02

1

4

1

4

1)1()0()2(

XPXPXPXP

XPXPXP

Page 90: Poslovna statistika

Poslovna statistika

90

3.1.1.2. Parametri varijabiliteta diskretne slu ajne promenljive

Parametri varijabiliteta diskretne slu ajne promenljive koje emo mi navesti su varijansa i standardna devijacija, kao apsolutne mere varijabiliteta diskretne slu ajne promenljive, i koeficijent varijacije,kao relativna mera varijabiliteta diskretne slu ajne promenljive.

- Varijansa. Varijansu diskretne slu ajne promenljive X obeležavamo sa var(X), ili 2

(X) i odre ujemo na slede i na in:

ako slu ajna promenljiva X može da uzme kona an broj vrednosti x1,

x, ..., xn sa verovatno ama p1, p2, ..., pn, gde je 11

n

i

ip , onda njena

varijansa uvek postoji i jednaka je

.)()(1

22n

i

ii pXExX

Ako slu ajna promenljiva X može da uzme beskona an broj vrednosti

x1, x, ..., xn, ... sa verovatno ama p1, p2, ..., pn, ..., gde je 11i

ip , onda

i) ukoliko red 1

2)(i

ii pXEx konvergira, varijansa te

slu ajne promenljive postoji i jednaka je

1

22 )()(i

ii pXExX ;

ii) ukoliko red 1

2)(i

ii pXEx divergira, varijansa te slu ajne

promenljive ne postoji.

Varijansa diskretne slu ajne promenljive još se naziva i centralni

moment drugog reda. U opštem slu aju, centralni moment k-tog reda

diskretne slu ajne promenljive X ozna avamo sa Mk(X) i nalazimo po formuli

n

i

i

k

ik pXExXM1

)()( ,

Page 91: Poslovna statistika

Poslovna statistika

91

odnosno

1

)()(i

i

k

ik pXExXM

ukoliko red 1

)(i

i

k

i pXEx konvergira.

Iz same definicije varijanse jasno je da važi

.)()( 22 XEXEX

Kako važi slede e:

212

2222

1

2

11

2

1

2

)()()()()(2)(

)()(2)(

mmXEXEXEXEXEXE

pXEpxXEpxpXExn

i

i

n

i

ii

n

i

ii

n

i

ii

to varijansu možemo izra unavati i pomo u tzv. radne formule

.)()()()()( 212

222 XmXmXEXEX

- Standardna devijacija. Standardnu devijaciju diskretne slu ajnepromenljive X obeležavamo sa st. dev. (X) ili sa (X) i izra unavamo po formuli

)var().(. XXdevst odnosno .)()( 2 XX

Page 92: Poslovna statistika

Poslovna statistika

92

- Koeficijent varijacije. Koeficijent varijacije diskretne slu ajnepromenljive X obeležavamo sa Cv(X) i izra unavamo po formuli

)(

)()(

XE

XXCv .

Ako ga želimo izraziti u procentima, obeležavamo ga sa Cv(X)% i izra unavamo po formuli

%.100)(

)()%(

XE

XXCv

Page 93: Poslovna statistika

Poslovna statistika

93

3.1.1.3. Parametri oblika rasporeda diskretne slu ajne promenljive

Parametri oblika rasporeda diskretne slu ajne promenljive su merasimetrije i mera spljoštenosti slu ajne promenljive.

Mera simetrije se izražava pomo u koeficijenta simetrije, dok se mera spljoštenosti izražava pomo u koeficijenta spljoštenosti. I jedan i drugi koeficijent se izra unavaju pomo u centralnih momenata.

- Koeficijent simetrije slu ajne promenljive X ozna avamo sa 3(X) i izra unavamo po formuli:

33

3)(

)()(

X

XMX .

Ukoliko je:

3(X)=0 zaklju ujemo da je raspodela vrednosti obeležja simetri na. Tada je tako e )()()( XMXMXE oe ;

3(X) 0 zaklju ujemo da je raspodela vrednosti obeležja pozitivno asimetri na (asimetrija udesno). Tada je tako e

)()()( XMXMXE oe ;

3(X) 0 zaklju ujemo da je raspodela vrednosti obeležja negativno asimetri na (asimetrija ulevo). Tada je tako e

)()()( XMXMXE oe .

- Koeficijent spljoštenosti slu ajne promenljive X ozna avamo sa 4(X) i izra unavamo po formuli:

Page 94: Poslovna statistika

Poslovna statistika

94

44

4)(

)()(

X

XMX .

Ukoliko je:

4(X)=3 zaklju ujemo da je raspodela vrednosti obeležja normalno spljoštena;

4(X) 3 zaklju ujemo da je raspodela vrednosti obeležja izdužena, odnosno ima spljoštenost manju od normalne;

4(X) 3 zaklju ujemo da raspodela vrednosti obeležja ima spljoštenost ve u od normalne.

Zadatak 3.1.1. Na i varijansu, standardnu devijaciju, koeficijent varijacije, koeficijente simetrije i spljoštenosti slu ajne promenljive „broj pojavljivanja „pisma” u bacanju tri nov i a”.

Page 95: Poslovna statistika

Poslovna statistika

95

3.1.2. Primeri nekih raspodela diskretnih slu ajnih promenljivih

3.1.2.1. Binomna raspodela, B(n,p)

Zamislimo slede i statisti ki eksperiment:

pretpostavimo da n-puta pokušavamo da realizujemo doga aj A i da je verovatno a uspešne realizacije ovog doga aja u svakom pokušaju ista i iznosi p. Naravno, tada je i verovatno a nerealizacije doga aja A u svakom pokušaju ista i iznosi 1-p.

Nad ovim eksperimentom definišimo slu ajnu promenljivu X kao „broj

uspešnih realizacija doga aja A u n pokušaja pri ovakvim uslovima”. Na imo raspodelu verovatno a ove slu ajne promenljive.

Vrednosti koje ova slu ajna promenljiva X može uzeti su

niiX ,...,2,1,0, , gde je saiX ozna eno da se doga aj A realizovao ta no i puta u n pokušaja.

Varovatno u da se doga aj A realizovao ta no i puta u n pokušaja, odnosno )( iXP , nalazimo slede im rasu ivanjem:

jedna od mogu ih elemenatrnih realizacija ovog eksperimenta, kod koje se doga aj A realizovao ta no i puta u n pokušaja, jeste da se doga aj A

realizovao u prvih i pokušaja, a nije realizovao u preostalih n-i pokušaja.Verovatno a ove elementarne realizacije je

1

1

1111 ni

ni

pppppppp .

Postojii

nrazli itih elementarnih realizacija kod kojih se doga aj A

realizovao ta no i puta u n pokušaja i svaka od njih ima istu verovatno u

jednaku ini pp 1 .

Varovatno a da se doga aj A realizovao ta no i puta u n pokušaja jednaka je zbiru verovatno a svih ovih elementarnih realizacija, odnosno

Page 96: Poslovna statistika

Poslovna statistika

96

....,2,1,0,)1()( nippi

niXP ini

Ovakva raspodela slu ajne promenljive se naziva Binomna raspodela. Kao što smo videli, zavisi od dva parametra: jedan je broj pokušaja realizacije doga aja(n), a drugi je verovatno a uspešne realizacije doga aja u svakom pojedina nom pokušaju (p).

Kada slu ajna promenljiva X podleže zakonu Binomne raspodele sa parametrima n i p, to zapisujemo: ).,(~ pnBX

Dakle, važi:

....,2,1,0,)1()(),(~ nippi

niXPpnBX ini

Parametri slu ajne promenljive ),(~ pnBX :

- matemati ko o ekivanje: pnXE )( ;

- varijansa: ppnX 1)(2 ;

- standardna devijacija ppnX 1)( ;

- koeficijent simetrijeppn

pX

1

21)(3 ;

- koeficijent spljoštenosti ppnn

X1

163)(4 .

Primer 3.1.2.1. Strelac ga a u metu 10 puta. Verovatno a da pogodi metu je u svakom pokušaju ista i iznosi p=0.7. Na i verovatno u da je pogodio ta no 8 puta.

Page 97: Poslovna statistika

Poslovna statistika

97

Rešenje:

Slu ajna promenljiva X definisana kao „broj pogodaka u 10 pokušaja pri ovim

uslovima”, podleže zakonu Binomne raspodele sa parametrima n=10 i p=0.7,

)7.0,10(~ BX , pa je 28 3.07.08

10)8(XP .

3.1.2.2. Hipergeometrijska raspodela, H(N,N1,n)

Zamislimo slede i statisti ki eksperiment:

proizvoljan skup sadrži N elemenata, od kojih N1 elemenata (N1<N)ima osobinu A. Iz takvog skupa na slu ajan na in biramo n elemenata bez ponavljanja (n<N).

Nad ovim eksperimentom definišimo slu ajnu promenljivu X kao „broj

izabranih elemenata koji imaju osobinu A pri ovakvim uslovima”. Na imo raspodelu verovatno a ove slu ajne promenljive.

Vrednosti koje ova slu ajna promenljiva X može uzeti su X = i ,gde i može uzeti bilo koju celobrojnu vrednost iz zatvorenog intervala

.),min(),,0max( 11 NnNNn

Verovatno u da u n ovako izabranih elemenata ima ta no i sa osobinom A, P(X=i), nalazimo slede im rasu ivanjem:

broj svih elementarnih doga aja u ovakvom statisti kom eksperimentu jednak je broju razli itih na ina na koji možemo iz skupa od N elemenata izabrati n

bez ponavljanja, odnosno jednak n

N.

Naš doga aj od interesa odre en je onim elementarnim doga ajima u kojima se od N1 elementa bira i bez ponavljanja i od N-N1 elementa bira n-i , tako e bez ponavljanja.

Kako od N1 elementa možemo izabrati i elemenata bez ponavljanja na i

N

razli itih na ina, a od N-N1 elementa možemo izabrati n-i elemenata bez

Page 98: Poslovna statistika

Poslovna statistika

98

ponavljanja na in

NN 1 razli itih na ina, to je po pravilu proizvoda naš

doga aj od interesa odre en sa i

N

in

NN 1 elementarnih doga aja.

Tako da, po klasi noj definiciji verovatno e, verovatno a da u n ovako izabranih elemenata ima ta no i sa osobinom A, iznosi

n

N

in

NN

i

N

iXP

1

)( ,

gde i može uzeti bilo koju celobrojnu vrednost iz zatvorenog intervala .),min(),,0max( 11 NnNNn

Ovakva raspodela slu ajne promenljive se naziva Hipergeometrijska

raspodela. Kao što smo videli, zavisi od tri parametra: jedan je broj elemenata skupa iz kojeg vršimo slu ajan izbor bez ponavljanja (N), drugi je broj elemenata tog skupa koji ima željenu osobinu (N1), a tre i je broj elemenata koji izvla imo iz tog skupa bez ponavljanja (n).

Kada slu ajna promenljiva X podleže zakonu Hipergeometrijske raspodele sa parametrima N, N1 i n, to zapisujemo: ).,,(~ 1 nNNHX

Parametri slu ajne promenljive ),,(~ 1 nNNHX :

- matemati ko o ekivanje:N

NnXE 1)( ;

- varijansa: 1

1)( 112

N

nN

N

N

N

NnX ;

- standardna devijacija 1

1)( 11

N

nN

N

N

N

NnX .

Page 99: Poslovna statistika

Poslovna statistika

99

Primer 3.1.2.2. Iz odeljenja koje ima 30 u enika od kojih su 18 de aka, na slu ajan na in biramo 10 u enika. Na i verovatno u da me u tih deset izabranih u enika bude 7 de aka.

Rešenje:

Broj de aka u 10 slu ajno izabranih u enika iz ovog odeljenja podleže

raspodeli )10,18,30(H , pa je verovatno a da je me u tih 10 u enika ta no 7

de aka jednaka

10

30

3

12

7

18

.

Page 100: Poslovna statistika

Poslovna statistika

100

3.1.2.3. Puasonova raspodela, P( )

Slu ajna promenljiva X ima Puasonovu raspodelu verovatno a, P( ),

ukoliko je njena raspodela verovatno a odre ena slede im zakonom raspodele:

,.....2,1,0,0,!

)( iconsti

eiXPi

Puasonova raspodela verovatno a je grani ni slu aj Binomne raspodele u slu aju kada je, za fiksirano i, n i p 0, ali tako da je n p=const.>0.Naime, važi slede e:

.1lim

11lim;11

12

11

1lim

)(!

1

11

12

11

11!

lim

1!

11lim

1lim),(lim00

en

nn

i

nn

jejer

Pei

n

n

n

i

nni

nni

innn

ppi

npnB

n

n

i

nn

i

i

n

i

n

in

i

i

n

ini

constpnn

constpnn

Iz ovoga zaklju ujemo da se Binomna raspodela može za veliko n i malo p, u slu aju kada je n p=const., dosta dobro aproksimirati Puasonovom, koja je lakša za izra unavanje. Greška koja se pri tome ini se ve za p<0.1 i n>50

može zanemariti. Kako je p blisko nuli, Puasonova raspodela opisuje doga ajeija je verovatno a pojavljivanja veoma mala, odnosno tzv. retke doga aje.

Puasonova raspodela ne služi samo za aproksimaciju Binomne raspodele, ve i za odre ivanje verovatno e broja javljanja nekog doga aja u prostoru i

Page 101: Poslovna statistika

Poslovna statistika

101

vremenu. Ovi doga aji nisu doga aji definisani kao podskup nekog statisti kogeksperimenta, ve doga aji koji zadovoljavaju slede e uslove:

- broj javljanja doga aja je nezavisan od jedne do druge jedinice vremena ili ta ke prostora;

- verovatno a istovremenog javljanja dva ili više doga aja u sasvim malom vremenskom ili prostornom intervalu je zanemarljivo mala;

- verovatno a javljanja doga aja je proporcionalna dužini odre enogvremenskog ili prostornog intervala.

To su, na primer, doga aji, broj telefonskih poziva u nekom vremenskom intervalu, broj estica emitovanih od neke radioaktivne supstance, broj štamparskih grešaka po stranici neke knjige i sl.

Naime, neka je slu ajna promenljiva Xt „broj pojavljivanja nekog doga aja u

intervalu 0, t)”. Podelimo interval 0, t) na n intervala jednakih dužina n

t. Ako

zamislimo da je n veliko, onda je:

- broj javljanja doga aja nezavistan od jednog do drugog intervala;

- verovatno a istovremenog javljanja dva ili više doga aja u jednom intervalu je zanemarljiva;

- verovatno a da se u nekom intervalu ostvari jedan doga aj, obeležimo je sa p, ista je za svaki interval i važi da kada n tada p 0. Tako e, ta verovatno a je direktno proporcionalna dužini intervala, odnosno obrnuto

proporcionalna broju intervala n, to jest možemo pisati n

p , =const. 0,

gde parametar na neki na in karakteriše intenzitet protoka doga aja.

Neka je Ai , i=1,2,...,n, doga aj da se u i-tom intervalu pojavi posmatrani doga aj.

Tada su, na osnovu gore navedenog, doga aji Ai , i = 1, 2, ..., n, nezavisni sa jednakim verovatno ama

Page 102: Poslovna statistika

Poslovna statistika

102

.,...,2,10.)( niconstn

pAP i

Slu ajna promenljiva Xt „broj pojavljivanja nekog doga aja u intervalu 0, t)”,sada je identi na slu ajnoj promenljivoj „broj realizacija doga aja Ai , i = 1,2,...,n”, a ona, kao što znamo, pod ovim uslovima podleže zakonu Binomne, B(n,p), raspodele. Dakle, ),(~ pnBX t .

Ako pove amo preciznost registrovanja doga aja, to jest dozvolimo da n ,

tada 0n

p , ali 0.constnp , pa tada važi

).(),(lim~0.

PpnBX

constpnn

t

Puasonova raspodela zavisi samo od jednog parametra , koji u slu ajuaproksimacije Binomne raspodele Puasonovom iznosi =n p, a u slu ajupredstavljanja protoka nekog doga aja u nekom prostornom ili vremenskom intervalu, predstavlja o ekivani broj pojavljivanja nekog doga aja u tom posmatranom prostornom ili vremenskom intervalu.

Kada slu ajna promenljiva X podleže zakonu Puasonove raspodele sa parametrom , to zapisujemo ).(~ PX

Parametri slu ajne promenljive )(~ PX :

- matemati ko o ekivanje: )(XE ;

- varijansa: )(2 X ;

- standardna devijacija )(X ;

- koeficijent simetrije1

)(3 X ;

- koeficijent spljoštenosti 1

3)(4 X .

Page 103: Poslovna statistika

Poslovna statistika

103

Primer 3.1.2.3.1. Verovatno a pogotka u cilj pri svakom ga anju je 0,05. Na iverovatno u ta no jednog pogotka, ako je broj ga anja 60.

Rešenje:

Obeležimo sa X slu ajnu promenljivu broj pogotka u 60 ga anja.

Pošto se binomna raspodela verovatno e za 1,005 pn može

aproksimirati Puasonovom raspodelom u kojoj je pn , to, kako je u ovom

slu aju 305,060pn , važi

31

3 3!1

3)1( eeXP .

Primer 3.1.2.3.2. U telefonskoj centrali u toku jednog sata bilo je 60 poziva. Izra unati verovatno u da u toku dva minuta nije bilo nijednog poziva.

Rešenje:

Obeležimo sa X slu ajnu promenljivu broj poziva u toku dva minuta.

O ekivani broj poziva u toku dva minuta je 230

60, pa je verovatno a da

u toku dva minuta nije bilo nijednog poziva jednaka

20

2

!0

2)0( eeXP .

Page 104: Poslovna statistika

Poslovna statistika

104

3.2. Raspodele neprekidnih slu ajnih promenljivih

Ako je slu ajna promenljiva X neprekidna slu ajna promenljiva, onda ona može da uzme bilo koju vrednost iz nekog intervala vrednosti. Pošto u realnom intervalu ima beskona no mnogo vrednosti, besmisleno je govoriti o verovatno i da slu ajna promenljiva X uzme ta no odre enu vrednost u tom intervalu. U tom smislu, za neprekidnu slu ajnu promenljivu X možemo re i da je verovatno a da ona uzme ta no odre enu vrednost, recimo i, jednaka nuli, to jest da je 0)( iXP . Smisleno je i mogu e kod neprekidnih slu ajnihpromenljivih izra unati verovatno u da se slu ajna promenljiva X nalazi u nekom intervalu vrednosti, odnosno izra unati )( bXaP .

Kako je

0)()( bXPaXP ,

to važi

)()()()( bXaPbXaPbXaPbXaP .

Važno je napomenuti da u slu aju neprekidne slu ajne promenljive X, injenicada je 0)( iXP ne zna i da je doga aj X = i nemogu , ve da je besmisleno o ekivati ga unapred, odnosno da mu je a priori verovatno a jednaka nuli.

Zato kod neprekidnih slu ajnih promenljiva nema smisla ra unati raspodelu verovatno a, ve je neprekidna slu ajna promenljiva potpuno definisana ako je data njena funkcija raspodele verovatno a ili njena funkcija gustine raspodele

verovatno a.

Page 105: Poslovna statistika

Poslovna statistika

105

- Funkcija raspodele verovatno a neprekidne slu ajne promenljive

Ako je X neprekidna slu ajna promenljiva, onda verovatno a da ta slu ajnapromenljiva bude manja od neke realne vrednosti x, predstavlja vrednost funkcije raspodele verovatno a te slu ajne promenljive u ta ki x i obeležava se sa F(x).

Dakle, funkcija raspodele verovatno a F(x), slu ajne promenljive X, jeste realna funkcija )(xFx definisana sa:

.),()( xxXPxF

Iz definicije funkcije raspodele F(x), zaklju ujemo da važi slede e:

)(1)(1)(1)()(.5

)()()()()()(.4

1)(lim0)(lim.3

)()(,.2

1)(0.1

aFaXPaXPaXPaXP

aFbFbXaPbXaPbXaPbXaP

xFxF

bFaFbaRba

xFRx

xx

Primer izgleda jedne funkcije raspodele neprekidne slu ajne promenljive dat je na slici 3.2.1.

Page 106: Poslovna statistika

Poslovna statistika

106

Slika 3.2.1. Funkcija raspodele

Vrednost F(a) predstavlja verovatno u da slu ajna promenljiva uzme neku vrednost manju od a, odnosno ).()( aXPaF

F(x)

1

F(a)

a x

Page 107: Poslovna statistika

Poslovna statistika

107

- Funkcija gustine raspodele verovatno a neprekidne slu ajne promenljive

Neka je F funkcija raspodele neprekidne slu ajne promenljive X. Ako postoji nenegativna funkcija f definisana na R takva da za svako x R važi da je

x

dttfxF )()( ,

tada tu funkciju f nazivamo funkcija gustine verovatno e neprekidne slu ajne

promenljive X, ili kra e – funkcija gustine.

Iz definicije funkcije gustine raspodele f(x) zaklju ujemo da, ukoliko je Fdiferencijabilna u ta ki x, važi slede e: ).()(' xfxF

Tako e važi:

1)(.4

)()()()(.3

)()()()(.2

0)(.1

dxxf

dxxfaXPdxxfaXP

aFbFdxxfbXaP

xfRx

a

a

b

a

Primer izgleda jedne funkcije gustine raspodele neprekidne slu ajnepromenljive dat je na Slici 3.2.2.

Page 108: Poslovna statistika

Poslovna statistika

108

Slika 3.2.2. Funkcija gustine raspodele

Kao što se vidi na slici 3.2.2, verovatno a )( bXaP jednaka je šrafiranoj površini ome enoj grafikom funkcije gustine raspodele f(x), x osom i pravama x=a i x=b.

Verovatno a )( bXP jednaka je površini desno od prave x=b ograni enojgrafikom funkcije gustine raspodele f(x) i x osom, a verovatno a

)( aXP jednaka je površini levo od prave x=a ograni enoj grafikom funkcije gustine raspodele f(x) i x osom.

P(a<X<b)

P(x>b)P(X<a)

f(x)

a b x

Page 109: Poslovna statistika

Poslovna statistika

109

3.2.1. Parametri neprekidnih slu ajnih promenljivih

Kao i u slu aju diskretnih slu ajnih promenljivih, parametre neprekidnih slu ajnih promenljivih svrsta emo u tri grupe:

- parametri srednje vrednosti (mere srednje vrednosti ili centralne tendencije);

- parametri varijabiliteta (mere disperzije); - parametri oblika rasporeda (mere oblika rasporeda).

Parametri prve grupe reprezentuju centar rasturanja vrednosti slu ajnepromenljive, parametri druge grupe mere vrednost tog rasturanja oko centra rasturanja, a parametri tre e grupe ukazuju na oblik rasturanja posmatrane raspodele.

3.2.1.1. Parametri centralne tendencije neprekidne slu ajnepromenljive

Parametri centralne tendencije neprekidne slu ajne promenljive koje emo mi navesti su matemati ko o ekivanje, modus i medijana.

Matemati ko o ekivanje. Matemati ko o ekivanje neprekidneslu ajne promenljive X esto se naziva i srednja vrednost slu ajnepromenljive X. Mi emo ga obeležavati sa E(X) i odre ujemo ga na slede i na in:

ako neprekidna slu ajna promenljiva X ima funkciju gustine verovatno e f(x), onda je njeno matemati ko o ekivanje jednako

.)()( dxxfxXE

Page 110: Poslovna statistika

Poslovna statistika

110

Matemati ko o ekivanje još se naziva i moment prvog reda neprekidneslu ajne promenljive. U opštem slu aju, moment k-tog reda neprekidneslu ajne promenljive X ozna avamo sa mk(X) i nalazimo po formuli

dxxfxXm k

k )()(

- Modus. Modus neprekidne slu ajne promenljive X obeležavamo sa Mo(X) i ona je odre ena onim ta kama u kojima funkcija gustine verovatno e f(x) ima maksimum.

- Medijana. Medijanu neprekidne slu ajne promenljive X obeležavamo sa Me(X) i ona predstavlja onu vrednost slu ajne promenljive X za koje važi slede e:

5.0)()()(eM

ee dxxfMFMXP .

Medijana neprekidne slu ajne promenljive je, dakle, ona vrednost slu ajne promenljive za koju je verovatno a da slu ajna promenljiva bude manja od nje jednaka verovatno i da slu ajna promenljiva bude ve a od nje, jednaka 0.5.

Primer 3.2.1.1. Na i matemati ko o ekivanje, modus i medijanu neprekidne slu ajne promenljive ija je funkcija gustine

1,00

1,02)(

x

xxxf .

Rešenje:

Matemati ko o ekivanje je

1

0

1

0

3

3

2|

322.)()(

xxdxxdxxfxXE .

Page 111: Poslovna statistika

Poslovna statistika

111

Modus iznosi

Mo(X) = 1

jer samo za X=1 funkcija gustine verovatno a ima maksimum .2)1(f

Medijanu nalazimo iz uslova:

5.05.0|2

22

5.0)()()(

2

0

2

0

ee

MM

M

ee

MMx

dxx

dxxfMFMXP

ee

e

3.2.1.2. Parametri varijabiliteta neprekidne slu ajne promenljive

Parametri varijabiliteta neprekidne slu ajne promenljive koje emo mi navesti su varijansa i standardna devijacija, kao apsolutne mere varijabiliteta neprekidne slu ajne promenljive, i koeficijent varijacije,kao relativna mera varijabiliteta neprekidne slu ajne promenljive.

- Varijansa. Varijansu neprekidne slu ajne promenljive Xobeležavamo sa var(X) ili 2

(X), i odre ujemo na slede i na in:

ako neprekidna slu ajna promenljiva X ima funkciju gustine verovatno e f(x) onda je njena varijansa jednaka

.)(()( 22 dxxfXExX

Varijansa se još naziva i centralni moment drugog reda. U opštem slu aju centralni moment k-tog reda neprekidne slu ajne promenljive X ozna avamo sa Mk(X) i nalazimo po formuli

Page 112: Poslovna statistika

Poslovna statistika

112

.)(()( dxxfXExXMk

k

Iz same definicije varijanse jasno je da važi

.)()( 22 XEXEX

Kako važi slede e:

212

2222

22

2

)()()()()(2)(

)()()()(2)(

)((

mmXEXEXEXEXEXE

dxxfXEdxxfxXEdxxfx

dxxfXEx

to varijansu možemo izra unavati i pomo u tzv. radne formule

.)()()()()( 212

222 XmXmXEXEX

- Standardna devijacija. Standardnu devijaciju neprekidne slu ajnepromenljive X obeležavamo sa st. dev. (X) ili sa (X) i izra unavamo po formuli

)var().(. XXdevst odnosno .)()( 2 XX

- Koeficijent varijacije. Koeficijent varijacije neprekidne slu ajnepromenljive X obeležavamo sa Cv(X) i izra unavamo po formuli

)(

)()(

XE

XXCv .

Ako ga želimo izraziti u procentima, obeležavamo ga sa Cv(X)% i izra unavamo po formuli

Page 113: Poslovna statistika

Poslovna statistika

113

%100XC%100)X(E)X()%X(C vv .

3.2.1.3. Parametri oblika rasporeda neprekidne slu ajnepromenljive

Parametri oblika rasporeda neprekidne slu ajne promenljive su, kao i kod diskretnih, mera simetrije i mera spljoštenosti slu ajnepromenljive.

Mera simetrije izražava se pomo u koeficijenta simetrije, dok se mera spljoštenosti izražava pomo u koeficijenta spljoštenosti. I jedan i drugi koeficijent se izra unavaju pomo u centralnih momenata, na isti na inkao i kod diskretnih slu ajnih promenljivih.

- Koeficijent simetrije slu ajne promenljive X ozna avamo sa 3(X) i izra unavamo po formuli:

33

3)(

)()(

X

XMX .

Ukoliko je:

3(X)=0 zaklju ujemo da je raspodela vrednosti obeležja simetri na; tada je tako e )()()( XMXMXE oe ;

3(X) 0 zaklju ujemo da je raspodela vrednosti obeležja pozitivno asimetri na (asimetrija udesno), tada je tako e

)()()( XMXMXE oe ;

3(X) 0 zaklju ujemo da je raspodela vrednosti obeležja negativno asimetri na (asimetrija ulevo); tada je tako e

)()()( XMXMXE oe .

Page 114: Poslovna statistika

Poslovna statistika

114

- Koeficijent spljoštenosti slu ajne promenljive X ozna avamo sa 4(X) i izra unavamo po formuli:

44

4)(

)()(

X

XMX .

Ukoliko je:

4(X)=3 zaklju ujemo da je raspodela vrednosti obeležja normalno spljoštena;

4(X) 3 zaklju ujemo da je raspodela vrednosti obeležja izdužena, odnosno ima spljoštenost manju od normalne;

4(X) 3 zaklju ujemo da raspodela vrednosti obeležja ima spljoštenost ve u od normalne.

Zadatak 3.2.1. Na i varijansu, standardnu devijaciju, koeficijent varijacije, koeficijente simetrije i spljoštenosti neprekidne slu ajnepromenljive ija je funkcija gustine

1,00

1,02)(

x

xxxf .

Page 115: Poslovna statistika

Poslovna statistika

115

3.2.2. Primeri nekih raspodela neprekidnih slu ajnih promenljivih

3.2.2.1. Normalna (Gausova) raspodela, N( ,2)

Neprekidna slu ajna promenljiva X ima Normalnu raspodelu sa parametrima i 2 ako je njena gustina raspodele verovatno a jednaka

,2

1)(

2

2

2

)(

xexf

x

.

Kada slu ajna promenljiva X ima Normalnu raspodelu sa parametrima i 2 to zapisujemo ),(~ 2NX .

Normalnu raspodelu uveo je nema ki matemati ar Karl Fridrih Gaus (1777-1855) u analizi ocene slu ajnih grešaka prilikom obrade rezultata merenja, pa se zato naziva i Gausova raspodela.

Grafici gustina ove raspodele verovatno a zavise od parametara i 2.Me utim, mogu se uo iti slede e zajedni ke karakteristike:

- sve krive gustine simetri ne su u odnosu na pravu x = , što zna i da je medijana Me= ;

- ta ka maksimuma je ta ka )2

1,( , pa je i moda Mo= ;

- 0)(lim xfx

;

- sve krive su zvonastog oblika;

Page 116: Poslovna statistika

Poslovna statistika

116

- ukoliko je ve e, to je maksimalna vrednost gustine manja, ali je rasturanje oko prave x = ve e, odnosno širina krive je ve a (Slika3.2.3);

8 6 4 2 0 2 4 6 8 10 120

0.13

0.25

dnormx 2 2( )

dnormy 2 4( )

Slika 3.2.3. Funkcije gustine N(2,22) i N(2,4

2)

- promena vrednosti parametra dovodi do translacije krive gustine duž x ose (Slika 3.2.4);

4 2 0 2 4 6 8 10 12 140

0.13

0.25

dnormx 2 2( )

dnormy 6 2( )

x y

Slika 3.2.4. Funkcije gustine N(2,22) i N(6,2

2)

N(2,22)

N(2,42)

N(2,22)

N(6,22)

Page 117: Poslovna statistika

Poslovna statistika

117

- za sve slu ajne promenljive ),(~ 2NX važi

997.0)33(

95.0)22(

68.0)(

XP

XP

XP

- ako slu ajna promenljiva X ima Normalan raspored, onda i njena linearna transformacija Y=a+bX tako e ima Normalan raspored;

- ako je ),(~ 2111 NX i ),(~ 2

222 NX , tada

),(~

),(~2

22

12121

22

212121

NXX

NXX

Slu ajnu promenljivu koja ima Normalnu raspodelu sa parametrima =0 i 2=1 zovemo slu ajna promenljiva Z tipa ili Z promenljiva. Zna i

)1,0(~ NZ (Slika 3.2.5).

4 3 2 1 0 1 2 3 40

0.25

0.5

dnorm x 0 1( )

x

Slika 3.2.5. Funkcija gustine N(0,1)

Page 118: Poslovna statistika

Poslovna statistika

118

Pod brojem z slu ajne promenljive Z tipa, podrazumeva emo broj z za koji

važi 1)()()(z

dxxfzZPzF (Slika 3.2.6).

0

0.25

0.5

dnorm x 0 1( )

x

Slika 3.2.6. Broj z

O igledno da je z

dxxfzZP )()( .

Vrednosti Normalne raspodele N(0,1) date su tabli no na kraju udžbenika u

obliku 1)()()(z

dxxfzZPzF .

U koloni ozna enoj sa z nalaze se cifra jedinica i prva decimala broja z , dok se u vrsti ozna enoj sa z nalazi druga decimala broja z .

U preseku vrste odre ene cifrom jedinicom i prvom decimalom broja z i kolone odre ene drugom decimalom broja z , nalazi se vrednost 1- koja odgovara tom z .

Tako, na primer, u preseku vrste odre ene sa 0.7 i kolone odre ene sa 0.04, nalazi se broj 0.7704, što zna i da je

7704.0)74.0(ZP , odnosno da je 2296.074.0 z .

1-

z

Page 119: Poslovna statistika

Poslovna statistika

119

Bez dokaza emo navesti jednu veoma važnu injenicu, koja nam omogu avada tablicu vrednosti N(0,1) raspodele možemo koristiti za odre ivanjevrednosti bilo koje N( ,

2) raspodele. Ta injenica je slede a:

ako slu ajna promenljiva X ima N( ,2) raspodelu, onda slu ajna promenljiva

X ima N(0,1) raspodelu, odnosno važi

)1,0(~),(~ 2 NX

NX to jest X

Z .

Primer 3.2.2.1. Ako slu ajna promenljiva X podleže zakonu N(20,102), na i

verovatno u )285( XP .

Rešenje:

Kako je u ovom slu aju 1020 i , to važi )1,0(~ NX

, pa je

7213.00668.07881.0)5.1()8.0()8.05.1(

)10

2028

10

205()285()10,20(~ 2

FFZP

XPXPNX

Moivre-Laplaceova teorema (koju ne emo dokazivati) nam omogu ava da, u slu ajevima kada je 5)1(5 pnipn , Binomnu raspodelu B(n,p)

možemo aproksimirati Normalnom raspodelom sa parametrima pn i

)1(2 ppn , odnosno sa ))1(,( ppnpnN .

Kako u tom slu aju diskretnu raspodelu aproksimiramo neprekidnom, neophodno je da se interval integracije Normalne raspodele proširi i sa gornje i sa donje strane sa 0.5.

Primer 3.2.2.2. Ako je )3.0,20(~ BX , na i približno verovatno u)73( XP .

Page 120: Poslovna statistika

Poslovna statistika

120

Rešenje:

Kako je 5147.0201563.020 pnipn to B(20,0.3)

možemo aproksimirati Normalnom raspodelom kod koje je

2.47.03.020163.020 2 ppnapn ,

pa je

7237.00436.07673.0)71.1()73.0(

)2.4

65.7

2.4

65.2()73(

FF

ZPXP.

Normalna raspodela ima najve i zna aj me u raspodelama verovatno a iz slede ih razloga:

- veliki broj slu ajnih promenljivih ima Normalan raspored;- veliki broj slu ajnih promenljivih ima aproksimativno Normalan

raspored;- izvesne komplikovanije raspodele mogu se aproksimirati Normalnom

raspodelom;- veliki broj slu ajnih promenljivih koje služe za verifikaciju statisti kih

testova imaju Normalnu raspodelu.

Parametri slu ajne promenljive ),(~ 2NX :

- matemati ko o ekivanje: )(XE ;

- varijansa: 22 )(X ;

- standardna devijacija )(X ;

- koeficijent simetrije 0)(3 X ;

- koeficijent spljoštenosti 3)(4 X .

Page 121: Poslovna statistika

Poslovna statistika

121

3.2.2.2. Studentova raspodela (t-raspodela), t

Engleski matemati ar Goset (W. S. Gosset) je 1908. godine, pod pseudonimom Student, objavio rad u kome je definisao jednu novu, do tada nepoznatu neprekidnu raspodelu, koja je po njegovom pseudonimu i dobila naziv Studentova raspodela. Ova raspodela se naziva još i t-raspodela.

Matemati ki izraz za funkciju gustine ove raspodele je previše komplikovan i ne emo ga izložiti.

Studentova raspodela je neprekidna raspodela koja zavisi samo od jednog parametra koji se naziva broj stepeni slobode, koga emo obeležavati sa i koji može iznositi =1, 2, 3, ... .

Kada slu ajna promenljiva X ima Studentovu raspodelu sa stepeni slobode, to zapisujemo tX ~ .

Studentova raspodela ima slede e osobine:

- njena funkcija gustine raspodele, obeležimo je sa f(t), definisana je na itavom skupu R za svako =1, 2, 3, ...;

- grafik funkcije gustine raspodele je simetri an u odnosu na ordinatnu osu, to jest

)()( tftfRt za svako =1, 2, 3, ...;

- apscisna osa je asimptota krive gustine f(t), kada tto jest

0)(lim tft

za svako =1, 2, 3, ...;

- kada Studentova raspodela teži N(0,1) raspodeli, tako da se veza 30 Studentova raspodela može aproksimirati N(0,1)

raspodelom;

- funkcija gustine Studentove raspodele je na sredini više spljoštena, a na krajevima šira od N(0,1) rasporeda.

Page 122: Poslovna statistika

Poslovna statistika

122

Na slici 3.2.7. dat je oblik funkcije gustine raspodele t1, t3 i t50.

4 3 2 1 0 1 2 3 40

0.2

0.4dt x 1( )

dt y 3( )

dt z 50( )

x y z

Slika 3.2.7. Funkcije gustine t1 , t3 , t50

Vrednosti Studentove raspodele t date su tabli no na kraju udžbenika u obliku )( ,ttP .

U koloni ozna enoj sa Stepeni slobode nalaze se cifre koje ozna avaju broj stepeni slobode, odnosno parametar , dok se u vrsti ozna enoj sa nalaze vrednosti verovatno e.

U preseku vrste odre ene parametrom i kolone odre ene verovatno om ,nalazi se broj t , za koji važi )( ,ttP .

Tako, na primer, u preseku vrste odre ene sa = 7 i kolone odre ene sa =0.05, nalazi se broj 1.8946, što zna i da je

05.0)8946.1( 7tP ,

odnosno da je 05.0,78946.1 t (Slika 3.2.8).

t1

t3

t50

Page 123: Poslovna statistika

Poslovna statistika

123

4 3 2 1 0 1 2 3 40

0.2

0.4

dt x 7( )

x

Slika 3.2.8. Grafi ka predstava broja t7,0.05

Parametri slu ajne promenljive tX ~ :

- matemati ko o ekivanje: 0)(XE ;

- varijansa: 2;2

)(2 X ;

- standardna devijacija 2;2

)(X ;

- koeficijent simetrije 0)(3 X ;

- koeficijent spljoštenosti 4;4

63)(4 X .

=0.05

t7

t7,0.05=1.8946

Page 124: Poslovna statistika

Poslovna statistika

124

3.2.2.3. Hi-kvadrat raspodela, 2

Matemati ki izraz za funkciju gustine ove raspodele tako e ne emo izložiti zbog njegove složenosti.

Hi-kvadrat raspodela je neprekidna raspodela koja zavisi samo od jednog parametra koji se naziva broj stepeni slobode, koga emo obeležavati sa i koji može iznositi =1, 2, 3, ...

Kada slu ajna promenljiva X ima Hi-kvadrat raspodelu sa stepeni slobode, to zapisujemo 2~X .

Hi-kvadrat raspodela ima slede e osobine:

- njena funkcija gustine raspodele, obeležimo je sa f(x), definisana je samo za pozitivne realne brojeve (x 0) za svako =1, 2, 3, ...;

- grafik funkcije gustine raspodele je asimetri an, i to pozitivno asimetri an za svako =1, 2, 3, ...;

- moda slu ajne promenljive sa 2 raspodelom iznosi Mo= - 2, ( 2);

- kada , Hi-kvadrat raspodela teži Normalnoj raspodeli saparametrima = , i 2

=2 , tako da se ve za 30 Hi-kvadrat raspodela

može aproksimirati N( ,2 ) raspodelom.

Na slici 3.2.9. dat je oblik funkcije gustine raspodele 27

24

23

22

21 ,,,, .

Page 125: Poslovna statistika

Poslovna statistika

125

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 150

0.2

0.4dchisq x 1( )

dchisq x 2( )

dchisq x 3( )

dchisq x 4( )

dchisq x 7( )

x

Slika 3.2.9. Funkcije gustine 27

24

23

22

21 ,,,,

Vrednosti Hi-kvadrat raspodele2 date su tabli no na kraju udžbenika u

obliku )( 2,

2P .

U koloni ozna enoj sa Stepeni slobode nalaze se cifre koje ozna avaju broj stepeni slobode, odnosno parametar , dok se u vrsti ozna enoj sa nalaze vrednosti verovatno e.

U preseku vrste odre ene parametrom i kolone odre ene verovatno om ,nalazi se broj 2

, , za koji važi )( 2,

2P .

Tako, na primer, u preseku vrste odre ene sa = 7 i kolone odre ene sa =0.05, nalazi se broj 14.067, što zna i da je

05.0)067.14( 27P ,

odnosno da je 205.0,7067.14 (Slika 3.2.10).

12

22

32

42

72

Page 126: Poslovna statistika

Poslovna statistika

126

0 2 4 6 8 10 12 14 16 18 200

0.05

0.1

0.15

dchisq x 7( )

x

Slika 3.2.10. Grafi ka predstava broja2

7,0.05

Parametri slu ajne promenljive 2~X :

- matemati ko o ekivanje: )(XE ;

- varijansa: 2)(2 X ;

- standardna devijacija 2)(X ;

- koeficijent simetrije8

)(3 X ;

- koeficijent spljoštenosti 12

3)(4 X .

=0.05

27,0.05=14.067

Page 127: Poslovna statistika

Poslovna statistika

127

3.3. Neke osobine matemati kog o ekivanja E(X) i varijanse Var(X) slu ajne promenljive X

Neka su a,b,c proizvoljni realni brojevi i neka su X i Y slu ajne promenljive. Tada važi:

YbEXaEbYaXE

XVarabaXVar

bXaEbaXE

cVar

ccE

()()(.5

)()(.4

)()(.3

0)(.2

)(.1

2

2

)())((0.6

XVarXEXP .

Osobina pod brojem 6. je poznata i kao ebiševljeva nejednakost.

Page 128: Poslovna statistika

Poslovna statistika

128

4. UZORAK I STATISTIKE UZORKA

Karakteristike populacije su egzaktno poznate samo ako su informacije o njima uzete iz itave populacije. Me utim, anketiranje itave populacije esto stvara velike teško e i iziskuje mnogo vremena. U pojedinim slu ajevima je nemogu e, pa i besmisleno anketirati itavu populaciju ukoliko prikupljanje informacija zna i i uništenje podataka. Zbog toga se kompletno anketiranje populacije esto zamenjuje jednim drugim metodom analize parametara populacije – metodom uzorka.

Uzorak je jedan deo populacije, izabran na specifi an na in, ijom analizom dobijamo rezultate pomo u kojih možemo izvesti dovoljno valjane zaklju ke o vrednostima parametara itave populacije.

Radi što ve e verodostojnosti izvedenih zaklju aka iz uzora kih podataka, potrebno je da uzorak bude reprezentativan, odnosno da je po svojoj strukturi sli an osnovnom skupu.

Prema na inu izbora uzorka iz populacije, uzorke delimo u dve osnovne grupe: na slu ajne (probabilisti ke) i na namerne (neprobabilisti ke).

Slu ajni uzorak je onaj uzorak kod koga je verovatno a izbora svakog elementa iz populacije u uzorak unapred poznata i razli ita od nule.

Svi ostali metodi izbora uzorka su neslu ajni i tako izabrani uzorci su namerni.

Postoji više razli itih na ina dobijanja slu ajnog uzorka iz populacije.

Najzna ajniji me u nima je prost slu ajni uzorak i on je predmet analize ovog, 4. poglavlja.

Pomenu emo da u slu ajne uzorke spadaju još i stratifikovani uzorak, uzorak

skupina, višeetapni uzorak, sistematski uzorak, ali njih ne emo analizirati u ovom udžbeniku.

Page 129: Poslovna statistika

Poslovna statistika

129

4.1. Prost slu ajni uzorak

Kao i u prethodnim poglavljima, broj lanova populacije obeležava emo sa N,a broj lanova uzorka sa n.

Ako iz populacije veli ine N izvla imo uzorke od n elemenata tako da su verovatno e izbora svakog uzorka me usobno jednake, onda takav uzorak zovemo prost slu ajni uzorak.

Mi emo analizirati dve vrste prostog slu ajnog uzorka: prost slu ajni uzorak sa ponavljanjem i prost slu ajni uzorak bez ponavljanja.

Prilikom uzimanja prostog slu ajnog uzorka sa ponavljanjem, element koji smo izabrali u uzorak vra amo u populaciju pre izbora slede eg elementa i on ravnopravno u estvuje u slede em izvla enju, odnosno isti element može biti izabran u uzorak više puta. Tako e, uzima emo u obzir i redosled izvla enja,što zna i da uzorke sa istim elementima smatramo razli itim ukoliko je redosled izbora elemenata razli it. Imaju i ovo u vidu, jasno je da postoji Nn

razli itih prostih slu ajnih uzorka sa ponavljanjem od n elemenata uzetih iz populacije od N elemenata.

Biraju i elemente sa ponavljanjem, svakom elementu skupa u svakom izboru

pružamo istu verovatno u da bude izabran, jednaku N

1, tako da su u ovom

slu aju izbori elemenata u uzorku statisti ki nezavisni doga aji.

Primer 4.1.1. Iz populacije iji su elementi brojevi 1, 2, 3, 4, 5, ispisati sve uzorke sa ponavljanjem od dva elementa.

Rešenje:

Kako je N=5 i n=2, postoji 52=25 razli itih uzorka sa ponavljanjem veli ine

dva. To su:

)5,5()4,5()3,5()2,5(1,5

)5,4()4,4()3,4()2,4(1,4

)5,3()4,3()3,3()2,3(1,3

)5,2()4,2()3,2()2,2(1,2

)5,1()4,1()3,1()2,1(1,1

Page 130: Poslovna statistika

Poslovna statistika

130

Prilikom uzimanja prostog slu ajnog uzorka bez ponavljanja, element koji smo izabrali u uzorak ne vra amo u populaciju pre izbora slede eg elementa i on ne

u estvuje u slede em izvla enju, odnosno isti element ne može biti izabran u uzorak više puta. Tako e, ne emo uzimati u obzir i redosled izvla enja, što zna i da uzorke sa istim elementima smatramo istim i ukoliko je redosled

izbora elemenata razli it. Imaju i ovo u vidu, jasno je da postoji n

Nrazli itih

prostih slu ajnih uzorka bez ponavljanja od n elemenata uzetih iz populacije od N elemenata.

Izbori elemenata u uzorku bez ponavljanja su statisti ki zavisni doga aji jer su verovatno e izbora elemenata u razli itim izvla enjima me usobno razli ite.

Naime, u prvom izvla enju verovatno a izbora nekog elementa u uzorak je N

1,

u drugom 1

1

N, u tre em

2

1

N, itd.

Primer 4.1.2. Iz populacije iji su elementi brojevi 1, 2, 3, 4, 5, ispisati sve uzorke bez ponavljanja od dva elementa.

Rešenje:

Kako je N=5 i n=2, postoji 1012

45

2

5 razli itih uzorka bez ponavljanja

veli ine dva. To su:

)5,4(

)5,3()4,3(

)5,2()4,2()3,2(

)5,1()4,1()3,1()2,1(

Page 131: Poslovna statistika

Poslovna statistika

131

U teorijskom slu aju kada je veli ina populacije beskona na (N ), iz nje možemo izabrati beskona no mnogo uzorka veli ine n. Tada pod prostim

slu ajnim uzorkom podrazumevamo uzorak kod koga su izbori elemenata populacije u uzorak me usobno statisti ki nezavisni doga aji. Zbog toga emo smatrati da je prost slu ajni uzorak uzet iz beskona ne populacije ekvivalentan

prostom slu ajnom uzorku sa ponavljanjem uzetom iz kona ne populacije.

U slu ajevima kad je uzorak dovoljno mali u odnosu na populaciju, n N (u

praksi n 0.05 N, odnosno 05.0N

n), uzorak bez ponavljanja je

aproksimativno evivalentan uzorku sa ponavljanjem, jer se tada verovatno eizbora elemenata u uzorak bez ponavljanja neznatno razlikuju me usobno, pa ih možemo smatrati statisti ki nezavisnim doga ajima.

Neka je, na primer, N=1000 a n=50, tada je verovatno a izbora prvog elementa

u uzorak bez ponavljanja jednaka 001.01000

1, a verovatno a izbora

poslednjeg, pedesetog elementa u uzorak jednaka 001051.0951

1.

Verovatno e izbora svih ostalih elemenata nalaze se izme u ovih dveju verovatno a i o igledno je da se sve me usobno neznatno razlikuju.

Dakle, analize i zaklju ci koje emo izvesti za prost slu ajni uzorak sa

ponavljanjem uzet iz kona ne populacije, važi e za prost slu ajni uzorak uzet

iz beskona ne populacije, i aproksimativno e važiti za prost slu ajni uzorak

bez ponavljanja uzet iz kona ne populacije u slu ajevima kada je 05.0N

n.

Izbor elemenata iz populacije u prost slu ajni uzorak sa i bez ponavljanja upraksi se naj eš e sprovodi pomo u Tablice slu ajnih brojeva, koja je data u Prilogu ovog udžbenika.

Ova tablica formirana je od cifara 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, koje su radi ve epreglednosti svrstane u grupe od po pet redova i pet kolona, koje zanemarujemo prilikom koriš enja tablice. U slu aju koji je ovde dat u Prilogu, Tablica slu ajnih brojeva ima ukupno 40 kolona i 100 vrsta. Algoritam po

Page 132: Poslovna statistika

Poslovna statistika

132

kome je Tablica slu ajnih brojeva konstruisana obezbe uje da su verovatno epojavljivanja bilo koje od ovih cifara iste i me usobno nezavisne. U slu aju kada biramo slu ajni uzorak veli ine n iz populacije veli ine N,Tablicu slu ajnih brojeva koristimo na slede i na in:

- prvo obeležimo sve lanove populacije brojevima od 1 do N;- ako prvi put koristimo Tablicu, slu ajno izaberemo jednu cifru u

Tablici (recimo zažmurimo i pritisnemo olovkom); ako Tablicu ne koristimo prvi put, izaberemo onu cifru koja sledi posle poslednje koriš ene cifre u prethodnom koriš enju Tablice;

- po evši od te izabrane cifre, u proizvoljnom pravcu (recimo sleva nadesno) grupišemo ostale cifre koje slede u grupe od po onoliko cifara koliko cifara ima broj N;

- tako grupisane cifre sada itamo kao brojeve i oni brojevi koji su u intervalu od 1 do N odre uju one elemente iz populacije koje uzimamo u uzorak; ako je uzorak bez ponavljanja, onda eventualno ponovljeni broj u intervalu od 1 do N odbacujemo, a u slu ajuuzorka sa ponavljanjem, uzimamo ga u uzorak.

Primer 4.1.3. Iz populacije koja ima N=50 elemenata izabrati prost slu ajniuzorak veli ine n=8

a) bez ponavljanja, b) sa ponavljanjem.

Rešenje:

Obeležimo sve lanove populacije brojevima 1 do 50. Neka je slu ajno

izabrana cifra u Tablici slu ajnih brojeva, cifra koja se nalazi u šesnaestoj

vrsti i prvoj koloni.

Kako je N=50 dvocifren broj, grupisa emo sve ostale cifre u smeru sleva na

desno u brojeve od po dve cifre. Tako dobijamo

23 23 67 37 51 31 88 88 17 18 06 54 68 32 46 ...

a) u slu aju uzorka bez ponavljanja, u uzorak ulaze oni elementi populacije koji su obeleženi brojevima (23, 37, 31, 17, 18, 06, 32, 46);

b) u slu aju uzorka sa ponavljanjem, u uzorak ulaze oni elementi populacije koji su obeleženi brojevima (23, 23,37, 31, 17, 18, 06, 32).

Page 133: Poslovna statistika

Poslovna statistika

133

4.2. Raspodele parametara uzoraka

Neka odre eno obeležje u populaciji veli ine N ima slede e parametre: aritmeti ku sredinu koju obeležavamo sa , varijansu koju obeležavamo sa 2 i proporciju koju obeležavamo sa .

Da se podsetimo, ukoliko elementi populacije imaju vrednosti obeležja

Nxxx ,...,, 21 onda je aritmeti ka sredina obeležja u toj populaciji N

xN

i

i

1 ,

a varijansa N

xN

i

i

1

2

2

)(.

Tako e, to obeležje možemo posmatrati i kao slu ajnu promenljivu X, koja uzima vrednosti iz skupa Nxxx ,...,, 21 , sa odre enim verovatno ama, i za koju

onda važi )(XE , i 2)var(X .

Sa proporcijom populacije do sada se nismo susretali, i ona predstavlja verovatno u da odre eni lan populacije ima odre enu osobinu (ili odre enosvojstvo). Odnosno, ako M lanova populacije koja ima N lanova, ima osobinu koje nas interesuje, onda je proporcija te osobine u ovoj populaciji

jednakaN

M.

Na primer, u populaciji od 150 osoba je 90 puša a, pa je proporcija broja

puša a u toj populaciji jednaka 6.0150

90.

Nad ovom populacijom, kao što smo rekli, možemo izabrati Nn prostih

slu ajnih uzoraka veli ine n sa ponavljanjem i n

N prostih slu ajnih uzoraka

veli ine n bez ponavljanja.

U svakom od ovih uzoraka (recimo u i-tom uzorku iji su elementi nxxx ,...,, 21 ,

od kojih m n ima željenu osobinu) možemo izra unati aritmeti ku sredinu i-tog uzorka, varijansu i-tog uzorka i proporciju željene osobine u i-tom uzorku na slede i na in:

Page 134: Poslovna statistika

Poslovna statistika

134

aritmeti ka sredina i-tog uzorka: n

x

x

n

i

i

i1

__

,

varijansa i-tog uzorka:

ukoliko je aritmeti ka sredina populacije poznata

n

x

s

n

i

i

i1

2

2

)( ,

ukoliko je aritmeti ka sredina populacije nepoznata

1

)(1

2__

2,

n

xx

s

n

i

ii

ic ,

proporcija željene osobine u i-tom uzorku:

n

mpi .

U skupu svih mogu ih prostih slu ajnih uzoraka veli ine n sa i bez ponavljanja, vrednosti za aritmeti ku sredinu (varijansu i proporciju uzoraka) e se pojavljivati sa odre enim verovatno ama, jednakim koli niku broja

uzoraka koji imaju datu vrednost aritmeti ke sredine (varijanse i proporcije uzoraka) i broja svih mogu ih uzoraka.

To zna i da nad skupom svih mogu ih prostih slu ajnih uzoraka veli ine n

možemo definisati slede e slu ajne promenljive:

slu ajna promenljiva aritmeti ka sredina uzorka __

X :

ri

ri

pppp

xxxxX

21

____

2

__

1

____

,

gde je

Page 135: Poslovna statistika

Poslovna statistika

135

n

i

iN

xjednakasredinaaaritmetickjecijauzorakabrojp

__

(uzorci sa

ponavljanjem);

n

N

xjednakasredinaaaritmetickjecijauzorakabrojp

i

i

__

(uzorci bez

ponavljanja);

slu ajna promenljiva varijansa uzorka:

2S - ukoliko je aritmeti ka sredina populacije poznata

ki

ki

pppp

ssssS

21

2222

212 ,

gde je

n

ii

N

sjednakaijansajecijauzorakabrojp

2var (uzorci sa ponavljanjem);

n

N

sjednakaijansajecijauzorakabrojp i

i

2var (uzorci bez ponavljanja);

Page 136: Poslovna statistika

Poslovna statistika

136

2cS - ukoliko je aritmeti ka sredina populacije nepoznata

li

lciccc

cpppp

ssssS

21

2,

2,

22,

21,2 ,

gde je

n

ic

iN

sjednakaijansajecijauzorakabrojp

2,var

(uzorci sa ponavljanjem);

n

N

sjednakaijansajecijauzorakabrojp

ic

i

2,var

(uzorci bez ponavljanja);

slu ajna promenljiva proporcija uzorka Pr:

si

si

rqqqq

ppppP

21

21 ,

gde je

n

ii

N

pjednakaproporcijajecijauzorakabrojq (uzorci sa ponavljanjem);

n

N

pjednakaproporcijajecijauzorakabrojq i

i (uzorci bez ponavljanja).

Page 137: Poslovna statistika

Poslovna statistika

137

Primer 4.2.1. Za datu populaciju 1, 2, 3, 4, odrediti sve uzorke

a) sa ponavljanjem, b) bez ponavljanja,

veli ine n=2 i prikazati raspodelu slu ajne promenljive aritmeti ka sredina

uzorka__

X .

Rešenje:

a) Broj uzoraka sa ponavljanjem veli ine n dobijenih iz populacije veli ine N

iznosi nN . U našem slu aju je n=2, N=4, pa je broj svih uzoraka sa

ponavljanjem jednak 42=16. Ovi uzorci i njihove srednje vrednosti date su u

Tabeli 4.2.1.a.

Redni broj

uzorka (i) Uzorak

Srednja

vrednost

uzorka )(_

ix

Redni broj

uzorka (i) Uzorak

Srednja

vrednost

uzorka

)(_

ix

1 (1,1) 1 9 (3,1) 2

2 (1,2) 1,5 10 (3,2) 2,5

3 (1,3) 2 11 (3,3) 3

4 (1,4) 2,5 12 (3,4) 3,5

5 (2,1) 1,5 13 (4,1) 2,5

6 (2,2) 2 14 (4,2) 3

7 (2,3) 2,5 15 (4,3) 3,5

8 (2,4) 3 16 (4,4) 4

Tabela 4.2.1.a.

Slu ajna promenljiva aritmeti ka sredina uzorka sa ponavljanjem X ima

slede u raspodelu verovatno a

16

1

16

2

16

3

16

4

16

3

16

2

16

1

45,335,225,11:X ,

dobijenu iz tablice 4.2.1.a.

Page 138: Poslovna statistika

Poslovna statistika

138

b) Broj uzoraka bez ponavljanja veli ine n dobijenih iz populacije veli ine N

iznosin

N. U našem slu aju je n=2, N=4, pa je broj svih uzoraka sa

ponavljanjem jednak .62

4 Ovi uzorci i njihove srednje vrednosti date su u

Tabeli 4.2.1.b.

Redni broj

uzorka (i) Uzorak

Srednja

vrednost

uzorka )(_

ix

Redni broj

uzorka (i) Uzorak

Srednja

vrednost

uzorka

)(_

ix

1 (1,2) 1,5 4 (2,3) 2,5

2 (1,3) 2 5 (2,4) 3

3 (1,4) 2,5 6 (3,4) 3,5

Tabela 4.2.1.b.

Slu ajna promanljiva aritmeti ka sredina uzorka bez ponavljanja X ima

slede u raspodelu verovatno a

6

1

6

1

6

2

6

1

6

1

5,335,225,1:X ,

dobijenu iz tablice 4.2.1.b.

U nekim okolnostima raspodele ovih slu ajnih promenljivih, koje u stvari predstavljaju parametre uzorka, podležu zakonitostima koje smo obradili u poglavlju 3. ovog udžbenika. Odredimo te okolnosti i raspodele po kojima se tada ponašaju ovi parametri uzoraka.

Page 139: Poslovna statistika

Poslovna statistika

139

4.2.1. Raspodela aritmeti ke sredine uzoraka __

X

Za matemati ko o ekivanje )(__

XE i varijansu )var(__

X slu ajne promenljive

aritmeti ka sredina uzorka __

X , formirane nad uzorcima veli ine n, iz populacije u kojoj je aritmeti ka sredina obeležja i varijansa obeležja 2

:

ri

ri

pppp

xxxxX

21

____

2

__

1

____

gde r predstavlja broj razli itih aritmeti kih sredina uzoraka iz skupa aritmeti kih sredina svih uzoraka, važi slede e:

- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez ponavljanja

kod kojih je 05.0N

n)

nN

x

pxX

N

x

pxXE

n

N

i

ir

i

ii

n

N

i

ir

i

ii

n

n

21

2__

1

2____

1

__

1

____

)()()var(

)(

- ako su uzorci bez ponavljanja kod kojih je 05.0N

n

Page 140: Poslovna statistika

Poslovna statistika

140

1

)()()var(

)(

21

2__

1

2____

1

__

1

____

N

nN

n

n

N

x

pxX

n

N

x

pxXE

nN

i

ir

i

ii

nN

i

ir

i

ii

Primer 4.2.1.1. Pokazati da u Primeru 4.2.1. važi

a) da je n

XiXEX

22

_

var ,

b) da je 1

var2

2_

N

nN

nXiXE

X

,

gde su i 2 aritmeti ka sredina i varijansa populacije respektivno.

Rešenje:

Srednja vrednost i varijansa populacije iznose

5,24

4321

4

5

4

5,245,235,225,21 22222 ,

pa je imaju i u vidu rezultate Primera 4.2.1.

Page 141: Poslovna statistika

Poslovna statistika

141

a)

.)(

5,216

14

16

25,3

16

33

16

45,2

16

32

16

25,1

16

11

)(7

1

_

XE

dakle

pxXEi

ii

8

55,2

16

14

16

25,3

16

33

16

45,2

16

32

16

25,1

16

11

)var(

2222

2222

222 XEXEXX

Kako je

n

jetoni

X

22

2

24

5

24

5

Page 142: Poslovna statistika

Poslovna statistika

142

b)

.)(

5,26

15,3

6

13

6

25,2

6

12

6

15,1

)(5

1

_

XE

dakle

pxXEi

ii

.114

24

24

5

12

55,2

6

15,3

6

13

6

25,2

6

12

6

15,1

)var(

22

222222

222

N

nN

n

odnosno

XEXEX

X

X

Raspodela slu ajne promenljive aritmeti ka sredina uzorka __

X može se odrediti u zavisnosti od raspodele samog obeležja u populaciji na slede i na in:

i) ako posmatrano obeležje u populaciji ima N( ,2) raspodelu, onda:

- ako je 2populacije poznato,

- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez

ponavljanja kod kojih je 05.0N

n),

onda

),(~2__

nNX ,

Page 143: Poslovna statistika

Poslovna statistika

143

- ako su uzorci bez ponavljanja kod kojih je 05.0N

n,

onda

)1

,(~2__

N

nN

nNX ;

- ako je 2populacije nepoznato,

- ako je poznato,

- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez

ponavljanja kod kojih je 05.0N

n) ,

onda

nt

n

S

X~

__

;

- ako su uzorci bez ponavljanja kod kojih je 05.0N

n ,

onda

nt

N

nN

n

S

X~

1

__

;

- ako je nepoznato,

- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez

ponavljanja kod kojih je 05.0N

n) ,

onda

Page 144: Poslovna statistika

Poslovna statistika

144

1

__

~ n

c

t

n

S

X ;

- ako su uzorci bez ponavljanja kod kojih je 05.0N

n,

onda

1

__

~

1

n

c

t

N

nN

n

S

X ;

ii) ako posmatrano obeležje u populaciji nema N( ,2) raspodelu,

onda aproksimativno važi:

- ako su uzorci sa ponavljanjem (ili N ),

uzimamo dovoljno veliki uzorak pod kojim podrazumevamo uzorak veli ine n 30 i za njega važe svi rezultati kao i uslu aju kad obeležje u populaciji imaN( ,

2) raspodelu;

- ako su uzorci bez ponavljanja,

uzimamo dovoljno veliki uzorak iz dovoljne velike populacije, pod kojim podrazumevamo uzorak veli ine

n 30 i populaciju za koju je 2

Nn , i za njega važe svi

rezultati kao i uslu aju kada obeležje u populaciji imaN( ,

2) raspodelu.

Prisetimo se da za n 30 možemo raspodelu tn dovoljno dobro aproksimirati N(0,1) raspodelom.

Page 145: Poslovna statistika

Poslovna statistika

145

Primer 4.2.1.2.

a) Pakovanja jedne vrste robe imaju težinu u proseku 50 kg i standardnu devijaciju 0.5 kg. Odrediti verovatno u da eprose na težina 250 pakovanja ove robe biti manja od 49.95 kg.

b) 1000 pakovanja jedne vrste robe imaju težinu u proseku 50 kg i standardnu devijaciju 0.5 kg. Odrediti verovatno u da eprose na težina slu ajno izabranih 250 od ovih 1000 pakovanja biti manja od 49.95 kg.

Rešenje:

a) Kako su podaci o prose noj težini kg50 i standardnoj devijaciji

kg5.0 odnose na beskona nu populaciju, i kako je veli ina uzorka

n=250>30, to slu ajna promenljiva prose na težina uzorka _

X ima približno

nN

2

, raspodelu, pa važi:

0571,09429,01)58,1(1)58,1(

250

5.05095.49

95.49_

FZP

n

XPXP

b) Kako su podaci o prose noj težini kg50 i standardnoj devijaciji

kg5.0 odnose na kona nu populaciju veli ine N=1000, i kako je veli ina

uzorka n=250>30 i 5002

25005,025,0N

niN

n , to slu ajna

promenljiva prose na težina uzorka _

X ima približno

1,

2

N

nN

nN raspodelu, pa važi:

Page 146: Poslovna statistika

Poslovna statistika

146

0344,09656,01)82,1(1)82,1(

11000

2501000

250

5.0

5095.49

1

95.49_

FZP

N

nN

n

XPXP

4.2.2. Raspodela razlike aritmeti kih sredina uzoraka, 2

__

1

__

XX

Ukoliko uzimamo nezavisne uzorke veli ine n1 i n2 iz dve populacije, gde u prvoj populaciji obeležje X1 ima parametre 2

1111 )var()( XiXE , a u

drugoj populaciji obeležje X2 ima parametre 22222 )var()( XiXE , onda

slu ajna promenljiva razlika aritmeti kih sredina uzoraka, 2

__

1

__

XX , ima

parametre 212

__

1

__

)( XXE i 2

22

1

21

2

__

1

__

)var(nn

XX .

Tako e važi:

- ako ),(~),(~ 2222

2111 NXiNX ,

onda

2

22

1

21

212

__

1

__

,~nn

NXX ;

- ako ne znamo zakon raspodele obeležja X1 i X2 ,

onda aproksimativno važi:

ako je n1 30 i n2 30 , tada:

2

22

1

21

212

__

1

__

,~nn

NXX .

Page 147: Poslovna statistika

Poslovna statistika

147

Zadatak 4.2.2. Baterije iz fabrike A imaju srednje vreme trajanja 200 asova i standardno odstupanje 30 asova, dok iz fabrike B srednje vreme trajanja 180 asova i standardno odstupanje 20 asova. Ako izaberemo 250 baterija iz fabrike A i 200 baterija iz

fabrike B, kolika je verovatno a da e srednje vreme trajanja baterija iz fabrike A biti duže bar 25 asova od srednjeg vremena trajanja baterija iz fabrike B?

4.2.3. Raspodela proporcije uzoraka Pr

Za matemati ko o ekivanje )( rPE i varijansu )var( rP slu ajne promenljive

proporcija uzorka rP , formirane nad uzorcima veli ine n, iz populacije u kojoj

je proporcija obeležja :

si

si

rqqqq

ppppP

21

21 ,

gde s predstavlja broj razli itih proporcija uzoraka iz skupa proporcija svih uzoraka, važi slede e:

- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez ponavljanja

kod kojih je 05.0N

n):

nN

p

qpP

N

p

qpPE

n

N

i

is

i

iir

n

N

i

is

i

iir

n

n

1)(

)()var(

)(

1

2

1

2

1

1

Page 148: Poslovna statistika

Poslovna statistika

148

- ako su uzorci bez ponavljanja kod kojih je 05.0N

n:

1

1)(

)()var(

)(

1

2

1

2

1

1

N

nN

n

n

N

p

qpP

n

N

p

qpPE

nN

i

is

i

iir

nN

i

is

i

iir

Ukoliko se radi o uzorcima sa ponavljanjem (ili N ), onda slu ajnapromenljiva proporcija uzorka rP podleže zakonu binomne raspodele, a ukoliko se radi o uzorcima bez ponavljanja, onda slu ajna promenljiva proporcija uzorka rP podleže zakonu hipergeometrijske raspodele, sa gore navedenim parametrima.

Ukoliko je veli ina uzorka takva da je 515 nin , tada aproksimativno važi slede e:

- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez ponavljanja

kod kojih je 05.0N

n), onda

)1

,(~n

NPr ;

- ako su uzorci bez ponavljanja kod kojih je 05.0N

n onda

)1

1,(~

N

nN

nNPr .

Page 149: Poslovna statistika

Poslovna statistika

149

Primer 4.2.3.1.

a) Poznato je da je u zdravstvu 65% zaposlenih ženskog pola. Na slu ajan na in je izabrano 50 osoba koje su zaposlene u zdravstvu. Kolika je verovatno a da je me u njima više od 35 žena?

b) U grupi od 800 osoba zaposlenih u zdravstvu 520 su ženskog pola. Iz te grupe na slu ajan na in je izabrano 50 osoba. Kolika je verovatno ada je me u njima više od 35 žena?

Rešenje:

a) Kako se podatak o proporciji žena u zdravstvu =0,65 odnosi na

beskona nu populaciju, i kako je 55.3265,050n i

55.1735,0501n , to slu ajna promenljiva proporcija žena u

uzorku Pr ima približno n

N1

, raspodelu, pa važi

.2296,07704,01)74,0(174,0

50

35,065,0

65,050

35

150

35

FZP

n

PPPP r

r

b) Kako se podatak o proporciji žena u zdravstvu 65,0800

520

odnosi na kona nu populaciju N=800 i kako je 55.3265,050n i

55.1735,0501n i 05,00625,0800

50

N

nto slu ajna

promenljiva proporcija žena u uzorku Pr ima približno

1

1,

N

nN

nN raspodelu, pa važi

Page 150: Poslovna statistika

Poslovna statistika

150

.2236,07764,01)76,0(176,0

1800

50800

50

35,065,0

65,050

35

1

150

35

FZP

N

nN

n

PPPP r

r

4.2.4. Raspodela varijanse uzoraka, 2S - poznato, 2cS - nepoznato

Ukoliko se slu ajna promenljiva X u populaciji raspodeljuje po zakonu N( ,2)

onda u slu aju kada je:

- poznato

za slu ajnu promenljivu varijansa uzorka 2S važi:

- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez

ponavljanja kod kojih je 05.0N

n), onda

22

2

~ n

Sn ;

- ako su uzorci bez ponavljanja kod kojih je 05.0N

n, onda

aproksimativno važi:

ako je n 30 i2

Nn , tada

22

2

~ n

Sn ;

Page 151: Poslovna statistika

Poslovna statistika

151

- nepoznato

za slu ajnu promenljivu varijansa uzorka 2cS važi:

- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez

ponavljanja kod kojih je 05.0N

n), onda

212

2

~)1(

ncSn

;

-ako su uzorci bez ponavljanja kod kojih je 05.0N

n, onda

aproksimativno važi:

ako je n 30 i2

Nn , tada

212

2

~)1(

ncSn

.

Zadatak 4.2.4. a) Iz populacije iji su parametri 5150 2i , uzet je prost

slu ajni uzorak veli ine n=11. Kolika je verovatno a da je varijansa tog uzorka manja od 9?

b) Iz populacije iji je parametar 502 , uzet je prost slu ajniuzorak veli ine n=11. Kolika je verovatno a da je varijansa tog uzorka manja od 20?

Page 152: Poslovna statistika

Poslovna statistika

152

5. STATISTI KO OCENJIVANJE

Suština analize uzoraka neke populacije ogleda se upravo u tome da se iz što manje uzoraka (obi no iz jednog) dobiju zadovoljavaju e informacije o ponašanju obeležja u itavoj populaciji. To ponašanje obeležja u itavojpopulaciji je zadovoljavaju e opisano analizom uzorka, ukoliko su analizom tog uzorka dovoljno dobro procenjeni parametri populacije (aritmeti kasredina, proporcija, varijansa) i ukoliko je dovoljno dobro procenjen zakon raspodele tog obeležja u populaciji.

Analiza uzorka pomo u koje se procenjuju parametri populacije naziva se parametarska analiza i ona e u nekom obimu biti obra ena u ovom udžbeniku.

Analiza uzorka pomo u koje se procenjuje zakon raspodele obeležja u populaciji naziva se neparametarska analiza i ona ne e biti obra ena u ovom udžbeniku.

Parametarska analiza se vrši na dva na ina, u zavisnosti od raspoloživih informacija o populaciji.

Prvi na in, koji se zove statisti ko ocenjivanje, primenjuje se u slu ajevima kada parametri populacije nisu poznati, pa ih iz uzetog uzorka procenjujemo, odnosno ocenjujemo. Ovaj na in emo obraditi u ovom 5. poglavlju udžbenika.

Drugi na in, koji se zove testiranje parametarskih statisti kih hipoteza,primenjuje se u slu ajevima kada su parametri populacije bili poznati, pa iz uzetog uzorka proveravamo da li su se promenili i u kom smeru je promena išla, odnosno da li su se pova ali ili smanjili. Ovaj na in emo obraditi u 6. poglavlju ovog udžbenika.

U postupku statisti kog ocenjivanja zaklju ak o nepoznatoj vrednosti parametra populacije koji ocenjujemo možemo dati u vidu jedne brojne vrednosti i tada se ta ocena zove ta kasta ocena, ili u vidu intervala mogu ihvrednosti i tada se ta ocena zove intervalna ocena.

Page 153: Poslovna statistika

Poslovna statistika

153

5.1 Ta kaste ocene

Obeležimo sa Q parametar populacije koji želimo da ocenimo (aritmeti kasredina, proporcija, varijansa...) pomo u neke ta kaste ocene dobijene iz prostog slu ajnog uzorka veli ine n. Neka je populacija okarakterisana slu ajnom promenljivom X koja uzima vrednosti iz skupa Nxxx ,...,, 21 i neka

je uzorak uzeo vrednosti nxxx ,...,, 21 . Obeležimo sa Un vrednost ocene

parametra Q izra unate iz uzorka ije su vrednosti nxxx ,...,, 21 . O igledno da

e vrednost ocene Un zavisiti od vrednosti nxxx ,...,, 21 , odnosno zavisi e od

izabranog uzorka. Dakle, na konkretnom uzorku ije su vrednosti nxxx ,...,, 21 ,

ocena Un je neka funkcija od nxxx ,...,, 21 , ),...,,( 21 nn xxxfU .

Ako bismo izvla ili više uzoraka od n elemenata, elementi koji su prvi izvu eni u svakom uzorku, a to su oni ozna eni indeksom 1, u razli itim uzorcima bi uzimali razli ite vrednosti sa razli itim verovatno ama, pa sve te vrednosti definišu jednu slu ajnu promenljivu koju emo obeležiti sa X1.Sli no, elementi koji su u više uzoraka izabrani na drugom mestu obrazuju slu ajnu promenljivu X2 itd. Na taj na in ocena U je funkcija n-dimenzionalne slu ajne promenljive (X1, X2, ..., Xn), U = f(X1, X2, ..., Xn), pa i sama predstavlja slu ajnu promenljivu sa nekom svojom raspodelom verovatno a.

Kako postoji beskona no veliki broj funkcija koje možemo definisati na promenljivima (X1, X2, ..., Xn), prirodno je definisati ocenu U na slede i na in:

ocenom parametra Q naziva se funkcija U=f(X1, X2, ..., Xn), koja sa verovatno om bliskom jedinici zadovoljava približnu jednakost U Q kada je brojnost uzorka dovoljno velika, to jest ako važi

nNn

CQUP 1lim ,

gde je C odre ena pozitivna konstanta.

Ova definicija dopušta da se na mnogo na ina definišu razne ocene za isti parametar Q. Na primer, aritmeti ku sredinu populacije možemo oceniti i aritmeti kom sredinom, i medijanom, i modom, i geometrijskom sredinom uzorka, itd. Ali, neke od ovih ocena ta nije ocenjuju parametar populacije od

Page 154: Poslovna statistika

Poslovna statistika

154

drugih. O igledno je da je ocena utoliko bolja ukoliko za manje vrednosti konstante C zadovoljava jednakost

nNn

CQUP 1lim .

U cilju nalaženja najefikasnije ocene parametra populacije Q, neophodno je izvršiti slede u klasifikaciju ocena:

- Saglasne (konzistentne) ocene. Saglasna (konzistentna) je ona ocena U=f(X1,X2,...,Xn) parametra populacije Q za koju važi

1)(lim0 QUP

nNn

.

Odnosno, ocena je saglasna (konzistentna) ako konvergira u verovatno i ka parametru koga ocenjuje kada broj elemenata uzorka raste.

- Centrirana (nepristrasna) ocena. Ocena U=f(X1,X2,...,Xn) parametra populacije Q je centrirana (saglasna) ako važi

QUE )( ,

to jest, ocena je centrirana (saglasna) ako je njeno matemati ko o ekivanjejednako parametru populacije koga ocenjuje.

- Najefikasnija ocena. Najefikasnija ocena je ona saglasna i centrirana

ocena koja ima najmanju varijansu.

Donja granica varijansi svih mogu ih ocena U parametra Q odre ena je nejednakoš u Rao-Kramera, koju ovde ne emo navoditi.

Za primenu su, naravno, najpogodnije najefikasnije ocene, ali one ne postoje uvek. U slu ajevima kada ih nema treba ispitati da li postoje asimptotski nejefikasnije ocene.

- Asimptotski najefikasnija ocena. Ukoliko ocena U0 ima najmanju mogu uvarijansu odre enu nejednakoš u Rao-Kramera, (a nije najefikasnija jer nije

Page 155: Poslovna statistika

Poslovna statistika

155

saglasna ili centrirana), onda za ocenu U koja je saglasna i centrirana kažemo da je asimptotski najefikasnija ukoliko važi:

1)var(

)var(lim 0

U

U

nNn

.

Pokazuje se da važi slede e:

1. Najefikasnija ocena za aritmeti ku sredinu populacije je aritmeti ka

sredina uzorka __

X , ija je realizacija na uzorku nxxx ,...,, 21 jednaka

n

x

x

n

i

i

1__

.

2. Najefikasnija ocena za proporciju populacije je proporcija uzorka Pr

ija je realizacija na uzorku od n elemenata me u kojima je m sa

osobinom iju proporciju ocenjujemo jednaka n

mpr .

3. Najefikasnija ocena za parametar populacije u kojoj obeležje podleže Puasonovoj P( ) raspodeli je aritmeti ka sredina realizovanih vrednosti parametra i u uzorku. Dakle, ako ocenu parametra populacije

, ozna imo sa oc, onda je na uzorku n,...,, 21 najefikasnija ocena

n

n

i

i

oc1 .

4. Asimptotski najefikasnija ocena za varijansu populacije 2, ija je aritmeti ka sredina -poznata je varijansa uzorka S2, ija je realizacija

na uzorku nxxx ,...,, 21 jednaka n

x

s

n

i

i

1

2

2

)(.

Page 156: Poslovna statistika

Poslovna statistika

156

5. Asimptotski najefikasnija ocena za varijansu populacije 2, ija je aritmeti ka sredina -nepoznata, je varijansa uzorka Sc

2, ija je

realizacija na uzorku nxxx ,...,, 21 jednaka 1

)(1

2__

2

n

xx

s

n

i

i

c .

Page 157: Poslovna statistika

Poslovna statistika

157

5.2. Intervalne ocene

Intervalna ocena parametra populacije Q predstavlja interval vrednosti u kome sa odre enom verovatno om o ekujemo da se nalazi parametar populacije Q, i to takav interval da je verovatno a da je vrednost parametra Q ve a od gornje granice intervala, jednaka verovatno i da je vrednost parametra Q manja od donje granice intervala. Takav interval nazivamo simetri an interval u pogledu

verovatno e.

Taj interval vrednosti predstavlja interval oko neke fiksne vrednosti izra unateiz konkretnog uzorka. Ta fiksna vrednost je obi no ta kasta ocena parametra iju intervalnu ocenu tražimo, odnosno parametra Q.

Verovatno a da se parametar Q nalazi u tom intervalu iznosi 1- i zovemo je koeficijent pouzdanosti intervalne ocene. Dakle, ako interval (a,b) predstavlja intervalnu ocenu za parametar Q sa koeficijentom pouzdanosti 1- , to zna i da važi slede e:

.2

)()(

1)(

bQPaQP

bQaP

O igledno da pove anje koeficijenta pouzdanosti pove ava širinu intervala, što sa svoje strane smanjuje preciznost, odnosno prakti nu upotrebljivost ocene.

Intervalne ocene parametra Q iz uzorka odre ujemo na osnovu zakonitosti po kojima se ta kasta ocena tog parametra U raspodeljuje u skupu svih mogu ihuzorka tog tipa uzetih iz populacije sa parametrom Q. Zakone raspodele koji su nam potrebni u ovom delu, analizirali smo u poglavlju 4. ovog udžbenika.

Page 158: Poslovna statistika

Poslovna statistika

158

5.2.1. Intervalna ocena aritmeti ke sredine populacije,

Kako je ta kasta ocena aritmeti ke sredine populacije , aritmeti ka

sredina uzorka __

X ija je raspodela data u 4. poglavlju, važi slede e:

j) ako posmatrano obeležje u populaciji ima N( ,2) raspodelu, onda:

- ako je 2populacije poznato:

- ako su uzorci sa ponavljanjem (ili N , ili uzorci

bez ponavljanja kod kojih je 05.0N

n),

onda:

),(~2__

nNX odnosno )1,0(~

__

N

n

X,

pa važi videti Sliku 5.2.1.1.

0

0.25

0.5

dnorm x 0 1( )

x

Slika 5.2.1.1. Funkcija raspodele N(0,1)

1-

2

z

2

2

z

Page 159: Poslovna statistika

Poslovna statistika

159

1)(

1)(

2

__

2

__

2

__

2

nzx

nzxP

z

n

xzP

Dakle, pod ovim uslovima simetri na intervalna ocena aritmeti ke sredine populacije sa koeficijentom pouzdanosti 1- je:

),(2

__

2

__

nzx

nzx .

Pod ovim uslovima možemo unapred odrediti veli inuuzorka n, pomo u koga emo dobiti interval ocene širine

L, sa nivoom pouzdanosti 1- . Naime, važi

2

2

2

2

2 L

z

nn

zL

- ako su uzorci bez ponavljanja kod kojih je

05.0N

n, onda:

)1

,(~2__

N

nN

nNX odnosno )1,0(~

1

__

N

N

nN

n

X,

pa važi videti Sliku 5.2.1.1.

Page 160: Poslovna statistika

Poslovna statistika

160

1)11

(

1)

1

(

2

__

2

__

2

__

2

N

nN

nzx

N

nN

nzxP

z

N

nN

n

xzP

Dakle, pod ovim uslovima simetri na intervalna ocena aritmeti ke sredine populacije sa koeficijentom pouzdanosti 1- je:

)1

,1

(2

__

2

__

N

nN

nzx

N

nN

nzx .

- Ako je 2populacije nepoznato:

ako je poznato, besmisleno je tražiti interval poverenja za ;

ako je nepoznato,

- ako su uzorci sa ponavljanjem (ili N , ili uzorci

bez ponavljanja kod kojih je 05.0N

n), onda:

1

__

~ n

c

t

n

S

X, pa važi videti Sliku 5.2.1.2.

Page 161: Poslovna statistika

Poslovna statistika

161

0

0.25

0.5

dnorm x 0 1( )

x

Slika 5.2.1.2. Funkcija raspodele tn-1

1)(

1)(

2,1

__

2,1

__

2,1

__

2,1

n

stx

n

stxP

t

n

s

xtP

c

n

c

n

nc

n

Dakle, pod ovim uslovima simetri na intervalna ocena aritmeti ke sredine populacije sa koeficijentom pouzdanosti 1- je:

),(2

,1

__

2,1

__

n

stx

n

stx c

n

c

n.

- Ako su uzorci bez ponavljanja kod kojih je

05.0N

n, onda :

1-

2,1n

t

2

2,1nt

Page 162: Poslovna statistika

Poslovna statistika

162

1

__

~

1

n

c

t

N

nN

n

S

X, pa važi videti Sliku 5.2.1.2.

1)11

(

1)

1

(

2,1

__

2,1

__

2,1

__

2,1

N

nN

n

stx

N

nN

n

stxP

t

N

nN

n

s

xtP

c

n

c

n

nc

n

Dakle, pod ovim uslovima, simetri na intervalna ocena aritmeti ke sredine populacije sa koeficijentom pouzdanosti 1- je:

)1

,1

(2

,1

__

2,1

__

N

nN

n

stx

N

nN

n

stx c

n

c

n.

iii) Ako posmatrano obeležje u populaciji nema N( ,2) raspodelu,

onda aproksimativno važi:

- ako su uzorci sa ponavljanjem (ili N ),

uzimamo dovoljno veliki uzorak pod kojim podrazumevamo uzorak veli ine n 30 i za njega važe svi rezultati kao i uslu aju kada obeležje u populaciji ima N( ,

2) raspodelu;

- ako su uzorci bez ponavljanja,

uzimamo dovoljno veliki uzorak iz dovoljne velike populacije, pod kojim podrazumevamo uzorak veli ine

Page 163: Poslovna statistika

Poslovna statistika

163

n 30 i populaciju za koju je 2

Nn , i za njega važe svi

rezultati kao i uslu aju kada obeležje u populaciji imaN( ,

2) raspodelu.

Primer 5.2.1. Poznato je da broj poena studenata na ispitu ima N( ,2)

raspodelu gde je parametar nepoznat. Slu ajan uzorak od 20 studenata uzet iz ogromne populacije, ima na ovom ispitu srednji broj poena 70 i na njemu je izra unata centrirana varijansa uzorka sc=10. Odrediti interval poverenja za srednji broj poena svih zadataka na ovom ispitu, ako je koeficijent pouzdanosti 1- jednak: 1- =0,99.

Rešenje:

Kako broj poena ima normalnu raspodelu sa nepoznatom varijansom i kako je

populacija ogromna, odnosno uzorak je manji od 5% populacije, to za

proizvoljan koeficijent pouzdanosti 1- važi:

12

,1

_

2,1

_

n

stx

n

stxP c

nc

n gde vrednost 2

,1nt itamo iz

Studentove t-tablice za n-1 stepeni slobode kao 22

,11

nn ttP . U ovom

slu aju broj stepeni slobode je 19.

Dakle, interval poverenja za srednji broj poena svih zadataka iznosi:

za 86,2005,02

99,01 005,0,19t , pa je

20

1086,270

20

1086,270 ,

odnosno

395.76605.63 .

Page 164: Poslovna statistika

Poslovna statistika

164

5.2.2. Intervalna ocena razlike aritmeti kih sredina populacija, 21

Za nezavisne uzorke veli ine n1 i n2 iz dve populacije gde u prvoj populaciji obeležje X1 ima parametre 2

1111 )var()( XiXE , a u drugoj populaciji

obeležje X2 ima parametre 22222 )var()( XiXE , važi:

- ako ),(~),(~ 2222

2111 NXiNX

onda:

2

22

1

21

212

__

1

__

,~nn

NXX , odnosno

)1,0(~)(

2

22

1

21

212

__

1

__

N

nn

XX, pa važi videti Sliku 5.2.1.1.

1)(

1))(

(

2

22

1

21

2

2

__

1

__

212

22

1

21

2

2

__

1

__

2

2

22

1

21

212

__

1

__

2

nnzxx

nnzxxP

z

nn

xxzP

Dakle, pod ovim uslovima simetri na intervalna ocena razlike aritmeti kihsredina ovih populacija sa koeficijentom pouzdanosti 1- je:

),(2

22

1

21

2

2

__

1

__

2

22

1

21

2

2

__

1

__

21nn

zxxnn

zxx .

Page 165: Poslovna statistika

Poslovna statistika

165

- Ako ne znamo zakon raspodele obeležja X1 i X2,

onda aproksimativno važi:

ako je n1 30 i n2 30, tada

2

22

1

21

212

__

1

__

,~nn

NXX , pa i tada važi da je simetri na

intervalna ocena razlike aritmeti kih sredina ovih populacija sa koeficijentom pouzdanosti 1- jednaka:

),(2

22

1

21

2

2

__

1

__

2

22

1

21

2

2

__

1

__

21nn

zxxnn

zxx .

Page 166: Poslovna statistika

Poslovna statistika

166

Primer 5.2.2. Testira se u inak novih lekova za spavanje pomo u dve grupe bolesnika sli nih karakteristika, tako što prva grupa od 50 bolesnika uzima ove lekove, dok ih druga grupa od 60 bolesnika ne uzima. Dužina spavanja bolesnika iz prve grupe je prose no 8.2 asova, a u drugoj 7.3 asova. Zna se da standardna devijacija dužine spavanja prve grupe bolesnika iznosi

30,01 asova, dok je standardna devijacija druge grupe bolesnika

40,02 asova. Odrediti interval poverenja za razliku srednjih vrednosti dužina spavanja koju prouzrokuje uzimanje ispitivanih lekova, ako je koeficijent pouzdanosti 1- jednak 0,95.

Rešenje:

Kako n1>30 i n2>30, to za proizvoljan koeficijent pouzdanosti 1- važi:

12

22

1

21

2

2

_

1

_

212

22

1

21

2

2

_

1

_

nnZxx

nnZxxP

gde vrednost 2

Z itamo iz tablice za N(0,1) raspodelu kao 2

12

ZF .

Dakle, interval poverenja za razliku srednjih vrednosti dužine spavanja iznosi:

za 96,1)975,0(025,02

95,012

FZ pa je

60

40,0

50

30,096,137.72.8

60

40,0

50

30,096,13.72.8

22

21

22

odnosno

967.0833.0 21 ,

tj. sa verovatno om 0,95 smatramo da je novi lek produžio spavanje u proseku

za 0.833 do 0.967 asova.

Page 167: Poslovna statistika

Poslovna statistika

167

5.2.3. Intervalna ocena proporcije populacije

Ukoliko su veli ina uzorka n i realizovana proporcija na uzorku pr takvi da je 3051,5 nipnpn rr , tada aproksimativno važi slede e:

-ako su uzorci sa ponavljanjem (ili N , ili uzorci bez ponavljanja

kod kojih je 05.0N

n), onda:

)1

,(~n

ppNP rr

r odnosno )1,0(~1

N

n

pp

P

rr

r ,

pa važi videti Sliku 5.2.1.1.

1)11

(

1)1

(

22

22

n

ppzp

n

ppzpP

z

n

pp

pzP

rrr

rrr

rr

r

Dakle, pod ovim uslovima, simetri na intervalna ocena proporcije populacije sa koeficijentom pouzdanosti 1- je:

)1

,1

(22 n

ppzp

n

ppzp rr

rrr

r .

Pod ovim uslovima možemo unapred odrediti veli inu uzorka n, pomo ukoga emo dobiti interval ocene proporcije, širine L, sa nivoom pouzdanosti 1- . Naime, važi:

Page 168: Poslovna statistika

Poslovna statistika

168

2

2

2

2

)1(1

L

ppz

nn

ppzL

rr

rr , a kako je

4

11 rr pp , to je

2

2

2

4 L

z

n .

- Ako su uzorci bez ponavljanja kod kojih je 05.0N

n, onda:

)1

1,(~

N

nN

n

ppNP rr

r , odnosno

)1,0(~

1

1N

N

nN

n

pp

P

rr

r ,

pa važi videti Sliku 5.2.1.1.

1)1

1

1

1(

1)

1

1(

22

22

N

nN

n

ppzp

N

nN

n

ppzpP

z

N

nN

n

pp

pzP

rrr

rrr

rr

r

Dakle, pod ovim uslovima simetri na intervalna ocena proporcije populacije sa koeficijentom pouzdanosti 1- je:

)1

1,

1

1(

22 N

nN

n

ppzp

N

nN

n

ppzp rr

rrr

r .

Page 169: Poslovna statistika

Poslovna statistika

169

Zadatak 5.2.3. U uzorku od 80 bolesnika od tuberkoloze, uzetog iz skupa od 500 bolesnika, ima 52 puša a. Odrediti interval poverenja za broj puša a u ovom skupu od 300 obolelih, ako je koeficijent pouzdanosti 1- jednak 0,90.

Page 170: Poslovna statistika

Poslovna statistika

170

5.2.4. Intervalna ocena varijanse populacije, 2

Ukoliko se slu ajna promenljiva X u populaciji raspodeljuje po zakonu N( ,

2), onda u slu aju kada je:

- poznato

za slu ajnu promenljivu varijansa uzorka 2S važi:

- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez

ponavljanja kod kojih je 05.0N

n), onda:

22

2

~ n

Sn , pa važi videti Sliku 5.2.4.1.

0 2 4 6 8 10 12 14 16 18 200

0.05

0.1

0.15

dchisq x 7( )

x

5.2.4.1. Funkcija raspodele 2n

22

1

2

21,n

2

2,n

Page 171: Poslovna statistika

Poslovna statistika

171

1)(

1)(

2

21,

22

2

2,

2

2

2,2

22

21,

nn

nn

SnSnP

SnP

Dakle, pod ovim uslovima simetri na intervalna ocena varijanse populacije sa koeficijentom pouzdanosti 1-je:

2

21,

2

2

2,

22 ,

nn

SnSn.

- Ako su uzorci bez ponavljanja kod kojih je 05.0N

n, onda

aproksimativno važi:

ako je n 30 i2

Nn , tada

22

2

~ n

Sn, pa i tada važi da je

simetri na intervalna ocena varijanse populacije sa koeficijentom pouzdanosti 1- jednaka:

2

21,

2

2

2,

22 ,

nn

SnSn.

Page 172: Poslovna statistika

Poslovna statistika

172

- nepoznato

za slu ajnu promenljivu varijansa uzorka 2cS važi:

- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez

ponavljanja kod kojih je 05.0N

n), onda:

212

2

~)1(

ncSn

, pa važi videti Sliku 5.2.4.1.

1))1()1(

(

1))1(

(

2

21,1

22

2

2,1

2

2

2,12

22

21,1

n

c

n

c

n

c

n

SnSnP

SnP

Dakle, pod ovim uslovima simetri na intervalna ocena varijanse populacije sa koeficijentom pouzdanosti 1- je:

2

21,1

2

2

2,1

22 )1(

,)1(

n

c

n

c SnSn.

- Ako su uzorci bez ponavljanja kod kojih je 05.0N

n, onda

aproksimativno važi:

ako je n 30 i2

Nn , tada

212

2

~)1(

ncSn

, pa i tada važi da je

Page 173: Poslovna statistika

Poslovna statistika

173

simetri na intervalna ocena varijanse populacije sa koeficijentom pouzdanosti 1- jednaka:

2

21,1

2

2

2,1

22 )1(

,)1(

n

c

n

c SnSn.

Zadatak 5.2.4. Centrirana ocena varijanse nekog obeležja iz uzorka veli inen=17, uzetog iz ogromne populacije u kojoj obeležje ima N( ,

2) raspodelu,

gde je nepoznato, iznosi .6251

1

2_

2

n

xx

s

n

i

i

c Odrediti interval

poverenja za varijansu datog obeležja na itavoj populaciji, ako je koeficijent pouzdanosti 1- jednak 0,99.

Page 174: Poslovna statistika

Poslovna statistika

174

6. TESTIRANJE PARAMETARSKIH STATISTI KIH HIPOTEZA

Kao što je ve re eno, testiranje parametarskih statisti kih hipoteza se primenjuje u slu ajevima kada su parametri populacije bili poznati, pa iz uzetog uzorka proveravamo da li su se promenili, to jest u kom smeru je promena izvršena, odnosno da li su se pove ali ili smanjili.

Obeležimo sa Q parametar populacije koji želimo da testiramo pomo u neke informacije dobijene iz jednog prostog slu ajnog uzorka veli ine n. Ta informacija je obi no ta kasta ocena parametra Q koja je izra unata na tom jednom prostom slu ajnom uzorku veli ine n, a koju, kao što smo rekli u poglavlju 5, obeležavamo sa Un, ),...,,( 21 nn xxxfU .

Zaklju ak testiranja izvodimo na osnovu poznavanja zakona raspodele slu ajnepromenljive U=f(X1,X2,...,Xn), koja je ta kasta ocena parametra Q (poglavlje 5) i njene vrednosti Un, ),...,,( 21 nn xxxfU , konkretno realizovane na tom

jednom prostom slu ajnom uzorku veli ine n.

Postupak testiranja parametarskih statisti kih hipoteza zapo injemo formiranjem nulte (obeležava emo je sa H0) i alternativne (obeležava emo je

sa H1) hipoteze.

Nulta i alternativna hipoteza predstavljaju dve pretpostavke o skupu vrednosti parametra populacije Q, koje su me u sobom disjunktne, a ija unija predstavlja skup svih mogu ih vrednosti testiranog parametra Q.

Nulta hipoteza H0 je pretpostavka o skupu vrednosti parametra Q koju želimo da osporimo.

Alternativna hipoteza H1 je pretpostavka o skupu vrednosti parametra Q koju želimo da dokažemo.

Nulta i alternativna hipoteza javljaju se u slede a tri oblika:

Page 175: Poslovna statistika

Poslovna statistika

175

1. Dvosmerna hipoteza. Nulta hipoteza pretpostavlja da je parametar Qjednak nekoj hipoteti koj (od ranije poznatoj) vrednosti Q0, a alternativna da je parametar Q razli it od te hipoteti ke (od ranije poznate) vrednosti Q0.

H0: Q=Q0 H1:Q Q0

2. Desnostrana jednosmerna hipoteza. Nulta hipoteza pretpostavlja da je parametar Q manji do jednak nekoj hipoteti koj (od ranije poznatoj) vrednosti Q0, a alternativna da je parametar Q ve i od te hipoteti ke (od ranije poznate) vrednosti Q0.

H0: Q Q0 H1:Q Q0

3. Levostrana jednosmerna hipoteza. Nulta hipoteza pretpostavlja da je parametar Q ve i do jednak nekoj hipoteti koj (od ranije poznatoj) vrednosti Q0, a alternativna da je parametar Q manji od te hipoteti ke(od ranije poznate) vrednosti Q0.

H0: Q Q0 H1:Q Q0

Proces testiranja hipoteza, koji emo kasnije objasniti, u svakom od ovih oblika e nas navesti da odlu imo da: ili prihvatimo alternativnu hipotezu H1, ili ne

prihvatimo alternativnu hipotezu H1.

Prilikom donošenja te odluke, možemo napraviti dve vrste grešaka.

Grešku I vrste emo napraviti ako nas test navede da zaklju imo da je hipoteza H1 istinita, a da je u stvarnosti hipoteza H1 neistinita.

Grešku II vrste emo napraviti ako nas test navede da zaklju imo da je hipoteza H1 neistinita, a da je u stvarnosti hipoteza H1 istinita.

Page 176: Poslovna statistika

Poslovna statistika

176

Verovatno u da emo na initi grešku I vrste obeležavamo sa i nazivamo je nivo zna ajnosti testa. Dakle, važi:

)|( 11 neistinitaHprihvatimoHP .

Verovatno u da emo na initi grešku II vrste obeležavamo sa i nazivamo je rizik greške II vrste. Dakle, važi:

)|( 11 istinitaHprihvatimoneHP .

Verovatno u da ne na inimo grešku II vrste obeležavamo sa i nazivamo je mo testa. Dakle, važi:

)|(11 11 istinitaHprihvatimoneHP .

U prakti noj primeni nivo zna ajnosti testa, , unapred biramo sa tendencijom da bude što manji, obi no =0.05 ili =0.01, dok smanjenje rizika greške II

vrste, , odnosno pove anje mo i testa , ostvarujemo pove anjem veli ineuzorka n.

Proces testiranja emo ilustrovati na slede em pojednostavljenom primeru testiranja vrednosti aritmeti ke sredine populacije , u kome unija nulte i alternativne hipoteze ne predstavlja skup svih mogu ih vrednosti aritmeti kesredine populacije, ve je, na primer:

H0: = 0 H1: = 1

Neka se vrednost datog obeležja raspodeljuje u populaciji po zakonu N( ,2).

Kao što smo ranije rekli, u tom slu aju aritmeti ka sredina slu ajnog uzorka

veli ine n,__

X , koja je ta kasta ocena aritmeti ke sredine populacije, ,

Page 177: Poslovna statistika

Poslovna statistika

177

raspodeljuje se po zakonu ),(~2__

nNX . U zavisnosti od toga da li je = 0

ili = 1 , ta raspodela aritmeti ke sredine slu ajnog uzorka veli ine n e, na primer za 1 0 , izgledati kao na slici 6.1.

10 0 10 200

0.1dnorm x 2 3( )

dnorm x 10 3( )

x

Izaberimo jedan slu ajan uzorak veli ine n iz ove populacije, nxxx ,...,, 21 , i

izra unajmo njegovu aritmeti ku sredinu n

x

x

n

i

i

1__

.

Neka je nivo zna ajnosti testa. Tada na imo vrednost krx__

(kriti nu vrednost aritmeti ke sredine uzorka), za koju važi da:

ako je ),(~2

0

__

nNX onda )(

____

krxXP .

),(2

1n

N

),(2

0n

N

0 1

Slika 6.1. Primeri raspodele

Page 178: Poslovna statistika

Poslovna statistika

178

Tada, ako je izra unata aritmeti ka sredina uzorka n

x

x

n

i

i

1__

ve a od kriti ne

vrednosti krx__

, krxx____

,

odbacujemo nultu hipotezu H0: = 0 i prihvatamo alternativnu hipotezu H1 : = 1 ,

i pri tome smo možda pogrešili sa istom onom verovatno om sa kojom je mogu e izvu i uzorak veli ine n te aritmeti ke sredine iz populacije koja se raspodeljuje po zakonu N( 0 ,

2), a ta je verovatno a, kao što smo videli,

manja od (jer je krxx____

). Odnosno, verovatno a da napravimo grešku I

vrste je (u ovom slu aju) manja od .

A ako je izra unata aritmeti ka sredina uzorka n

x

x

n

i

i

1__

manja do jednaka od

kriti ne vrednosti krx__

, krxx____

, ne možemo prihvatiti alternativnu hipotezu H1 : = 1 sa nivoom zna ajnosti .

Za ovako izabrano , a samim tim i krx__

, verovatno a da napravimo grešku II

vrste, , iznosi:

ako je ),(~2

1

__

nNX onda )(

____

krxXP

jer je to verovatno a da iz populacije koja se raspodeljuje po zakonu

N( 1 ,2) izvu emo uzorak ija je aritmeti ka sredina krxx

____

, što e nas naterati da ne prihvatimo alternativnu hipotezu H1 : = 1 i time pogrešimo.

Ilustracija za , , i krx__

data je na Slici 6.2.

Page 179: Poslovna statistika

Poslovna statistika

179

10 0 10 200

0.1dnorm x 2 3( )

dnorm x 10 3( )

x

O igledno je (Slika 6.2) da za istu veli inu uzorka n, smanjenje nivoa zna ajnosti testa , dovodi do pove anja rizika greške II vrste, , odnosno do smanjenja mo i testa . Smanjivanje parametra postiže se smanjivanjem širina krivih na slici 6.2, odnosno smanjivanjem varijanse raspodele

aritmeti ke sredine uzoraka. Kako je ta varijansa jednaka n

2

, smanjivanje

parametra postiže se pove anjem veli ine uzorka n.

Naša dalja analiza odnosi e se samo na testitranje parametarskih statisti kihhipoteza za unapred izabrani nivo zna ajnosti testa , dok se smanjivanjem rizika greške II vrste, , pove anjem veli ine uzorka, ne emo baviti. Zbog toga je važno imati na umu slede e:

- ako nas test navede da prihvatimo alternativnu hipotezu H1 sa nivoom zna ajnosti testa , to zna i da hipotezi H1 možemo verovati sa verovatno om 1- ;

- ako nas test navede da ne prihvatimo alternativnu hipotezu H1 sa nivoom zna ajnosti testa , to zna i da hipotezi H1 ne možemo verovati sa verovatno om 1- , a mera poverenja u nultu hipotezu H0 na osnovu ovog testa nam nije poznata.

),(2

1n

N

),(2

0n

N

0 krx__

1

Slika 6.2. Ilustracija , , krx__

Page 180: Poslovna statistika

Poslovna statistika

180

Tako e, kada su nulta i alternativna hipoteza me u sobom disjunktne, a njihova unija predstavlja skup svih mogu ih vrednosti testiranog parametra Q,možemo na osnovu uzorka odrediti nivo zna ajnosti sa kojim možemo prihvatiti alternativnu hipotezu H1.

Naime, neka je, na primer, u pitanju desni jednosmerni test aritmeti ke sredine populacije ,obeležja ija se aritmeti ka sredina u uzorku veli ine n

rasporedjuje po zakonu ),(~2__

nNX :

H0: 0 H1: 0.

Neka je iz te populacije uzet slu ajni uzorak veli ine n, i neka je njegova

izra unata aritmeti ka sredina jednaka n

x

x

n

i

i

1__

.

Tada, tabli nim rešavanjem jedna ine

ako je ),(~2

0

__

nNX onda )(

____

xXP ,

po nepoznatom parametru ,

možemo da konstatujemo da sa nivoom zna ajnosti možemo prihvatiti alternativnu hipotezu H1: 0.

U daljoj analizi koristi emo zakone raspodele parametara uzoraka, analizirane u 4. poglavlju ovog udžbenika, odnosno zakone raspodele ta kastih ocena, analizirane u 5. poglavlju ovog udžbenika.

Page 181: Poslovna statistika

Poslovna statistika

181

6.1. Testiranje aritmeti ke sredine populacije,

Neka je iz populacije iju aritmeti ku sredinu testiramo formiran jedan slu ajni uzorak veli ine n i neka je njegova aritmeti ka sredina jednaka

n

x

x

n

i

i

1__

.

Za dati nivo zna ajnosti testa , tada je:

k) ako posmatrano obeležje u populaciji ima N( ,2) raspodelu, onda:

- ako je 2populacije poznato

- ako je uzorak sa ponavljanjem (ili N , ili uzorak

bez ponavljanja kod koga je 05.0N

n), onda je

),(~2__

nNX odnosno )1,0(~

__

N

n

X,

pa važi za:

Page 182: Poslovna statistika

Poslovna statistika

182

1. dvosmerni test: H0: = 0 H1: 0

2

0

__

z

n

xprihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.1);

2

0

__

z

n

xne prihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.1);

0

0.25

0.5

dnorm x 0 1( )

x

Slika 6.1.1. Funkcija raspodele N(0,1)

2

z

2

2

z

2

Page 183: Poslovna statistika

Poslovna statistika

183

2. desni jednosmerni test: H0: 0 H1: 0

z

n

x 0

__

prihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.2);

z

n

x 0

__

ne prihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.2);

0

0.25

0.5

dnorm x 0 1( )

x

Slika 6.1.2. Funkcija raspodele N(0,1)

3. levi jednosmerni test: H0: 0 H1: 0

z

n

x 0

__

prihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.3);

z

Page 184: Poslovna statistika

Poslovna statistika

184

z

n

x 0

__

ne prihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.3);

0

0.25

0.5

dnorm x 0 1( )

x

Slika 6.1.3.Funkcija raspodele N(0,1)

- ako je uzorak bez ponavljanja kod koga je 05.0N

n

onda je

)1

,(~2__

N

nN

nNX , odnosno

)1,0(~

1

__

N

N

nN

n

X,

pa važi za:

z

Page 185: Poslovna statistika

Poslovna statistika

185

1. dvosmerni test : H0: = 0 H1: 0

2

0

__

1

z

N

nN

n

xprihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.1);

2

0

__

1

z

N

nN

n

xne prihvatamo H1: 0 sa

nivoom zna ajnosti (Slika 6.1.1);

2. desni jednosmerni test: H0: 0 H1: 0

z

N

nN

n

x

1

0

__

prihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.2);

z

N

nN

n

x

1

0

__

ne prihvatamo H1: 0 sa

nivoom zna ajnosti (Slika 6.1.2);

Page 186: Poslovna statistika

Poslovna statistika

186

3. levi jednosmerni test: H0: 0 H1: 0

z

N

nN

n

x

1

0

__

prihvatamo H1: 0 sa

nivoom zna ajnosti (Slika 6.1.3);

z

N

nN

n

x

1

0

__

ne prihvatamo H1: 0 sa

nivoom zna ajnosti (Slika 6.1.3);

- ako je 2populacije nepoznato:

- ako je poznato besmisleno je testirati ;

- ako je nepoznato:

- ako je uzorak sa ponavljanjem (ili N , ili uzorak

bez ponavljanja kod koga je 05.0N

n) onda

1

__

~ n

c

t

n

S

X, pa važi za:

Page 187: Poslovna statistika

Poslovna statistika

187

1. dvosmerni test: H0: = 0 H1: 0

2,1

0

__

nc

t

n

s

xprihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.4);

2,1

0

__

nc

t

n

s

xne prihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.4);

0

0.25

0.5

dnorm x 0 1( )

x

Slika 6.1.4. Funkcija raspodele tn-1

2,1n

t

2

2,1nt

2

Page 188: Poslovna statistika

Poslovna statistika

188

2. desni jednosmerni test: H0: 0 H1: 0

,10

__

n

c

t

n

s

xprihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.5);

,10

__

n

c

t

n

s

xne prihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.5);

0

0.25

0.5

dnorm x 0 1( )

x

Slika 6.1.5. Funkcija raspodele tn-1

,1nt

Page 189: Poslovna statistika

Poslovna statistika

189

3. levi jednosmerni test: H0: 0 H1: 0

,10

__

n

c

t

n

s

xprihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.6);

,10

__

n

c

t

n

s

xne prihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.6);

0

0.25

0.5

dnorm x 0 1( )

x

Slika 6.1.6. Funkcija raspodele tn-1

,1nt

Page 190: Poslovna statistika

Poslovna statistika

190

- ako je uzorak bez ponavljanja kod koga je

05.0N

n, onda:

1

__

~

1

n

c

t

N

nN

n

S

X, pa važi za:

1. dvosmerni test: H0: = 0 H1: 0

2,1

0

__

1

nc

t

N

nN

n

s

xprihvatamo H1: 0 sa

nivoom zna ajnosti (Slika 6.1.4);

2,1

0

__

1

nc

t

N

nN

n

s

xne prihvatamo H1: 0 sa

nivoom zna ajnosti (Slika 6.1.4);

2. desni jednosmerni test: H0: 0 H1: 0

,10

__

1

n

c

t

N

nN

n

s

xprihvatamo H1: 0 sa

nivoom zna ajnosti (Slika 6.1.5);

Page 191: Poslovna statistika

Poslovna statistika

191

,10

__

1

n

c

t

N

nN

n

s

xne prihvatamo H1: 0 sa

nivoom zna ajnosti (Slika 6.1.5);

3. levi jednosmerni test: H0: 0 H1: 0

,10

__

1

n

c

t

N

nN

n

s

xprihvatamo H1: 0 sa

nivoom zna ajnosti (Slika 6.1.6);

,10

__

1

n

c

t

N

nN

n

s

xne prihvatamo H1: 0 sa

nivoom zna ajnosti (Slika 6.1.6);

iv) ako posmatrano obeležje u populaciji nema N( ,2) raspodelu,

onda aproksimativno važi:

- ako je uzorak sa ponavljanjem (ili N ),

uzimamo dovoljno veliki uzorak pod kojim podrazumevamo uzorak veli ine n 30 i za njega važe svi rezultati kao i uslu aju kad obeležje u populaciji imaN( ,

2) raspodelu;

Page 192: Poslovna statistika

Poslovna statistika

192

- ako je uzorak bez ponavljanja,

uzimamo dovoljno veliki uzorak iz dovoljne velike populacije, pod kojim podrazumevamo uzorak veli ine

n 30 i populaciju za koju je 2

Nn , i za njega važe svi

rezultati kao i uslu aju kad obeležje u populaciji imaN( ,

2) raspodelu.

Primer 6.1.1. Prose an broj dnevnih posetilaca u beogradskim restoranima je 150 posetilaca po restoranu, sa standardnom varijansom = 30. Posle smanjenja cena mesa u restoranima od 10%, uzorkovano je 40 slu ajnoodabranih restorana, i na njima je izra unat srednji broj dnevnih posetilaca – 160 posetilaca po rastoranu.

i) Da li, sa nivoom zna ajnosti

a) =0,05b) =0,01

možemo konstatovati da se srednji broj posetilaca u restoranima pove ao?

ii) Sa kojim nivoom zna ajnosti možemo iz ovog uzorka konstatovati da se srednji broj posetilaca pove ao?

Rešenje:

Kako je uzorak n=40 > 30, to broj posetilaca možemo aproksimirati

N(150, 302) raspodelom. Po uslovu zadatka, nulta hipoteza je 150:0H , a

alternativna .150:1H

i)

a)

Za nivo zna ajnosti 64,105,0 Z

važi:

Page 193: Poslovna statistika

Poslovna statistika

193

64,111,2

40

301501600

_

n

x

Možemo konstatovati da se srednji broj posetilaca u

restoranima pove ao.

b)

Za nivo zna ajnosti 33,201,0 Z

važi:

33,211,2

40

301501600

_

n

x

Ne možemo konstatovati da se srednji broj posetilaca u

restoranima pove ao.

ii)

Iz uslova:

ZZ

n

x11,20

_

koriste i N(0,1) tablicu, dobijamo 9826,01 , odakle je

=0,0174.

Dakle, iz ovog uzorka možemo sa nivoom zna ajnosti =0,0174konstatovati da se srednji broj posetilaca pove ao.

Page 194: Poslovna statistika

Poslovna statistika

194

6.2. Testiranje razlike aritmeti kih sredina populacija, 21

Neka su iz dve populacije iju razliku aritmeti kih sredina 1 - 2 testiramo formirana dva nezavisna uzorka veli ine n1 i n2, i neka su njihove aritmeti ke

sredine redom jednake 1

11

__

1

n

x

x

n

i

i

i 2

12

__

2

n

x

x

n

i

i

.

Tako e, neka u prvoj populaciji obeležje X1 ima parametar 211 )var(X , a u

drugoj populaciji obeležje X2 ima parametar 222 )var(X .

Tada, za dati nivo zna ajnosti testa , važi:

- ako ),(~),(~ 2222

2111 NXiNX ,

onda:

2

22

1

21

212

__

1

__

,~nn

NXX ,odnosno

)1,0(~)(

2

22

1

21

212

__

1

__

N

nn

XX, pa važi:

1. dvosmerni test: H0: 1 - 2 = 10 - 20 H1: 1 - 2 10 - 20

2

2

22

1

21

20102

__

1

__

)(z

nn

xxprihvatamo H1: 1 - 2 10 - 20 sa

nivoom zna ajnosti (Slika 6.1.1);

Page 195: Poslovna statistika

Poslovna statistika

195

2

2

22

1

21

20102

__

1

__

)(z

nn

xxne prihvatamo H1: 1 - 2 10 - 20 sa

nivoom zna ajnosti (Slika 6.1.1);

2. desni jednosmerni test: H0: 1 - 2 10 - 20 H1: 1 - 2 10 - 20

z

nn

xx

2

22

1

21

20102

__

1

__

)(prihvatamo H1: 1 - 2 10 - 20 sa

nivoom zna ajnosti (Slika 6.1.2);

z

nn

xx

2

22

1

21

20102

__

1

__

)(ne prihvatamo H1: 1 - 2 10 - 20 sa

nivoom zna ajnosti (Slika 6.1.2);

3. levi jednosmerni test: H0: 1 - 2 10 - 20 H1: 1 - 2 10 - 20

z

nn

xx

2

22

1

21

20102

__

1

__

)(prihvatamo H1: 1 - 2 10 - 20 sa

nivoom zna ajnosti (Slika 6.1.3);

Page 196: Poslovna statistika

Poslovna statistika

196

z

nn

xx

2

22

1

21

20102

__

1

__

)(ne prihvatamo H1: 1 - 2 10 - 20 sa

nivoom zna ajnosti (Slika 6.1.3);

- ako ne znamo zakon raspodele obeležja X1 i X2 ,

onda aproksimativno važi: ako je n1 30 i n2 30, tada

2

22

1

21

212

__

1

__

,~nn

NXX ,

pa onda uzimamo uzorke veli ine n1 30 i n2 30 i za njih važi sve gore navedeno, kao da je ),(~),(~ 2

2222111 NXiNX .

Primer 6.2.1. Proizvo a A tvrdi da je prose an radni vek sijalica koje on proizvodi ve i za 80 radnih asova od radnog veka sijalica koje proizvodi proizvo a B. Standardne devijacije radnog veka sijalica proizvo a a A i B su poznate i iznose 3020 BA i asova. Uzorak od 50 sijalica proizvo a a A ima srednji vek trajanja 2590 asova, dok uzorak od 60 sijalica proizvo a a B ima srednji vek trajanja 2500 asova.

i) Da li, sa nivoom zna ajnosti

a) =0,05b) =0,01

možemo konstatovati da je proizvo a A u pravu?

ii) Sa kojim nivoom zna ajnosti možemo iz ovih uzoraka konstatovati da je proizvo a A u pravu?

Page 197: Poslovna statistika

Poslovna statistika

197

Rešenje:

Po uslovu zadatka, nulta hipoteza je 80:0 BAH , a alternativna

hipoteza je 80:1 BAH . Kako je nA >30, nB >30, i varijanse obe

populacije poznate, važi:

i)

a)

Za nivo zna ajnosti 64,105,0 Z ,

pa je

64,108,2

60

30

50

20

80250025902222

__

B

B

A

A

BABA

nn

xx.

Možemo konstatovati da je proizvo a A u pravu.

b)

Za nivo zna ajnosti 33,201,0 Z ,

pa je

33,208,2

60

30

50

20

80250025902222

__

B

B

A

A

BABA

nn

xx .

Možemo konstatovati da proizvo a A nije u pravu.

Page 198: Poslovna statistika

Poslovna statistika

198

ii)

Iz uslova:

ZZ

nn

xx

B

B

A

A

BABA08,2

22

__

,

koriste i N(0,1) tablicu, dobijamo 9812,01 , odakle je

=0,0188. Dakle, iz ovih uzoraka možemo sa nivoom zna ajnosti

=0,0188 konstatovati da je proizvo a A u pravu.

Page 199: Poslovna statistika

Poslovna statistika

199

6.3. Testiranje proporcije populacije,

Neka je iz populacije iju proporciju testiramo, formiran jedan slu ajniuzorak veli ine n i neka je njegova realizovana proporcija pr takva da je

3051,5 nipnpn rr ,

tada za dati nivo zna ajnosti testa aproksimativno važi slede e:

- ako je uzorak sa ponavljanjem (ili N , ili uzorak bez ponavljanja

kod koga je 05.0N

n), onda

)1

,(~n

ppNP rr

r odnosno )1,0(~1

N

n

pp

P

rr

r ,

pa važi za:

1. dvosmerni test: H0: = 0 H1: 0

2

0

1z

n

pp

p

rr

r prihvatamo H1: 0

sa nivoom zna ajnosti (Slika 6.1.1);

2

0

1z

n

pp

p

rr

r ne prihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.1);

Page 200: Poslovna statistika

Poslovna statistika

200

2. desni jednosmerni test: H0: 0 H1: 0

z

n

pp

p

rr

r

10 prihvatamo H1: 0

sa nivoom zna ajnosti (Slika 6.1.2);

z

n

pp

p

rr

r

10 ne prihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.2);

3. levi jednosmerni test: H0: 0 H1: 0

z

n

pp

p

rr

r

10 prihvatamo H1: 0

sa nivoom zna ajnosti (Slika 6.1.3);

z

n

pp

p

rr

r

10 ne prihvatamo H1: 0 sa nivoom

zna ajnosti (Slika 6.1.3);

- ako su uzorci bez ponavljanja kod kojih je 05.0N

n, onda

)1

1,(~

N

nN

n

ppNP rr

r , odnosno

)1,0(~

1

1N

N

nN

n

pp

P

rr

r ,

Page 201: Poslovna statistika

Poslovna statistika

201

pa važi za:

1. dvosmerni test: H0: = 0 H1: 0

2

0

1

1z

N

nN

n

pp

p

rr

r prihvatamo H1: 0

sa nivoom zna ajnosti (Slika 6.1.1);

2

0

1

1z

N

nN

n

pp

p

rr

r ne prihvatamo H1: 0 sa

nivoom zna ajnosti (Slika 6.1.1);

2. desni jednosmerni test: H0: 0 H1: 0

z

N

nN

n

pp

p

rr

r

1

10 prihvatamo H1: 0

sa nivoom zna ajnosti (Slika 6.1.2);

z

N

nN

n

pp

p

rr

r

1

10 ne prihvatamo H1: 0 sa

nivoom zna ajnosti (Slika 6.1.2);

3. levi jednosmerni test: H0: 0 H1: 0

z

N

nN

n

pp

p

rr

r

1

10 prihvatamo H1: 0

Page 202: Poslovna statistika

Poslovna statistika

202

sa nivoom zna ajnosti (Slika 6.1.3),

z

N

nN

n

pp

p

rr

r

1

10 ne prihvatamo H1: 0 sa

nivoom zna ajnosti (Slika 6.1.3).

Zadatak 6.3.1. Veruje se da e 25% glasa a iz jednog okruga glasati za stranku A na predstoje im izborima. Slu ajan uzorak od 50 glasa a iz tog okruga je pokazao da e njih 7 glasati za stranku A.

i) Možemo li sa nivoom zna ajnosti

a) =0,05b) =0,01

konstatovati da se u ovom okrugu promenio % glasa a koji e glasati za stranku A?

ii) Sa kojim nivoom zna ajnosti možemo iz ovog uzorka konstatovati da se u ovom okrugu promenio % glasa a koji e glasati za stranku A?

Page 203: Poslovna statistika

Poslovna statistika

203

6.4. Testiranje varijanse populacije, 2

Neka se slu ajna promenljiva X u populaciji raspodeljuje po zakonu N( ,2).

Neka je iz te populacije, iju varijansu 2 testiramo, formiran jedan slu ajniuzorak veli ine n i neka je njegova centrirana varijansa jednaka:

- ukoliko je aritmeti ka sredina populacije poznata

n

x

s

n

i

i

1

2

2

)( ;

- ukoliko je aritmeti ka sredina populacije nepoznata

1

)(1

2__

2

n

xx

s

n

i

i

c .

Tada važi:

- poznato

za slu ajnu promenljivu varijansa uzorka 2S važi:

- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez

ponavljanja kod kojih je 05.0N

n), onda:

22

2

~ n

Sn , pa važi za:

1. dvosmerni test: H0:2 =

20 H1:

2 20

Page 204: Poslovna statistika

Poslovna statistika

204

2

21,2

0

22

2,2

0

2

nn

snsn prihvatamo H1:

2 20

sa nivoom zna ajnosti (Slika 6.4.1);

2

2,2

0

22

21, nn

snne prihvatamo H1:

2 20

sa nivoom zna ajnosti (Slika 6.4.1);

0 2 4 6 8 10 12 14 16 18 200

0.05

0.1

0.15

dchisq x 7( )

x

6.4.1. Funkcija raspodele 2n

2. desni jednosmerni test: H0:2 2

0 H1:2 2

0

22

2

21,n

2

2,n

Page 205: Poslovna statistika

Poslovna statistika

205

2,2

0

2

n

snprihvatamo H1:

2 20 sa nivoom zna ajnosti

(Slika 6.4.2);

2,2

0

2

n

snne prihvatamo H1:

2 20 sa nivoom

zna ajnosti (Slika 6.4.2);

0 2 4 6 8 10 12 14 16 18 200

0.05

0.1

0.15

dchisq x 7( )

x

6.4.2. Funkcija raspodele 2n

3. levi jednosmerni test: H0:2 2

0 H1:2 2

0

21,2

0

2

n

snprihvatamo H1:

2 20 sa nivoom

zna ajnosti (Slika 6.4.3);

2,n

Page 206: Poslovna statistika

Poslovna statistika

206

21,2

0

2

n

snne prihvatamo H1:

2 20 sa nivoom

zna ajnosti (Slika 6.4.3);

0 2 4 6 8 10 12 14 16 18 200

0.05

0.1

0.15

dchisq x 7( )

x

6.4.3. Funkcija raspodele 2n

- ako je uzorak bez ponavljanja kod koga je 05.0N

n, onda

aproksimativno važi:

- ako je n 30 i2

Nn ,

tada 22

2

~ n

Sn ,

pa i tada važi sve navedeno za uzorak sa ponavljanjem podovim uslovima;

21,n

Page 207: Poslovna statistika

Poslovna statistika

207

- nepoznato

za slu ajnu promenljivu varijansa uzorka 2cS važi:

- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez

ponavljanja kod kojih je 05.0N

n), onda:

212

2

~)1(

ncSn

, pa važi za:

1. dvosmerni test: H0:2 =

20 H1:

2 20

2

21,12

0

22

2,12

0

2 )1()1(n

c

n

c snsnprihvatamo

H1:2 2

0 sa nivoom zna ajnosti (Slika 6.4.1);

2

2,12

0

22

21,1

)1(n

c

n

snne prihvatamo H1:

2 20

sa nivoom zna ajnosti (Slika 6.4.1);

2. desni jednosmerni test: H0:2 2

0 H1:2 2

0

2,12

0

2)1(n

csnprihvatamo H1:

2 20 sa nivoom

zna ajnosti (Slika 6.4.2);

2,12

0

2)1(n

csnne prihvatamo H1:

2 20 sa nivoom

zna ajnosti (Slika 6.4.2);

Page 208: Poslovna statistika

Poslovna statistika

208

3. levi jednosmerni test: H0:2 2

0 H1:2 2

0

21,12

0

2)1(n

csnprihvatamo H1:

2 20 sa nivoom

zna ajnosti (Slika 6.4.3)

21,12

0

2)1(n

csnne prihvatamo H1:

2 20 sa nivoom

zna ajnosti (Slika 6.4.3);

- ako je uzorak bez ponavljanja kod koga je 05.0N

n, onda

aproksimativno važi:

- ako je n 30 i2

Nn ,

tada 212

2

~)1(

ncSn

,

pa i tada važi sve navedeno za uzorak sa ponavljanjem pod ovim uslovima.

Zadatak 6.4.1. Slu ajan uzorak veli ine n=16 uzet je iz populacije u kojoj analizirano obeležje ima N( ,

2), gde je aritmeti ka sredina obeležja

Page 209: Poslovna statistika

Poslovna statistika

209

nepoznata, a smatra se da varijansa obeležja iznosi .78020 Centralizovana

standardna devijacija ovog uzorka iznosi 33cs .

Da li, sa nivoom zna ajnosti

a) =0,05b) =0,01

možemo konstatovati da se promenila varijansa populacije?

Page 210: Poslovna statistika

Poslovna statistika

210

7. REGRESIJA I KORELACIJA

Vrlo esto postoji potreba za predvi anjem vrednosti nekog obeležja na osnovu njegove povezanosti sa jednim ili više drugih obeležja.

Jedan od važnijih zadataka statistike je da utvrdi stepen i oblik zavisnosti izme u odre enih obeležja od interesa, kod kojih egzaktan uzro no-posledi niodnos nije definisan. Takva analiza omogu ava predvi anje vrednosti jednog obeležja na osnovu poznavanja vrednosti drugih obeležja, i esto se koristi prilikom donošenja odre enih poslovnih odluka.

Pod pojmom regresiona analiza podrazumeva se skup statisti kih procedura za ispitivanje oblika zavisnosti izme u dva ili više obeležja.

Pod pojmom korelaciona analiza podrazumeva se skup statisti kih procedura za ispitivanje stepena (ja ine) zavisnosti izme u dva ili više obeležja.

Ukoliko se ispituje oblik i stepen zavisnosti samo izme u dva obeležja, onda se takav proces naziva prosta regresiona analiza (utvr ivanje oblika zavisnosti dva obeležja) i prosta korelaciona analiza (utvr ivanje stepena zavisnosti dva obeležja).

Ukoliko se ispituje oblik i stepen zavisnosti izme u više obeležja, onda se takav proces naziva višestruka regresiona analiza (utvr ivanje oblika zavisnosti više obeležja), odnosno višestruka korelaciona analiza (utvr ivanjestepena zavisnosti više obeležja).

U ovom udžbeniku bavi emo se samo prostom regresionom i korelacionom analizom.

Naša analiza e se kao i do sada odvijati na podacima iz slu ajnog uzorka, a rezultati koje dobijemo važi e za itavu populaciju iz koje je uzet uzorak.

Kod proste regresione analize neophodno je unapred odrediti koje obeležje eimati ulogu nezavisne promenljive, a koje zavisne promenljive. Ovo se utvr uje na osnovu prethodnih teorijskih ili empirijskih saznanja o prirodi analiziranih obeležja. Tako, na primer, ako u jednoj populaciji želimo izvršiti prostu regresionu analizu (prona i zavisnost) izme u mese nog prihoda pojedinca i koli ini mesa utrošenog u ishrani pojedinca za mesec dana, logi no

Page 211: Poslovna statistika

Poslovna statistika

211

je da mese ni prihod bude nezavisna promenljiva, a koli ina utrošenog mesa zavisna.

Kod proste korelacione analize, svejedno je koje se obeležje karakteriše kao zavisno, a koje kao nezavisno.

Regresiona i korelaciona analiza se, kao što smo rekli, bave analizom zavisnosti me u obeležjima koja su stohasti ke prirode, pa rezultati koje dobijamo ovim analizama nisu egzaktni, ve su verodostojni sa odre enim verovatno ama i u odre enim intervalima vrednosti. Ali, pomo u njih mi možemo da ocenimo i predvidimo interval vrednosti zavisne promenljive za željene vrednosti nezavisne promenljive, sa unapred definisanom, zadovoljavaju e velikom verovatno om.

Prvi korak u analizi zavisnosti dva obeležja je identifikovanje: koje obeležje predstavlja nezavisno, a koje zavisno obeležje. U daljoj analizi, nezavisno obeležje obeležava emo sa X, a zavisno sa Y. Na taj na in, ukoliko uzimamo podatke o obeležjima X i Y iz slu ajnog uzorka veli ine n, dolazimo do nparova podataka (x1, y1), (x2, y2), ..., (xn, yn).

Slede i korak je grafi ki prikaz ovih parova podataka koji se konstruiše u pravouglom Dekartovom koordinatnom sistemu, pri emu se na apscisnu osu nanose podaci nezavisne promenljive X, a na ordinatnu osu vrednosti zavisne promenljive Y. Takav grafi ki prikaz naziva se dijagram raspršenosti, i na osnovu njega se na prvi pogled može dobiti odre ena predstava o eventualnom postojanju zavisnosti, obliku zavisnosti i stepenu zavisnosti izme uposmatranih obeležja (Slika 7.1).

Page 212: Poslovna statistika

Poslovna statistika

212

X X

a) b)

X X

c) d)

Slika 7.1. Dijagrami raspršenosti

Tako, na primer, sa Slike 7.1. možemo zaklju iti da:

a) postoji direktna linearna veza (zavisno obeležje linearno raste kada raste nezavisno obeležje);

b) postoji inverzna linearna veza, slabija nego pod a. (zavisno obeležje linearno opada kada raste nezavisno obeležje);

c) ne postoji stohasti ka veza; d) postoji snažna kvadratna veza.

Y Y

Y Y

Page 213: Poslovna statistika

Poslovna statistika

213

Generalno, dijagramom raspršenosti možemo sagledati da li izme u dva obeležja postoji stohasti ka veza ako postoji koji je oblik te veze (linearni, kvadratni, eksponecijalni, logaritamski...), i ako je oblik slaganja linearni, da li je direktni ili inverzni.

Page 214: Poslovna statistika

Poslovna statistika

214

7.1. Prosta linearna regresija i korelacija

Neka smo iz populacije veli ine N uzeli slu ajan uzorak veli ine n, i neka su na njemu uzeti parovi uzora kih podataka (xi,yi), i = 1, 2, ..., n za obeležja X iY, iju zavisnost ispitujemo. Neka dijagram raspršenosti definisan ovim uzorkom, dat na slici 7.1, indicira da se radi o linearnoj zavisnosti obeležja X iY u itavoj populaciji,

XY (opravdano pretpostavljena zavisnost obeležja X i Y u itavoj

populaciji).

Zadatak linearne regresione analiza je da oceni koeficijente i , koji opisuju linearnu zavisnost u itavoj populaciji, na osnovu uzora kih podataka (xi,yi), i = 1, 2, ..., n.

x3 X

Slika 7.1.1. Dijagram raspršenosti uzorka

Y

y3

Page 215: Poslovna statistika

Poslovna statistika

215

Radi lakšeg objašnjenja, zamislimo da je dijagram raspršenosti itavepopulacije, ta ke (xi,yi), i = 1, 2, ..., N, dat na slici 7.1.2.

X

Slika 7.1.2. Dijagram raspršenosti populacije

O igledno da bi, i kada bi smo znali koeficijente i , zbog stohasti nostizavisnosti obeležja X i Y važilo:

iii xy , i = 1, 2, ..., N,

gde je sa i obeležen stohasti ki lan (slu ajni poreme aj) i-tog lanapopulacije.

Ovaj stohasti ki lan, i , posledica je injenice da na zavisno obeležje Y ne deluje samo nezavisno obeležje X, ve i veliki broj drugih faktora koji u ovom modelu nisu uzeti u obzir. Ove fluktuacije i se u ovakvom pristupu karakterišu kao fluktuacije zavisne promenljive neobjašnjenje ovim regresionim modelom.

Y

Page 216: Poslovna statistika

Poslovna statistika

216

Dalja analiza koju emo sprovesti, a pomo u koje emo iz uzora kih podataka (xi,yi), i = 1, 2, ..., n oceniti parametre i , podrazumeva e da za stohasti kilan i u itavoj populaciji (i = 1, 2, ..., N) važi slede e:

- 0)( iE , što zna i da je stohasti ki lan u proseku u populaciji jednak nuli;

- constVarVarVar N

221 )()()( , što zna i da svi stohasti ki

lanovi imaju istu varijansu; ova osobina se još naziva i homoskedasti nost;

- izme u bilo koja dva stohasti ka lana i i j ne postoji nikakva funkcionalna veza;

- i ima Normalan raspored, odnosno ).,0(~ 2Ni

7.1.1. Ocenjivanje parametara i iz uzora kih podataka

Pod navedenim uslovima za stohasti ki lan u populaciji, oceni emo parametre i iz uzora kih podataka (xi,yi), i = 1 ,2, ..., n metodom minimiziranja

sume svih kvadrata stohasti kog lana i , izra unate na uzora kim podacima u odnosu na ocenjene vrednosti za i .

Naime, neka je ocena parametra , recimo koeficijent a, a ocena parametrarecimo koeficijent b. Tada je uzora ka regresiona kriva, koju emo obeležiti sa ^

y , jednaka:

xbay^

,

a za svaki par uzora kih podataka (xi,yi), i = 1, 2, ..., n važi slede e:

iii xbay

ii xbay^

.

Videti Sliku 7.1.3.

Page 217: Poslovna statistika

Poslovna statistika

217

xi

X

Slika 7.1.3. Uzora ka regresiona kriva

Koeficijente a i b, kao što smo rekli, dobi emo minimiziranjem slede egizraza:

n

i

ii

n

i

ii

n

i

i xbayyy1

2

1

2^

1

2 ))(()( .

Postupak minimiziranja se sprovodi nalaženjem parcijalnih izvoda navedenog izraza po parametrima a i b i njihovim izjedna avanjem sa nulom:

iy^

iy

xbay^

Y

Page 218: Poslovna statistika

Poslovna statistika

218

0

))((

0

))((

1

2

1

2

b

xbay

a

xbay

n

i

ii

n

i

ii

,

odakle dobijamo slede i sistem jedna ina:

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

xbxayx

xbany

1

2

11

11 .

Ovaj sistem jedna ina ima jedinstveno rešenje po a i b:

n

x

bn

y

a

xxn

yxyxn

b

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

112

11

2

111 .

Ovako dobijene ocene za i su, pod gore navedenim regresionim pretpostavkama, najefikasnije ocene. Dakle, važi:

)(

)(

bE

aE .

7.1.2. Standardna greška regresije, se

Pomo u ovako dobijenih a i b možemo oceniti varijansu stohasti kih lanova

i,2 sa 2

es , po formuli:

Page 219: Poslovna statistika

Poslovna statistika

219

22

)(

2111111

2

1

2^

1

2

2

n

yxbyay

n

yy

ns

n

ii

n

i

n

i

n

i

ii

n

i

i

e

i dobiti standardnu grešku regresije, se , po formuli:

22

)(

2111111

2

1

2^

1

2

n

yxbyay

n

yy

ns

n

ii

n

i

n

i

n

i

ii

n

i

i

e .

Standardna greška regresije je apsolutna mera varijacije uzora kih podataka od regresione linije uzorka. Što je standardna greška regresije ve a, to su ta keuzorka više raspršene od uzora ke linije regresije, pa su i predvi anjazasnovana na toj liniji regresije manje pouzdana. Tako e, što je uzorak ve i, to je standardna greška regresije manja.

7.1.3. Standardna greška ocene nagiba regresione krive, sb

Standardnu grešku ocene nagiba regresione krive, sb , to jest standardnu grešku ocene parametra , pomo u na uzorku izra unatog parametra b,dobijamo po formuli:

n

x

x

ss

n

i

in

i

i

eb 2

1

1

2

.

Da bi primena regresione linije uzorka bila opravdana, neophodno je ispitati da li uopšte postoji linearno slaganje u itavoj populaciji, odnosno da li je parametar 0. To ispitivanje emo izvršiti dvosmernim testom hipoteza, gde je nulta hipoteza H0: =0, a alternativna H1: 0.

Ovim testom prihvati emo alternativnu hipotezu H1: 0 sa nivoom zna ajnosti (ovo predstavlja verovatno u da emo na initi grešku I vrste i nema

Page 220: Poslovna statistika

Poslovna statistika

220

nikakve veze sa parametrom iz regresione jedna ine populacije XY ), ukoliko je

2,2n

b

ts

b .

7.1.4. Koeficijent determinacije, r2

Relativna mera reprezentativnosti regresione linije koja pokazuje koji se deo varijabiliteta obeležja Y objašnjava promenom obeležja X po linearnom regresionom modelu, zove se koeficijent determinacije, r

2, i na uzorku se izra unava po formuli:

2

2

11

2

2

11

2

1112

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

yynxxn

yxyxn

r .

Vrednost koeficijenta determinacije varira od 0 do 1, to jest važi:

10 2r .

Što je koeficijent determinacije bliži jedinici, to regresiona kriva bolje opisuje zavisnost podataka. Tako, ako je na primer:

92.02r ,

to zna i da je 92% ukupnog varijabiliteta zavisne promenljive opisano varijabilitetom nezavisne promenljive po utvr enom regresionom zakonu, a da samo 8% varijabiliteta nije objašnjeno regresionom linijom, ve je uzrokovano nekim neidentifikovanim faktorima.

Page 221: Poslovna statistika

Poslovna statistika

221

7.1.5. Koeficijent proste linearne korelacije u uzorku, r

Sa koeficijentom determinacije je usko povezan koeficijent proste linearne

korelacije u uzorku, r, koji na uzorku izra unavamo po formuli:

2

11

2

2

11

2

111

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

yynxxn

yxyxn

r , odnosno

2rr .

Koeficijent proste linearne korelacije (negde se naziva i Pirsonov koeficijent) opisuje postojanje i ja inu linearne veze izme u dve pojave, u ovom slu ajuobeležja X i Y. To je broj koji uzima vrednosti izme u –1 i 1, to jest važi:

.11 r

Kada je ovaj koeficijent pozitivan, korelacija je pozitivna (direktna), odnosno pove anje obeležja X uslovljava pove anje obeležja Y, a kada je ovaj koeficijent negativan, korelacija je negativna (inverzna), odnosno pove anjeobeležja X uslovljava smanjenje obeležja Y. Što je ovaj koeficijent bliži jedinici po apsolutnoj vrednosti, to je sve ja a linearna korelaciona veza izme u obeležja, a što je bliži nuli, linearna korelaciona veza je slabija. U statisti koj literaturi ne postoji slaganje u pogledu tuma enja zna enja mogu ihvrednosti proste linearne korelacije r, ali možemo usvojiti slede u grubu podelu:

8.07.0 r - izražena linearna korelacija;

9.08.0 r - visoka linearna korelacija;

19.0 r - veoma visoka linearna korelacija;

1r - savršena linearna korelacija.

Page 222: Poslovna statistika

Poslovna statistika

222

7.1.6. Standardna greška ocene koeficijenta proste linearne korelacije, sr

Koeficijent proste linearne korelacije u itavoj populaciji obeležimo sa , i njega ocenjujemo parametrom koeficijent proste linearne korelacije u uzorku,

r. Time inimo odre enu grešku koju opisujemo standardnom greškom ocene koeficijenta proste linearne korelacije, koju obelažavamo sa sr.

Standardnu grešku ocene koeficijenta proste linearne korelacije, sr,

izra unavamo po formuli:

2

1 2

n

rsr .

Kako je koeficijent korelacije u itavoj populaciji nepoznat, potrebno je na osnovu uzorka ispitati da li i u itavoj populaciji postoji korelacija, odnosno da li je 0.

To ispitivanje emo izvršiti dvosmernim testom hipoteza, gde je nulta hipoteza H0: =0, a alternativna H1: 0.

Ovim testom prihvati emo alternativnu hipotezu H1: 0 sa nivoom zna ajnosti (ovo predstavlja verovatno u da emo na initi grešku I vrste i nema

nikakve veze sa parametrom iz regresione jedna ine populacije XY ), ukoliko je

2,2n

r

ts

r.

Page 223: Poslovna statistika

Poslovna statistika

223

7.1.7. Koriš enje linearnog regresionog modela za predvi anje vrednosti zavisnog obeležja

Primena linearnog regresionog modela za predvi enje vrednosti zavisnog obeležja opravdana je ukoliko je koeficijent determinacije visok (dovoljno je da je r2

>0.5) i ukoliko je 0 sa nivoom zna ajnosti =0.05.

Kako je priroda veze izme u X i Y stohasti ka, to za svaku vrednost xi iz populacije postoji mnogo mogu ih vrednosti za yi u populaciji, jer je

iii xy ,

a i je stohasti ki lan (slu ajni poreme aj).

Taj raspored mogu ih vrednosti zavisnog obeležja yi za neku odre enuvrednost xi, predstavlja slu ajnu promenljivu Yi.Kako je 0)( iE , to je prose na vrednost za yi, za unapred zadato xi , jednaka

iiiiii xExExEYE )()()()( ,

odnosno prose na vrednost zavisnog obeležja yi, za unapred zadatu vrednost nezavisnog obeležja xi, nalazi se na liniji regresije populacije XY .

Dakle, na osnovu ocenjenih parametara za i ( smo ocenili sa a, sa b),možemo za datu vrednost nezavisnog obeležja X=xp , predvi ati individualnu vrednost zavisnog obeležja Yp i prose nu vrednost zavisnog obeležja E(Yp).

Kako je

pp

ppp

xYE

axY

)( ,

to je predvi anje individualne vrednosti zavisnog obeležja neizvesnije od predvi anja prose ne vrednosti zavisnog obeležja, jer osim neizvesnosti usled ocenjivanja parametara i , kod predvi anja individualne vrednosti postoji i dodatna neizvesnost usled stohasti nosti lana p.

Page 224: Poslovna statistika

Poslovna statistika

224

Samim tim e odgovaraju i interval predvi anja individualne vrednosti biti širi od intervala predvi anja prose ne vrednosti zavisnog obeležja, za datu vrednost nezavisnog obeležja.

7.1.8. Interval predvi anja prose ne vrednosti zavisnog obeležja Y, za datu vrednost nezavisnog obeležja X=xp

Stvarna prose na vrednost zavisnog obeležja Y za datu vrednost nezavisnog obeležja X=xp iznosi

pp xYE )( ,

a ocenjena vrednost iznosi

ppxbay

^

.

Meru odstupanja ocenjene vrednosti p

y^

od prave vrednosti E(Yp), opisuje

standardna greška ocene prose ne vrednosti zavisnog obeležja, koju ozna avamo sa _

py

s , i koju za X=xp izra unavamo po formuli:

n

x

x

n

x

x

nss

n

i

in

i

i

n

i

i

p

ey p

2

1

1

2

2

1

1_ ,

Interval prose ne vrednosti zavisnog obeležja, koji e sa verovatno om 1-

obuhvatiti stvarnu prose nu vrednost zavisnog obeležja E(Yp), iznosi:

pp ynpp

ynp styYEsty __

2,2

^

2,2

^

.

Page 225: Poslovna statistika

Poslovna statistika

225

7.1.9. Interval predvi anja individualne vrednosti zavisnog obeležja Y, za datu vrednost nezavisnog obeležja X=xp

Stvarna individualna vrednost zavisnog obeležja Y za datu vrednost nezavisnog obeležja X=xp iznosi

ppp xY ,

a ocenjena vrednost iznosi

ppxbay

^

.

Meru odstupanja ocenjene vrednosti p

y^

od prave individualne vrednosti Yp,

opisuje standardna greška ocene individualne vrednosti zavisnog obeležja,koju ozna avamo sa

pys , i koju za X=xp izra unavamo po formuli:

n

x

x

n

x

x

nss

n

i

in

i

i

n

i

i

p

ey p 2

1

1

2

2

1

11 .

Interval individualne vrednosti zavisnog obeležja, koji e sa verovatno om 1- obuhvatiti stvarnu individualnu vrednost zavisnog obeležja Yp, iznosi:

pp yn

ppyn

p styYsty2

,2

^

2,2

^

.

Page 226: Poslovna statistika

Poslovna statistika

226

Evidentno je da je za datu verovatno u 1- , širina intervala i prose ne i individualne vrednosti direktno srazmerna standardnoj greški ocene _

py

s ,

odnosnopys . Analizom izraza za standardnu grešku ocene individualne i

prose ne vrednosti, zaklju ujemo da za širinu intervala i prose ne i individualne vrednosti, za datu verovatno u 1- , važi slede e:

- pove anjem standardne greške regresije, se, odnosno pove anjem

raspršenoš u ta aka oko linije regresije, pove avaju se širine oba

intervala;

- pove anjem veli ine uzorka (broja n), širine oba intervala se smanjuju;

- udaljavanjem izabrane vrednosti xp od uzora ke aritmeti ke sredine

obeležja X, širina oba intervala se pove ava; zbog toga bi trebalo predvi anje vršiti za vrednosti nezavisnog obeležja koja nisu previše

udaljene od uzora ke aritmeti ke sredine obeležja X;

- pove anjem disperzije obeležja X, širina oba intervala se smanjuje;

zbog toga se pri planiranju uzorka uzima što širi dijapazon mogu ih

vrednosti obeležja X.

Page 227: Poslovna statistika

Poslovna statistika

227

7.2. Kvadratna regresija i korelacija

Neka smo iz populacije veli ine N, uzeli slu ajan uzorak veli ine n, i neka su na njemu uzeti parovi uzora kih podataka (xi,yi), i = 1, 2, ..., n za obeležja X iY, iju zavisnost ispitujemo. Neka dijagram raspršenosti definisan ovim uzorkom, dat na slici 7.2.1, indicira da se radi o kvadratnoj zavisnosti obeležja X i Y u itavoj populaciji,

2XXY (opravdano pretpostavljena zavisnost obeležja X i Y uitavoj populaciji).

Zadatak kvadratne regresione analize je da oceni koeficijente , i , koji opisuju kvadratnu zavisnost u itavoj populaciji, na osnovu uzora kih podataka (xi,yi), i = 1, 2, ..., n.

x3 X

Slika 7.2.1. Dijagram raspršenosti uzorka

Sli no kao i kod linearne regresije, ukoliko bismo poznavali parametre , i ,zbog stohasti nosti zavisnosti obeležja X i Y važilo bi:

iiii xxy 2 , i = 1, 2, ..., N,

gde je sa i obeležen stohasti ki lan (slu ajni poreme aj) i-tog lanapopulacije.

Y

y3

Page 228: Poslovna statistika

Poslovna statistika

228

Ovaj stohasti ki lan i je, isto kao i kod linearne regresije, posledica fenomena koje ne opisuje kvadratna regresiona zavisnost obeležja X i Y.

U slu ajevima kada taj lan ima osobine navedene prilikom analize linearnog regresionog modela, oceni emo parametre , i iz uzora kih podataka (xi,yi), i = 1, 2, ..., n, metodom minimiziranja sume svih kvadrata stohasti kog lana

i, izra unate na uzora kim podacima u odnosu na ocenjene vrednosti za , i .

Naime, neka je, recimo, ocena parametra koeficijent a, ocena parametrakoeficijent b, a ocena parametra koeficijent c. Tada je uzora ka kvadratna

regresiona kriva, koju emo obeležiti sa ^

y , jednaka:

2^

xcxbay ,

a za svaki par uzora kih podataka (xi,yi), i = 1, 2, ..., n važi slede e:

iiii xcxbay 2

2^

iii xcxbay .

Koeficijente a, b i c, kao što smo rekli, dobi emo minimiziranjem slede egizraza

n

i

iii

n

i

ii

n

i

i xcxbayyy1

22

1

2^

1

2 ))(()( .

Postupak minimiziranja se sprovodi nalaženjem parcijalnih izvoda navedenog izraza po parametrima a, b i c, i njihovim izjedna avanjem sa nulom:

Page 229: Poslovna statistika

Poslovna statistika

229

0

))((

0

))((

0

))((

1

22

1

22

1

22

c

xcxbay

b

xcxbay

a

xcxbay

n

i

iii

n

i

iii

n

i

iii

odakle dobijamo slede i sistem jedna ina:

n

i

i

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

i

n

i

ii

n

i

i

n

i

i

n

i

i

xcxbxayx

xcxbxayx

xcxbany

1

4

1

3

1

2

1

2

1

3

1

2

11

1

2

11

Ovaj sistem jedna ina ima jedinstveno rešenje po a, b i c.

Ovako dobijene ocene za , i su, pod navedenim regresionim pretpostavkama, najefikasnije ocene. Dakle, važi:

.)(

)(

)(

cE

bE

aE

Page 230: Poslovna statistika

Poslovna statistika

230

7.2.1. Standardna greška kvadratne regresije, se

Pomo u ovako dobijenih a, b i c, možemo oceniti varijansu stohasti kihlanova i ,

2 sa 2es , po formuli:

33

)(

311

2

111111

2

1

2^

1

2

2

n

yxcyxbyay

n

yy

ns

n

ii

n

ii

n

i

n

i

n

i

ii

n

i

i

e

i dobiti standardnu grešku regresije, se, po formuli:

33

)(

311

2

111111

2

1

2^

1

2

n

yxcyxbyay

n

yy

ns

n

ii

n

ii

n

i

n

i

n

i

ii

n

i

i

e

7.2.2. Koeficijent determinacije kvadratne regresije, r2

Koeficijent determinacije kod kvadratne regresije izra unavamo po formuli:

2

1

1

2

2

1

1

2

11

2

n

y

ny

n

y

nyxcyxbya

rn

i

in

i

i

n

i

in

i

ii

n

i

ii

n

i

i

.

Smisao parametara standardne greške kvadratne regresije, se, i koeficijenta

determinacije kvadratne regresije, r2, isti je kao i kod linearne regresije.

Page 231: Poslovna statistika

Poslovna statistika

231

7.3. Logaritamska regresija i korelacija

Neka smo iz populacije veli ine N uzeli slu ajan uzorak veli ine n, i neka su na njemu uzeti parovi uzora kih podataka (xi,yi), i = 1, 2, ..., n za obeležja X iY, iju zavisnost ispitujemo. Neka dijagram raspršenosti definisan ovim uzorkom, dat na slici 7.3.1, indicira da se radi o logaritamskoj zavisnosti obeležja X i Y u itavoj populaciji,

XY ln (opravdano pretpostavljena zavisnost obeležja X i Y u itavoj

populaciji).

Zadatak logaritamske regresione analize je da oceni koeficijente i , koji opisuju logaritamsku zavisnost u itavoj populaciji, na osnovu uzora kihpodataka (xi,yi), i = 1, 2, ..., n.

x3

XSlika 7.3.1. Dijagram raspršenosti uzorka

Y

y3

Page 232: Poslovna statistika

Poslovna statistika

232

Uvo enjem smene XX ln* , logaritamska regresija XY ln svodi

se na linearnu regresiju *XY , pa se ocena parametara i , kao i itava regresiona analiza sprovodi kao za linearnu regresiju, s tim što se umesto

uzora kih vrednosti za nezavisnu promenljivu xi, koriste njihovi logaritmi lnxi.To jest, sve formule i zaklju ci iz linearne regresije važe, samo što vrednosti za xi (i = 1, 2, ..., n) zamenjujemo vrednostima lnxi (i = 1, 2, ..., n).

7.4. Eksponencijalna regresija i korelacija

Neka smo iz populacije veli ine N uzeli slu ajan uzorak veli ine n, i neka su na njemu uzeti parovi uzora kih podataka (xi,yi), i = 1, 2, ..., n za obeležja X iY, iju zavisnost ispitujemo. Neka dijagram raspršenosti definisan ovim uzorkom, dat na slici 7.4.1, indicira da se radi o eksponencijalnoj zavisnosti obeležja X i Y u itavoj populaciji,

XeY (opravdano pretpostavljena zavisnost obeležja X i Y u itavoj

populaciji).

Zadatak eksponencijalne regresione analize je da oceni koeficijente i , koji opisuju eksponencijalnu zavisnost u itavoj populaciji, na osnovu uzora kihpodataka (xi,yi), i = 1, 2, ..., n.

x3 X

Slika 7.4.1. Dijagram raspršenosti uzorka

Y

y3

Page 233: Poslovna statistika

Poslovna statistika

233

Uvo enjem smena YY ln* , ln* , eksponencijalna regresija XeY se svodi na linearnu regresiju XY ** , pa se ocena

parametara * i , kao i itava regresiona analiza sprovodi kao za linearnu regresiju, s tim što se umesto uzora kih vrednosti za nezavisnu promenljivu yi,koriste njihovi logaritmi lnyi.

Na ovaj na in dobijamo ocenu parametra *, recimo a*, dok ocenu parametra

, koju obeležavamo sa a, dobijamo kao *aea .

Sve formule i zaklju ci iz linearne regresije važe, samo što vrednosti za yi (i = 1, 2, ..., n) zamenjujemo vrednostima lnyi (i = 1, 2, ..., n).

Primer 7.1. U Tabeli 7.1. prikazani su podaci o cenama i prodatoj koli ini(tražnji) jedne vrste proizvoda.

Cena po

1 kg u dinarima

(x)

Tražnja u tonama

(y)

5 42

10 30

12 22

15 14

16 6

Tabela 7.1.

a) Odrediti parametre linearne regresije i predstaviti je grafi ki. b) Odrediti standardnu grešku regresije se.

c) Odrediti standardnu grešku ocene nagiba sb. d) Odrediti koeficijent proste linearne korelacije r, i koeficijent determinacije r2.

e) Odrediti standardnu grešku ocene koeficijenta proste linearne korelacije sr.

f) Testirati postojanje linearne zavisnosti tražnje ovog proizvoda od njegove cene pomo u Studentovog t-testa sa nivoom zna ajnosti = 0,05za: 1) ocenu nagiba, 2) ocenu proste linearne korelacije.

Page 234: Poslovna statistika

Poslovna statistika

234

g) Odrediti standardnu grešku ocene prose ne vrednosti zavisne promenljive (u ovom slu aju tražnje) _

py

s , pri ceni xp=11 din./kg.

h) Odrediti standardnu grešku ocene individualne vrednosti zavisne promenljive (u ovom slu aju tražnje)

pys , pri ceni xp=11 din./kg.

i) Oceniti interval prose ne vrednosti tražnje pri ceni xp=11

din./kg sa nivoom pouzdanosti 1- = 0,95.

j) Oceniti interval individualne vrednosti tražnje pri ceni xp=11 din./kg sa nivoom pouzdanosti 1- = 0,95.

Rešenje:

a)

Linearna regresija ocenjena iz n uzora kih parova (xi , yi), data je u

obliku xbay^

, gde je:

n

x

bn

y

a

xxn

yxyxn

b

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

112

11

2

111 .

Analiziraju i podatke iz tablice 7.1.a. i imaju i u vidu da je n=5, dobijamo:

Cena po

1 kg u din.

(xi)

Tražnja u

tonama

(yi)xi yi xi

2yi

2

5 42 210 25 1764

10 30 300 100 900

12 22 264 144 484

15 14 210 225 196

16 6 96 256 36

585

1i

ix 1145

1i

iy 10805

1i

ii yx 7505

1

2

i

ix 33805

1

2

i

iy

Tabela 7.1.a.

Page 235: Poslovna statistika

Poslovna statistika

235

22.595

58)14.3(

5

11414.3

587505

11458108052

ab

Dakle, jedna ina linearne regresije je 22.5914.3^

xy i grafi ki je

predstavljena na slede oj slici.

y = -3.1399x + 59.223

R2 = 0.9745

0

5

10

15

20

25

30

35

40

45

50

0 2 4 6 8 10 12 14 16 18

b) Standardna greška regresije se iznosi:

59.23

108014.311422.593380

2111111

2

n

yxbyay

s

n

ii

n

i

n

i

e

Page 236: Poslovna statistika

Poslovna statistika

236

c) Standardna greška ocene nagiba sb, iznosi:

295,0

5

58750

59.222

1

1

2

n

x

x

ss

n

i

in

i

i

eb

d) Koeficijent proste linearne korelacije r je:

9872,011433805587505

114581080522

2

11

2

2

11

2

111

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

i

n

i

ii

yynxxn

yxyxn

r

Koeficijent determinacije je kvadrat koeficijenta proste linearne korelacije. tj, koeficijent determinacije je:

9745,09872,0 22r

e)

Standardna greška ocene koeficijenta proste linearne korelacije sr iznosi:

092,02

1 2

n

rsr

Page 237: Poslovna statistika

Poslovna statistika

237

¸f)

1)

Kako je za n=5 i = 0,05

1824,364.10295.0

14.3

2,2n

b

ts

b,

zaklju ujemo pomo u testa nagiba, uz rizik verovatno e 0,05,

da se parametar nagiba b razlikuje od nule i da postoji linearna

veza izme u cene i tražnje ovog proizvoda.

2)

Kako je za n=5 i = 0,05

1824,373.10092,0

9872,0

2,2n

r

ts

r,

zaklju ujemo pomo u testa korelacije, uz rizik verovatno e 0,05,

da postoji linearna veza izme u cene i tražnje ovog proizvoda.

g)

Standardna greška ocene prose ne vrednosti tražnje ovog

proizvoda _

py

s , pri ceni xp=11 din./kg, je:

17,1

5

58750

5

5811

5

159.2

12

2

2

1

1

2

2

1

_

n

x

x

n

x

x

nss

n

i

in

i

i

n

i

i

p

ey p

Page 238: Poslovna statistika

Poslovna statistika

238

h)

Standardna greška ocene individualne vrednosti tražnje ovog

proizvodapys , pri ceni xp=11 din./kg, je:

11.3

5

58750

5

5811

5

1159.2

11

2

2

2

1

1

2

2

1

n

x

x

n

x

x

nss

n

i

in

i

i

n

i

i

p

ey p

i)

Kako je

683.24223.591114.3)11(^

py ,

to interval prose ne vrednosti tražnje pri ceni xp=11 din./kg sa nivoom

pouzdanosti 1- = 0,95, iznosi:

41.2895.20

17.11824,3683.2417.11824,3683.24

__

2,2

^

2,2

^

p

p

ynpp

ynp

YE

YE

styYEstypp

Page 239: Poslovna statistika

Poslovna statistika

239

j)

Kako je

683.24223.591114.3)11(^

py ,

to interval individualne vrednosti tražnje pri ceni xp=11 din./kg sa

nivoom pouzdanosti 1- = 0,95, iznosi:

58.3478.14

11.31824,3683.2411.31824,3683.242

,2

^

2,2

^

p

p

yn

ppyn

p

Y

Y

styYstypp

Page 240: Poslovna statistika

Poslovna statistika

240

8. INDEKSI

Dosadašnja analiza varijabiliteta odre enih obeležja u populaciji nije razmatrala promene obeležja u razli itim vremenskim trenucima, ve su se analizirale promene obeležja unutar osnovnog skupa (populacije) u okviru jednog vremenskog trenutka (ili intervala) i analiza se usmeravala na strukturu obeležja u okviru populacije ili na povezanosti koje ta struktura ima sa strukturama drugih obeležja. Vreme, dakle, u ovim analizama nije predstavljalo promenljivu, ili faktor zavisnosti, ve je samo odre ivalo trenutak (ili interval) u kome su analize vršene. Zbog toga se dosadašnji metodi statisti ke analize nazivaju metodi stati ke statisti ke analize.

Naravno da se sve pojave (a naro ito ekonomske) manje ili više menjaju u vremenu. Metodi statisti ke analize pomo u kojih se analizira vremenska zavisnost obeležja, odnosno vremenska zavisnost njegovog varijabiliteta, nazivaju se metodi dinami ke statisti ke analize.

Vremenska zavisnost obeležja prati se pomo u vremenskih serija, kojepredstavljaju nizove podataka o vrednosti odre enog obeležja u odre enim vremenskim trenucima. Poželjno je da ti izabrani vremenski trenuci budu takvi da su vremenski intervali izme u svaka dva uzajamno sukcesivna trenutka me usobno jednaki.

Naravno, da bi analiza vremenskih serija omogu ila ispravne zaklju ke o dinamici posmatranog obeležja, neophodno ja da isto obeležje bude definisano i mereno na isti na in u svim vremenskim trenucima. Na taj na in se dobijaju takozvane homogene vremenske serije, i one su predmet naše dalje analize.

U ovom udžbeniku upozna emo dva razli ita metoda dinami ke statisti ke

analize.

Prvi metod, koji emo analizirati u ovom poglavlju, jeste metod indeksa (iliskra eno – indeksi), po kome se vrši relativno upore ivanje vrednosti jednog ili više obeležja u razli itim vremenskim trenucima, i iz tih relativnih promena obeležja u razli itim vremenskim trenucima donose se odre eni zaklju ci.

Drugi metod, koji je analiziran u devetom poglavlju ovog udžbenika, jeste metod dekompozicije vremenskih serija, pomo u koga se pokušavaju prona i osnovne komponente vremenske serije. Tako e, u devetom poglavlju

Page 241: Poslovna statistika

Poslovna statistika

241

je dat i osvrt na predvi anja ponašanja vremenske serije u bliskoj budu nosti,odnosno na prognozu vrednosti obeležja u bliskoj budu nosti.Indeksi koji izražavaju relativnu promenu vrednosti jednog obeležja u razli itim trenucima, nazivaju se individualni indeksi, dok se indeksi koji izražavaju relativnu promenu vrednosti grupe obeležja u razli itim trenucima, nazivaju grupni (agregatni) indeksi.

Indeksi (i individualni i grupni) generalno se mogu svrstati u tri osnovne grupe: indeks cena, indeks koli ina (indeks fizi kog obima) i indeks vrednosti (indeks proizvoda koli ina i cena). Iz ovih indeksa izvedeni su razni drugi indeksi: indeks produktivnosti, indeks troškova života, indeks realnih primanja, itd.

8.1. Individualni indeksi

Kao što je re eno, individualni indeksi su relativni brojevi kojima se prati promena vrednosti jednog obeležja (cena, koli ina...) u razli itim vremenskim trenucima.

Ukoliko se prati promena obeležja u odnosu na jednu unapred izabranu vrednost obeležja iz nekog vremenskog trenutka, onda se takvi indeksi nazivaju bazni. Tada se ta izabrana vrednost obeležja, sa kojom se ostale vrednosti upore uju, naziva baza.

Ukoliko se prati promena vrednosti obeležja u jednom trenutku u odnosu na vrednost obeležja iz prethodnog trenutka, onda se takvi indeksi nazivaju lan ani.

8.1.1. Individualni bazni indeksi, Bi

Ozna imo sa nyyy ,,, 21 vrednosti obeležja u trenucima nttt ,,, 21 , gde je sa

iy ozna ena vrednost obeležja u trenutku it , i neka je sa By ozna ena bazna

vrednost obeležja u trenutku Bt .

Tada se individualni bazni indeksi, koje ozna avamo sa Bi, izra unavaju po formuli:

100B

ii

y

yB (i = 1, 2, ..., n).

Page 242: Poslovna statistika

Poslovna statistika

242

Ukoliko, recimo, bazni indeks u trenutku ti iznosi 35,106iB , to zna i da je

vrednost obeležja u trenutku ti za 6,35% ve a od vrednosti obeležja u baznom

trenutku, dok ako, recimo, bazni indeks u trenutku ti iznosi 34,92iB , to

zna i da je vrednost obeležja u trenutku ti za 7,66% manja od vrednosti obeležja u baznom trenutku.

Primer 8.1.1. Koriste i podatke iz Tabele 8.1.1, analizirati promene ukupnog broja zaposlenih u odnosu na 2002. godinu, koriste i bazne indekse.

Godina Broj zaposlenih (000)

2001. 178 2002. 169 2003. 180 2004. 195 2005. 201

Tabela 8.1.1

Rešenje:

Koriste i formulu za dobijanje baznih indeksa 100B

ii

y

yB , gde je bazna

godina 2002, dobijamo:

GodinaBroj

zaposlenih(000)

Bazni indeks

B2002=100

2001. 178 105,33

2002. 169 100

2003. 180 106,5

2004. 195 115,38

2005. 201 118,93

gde je, na primer, B2004 dobijen kao 38.115100169

195100

2002

20042004

y

yB .

Page 243: Poslovna statistika

Poslovna statistika

243

8.1.2. Individualni lan ani indeksi, Li

Ozna imo sa nyyy ,,, 21 vrednosti obeležja u trenucima nttt ,,, 21 , gde je sa

iy ozna ena vrednost obeležja u trenutku it .

Tada se individualni lan ani indeksi, koje ozna avamo sa Li, izra unavaju po formuli:

1001i

ii

y

yL ( i = 2, ..., n).

Dakle, ne postoji individualni lan ani indeks prvog lana vremenske serije jer prvi lan nema prethodni, pa se nema sa ime upore ivati.

Ukoliko, recimo, lan ani indeks u trenutku ti iznosi 35,106iB , to zna i da je

vrednost obeležja u trenutku ti za 6,35% ve a od vrednosti obeležja u prethodnom trenutku ti-1, dok ako, recimo, bazni indeks u trenutku ti iznosi

34,92iB , to zna i da je vrednost obeležja u trenutku ti za 7,66% manja od

vrednosti obeležja u prethodnom trenutku ti-1.

Primer 8.1.2. Koriste i podatke iz Tabele 8.1.2, analizirati promene ukupnog broja zaposlenih koriste i lan ane indekse.

Godina Broj zaposlenih (000)

2001 178 2002 169 2003 180 2004 195 2005 201

Tabela 8.1.2.

Page 244: Poslovna statistika

Poslovna statistika

244

Rešenje:

Koriste i formulu za dobijanje lan anih indeksa 1001i

ii

y

yL ( i=2,...,n),

dobijamo:

GodinaBroj

zaposlenih(000)

Lan ani indeks

2001. 178 2002. 169 94,94

2003. 180 106,5

2004. 195 108,33

2005. 201 103,08

gde je na primer L2004 dobijen kao 33.108100180

195100

2003

20042004

y

yL .

8.1.3. Srednji tempo porasta, S

Neka obeležje Y ima tendenciju rasta u periodu t1 do tn.

Ozna imo sa nyyy ,,, 21 vrednosti obeležja Y u trenucima nttt ,,, 21 , gde je

sa iy ozna ena vrednost obeležja u trenutku it .

Srednji tempo porasta, S, predstavlja prose nu porast vrednosti obeležja za posmatrani period, i izra unava se po formuli:

10011

1

nn

y

yS .

Page 245: Poslovna statistika

Poslovna statistika

245

Kako je

1321

12

3

1

21

1

nn

n

n

nn

n LLLy

y

y

y

y

y

y

y ,

to je srednji tempo porasta jednak:

1001132

nnLLLS .

Ukoliko, recimo srednji tempo porasta u periodu od t1 do tn iznosi 35,6S , to zna i da je vrednost obeležja u periodu od t1 do tn prose no rasla za 6,35% u svakom vremenskom intervalu (ti-1 , ti ), ( i = 2, ..., n).

Primer 8.1.3. Koriste i podatke iz Tabele 8.1.3, prona i srednji tempo porasta broja zaposlenih za period 2001-2005. godine.

Godina Broj zaposlenih (000)

2001. 178 2002. 169 2003. 180 2004. 195 2005. 201

Tabela 8.1.3.

Rešenje:

Srednji tempo porasta je 08.31001178

2011001 44

2001

2005

y

yS .

Dakle, u periodu od 2001. do 2005. godine, broj zaposlenih se prose no

pove avao za 3,08% godišnje.

Page 246: Poslovna statistika

Poslovna statistika

246

8.1.4. Srednji tempo pada, P

Neka obeležje Y ima tendenciju opadanja u periodu t1 do tn. Ozna imo sa

nyyy ,,, 21 vrednosti obeležja Y u trenucima nttt ,,, 21 , gde je sa iy

ozna ena vrednost obeležja u trenutku it .

Srednji tempo pada, P, predstavlja prose no opadanje vrednosti obeležja za posmatrani period, i izra unava se po formuli:

1001 1

1

nn

y

yP .

Kako je

1321

12

3

1

21

1

nn

n

n

nn

n LLLy

y

y

y

y

y

y

y ,

to je srednji tempo pada jednak:

1001 132

nnLLLP .

Ukoliko, recimo, srednji tempo pada u periodu od t1 do tn iznosi 35,6P , to zna i da je vrednost obeležja u periodu od t1 do tn prose no opadala za 6,35% u svakom vremenskom intervalu (ti-1 , ti ), (i = 2, ..., n).

Primer 8.1.4. Koriste i podatke iz Tabele 8.1.4, prona i srednji tempo pada broja zaposlenih za period 2001-2005. godine.

Godina Broj zaposlenih (000)

2001. 178 2002. 169 2003. 160 2004. 162 2005. 158

Tabela 8.1.4.

Page 247: Poslovna statistika

Poslovna statistika

247

Rešenje:

Srednji tempo pada je 93.2100178

15811001 44

2001

2005

y

yP .

Dakle, u periodu od 2001. do 2005. godine, broj zaposlenih se prose no

smanjivao za 2,93% godišnje.

8.2. Grupni (agregatni) indeksi

Grupni (agregatni) indeksi su relativni brojevi kojima se prati promena vrednosti grupe srodnih obeležja (cena prehrambenih proizvoda, cena mle nihproizvoda, koli ina poljoprivredne proizvodnje...) u razli itim vremenskim trenucima.

Svaki lan odre ene grupe obeležja dat je, naravno, u vidu vremenske serije individualnih indeksa tog lana, a zajedni ka (grupna) analiza se može izvršiti na dva na ina: metodom prose nih odnosa (srednjih vrednosti) i metodomagregata individualnih indeksa sastavnih serija.

U našoj daljoj analizi obeležimo sa pi i qi cenu i koli inu u posmatranom trenutku, a sa p0 i q0 cenu i koli inu u baznom periodu. Tada, naravno, vrednost u posmatranom trenutku iznosi ii qp , a vrednost u baznom trenutku iznosi

00 qp .

8.2.1. Metod prose nih odnosa (srednje vrednosti)

Po metodi prose nih odnosa, grupni indeks grupe obeležja izra unava se kao srednja vrednost individualnih baznih indeksa, izra unatih za istu bazu za svakog lana grupe.

Kako je aritmeti ka sredina prirodna srednja vrednost individualnih baznih indeksa, to se grupni indeksi cena, koli ina i vrednosti, po ovom metodu izra unavaju po slede im formulama:

Page 248: Poslovna statistika

Poslovna statistika

248

Indeks cena, Ip n

p

p

I

i

p

1000

Indeks koli ina, Iqn

q

q

I

i

q

1000

Indeks vrednosti, Ipqn

qp

qp

I

ii

pq

10000 ,

gde je n broj lanova grupe, odnosno broj individualnih indeksa, a znak ozna ava da se sumiranje vrši tako e po svim lanovima grupe.

Primer 8.2.1. Na osnovu podataka iz Tabele 8.2.1, izra unati za 2005. godinu kao teku u i 2000. godinu kao baznu, po metodi prose nih odnosa, grupni indeks cena, indeks koli ina i indeks vrednosti grupe mle nih proizvoda.

Proizvod Cena u din./kg2000. g.

(p0)

Cena u din./kg2005. g.

(pi)

Prodatakoli ina (t)

2000. g. (q0)

Prodatakoli ina (t)

2005. g. (qi)

Kajmak 1000 1200 55 60 Pavlaka 600 850 80 80 Mleko 300 450 90 100 Jogurt 400 550 40 60

Tabela 8.2.1.

Page 249: Poslovna statistika

Poslovna statistika

249

Rešenje:

Grupa mle nih proizvoda koju analiziramo sastoji se od n=4 lana

(kajmak, pavlaka, mleko, jogurt), pa koriste i rezultate Tabele 8.2.1.a.,

Proizvod100

0p

pi 1000q

qi 10000 qp

qp ii

Kajmak 120 109,09 130,91

Pavlaka 141,67 100 141,67

Mleko 150 111,11 166,67

Jogurt 137,5 150 206,25

=549,17 =470,2 =645,5

Tabela 8.2.1.a.

po metodi prose nih odnosa dobijamo:

indeks cena 29,1374

17,549100

0

n

p

p

I

i

p

indeks koli ina 55,1174

2,470100

0

n

q

q

I

i

q

indeks vrednosti 375,1614

5,645100

00

n

qp

qp

I

ii

pq .

8.2.2. Metod agregata

Generalno, postoje dva na ina primene metode agregata, odnosno izra unavanja agregatnih indeksa.

Jedan od njih je takozvani neponderisani metod agregata, dok je drugi takozvani ponderisani metod agregata.

Page 250: Poslovna statistika

Poslovna statistika

250

8.2.2.1. Neponderisani metod agregata

Neponderisanim metodom agregata se grupni neponderisani agregatni

indeks dobija kao koli nik zbira svih vrednosti obeležja lanova grupe u posmatranom trenutku i zbira svih vrednosti obeležja lanova grupe u baznom trenutku.

Dakle, grupni neponderisani agregatni indeksi cena, koli ina i vrednosti, izra unavaju se po slede im formulama:

Indeks cena, Ip 1000p

pI

i

p

Indeks koli ina, Iq 1000q

qI

i

q

Indeks vrednosti, Ipq 10000 qp

qpI

ii

pq ,

gde je n broj lanova grupe, odnosno broj individualnih indeksa, a znak ozna ava da se sumiranje vrši tako e po svim lanovima grupe.

Primer 8.2.2.1. Na osnovu podataka iz Tabele 8.2.2.1, izra unati za 2005. godinu kao teku u i 2000. kao baznu, po metodi neponderisanih agregata, grupni indeks cena, indeks koli ina i indeks vrednosti grupe mle nihproizvoda.

Proizvod Cena u din./kg2000. g.

(p0)

Cena u din./kg2005. g.

(pi)

Prodatakoli ina (t)

2000. g. (q0)

Prodatakoli ina (t)

2005. g. (qi)

Kajmak 1000 1200 55 60 Pavlaka 600 850 80 80 Mleko 300 450 90 100 Jogurt 400 550 40 60

Tabela 8.2.2.1.

Page 251: Poslovna statistika

Poslovna statistika

251

Rešenje:

Po metodi agregata, grupni neponderisani indeks cena je:

1000p

pI

i

p , indeks koli ina je 1000q

qI

i

q a , indeks vrednosti

je 10000 qp

qpI

ii

pq . Imaju i u vidu rezultate iz Tabele 8.2.2.1.a.,

Proizvod

Cena u din./kg2000. g.

p0

Cena u din./kg2003. g.

pi

Prodatakoli ina

(t)2000. g.

q0

Prodatakoli ina

(t)2003. g.

qi

p0 q0 pi qi

K 1000 1200 55 60 55000 72000 P 600 850 80 80 48000 68000 M 300 450 90 100 27000 45000 J 400 550 40 60 16000 33000

p0=2300 pi=3050 q0=265 qi=300 = 146000

= 218000

Tabela 8.2.2.1.a.

dobijamo:

indeks cena 61,1321002300

3050100

0p

pI

i

p

indeks koli ina 21,113100265

300100

0q

qI

i

q

indeks vrednosti 32,149100146000

218000100

00 qp

qpI

ii

pq .

Page 252: Poslovna statistika

Poslovna statistika

252

8.2.2.2. Ponderisani metod agregata

Grupni indeksi dobijeni metodom srednje vrednosti i neponderisanim metodom agregata su realni pokazatelji grupnih promena samo ukoliko svi lanovi grupe imaju približno isti zna aj u okviru grupe kao celine, što je u praksi veoma retko.

U slu ajevima kada lanovi grupe nemaju približno podjednak zna aj u okviru grupe kao celine, ponderisani agregatni grupni indeks je indeks koji adekvatno reprezentuje promenu grupe kao celine, izra unatu na osnovu podataka o promenama svakog lana grupe ponaosob.

Ponderisani agregatni grupni indeks je grupni indeks kod koga se vrednost svake komponente grupe množi nekim brojem (ponderom) koji odre ujezna aj te komponente u grupi. Osnovni je problem kako izabrati ponder svakoj komponenti i pomo u njega obezbediti realno predstavljanje dinamike svih delova složene grupe.

Uobi ajeno je da se prilikom izra unavanja indeksa cene za ponder uzimaju vrednosti koli ina, dok se prilikom izra unavanja indeksa koli ina za ponder uzimaju vrednosti cena lanova grupe. Analizira emo slede e na ine izbora pondera:

- Laspeyers-ov metod, - Pasche-ov metod, - Fisher-ov metod, - Marshal-Edgworth-ov metod.

8.2.2.2.1. Laspeyers-ov metod

Po ovom grupnom ponderisanom agregatnom metodu, ponderi se uzimaju kao vrednosti iz bazne godine, pa je po njemu:

Indeks cena, Ip: 10000

0

qp

qpI

i

p

Indeks koli ina, Iq: 10000

0

pq

pqI

i

q .

Page 253: Poslovna statistika

Poslovna statistika

253

Primer 8.2.2.2. Na osnovu podataka iz Tabele 8.2.2.2.

Proizvod Cena u din./kg2000. g.

(p0)

Cena u din./kg2005. g.

(pi)

Prodatakoli ina (t)

2000. g. (q0)

Prodatakoli ina (t)

2005. g. (qi)

Kajmak 1000 1200 55 60 Pavlaka 600 850 80 80 Mleko 300 450 90 100 Jogurt 400 550 40 60

Tabela 8.2.2.2.

Izra unati za 2005 god kao teku u i 2000god. kao baznu, po Laspeyers-ovom metodu ponderisanih agregata, grupni indeks cena i indeks koli ina,grupe mle nih proizvoda.

Rešenje:

Koriste i rezultate Tabele 8.2.2.2.a.,

Proizvod00 qp 0qpi 0pqi

Kajmak 55000 66000 60000

Pavlaka 48000 68000 48000

Mleko 27000 40500 30000

Jogurt 16000 22000 24000

=146000 =196500 =162000

Tabela 8.2.2.2.a.

dobijamo da je po Laspeyers-ovom metodu agregata grupni ponderisani

indeks cena 59,134100146000

196500100

00

0

qp

qpI

i

p

indeks koli ina 96,110100146000

162000100

00

0

qp

pqI

i

q .

Page 254: Poslovna statistika

Poslovna statistika

254

8.2.2.2.2. Pasche-ov metod

Po ovom grupnom ponderisanom agregatnom metodu, ponderi se uzimaju kao vrednosti iz teku e godine, pa je po njemu:

Indeks cena, Ip 1000 i

ii

pqp

qpI

Indeks koli ina, Iq 1000 i

ii

qpq

pqI .

Primer 8.2.2.3. Na osnovu podataka iz Tabele 8.2.2.3.

Proizvod Cena u din./kg2000. g.

(p0)

Cena u din./kg2005. g.

(pi)

Prodatakoli ina (t)

2000. g. (q0)

Prodatakoli ina (t)

2005. g. (qi)

Kajmak 1000 1200 55 60 Pavlaka 600 850 80 80 Mleko 300 450 90 100 Jogurt 400 550 40 60

Tabela 8.2.2.3.

Izra unati za 2005. godinu kao teku u i 2000. kao baznu, po Pasche-ovommetodu ponderisanih agregata, grupni indeks cena i indeks koli ina grupe mle nih proizvoda.

Page 255: Poslovna statistika

Poslovna statistika

255

Rešenje:

Koriste i rezultate Tabele 8.2.2.3.a.

Proizvodii qp 0qpi 0pqi

Kajmak 72000 66000 60000

Pavlaka 68000 68000 48000

Mleko 45000 40500 30000

Jogurt 33000 22000 24000

=218000 =196500 =162000

Tabela 8.2.2.3.a.

dobijamo da je po Pasche-ovom metodu agregata grupni ponderisani

indeks cena 57,134100162000

218000100

0 i

ii

pqp

qpI ,

indeks koli ina 94,110100196500

218000100

0 i

ii

qpq

pqI .

8.2.2.2.3. Fisher-ov metod (Idealni metod)

Po ovom grupnom ponderisanom agregatnom metodu, indeksi se dobijaju kao geometrijska sredina grupnih ponderisanih indeksa dobijenih Laspeyers-ovom metodom i Pasche-ovom metodom.

Dakle,

Fisher-ov (idealni)

Indeks cena, Ip 100000

0

i

iii

Pqp

qp

qp

qpI

Page 256: Poslovna statistika

Poslovna statistika

256

Indeks koli ina, Iq 100000

0

i

iii

qpq

pq

pq

pqI .

Primer 8.2.2.4. Na osnovu podataka iz Tabele 8.2.2.4.

Proizvod Cena u din./kg2000. g.

(p0)

Cena u din./kg2005. g.

(pi)

Prodatakoli ina (t)

2000. g. (q0)

Prodatakoli ina (t)

2005. g. (qi)

Kajmak 1000 1200 55 60 Pavlaka 600 850 80 80 Mleko 300 450 90 100 Jogurt 400 550 40 60

Tabela 8.2.2.4.

Izra unati za 2005. godinu kao teku u i 2000. kao baznu, po Fisher-ovommetodu ponderisanih agregata, grupni indeks cena i indeks koli ina grupe mle nih proizvoda.

Rešenje:

Imaju i u vidu rezultate dobijene dobijene u Primeru 8.2.2.2. i Primeru

8.2.2.3, dobijamo da je Fisher-ov idealni

indeks cena:

58,1341003457,13459,1100000

0

i

iii

Pqp

qp

qp

qpI

Page 257: Poslovna statistika

Poslovna statistika

257

indeks koli ina:

95,1101001094,11096,1100000

0

i

iii

qpq

pq

pq

pqI .

8.2.2.2.4. Marshal-Edgworth-ov metod

Po ovom grupnom ponderisanom agregatnom metodu, ponderi se uzimaju kao zbir vrednosti iz teku e i bazne godine, pa je po njemu:

Indeks cena, Ip 100)(

)(

00

0

i

ii

pqqp

qqpI

Indeks koli ina, Iq 100)(

)(

00

0

i

ii

qppq

ppqI

Primer 8.2.2.5. Na osnovu podataka iz Tabele 8.2.2.5.

Proizvod Cena u din./kg2000. g.

(p0)

Cena u din./kg2005. g.

(pi)

Prodatakoli ina (t)

2000. g. (q0)

Prodatakoli ina (t)

2005. g. (qi)

Kajmak 1000 1200 55 60 Pavlaka 600 850 80 80 Mleko 300 450 90 100 Jogurt 400 550 40 60

Tabela 8.2.2.5.

Page 258: Poslovna statistika

Poslovna statistika

258

Izra unati za 2005. godinu kao teku u i 2000. kao baznu, po Marshal-Edgworth-ovom metodu ponderisanih agregata, grupni indeks cena i indeks koli ina, grupe mle nih proizvoda.

Rešenje:

Na osnovu Tabele 8.2.2.5.a.,

Proizvod

ii qqp 0 iqqp 00 ii ppq 0 ippq 00

Kajmak 138000 115000 132000 121000

Pavlaka 136000 96000 116000 116000

Mleko 85500 57000 75000 67500

Jogurt 55000 40000 60000 38000

=414500 =308000 =383000 =342500

Tabela 8.2.2.5.a.

dobijamo da je po Marshal-Edgworth-ovom metodu

indeks cena

58,134100308000

414500100

)(

)(

00

0

i

ii

pqqp

qqpI

Page 259: Poslovna statistika

Poslovna statistika

259

indeks koli ina

82,111100342500

383000100

)(

)(

00

0

i

ii

qppq

ppqI .

Zadatak 8.3. Na osnovu podataka iz slede e tabele,

Proizvod Cena u din./kg2001. g.

Cena u din./kg2005. g.

Prodatakoli ina (t)

2001. g.

Prodatakoli ina (t)

2005. g. Kukuruz 950 1200 12 16 Pšenica 760 850 18 24

Raž 330 450 20 30 Je am 640 550 25 22 Ovas 450 500 17 24

Izra unati za 2005. godinu kao teku u i 2001. kao baznu:

a) po metodi agregata grupni neponderisani indeks cena, indeks koli ina, indeks vrednosti; b) po metodi prose nih odnosa grupni neponderisani indeks cena, indeks koli ina, indeks vrednosti; c) po metodi agregata grupni ponderisani indeks cena i indeks koli ina po Laspeyers-ovom metodu; d) po metodi agregata grupni ponderisani indeks cena i indeks koli ina po Pasche-ovom metodu; e) Fisher-ov idealni indeks cena i indeks koli ina;

f) Marshal-Edgworth-ov indeks cena i indeks koli ina.

Page 260: Poslovna statistika

Poslovna statistika

260

9. ANALIZA VREMENSKIH SERIJA

Neka posmatrano obeležje X u trenucima t1, t2, ..., tn (u našoj analizi ovi trenuci su ekvidistantni), ima vrednosti x1, x2, ..., xn. Tada niz

nitXxiX ii ,...,2,1)()( predstavlja jednu vremensku seriju.

Statisti ka analiza promene obeležja X u vremenu svodi se na kvantitativnu analizu varijacije niza X(i).

Naravno da su uzroci vremenskih varijacija obeležja X mnogobrojni i raznovrsni, i obi no nisu svi ni poznati. Zbog toga su razvijene mnogobrojne metode analiza vremenskih serija pomo u kojih se pokušavaju prona i makar bitni uzroci koji generišu vremenske varijacije, odnosno iz odre enevremenske serije pokušavaju se prona i inioci serije koji su posledica odre enih uzroka. Taj proces se obi no naziva dekompozicija vremenskih

serija na njene osnovne komponente.

Analiza vremenskih serija se osim u pravcu pronalaženja osnovnih komponenti serije, razvijala i u pravcu predvi anja vrednosti serije, odnosno obeležja, u budu nosti, obi no bliskoj. Analiza predvi anja vremenske serije obi no se naziva prognoza serije mada se kod nas ve odoma io i engleski izraz forecasting.

Postoji ogroman broj razli itih, matemati ki veoma komplikovanih metoda koje su razvijene radi analize vremenskih serija. Proces pronalaženja novih metoda e još dugo trajati, ali se, generalno, sve te metode mogu svrstati u dve grupe.

Prva grupa su metode koje vremenske serije analiziraju u vremenskom

domenu, a druga grupa su metode koje vremenske serije analiziraju u frekventnom domenu.

Ova druga grupa metoda (analiza u frekventnom domenu) je predmet spektralne (harmonijske) analize u kojoj vode u ulogu imaju Furijeovi redovi

i kojom se u ovom udžbeniku ne emo baviti.

U ovom udžbeniku emo vremenske serije analizirati u vremenskom domenu, kako u analizi dekompozicije serije, tako i u analizi prognoze, i upozna emo se sa metodama koje nisu previše komplikovane.

Page 261: Poslovna statistika

Poslovna statistika

261

9.1. Dekompozicija vremenskih serija

U ve em broju slu ajeva se kod vremenskih serija mogu izdvojiti njene etiriosnovne komponente: trend, cikli na komponenta, sezonska komponenta i rezidualna (slu ajna) komponenta.

- Trend je osnovna razvojna tendencija obeležja i nastaje od regularnih uticaja na posmatrnao obeležje. On predstavlja dugoro nu tendenciju razvoja vremenske serije. Trend komponentu vremenske serije obeležava emo sa T,odnosno sa T(i) , i=1,2,...,n.

- Cikli na komponenta su varijacije koje se pojavljuju kao oscilacije oko trenda sa promenljivom periodom koja je obi no ve a od jedne godine. Cikli nu komponentu vremenske serije obeležava emo sa C, odnosno sa C(i),i=1,2,...,n.

- Sezonska komponenta su varijacije koje se pojavljuju kao oscilacije oko trenda sa istom periodom koja je obi no manja do jednaka od jedne godine. Sezonsku komponentu vremenske serije obeležava emo sa S, odnosno saS(i), i=1,2,...,n.

- Rezidualna komponenta su slu ajne ili katastrofalne varijacije. Slu ajnevarijacije imaju karakter slu ajnih grešaka, dok su katastrofalne varijacije posledica nekih prirodnih ili društvenih kataklizmi (poplave, zemljotresi, ratovi i sl...). Rezidualnu komponentu vremenske serije obeležava emo sa R,odnosno sa R(i), i=1,2,...,n.

Za vremensku seriju kažemo da je desezonirana, DX(i), ukoliko iz nje uklonimo sezonsku komponentu S(i).

Naj eš i tipovi modela vremenske serije su aditivni model, multiplikativni

model i mešoviti (kombinovani) model.

Po multiplikativnom modelu vremenska serija je jednaka proizvodu svojih osnovnih komponenti, to jest:

RSCTX odnosno

)()()()()( iRiSiCiTiX i=1,2,...,n,

Page 262: Poslovna statistika

Poslovna statistika

262

)()()()( iRiCiTiDX i=1,2,...,n.

Po aditivnom modelu vremenska serija je jednaka zbiru svojih osnovnih komponenti, to jest:

RSCTX odnosno

)()()()()( iRiSiCiTiX i=1,2,...,n,

)()()()( iRiCiTiDX i=1,2,...,n.

Po kombinovanom modelu vremenska serija je jednaka zbiru proizvoda nekih svojih osnovnih komponenti, na primer:

RSCTX odnosno

)()()()()( iRiSiCiTiX i=1,2,...,n,

)()()()( iRiCiTiDX i=1,2,...,n.

Naravno da je mogu e da neka od ovih komponenti ne postoji u vremenskim varijacijama obeležja, što zavisi od prirode analiziranog obeležja. Tada ta komponenta nije sastavni deo modela, odnosno jednaka je jedinici u multiplikativnom modelu ili nuli u aditivnom modelu. Ovo se ne odnosi na rezidualnu komponentu, jer ona u svakoj statisti koj analizi vremenskih serija uvek postoji.

Dekompozicija vremenske serije predstavlja pronalaženje svake od gore navedenih komponetni. Kao jedna od provera pravilno izvedene dekompozicije originalne vremenske serije je i pronalaženje srednje vrednosti rezidualne (slu ajne) komponente. Naime, ako je ona u multiplikativnom modelu bliska jedinici, odnosno u aditivnom modelu bliska nuli, to je dovoljno dobar pokazatelj da je dekompozicija adekvantno izvedena.

Kombinovani model se veoma retko koristi, dok su multiplikativni i aditivni model dosta zastupljeni. Dekompoziciju vremenske serije emo analizirati na multiplikativnom metodu vremenske serije.

Page 263: Poslovna statistika

Poslovna statistika

263

U procesu dekompozicije vremenske serije koristi emo jedan specifi an metod izravnjanja vremenske serije, koji se zove metod pokretnih proseka, PP.

9.1.1. Metod pokretnih proseka (pokretnih sredina), PP

Metod pokretnih proseka naj eš e se koristi za odre ivanje osnovnog toka pojave, to jest za odre ivanje trenda (T) ukoliko cikli na komponenta ne postoji, ili za odre ivanje proizvoda trenda i cikli ne komponente (T C)ukoliko cikli na komponenta postoji.

Pokretni prosek je jedna vešta ka konstrukcija vremenske serije u kojoj je svaki originalni podatak vremenske serije zamenjen aritmeti kom sredinom tog podatka, odre enog broja prethodnih podataka i isto toliko narednih podataka. Ukupan broj lanova ija se aritmeti ka sredina traži je dakle neparan, i predstavlja red proseka.

Tako, ako svaki originalni podatak vremenske serije zamenimo aritmeti kom sredinom tog podatka, jednog prethodnog i jednog narednog podatka, dobijamo tro lani pokretni prosek.

Ukoliko svaki originalni podatak vremenske serije zamenimo aritmeti kom sredinom tog podatka, dva prethodna i dva naredna podatka, dobijamo peto lani pokretni prosek, itd.

Na primer, neka je data vremenska serija x1, x2, ..., xn.

Ako tražimo njen tro lani pokretni prosek, PP(3), tada e prva pokretna sredina biti

3321

2

__ xxxx i ona e zameniti originalni podatak 2x ,

druga pokretna sredina e biti

3432

3

__ xxxx i ona e zameniti originalni podatak 3x ,

Page 264: Poslovna statistika

Poslovna statistika

264

itd., sve do poslednjeg tro lanog pokretnog proseka

312

1

__nnn

n

xxxx i ona e zameniti originalni podatak 1nx .

Uo imo da ne možemo na i tro lani prosek prvog i poslednjeg originalnog podatka.

Ako tražimo peto lani pokretni prosek, PP(5), vremenske serije x1, x2, ..., xn,tada e prva pokretna sredina biti

554321

3

__ xxxxxx i ona e zameniti originalni podatak 3x ,

druga pokretna sredina e biti

565432

4

__ xxxxxx i ona e zameniti originalni podatak 4x ,

itd., sve do poslednjeg tro lanog pokretnog proseka

51234

2

__nnnnn

n

xxxxxx i ona e zameniti originalni podatak

2nx .

Uo imo da ne možemo na i peto lani prosek prva i poslednja dva originalna podatka.

Ukoliko želimo prona i (2 m+1)- lani pokretni prosek, PP(m), vremenske serije x1, x2, ..., xn,dobi emo izravnatu vremensku seriju

mnmmixm

xm

mj

jii ,,2,1,12

1__

.

Naravno, u ovom slu aju ne možemo na i (2 m+1)- lani pokretni prosek, prvih i poslednjih m originalnih podataka.

Page 265: Poslovna statistika

Poslovna statistika

265

Mogu e je koristiti i parne pokretne proseke. Tako, ako je data vremenska serija x1, x2, ..., xn, tada bi njen prvi pokretni prosek grupe od etiri podatka bio

44321

3/2

__ xxxxx , drugi

45432

4/3

__ xxxxx , itd., i poslednji

4123

1/2

__nnnn

nn

xxxxx ,

a podatak 3x bi zamenili aritmeti kom sredinom 3/2

__

x i 4/3

__

x ,

24/3

__

3/2

__

3

__ xxx ,

podatak 4x bi zamenili aritmeti kom sredinom 4/3

__

x i 5/4

__

x ,

25/4

__

4/3

__

4

__ xxx , itd., i na kraju

podatak 2nx bi zamenili aritmeti kom sredinom 2/3

__

nnx i 1/2

__

nnx ,

21/2

__

2/3

__

2

__nnnn

n

xxx i tako dobili PP(4) originalne serije.

Uo imo da u ovom slu aju ne možemo na i pokretni prosek prva i poslednja dva lana originalne serije.

Page 266: Poslovna statistika

Poslovna statistika

266

Primer 9.1.1. Za vremensku seriju iz Tabele 9.1.1. na i tro lani, etvro lani i peto lani pokretni prosek i prikazati ih grafi ki.

Period i xi

zima 2001. g. 1 182 prole e 2002. g. 2 153

leto 2002. g. 3 146 jesen 2002. g. 4 155 zima 2002. g. 5 167

prole e 2003. g 6 140 leto 2003 g. 7 138

jesen 2003. g. 8 164 zima 2003. g. 9 162

prole e 2004. g. 10 148 leto 2004. g. 11 129

jesen 2004. g. 12 139 zima 2004. g. 13 165

prole e 2005. g. 14 148 leto 2005. g. 15 133

jesen 2005. g. 16 145

Tabela 9.1.1.

Rešenje:

Tro lani PP(3), etvoro lani PP(4) i peto lani pokretni prosek PP(5)

originalne serije dat je u Tabeli 9.1.1.a.

Page 267: Poslovna statistika

Poslovna statistika

267

i xi

PP(3)

3

1

1__

j

ji

i

x

x4

2

1

1/

__

j

ji

ii

x

xPP(4)

21//1

__

iiii

i

xx

x

PP(5)

5

2

2__

j

ji

i

x

x

1 182

2 153 160.3 159

3 146 151.3 155.25 157.125 160.6

4 155 156 152 153.625 152.2

5 167 154 150 151 149.2

6 140 148.3 152.25 151.125 152.8

7 138 147.3 151 151.625 154.2

8 164 154.7 153 152 150.4

9 162 158 150.75 151.875 148.2

10 148 146.3 144.5 147.625 148.4

11 129 138.7 145.25 144.875 148.6

12 139 144.3 145.25 145.25 145.8

13 165 150.7 146.25 145.75 142.8

14 148 148.7 147.75 147 146

15 133 142

16 145

Tabela 9.1.1.a.

Grafi ki prikaz PP(3), PP(4) i PP(5) dat je na slici 9.1.1.

Page 268: Poslovna statistika

Poslovna statistika

268

0

20

40

60

80

100

120

140

160

180

200

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Originalna serija

PP(3)

PP(5)

PP(4)

Slika 9.1.1. Grafi ki prikaz PP(3), PP(4) i PP(5)

9.1.2. Odre ivanje trenda, T(i)

Kao što je ve napomenuto, ukoliko u vremenskoj seriji nije izraženo prisutna cikli na komponenta, onda trend aproksimiramo pokretnim prosecima, odnosno

T(i)=PP(i).

Me utim, ukoliko je evidentno prisustvo cikli ne komponente, onda pokretni prosek predstavlja proizvod trenda i cikli ne komponente, odnosno tada prihvatamo da važi

T(i) C(i)=PP(i).

U ovom slu aju (uo eno prisustvo cikli ne komponente), trend nalazimo pronalaženjem glatke krive T(i), koja ima najmanji kvadrat greške u odnosu na podatke originalne serije (i,xi). Dakle, potpuno identi no kao i kod regresione analize, samo što u ovom slu aju metodom najmanjih kvadrata tražimo

Page 269: Poslovna statistika

Poslovna statistika

269

zavisnost izme u vrednosti obeležja X i vremena t na osnovu podataka (i,xi)

i=1,2,...,n.

Naravno da i u ovom slu aju može postojati linearna veza izme u vrednosti obeležja i vremena koja odre uje linearni trend, zatim paraboli na,eksponencijalna, logaritamska, itd. Sve formule pomo u kojih se metodom najmanjih kvadrata dobijaju razne regresione krive, a koje su date u 7. poglavlju ovog udžbenika, važe i za odre ivanje trenda vremenske serije.

Primer 9.1.2. Prona i linearni trend vremenske serije iz Tabele 9.1.1. pod pretpostavkom da postoji cikli na komponenta. Predstaviti ga grafi ki i tabli no.

Rešenje:

Linearni trend ocenjen iz n uzora kih parova (i , xi), dat je u obliku

ibaiT )( gde je

n

i

bn

x

a

iin

xixin

b

n

i

n

i

i

n

i

n

i

n

i

i

n

i

n

i

i

112

11

2

111.

Rešavanjem ovih jedna ina dobijamo 45.1623618.1 ab , odnosno

linearni trend je oblika 45.1623618.1)( iiT .

Ovaj linearni trend je predstavljen grafi ki na Slici 9.1.2., a tabli no Tabelom

9.1.2.

Page 270: Poslovna statistika

Poslovna statistika

270

y = -1.3618x + 162.45

0

20

40

60

80

100

120

140

160

180

200

0 5 10 15 20

Series1

Linear (Series1)

Slika 9.1.2. Linearni trend serije iz Tabele 9.1.1.

i xi

T(i)

45.162

3618.1

)(

i

iT

1 182 161.1

2 153 159.7

3 146 158.4

4 155 157

5 167 155.6

6 140 154.3

7 138 152.9

8 164 151.6

9 162 150.2

10 148 148.8

11 129 147.5

12 139 146.1

13 165 144.7

14 148 143.4

15 133 142

16 145 140.7

Tabela 9.1.2. Trend serije

Page 271: Poslovna statistika

Poslovna statistika

271

9.1.3. Odre ivanje cikli ne komponente, C(i)

Kako je po multiplikativnom modelu , za PP reda 2 m+1,

)()()( iCiTiPP i=m+1,m+2, ... , n-m,

to se cikli na komponenta odre uje iz

)(

)()(

iT

iPPiC i=m+1,m+2, ... , n-m .

esto se radi lakšeg predstavljanja cikli na komponenta predstavlja u obliku C(i) 100.

Primer 9.1.3. Za vremensku seriju iz Tabele 9.1.1. prona i cikli nukomponentu, uz uslov izravnjanja tro lanim pokretnim prosecima. Predstaviti cikli nu komponentu tabli no i grafi ki.

Rešenje:

Imaju i u vidu da je

)(

)()(

iT

iPPiC i=m+1,m+2, ... , n-m ,

dobijamo slede e vrednosti za cikli nu komponentu (Tabela 9.1.3.

i Slika 9.1.3).

Page 272: Poslovna statistika

Poslovna statistika

272

i xi

PP(3)

3

1

1__

j

ji

i

x

x

T(i)

45.162

3618.1

)(

i

iT

C(i)

)(

))(3(

)(

iT

iPP

iC

C(i) 100

1 182 161.1

2 153 160.3 159.7 1.0038 100.38

3 146 151.3 158.4 0.9556 95.56

4 155 156 157 0.9936 99.36

5 167 154 155.6 0.9895 98.95

6 140 148.3 154.3 0.9614 96.14

7 138 147.3 152.9 0.9635 96.35

8 164 154.7 151.6 1.0205 102.05

9 162 158 150.2 1.0520 105.20

10 148 146.3 148.8 0.9832 98.32

11 129 138.7 147.5 0.9403 94.03

12 139 144.3 146.1 0.9879 98.79

13 165 150.7 144.7 1.0409 104.09

14 148 148.7 143.4 1.0368 103.68

15 133 142 142 0.9998 99.98

16 145 140.7

Tabela 9.1.3. Cikli na komponenta serije

Ciklicna komponenta C(I)

0.85

0.9

0.95

1

1.05

1.1

Ciklicna komponenta C(I)

Slika 9.1.3. Cikli na komponenta serije

Page 273: Poslovna statistika

Poslovna statistika

273

9.1.4. Odre ivanje sezonske komponente, S(i)

Sezonsku komponetu dobijamo usrednjavanjem proizvoda sezonske i rezidualne komponente. Usrednjavanje se vrši po sezonama za koje tražimo sezonsku komponentu, a proizvod sezonske i rezidualne komponente dobijamo kao koli nik originalne serije i serije pokretnih proseka. Naime, po multiplikativnom modelu važi:

)()()()()( iRiSiCiTiX i=1,2,...,n

)()()( iCiTiPP i=m+1,m+2, ... , n-m ,

pa je

)(

)(

)()(

)()()()()()(

iPP

iX

iCiT

iRiSiCiTiRiS i=m+1,m+2, ... , n-m.

Sezonsku komponentu, koja se još naziva i sezonski indeks, dobijamo usrednjavanjem proizvoda S(i) R(i) po sezonama za koje tražimo sezonski indeks.

esto se radi lakšeg predstavljanja sezonska komponenta predstavlja u obliku S(i) 100.

Pokažimo to na primeru vremenske serije iz Tabele 9.1.1.

Primer 9.1.4. Za vremensku seriju iz Tabele 9.1.1. prona i sezonsku komponentu, uz uslov izravnanja tro lanim pokretnim prosecima.

Rešenje:

Kako je

)(

)(

)()(

)()()()()()(

iPP

iX

iCiT

iRiSiCiTiRiS i=m+1,m+2, ... , n-m ,

to je (videti Tabelu 9.1.4).

Page 274: Poslovna statistika

Poslovna statistika

274

i xi

PP(3)

3

1

1__

j

ji

i

x

x

S(i) R(i)

))(3(

)(

)()(

iPP

iX

iRiS

S(i) R(i) 100

1 182

2 153 160.3 0.9543 95.43

3 146 151.3 0.9648 96.48

4 155 156 0.9936 99.36

5 167 154 1.0844 108.44

6 140 148.3 0.9438 94.38

7 138 147.3 0.9367 93.67

8 164 154.7 1.0603 106.03

9 162 158 1.0253 102.53

10 148 146.3 1.0114 101.14

11 129 138.7 0.9303 93.03

12 139 144.3 0.9630 96.30

13 165 150.7 1.0951 109.51

14 148 148.7 0.9955 99.55

15 133 142 0.9366 93.66

16 145

Tabela 9.1.4. Proizvod sezonske i rezidualne komponente serije

Sezonsku komponentu dobijamo usrednjavanjem proizvoda sezonske i

rezidualne komponente serije )()( iRiS , gde se usrednjavanje vrši po sezoni

za koju tražimo sezonski indeks ( u ovom slu aju po godišnjim dobima). Za

originalnu seriju iz našeg primera, indeksi reprezentuju:

i=1,5,9,13, zimski period,

i=2,6,10,14, prole ni,

i= 3,7,11,15 letnji,

i=4,8,12,16 jesenji period,

pa je (videti Tabelu 9.1.4.a),

Page 275: Poslovna statistika

Poslovna statistika

275

Zima Prole e Leto Jesen

2002 0.9543 0.9648 0.9936

2003 1.0844 0.9438 0.9367 1.0603

2004 1.0253 1.0114 0.9303 0.9630

2005 1.0951 0.9955 0.9366_____

RSS 1.0683 0.9762 0.9421 1.0056

Tabela 9.1.4.a

odnosno sezonska serija S(i) data je u Tabeli 9.1.4.b.

i xi

PP(3)

3

1

1__

j

ji

i

x

x

S(i) R(i)

))(3(

)(

)()(

iPP

iX

iRiS

S(i)

____________

)()(

)(

iRiS

iS

S(i) 100

1 182

2 153 160.3 0.9543 0.9762 97.62

3 146 151.3 0.9648 0.9421 94.21

4 155 156 0.9936 1.0056 100.56

5 167 154 1.0844 1.0683 106.83

6 140 148.3 0.9438 0.9762 97.62

7 138 147.3 0.9367 0.9421 94.21

8 164 154.7 1.0603 1.0056 100.56

9 162 158 1.0253 1.0683 106.83

10 148 146.3 1.0114 0.9762 97.62

11 129 138.7 0.9303 0.9421 94.21

12 139 144.3 0.9630 1.0056 100.56

13 165 150.7 1.0951 1.0683 106.83

14 148 148.7 0.9955 0.9762 97.62

15 133 142 0.9366 0.9421 94.21

16 145

Tabela 9.1.4.b. Sezonska komponenta serije

Page 276: Poslovna statistika

Poslovna statistika

276

9.1.5. Odre ivanje rezidualne komponente, R(i)

Rezidualna komponenta serije dobija se kao koli nik proizvoda sezonske i rezidualne komponete i sezonske komponente originalne serije, odnosno

)(

)()()(

iS

iRiSiR i=m+1,m+2, ... , n-m .

esto se radi lakšeg predstavljanja i rezidualna komponenta predstavlja u obliku R(i) 100.

Pokažimo to na primeru vremenske serije iz Tabele 9.1.1.

Primer 9.1.5. Za vremensku seriju iz Tabele 9.1.1. prona i rezidualnu komponentu, uz uslov izravnjanja tro lanim pokretnim prosecima. Prikazati je tabelarno i grafi ki i prokomentarisati njenu aritmeti ku sredinu.

Rešenje:

Kako je

)(

)()()(

iS

iRiSiR i=m+1,m+2, ... , n-m ,

to je (videti Tabelu 9.1.5).

Page 277: Poslovna statistika

Poslovna statistika

277

i xi

PP(3)

3

1

1__

j

ji

i

x

x

S(i) R(i)

))(3(

)(

)()(

iPP

iX

iRiS

S(i)

____________

)()(

)(

iRiS

iS

R(i)

)(

)()(

)(

iS

iRiS

iR

1 182

2 153 160.3 0.9543 0.9762 0.9775

3 146 151.3 0.9648 0.9421 1.0240

4 155 156 0.9936 1.0056 0.9881

5 167 154 1.0844 1.0683 1.0151

6 140 148.3 0.9438 0.9762 0.9668

7 138 147.3 0.9367 0.9421 0.9942

8 164 154.7 1.0603 1.0056 1.0544

9 162 158 1.0253 1.0683 0.9598

10 148 146.3 1.0114 0.9762 1.0360

11 129 138.7 0.9303 0.9421 0.9875

12 139 144.3 0.9630 1.0056 0.9577

13 165 150.7 1.0951 1.0683 1.0251

14 148 148.7 0.9955 0.9762 1.0198

15 133 142 0.9366 0.9421 0.9942

16 145

Tabela 9.1.5. Rezidualna komponenta

Grafik rezidualne komponente dat je na Slici 9.1.5.

Rezidualna komponenta R(I)

0.9

0.95

1

1.05

1.1

Rezidualna komponenta R(I)

Slika 9.1.5. Rezidualna komponenta

Page 278: Poslovna statistika

Poslovna statistika

278

Aritmeti ka sredina rezidualne komponente iznosi

000018.114

)(15

2i

iR

,

što ukazuje na injenicu da je dekompozicija originalne vremenske serije

adekvatno izvršena.

9.1.6. Odre ivanje desezonirane serije, DX(i)

Desezoniranu seriju dobijamo iz originalne serije kada iz nje eliminišemo sezonsku komponentu. Dakle,

)(

)()(

iS

iXiDX i=m+1,m+2, ... , n-m .

Primer 9.1.6. Desezonirati vremensku seriju iz Tabele 9.1.1, uz uslov izravnjanja tro lanim pokretnim prosecima. Prikazati desezoniranu seriju tabelarno i grafi ki.

Rešenje:

Kako je

)(

)()(

iS

iXiDX i=m+1,m+2, ... , n-m ,

to je (videti Tabelu 9.1.6).

Page 279: Poslovna statistika

Poslovna statistika

279

i xi

S(i)

____________

)()(

)(

iRiS

iS

DX(i)

)(

)(

)(

iS

iX

iDX

1 1822 153 0.9762 156.73

3 146 0.9421 154.97

4 155 1.0056 154.14

5 167 1.0683 156.32

6 140 0.9762 143.41

7 138 0.9421 146.48

8 164 1.0056 163.09

9 162 1.0683 151.64

10 148 0.9762 151.61

11 129 0.9421 136.93

12 139 1.0056 138.23

13 165 1.0683 154.45

14 148 0.9762 151.61

15 133 0.9421 141.17

16 145

Tabela 9.1.6. Desezonirana serija

Grafi ki prikaz dat je na Slici 9.1.6.

Desezonirana serija DX(I)

120

130

140

150

160

170

Desezonirana serija DX(I)

Slika 9.1.6. Desezonirana serija

Page 280: Poslovna statistika

Poslovna statistika

280

Zadatak 9.1.1. Za seriju xt iz slede e tabele

Period t xt

zima 2001. g. 1 375 prole e 2002. g. 2 344

leto 2002. g. 3 347 jesen 2002. g. 4 358 zima 2002. g. 5 369

prole e 2003. g. 6 335 leto 2003. g. 7 330

jesen 2003. g. 8 359 zima 2003. g. 9 357

prole e 2004. g. 10 348 leto 2004. g. 11 325

jesen 2004. g. 12 338 zima 2004. g. 13 364

prole e 2005. g. 14 342 leto 2005. g. 15 330

jesen 2005. g. 16 346

odrediti mulitiplikativnim metodom:

a) sezonsku i rezidualnu komponentu serije, sezonske indekse i desezoniranu seriju i predstaviti ih grafi ki; b) cikli nu komponentu serije, pretpostavljaju i da serija ima linearni trend, i predstaviti je grafi ki.

Page 281: Poslovna statistika

Poslovna statistika

281

9.2. Prognoza vremenske serije

Metod dekompozicije, baziran na poravnanju vremenske serije pokretnim prosecima, neupotrebljiv je za predvi anje ponašanja vremenske serije u budu nosti, jer se pokretnim prosecima gube informacije na krajevima vremenskog intervala (za poslednjih m ta aka originalne serije ne možemo na ipokretni prosek reda (2 m+1).

Zbog toga se u ovom slu aju prognoza vrednosti obeležja X u trenutku i+1,

dobija kao vrednost funkcije trenda u ta ki i+1. Ova prognoza nije dovoljno precizna za ozbiljnije analize predvi anja vrednosti obeležja u budu nosti.

Generalno, ako sa fi obeležimo prognozirane vrednosti obeležja xi u trenutku i,onda važi:

)1(1 iTf i .

Primer 9.2.1. Proceniti vrednost vremenske serije iz Tabele 9.1.1. za zimu 2005. pomo u linije trenda.

Rešenje:

Kako je linija trenda ove serije oblika 45.1623618.1)( iiT , i kako za

zimu 2005. indeks i=17, to je prognozirana vrednost analiziranog obeležja u

zimu 2005. iznosi:

30.13945.162173618.1)17(T .

Drugi, precizniji metod prognoze vremenske serije, postiže se metodom eksponencijalnog poravnanja.

9.2.1. Eksponencijalno poravnanje

Kod esponencijalnog poravnanja smatra se da su uslovi koji su generisali prvi prethodni lan od najve eg uticaja na prognozirani slede i lan, zatim uslovi koji su generisali drugi lan koji prethodi prognoziranom imaju drugi po veli ini stepen uticaja, itd.

Page 282: Poslovna statistika

Poslovna statistika

282

Po ovom modelu, ekponencijalno poravnate vrednosti, fi, vremenske serije, xi,i=1,2,...,n, dobijaju se po slede em rekurentnom obrascu:

.,,2,1,1011

11

niafaxaf

xf

iii

O igledno da na ovaj na in, za i=n, dobijamo prognoziranu vrednost u bliskoj budu nosti

nnn faxaf 11 .

Broj a je ponder koji odre uje stepen uticaja uslova koji su determinisali prvi prethodni lan, dok ponder (1-a) ukazuje na to da je uticaj svake prethodne opservacije (1-a) puta manji. Naime, važi:

33

22

1

111

11

111

111

iiii

iiiiii

xaaxaaxaaxa

faxaaxafaxaf

xf

Imaju i u vidu da je greška prognoze u trenutku i jednaka

iii fxe ,

ovaj model eksponencijalnog izravnjanja se može pretstaviti i u obliku

.,,2,1,10

11

11

nia

eaffxaffaxaf

xf

iiiiiiii

Page 283: Poslovna statistika

Poslovna statistika

283

Tako da je nova prognoza jednaka zbiru prethodne prognoze i korekcije za grešku prognoze.

Za primenu u prognozi, pošeljno je da ponder a bude ve i od 0.7. Dok, u slu ajevima u kojima eksponencijalno izravnjanje koristimo umesto serije pokretnih proseka u procesu desezoniranja, poželjno je da ponder a bude manji od 0.4.

Primer 9.2.2. Za vremensku seriju iz Tabele 9.1.1, predstaviti tabelarno i grafi ki eksponencijalno izravnjanje za parametar a=0.8 i a=0.3. Tako e,pomo u ekponencijalno poravnate serije parametrom a=0.8 predvidetivrednost obeležja za zimu 2005.

Rešenje:

Eksponencijalno izravnata serija ft izra unata po formuli

1,...2,111

11

nifaxaf

xf

iii

za a= 0,8 i a=0.3 prikazana je Tabelom 9.2.2. i Slikom 9.2.2.

Period i xi a=0.8 a=0.3 zima 2001 god. 1 182 182 182

prole e 2002 god 2 153 182 182 leto 2002 god 3 146 158.8 173.3

jesen 2002 god 4 155 148.56 165.11 zima 2002 god. 5 167 153.71 162.08

prole e 2003 god 6 140 164.34 163.55 leto 2003 god 7 138 144.87 156.49

jesen 2003 god 8 164 139.37 150.94 zima 2003 god. 9 162 159.07 154.86

prole e 2004 god 10 148 161.41 157 leto 2004 god 11 129 150.68 154.3

jesen 2004 god 12 139 133.34 146.71 zima 2004 god. 13 165 137.87 144.4

prole e 2005 god 14 148 159.57 150.58 leto 2005 god 15 133 150.31 149.8

jesen 2005 god 16 145 136.46 144.76

Tabela 9.2.2 Eksponencijalno poravnanje za a=0.8 i a=0.3

Page 284: Poslovna statistika

Poslovna statistika

284

Grafik originalne serije i serija eksponencijalnih izravnanja za a=0.8 i a=0.3

dat je na Slici 9.2.2.

0

20

40

60

80

100

120

140

160

180

200

Originalna serija X(I) Eksponencijalno poravnjanje a=0.8

Eksponencijalno poravnjanje a=0.3

Slika 9.2.2. Grafik originalne serije i

ekponencijalno poravnate serije za a=0.8 i a=0.3

Prognozirana vrednost obeležja za zimu 2005. po metodi ekponencijalnog

poravnanja za a=0.8 iznosi:

29.14346.1362.01458.01 161617 faxaf .

U smislu koriš enja metode eksponencijalnog izravnjanja za prognoze vrednosti vremenske serije, preporu uje se njena slede a modifikovana verzija, po kojoj se izravnate vrednosti fi, vremenske serije, xi, i=1,2,...,n, dobijaju po slede em rekurentnom obrascu:

.1,,2,1,10111

11

niafaxaf

xf

iii

Page 285: Poslovna statistika

Poslovna statistika

285

Na ovaj na in prognozirana vrednost u trenutku n+1 iznosi

nnn faxaf 11 .

Po ovom metodu, za podatke originalne serije iz Primera 9.2.2. dobijamo slede e vrednosti poravnanja i prognoze za zimu 2005. (Tabela 9.2.2.a.i Slika 9.2.2.a)

Period i xi a=0.8 a=0.3 zima 2001. g. 1 182 182 182

prole e 2002. g. 2 153 158.8 173.3 leto 2002. g. 3 146 148.56 165.11

jesen 2002. g. 4 155 153.71 162.08 zima 2002. g. 5 167 164.34 163.55

prole e 2003. g. 6 140 144.87 156.49 leto 2003. g. 7 138 139.37 150.94

jesen 2003. g. 8 164 159.07 154.86 zima 2003. g. 9 162 161.41 157

prole e 2004. g. 10 148 150.68 154.3 leto 2004. g. 11 129 133.34 146.71

jesen 2004. g. 12 139 137.87 144.4 zima 2005. g. 13 165 159.57 150.58

prole e 2005. g. 14 148 150.31 149.8 leto 2005. g. 15 133 136.46 144.76

jesen 2005. g. 16 145 143.29 144.83

Tabela 9.2.2.a. Poboljšano eksponencijalno poravnanje

za a=0.8 i a=0.3

Grafik originalne serije i serija poboljšanih eksponencijalnih izravnanja za a=0.8 i a=0.3 dat je na Slici 9.2.2.a.

Page 286: Poslovna statistika

Poslovna statistika

286

0

50

100

150

200

Originalna serija X(I)

Poboljsano eksponencijalno poravnjanje a=0.8

Poboljsano eksponencijalno poravnjanje a=0.3

Slika 9.2.2a. Grafik originalne serije i

poboljšano ekponencijalno poravnate serije za a=0.8 i a=0.3

Prognozirana vrednost obeležja za zimu 2005. po metodi poboljšanog ekponencijalnog poravnanja za a=0.8 iznosi:

66.14429.1432.01458.01 161617 faxaf .

Page 287: Poslovna statistika

Poslovna statistika

287

Zadatak 9.2.2. Za seriju iz slede e tabele prognozirati vrednost za januar 2006, koriste i oba metoda eksponencijalnog izravnanja sa konstantom a=0,9 i predstaviti grafi ki originalnu i poravnate serije.

2004. g. t xt 2005 god t xt

januar 1 110 januar 13 478 februar 2 138 februar 14 485

mart 3 215 mart 15 505 april 4 250 april 16 535 maj 5 203 maj 17 576 jun 6 248 jun 18 587 jul 7 308 jul 19 612

avgust 8 327 avgust 20 645 septembar 9 359 septembar 21 684

oktobar 10 375 oktobar 22 716 novembar 11 420 novembar 23 723 decembar 12 465 decembar 24 758

Page 288: Poslovna statistika

Poslovna statistika

288

LITERATURA

Aczel, A. D. – Sounderpandian, J.: Complete Business Statistics, 5th Edition, Mc Grew-Hill, 2002. Berenson, M. L. –Levine, D. M. – Krehbiel, T. C.: Basic Business Statistics Concepts and Applications, 8th Edition, Prentice Hall, 2002. Ivkovi , Z. A.: Matemati ka statistika, „Nau na knjiga”, Beograd, 1992.Mališi , J.: Vremenske serije, Matemati ki fakultet, Beograd, 2002. Mari , N. – Ralevi , N. – Filipovi , L.: Poslovna statistika, Megatrend univerzitet primenjenih nauka, Beograd, 2001. Merkle, M. – Vasi , P.: Verovatno a i statistika, „Akademska misao”, Beograd 2001.Mladenovi , P.: Verovatno a i statistika, Matemati ki fakultet, Beograd, 2002. Peter, J. – Brockwell, R. – Davis, A.: „Introduction to Time Series and Forecasting”, Springer Texts in Statistics, 2nd Edition, 2002.Spanos, Aris.: Probability Theory and Statistical Inference, Econometric Modeling with Observational Data, Cambridge University Press, 1999. Vukadinovi , S. V.: Elementi teorije verovatno e i matemati kestatistike, „Privredni pregled”, Beograd, 1990. Vukadinovi , S. V.: Zbirka rešenih zadataka iz matemati ke statistike,„Nau na knjiga”, Beograd, 1988. Vukadinovi , S. V.: Zbirka rešenih zadataka iz teorije verovatno e,„Privredni pregled”, Beograd, 1990. Žiži , M. –Lovri , M. –Pavli i , D.: Metodi statisti ke analize,Ekonomski fakultet, Beograd, 2001.

Page 289: Poslovna statistika

DODATAK

TABLICE

Page 290: Poslovna statistika
Page 291: Poslovna statistika
Page 292: Poslovna statistika
Page 293: Poslovna statistika
Page 294: Poslovna statistika
Page 295: Poslovna statistika
Page 296: Poslovna statistika
Page 297: Poslovna statistika
Page 298: Poslovna statistika

Prof. dr Dušan Joksimović rođen je 1966. godine u Beogradu.Diplomirao je na Elektrotehničkom fakultetu u Beogradu 1991. godine. Na istom fakultetu je magistrirao 1995. godine i doktorirao 2001. godine.Učesnik je više domaćih i inostranih kongresa i konferencija i ima preko trideset objavljenih ra-dova u domaćim i međunarodnim stručnim pub-likacijama.

Naučni je saradnik Instituta za fiziku i vanredni profesor na Fakulte-tu za poslovne studije Megatrend univerziteta primenjenih nauka za predmete Poslovna matematika i Poslovna statistika.

cyan magenta yellow black

POSLOVNA STATISTIKA

Prof. dr Dušan Joksimović

ISBN 86-7747-205-3 Megatrend univerzitet primenjenih nauka, Beograd, 2006.

Pro

f. d

r D

uša

n J

oks

imo

vić

• PO

SLO

VN

A S

TATI

STIK

A