poslovna statistika
DESCRIPTION
Poslovna statistikaTRANSCRIPT
Prof. dr Dušan Joksimović rođen je 1966. godine u Beogradu.Diplomirao je na Elektrotehničkom fakultetu u Beogradu 1991. godine. Na istom fakultetu je magistrirao 1995. godine i doktorirao 2001. godine.Učesnik je više domaćih i inostranih kongresa i konferencija i ima preko trideset objavljenih ra-dova u domaćim i međunarodnim stručnim pub-likacijama.
Naučni je saradnik Instituta za fiziku i vanredni profesor na Fakulte-tu za poslovne studije Megatrend univerziteta primenjenih nauka za predmete Poslovna matematika i Poslovna statistika.
cyan magenta yellow black
POSLOVNA STATISTIKA
Prof. dr Dušan Joksimović
ISBN 86-7747-205-3 Megatrend univerzitet primenjenih nauka, Beograd, 2006.
Pro
f. d
r D
uša
n J
oks
imo
vić
• PO
SLO
VN
A S
TATI
STIK
A
Prof. dr Dušan Joksimović
POSLOVNASTATISTIKA
Megatrend univerzitet primenjenih nauka, Beograd, 2006.
Prof. dr Dušan JoksimovićPOSLOVNA STATISTIKARecenzenti:
Dr Nebojša Romčević,viši naučni saradnik Instituta za fiziku u BeograduDr Nenad Ignjatović,viši naučni saradnik Instituta tehničkih nauka SANU u Beogradu
Izdaje i štampa:Megatrend univerzitet primenjenih nauka, Beograd, Makedonska 21
Za izdavača:Nevenka Trifunović, izvršni direktor
Direktor izdavačke delatnosti:Dragan Karanović
Lektor:Irina Milutinović
Tehnički urednik:Prof. dr Dušan Joksimović
Dizajn koricaBranimir Trošić
Tiraž:1000 primeraka
Copyright:© 2005 Megatrend univerzitetprimenjenih nauka - BeogradIzdavač zadržava sva prava.Reprodukcija pojedinih delovaili celine ove publikacijenije dozvoljena!
ISBN 86-7747-205-3
Odlukom Komisije za izdavačku delatnost Megatrend univerziteta primenjenih nauka broj 158/44 (23.1.2006) rukopis je odobren za štampu
i upotrebu u nastavi kao udžbenik.
SADRŽAJ ............................................................................................................str.
UVOD .................................................................................................................................71. DESKRIPTIVNA STATISTIČKA ANALIZA ..........................................................101.1. Uređivanje i prikazivanje podataka .....................................................................101.2. Izračunavanje parametara raspodele obeležja ....................................................201.2.1. Parametri srednje vrednosti (mere srednje vrednosti) ................................201.2.2. Parametri varijabiliteta (mere disperzije) ......................................................321.2.3. Parametri oblika rasporeda (mere oblika rasporeda) ...................................53
2. OSNOVNI POJMOVI TEORIJE VEROVATNOĆE ..............................................562.1. Algebra događaja. ...................................................................................................582.2. Verovatnoća ............................................................................................................612.2.1. Definicija verovatnoće ......................................................................................612.2.2. Osobine verovatnoće ........................................................................................642.2.3. Elementi kombinatorike ...................................................................................68
2.2.3.1. Varijacije od n elemenata k-te klase .........................................................692.2.3.2. Permutacije od n elemenata ......................................................................712.2.3.3. Kombinacije od n elemenata k-te klase ...................................................73
3. RASPODELE SLUČAJNIH PROMENLJIVIH .......................................................773.1. Raspodele diskretnih slučajnih promenljivih .....................................................793.1.1. Parametri diskretnih slučajnih promenljivih ................................................85
3.1.1.1. Parametri centralne tendencije diskretneslučajne promenljive ..................................................................................86
3.1.1.2. Parametri varijabiliteta diskretneslučajne promenljive ..................................................................................90
3.1.1.3. Parametri oblika rasporeda diskretneslučajne promenljive ..................................................................................93
3.1.2. Primeri nekih raspodela diskretnihslučajnih promenljivih ......................................................................................95
3.1.2.1. Binomna raspodela, B(n,p) .......................................................................953.1.2.2. Hipergeometrijska raspodela, H(N,N1,n) ................................................973.1.2.3. Puasonova raspodela. P(λ) ................................................................... 100
3.2. Raspodele neprekidnih slučajnih promenljivih ...............................................1043.2.1. Parametri neprekidnih slučajnih promenljivih ...........................................109
3.2.1.1. Parametri centralne tendencije neprekidneslučajne promenljive ................................................................................109
3.2.1.2. Parametri varijabiliteta neprekidneslučajne promenljive .................................................................................111
3.2.1.3. Parametri oblika rasporeda neprekidne slučajnepromenljive ................................................................................................113
3.2.2. Primeri nekih raspodela neprekidnihslučajnih promenljivih ...................................................................................115
3.2.2.1. Normalna (Gausova) raspodela, N(μ,σ2) ...............................................1153.2.2.2. Studentova raspodela (t-raspodela), tv ..................................................1213.2.2.3. Hi-kvadrat raspodela, χv2 ........................................................................124
3.3. Neke osobine matematičkog očekivanja E(X)i Varijanse Var(X) slučajne promenljive X .......................................................127
4. UZORAK I STATISTIKE UZORKA ......................................................................1284.1. Prost slučajni uzorak ............................................................................................1294.2. Raspodele parametara uzorka ............................................................................1334.2.1. Raspodela aritmetičke sredine uzoraka X ....................................................1394.2.2. Raspodela razlike aritmetičkih sredina uzoraka, X1 — X2 ..........................1464.2.3. Raspodela proporcije uzoraka Pr ..................................................................1474.2.4. Raspodela varijanse uzoraka,
S2 -μ poznato, S 2c -μ nepoznato .....................................................................150
5. STATISTIČKO OCENJIVANJE ..............................................................................1525.1. Tačkaste ocene ......................................................................................................1535.2. Intervalne ocene ...................................................................................................1575.2.1. Intervalna ocena aritmetičke sredine populacije, μ ....................................1585.2.2. Intervalna ocena razlike aritmetičkih sredina
populacija, μ1 — μ2 ...........................................................................................1645.2.3. Intervalna ocena proporcije populacije π ....................................................1675.2.4. Intervalna ocena varijanse populacije, σ2 .....................................................170
6. TESTIRANJE PARAMETARSKIHSTATISTIČKIH HIPOTEZA ...................................................................................174
6.1. Testiranje aritmetičke sredine populacije ,μ .....................................................1816.2. Testiranje razlike aritmetičkih sredina populacije, μ1 — μ2 .............................1946.3. Testiranje proporcije populacije, π .....................................................................1996.4. Testiranje varijanse populacije σ2 .......................................................................203
7. REGRESIJA I KORELACIJA ...................................................................................2107.1. Prosta linearna regresija i korelacija ..................................................................2147.1.1. Ocenjivanje parametara α i β iz uzoračkih podataka .................................2167.1.2. Standardna greška regresije, se .......................................................................2187.1.3. Standardna greška ocene nagiba regresione krive, sb .................................2197.1.4. Koeficijent determinacije, r2 ..........................................................................2207.1.5. Koeficijent proste linearne korelacije u uzorku, r .......................................2217.1.6. Standardna greška ocene koeficijenta
proste linearne korelacije, sr ..........................................................................222
7.1.7. Korišćenje linearnog regresionog modelaza predviđanje vrednosti zavisnog obeležja ...............................................223
7.1.8. Interval predviđanja prosečne vrednosti zavisnogobeležja Y, za datu vrednost nezavisnog obeležja X=xp .............................224
7.1.9. Interval predviđanja individualne vrednostizavisnog obeležja Y, za datu vrednost nezavisnog obeležja X=xp .................225
7.2. Kvadratna regresija i korelacija ...........................................................................2277.2.1. Standardna greška kvadratne regresije, se ....................................................2307.2.2. Koeficijent determinacije kvadratne regresije, r2 ........................................230
7.3. Logaritamska regresija i korelacija .....................................................................2317.4. Eksponencijalna regresija i korelacija ................................................................232
8. INDEKSI.....................................................................................................................2408.1. Individualni indeksi .............................................................................................241
8.1.1. Individualni bazni indeksi, Bi ........................................................................2418.1.2. Individualni lančani indeksi, Li .....................................................................2438.1.3. Srednji tempo porasta, S .................................................................................2448.1.4. Srednji tempo pada, P .....................................................................................246
8.2. Grupni agregatni indeksi .....................................................................................2478.2.1. Metod prosečnih odnosa (srednje vrednosti) .............................................2478.2.2. Metod agegata ..................................................................................................249
8.2.2.1. Neponderisani metod agregata ..............................................................2508.2.2.2. Ponderisani metod agregata ...................................................................252
8.2.2.2.1. Lespeyers-ov metod ......................................................................2528.2.2.2.2. Pasche-ov metod ...........................................................................2548.2.2.2.3. Fisher-ov metod (idealni metod) ................................................2558.2.2.2.4. Marshal-Edgworth-ov metod .....................................................257
9. ANALIZA VREMENSKIH SERIJA ........................................................................2609.1. Dekompozicija vremenskih serija ......................................................................2619.1.1. Metod pokretnih proseka (pokretnih sredina), PP ....................................2639.1.2. Određivanje trenda, T(i) ................................................................................2689.1.3. Određivanje ciklične komponente, C(i) .......................................................2719.1.4. Određivanje sezonske komponente, S(i) ......................................................2739.1.5. Određivanje rezidualne komponente, R(i) ..................................................2769.1.6. Određivanje desezonirane serije DX (i) .......................................................278
9.2. Prognoza vremenske serije..................................................................................2819.2.1. Eksponencijalno poravnanje .........................................................................281
LITERATURA ...............................................................................................................288TABELE ..........................................................................................................................291
Poslovna statistika
7
UVOD
- Kratak istorijat statisti ke analize. Po eci statisti ke analize datiraju nekoliko vekova pre naše ere. Prva poznata prebrojavanja sprovedena su u Kini oko 4000 godina pre nove ere i u Egiptu oko 3000 godina pre nove ere, dok su prvi organizovani popisi vršeni u starom veku u Rimskoj republici. U srednjem veku vršeni su uglavnom popisi zemljišta i stoke i u nekim evropskim zemljama registri ro enih, umrlih i ven anih lica. Prvi sistematski organizovani popisi stanovništva vršeni su krajem XVIII veka. Sama re „statistika” prvi put je upotrebljena u prvoj polovini XVIII veka u radovima Gotfrida A envala(Gottfried Achenwal), profesora univerziteta u Getingenu. Po eci statistike kao nau ne discipline skoro istovremeno datiraju od XVII veka u Nema koj i Engleskoj.Po etkom XIX veka dolazi do naglog razvoja statisti kih teorija, najviše zahvaljuju i razvoju teorije verovatno e i složenijih matemati kih analiza. Naravno, vrtoglavi razvoj sistema elektronskih ra unara u drugoj polovini XX veka, inicirao je ogroman skok u aspektu primene statisti kih metoda u, sada ve , gotovo svim analizama bilo kojih masovnih pojava.
U današnje vreme statistika predstavlja simbiozu slede ih komponenti:
- deskriptivna statistika koja se bavi prikupljanjem, obradom i prezentiranjem ve postoje ih podataka;
- statisti ka analiza koja predstavlja skup statisti kih metoda pomo ukojih se vrši kvantitativna analiza me usobnih odnosa izme u pojava koje imaju masovni karakter i pomo u kojih se donose odre enizaklju ci i definišu zakonitosti ponašanja posmatranih pojava;
- statisti ka teorija koja pronalazi nove statisti ke metode i usavršava ve postoje e.
- Predmet statisti kog istraživanja. Statistika istražuje pojave koje su po svojoj prirodi varijabilne, koje imaju masovni karakter i ije ponašanje u masi, na našem nivou intelektualnog razvoja, nije unapred odre eno egzaktnim uzro no-posledi nim zakonitostima. Posmatranjem i analiziranjem pojava na velikom broju slu ajeva, statistika donosi odre ene zaklju ke o masovnom ponašanju tih pojava, te se naj eš e i predstavlja kao nau ni metod kvantitativnog istraživanja masovnih pojava.
Poslovna statistika
8
- Statisti ki skup (populacija, osnovni skup). Skup svih elemenata na kojima se odre ena pojava statisti ki posmatra zove se statisti ki skup (populacija, osnovni skup). Pojedina ni elementi iz kojih se statisti ki skup sastoji zovu se elementi statisti kog skupa (statisti ke jedinice). Definisanje statisti kogskupa u svakom konkretnom slu aju zavisi od prirode pojave koja se želi statisti ki analizirati, od cilja istraživanja i od raspoloživih mogu nostiposmatranja, ali se uvek mora voditi ra una o tome da statisti ki skup bude relativno homogen, odnosno da elementi statisti kog skupa imaju bar jednu zajedni ku osobinu. Što elementi skupa imaju više zajedni kih osobina, to je statisti ki skup homogeniji. Tako e, prilikom definisanja statisti kog skupa, mora se voditi ra una o tome da elementi skupa budu istovrsni, ali, naravno, ne i istovetni. U ovom odžbeniku emo broj lanova populacije (broj elemenata statisti kog skupa) obeležavati sa N.
- Uzorak. Uglavnom je nemogu e, a mahom uvek ekonomski i prostorno-vremenski neopravdano, vršiti statisti ku analizu na itavom statisti kom skupu. Zbog toga se vrlo esto iz itavog statisti kog skupa vrši odabir nekih elemenata skupa (vrši se uzorkovanje skupa) na kojima se sprovodi dalja statisti ka analiza, koja rezultira odre enim kvantitativnim zaklju cima koji važe za itav statisti ki skup. Na ini na koji se vrši uzorkovanje skupa nisu proizvoljni, ve moraju ispuniti odre ene zahteve, koji e biti analizirani u ovom udžbeniku. Podskup statisti kog skupa dobijen uzorkovanjem njegovih elemenata zove se uzorak. Broj lanova uzorka (broj elemata uzorka) u ovom udžbeniku emo obeležavati sa n.
- Obeležje. Osobine po kojima se jedinice statisti kog skupa ili uzorka razlikuju, a koje su predmet statisti ke analize, zovu se obeležja i obi no se dele na atributna (opisna) i numeri ka.
- Atributna obeležja su obeležja koja se izražavaju opisno (zanimanje, boja kose, pol, itd.).
- Numeri ka obeležja su obeležja koja se izražavaju broj ano i mogu biti prekidna (diskretna) i neprekidna (kontinualna).
- Prekidna numeri ka obeležja su ona obeležja koja mogu imati samo izolovane vrednosti (broj prodatih automobila, broj ro enih, broj lanova porodice, itd.).
Poslovna statistika
9
- Neprekidna numeri ka obeležja su ona obeležja koja mogu imati bilo koju vrednost unutar nekog intervala (visina, težina, potrošnja goriva, itd.).
U ovom udžbeniku emo objasniti neke od statisti kih metoda koje se koriste u analizi numeri kih obeležja, dok se analizom atributnih obeležja ne emo baviti.
Generalno, statisti ki metodi analize masovnih pojava se mogu svrstati u dve grupe: deskriptivna statisti ka analiza i analiti ka statistika.
- Deskriptivna statisti ka analiza obuhvata metode prikupljanja, sre ivanja i prikazivanja podataka iz statisti kog skupa ili iz uzorka, i metode odre ivanjaodre enih parametara statisti kog skupa ili uzorka, naravno onih parametara koji su relevantni za opis ponašanja posmatranog obeležja u posmatranom skupu.
- Analiti ka statistika se bavi objašnjavanjem i procenjivanjem varijabiliteta, statisti kim zaklju ivanjima na onovu uzorka i predvi anjima ponašanja posmatranog obeležja u budu nosti.
Tako e, metodi statisti ke analize mogu se podeliti na stati ke i dinami ke.
- Metodi stati ke statisti ke analize analiziraju promene obeležja unutar osnovnog skupa (populacije) u okviru jednog trenutka (ili intervala vremena).
- Metodi dinami ke statisti ke analize analiziraju vremensku zavisnost obeležja.
Poslovna statistika
10
1. DESKRIPTIVNA STATISTI KA ANALIZA
1.1. Ure ivanje i prikazivanje podataka
Dobijeni podaci o vrednostima obeležja koje imaju ispitivani elementi populacije (ili uzorka) predstavljaju niz neure enih numeri kih podataka.
Postupak njihovog ure ivanja predstavlja njihovo predstavljanje po veli ini od najmanje do najve e vrednosti. Tako ure en niz vrednosti posmatranog obeležja predstavlja ure enu statisti ku seriju, iji emo i-ti lan obeležavati sa ix , i obi no ih nazivamo negrupisanim podacima.
Prikazivanje ure enih podataka može biti tabelarno (u vidu tabela) i grafi ko(u vidu grafikona).
Da bi se ure eni podaci prikazali tabelarno ili grafi ki, neophodno je prvo ih grupisati, odnosno odrediti klase po kojima e se raspore ivati elementi populacije (ili uzorka). U zavisnosti od osobina obeležja koje se ispituje, klase mogu biti diskretne (ispitivana obeležja su diskretna) ili intervalne (ispitivanaobeležja su neprekidna).
Diskretna klasa, kod diskretnih obeležja, odre uje onu grupu lanovapopulacije koja ima istu vrednost obeležja, dok intervalna klasa, kod neprekidnih obeležja, odre uje onu grupu lanova populacije koja ima vrednosti unutar istog, unapred odre enog intervala vrednosti obeležja.
Klasni intervali intervalnih klasa obi no su iste širine (u analizama koje e biti sprovedene u ovom udžbeniku, klasni intervali moraju biti iste širine).
Donja i gornja granica klasnog intervala moraju biti jasno i nedvosmisleno odre ene i moraju o uvati kontinualnu prirodu vrednosti posmatranog obeležja, odnosno moraju biti u vidu poluotvorenih intervala koji se ne preklapaju ( iji je presek prazan skup), i koji prekrivaju itavu oblast mogu ihposmatranih vrednosti obeležja ( ija je unija itav interval mogu ih vrednosti obeležja).
Dakle, kod diskretnih obeležja, klase su odre ene vrednostima obeležja koje se pojavljuju u ure enoj seriji, dok kod neprekidnih obeležja, klase (njihov broj, odnosno klasni interval) odre uje osoba koja vrši statisti ku analizu.
Poslovna statistika
11
Broj klasa nadalje emo obeležavati sa K.
Ne postoji jasno definisano pravilo po kome bi se trebalo rukovoditi prilikom odre ivanja broja intervalnih klasa, ve odre eni broj preporuka.
Neke od njih su:
a) po Sturgesovoj formuli NK log3.31
b)
21500
17,12500,200
12,9200,100
10,7100,60
8,660,40
KN
KN
KN
KN
KN
c)
za bilo koje N važi 15,5K .
Predstavnik i-te klase (obeležava emo ga sa ,ix ) kod diskretnih klasa
predstavlja vrednost obeležja koje odre uje i-tu klasu, dok kod neprekidnih klasa predstavlja sredinu i-tog klasnog intervala.
Širina i-tog klasnog intervala (obeležava emo je sa i) predstavlja razliku izme u po etka (i+1)-og i po etka i-tog klasnog intervala. U analizama koje e biti sprovedene u ovom udžbeniku, intervalne klase moraju biti izabrane tako da su im širine me usobno iste, pa emo širinu klasnog intervala obeležavati sa .
Tabelarno, odnosno grafi ko prikazivanje ure enih podataka, u stvari, predstavlja prikazivanje odre enog broja pojavljivanja vrednosti datog obeležja u ispitivanoj populaciji (uzorku), to jest prikazivanje slede ihfrekvencija:
Poslovna statistika
12
- Apsolutna frekvencija i-te klase – obeleži emo je sa fi – kojapredstavlja ukupan broj lanova populacije (uzorka) koji imaju vrednost obeležja odre enu i-tom klasom (i = 1, 2, ..., K).
O igledno je da važi NfK
i
i
1
.
- Relativna frekvencija i-te klase – obeleži emo je sa pi, – kojapredstavlja relativan broj lanova populacije (uzorka) koji imaju vrednost obeležja odre enu i-tom klasom ( i = 1,2,...,K ), to jest
N
fp i
i .
O igledno je da važi 11
K
i
ip .
- Kumulativna frekvencija i-te klase – obeleži emo je sa Ki –
odre ena sa „ ” ukoliko se radi o diskretnim klasama ili intervalnim klasama ija je gornja granica zatvorena, ili sa „ ”ukoliko se radi o intervalnim klasama ija je gornja granica otvorena. Ova kumulativna frekvencija predstavlja ukupan broj lanova populacije (uzorka) koji imaju vrednost obeležja manju ili
jednaku od vrednosti obeležja i-te diskretne klase, ili od vrednosti gornje granice i-te intervalne klase ija je gornja granica zatvorena, odnosno predstavlja ukupan broj lanova populacije (uzorka) koji imaju vrednost obeležja manju od vrednosti gornje granice i-te intervalne klase ija je gornja granica otvorena (i = 1, 2, ..., K).
O igledno je da važi NK K .
- Kumulativna frekvencija i-te klase – obeleži emo je sa Wi –
odre ena sa „ ” ukoliko se radi o diskretnim klasama ili intervalnim klasama ija je donja granica zatvorena, ili sa „ ”ukoliko se radi o intervalnim klasama ija je donja granica otvorena. Ova kumulativna frekvencija predstavlja ukupan broj lanova populacije (uzorka) koji imaju vrednost obeležja ve u ili
jednaku od vrednosti obeležja i-te diskretne klase, ili od vrednosti donje granice i-te intervalne klase ija je donja granica zatvorena, odnosno predstavlja ukupan broj lanova populacije (uzorka) koji imaju vrednost
Poslovna statistika
13
obeležja ve u od vrednosti donje granice i-te intervalne klase ija je donja granica otvorena (i = 1, 2, ..., K).
O igledno je da važi .1 NW
Naravno, sve gore navedeno važi i za uzorak, uz injenicu da je tada N=n.
Grafi ki prikaz frekvencija daje se u vidu grafikona u pravouglom Dekartovom koordinatnom sistemu (x, y), gde se na x-osu nanose vrednosti obeležja i-teklase, a na y-osu vrednost frekvencije koja se predstavlja (recimo fi).
Kod diskretnih obeležja (diskretnih klasa) taj grafi ki prikaz je u vidu izlomljenih pravih linija koje spajaju ta ke ( ,
ix , fi) (ukoliko predstavljamo
apsolutnu frekvenciju fi) i naziva se poligon.
Kod neprekidnih obeležja (intervalnih klasa) taj grafi ki prikaz je u vidu pravougaonika ija je širina jednaka širini klasnog intervala, a visina nad i-tim klasnim intervalom jednaka vrednosti i-te frekvencije koja se predstavlja (recimo fi).
Primer 1.1.1. Anketirana je populacija od 50 studenata o broju položenih ispita i telesnoj težini. Dobijeni su slede i rezultati:
a) broj položenih ispita:
7 4 12 3 7 8 6 5 9 9 10 11 6 7 8 6 9 4 5 5 7 3 9 8 6 8 7 6 8 9 6 7 4 10 11 11 12 6 7 7 8 4 10 11 4 12 6 7 8 9
Poslovna statistika
14
b) težina (u kg):
57 84 112 83 77 68 96 105 90 69 102 71 68 72 78 76 89 74 55 85 87 73 89 78 67 68 74 69 80 79 66 67 64 104 110 91 92 68 75 77 82 64 101 91 64 62 65 73 81 91
Prikazati tabelarno i grafi ki apsolutnu frekvenciju, relativnu frekvenciju, kumulativne frekvencije odre ene sa „manje do jednako od” i „ve e do jednako od”, za oba obeležja.
Rešenje:
a)
Tabelarni prikaz dat je u Tabeli 1.1.1.a.
Broj
položenih
ispita
Apsolutna
frekvencija
fi
Relativna
frekvencija
pi
Kumulativna
frekvencijaKi
Kumulativna
frekvencijaWi
3 2 2/50 2 50
4 5 5/50 7 48
5 3 3/50 10 43
6 8 8/50 18 40
7 9 9/50 27 32
8 7 7/50 34 23
9 6 6/50 40 16
10 3 3/50 43 10
11 4 4/50 47 7
12 3 3/50 50 3
fi=50 pi=1
Tabela 1.1.1.a.
Poslovna statistika
15
Grafi ki prikaz apsolutne, relativne i kumulativnih frekvencija dat je na
slede im slikama.
0
1
2
3
4
5
6
7
8
9
10
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Broj položenih ispita
Ap
so
lutn
a f
re
kv
en
cij
a
Slika 1.1.1.a. Grafi ki prikaz apsolutne frekvencije
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Broj položenih ispita
Rela
tivn
a f
rekven
cija
Slika 1.1.1.b. Grafi ki prikaz relativne frekvencije
Poslovna statistika
16
0
5
10
15
20
25
30
35
40
45
50
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Broj položenih ispita
Ku
mu
lati
vn
a f
rekven
cija
<=
1.1.1.c. Grafi ki prikaz kumulativne frekvencije ( )
0
5
10
15
20
25
30
35
40
45
50
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Broj položenih ispita
Ku
mu
lati
vn
a f
rekven
cija
>=
1.1.1.d. Grafi ki prikaz kumulativne frekvencije ( )
Poslovna statistika
17
b)
Imaju i u vidu preporuke date u ovom udžbeniku o grupisanju neprekidnih
vrednosti obeležja u intervalne klase i injenicu da je najmanja težina u
populaciji 55 kg, a najve a 112 kg, podatke o težini iz ove populacije emo
grupisati u sedam klasa širine 10 kg, po ev od 50 kg.
Tabelarni prikaz je dat u Tabeli 1.1.1.b.
Interval
težine (kg)
Apsolutna
frekvencija
fi
Relativna
frekvencija
pi
Kumulativna
frekvencija <
Ki
Kumulativna
frekvencijaWi
50 -60 2 2/50 2 50
60 -70 14 14/50 16 48
70 -80 13 13/50 29 34
80 -90 9 9/50 38 21
90 -100 6 6/50 44 12
100 -110 4 4/50 48 6
110 -120 2 2/50 50 2
fi=50 pi=1
Tabela 1.1.1.b.
Grafi ki prikaz apsolutne, relativne i kumulativnih frekvencija dat je na
slede im slikama.
Poslovna statistika
18
0
2
4
6
8
10
12
14
Ap
so
lutn
a f
re
kv
en
cij
a
Slika 1.1.1.e. Grafi ki prikaz apsolutne frekvencije
0
0.04
0.08
0.12
0.16
0.2
0.24
0.28
Re
lati
vn
a f
re
kv
en
cij
a
Slika 1.1.1.f. Grafi ki prikaz relativne frekvencije
50 60 70 80 90 100 110 120 (kg)
Težina
50 60 70 80 90 100 110 120 (kg)
Težina
Poslovna statistika
19
0
5
10
15
20
25
30
35
40
45
50
Ku
mu
lati
vn
a f
re
kv
en
cij
a
<
Slika 1.1.1.g. Grafi ki prikaz kumulativne frekvencije (<)
0
5
10
15
20
25
30
35
40
45
50
Ku
mu
lati
vn
a f
re
kv
en
cij
a
>=
Slika 1.1.1.h. Grafi ki prikaz kumulativne frekvencije ( )
50 60 70 80 90 100 110 120 (kg)
Težina
50 60 70 80 90 100 110 120 (kg)
Težina
Poslovna statistika
20
1.2. Izra unavanje parametara raspodele obeležja
Ure ivanje i prikazivanje podataka analizirano u prethodnom odeljku 1.1, samo je priprema podataka za njihovu dalju obradu. Naime, da bi se izveli odre eni zaklju ci o raspodeli ispitivanog obeležja u populaciji, ili u uzorku, pa kasnije na osnovu toga i u celoj populaciji, neophodno je izra unati neke veli ine (parametre, pokazatelje, mere) koji na neki na in prezentuju ponašanje raspodeljenosti obeležja u posmatranoj populaciji.
Uopšteno, ti parametri se mogu podeliti u tri osnovne grupe:
- parametri srednje vrednosti (mere srednje vrednosti ili centralne tendencije);
- parametri varijabiliteta (mere disperzije); - parametri oblika rasporeda (mere oblika rasporeda).
Neki od parametara koje emo izra unavati isto e se ozna avati i za populaciju i za uzorak, dok e neki imati razli ite oznake u zavisnosti od toga da li se radi o populaciji ili uzorku.
Tako e, neke od formula po kojima e se ra unati parametri, bi e identi ne i za populaciju i za uzorak, dok e se neke razlikovati.
U ovom trenutku italac treba da obrati pažnju na te razlike i da ih prihvati bez dodatnih objašnjenja, uz napomenu da e se u kasnijim delovima udžbenika adekvatno razjasniti potreba za ovim razlikama.
1.2.1. Parametri srednje vrednosti (mere srednje vrednosti)
Parametre srednje vrednosti možemo podeliti na izra unate i pozicione.
Izra unati su:
- aritmeti ka sredina, - geometrijska sredina, - harmonijska sredina.
Pozicioni su:
Poslovna statistika
21
- modus, - medijana.
Zavisnost prirode promene ispitivanog obeležja nam diktira koji emo od gore pomenuta tri izra unata parametra srednje vrednosti da koristimo kao relevantnu meru srednje vrednosti datog obeležja u posmatranoj populaciji (uzorku).
Kada je priroda promene posmatranog obeležja linearno zavisna, koristi emo aritmeti ku sredinu kao meru srednje vrednosti. Linearna zavisnost promene ogleda se u tome da je ukupna grupna vrednost obeležja jednaka aritmeti kom zbiru obeležja svakog lana grupe ponaosob (visina, težina, broj prodatih automobila, broj poena na ispitu...). Ovakva priroda promene je najzastupljenija u svakodnevnom životu.
Kada je priroda promene posmatranog obeležja direktno proporcionalna,koristi emo geometrijsku sredinu kao meru srednje vrednosti. Direktna proporcionalnost promene ogleda se u tome da je ukupna grupna vrednost obeležja jednaka proizvodu obeležja svakog lana grupe ponaosob (procenat...).
Kada je priroda promene posmatranog obeležja obrnuto proporcionalna,koristi emo harmonijsku sredinu kao meru srednje vrednosti. Obrnuta proporcionalnost promene ogleda se u tome da se grupna vrednost obeležja smanjuje kada se pove ava broj lanova grupe i obrnuto (vreme završetka nekog posla u odnosu na broj ljudi koji ga istovremeno rade i sl.).
- Aritmeti ka sredina. Aritmeti ku sredinu bilo kojih N brojeva x1, x2, ..., xN
obeležavamo sa ___
X i izra unavamo po formuli:
N
xxxX N...21___
.
Od sada pa nadalje u ovom udžbeniku, aritmeti ku sredinu populacije emo
obeležavati sa , dok emo aritmeti ku sredinu uzorka obeležavati sa ___
X .Kada podatke nismo grupisali u klase važi:
Poslovna statistika
22
.1___
1
n
x
XN
xn
i
i
N
i
i
Kada smo podatke grupisali u klase važi:
.1
,
___1
,
n
xf
XN
xfK
i
ii
K
i
ii
Imaju i u vidu da je predstavnik diskretne klase ,ix jednak vrednosti obeležja
koje imaju svi lanovi te klase (u i-toj klasi fi lanova ima vrednost xi koja je jednaka ,
ix ), zaklju ujemo da je aritmeti ka sredina u istoj seriji podataka
diskretnih obeležja identi na bez obzira na to da li su podaci grupisani ili ne, dok za neprekidna obeležja to ne možemo da tvrdimo jer je kod grupisanih neprekidnih obeležja predstavnik i-te klase ,
ix , sredina i-tog klasnog intervala,
a sama raspodela obeležja u i-toj klasi ne mora biti takva da je njihova aritmeti ka sredina baš sredina tog klasnog intervala.
Primer 1.2.1.1. Za podatke iz Primera 1.1.1. izra unati aritmeti ku sredinu broja položenih ispita i težine anketiranih studenata
a) negrupišu i podatke, b) grupišu i podatke.
Rešenje:
i)
Ako ne grupišemo podatke, za aritmeti ku sredinu broja položenih
ispita dobijamo:
44.750
50
1i
ix
a za aritmeti ku sredinu težine studenata dobijamo:
Poslovna statistika
23
.26.7950
50
1 kg
xi
i
ii)
Ako grupišemo podatke, za aritmeti ku sredinu broja položenih ispita
dobijamo:
44.750
12311410396877968534532
10
1
,
N
xfi
ii
naravno, istu vrednost kao i kada nismo grupisali podatke, jer je obeležje
diskretnog tipa.
Ako grupišemo podatke, za aritmeti ku sredinu težine studenata
dobijamo:
.6.7950
1152105495685975136514552
7
1
,
kg
N
xfi
ii
Kao što smo i o ekivali, aritmeti ka sredina grupisanih podataka se razlikuje
od aritmeti ke sredine negrupisanih jer je težina obeležje neprekidnog tipa.
Aritmeti ka sredina se ponekad naziva i moment prvog reda.
Generalno, moment reda k ozna avamo sa mk i izra unavamo po formuli:
N
x
m
N
i
k
i
k1 za negrupisane podatke,
Poslovna statistika
24
N
xf
m
kK
i
ii
k1
,
za grupisane podatke.
- Aritmeti ka sredina aritmeti kih sredina. Neka je dato m razli itihpopulacija (ili uzorka), i neka je broj lanova svake od ovih populacija (uzorka) Ni (odnosno ni), i neka je aritmeti ka sredina svake od ovih populacija (uzorka)
i (odnosno iX___
), tada je, ako sve ove populacije (uzorke) spojimo u jednu, aritmeti ka sredina novodobijene populacije (uzorka) jednaka:
m
i
i
m
i
ii
m
i
i
m
i
ii
n
Xn
X
N
N
1
1
___
___
1
1__
.
Primer 1.2.1.2. Prose na visina svih 220 devojaka na prvoj godini studija je 168 cm, a prose na visina svih180 muškaraca na prvoj godini je 182 cm. Kolika je prose na visina studenta prve godine?
Rešenje:
Prose na visina studenta na prvoj godini studija je
.3.174180220
182180168220
1
1_
cm
N
N
m
i
i
m
i
ii
- Geometrijska sredina. Geometrijsku sredinu bilo kojih N brojeva x1, x2, ...,
xN obeležavamo sa G i izra unavamo po formuli:
NNxxxG ...21 .
Poslovna statistika
25
Kada želimo da iskažemo geometrijsku sredinu kao meru srednje vrednosti odre enog obeležja u populaciji (ili uzorku), onda važi:
za negrupisane podatke NNxxxG ...21 ,
za grupisane podatke Kf
K
ff K
xxxG ,,2
,1 ...21 ,
gde je: G - reprezent geometrijske sredine koji pravilno predstavlja direktno proporcionalnu prirodu promene datog obeležja;
xi - reprezent vrednosti obeležja koje pravilno predstavlja direktno proporcionalnu prirodu promene datog obeležja (i = 1, 2, ..., N);
,ix - reprezent predstavnika i-te klase koji pravilno predstavlja direktno
proporcionalnu prirodu promene datog obeležja (i = 1, 2, ..., K).
Formule za geometrijsku sredinu uzorka su identi ne uz uslov N=n.
Primer 1.2.1.3. U poslednje etiri godine cena neke robe se menjala na slede ina in: prve godine pove ala se za 10%, druge se pove ala za 12%, tre e godine se smanjila za 5% i etvrte godine se smanjila za 17%. Kakva je prose naprocentualna godišnja promena cene ove robe u ovom periodu?
Rešenje:
Ukoliko sa p predstavimo decimalni zapis procentualne promene od p%,
odnosno100
%pp , onda je
(1+ p) pravilni reprezent porasta od p%, a
(1 - p) pravilni reprezent smanjenja od p%,
pa je reprezent geometrijske sredine procentualne godišnje promene cena u
ovom periodu
99278,083,095,012,11,14G .
Poslovna statistika
26
Zaklju ujemo da se u ovom etvorogodišnjem periodu ovakvim promenama
cena robe prose no godišnje smanjivala 0,722%.
- Harmonijska sredina. Harmonijsku sredinu bilo kojih N brojeva x1, x2, ..., xN obeležavamo sa H i izra unavamo po formuli:
Nxxx
NH
1...
11
21
.
Kada želimo da iskažemo harmonijsku sredinu kao meru srednje vrednosti odre enog obeležja u populaciji (ili uzorku), onda važi:
za negrupisane podatke: N
i ix
NH
1
1
za grupisane podatke: K
i i
i
x
f
NH
1,
.
Formule za harmonijsku sredinu uzorka su identi ne uz uslov N=n.
Primer 1.2.1.4. Osoba A uradi jedan posao rade i sam za 10 asova. Osoba B za 12 asova, a osoba C za 9 asova. Ako su osobe A, B i C iz iste grupacije ljudi, koliko je srednje vreme potrebno da jedan ovek iz te grupacije sam uradi taj posao?
Rešenje:
Pošto je vreme za koje bi se završio taj posao obrnuto proporcionalno broju
ljudi iz te grupacije koji bi ga istovremeno obavljali (što više ljudi istovremeno radi na tom poslu, to e vreme izrade posla biti manje), to je srednje vreme
potrebno da jedan ovek iz te grupacije sam uradi taj posao jednako:
Poslovna statistika
27
9
1
12
1
10
13
H asova=10,19 asova.
Izme u harmonijske, geometrijske i harmonijske sredine izra unate nad istim skupom brojeva, važi slede a nejedna ina:
____
XGH .
- Modus. Za negrupisane podatke modus (M0) je vrednost obeležja koje se naj eš e javlja u seriji.
Za grupisane podatke diskretnog tipa, modus (M0) je tako e vrednost obeležja koje se naj eš e javlja u seriji, što u ovom slu aju predstavlja vrednost klase ija je apsolutna frekvencija najve a.
Za grupisane podatke neprekidnog tipa modus (M0) nalazimo tako što prvo prona emo modalnu klasu, kao klasu ija je apsolutna frekvencija najve a.Zatim modus izra unavamo po formuli:
11
1
0
0000
00
0
MMMM
MM
Mffff
ffLM ,
gde je:
0ML - po etak modalne klase,
0Mf - apsolutna frekvencija modalne klase,
10Mf - apsolutna frekvencija klase pre modalne,
10Mf - apsolutna frekvencija klase posle modalne,
- širina klasnog intervala.
Vrednost modusa neprekidnih podataka grupisanih u klase može se dobiti i grafi kim putem kao apscisa ta ke preseka prave koja je odre ena ta kama
100, MM fL i
00, MM fL i prave odre ene ta kama
00, MM fL i
100, MM fL (Slika 1.2.1).
Poslovna statistika
28
Slika 1.2.1.
Interesantno je napomenuti da ako bi se konstruisala parabola koja prolazi kroz tri sredine gornjih strana pravougaonika, apscisa maksimuma te parabole bi se poklopila sa modusom.
Ukoliko se svaki podatak u seriji pojavljuje isti broj puta, odnosno ukoliko su sve apsolutne frekvencije me usobno jednake, onda modus ne postoji.
Ukoliko postoji samo jedan modus, kažemo da je serija, odnosno raspodela unimodalna. Ukoliko postoje dva modusa, onda kažemo da je serija, odnosno raspodela bimodalna, a ako postoji više od dva modusa, onda seriju, odnosno raspodelu proglašavamo polimodalnom.
Primer 1.2.1.5. Za podatke iz Primera 1.1.1. izra unati modus:
a) broja položenih ispita, b) težine anketiranih studenata.
fMo
fMo+1
fMo-1
LMo Mo LMo+
fi
xi
Poslovna statistika
29
Rešenje:
a)
Kako je najfrekventnija klasa klasa u kojoj se nalaze lanovi populacije koji
imaju sedam položenih ispita, to je modus ove unimodalne raspodele
Mo=7.
b)
Najfrekventnija klasa, odnosno modalna klasa, je klasa 60 -700 kg, pa je modus
.23,69101314214
21460
11
1kg
ffff
ffLM
oooo
oo
o
MMMM
MM
Mo
- Medijana. Za negrupisane podatke medijana (Me) je vrednost obeležja koje se nalazi u sredini ure ene statisti ke serije. Dakle, broj lanova populacije (uzorka) koji su manji od Me te populacije (tog uzorka) jednak je broju lanovate populacije (tog uzorka) koji su ve i od Me te populacije (tog uzorka).
Ukoliko je broj lanova ure ene statisti ke serije neparan, 12 kN , tada je
medijana jednaka vrednosti 2
1N-og lana te serije, a ukoliko je broj
lanova ure ene statisti ke serije paran, kN 2 , tada je medijana jednaka
aritmeti koj sredini 2
N-og i 1
2
N-og lana te serije.
Odnosno, za negrupisane podatke važi:
.2
2
12
122
2
1
NN
e
Ne
xx
MkN
xMkN
Poslovna statistika
30
Za grupisane podatke diskretnog tipa, Me tako e predstavlja vrednost obeležja koje se nalazi u sredini ure ene statisti ke serije. Izra unavanje vrednosti Me je
u ovom slu aju isto kao i za negrupisane podatke, samo se vrednosti 2
1N-
og lana (ukoliko je 12 kN ), odnosno 2
N-og i 1
2
N-og lana
(ukoliko je kN 2 ), nalaze iz tabelarne predstave ure ene serije.
Za grupisane podatke neprekidnog tipa, Me je vrednost koja deli histogram na dva dela jednakih površina. Naravno da i tada važi da je broj lanovapopulacije (uzorka) koji su manji od tako odre ene Me jednak broju lanova te populacije (tog uzorka) koji su ve i od Me .
Da bismo odredili Me za grupisane podatke neprekidnog tipa, potrebno je prvo da prona emo medijalnu klasu Me,kl.
Medijalnu klasu Me,kl. odre ujemo iz uslova:
klekle M
i
i
M
i
i fN
f,,
1
1
1 2.
Medijanu Me odre ujemo iz jedna ine
kle
kle
kle
M
M
i
i
Mef
fN
LM
,
,
,
1
12,
gde je:
kleML,
- po etak medijalne klase,
klMf,0
- apsolutna frekvencija medijalne klase,
N - broj lanova populacije,
if - apsolutna frekvencija i-te klase,
- širina klasnog intervala.
Formule za medijanu Me uzorka su identi ne uz uslov N=n.
Poslovna statistika
31
Primer 1.2.1.6. Za podatke iz Primera 1.1.1. izra unati medijanu:
a) broja položenih ispita, b) težine anketiranih studenata.
Rešenje:
a)
Populacija sadrži paran broj lanova, N=50, pa medijanu nalazimo kao
aritmeti ku sredinu 25. i 26. lana serije ure ene u rastu i poredak.
Analiziraju i kumulativnu frekvenciju Ki , vidimo da se i 25. i 26. lan serije
ure ene u rastu i poredak nalaze u klasi u kojoj se nalaze lanovi populacije
koji su položili sedam ispitai, pa je medijana ove raspodele
.72
77
22625 XX
M e
b)
Kako je 252
50
2
N, to je medijalna klasa 70 -80 kg, pa je medijana
.92,761013
162570
2
,
,
,
1
1 kgf
fN
LM
kle
kle
kle
M
M
i
i
Me
Poslovna statistika
32
1.2.2. Parametri varijabiliteta (mere disperzije)
Parametre varijabiliteta možemo podeliti na apsolutne i relativne.
Apsolutni su:
- interval varijacije, - interkvartilna razlika, - srednje apsolutno odstupanje, - srednje kvadratno odstupanje (varijansa), - standardna devijacija.
Relativni su:
- koeficijent varijacije, - normalizovano standardno odstupanje.
- Interval varijacije. Interval varijacije (Iv) je interval vrednosti obeležja u kome se nalaze vrednosti obeležja svih lanova populacije (uzorka).
Kod negrupisanih podataka, kao i kod grupisanih podataka diskretnog tipa, izra unava se kao razlika najve e i najmanje vrednosti obeležja u ispitivanoj populaciji (uzorku):
minmax xxIv .
Kod grupisanih podataka neprekidnog tipa, izra unava se kao razlika gornje granice poslednje klase i donje granice prve klase.
Primer 1.2.2.1. Za podatke iz Primera 1.1.1. izra unati interval varijacije:
c) broja položenih ispita d) težine anketiranih studenata.
Rešenje:
a)
Interval varijacije je 9312minmax xxIv položenih ispita.
Poslovna statistika
33
b)
Interval varijacije je .7050120minmax kgxxIv
- Interkvartilna razlika. Pre nego što definišemo interkvartilnu razliku, definisa emo slede e pojmove: kvartil, decil i percentil.
- Kvartili su brojevi, koje emo obeležavati sa )3,...,1(iQi , sa
osobinom da i-ti kvartil (Qi) deli interval varijacije u odnosu .4: ii
To zna i da Qi predstavlja vrednost obeležja od koje %25i elemenata populacije (uzorka) ima vrednost manju ili jednaku od Qi. O igledno da je
eMQ2 .
Za negrupisane podatke, kao i za grupisane podatke diskretnog tipa, i-ti kvartil izra unavamo po formuli:
3,...,1
14
11
4
11
4
12
4
11
4
1
i
xxN
iN
ixQN
iN
iN
ii
gde je sa ozna en ceo deo broja .
U suštini, ova formula zna i slede e:
ukoliko je 14
1Ni ceo broj, tada je vrednost i-tog kvartila jednaka
vrednosti 14
1Ni -og lana ure ene statisti ke serije.
A ukoliko 14
1Ni nije ceo broj, tada se vrednost i-tog kvartila dobija
linearnom interpolacijom vrednosti 14
1Ni -og i 2
4
1Ni -og lana
ure ene statisti ke serije.
Poslovna statistika
34
Da bismo odredili vrednost i-tog kvartila (Qi) za grupisane podatke neprekidnog tipa, neophodno je prvo odrediti klasu i-tog kvartila kliQ , , iz
slede eg uslova:
klikli Q
i
i
Q
i
i fN
if,,
1
1
1 4i=1,...,3.
Vrednost Qi i=1,...,3 odre ujemo iz jedna ine
kli
kli
kli
Q
Q
i
i
Qif
fN
i
LQ
,
,
,
1
14
gde je:
kliQL,
- po etak klase i-tog kvartila,
kliQf,
- apsolutna frekvencija klase i-tog kvartila,
N - broj lanova populacije,
if - apsolutna frekvencija i-te klase,
- širina klasnog intervala.
Formule za Qi uzorka su identi ne uz uslov N=n.
- Decili su brojevi, koje emo obeležavati sa )9,...,1(iDi , sa
osobinom da i-ti decil (Di) deli interval varijacije u odnosu .10: ii
To zna i da Di predstavlja vrednost obeležja od koje %10i elemenata populacije (uzorka) ima vrednost manju ili jednaku od Di. O igledno da je
eMD5 .
Za negrupisane podatke, kao i za grupisane podatke diskretnog tipa, i-ti decil izra unavamo po formuli:
9,...,1
110
11
10
11
10
12
10
11
10
1
i
xxN
iN
ixDN
iN
iN
ii
Poslovna statistika
35
gde je sa ozna en ceo deo broja .
U suštini, ova formula zna i slede e:
ukoliko je 110
1Ni ceo broj, tada je vrednost i-tog decila jednaka
vrednosti 110
1Ni -og lana ure ene statisti ke serije.
A ukoliko 110
1Ni nije ceo broj, tada se vrednost i-tog decila dobija
linearnom interpolacijom vrednosti 110
1Ni -og i 2
10
1Ni -og lana
ure ene statisti ke serije.
Da bismo odredili vrednost i-tog decila (Di) za grupisane podatke neprekidnog tipa, neophodno je prvo odrediti klasu i-tog decila kliD , , iz slede eg uslova:
klikli D
i
i
D
i
i fN
if,,
1
1
1 10i=1,...,9.
Vrednost Di i=1,...,9 odre ujemo iz jedna ine
kli
kli
kli
D
D
i
i
Dif
fN
i
LD
,
,
,
1
110,
gde je:
kliDL,
- po etak klase i-tog decila,
kliDf,
- apsolutna frekvencija klase i-tog decila,
N - broj lanova populacije,
if - apsolutna frekvencija i-te klase,
- širina klasnog intervala.
Formule za Di uzorka su identi ne uz uslov N=n.
Poslovna statistika
36
- Percentili su brojevi, koje emo obeležavati sa )99,...,1(iPi ,
sa osobinom da i-ti percentil (Pi) deli interval varijacije u odnosu .100: ii
To zna i da Pi predstavlja vrednost obeležja od koje %1i elemenata populacije (uzorka) ima vrednost manju ili jednaku od Pi. O igledno da je
eMP50 .
Za negrupisane podatke, kao i za grupisane podatke diskretnog tipa, i-tipercentil izra unavamo po formuli:
99,...,1
1100
11
100
11
100
12
100
11
100
1
i
xxN
iN
ixPN
iN
iN
ii
gde je sa ozna en ceo deo broja .
U suštini, ova formula zna i slede e:
ukoliko je 1100
1Ni ceo broj, tada je vrednost i-tog percentila jednaka
vrednosti 1100
1Ni -og lana ure ene statisti ke serije.
A ukoliko 1100
1Ni nije ceo broj, tada se vrednost i-tog percentila dobija
linearnom interpolacijom vrednosti 1100
1Ni -og i 2
100
1Ni -og lana
ure ene statisti ke serije.
Da bismo odredili vrednost i-tog percentila (Pi) za grupisane podatke neprekidnog tipa, neophodno je prvo odrediti klasu i-tog percentila kliP , , iz
slede eg uslova:
klikli P
i
i
P
i
i fN
if,,
1
1
1 100i=1,...,99.
Vrednost Pi i=1,...,99 odre ujemo iz jedna ine
Poslovna statistika
37
kli
kli
kli
P
P
i
i
Pif
fN
i
LP
,
,
,
1
1100 ,
gde je:
kliPL,
- po etak klase i-tog percentila,
kliPf,
- apsolutna frekvencija klase i-tog percentila,
N - broj lanova populacije,
if - apsolutna frekvencija i-te klase,
- širina klasnog intervala.
Formule za Pi uzorka su identi ne uz uslov N=n.
Interkvartilna razlika Iq predstavlja interval vrednosti obeležja u kome se nalazi 50% središnih vrednosti ure ene serije, i izra unava se po formuli
257513 PPQQI q .
Ona isklju uje 25% podataka sa najnižim vrednostima i 25% podataka sa najvišim vrednostima.
U nekim literaturama se esto definiše i pojam polukvartilne razlike (semikvartilna razlika) i ona je polovina interkvartilne razlike, odnosno važi
semikvartilna razlika2qI
.
Primer 1.2.2.2. Za podatke iz Primera 1.1.1. izra unati interkvartilnu razliku, tre i decil i trideset peti percentil:
a) broja položenih ispita, b) težine anketiranih studenata.
Rešenje:
Kako je N=50, važi slede e:
Poslovna statistika
38
a)
14
15012
4
15011
4
1501
1 14
15011
4
1501 xxxQ
66625.0625.0
25.1325.13
1314131
25.1325.1425.131
xxxQ
xxxQ
14
15032
4
15031
4
1503
3 14
15031
4
1503 xxxQ
99975.0975.0
75.3775.37
3738373
75.3775.3875.373
xxxQ
xxxQ
pa je interkvartilna razlika 36913 QQI q položena ispita.
Tre i decil iznosi:
.6667.067.0
7.157.15
110
15031
10
1503
151615
7.157.167.153
110
15032
10
15031
10
1503
3
xxx
xxxD
xxxD
Trideset peti percentil iznosi:
.15.66715.0615.0
15.1815.18
1100
150351
100
15035
181918
15.1815.1915.1835
1100
150352
100
150351
100
15035
35
xxx
xxxP
xxxP
Poslovna statistika
39
b)
Kako je 5,124
50
4
N to je klasa prvog kvartila 60 -70 kg, pa je prvi
kvartil Q1
kgf
fN
LQ
kl
kl
kl
Q
Q
i
i
Q 5.671014
25,1260
4
,1
,1
,1
1
11 .
Kako je 5,374
503
4
3 Nto je klasa tre eg kvartila 80 -90 kg, pa
je tre i kvartil Q3
kgf
fN
LQ
kl
kl
kl
Q
Q
i
i
Q 44.89109
295,3780
4
3
,3
,3
3,
1
13 .
Interkvartilna razlika je .94.215.6744.8913 kgQQI q
Kako je 1510
503
10
3 N to je klasa tre eg decila 60 -70 kg, pa je
tre i decil D3
.29.691014
21560
10
3
,3
,3
,3
1
13 kg
f
fN
LD
kl
kl
kl
D
D
i
i
D
Kako je 5.17100
5035
100
35 N to je klasa trideset petog percentila
70 -80 kg, pa je trideset peti percentil P35
.12.7013
165.1770
10035
,
,
,
1
135 kg
f
fN
LP
kli
kli
kli
P
P
i
i
P
Poslovna statistika
40
- Srednje apsolutno odstupanje
Srednje apsolutno odstupanje (AD) možemo odrediti u odnosu na aritmeti kusredinu, modus i medijanu.
Srednje apsolutno odstupanje od aritmeti ke sredine ozna avamo sa )(AD
ukoliko je u pitanju populacija, odnosno sa )(__
xAD ukoliko je u pitanju uzorak.
Za negrupisane podatke se izra unava po formuli:
N
x
AD
N
i
i
1)( za populaciju,
n
xx
xAD
n
i
i
1
__
__
)( za uzorak,
dok se za grupisane podatke izra unava po formuli:
N
xf
AD
K
i
ii
1
,
)( za populaciju,
n
xxf
xAD
K
i
ii
1
__,
__
)( za uzorak.
Srednje apsolutno odstupanje od modusa ozna avamo sa )( oMAD i za
negrupisane podatke populacije se izra unava po formuli:
N
Mx
MAD
N
i
oi
o1)(
dok se za grupisane podatke izra unava po formuli:
Poslovna statistika
41
N
Mxf
MAD
K
i
oii
o1
,
)( .
Formule za AD(Mo) uzorka su identi ne uz uslov N=n.
Srednje apsolutno odstupanje od medijane ozna avamo sa )( eMAD i za
negrupisane podatke populacije se izra unava po formuli:
N
Mx
MAD
N
i
ei
e1)(
dok se za grupisane podatke izra unava po formuli:
N
Mxf
MAD
K
i
eii
o1
,
)( .
Formule za AD(Me) uzorka su identi ne uz uslov N=n.
Interesantno je napomenuti da zbir N
AxN
i
i
1 ima minimum kada je eMA ,
odnosno za negrupisane podatke je srednje apsolutno odstupanje od medijane najmanje.
Primer 1.2.2.3. Za podatke iz Primera 1.1.1. izra unati srednje apsolutno odstupanje od aritmeti ke sredine
a) broja položenih ispita, b) težine anketiranih studenata.
Podatke analizirati kao grupisane.
Poslovna statistika
42
Rešenje:
a)
Srednje apsolutno odstupanje broja položenih ispita od aritmeti ke
sredine je
9552,150
56.4356.3456.2350
56.1656.0744.0944.1844.2344.3544.4250
44.712344.711444.710344.79644.78750
44.77944.76844.75344.74544.732
10
1
,
N
xf
AD i
ii
b)
Srednje apsolutno odstupanje težine od aritmeti ke sredine je
.536.1250
4.3524.2544.1564.596.4136.14146.24250
6.7911526.79105450
6.799566.798596.7975136.7965146.79552
7
1
,
kg
N
xf
AD i
ii
Poslovna statistika
43
- Srednje kvadratno odstupanje (varijansa)
Srednje kvadratno odstupanje (varijansu) emo posebno izra unavati i obeležavati u zavisnosti od toga da li ra unamo varijansu populacije ili uzorka. Razlozi zbog kojih se na in izra unavanja varijanse populacije razlikuje od na ina izra unavanja varijanse uzorka, bi e objašnjen u kasnijim poglavljima ovog udžbenika.
- Varijansa populacije
Varijansu populacije obeležavamo sa 2 i izra unavamo po formuli:
N
xN
i
i
1
2
2 za negrupisane podatke,
N
xfK
i
ii
1
2,
2 za grupisane podatke.
Imaju i u vidu da važi slede e:
21
2
21
2
1
2
11
2
1
22
1
2
2
22
N
x
N
x
NN
x
N
x
N
xx
N
x
N
i
i
N
i
i
N
i
N
i
i
N
i
i
N
i
ii
N
i
i
i
Poslovna statistika
44
21
2,
21
2,
1
2
1
,
1
2,
1
2,2,
1
2,
2
2
2
N
xf
N
xf
N
f
N
xf
N
xf
N
xxf
N
xf
K
i
ii
K
i
ii
K
i
i
K
i
ii
K
i
ii
K
i
iii
K
i
ii
varijansa populacije se može izra unavati i po slede im (tzv. radnim) formulama:
21
2
2
N
xN
i
i
za negrupisane podatke,
21
2,
2
N
xfK
i
ii
za grupisane podatke.
-Varijansa uzorka
Na in izra unavanja i obeležavanja varijanse uzorka zavisi od toga da li je aritmeti ka sredina populacije ( ), iz koje je uzorak uzet, poznata ili ne.
U slu aju kada je aritmeti ka sredina populacije ( ) poznata, varijansu uzorka obeležavamo sa 2s i izra unavamo po formuli:
21
2
1
2
2
n
x
n
x
s
n
i
i
n
i
i
za negrupisane podatke,
Poslovna statistika
45
21
2,
1
2,
2
n
xf
n
xf
s
K
i
ii
K
i
ii
za grupisane podatke.
U slu aju kada je aritmeti ka sredina populacije ( ) nepoznata, varijansu uzorka obeležavamo sa 2
cs i izra unavamo po formuli:
11
2__
2
n
xx
s
n
i
i
c za negrupisane podatke,
11
2__,
2
n
xxf
s
K
i
ii
c za grupisane podatke,
gde je sa __
x obeležena aritmeti ka sredina ispitivanog uzorka.
Imaju i u vidu da važi slede e:
1112
1
112
11
2
1
1
2__22____
__1
2
1
2__
1__
1
2
1
2____2
1
2__
n
xnx
n
xn
n
xnx
n
x
n
x
n
x
xn
x
n
xxxx
n
xx
n
i
i
n
i
i
n
i
n
i
i
n
i
i
n
i
ii
n
i
i
i
Poslovna statistika
46
1112
1
112
1
1
2
1
2__
1
2,2______
1
2,
1
2__
1
,
__1
2,
1
2____,2,
1
2__,
n
xnxf
n
xn
n
xnx
n
xf
n
xf
n
xf
xn
xf
n
xxxxf
n
xxf
K
i
ii
K
i
ii
K
i
i
K
i
ii
K
i
ii
K
i
iii
K
i
ii
varijansa uzorka se, u slu aju ne poznavanja aritmeti ke sredine populacije, može izra unavati i po slede im formulama:
11
2__2
2
n
xnx
s
n
i
i
c za negrupisane podatke,
1
2__
1
2,
2
n
xnxf
s
K
i
ii
c za grupisane podatke.
Primer 1.2.2.4. Za podatke iz Primera 1.1.1. izra unati varijansu:
a) broja položenih ispita, b) težine anketiranih studenata.
Podatke analizirati kao grupisane i smatrati da se radi o populaciji.
Poslovna statistika
47
Rešenje:
a)
Varijansa broja položenih ispita je
6864.550
56.4356.3456.2356.1656.07
50
44.0944.1844.2344.3544.42
50
44.712344.711444.710344.79644.787
50
44.77944.76844.75344.74544.732
22222
22222
22222
22222
10
1
2,
2
N
xfi
ii
b)
Varijansa težine je
.84,22450
4.3524.2544.156
50
4.596.4136.14146.242
50
6.7911526.7910546.79956
50
6.798596.7975136.7965146.79552
222
2222
222
2222
7
1
2,
2
N
xfi
ii
Poslovna statistika
48
- Standardna devijacija
Standardna devijacija je kvadratni koren varijanse i obeležava se i izra unavapo slede im formulama:
- standardna devijacija populacije ( )
2
- standardna devijacija uzorka kada je poznato (s)
2ss
- standardna devijacija uzorka kada nije poznato ( cs )
2cc ss .
Primer 1.2.2.5. Za podatke iz Primera 1.1.1. izra unati standardnu devijaciju:
a) broja položenih ispita, b) težine anketiranih studenata.
Podatke analizirati kao grupisane i smatrati da se radi o populaciji.
Rešenje:
Imaju i u vidu rešenje Primera 1.2.2.4. dobijamo:
a)
standardna devijacija broja položenih ispita iznosi
38.26864.52
b)
standardna devijacija težine studenata iznosi
.99.1484.2242 kg
Poslovna statistika
49
Aritmeti ka sredina i standardna devijacija u nekoj meri odre uju raspored vrednosti obeležja analiziranih podataka u populaciji (uzorku). Naime, na osnovu ebiševljeve teoreme, koju ovde ne emo prezentovati, definisano je slede e pravilo, poznato kao ebiševljevo pravilo:
u k standardnih devijacija oko aritmeti ke sredine nalazi se bar
%1001
12k
vrednosti obeležja podataka analizirane populacije (uzorka).
Ovo pravilo važi za k 1 , k R.
Dakle:
- bar %75%1002
11
2 podataka ima vrednost obeležja u intervalu
2 standardne devijacije oko aritmeti ke sredine;
- bar %89,88%1003
11
2 podataka ima vrednost obeležja u
intervalu 3 standardne devijacije oko aritmeti ke sredine;
- bar %75,93%1004
11
2 podataka ima vrednost obeležja u
intervalu 4 standardne devijacije oko aritmeti ke sredine.
- Koeficijent varijacije
Koeficijent varijacije obeležavamo sa Cv i izra unavamo po slede im formulama:
- koeficijent varijacije populacije
vC
- koeficijent varijacije uzorka kada je poznato
Poslovna statistika
50
__
x
sCv
- koeficijent varijacije uzorka kada nije poznato
__
x
sC c
v .
Kada koeficijent varijacije izražavamo u procentima, obeležavamo ga sa Cv% i izra unavamo po formuli
%.100% vv CC
Koeficijent varijacije je relativni parametar koji ukazuje na nivo homogenosti posmatranog obeležja u populacija (uzorku). Što je koeficijent varijacije ve i,to je homogenost manja, odnosno populacija (uzorak) je nestabilnija u aspektu vrednosti posmatranog obeležja. Pomo u ovog parametra može se upore ivatihomogenost razli itih obeležja u razli itim populacijama (uzorcima). Ovaj parametar, dakle, opisuje svojstvo itave populacije, pa se esto kaže da ima integralni karakter.
Primer 1.2.2.6. Za podatke iz Primera 1.1.1. izra unati koeficijent varijacije:
a) broja položenih ispita, b) težine anketiranih studenata.
Podatke analizirati kao grupisane i smatrati da se radi o populaciji.
Rešenje:
a)
Koeficijent varijacije broja položenih ispita iznosi
%32%
32.044.7
38.2
v
v
C
C
Poslovna statistika
51
b)
Koeficijent varijacije težine iznosi
%8.18%
188.06.79
99.14
v
v
C
C
Raspodeljenost broja položenih ispita ovih studenata nestabilnija je od
raspodeljenosti njihovih težina.
- Normalizovano standardno odstupanje
Normalizovano standardno odstupanje je relativni parametar koji ukazuje na odstupanje odre enog (i-tog) lana populacije (uzorka) u odnosu na aritmeti ku sredinu te populacije (uzorka), imaju i u vidu i stepen stabilnosti vrednosti obeležja u toj populaciji (uzorka). Pomo u ovog parametra mogu se upore ivati individualni lanovi iz razli itih populacija.
Normalizovano standardno odstupanje i-tog lana, ija je vrednost obeležja xi,obeležavamo sa Zi i izra unavamo po slede im formulama:
- Zi i-tog lana populacije
ii
xZ ,
- Zi i-tog lana uzorka kada je poznato
s
xxZ i
i
__
,
- Zi i-tog lana kada nije poznato
c
ii
s
xxZ
__
.
Poslovna statistika
52
Primer 1.2.2.7. Student koji pripada populaciji iz Primera 1.1.1. ima 75 kg. i položio je 7 ispita. Na i normalizovano odstupanje:
a) broja položenih ispita, b) težine
ovog studenta.
Rešenje:
a)
Normalizovano odstupanje broja položenih ispita ovog studenta iznosi
185.038.2
44.77ii
xZ .
b)
Normalizovano odstupanje težine ovog studenta iznosi
307.099.14
6.7975ii
xZ .
Ovaj student je i u jednom i u drugom slu aju ispod proseka svoje
populacije, ali više odstupa u težini nego u položenim ispitima.
Poslovna statistika
53
1.2.3. Parametri oblika rasporeda (mere oblika rasporeda)
Mere oblika rasporeda su mera simetrije i mera spljoštenosti. U ovom udžbeniku analizira emo samo mere oblika rasporeda za populaciju, dok se analizom mera oblika rasporeda uzorka ne emo baviti.
Mera simetrije se izražava pomo u koeficijenta simetrije, dok se mera spljoštenosti izražava pomo u koeficijenta spljoštenosti. I jedan i drugi koeficijent se izra unavaju pomo u centralnih momenata.
- Centralni moment reda k ozna avamo sa Mk i izra unavamo po formuli:
N
x
M
N
i
k
i
k1 za negrupisane podatke,
N
xf
M
kK
i
ii
k1
,
za grupisane podatke.
- Koeficijent simetrije ozna avamo sa 3 i izra unavamo po formuli:
33
3
M.
Ukoliko je:
3=0 zaklju ujemo da je raspodela vrednosti obeležja simetri na; tada je tako e oe MM ;
Poslovna statistika
54
3 0 zaklju ujemo da je raspodela vrednosti obeležja pozitivno asimetri na (asimetrija udesno); tada je tako e oe MM ;
3 0 zaklju ujemo da je raspodela vrednosti obeležja negativno asimetri na (asimetrija ulevo); tada je tako e oe MM
(Slika 1.2.3.1).
a) Simetri an raspored
b) Pozitivno asimetri an raspored
c) Negativno asimetri an raspored
Slika 1.2.3.1. Oblici rasporeda frekvencija u smislu simetrije
U praksi se esto koristi slede a podela:
1.03 smatra se da nema asimetrije,
25.01.0 3 mala asimetrija,
5.025.0 3 srednja asimetrija,
35.0 jaka asimetrija.
fi
xi3=0=Me=M0
3 0Me M0
3 0Me M0
a b c
Poslovna statistika
55
- Koeficijent spljoštenosti ozna avamo sa 4 i izra unavamo po formuli:
44
4
M.
Ukoliko je:
4=3 zaklju ujemo da je raspodela vrednosti obeležja normalno spljoštena;
3 3 zaklju ujemo da je raspodela vrednosti obeležja izdužena, odnosno ima spljoštenost manju od normalne;
3 0 zaklju ujemo da raspodela vrednosti obeležja ima spljoštenost ve u od normalne.
Zadatak 1.2.3.1. Za podatke iz Primera 1.1.1. izra unati mere oblika rasporeda (koeficijent simetrije i spljoštenosti):
c) broja položenih ispita, c) težine anketiranih studenata.
Podatke analizirati kao grupisane i smatrati da se radi o populaciji.
Poslovna statistika
56
2. OSNOVNI POJMOVI TEORIJE VEROVATNO E
Na današnjem nivou razvoja ljudske svesti „slu ajnost” kao pojava tretira se dvojako.
Pobornici takozvanog kauzalnog shvatanja, mišljenja su da su sva dešavanja u univerzumu (a tu spadaju i ponašanja ljudskog uma) deterministi ka, odnosno uzro no-posledi na. Za pojedine pojave, otkrivanje njihovih uzroka i na ina(zakonitosti) po kojima uzroci deluju na pojavu kao posledicu, „preveli” su tu pojavu iz domena slu ajne pojave u domen potpuno odre ene pojave, ije su mesto, veli ina i trenutak pojave, u našem etvorodimenzionalnom prostorno-vremenskom okruženju, potpuno opisani. Na primer, sigurno je da je pojava Halejeve komete na nebu za nekog posmatra a od pre hiljadu godina bila jedan slu ajan doga aj. Danas, putanja Halejeve komete je potpuno opisana i vreme i mesto njene pojave potpuno su odre eni, a ne slu ajni. Svako otkrivanje uzro no-posledi ne zavisnosti odre enih pojava utemeljilo je odre enufundamentalnu nau nu teoriju (opšta teorija relativnosti, teorija elektromagnetizma, i sl.), u okviru kojih se analiza vrši po utvr enim i nepromenjlivim pravilima, opisanim kroz odre ene matemati ke jedna ine, i gde „slu ajnost” kao pojam uopšte ne postoji. Ovakav pristup smatra da su odre eni „slu ajni” doga aji, u stvari, doga aji ije mnogobrojne i složene uzro no-posledi ne veze sa poznatim i nepoznatim uzrocima još nismo otkrili. Zbog toga vreme, prostor i formu njihovog pojavljivanja ne možemo predvideti, pa ih nazivamo „slu ajnim”, dok oni to u stvari nisu.
Pristalice drugog pristupa smatraju da slu ajnost zaista postoji u univerzumu, i da je „slu ajno” pojavljivanje, pojavljivanje bez ikakvog uzroka i zakonitosti odre enih doga aja, jedna od fundamentalnih karakteristika univerzuma. Po tom pristupu, kauzalnost odre enih pojava nije postulat, ve „slu ajnost”veoma velike verovatno e. Toliko velike da je vreme u kome analiziramo, pa i živimo po toj kauzalnosti, izuzetno kratko, pa je verovatno a da se do sada pojavio doga aj koji bi opovrgnuo odre eni kauzalni zakon veoma mala. Zbog toga se jedan takav doga aj, „perpetum mobile”, „slu ajno” nije ni pojavio, te otud „zabluda” o deterministi nosti univerzuma. Nau na utemeljenost ovakvog pristupa ogleda se u Hajzenbergovoj relaciji neodre enosti i raznim kvantnim teorijama.
Najve i mislioci današnjeg vremena nisu se egzaktno opredelili ni za jedan od ovih pristupa, ve pokušavaju da objedine ova dva pristupa u neku jedinstvenu
Poslovna statistika
57
teoriju, a do tada se koriste zakonitostima jednog ili drugog pristupa u zavisnosti od prirode analiziranih pojava.
Bez obzira kako tretiramo slu ajnost, ona ima svoje zakonitosti i upravo je teorija verovatno e matemati ka teorija koja analizira te zakonitosti na modelima stvarnih pojava, dok je statisti ka teorija, pogotovu njen metod uzorkovanja, uspostavljavanje veze izme u stvarnih pojava i matemati kihmodela.
Uopšteno, svi matemati ki modeli stvarnih pojava koje analiziramo metodama verovatno e, svrstavaju se u kategoriju statisti kog eksperimenta, a to je eksperiment koji zadovoljava slede e uslove:
3. može se ponavljati (realno ili misaono) proizvoljan broj puta pod istim uslovima;
4. unapred je definisano šta se registruje u eksperimentu i poznati su svi mogu i ishodi, kojih može biti kona no mnogo, i prebrojivo ili neprebrojivo beskona no mnogo;
5. ishod svakog budu eg pojedina nog eksperimenta nije unapred poznat.
Nad ishodima ovakvog eksperimenta, statisti kog eksperimenta, definišemo slede e pojmove:
- elementarni doga aj je skup iji je element svaki mogu i pojedina niishod statisti kog eksperimenta;
- siguran doga aj je skup svih ishoda eksperimenta, odnosno skup svih elementarnih doga aja, i obeležava emo ga sa S;
- doga aj (ili slu ajan doga aj) je svaki podskup sigurnog doga aja,odnosno svaki podskup skupa S, i njih emo obeležavati velikim slovima A, B, C...
Važno je ista i da su doga aji definisani kao skupovi i da se teorija verovatno e primenjuje na ovako definisanim doga ajima.
Nemogu doga aj u nekom statisti kom eksperimentu je bilo koja pojava koja nije podskup sigurnog doga aja, i obeležavamo ga kao prazan skup .
Jedan od uobi ajenih primera statisti kog eksperimenta je bacanje kockice za jamb (kocka ije su strane obeležene brojevima od 1 do 6), gde se registruje broj koji je pao sa gornje strane kocke.
Poslovna statistika
58
Kod ovog statisti kog eksperimenta postoji šest elementarnih doga aja;obeležimo ih sa Ai (i = 1, 2, ..., 6), gde je:
11A - pala je jedinica;
22A - pala je dvojka;
66A - pala je šestica.
Siguran doga aj je skup
,6,5,4,3,2,1S - da padne bilo koji ceo broj od 1 do 6, uklju uju i i 1 i 6.
Recimo, doga aj da padne paran broj ve i od 3 je skup koji emo obeležiti sa Bi iji su elementi
6,4B i svakako da je .SB
Doga aj da padne broj ve i od 26 je nemogu doga aj.
2.1. Algebra doga aja
Kako su doga aji definisani kao skupovi, to se operacije sa doga ajima u skupu S definišu na isti na in kao i operacije sa skupovima.
- Podskup doga aja. Kažemo da je doga aj A podskup doga aja B ukoliko su svi elementarni doga aji koji ine doga aj A istovremeno i elementarni doga aji koji ine doga aj B, i to zapisujemo
BA .
U tom slu aju kažemo da doga aj A implicira doga aj B, da je doga aj A deo doga aja B ...- Jednakost (ekvivalentnost) doga aja. Doga aji A i B su jednaki ukoliko je
ABBA i tada zapisujemo .BA
Poslovna statistika
59
- Suprotan doga aj. Suprotan doga aj doga aju A je doga aj koji se realizuje kada se prilikom izvo enja statisti kog eksperimenta ne realizuje doga aj A. Suprotan doga aj je skup koji se sastoji od svih elementarnih doga aja statisti kog eksperimenta, koji ne pripadaju doga aju A . Obeležava
se sa __
A i važi
ASA \__
gde je sa „ \ ” ozna ena operacija „razlika skupova”.
- Zbir doga aja. Zbir doga aja A i B , u oznaci A+B, predstavlja doga aj koji se realizuje u pojavi bar jednog od doga aja A ili B. Skup koji predstavlja doga aj A+B je skup .BA
Uopšte, zbir kona no mnogo doga aja A1, A2, ..., An, u oznaci n
i
iA1
,
predstavlja doga aj koji se realizuje u pojavi bar jednog od doga aja Ai,
(i=1,2,...,n). Skup koji predstavlja doga ajn
i
iA1
je skup n
i
iA1
.
Doga aji A1, A2, ..., An, ine potpun sistem doga aja ukoliko se bar jedan od
njih pojavi pri realizaciji eksperimenta, to jest ako važi .1
SAn
i
i
- Proizvod doga aja. Proizvod doga aja A i B, u oznaci BA , predstavljadoga aj koji se realizuje pojavom i doga aja A i doga aja B. Skup koji predstavlja doga aj BA , je skup .BA
Uopšte, proizvod kona no mnogo doga aja A1, A2, ..., An, u oznaci n
i
iA1
,
predstavlja doga aj koji se realizuje istovremenom pojavom svih doga aja Ai,
(i=1,2,...,n). Skup koji predstavlja doga ajn
i
iA1
, je skup n
i
iA1
.
Za doga aje A i B kažemo da se isklju uju (uzajamno isklju ivi doga aji,
nesaglasni doga aji) ako se ne mogu istovremeno dogoditi, odnosno ako je BA .
Uopšte, doga aji A1, A2, ... su uzajamno isklju ivi ako je ji AA za svako
i , j=1,2,..., i j.
Poslovna statistika
60
Ukoliko doga aji A1, A2, ..., An, ine potpun sistem doga aja i me usobno su
isklju ivi, onda doga aji A1, A2, ..., An, ine potpun sistem hipoteza prirealizaciji eksperimenta.
- Razlika doga aja. Razlika doga aja A i B , u oznaci A-B, predstavljadoga aj koji se realizuje kada se realizuje doga aj A i ne realizuje doga aj B.Skup koji predstavlja doga aj A-B, jeste skup .\ BA
Iz definicije razlike doga aja sledi __
BABA .
Primer 2.1.1. Obeležimo sa A doga aj da prilikom bacanja kockice za jamb padne paran broj ve i od 2, a sa B doga aj da padne broj ve i od 3.
Na i A+B, .,,,__
ABBABAA
Rešenje:
Kako je po uslovu zadatka 6,4A , a 6,5,4B , to je
6,4
5,3,2,1
6,5,4__
BA
A
BA
BA
.5AB
Poslovna statistika
61
2.2. Verovatno a
Kako je intuitivno jasno da se neki „slu ajni” doga aji javljaju eš e (ili re e)od nekih drugih „slu ajnih” doga aja, pojavila se potreba za uvo enjem odre ene mere koja bi na pravi na in predstavljala meru da se odre eni„slu ajni” doga aj desi. Ta mera, odnosno broj koji dodeljujemo odre enom „slu ajnom” doga aju, a koji predstavlja meru pojavljivanja tog doga aja,nazivamo verovatno om tog doga aja.
2.2.1. Definicija verovatno e
Za razne vrste doga aja definisale su se razne verovatno e, ali je 1933. godine ruski matemati ar A. N. Kolmogorov, postavio jednu sveobuhvatnu, tzv. aksiomatsku definiciju verovatno e, koja glasi:
- Aksiomatska definicija verovatno e. Neka je dat skup S. Funkcija P koja svaki podskup skupa S preslikava na skup R, za koju važi
Aksioma 1. 1SP (normiranost)
Aksioma 2. 0APSA (nenegativnost)
Aksioma 3. Ako su A1, A2, A3,... podskupovi iz S , takvi da važi
(i j) Ai Aj= , onda važi jednakost 11 i
i
i
i APAP .
(aditivnost) naziva se verovatno om na skupu S.
Ova aksiomatska definicija verovatno e je preambiciozna za nivo ovog udžbenika, pa je ne emo koristiti u našim izra unavanjima, ve emo verovatno u izra unavati ili na osnovu tzv. klasi ne definicije verovatno e (apriori verovatno a) ili na osnovu statisti ke definicije verovatno e (aposteriori verovatno a), u zavisnosti od prirode slu ajnog doga aja ijuverovatno u izra unavamo. Naravno, i klasi na i statisti ka definicija verovatno e su u saglasnosti sa aksiomatskom definicijom, odnosno predstavljaju njene specijalne slu ajeve.
Poslovna statistika
62
- Klasi na definicija verovatno e. Neka skup S sadrži njednakoverovatnih elementarnih doga aja. Ako skup A sadrži m elementarnih
doga aja, tada je verovatno a doga aja A, u oznaci P(A), jednaka n
mAP .
Elementarne doga aje koji odre uju doga aj A nazivamo povoljnim ishodima
za doga aj A.
Ova klasi na definicija se može koristiti kada su svi elementarni doga ajijednako verovatni i kada ih ima prebrojivo kona no mnogo. Zove se još i apriori verovatno a jer se može izra unati pre izvo enja statisti kogeksperimenta.
Primer 2.2.1.1. Na i verovatno u da prilikom bacanje kocke za jamb padne paran broj ve i od 2.
Rešenje:
Skup svih elementarnih doga aja je u ovom slu aju 6,5,4,3,2,1S , a traženi
doga aj, obeležimo ga sa A, odre en je slede im elementarnim doga ajima
6,4A , pa je verovatno a ovog doga aja .3
1
6
2)(AP
injenica da je za doga aje kod kojih se može primeniti klasi na definicija verovatno e, relativna frekvencija pojavljivanja odre enog doga aja u velikom broju eksperimenata veoma bliska verovatno i, omogu ava nam da pretpostavimo da i u opštem slu aju postoji neka konstanta oko koje se koleba relativna frekvencija pojavljivanja nekog „slu ajnog” doga aja. Prirodno je tu konstantu nazvati verovatno om, u ovom slu aju statisti kom verovatno om
posmatranog doga aja.
- Statisti ka definicija verovatno e. Ukoliko se prilikom velikog broja ponavljanja statisti kog eksperimenta zapazi da se relativna frekvencija doga aja A skoro za svaku veliku seriju eksperimenata samo neznatno razlikuje od neke (generalno nepoznate) konstante, kažemo da je ta konstanta statisti ka verovatno a doga aja A.
ebiševljev i Hin inov Zakon velikih brojeva, koji ovde ne emo izlagati, dozvoljava nam da statisti ku verovatno u doga aja A možemo dovoljno
Poslovna statistika
63
dobro oceniti relativnom frekvencijom pojavljivanja doga aja A u velikoj seriji statisti kih eksperimenata.
Dakle, ako je m broj pojavljivanja doga aja A u seriji od n statisti kiheksperimenata, onda je statisti ka verovatno a, P(A), približno jednaka
n
mAP )( ,
i važi slede e: 1)(lim0 APn
mPn .
Ova poslednja formula zna i da kada broj realizacije statisti kog eksperimenta teži u beskona nost, verovatno a da relativna frekvencija teži statisti koj
verovatno i, teži jedinici.
Statisti ka verovatno a se zove još i a posteriori verovatno a jer se izra unavaposle izvo enja statisti kog eksperimenta.
Primer 2.2.1.2. Proizvo a automobilskih guma je testirao izdržljivost svojih guma na pre enih 20.000 km. Od 150.000 ispitivanih guma, njih 900 nije izdržalo 20.000 km. Kolika je verovatno a da guma ovog proizvo a a ne izdrži put od 20.000 km.
Rešenje:
Na osnovu statisti ke definicije verovatno e, verovatno a da guma ovog
proizvo a a ne izdrži put od 20.000 km je .006.0150000
900
Poslovna statistika
64
2.2.2. Osobine verovatno e
Osobine verovatno e koje emo ovde prikazati su dokazive iz aksiomatske definicije verovatno e, ali ih ne emo dokazivati ve samo navesti.
Neka je dat skup elementarnih doga aja S i neka je na njemu definisana verovatno a P. Tada za SBA, važi slede e:
1. 1)(0 AP (Verovatno a je uvek broj izme u 0 i 1.)
2. P( )=0 (Verovatno a nemogu eg doga aja je 0.)
3. 1)()(__
APAP (Zbir verovatno a doga aja i njemu suprotnog
doga aja je 1.)
4. )()()()( BAPBPAPBAP (Verovatno a zbira dva
doga aja jednaka je zbiru verovatno a tih doga aja umanjenom za verovatno u proizvoda tih doga aja.)
Primer 2.2.2.1. Neka su A i B doga aji kod kojih je verovatno a P(A) = 0.45, P(B) = 0.30, a P(AB) = 0.25. Na i verovatno u da se dogodi bar jedan od doga aja A i B.
Rešenje:
Doga aj da se dogodi bar jedan od doga aja A i B je doga aj A+B, pa
je verovatno a tog doga aja jednaka
5.025.030.045.0)()()()( BAPBPAPBAP
5. )()()( BAPAPBAP (Verovatno a doga aja „A
razlika B” jednaka je razlici verovatno e doga aja A i doga aja
BA .)
Poslovna statistika
65
Primer 2.2.2.2. Neka su A i B doga aji kod kojih je verovatno a P(A) = 0.45, P(B) = 0.30, a P(AB) = 0.25. Na i verovatno u da se dogodi doga aj A a ne dogodi doga aj B.
Rešenje:
Doga aj da se dogodi doga aj A a ne dogodi doga aj B, je doga aj
A-B, pa je verovatno a tog doga aja jednaka
20.025.045.0)()()( BAPAPBAP .
6. Uslovna verovatno a. Uslovna verovatno a doga aja A, pod uslovom
da se dogodio doga aj B, P(B) 0, ozna ava se sa P(A B) i definiše sa
P(A B)=)(
)(
BP
BAP.
Primer 2.2.2.3. Neka su A i B doga aji kod kojih je verovatno a P(A) = 0.45, P(B) = 0.30, a P(AB) = 0.25. Na i verovatno u da se dogodi doga aj A pod uslovom da se dogodio doga aj B.
Rešenje:
Verovatno a da se dogodi doga aj A pod uslovom da se dogodio
doga aj B iznosi
P(A B)= .83.030.0
25.0
)(
)(
BP
BAP
7. Nezavisnost doga aja. Za doga aje A i B kažemo da su nezavisni ako
je
)()()( BPAPBAP .
O igledno da za ove doga aje važi
Poslovna statistika
66
P(A B)= )()(
)()(
)(
)(AP
BP
BPAP
BP
BAP.
Primer 2.2.2.4. Neka su A i B doga aji kod kojih je verovatno a P(A) = 0.45, P(B) = 0.30, a P(AB) = 0.25. Da li su doga aji A i B nezavisni doga aji?
Rešenje:
Kako je
25.0)(
135.030.045.0)()(
BAP
BPAP
to je
)()()( BPAPBAP ,
pa ovi doga aji nisu nezavisni.
8. Formula totalne verovatno e. Ako H1, H2, ..., Hn ine potpun sistem
hipoteza u odnosu na doga aj A, tada je
n
i
AP1
)( P(A Hi) P(Hi).
Primer 2.2.2.5. etiri kooperanta proizvode jedan deo nekog aparata. Kooperant A podmiruje 30% potreba, B 20% a C i D po 25 % potreba. Uo eno je da kooperant A šalje fabrici 10% neispravnih delova, B 15%, C 5% i D 8% neispravnih delova. Na i verovatno u da je u slu ajnoizabrani aparat ugra en neispravan deo.
Rešenje:
Ozna imo sa
A – doga aj ugra eni deo je od kooperanta A;B – doga aj ugra eni deo je od kooperanta B;
Poslovna statistika
67
C – doga aj ugra eni deo je od kooperanta C;D – doga aj ugra eni deo je od kooperanta D.
N – ugra eni deo je neispravan.
Sada je po uslovu zadatka
P(A)=0.3 P(N A)=0.1
P(B)=0.2 P(N B)=0.15
P(C)=0.25 P(N C)=0.05
P(D)=0.25 P(N D)=0.08
pa je
P(N)= P(A) P(N A)+ P(B) P(N B)+ P(C) P(N C)+ P(D) P(N D)=
0.3 0.1+0.2 0.15+0.25 0.05+0.25 0.08=0.0925.
Verovatno a da je ugra eni deo neispravan je 0.0925.
9. Bajesova formula. Ako H1, H2, ..., Hn ine potpun sistem hipoteza u
odnosu na doga aj A, i neka je P(A) 0, tada za i=1, 2, ..., n važi
P(Hi A)=n
j
jj
iiii
HHP
HHP
AP
HHP
1
)P(A)(
)P(A)(
)(
)P(A)(.
Primer 2.2.2.6. Ako je u prethodnom, Primeru 2.2.2.5, uo eno da je ugra en neispravan deo, kolika je verovatno a da taj neispravni deo poti e od kooperanta B?
Rešenje:
Po uslovu zadatka važi
P(B N)= .32.00925.0
15.02.0
)(
)P(N)(
NP
BBP
Verovatno a da neispravni deo poti e od kooperanta B je 0.32.
Poslovna statistika
68
2.2.3. Elementi kombinatorike
Prilikom odre ivanja verovatno e klasi nom definicijom potrebno je prebrojati doga aje, pri emu se esto koristimo kombinatorikom. Sve kombinatorne formule mogu se izvesti iz dva osnovna pravila: pravila
zbira i pravila proizvoda.
- Pravilo zbira. Ako se predmet jedne vrste može izabrati na n1 na ina,predmet druge vrste na n2 na ina, ..., predmet k-te vrste na nk na ina, onda se jedan predmet bez obzira na vrstu može izabrati na n1+n2+...+nk razli itihna ina.
- Pravilo proizvoda. Ako se predmet jedne vrste može izabrati na n1 na ina,predmet druge vrste na n2 na ina, ..., predmet k-te vrste na nk na ina, onda se kpredmeta razli ite vrste (odnosno iz svake vrste po jedan predmet) može izabrati na n1 n2 ... nk razli itih na ina.
Primer 2.2.3. Na prvoj godini studija ima 250 devojaka i 220 muškaraca. Na koliko razli itih na ina možemo izabrati jednog studenta sa ove godine, a na koliko razli itin na ina možemo izabrati plesni par na ovoj godini?
Rešenje:
Jednog studenta možemo izabrati na 250+220=470 razli itih na ina.
Jedan plesni par možemo izabrati na 250 220=55 000 razli itih na ina.
Poslovna statistika
69
2.2.3.1. Varijacije od n elemenata k-te klase
- Varijacije od n elemenata k-te klase bez ponavljanja k
nV (k<n)
Varijacije od n elemenata k-te klase bez ponavljanja, k
nV (k<n),
predstavljaju broj koji pokazuje na koliko se razli itih na ina može iz jednog osnovnog skupa od n razli itih elemenata izabrati k puta pojedan element, ali tako da se posle svakog izbora izabrani element nevra a u osnovni skup i ne u estvuje u slede em izboru.
Neka je, na primer, osnovni skup od n 4 elemenata skup
naaa ,...,, 21 .
Jedna njegova varijacija 4-te klase bez ponavljanja je, na primer, a1,a2,a3,a4, druga a2,a1,a3,a4, tre a a1,a2,a3,an, itd.
Formulu za broj k
nV emo dobiti slede im rasu ivanjem.
U prvom izboru imamo n mogu nosti, u drugom n-1 mogu unost, u tre em n-2 mogu nosti, ..., u k-tom n-k+1 mogu nost, to je po pravilu proizvoda:
121 knnnnV k
n .
- Varijacije od n elemenata k-te klase sa ponavljanjem k
nV__
Varijacije od n elemenata k-te klase sa ponavljanjem, k
nV__
, predstavljaju broj koji pokazuje na koliko se razli itih na ina može iz jednog osnovnog skupa od n razli itih elemenata izabrati k puta po jedan element, ali tako da se posle svakog izbora izabrani element vra a uosnovni skup i ravnopravno u estvuje u slede em izboru.
Neka je, na primer, osnovni skup od n 4 elemenata skup
naaa ,...,, 21 .
Poslovna statistika
70
Jedna njegova varijacija 4-te klase sa ponavljanjem je, na primer, a1,a1,a3,a4, druga a2,a1,a3,a1, tre a a1,a2,a3,an , itd.
Formulu za broj k
nV__
dobi emo slede im rasu ivanjem.
Kako je pri svakom izboru sastav osnovnog skupa isti i sadrži nrazli itih elemenata, to pri svakom izboru imamo n mogu nosti za izbor, pa je po pravilu proizvoda
k
k
k
n nnnnV ...__
.
Primer 2.2.3.1. U jednom odeljenju u kome se nalazi 30 u enika,biramo predsednika, sekretara i blagajnika. Na koliko razli itih na inato možemo da u inimo ukoliko:
a) jedna osoba može da obavlja više funkcija; b) jedna osoba može da obavlja samo jednu
funkciju?
Rešenje:
a)
Kako jedna osoba može da obavlja više od jedne funkcije, to u ovom
slu aju iz skupa od 30 elemenata biramo 3, ali sa ponavljanjem, pa je
broj na ina
33
30
__
30V .
b)
Kako jedna osoba ne može da obavlja više od jedne funkcije, to u ovom
slu aju iz skupa od 30 elemenata biramo 3, ali bez ponavljanja, pa je
broj na ina
282930330V .
Poslovna statistika
71
2.2.3.2. Permutacije od n elemenata
- Permutacije od n elemenata bez ponavljanja, Pn
Permutacije od n elemenata bez ponavljanja, Pn, predstavljaju broj koji pokazuje na koliko se razli itih na ina može razmestiti svih n razli itihelemenata osnovnog skupa.
Neka je, na primer, osnovni skup od n = 4 elemenata skup .,,, 4321 aaaa
Jedna njegova permutacija bez ponavljanja je, na primer, a1,a2,a3,a4,
druga a2,a1,a3,a4, tre a a1,a2,a4,a3, itd. Lako je zaklju iti da je taj broj jednak broju varijacija od n elemenata n-te klase bez ponavljanja, n
nV = n!.
Dakle Pn=n!.
Primer 2.2.3.2.1. Na polici se nalazi 15 razli itih knjiga. Na koliko razli itih na ina ih možemo razmestiti?
Rešenje:
Broj razli itih razmeštaja 15 razli itih knjiga na polici je jednak broju permutacija od 15 elemenata bez ponavljanja, P15=15!.
- Permutacije od n elemenata sa ponavljanjem, n
nnn kP ,...,, 21
Neka odre eni skup ima n elemenata, takvih da me u njima ima krazli itih vrsta. Neka i- ta vrsta (i = 1, 2, ..., k) sadrži ni elemenata koji se, naravno, me usobno ne razlikuju. O igledno da tada važi n=n1+n2+...+nk.
Permutacije od n elemenata sa ponavljanjem jednog ovakvog skupa, obeležavaju se sa n
nnn kP ,...,, 21
i predstavljaju broj koji pokazuje na koliko
razli itih na ina možemo ovakav skup od n elemenata da rasporedimo na n mesta.
Poslovna statistika
72
Neka je, na primer, osnovni skup od n elemenata skup koji se sastoji od dve vrste elemenata, i a-ova i n – i b-ova,
ini
bbbaaa ,...,,,,...,, .
Jedna njegova permutacija sa ponavljanjem je, na primer,
ini
bbbaaa ,...,,,,..., , druga abbbaaa
ini
,,...,,,,...,,1
, itd.
Formulu za broj n
nnn kP ,...,, 21
dobi emo slede im rasu ivanjem.
Kada bi svih n elemenata bilo me usobno razli ito, broj razli itihrazmeštaja ovakvog skupa predstavljao bi broj permutacija od nelemenata bez ponavljanja, odnosno !.nPn
Kako se u našem slu aju elementi iste vrste ne razlikuju, to se rasporedi koji se dobijaju permutovanjem elemenata iste vrste tako e ne erazlikovati. Broj takvih rasporeda je prema pravilu proizvoda n1! n2!nk!, pa tako e prema pravilu proizvoda važi
n1! n2! nk!n
nnn kP ,...,, 21
= n! ,
odakle sledi da je traženi broj na ina rasporeda elemenata ovakvog skupa
.!!!
!
21,...,, 21
k
n
nnnnnn
nP
k
Primer 2.2.3.2.2. U kutiji se nalazi 5 plavih, 3 žute i 4 crvene kuglice. Svih 12 kuglica raspore ujemo u red. Koliko ima razli itih rasporeda?
Rešenje:
Broj razli itih rasporeda iznosi .!3!4!5
!12124,3,5P
Poslovna statistika
73
2.2.3.3. Kombinacije od n elemenata k-te klase
- Kombinacije od n elemenata k-te klase bez ponavljanja, k
nC (k<n)
Kombinacije od n elemenata k-te klase bez ponavljanja, k
nC (k<n),
predstavljaju broj koji pokazuje koliko se razli itih podskupova od kelemenata mogu izabrati iz jednog osnovnog skupa od n razli itihelemenata, gde se elementi u podskupu ne mogu ponavljati.
Neka je, na primer, osnovni skup od n 4 elemenata skup
naaa ,...,, 21 .
Jedna njegova kombinacija 4-te klase bez ponavljanja je, na primer, skup 4321 ,,, aaaa , druga skup naaaa ,,, 321 , tre a nn aaaa ,,, 121
itd.
Formulu za broj k
nC dobi emo slede im rasu ivanjem.
Ako bismo elemente svakog takvog podskupa od k elementa permutovali, ukupan broj svih takvih permutacija po svim takvim podskupovima bio bi jednak broju varijacija od n elemenata k-te klase bez ponavljanja )( k
nV . Kako je broj permutacija po jednom takvom
podskupu od k elemenata jednak k!, a broj takvih podskupova jednak k
nC , to po pravilu proizvoda važi:
k
n
k
n VkC ! , pa je
k
n
k
knnnn
k
VC
k
nk
n !
121
!.
Poslovna statistika
74
Izrazk
n se naziva binomni koeficijent i važi:
.0;10
;;!!
!
k
nnk
n
nn
kn
n
k
n
knk
n
k
n
Primer 2.2.3.3.1. U jednom odeljenju nalazi se 30 u enika. Pod pretpostavkom da svi znaju da igraju preferans, koliko razli itih ekipa za igranje preferansa možemo imati u ovom odeljenju? (Preferans je kartaška igra koju igraju samo tri igra a.)
Rešenje:
U ovom odeljenju ima !3
282930
3
30330C mogu ih razli itih
ekipa za igranje preferansa.
- Kombinacije od n elemenata k-te klase sa ponavljanjem,k
nC__
Kombinacije od n elemenata k-te klase sa ponavljanjem, k
nC__
,predstavljaju broj koji pokazuje koliko se razli itih podskupova od kelemenata mogu izabrati iz jednog osnovnog skupa od n razli itihelemenata, gde se elementi u podskupu mogu ponavljati.
Neka je, na primer, osnovni skup od n 4 elemenata skup
naaa ,...,, 21 .
Poslovna statistika
75
Jedna njegova kombinacija 4-te klase sa ponavljanjem je, na primer, skup 4321 ,,, aaaa , druga skup 4311 ,,, aaaa , tre a 1111 ,,, aaaa ,
itd.
Formulu za broj k
nC__
dobi emo slede om analogijom.
Neka je osnovni skup od n elemenata skup naaa ,...,, 21 .
Zamislimo da smo u jednoj dubokoj kutiji postavili n – 1 pregradu, kao na slici 2.2.3.3.
Slika 2.2.3.3.
Tih n – 1 pregrada odre uju n nezavisnih prostora, koje smo obeležili slovima a1, a2, ..., an. Zamislimo da u tako pregra enu kutiju ubacujemo k kuglica. Tih k kuglica e se nekako rasporediti u ovih n prostora.
Zabeležimo te rasporede na slede i na in: ako su na primer 4 kuglice pale u prostor a1 a preostalih k – 4 kuglica u prostor an-2 , onda takav raspored obeležimo slede im podskupom od k elemenata
4
2221111 ,...,,,,,,k
nnn aaaaaaa .
1 2 n-2 n-1 pregrada
a1 a2 an-1 an
Poslovna statistika
76
Ovo upravo i jeste jedan podskup od k elemenat izabran iz osnovnog skupa od n elemenata sa ponavljanjem. Ukupan broj svih rasporeda uba enih k kuglica u ovako pregra enu kutiju i ovako zabeleženih, predstavlja ukupan broj svih podskupova od k elemenata izabranih iz osnovnog skupa naaa ,...,, 21 , dakle predstavlja broj kombinacija od n
elemenata k-te klase sa ponavljanjem.
Sa druge strane, ukupan broj svih rasporeda uba enih k kuglica u ovako pregra enu kutiju, jednak je broju razli itih rasporeda k kuglica i n – 1
pregrade, odnosno jednak je broju permutacija sa ponavljanjem skupa koji sadrži k+n-1 element od kojih su k iste vrste (kuglice) i n – 1 istevrste (pregrade), a to je, kao što smo ranije pokazali:
k
kn
nk
knP nk
nk
1
!1!
!111, .
Dakle, važi
k
kn
nk
knPC nk
nk
k
n
1
!1!
!111,
__
.
Primer 2.2.3.3.2. Osmoro ljudi ulazi u zgradu koja ima etiri ulaza. Na koliko razli itih na ina oni mogu u i u zgradu u smislu broja ljudi koji ulaze na razli itim ulazima?
Rešenje:
Obeležimo svaku osobu koja u e na i-tom ulazu (i=1,2,3,4) brojem i.
Ovim na inom dobijamo nizove dužine osam od etiri elementa. Na
primer, ako su tri osobe ušle na prvom ulazu, a pet na tre em, dobijamo
slede i niz dužine osam 1,1,1,3,3,3,3,3. Kako redosled ne igra nikakvu
ulogu i brojevi se ponavljaju, dobijeni nizovi ine broj kombinacija od
etiri elementa osme klase sa ponavljanjem, kojih ima
.8
11
8
1848
4
___
C
Poslovna statistika
77
3. RASPODELE SLU AJNIH PROMENLJIVIH
U mnogim statisti kim eksperimentima elementarni doga aji su sami po sebi realni brojevi, kao u našem primeru bacanja kockice za jamb. Naravno, postoje i statisti ki eksperimenti kod kojih elementarni doga aji nisu realni brojevi.
Na primer, ako prilikom bacanja dva nov i a sa „G” obeležimo da se na posmatranom nov i u pojavila „glava” a sa „P” – „pismo”, skup svih elementarnih doga aja ovog eksperimenta je ),(),,(),,(,, PPGPPGGGS
gde, kao što vidimo, elementarni doga aji nisu realni brojevi.
Radi lakše analize u oblasti verovatno e, veoma je poželjno da sve elementarne doga aje izražavamo pomo u realnih brojeva, koji e samim tim sadržavati i informaciju o verovatno i pojavljivanja elementarnih doga aja koje predstavljaju.
Zbog toga je potrebno po nekom pravilu od interesa, u datoj situaciji preslikati skup svih elementarnih doga aja na skup realnih brojeva tako da se svaki elementarni doga aj iz skupa svih mogu ih ishoda preslika u jedan realan broj, kome se pridružuje verovatno a jednaka zbiru verovatno a pojavljivanja svih elementarnih doga aja koji se u njega slikaju (svih originala).
Neka u našem interesu to pravilo preslikavanja bude zadato sa „broj
pojavljivanja „pisma” u bacanju dva nov i a”. Tada se elementarni doga aj(G,G) preslikava u 0, (G,P) i (P,G) u 1, a (P,P) u 2, pa se itav skup S na ovaj na in preslikava na skup 2,1,0 . Nazovimo taj skup X.
Dakle, tada je
2,1,0),(),,(),,(,, XPPGPPGGGS pismabroj
i važi:
.4
1,()2(
2
1
4
1
4
1),((),(()),(),,(()1(
4
1)),(()0(
PPPXP
GPPPGPGPPGPXP
GGPXP
Poslovna statistika
78
Upravo se jedno ovakvo preslikavanje skupa svih elementarnih doda aja zoveslu ajna promenljiva.
- Slu ajna promenljiva
Slu ajna promenljiva je funkcija koja svaki elementarni doga aj statisti kogeksperimenta preslikava u jedan realan broj, kome se pridružuje verovatno ajednaka zbiru verovatno a pojavljivanja svih elementarnih doga aja koji se u njega slikaju.
Skup svih realnih brojeva na koji se slika skup svih elementarnih doga aja (S)obeležavamo velikim slovima X , Y , Z , ..., i vrlo esto se sam taj skup svih slika slu ajne promenljive naziva, tako e, slu ajna promenljiva. Ovaj naziv je veoma odoma en u našoj i stranoj literaturi, tako da emo ga i mi koristiti. Konkretne realizacije slu ajne promenljive obeležava emo malim slovima x, y,
z, ..., tako da kad napišemo X = x, to zna i da je slu ajna promenljiva X uzelavrednost x.
U našem primeru slu ajna promenljiva je 2,1,0X , a njene konkretne
realizacije su .2,1,0 321 xxx
Slu ajna promenljiva može biti diskretna i neprekidna.
- Diskretna slu ajna promenljiva. Ako slu ajna promenljiva uzima kona anbroj vrednosti ili prebrojivo beskona an broj vrednosti, onda se ona naziva diskretna slu ajna promenljiva.
Naš malopre ašnji primer je primer diskretne slu ajne promenljive, jer slu ajnapromenljiva uzima kona an broj vrednosti – tri vrednosti.
- Neprekidna slu ajna promenljiva. Ako slu ajna promenljiva može da uzme bilo koju vrednost iz nekog intervala vrednosti, onda se ona naziva neprekidna
slu ajna promenljiva.
Primer neprekidne slu ajne promenljive je, recimo, slu ajna promenljiva visina ljudi na našoj planeti. Ta slu ajna promenljiva je neprekidna jer može uzeti bilo koju vrednost iz, recimo, intervala (30 cm-250 cm).
Poslovna statistika
79
3.1. Raspodele diskretnih slu ajnih promenljivih
Diskretna slu ajna promenljiva je potpuno definisana ako je data njena raspodela verovatno a ili njena funkcija raspodele verovatno a.
- Raspodela verovatno a diskretne slu ajne promenljive. Ako slu ajnapromenljiva X može da uzme kona an broj vrednosti x1, x, ..., xn sa
verovatno ama p1, p2,..., pn, , gde je 11
n
i
ip , onda skup parova brojeva
nixXPpx iii ,...,2,1,)(, , odnosno šematski prikaz
n
i
i
n
np
ppp
xxxX
121
21 1,...
....
predstavlja raspodelu verovatno e slu ajne promenljive X.
Ukoliko slu ajna promenljiva X može da uzme beskona an broj vrednosti x1, x,
..., xn, ... sa verovatno ama p1, p2, ..., pn, ..., gde je 11i
ip , onda skup parova
brojeva nixXPpx iii ,...,2,1,)(, ,... odnosno šematski prikaz
121
21 1,...
...
i
i
n
np
ppp
xxxX ,
predstavlja raspodelu verovatno e slu ajne promenljive X.
Raspodela verovatno e slu ajne promenljive X grafi ki se može predstaviti poligonom raspodela verovatno e ili dijagramom raspodela verovatno e.
- Poligon raspodela verovatno e. Poligon raspodela verovatno e se dobija spajanjem ta aka (xi, pi) i=1,2,...,n u koordinatnom sistemu na ijoj apscisi se nanose vrednosti xi slu ajne promenljive X, a na ordinati odgovaraju everovatno e pi, kao na slici 3.1.1.
Poslovna statistika
80
Slika 3.1.1. Poligon raspodele verovatno a
- Dijagram raspodela verovatno e. Dijagram raspodela verovatno e dobijase spajanjem ta aka (xi,0) i (0, pi) i=1,2,...,n u koordinatnom sistemu na ijoj se apscisi nanose vrednosti xi slu ajne promenljive X, a na ordinati odgovaraju everovatno e pi, kao na slici 3.1.2.
Slika 3.1.2. Dijagram raspodele verovatno a
x1 x2 .... xn-1 xn xi
pi
p2
pn-1
p1
pn
x1 x2 .... xn-1 xn xi
pi
p2
pn-1
p1
pn
Poslovna statistika
81
Primer 3.1.1. Na i raspodelu verovatno a slu ajne promenljive „broj
pojavljivanja „pisma” u bacanju dva nov i a” i predstaviti poligon i dijagram raspodele.
Rešenje:
Kao što je ranije analizirano, raspodela verovatno e ove slu ajne
promenljive, koju smo obeležili sa X, je
4
1
2
1
4
1
210X .
Poligon raspodele verovatno a je dat na slici 3.1.3.a.
Slika 3.1.3.a. Poligon raspodele
Dijagram raspodele verovatno a dat je na slici 3.1.3.b.
0 1 2 xi
pi
0.5
0.25
Poslovna statistika
82
Slika 3.1.3.b. Dijagram raspodele
- Funkcija raspodele verovatno a diskretne slu ajne promenljive. Akoslu ajna promenljiva X može da uzme kona an broj vrednosti x1, x,..., xn sa
verovatno ama p1, p2, ..., pn , gde je 11
n
i
ip , ili beskona an broj vrednosti x1,
x, ..., xn, ..., sa verovatno ama p1, p2, ..., pn, ... , gde je 11i
ip , onda
verovatno a da ta slu ajna promenljiva bude manja od neke realne vrednosti x,predstavlja vrednost funkcije raspodele verovatno a te slu ajne promenljive u ta ki x i obeležava se sa F(x).
Dakle, funkcija raspodele verovatno a F(x) slu ajne promenljive X je realna funkcija )(xFx , definisana sa:
.),()( xxXPxF
(Napomena. U nekim udžbenicima funkcija raspodele verovatno a definiše se kao ).()( xXPxF )
Iz definicije funkcije raspodele F(x), zaklju ujemo da važi slede e:
0 1 2 xi
pi
0.5
0.25
Poslovna statistika
83
ixx
ipxF )( ,
odnosno
xx
xxxppp
xxxpp
xxxp
xx
xF
n
nnn
1
0
)(
1121
3221
211
1
.
Grafi ka predstava funkcije raspodele verovatno a data je na slici 3.1.4.
Slika 3.1.4. Funkcija raspodele verovatno a
Neke od osobina funkcije raspodele verovatno a diskretne slu ajnepromenljive su:
Osobina 1. Funkcija raspodele verovatno a diskretne slu ajnepromenljive je prekidna funkcija, ije su ta ke prekida upravo one vrednosti koje slu ajna promenljiva može uzeti sa odre enim verovatno ama. U tim
F(x)
1 1
1
n
i
ip
p1+p2
p1
0x1 x2 x3 xn-1 xn x
Poslovna statistika
84
ta kama prekida, ovako definisana funkcija raspodele verovatno a je neprekidna sa leve strane, a prekidna sa desne.
Osobina 2. Oblast definisanosti ove funkcije je itav skup R i važi:
1)(0
1)(lim
0)(lim
xFRx
xF
xF
x
x
Osobina 3. Funkcija raspodele diskretne slu ajne promenljive je neopadaju a funkcija, tj. važi
)()(),( bFaFbaRba .
Primer 3.1.2. Na i funkciju raspodele verovatno a slu ajnepromenljive „broj pojavljivanja „pisma” u bacanju dva nov i a” i predstaviti je grafi ki.
Rešenje:
Na osnovu definicije, funkcija raspodele verovatno a ove slu ajne
promenljive je
x
x
x
x
xF
21
214
3
104
1
00
)( .
Poslovna statistika
85
Grafik ove funkcije raspodele verovatno a dat je na slede oj slici 3.1.5.
3.1.1. Parametri diskretnih slu ajnih promenljivih
Kao što smo rekli, raspodela verovatno a diskretne slu ajne promenljive ili funkcija raspodele verovatno a diskretne slu ajne promenljive, u potpunosti opisuju slu ajnu promenljivu. Me utim, u mnogim slu ajevima nije neophodno opisati slu ajnu promenljivu potpuno, ve je dovoljno ukazati na pojedine parametre koji u odre enoj meri karakterišu bitne osobine analizirane raspodele.
Kao i u slu aju deskriptivne statisti ke analize, ti parametri se mogu svrstati u tri grupe:
- parametri srednje vrednosti (mere srednje vrednosti ili centralne tendencije);
- parametri varijabiliteta (mere disperzije); - parametri oblika rasporeda (mere oblika rasporeda).
1 2 xSlika 3.1.5. Funkcija raspodele verovatno a
F(x)
1
0.75
0.25
Poslovna statistika
86
Parametri prve grupe reprezentuju centar rasturanja vrednosti slu ajnepromenljive, parametri druge grupe mere vrednost tog rasturanja oko centra rasturanja, a parametri tre e grupe ukazuju na oblik rasturanja posmatrane raspodele.
3.1.1.1. Parametri centralne tendencije diskretne slu ajnepromenljive
Parametri centralne tendencije diskretne slu ajne promenljive koje emo mi navesti su matemati ko o ekivanje, modus i medijana.
- Matemati ko o ekivanje. Matemati ko o ekivanje diskretneslu ajne promenljive X esto se naziva i srednja vrednost slu ajnepromenljive X. Mi ga obeležavamo sa E(X) i odre ujemo ga na slede ina in:
ako slu ajna promenljiva X može da uzme kona an broj vrednosti x1,
x,..., xn sa verovatno ama p1, p2, ..., pn, , gde je 11
n
i
ip , onda njeno
matemati ko o ekivanje uvek postoji i jednako je
.)(1
n
i
ii pxXE
Ako slu ajna promenljiva X može da uzme beskona an broj vrednosti
x1, x, ..., xn, ... sa verovatno ama p1, p2, ..., pn, ..., , gde je 11i
ip ,
onda
i) ukoliko red 1i
ii px konvergira, matemati ko o ekivanje te
slu ajne promenljive postoji i jednako je 1
)(i
ii pxXE ;
ii) ukoliko red 1i
ii px divergira, matemati ko o ekivanje te
slu ajne promenljive ne postoji.
Poslovna statistika
87
Matemati ko o ekivanje se još naziva i moment prvog reda diskretneslu ajne promenljive. U opštem slu aju moment k-tog reda diskretneslu ajne promenljive X ozna avamo sa mk(X) i nalazimo po formuli
n
i
i
k
ik pxXm1
)(
odnosno
1
)(i
i
k
ik pxXm ukoliko red 1i
i
k
i px konvergira.
- Modus. Modus diskretne slu ajne promenljive X obeležavamo sa Mo(X) i ona predstavlja najverovatniju vrednost (ukoliko je unimodalna raspodela) ili najverovatnije vrednosti (ukoliko je polimodalna raspodela) diskretne slu ajne promenljive X. Zna i Mo(X)
predstavlja vrednosti slu ajne promenljive X u kojima raspodela verovatno a te slu ajne promenljive P(X=x) ima maksimum.
- Medijana. Medijanu diskretne slu ajne promenljive X obeležavamo sa Me(X) i ona predstavlja sve one vrednosti slu ajne promenljive X za koje važi slede e:
.5.0))((5.0))(( XMXPXMXP ee
Primer 3.1.1.1. Na i matemati ko o ekivanje, modus i medijanu slu ajne promenljive „broj pojavljivanja „pisma” u bacanju dva
nov i a”.
Rešenje:
Kao što je ranije analizirano, raspodela verovatno e ove slu ajne
promenljive, koju smo obeležili sa X, je
4
1
2
1
4
1
210X ,
Poslovna statistika
88
pa je:
matemati ko o ekivanje
14
12
2
11
4
10)(
3
1i
ii pxXE .
Modus iznosi
Mo(X) = 1
jer samo za X=1 raspodela verovatno a ima maksimum 2
1)1(XP .
Medijana iznosi
Me(X) = 1
jer samo za X = 1 važi slede e:
.5.04
3
2
1
4
1)1()0()1(
5.04
1)0()1(
XPXPXP
XPXP
Primer 3.1.1.2. Na i medijanu slu ajne promenljiva X ija je raspodela
verovatno a .
4
1
4
1
4
1
4
1
3210X
Rešenje:
Medijana ove slu ajne promenljive je bilo koji broj iz zatvorenog
intervala 2,1 , odnosno Me(X) 2,1 .
Naime, za Me(X)=1 važi:
Poslovna statistika
89
.5.02
1
4
1
4
1)1()0()1(
5.04
1)0()1(
XPXPXP
XPXP
Za Me(X) (1,2) važi:
.5.02
1
4
1
4
1)1()0()(
5.02
1
4
1
4
1)1()0()(
XPXPMXP
XPXPMXP
e
e
Za Me(X)=2 važi:
.5.04
3
4
1
4
1
4
1)2()1()0()2(
5.02
1
4
1
4
1)1()0()2(
XPXPXPXP
XPXPXP
Poslovna statistika
90
3.1.1.2. Parametri varijabiliteta diskretne slu ajne promenljive
Parametri varijabiliteta diskretne slu ajne promenljive koje emo mi navesti su varijansa i standardna devijacija, kao apsolutne mere varijabiliteta diskretne slu ajne promenljive, i koeficijent varijacije,kao relativna mera varijabiliteta diskretne slu ajne promenljive.
- Varijansa. Varijansu diskretne slu ajne promenljive X obeležavamo sa var(X), ili 2
(X) i odre ujemo na slede i na in:
ako slu ajna promenljiva X može da uzme kona an broj vrednosti x1,
x, ..., xn sa verovatno ama p1, p2, ..., pn, gde je 11
n
i
ip , onda njena
varijansa uvek postoji i jednaka je
.)()(1
22n
i
ii pXExX
Ako slu ajna promenljiva X može da uzme beskona an broj vrednosti
x1, x, ..., xn, ... sa verovatno ama p1, p2, ..., pn, ..., gde je 11i
ip , onda
i) ukoliko red 1
2)(i
ii pXEx konvergira, varijansa te
slu ajne promenljive postoji i jednaka je
1
22 )()(i
ii pXExX ;
ii) ukoliko red 1
2)(i
ii pXEx divergira, varijansa te slu ajne
promenljive ne postoji.
Varijansa diskretne slu ajne promenljive još se naziva i centralni
moment drugog reda. U opštem slu aju, centralni moment k-tog reda
diskretne slu ajne promenljive X ozna avamo sa Mk(X) i nalazimo po formuli
n
i
i
k
ik pXExXM1
)()( ,
Poslovna statistika
91
odnosno
1
)()(i
i
k
ik pXExXM
ukoliko red 1
)(i
i
k
i pXEx konvergira.
Iz same definicije varijanse jasno je da važi
.)()( 22 XEXEX
Kako važi slede e:
212
2222
1
2
11
2
1
2
)()()()()(2)(
)()(2)(
mmXEXEXEXEXEXE
pXEpxXEpxpXExn
i
i
n
i
ii
n
i
ii
n
i
ii
to varijansu možemo izra unavati i pomo u tzv. radne formule
.)()()()()( 212
222 XmXmXEXEX
- Standardna devijacija. Standardnu devijaciju diskretne slu ajnepromenljive X obeležavamo sa st. dev. (X) ili sa (X) i izra unavamo po formuli
)var().(. XXdevst odnosno .)()( 2 XX
Poslovna statistika
92
- Koeficijent varijacije. Koeficijent varijacije diskretne slu ajnepromenljive X obeležavamo sa Cv(X) i izra unavamo po formuli
)(
)()(
XE
XXCv .
Ako ga želimo izraziti u procentima, obeležavamo ga sa Cv(X)% i izra unavamo po formuli
%.100)(
)()%(
XE
XXCv
Poslovna statistika
93
3.1.1.3. Parametri oblika rasporeda diskretne slu ajne promenljive
Parametri oblika rasporeda diskretne slu ajne promenljive su merasimetrije i mera spljoštenosti slu ajne promenljive.
Mera simetrije se izražava pomo u koeficijenta simetrije, dok se mera spljoštenosti izražava pomo u koeficijenta spljoštenosti. I jedan i drugi koeficijent se izra unavaju pomo u centralnih momenata.
- Koeficijent simetrije slu ajne promenljive X ozna avamo sa 3(X) i izra unavamo po formuli:
33
3)(
)()(
X
XMX .
Ukoliko je:
3(X)=0 zaklju ujemo da je raspodela vrednosti obeležja simetri na. Tada je tako e )()()( XMXMXE oe ;
3(X) 0 zaklju ujemo da je raspodela vrednosti obeležja pozitivno asimetri na (asimetrija udesno). Tada je tako e
)()()( XMXMXE oe ;
3(X) 0 zaklju ujemo da je raspodela vrednosti obeležja negativno asimetri na (asimetrija ulevo). Tada je tako e
)()()( XMXMXE oe .
- Koeficijent spljoštenosti slu ajne promenljive X ozna avamo sa 4(X) i izra unavamo po formuli:
Poslovna statistika
94
44
4)(
)()(
X
XMX .
Ukoliko je:
4(X)=3 zaklju ujemo da je raspodela vrednosti obeležja normalno spljoštena;
4(X) 3 zaklju ujemo da je raspodela vrednosti obeležja izdužena, odnosno ima spljoštenost manju od normalne;
4(X) 3 zaklju ujemo da raspodela vrednosti obeležja ima spljoštenost ve u od normalne.
Zadatak 3.1.1. Na i varijansu, standardnu devijaciju, koeficijent varijacije, koeficijente simetrije i spljoštenosti slu ajne promenljive „broj pojavljivanja „pisma” u bacanju tri nov i a”.
Poslovna statistika
95
3.1.2. Primeri nekih raspodela diskretnih slu ajnih promenljivih
3.1.2.1. Binomna raspodela, B(n,p)
Zamislimo slede i statisti ki eksperiment:
pretpostavimo da n-puta pokušavamo da realizujemo doga aj A i da je verovatno a uspešne realizacije ovog doga aja u svakom pokušaju ista i iznosi p. Naravno, tada je i verovatno a nerealizacije doga aja A u svakom pokušaju ista i iznosi 1-p.
Nad ovim eksperimentom definišimo slu ajnu promenljivu X kao „broj
uspešnih realizacija doga aja A u n pokušaja pri ovakvim uslovima”. Na imo raspodelu verovatno a ove slu ajne promenljive.
Vrednosti koje ova slu ajna promenljiva X može uzeti su
niiX ,...,2,1,0, , gde je saiX ozna eno da se doga aj A realizovao ta no i puta u n pokušaja.
Varovatno u da se doga aj A realizovao ta no i puta u n pokušaja, odnosno )( iXP , nalazimo slede im rasu ivanjem:
jedna od mogu ih elemenatrnih realizacija ovog eksperimenta, kod koje se doga aj A realizovao ta no i puta u n pokušaja, jeste da se doga aj A
realizovao u prvih i pokušaja, a nije realizovao u preostalih n-i pokušaja.Verovatno a ove elementarne realizacije je
1
1
1111 ni
ni
pppppppp .
Postojii
nrazli itih elementarnih realizacija kod kojih se doga aj A
realizovao ta no i puta u n pokušaja i svaka od njih ima istu verovatno u
jednaku ini pp 1 .
Varovatno a da se doga aj A realizovao ta no i puta u n pokušaja jednaka je zbiru verovatno a svih ovih elementarnih realizacija, odnosno
Poslovna statistika
96
....,2,1,0,)1()( nippi
niXP ini
Ovakva raspodela slu ajne promenljive se naziva Binomna raspodela. Kao što smo videli, zavisi od dva parametra: jedan je broj pokušaja realizacije doga aja(n), a drugi je verovatno a uspešne realizacije doga aja u svakom pojedina nom pokušaju (p).
Kada slu ajna promenljiva X podleže zakonu Binomne raspodele sa parametrima n i p, to zapisujemo: ).,(~ pnBX
Dakle, važi:
....,2,1,0,)1()(),(~ nippi
niXPpnBX ini
Parametri slu ajne promenljive ),(~ pnBX :
- matemati ko o ekivanje: pnXE )( ;
- varijansa: ppnX 1)(2 ;
- standardna devijacija ppnX 1)( ;
- koeficijent simetrijeppn
pX
1
21)(3 ;
- koeficijent spljoštenosti ppnn
X1
163)(4 .
Primer 3.1.2.1. Strelac ga a u metu 10 puta. Verovatno a da pogodi metu je u svakom pokušaju ista i iznosi p=0.7. Na i verovatno u da je pogodio ta no 8 puta.
Poslovna statistika
97
Rešenje:
Slu ajna promenljiva X definisana kao „broj pogodaka u 10 pokušaja pri ovim
uslovima”, podleže zakonu Binomne raspodele sa parametrima n=10 i p=0.7,
)7.0,10(~ BX , pa je 28 3.07.08
10)8(XP .
3.1.2.2. Hipergeometrijska raspodela, H(N,N1,n)
Zamislimo slede i statisti ki eksperiment:
proizvoljan skup sadrži N elemenata, od kojih N1 elemenata (N1<N)ima osobinu A. Iz takvog skupa na slu ajan na in biramo n elemenata bez ponavljanja (n<N).
Nad ovim eksperimentom definišimo slu ajnu promenljivu X kao „broj
izabranih elemenata koji imaju osobinu A pri ovakvim uslovima”. Na imo raspodelu verovatno a ove slu ajne promenljive.
Vrednosti koje ova slu ajna promenljiva X može uzeti su X = i ,gde i može uzeti bilo koju celobrojnu vrednost iz zatvorenog intervala
.),min(),,0max( 11 NnNNn
Verovatno u da u n ovako izabranih elemenata ima ta no i sa osobinom A, P(X=i), nalazimo slede im rasu ivanjem:
broj svih elementarnih doga aja u ovakvom statisti kom eksperimentu jednak je broju razli itih na ina na koji možemo iz skupa od N elemenata izabrati n
bez ponavljanja, odnosno jednak n
N.
Naš doga aj od interesa odre en je onim elementarnim doga ajima u kojima se od N1 elementa bira i bez ponavljanja i od N-N1 elementa bira n-i , tako e bez ponavljanja.
Kako od N1 elementa možemo izabrati i elemenata bez ponavljanja na i
N
razli itih na ina, a od N-N1 elementa možemo izabrati n-i elemenata bez
Poslovna statistika
98
ponavljanja na in
NN 1 razli itih na ina, to je po pravilu proizvoda naš
doga aj od interesa odre en sa i
N
in
NN 1 elementarnih doga aja.
Tako da, po klasi noj definiciji verovatno e, verovatno a da u n ovako izabranih elemenata ima ta no i sa osobinom A, iznosi
n
N
in
NN
i
N
iXP
1
)( ,
gde i može uzeti bilo koju celobrojnu vrednost iz zatvorenog intervala .),min(),,0max( 11 NnNNn
Ovakva raspodela slu ajne promenljive se naziva Hipergeometrijska
raspodela. Kao što smo videli, zavisi od tri parametra: jedan je broj elemenata skupa iz kojeg vršimo slu ajan izbor bez ponavljanja (N), drugi je broj elemenata tog skupa koji ima željenu osobinu (N1), a tre i je broj elemenata koji izvla imo iz tog skupa bez ponavljanja (n).
Kada slu ajna promenljiva X podleže zakonu Hipergeometrijske raspodele sa parametrima N, N1 i n, to zapisujemo: ).,,(~ 1 nNNHX
Parametri slu ajne promenljive ),,(~ 1 nNNHX :
- matemati ko o ekivanje:N
NnXE 1)( ;
- varijansa: 1
1)( 112
N
nN
N
N
N
NnX ;
- standardna devijacija 1
1)( 11
N
nN
N
N
N
NnX .
Poslovna statistika
99
Primer 3.1.2.2. Iz odeljenja koje ima 30 u enika od kojih su 18 de aka, na slu ajan na in biramo 10 u enika. Na i verovatno u da me u tih deset izabranih u enika bude 7 de aka.
Rešenje:
Broj de aka u 10 slu ajno izabranih u enika iz ovog odeljenja podleže
raspodeli )10,18,30(H , pa je verovatno a da je me u tih 10 u enika ta no 7
de aka jednaka
10
30
3
12
7
18
.
Poslovna statistika
100
3.1.2.3. Puasonova raspodela, P( )
Slu ajna promenljiva X ima Puasonovu raspodelu verovatno a, P( ),
ukoliko je njena raspodela verovatno a odre ena slede im zakonom raspodele:
,.....2,1,0,0,!
)( iconsti
eiXPi
Puasonova raspodela verovatno a je grani ni slu aj Binomne raspodele u slu aju kada je, za fiksirano i, n i p 0, ali tako da je n p=const.>0.Naime, važi slede e:
.1lim
11lim;11
12
11
1lim
)(!
1
11
12
11
11!
lim
1!
11lim
1lim),(lim00
en
nn
i
nn
jejer
Pei
n
n
n
i
nni
nni
innn
ppi
npnB
n
n
i
nn
i
i
n
i
n
in
i
i
n
ini
constpnn
constpnn
Iz ovoga zaklju ujemo da se Binomna raspodela može za veliko n i malo p, u slu aju kada je n p=const., dosta dobro aproksimirati Puasonovom, koja je lakša za izra unavanje. Greška koja se pri tome ini se ve za p<0.1 i n>50
može zanemariti. Kako je p blisko nuli, Puasonova raspodela opisuje doga ajeija je verovatno a pojavljivanja veoma mala, odnosno tzv. retke doga aje.
Puasonova raspodela ne služi samo za aproksimaciju Binomne raspodele, ve i za odre ivanje verovatno e broja javljanja nekog doga aja u prostoru i
Poslovna statistika
101
vremenu. Ovi doga aji nisu doga aji definisani kao podskup nekog statisti kogeksperimenta, ve doga aji koji zadovoljavaju slede e uslove:
- broj javljanja doga aja je nezavisan od jedne do druge jedinice vremena ili ta ke prostora;
- verovatno a istovremenog javljanja dva ili više doga aja u sasvim malom vremenskom ili prostornom intervalu je zanemarljivo mala;
- verovatno a javljanja doga aja je proporcionalna dužini odre enogvremenskog ili prostornog intervala.
To su, na primer, doga aji, broj telefonskih poziva u nekom vremenskom intervalu, broj estica emitovanih od neke radioaktivne supstance, broj štamparskih grešaka po stranici neke knjige i sl.
Naime, neka je slu ajna promenljiva Xt „broj pojavljivanja nekog doga aja u
intervalu 0, t)”. Podelimo interval 0, t) na n intervala jednakih dužina n
t. Ako
zamislimo da je n veliko, onda je:
- broj javljanja doga aja nezavistan od jednog do drugog intervala;
- verovatno a istovremenog javljanja dva ili više doga aja u jednom intervalu je zanemarljiva;
- verovatno a da se u nekom intervalu ostvari jedan doga aj, obeležimo je sa p, ista je za svaki interval i važi da kada n tada p 0. Tako e, ta verovatno a je direktno proporcionalna dužini intervala, odnosno obrnuto
proporcionalna broju intervala n, to jest možemo pisati n
p , =const. 0,
gde parametar na neki na in karakteriše intenzitet protoka doga aja.
Neka je Ai , i=1,2,...,n, doga aj da se u i-tom intervalu pojavi posmatrani doga aj.
Tada su, na osnovu gore navedenog, doga aji Ai , i = 1, 2, ..., n, nezavisni sa jednakim verovatno ama
Poslovna statistika
102
.,...,2,10.)( niconstn
pAP i
Slu ajna promenljiva Xt „broj pojavljivanja nekog doga aja u intervalu 0, t)”,sada je identi na slu ajnoj promenljivoj „broj realizacija doga aja Ai , i = 1,2,...,n”, a ona, kao što znamo, pod ovim uslovima podleže zakonu Binomne, B(n,p), raspodele. Dakle, ),(~ pnBX t .
Ako pove amo preciznost registrovanja doga aja, to jest dozvolimo da n ,
tada 0n
p , ali 0.constnp , pa tada važi
).(),(lim~0.
PpnBX
constpnn
t
Puasonova raspodela zavisi samo od jednog parametra , koji u slu ajuaproksimacije Binomne raspodele Puasonovom iznosi =n p, a u slu ajupredstavljanja protoka nekog doga aja u nekom prostornom ili vremenskom intervalu, predstavlja o ekivani broj pojavljivanja nekog doga aja u tom posmatranom prostornom ili vremenskom intervalu.
Kada slu ajna promenljiva X podleže zakonu Puasonove raspodele sa parametrom , to zapisujemo ).(~ PX
Parametri slu ajne promenljive )(~ PX :
- matemati ko o ekivanje: )(XE ;
- varijansa: )(2 X ;
- standardna devijacija )(X ;
- koeficijent simetrije1
)(3 X ;
- koeficijent spljoštenosti 1
3)(4 X .
Poslovna statistika
103
Primer 3.1.2.3.1. Verovatno a pogotka u cilj pri svakom ga anju je 0,05. Na iverovatno u ta no jednog pogotka, ako je broj ga anja 60.
Rešenje:
Obeležimo sa X slu ajnu promenljivu broj pogotka u 60 ga anja.
Pošto se binomna raspodela verovatno e za 1,005 pn može
aproksimirati Puasonovom raspodelom u kojoj je pn , to, kako je u ovom
slu aju 305,060pn , važi
31
3 3!1
3)1( eeXP .
Primer 3.1.2.3.2. U telefonskoj centrali u toku jednog sata bilo je 60 poziva. Izra unati verovatno u da u toku dva minuta nije bilo nijednog poziva.
Rešenje:
Obeležimo sa X slu ajnu promenljivu broj poziva u toku dva minuta.
O ekivani broj poziva u toku dva minuta je 230
60, pa je verovatno a da
u toku dva minuta nije bilo nijednog poziva jednaka
20
2
!0
2)0( eeXP .
Poslovna statistika
104
3.2. Raspodele neprekidnih slu ajnih promenljivih
Ako je slu ajna promenljiva X neprekidna slu ajna promenljiva, onda ona može da uzme bilo koju vrednost iz nekog intervala vrednosti. Pošto u realnom intervalu ima beskona no mnogo vrednosti, besmisleno je govoriti o verovatno i da slu ajna promenljiva X uzme ta no odre enu vrednost u tom intervalu. U tom smislu, za neprekidnu slu ajnu promenljivu X možemo re i da je verovatno a da ona uzme ta no odre enu vrednost, recimo i, jednaka nuli, to jest da je 0)( iXP . Smisleno je i mogu e kod neprekidnih slu ajnihpromenljivih izra unati verovatno u da se slu ajna promenljiva X nalazi u nekom intervalu vrednosti, odnosno izra unati )( bXaP .
Kako je
0)()( bXPaXP ,
to važi
)()()()( bXaPbXaPbXaPbXaP .
Važno je napomenuti da u slu aju neprekidne slu ajne promenljive X, injenicada je 0)( iXP ne zna i da je doga aj X = i nemogu , ve da je besmisleno o ekivati ga unapred, odnosno da mu je a priori verovatno a jednaka nuli.
Zato kod neprekidnih slu ajnih promenljiva nema smisla ra unati raspodelu verovatno a, ve je neprekidna slu ajna promenljiva potpuno definisana ako je data njena funkcija raspodele verovatno a ili njena funkcija gustine raspodele
verovatno a.
Poslovna statistika
105
- Funkcija raspodele verovatno a neprekidne slu ajne promenljive
Ako je X neprekidna slu ajna promenljiva, onda verovatno a da ta slu ajnapromenljiva bude manja od neke realne vrednosti x, predstavlja vrednost funkcije raspodele verovatno a te slu ajne promenljive u ta ki x i obeležava se sa F(x).
Dakle, funkcija raspodele verovatno a F(x), slu ajne promenljive X, jeste realna funkcija )(xFx definisana sa:
.),()( xxXPxF
Iz definicije funkcije raspodele F(x), zaklju ujemo da važi slede e:
)(1)(1)(1)()(.5
)()()()()()(.4
1)(lim0)(lim.3
)()(,.2
1)(0.1
aFaXPaXPaXPaXP
aFbFbXaPbXaPbXaPbXaP
xFxF
bFaFbaRba
xFRx
xx
Primer izgleda jedne funkcije raspodele neprekidne slu ajne promenljive dat je na slici 3.2.1.
Poslovna statistika
106
Slika 3.2.1. Funkcija raspodele
Vrednost F(a) predstavlja verovatno u da slu ajna promenljiva uzme neku vrednost manju od a, odnosno ).()( aXPaF
F(x)
1
F(a)
a x
Poslovna statistika
107
- Funkcija gustine raspodele verovatno a neprekidne slu ajne promenljive
Neka je F funkcija raspodele neprekidne slu ajne promenljive X. Ako postoji nenegativna funkcija f definisana na R takva da za svako x R važi da je
x
dttfxF )()( ,
tada tu funkciju f nazivamo funkcija gustine verovatno e neprekidne slu ajne
promenljive X, ili kra e – funkcija gustine.
Iz definicije funkcije gustine raspodele f(x) zaklju ujemo da, ukoliko je Fdiferencijabilna u ta ki x, važi slede e: ).()(' xfxF
Tako e važi:
1)(.4
)()()()(.3
)()()()(.2
0)(.1
dxxf
dxxfaXPdxxfaXP
aFbFdxxfbXaP
xfRx
a
a
b
a
Primer izgleda jedne funkcije gustine raspodele neprekidne slu ajnepromenljive dat je na Slici 3.2.2.
Poslovna statistika
108
Slika 3.2.2. Funkcija gustine raspodele
Kao što se vidi na slici 3.2.2, verovatno a )( bXaP jednaka je šrafiranoj površini ome enoj grafikom funkcije gustine raspodele f(x), x osom i pravama x=a i x=b.
Verovatno a )( bXP jednaka je površini desno od prave x=b ograni enojgrafikom funkcije gustine raspodele f(x) i x osom, a verovatno a
)( aXP jednaka je površini levo od prave x=a ograni enoj grafikom funkcije gustine raspodele f(x) i x osom.
P(a<X<b)
P(x>b)P(X<a)
f(x)
a b x
Poslovna statistika
109
3.2.1. Parametri neprekidnih slu ajnih promenljivih
Kao i u slu aju diskretnih slu ajnih promenljivih, parametre neprekidnih slu ajnih promenljivih svrsta emo u tri grupe:
- parametri srednje vrednosti (mere srednje vrednosti ili centralne tendencije);
- parametri varijabiliteta (mere disperzije); - parametri oblika rasporeda (mere oblika rasporeda).
Parametri prve grupe reprezentuju centar rasturanja vrednosti slu ajnepromenljive, parametri druge grupe mere vrednost tog rasturanja oko centra rasturanja, a parametri tre e grupe ukazuju na oblik rasturanja posmatrane raspodele.
3.2.1.1. Parametri centralne tendencije neprekidne slu ajnepromenljive
Parametri centralne tendencije neprekidne slu ajne promenljive koje emo mi navesti su matemati ko o ekivanje, modus i medijana.
Matemati ko o ekivanje. Matemati ko o ekivanje neprekidneslu ajne promenljive X esto se naziva i srednja vrednost slu ajnepromenljive X. Mi emo ga obeležavati sa E(X) i odre ujemo ga na slede i na in:
ako neprekidna slu ajna promenljiva X ima funkciju gustine verovatno e f(x), onda je njeno matemati ko o ekivanje jednako
.)()( dxxfxXE
Poslovna statistika
110
Matemati ko o ekivanje još se naziva i moment prvog reda neprekidneslu ajne promenljive. U opštem slu aju, moment k-tog reda neprekidneslu ajne promenljive X ozna avamo sa mk(X) i nalazimo po formuli
dxxfxXm k
k )()(
- Modus. Modus neprekidne slu ajne promenljive X obeležavamo sa Mo(X) i ona je odre ena onim ta kama u kojima funkcija gustine verovatno e f(x) ima maksimum.
- Medijana. Medijanu neprekidne slu ajne promenljive X obeležavamo sa Me(X) i ona predstavlja onu vrednost slu ajne promenljive X za koje važi slede e:
5.0)()()(eM
ee dxxfMFMXP .
Medijana neprekidne slu ajne promenljive je, dakle, ona vrednost slu ajne promenljive za koju je verovatno a da slu ajna promenljiva bude manja od nje jednaka verovatno i da slu ajna promenljiva bude ve a od nje, jednaka 0.5.
Primer 3.2.1.1. Na i matemati ko o ekivanje, modus i medijanu neprekidne slu ajne promenljive ija je funkcija gustine
1,00
1,02)(
x
xxxf .
Rešenje:
Matemati ko o ekivanje je
1
0
1
0
3
3
2|
322.)()(
xxdxxdxxfxXE .
Poslovna statistika
111
Modus iznosi
Mo(X) = 1
jer samo za X=1 funkcija gustine verovatno a ima maksimum .2)1(f
Medijanu nalazimo iz uslova:
5.05.0|2
22
5.0)()()(
2
0
2
0
ee
MM
M
ee
MMx
dxx
dxxfMFMXP
ee
e
3.2.1.2. Parametri varijabiliteta neprekidne slu ajne promenljive
Parametri varijabiliteta neprekidne slu ajne promenljive koje emo mi navesti su varijansa i standardna devijacija, kao apsolutne mere varijabiliteta neprekidne slu ajne promenljive, i koeficijent varijacije,kao relativna mera varijabiliteta neprekidne slu ajne promenljive.
- Varijansa. Varijansu neprekidne slu ajne promenljive Xobeležavamo sa var(X) ili 2
(X), i odre ujemo na slede i na in:
ako neprekidna slu ajna promenljiva X ima funkciju gustine verovatno e f(x) onda je njena varijansa jednaka
.)(()( 22 dxxfXExX
Varijansa se još naziva i centralni moment drugog reda. U opštem slu aju centralni moment k-tog reda neprekidne slu ajne promenljive X ozna avamo sa Mk(X) i nalazimo po formuli
Poslovna statistika
112
.)(()( dxxfXExXMk
k
Iz same definicije varijanse jasno je da važi
.)()( 22 XEXEX
Kako važi slede e:
212
2222
22
2
)()()()()(2)(
)()()()(2)(
)((
mmXEXEXEXEXEXE
dxxfXEdxxfxXEdxxfx
dxxfXEx
to varijansu možemo izra unavati i pomo u tzv. radne formule
.)()()()()( 212
222 XmXmXEXEX
- Standardna devijacija. Standardnu devijaciju neprekidne slu ajnepromenljive X obeležavamo sa st. dev. (X) ili sa (X) i izra unavamo po formuli
)var().(. XXdevst odnosno .)()( 2 XX
- Koeficijent varijacije. Koeficijent varijacije neprekidne slu ajnepromenljive X obeležavamo sa Cv(X) i izra unavamo po formuli
)(
)()(
XE
XXCv .
Ako ga želimo izraziti u procentima, obeležavamo ga sa Cv(X)% i izra unavamo po formuli
Poslovna statistika
113
%100XC%100)X(E)X()%X(C vv .
3.2.1.3. Parametri oblika rasporeda neprekidne slu ajnepromenljive
Parametri oblika rasporeda neprekidne slu ajne promenljive su, kao i kod diskretnih, mera simetrije i mera spljoštenosti slu ajnepromenljive.
Mera simetrije izražava se pomo u koeficijenta simetrije, dok se mera spljoštenosti izražava pomo u koeficijenta spljoštenosti. I jedan i drugi koeficijent se izra unavaju pomo u centralnih momenata, na isti na inkao i kod diskretnih slu ajnih promenljivih.
- Koeficijent simetrije slu ajne promenljive X ozna avamo sa 3(X) i izra unavamo po formuli:
33
3)(
)()(
X
XMX .
Ukoliko je:
3(X)=0 zaklju ujemo da je raspodela vrednosti obeležja simetri na; tada je tako e )()()( XMXMXE oe ;
3(X) 0 zaklju ujemo da je raspodela vrednosti obeležja pozitivno asimetri na (asimetrija udesno), tada je tako e
)()()( XMXMXE oe ;
3(X) 0 zaklju ujemo da je raspodela vrednosti obeležja negativno asimetri na (asimetrija ulevo); tada je tako e
)()()( XMXMXE oe .
Poslovna statistika
114
- Koeficijent spljoštenosti slu ajne promenljive X ozna avamo sa 4(X) i izra unavamo po formuli:
44
4)(
)()(
X
XMX .
Ukoliko je:
4(X)=3 zaklju ujemo da je raspodela vrednosti obeležja normalno spljoštena;
4(X) 3 zaklju ujemo da je raspodela vrednosti obeležja izdužena, odnosno ima spljoštenost manju od normalne;
4(X) 3 zaklju ujemo da raspodela vrednosti obeležja ima spljoštenost ve u od normalne.
Zadatak 3.2.1. Na i varijansu, standardnu devijaciju, koeficijent varijacije, koeficijente simetrije i spljoštenosti neprekidne slu ajnepromenljive ija je funkcija gustine
1,00
1,02)(
x
xxxf .
Poslovna statistika
115
3.2.2. Primeri nekih raspodela neprekidnih slu ajnih promenljivih
3.2.2.1. Normalna (Gausova) raspodela, N( ,2)
Neprekidna slu ajna promenljiva X ima Normalnu raspodelu sa parametrima i 2 ako je njena gustina raspodele verovatno a jednaka
,2
1)(
2
2
2
)(
xexf
x
.
Kada slu ajna promenljiva X ima Normalnu raspodelu sa parametrima i 2 to zapisujemo ),(~ 2NX .
Normalnu raspodelu uveo je nema ki matemati ar Karl Fridrih Gaus (1777-1855) u analizi ocene slu ajnih grešaka prilikom obrade rezultata merenja, pa se zato naziva i Gausova raspodela.
Grafici gustina ove raspodele verovatno a zavise od parametara i 2.Me utim, mogu se uo iti slede e zajedni ke karakteristike:
- sve krive gustine simetri ne su u odnosu na pravu x = , što zna i da je medijana Me= ;
- ta ka maksimuma je ta ka )2
1,( , pa je i moda Mo= ;
- 0)(lim xfx
;
- sve krive su zvonastog oblika;
Poslovna statistika
116
- ukoliko je ve e, to je maksimalna vrednost gustine manja, ali je rasturanje oko prave x = ve e, odnosno širina krive je ve a (Slika3.2.3);
8 6 4 2 0 2 4 6 8 10 120
0.13
0.25
dnormx 2 2( )
dnormy 2 4( )
Slika 3.2.3. Funkcije gustine N(2,22) i N(2,4
2)
- promena vrednosti parametra dovodi do translacije krive gustine duž x ose (Slika 3.2.4);
4 2 0 2 4 6 8 10 12 140
0.13
0.25
dnormx 2 2( )
dnormy 6 2( )
x y
Slika 3.2.4. Funkcije gustine N(2,22) i N(6,2
2)
N(2,22)
N(2,42)
N(2,22)
N(6,22)
Poslovna statistika
117
- za sve slu ajne promenljive ),(~ 2NX važi
997.0)33(
95.0)22(
68.0)(
XP
XP
XP
- ako slu ajna promenljiva X ima Normalan raspored, onda i njena linearna transformacija Y=a+bX tako e ima Normalan raspored;
- ako je ),(~ 2111 NX i ),(~ 2
222 NX , tada
),(~
),(~2
22
12121
22
212121
NXX
NXX
Slu ajnu promenljivu koja ima Normalnu raspodelu sa parametrima =0 i 2=1 zovemo slu ajna promenljiva Z tipa ili Z promenljiva. Zna i
)1,0(~ NZ (Slika 3.2.5).
4 3 2 1 0 1 2 3 40
0.25
0.5
dnorm x 0 1( )
x
Slika 3.2.5. Funkcija gustine N(0,1)
Poslovna statistika
118
Pod brojem z slu ajne promenljive Z tipa, podrazumeva emo broj z za koji
važi 1)()()(z
dxxfzZPzF (Slika 3.2.6).
0
0.25
0.5
dnorm x 0 1( )
x
Slika 3.2.6. Broj z
O igledno da je z
dxxfzZP )()( .
Vrednosti Normalne raspodele N(0,1) date su tabli no na kraju udžbenika u
obliku 1)()()(z
dxxfzZPzF .
U koloni ozna enoj sa z nalaze se cifra jedinica i prva decimala broja z , dok se u vrsti ozna enoj sa z nalazi druga decimala broja z .
U preseku vrste odre ene cifrom jedinicom i prvom decimalom broja z i kolone odre ene drugom decimalom broja z , nalazi se vrednost 1- koja odgovara tom z .
Tako, na primer, u preseku vrste odre ene sa 0.7 i kolone odre ene sa 0.04, nalazi se broj 0.7704, što zna i da je
7704.0)74.0(ZP , odnosno da je 2296.074.0 z .
1-
z
Poslovna statistika
119
Bez dokaza emo navesti jednu veoma važnu injenicu, koja nam omogu avada tablicu vrednosti N(0,1) raspodele možemo koristiti za odre ivanjevrednosti bilo koje N( ,
2) raspodele. Ta injenica je slede a:
ako slu ajna promenljiva X ima N( ,2) raspodelu, onda slu ajna promenljiva
X ima N(0,1) raspodelu, odnosno važi
)1,0(~),(~ 2 NX
NX to jest X
Z .
Primer 3.2.2.1. Ako slu ajna promenljiva X podleže zakonu N(20,102), na i
verovatno u )285( XP .
Rešenje:
Kako je u ovom slu aju 1020 i , to važi )1,0(~ NX
, pa je
7213.00668.07881.0)5.1()8.0()8.05.1(
)10
2028
10
205()285()10,20(~ 2
FFZP
XPXPNX
Moivre-Laplaceova teorema (koju ne emo dokazivati) nam omogu ava da, u slu ajevima kada je 5)1(5 pnipn , Binomnu raspodelu B(n,p)
možemo aproksimirati Normalnom raspodelom sa parametrima pn i
)1(2 ppn , odnosno sa ))1(,( ppnpnN .
Kako u tom slu aju diskretnu raspodelu aproksimiramo neprekidnom, neophodno je da se interval integracije Normalne raspodele proširi i sa gornje i sa donje strane sa 0.5.
Primer 3.2.2.2. Ako je )3.0,20(~ BX , na i približno verovatno u)73( XP .
Poslovna statistika
120
Rešenje:
Kako je 5147.0201563.020 pnipn to B(20,0.3)
možemo aproksimirati Normalnom raspodelom kod koje je
2.47.03.020163.020 2 ppnapn ,
pa je
7237.00436.07673.0)71.1()73.0(
)2.4
65.7
2.4
65.2()73(
FF
ZPXP.
Normalna raspodela ima najve i zna aj me u raspodelama verovatno a iz slede ih razloga:
- veliki broj slu ajnih promenljivih ima Normalan raspored;- veliki broj slu ajnih promenljivih ima aproksimativno Normalan
raspored;- izvesne komplikovanije raspodele mogu se aproksimirati Normalnom
raspodelom;- veliki broj slu ajnih promenljivih koje služe za verifikaciju statisti kih
testova imaju Normalnu raspodelu.
Parametri slu ajne promenljive ),(~ 2NX :
- matemati ko o ekivanje: )(XE ;
- varijansa: 22 )(X ;
- standardna devijacija )(X ;
- koeficijent simetrije 0)(3 X ;
- koeficijent spljoštenosti 3)(4 X .
Poslovna statistika
121
3.2.2.2. Studentova raspodela (t-raspodela), t
Engleski matemati ar Goset (W. S. Gosset) je 1908. godine, pod pseudonimom Student, objavio rad u kome je definisao jednu novu, do tada nepoznatu neprekidnu raspodelu, koja je po njegovom pseudonimu i dobila naziv Studentova raspodela. Ova raspodela se naziva još i t-raspodela.
Matemati ki izraz za funkciju gustine ove raspodele je previše komplikovan i ne emo ga izložiti.
Studentova raspodela je neprekidna raspodela koja zavisi samo od jednog parametra koji se naziva broj stepeni slobode, koga emo obeležavati sa i koji može iznositi =1, 2, 3, ... .
Kada slu ajna promenljiva X ima Studentovu raspodelu sa stepeni slobode, to zapisujemo tX ~ .
Studentova raspodela ima slede e osobine:
- njena funkcija gustine raspodele, obeležimo je sa f(t), definisana je na itavom skupu R za svako =1, 2, 3, ...;
- grafik funkcije gustine raspodele je simetri an u odnosu na ordinatnu osu, to jest
)()( tftfRt za svako =1, 2, 3, ...;
- apscisna osa je asimptota krive gustine f(t), kada tto jest
0)(lim tft
za svako =1, 2, 3, ...;
- kada Studentova raspodela teži N(0,1) raspodeli, tako da se veza 30 Studentova raspodela može aproksimirati N(0,1)
raspodelom;
- funkcija gustine Studentove raspodele je na sredini više spljoštena, a na krajevima šira od N(0,1) rasporeda.
Poslovna statistika
122
Na slici 3.2.7. dat je oblik funkcije gustine raspodele t1, t3 i t50.
4 3 2 1 0 1 2 3 40
0.2
0.4dt x 1( )
dt y 3( )
dt z 50( )
x y z
Slika 3.2.7. Funkcije gustine t1 , t3 , t50
Vrednosti Studentove raspodele t date su tabli no na kraju udžbenika u obliku )( ,ttP .
U koloni ozna enoj sa Stepeni slobode nalaze se cifre koje ozna avaju broj stepeni slobode, odnosno parametar , dok se u vrsti ozna enoj sa nalaze vrednosti verovatno e.
U preseku vrste odre ene parametrom i kolone odre ene verovatno om ,nalazi se broj t , za koji važi )( ,ttP .
Tako, na primer, u preseku vrste odre ene sa = 7 i kolone odre ene sa =0.05, nalazi se broj 1.8946, što zna i da je
05.0)8946.1( 7tP ,
odnosno da je 05.0,78946.1 t (Slika 3.2.8).
t1
t3
t50
Poslovna statistika
123
4 3 2 1 0 1 2 3 40
0.2
0.4
dt x 7( )
x
Slika 3.2.8. Grafi ka predstava broja t7,0.05
Parametri slu ajne promenljive tX ~ :
- matemati ko o ekivanje: 0)(XE ;
- varijansa: 2;2
)(2 X ;
- standardna devijacija 2;2
)(X ;
- koeficijent simetrije 0)(3 X ;
- koeficijent spljoštenosti 4;4
63)(4 X .
=0.05
t7
t7,0.05=1.8946
Poslovna statistika
124
3.2.2.3. Hi-kvadrat raspodela, 2
Matemati ki izraz za funkciju gustine ove raspodele tako e ne emo izložiti zbog njegove složenosti.
Hi-kvadrat raspodela je neprekidna raspodela koja zavisi samo od jednog parametra koji se naziva broj stepeni slobode, koga emo obeležavati sa i koji može iznositi =1, 2, 3, ...
Kada slu ajna promenljiva X ima Hi-kvadrat raspodelu sa stepeni slobode, to zapisujemo 2~X .
Hi-kvadrat raspodela ima slede e osobine:
- njena funkcija gustine raspodele, obeležimo je sa f(x), definisana je samo za pozitivne realne brojeve (x 0) za svako =1, 2, 3, ...;
- grafik funkcije gustine raspodele je asimetri an, i to pozitivno asimetri an za svako =1, 2, 3, ...;
- moda slu ajne promenljive sa 2 raspodelom iznosi Mo= - 2, ( 2);
- kada , Hi-kvadrat raspodela teži Normalnoj raspodeli saparametrima = , i 2
=2 , tako da se ve za 30 Hi-kvadrat raspodela
može aproksimirati N( ,2 ) raspodelom.
Na slici 3.2.9. dat je oblik funkcije gustine raspodele 27
24
23
22
21 ,,,, .
Poslovna statistika
125
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 150
0.2
0.4dchisq x 1( )
dchisq x 2( )
dchisq x 3( )
dchisq x 4( )
dchisq x 7( )
x
Slika 3.2.9. Funkcije gustine 27
24
23
22
21 ,,,,
Vrednosti Hi-kvadrat raspodele2 date su tabli no na kraju udžbenika u
obliku )( 2,
2P .
U koloni ozna enoj sa Stepeni slobode nalaze se cifre koje ozna avaju broj stepeni slobode, odnosno parametar , dok se u vrsti ozna enoj sa nalaze vrednosti verovatno e.
U preseku vrste odre ene parametrom i kolone odre ene verovatno om ,nalazi se broj 2
, , za koji važi )( 2,
2P .
Tako, na primer, u preseku vrste odre ene sa = 7 i kolone odre ene sa =0.05, nalazi se broj 14.067, što zna i da je
05.0)067.14( 27P ,
odnosno da je 205.0,7067.14 (Slika 3.2.10).
12
22
32
42
72
Poslovna statistika
126
0 2 4 6 8 10 12 14 16 18 200
0.05
0.1
0.15
dchisq x 7( )
x
Slika 3.2.10. Grafi ka predstava broja2
7,0.05
Parametri slu ajne promenljive 2~X :
- matemati ko o ekivanje: )(XE ;
- varijansa: 2)(2 X ;
- standardna devijacija 2)(X ;
- koeficijent simetrije8
)(3 X ;
- koeficijent spljoštenosti 12
3)(4 X .
=0.05
27,0.05=14.067
Poslovna statistika
127
3.3. Neke osobine matemati kog o ekivanja E(X) i varijanse Var(X) slu ajne promenljive X
Neka su a,b,c proizvoljni realni brojevi i neka su X i Y slu ajne promenljive. Tada važi:
YbEXaEbYaXE
XVarabaXVar
bXaEbaXE
cVar
ccE
()()(.5
)()(.4
)()(.3
0)(.2
)(.1
2
2
)())((0.6
XVarXEXP .
Osobina pod brojem 6. je poznata i kao ebiševljeva nejednakost.
Poslovna statistika
128
4. UZORAK I STATISTIKE UZORKA
Karakteristike populacije su egzaktno poznate samo ako su informacije o njima uzete iz itave populacije. Me utim, anketiranje itave populacije esto stvara velike teško e i iziskuje mnogo vremena. U pojedinim slu ajevima je nemogu e, pa i besmisleno anketirati itavu populaciju ukoliko prikupljanje informacija zna i i uništenje podataka. Zbog toga se kompletno anketiranje populacije esto zamenjuje jednim drugim metodom analize parametara populacije – metodom uzorka.
Uzorak je jedan deo populacije, izabran na specifi an na in, ijom analizom dobijamo rezultate pomo u kojih možemo izvesti dovoljno valjane zaklju ke o vrednostima parametara itave populacije.
Radi što ve e verodostojnosti izvedenih zaklju aka iz uzora kih podataka, potrebno je da uzorak bude reprezentativan, odnosno da je po svojoj strukturi sli an osnovnom skupu.
Prema na inu izbora uzorka iz populacije, uzorke delimo u dve osnovne grupe: na slu ajne (probabilisti ke) i na namerne (neprobabilisti ke).
Slu ajni uzorak je onaj uzorak kod koga je verovatno a izbora svakog elementa iz populacije u uzorak unapred poznata i razli ita od nule.
Svi ostali metodi izbora uzorka su neslu ajni i tako izabrani uzorci su namerni.
Postoji više razli itih na ina dobijanja slu ajnog uzorka iz populacije.
Najzna ajniji me u nima je prost slu ajni uzorak i on je predmet analize ovog, 4. poglavlja.
Pomenu emo da u slu ajne uzorke spadaju još i stratifikovani uzorak, uzorak
skupina, višeetapni uzorak, sistematski uzorak, ali njih ne emo analizirati u ovom udžbeniku.
Poslovna statistika
129
4.1. Prost slu ajni uzorak
Kao i u prethodnim poglavljima, broj lanova populacije obeležava emo sa N,a broj lanova uzorka sa n.
Ako iz populacije veli ine N izvla imo uzorke od n elemenata tako da su verovatno e izbora svakog uzorka me usobno jednake, onda takav uzorak zovemo prost slu ajni uzorak.
Mi emo analizirati dve vrste prostog slu ajnog uzorka: prost slu ajni uzorak sa ponavljanjem i prost slu ajni uzorak bez ponavljanja.
Prilikom uzimanja prostog slu ajnog uzorka sa ponavljanjem, element koji smo izabrali u uzorak vra amo u populaciju pre izbora slede eg elementa i on ravnopravno u estvuje u slede em izvla enju, odnosno isti element može biti izabran u uzorak više puta. Tako e, uzima emo u obzir i redosled izvla enja,što zna i da uzorke sa istim elementima smatramo razli itim ukoliko je redosled izbora elemenata razli it. Imaju i ovo u vidu, jasno je da postoji Nn
razli itih prostih slu ajnih uzorka sa ponavljanjem od n elemenata uzetih iz populacije od N elemenata.
Biraju i elemente sa ponavljanjem, svakom elementu skupa u svakom izboru
pružamo istu verovatno u da bude izabran, jednaku N
1, tako da su u ovom
slu aju izbori elemenata u uzorku statisti ki nezavisni doga aji.
Primer 4.1.1. Iz populacije iji su elementi brojevi 1, 2, 3, 4, 5, ispisati sve uzorke sa ponavljanjem od dva elementa.
Rešenje:
Kako je N=5 i n=2, postoji 52=25 razli itih uzorka sa ponavljanjem veli ine
dva. To su:
)5,5()4,5()3,5()2,5(1,5
)5,4()4,4()3,4()2,4(1,4
)5,3()4,3()3,3()2,3(1,3
)5,2()4,2()3,2()2,2(1,2
)5,1()4,1()3,1()2,1(1,1
Poslovna statistika
130
Prilikom uzimanja prostog slu ajnog uzorka bez ponavljanja, element koji smo izabrali u uzorak ne vra amo u populaciju pre izbora slede eg elementa i on ne
u estvuje u slede em izvla enju, odnosno isti element ne može biti izabran u uzorak više puta. Tako e, ne emo uzimati u obzir i redosled izvla enja, što zna i da uzorke sa istim elementima smatramo istim i ukoliko je redosled
izbora elemenata razli it. Imaju i ovo u vidu, jasno je da postoji n
Nrazli itih
prostih slu ajnih uzorka bez ponavljanja od n elemenata uzetih iz populacije od N elemenata.
Izbori elemenata u uzorku bez ponavljanja su statisti ki zavisni doga aji jer su verovatno e izbora elemenata u razli itim izvla enjima me usobno razli ite.
Naime, u prvom izvla enju verovatno a izbora nekog elementa u uzorak je N
1,
u drugom 1
1
N, u tre em
2
1
N, itd.
Primer 4.1.2. Iz populacije iji su elementi brojevi 1, 2, 3, 4, 5, ispisati sve uzorke bez ponavljanja od dva elementa.
Rešenje:
Kako je N=5 i n=2, postoji 1012
45
2
5 razli itih uzorka bez ponavljanja
veli ine dva. To su:
)5,4(
)5,3()4,3(
)5,2()4,2()3,2(
)5,1()4,1()3,1()2,1(
Poslovna statistika
131
U teorijskom slu aju kada je veli ina populacije beskona na (N ), iz nje možemo izabrati beskona no mnogo uzorka veli ine n. Tada pod prostim
slu ajnim uzorkom podrazumevamo uzorak kod koga su izbori elemenata populacije u uzorak me usobno statisti ki nezavisni doga aji. Zbog toga emo smatrati da je prost slu ajni uzorak uzet iz beskona ne populacije ekvivalentan
prostom slu ajnom uzorku sa ponavljanjem uzetom iz kona ne populacije.
U slu ajevima kad je uzorak dovoljno mali u odnosu na populaciju, n N (u
praksi n 0.05 N, odnosno 05.0N
n), uzorak bez ponavljanja je
aproksimativno evivalentan uzorku sa ponavljanjem, jer se tada verovatno eizbora elemenata u uzorak bez ponavljanja neznatno razlikuju me usobno, pa ih možemo smatrati statisti ki nezavisnim doga ajima.
Neka je, na primer, N=1000 a n=50, tada je verovatno a izbora prvog elementa
u uzorak bez ponavljanja jednaka 001.01000
1, a verovatno a izbora
poslednjeg, pedesetog elementa u uzorak jednaka 001051.0951
1.
Verovatno e izbora svih ostalih elemenata nalaze se izme u ovih dveju verovatno a i o igledno je da se sve me usobno neznatno razlikuju.
Dakle, analize i zaklju ci koje emo izvesti za prost slu ajni uzorak sa
ponavljanjem uzet iz kona ne populacije, važi e za prost slu ajni uzorak uzet
iz beskona ne populacije, i aproksimativno e važiti za prost slu ajni uzorak
bez ponavljanja uzet iz kona ne populacije u slu ajevima kada je 05.0N
n.
Izbor elemenata iz populacije u prost slu ajni uzorak sa i bez ponavljanja upraksi se naj eš e sprovodi pomo u Tablice slu ajnih brojeva, koja je data u Prilogu ovog udžbenika.
Ova tablica formirana je od cifara 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, koje su radi ve epreglednosti svrstane u grupe od po pet redova i pet kolona, koje zanemarujemo prilikom koriš enja tablice. U slu aju koji je ovde dat u Prilogu, Tablica slu ajnih brojeva ima ukupno 40 kolona i 100 vrsta. Algoritam po
Poslovna statistika
132
kome je Tablica slu ajnih brojeva konstruisana obezbe uje da su verovatno epojavljivanja bilo koje od ovih cifara iste i me usobno nezavisne. U slu aju kada biramo slu ajni uzorak veli ine n iz populacije veli ine N,Tablicu slu ajnih brojeva koristimo na slede i na in:
- prvo obeležimo sve lanove populacije brojevima od 1 do N;- ako prvi put koristimo Tablicu, slu ajno izaberemo jednu cifru u
Tablici (recimo zažmurimo i pritisnemo olovkom); ako Tablicu ne koristimo prvi put, izaberemo onu cifru koja sledi posle poslednje koriš ene cifre u prethodnom koriš enju Tablice;
- po evši od te izabrane cifre, u proizvoljnom pravcu (recimo sleva nadesno) grupišemo ostale cifre koje slede u grupe od po onoliko cifara koliko cifara ima broj N;
- tako grupisane cifre sada itamo kao brojeve i oni brojevi koji su u intervalu od 1 do N odre uju one elemente iz populacije koje uzimamo u uzorak; ako je uzorak bez ponavljanja, onda eventualno ponovljeni broj u intervalu od 1 do N odbacujemo, a u slu ajuuzorka sa ponavljanjem, uzimamo ga u uzorak.
Primer 4.1.3. Iz populacije koja ima N=50 elemenata izabrati prost slu ajniuzorak veli ine n=8
a) bez ponavljanja, b) sa ponavljanjem.
Rešenje:
Obeležimo sve lanove populacije brojevima 1 do 50. Neka je slu ajno
izabrana cifra u Tablici slu ajnih brojeva, cifra koja se nalazi u šesnaestoj
vrsti i prvoj koloni.
Kako je N=50 dvocifren broj, grupisa emo sve ostale cifre u smeru sleva na
desno u brojeve od po dve cifre. Tako dobijamo
23 23 67 37 51 31 88 88 17 18 06 54 68 32 46 ...
a) u slu aju uzorka bez ponavljanja, u uzorak ulaze oni elementi populacije koji su obeleženi brojevima (23, 37, 31, 17, 18, 06, 32, 46);
b) u slu aju uzorka sa ponavljanjem, u uzorak ulaze oni elementi populacije koji su obeleženi brojevima (23, 23,37, 31, 17, 18, 06, 32).
Poslovna statistika
133
4.2. Raspodele parametara uzoraka
Neka odre eno obeležje u populaciji veli ine N ima slede e parametre: aritmeti ku sredinu koju obeležavamo sa , varijansu koju obeležavamo sa 2 i proporciju koju obeležavamo sa .
Da se podsetimo, ukoliko elementi populacije imaju vrednosti obeležja
Nxxx ,...,, 21 onda je aritmeti ka sredina obeležja u toj populaciji N
xN
i
i
1 ,
a varijansa N
xN
i
i
1
2
2
)(.
Tako e, to obeležje možemo posmatrati i kao slu ajnu promenljivu X, koja uzima vrednosti iz skupa Nxxx ,...,, 21 , sa odre enim verovatno ama, i za koju
onda važi )(XE , i 2)var(X .
Sa proporcijom populacije do sada se nismo susretali, i ona predstavlja verovatno u da odre eni lan populacije ima odre enu osobinu (ili odre enosvojstvo). Odnosno, ako M lanova populacije koja ima N lanova, ima osobinu koje nas interesuje, onda je proporcija te osobine u ovoj populaciji
jednakaN
M.
Na primer, u populaciji od 150 osoba je 90 puša a, pa je proporcija broja
puša a u toj populaciji jednaka 6.0150
90.
Nad ovom populacijom, kao što smo rekli, možemo izabrati Nn prostih
slu ajnih uzoraka veli ine n sa ponavljanjem i n
N prostih slu ajnih uzoraka
veli ine n bez ponavljanja.
U svakom od ovih uzoraka (recimo u i-tom uzorku iji su elementi nxxx ,...,, 21 ,
od kojih m n ima željenu osobinu) možemo izra unati aritmeti ku sredinu i-tog uzorka, varijansu i-tog uzorka i proporciju željene osobine u i-tom uzorku na slede i na in:
Poslovna statistika
134
aritmeti ka sredina i-tog uzorka: n
x
x
n
i
i
i1
__
,
varijansa i-tog uzorka:
ukoliko je aritmeti ka sredina populacije poznata
n
x
s
n
i
i
i1
2
2
)( ,
ukoliko je aritmeti ka sredina populacije nepoznata
1
)(1
2__
2,
n
xx
s
n
i
ii
ic ,
proporcija željene osobine u i-tom uzorku:
n
mpi .
U skupu svih mogu ih prostih slu ajnih uzoraka veli ine n sa i bez ponavljanja, vrednosti za aritmeti ku sredinu (varijansu i proporciju uzoraka) e se pojavljivati sa odre enim verovatno ama, jednakim koli niku broja
uzoraka koji imaju datu vrednost aritmeti ke sredine (varijanse i proporcije uzoraka) i broja svih mogu ih uzoraka.
To zna i da nad skupom svih mogu ih prostih slu ajnih uzoraka veli ine n
možemo definisati slede e slu ajne promenljive:
slu ajna promenljiva aritmeti ka sredina uzorka __
X :
ri
ri
pppp
xxxxX
21
____
2
__
1
____
,
gde je
Poslovna statistika
135
n
i
iN
xjednakasredinaaaritmetickjecijauzorakabrojp
__
(uzorci sa
ponavljanjem);
n
N
xjednakasredinaaaritmetickjecijauzorakabrojp
i
i
__
(uzorci bez
ponavljanja);
slu ajna promenljiva varijansa uzorka:
2S - ukoliko je aritmeti ka sredina populacije poznata
ki
ki
pppp
ssssS
21
2222
212 ,
gde je
n
ii
N
sjednakaijansajecijauzorakabrojp
2var (uzorci sa ponavljanjem);
n
N
sjednakaijansajecijauzorakabrojp i
i
2var (uzorci bez ponavljanja);
Poslovna statistika
136
2cS - ukoliko je aritmeti ka sredina populacije nepoznata
li
lciccc
cpppp
ssssS
21
2,
2,
22,
21,2 ,
gde je
n
ic
iN
sjednakaijansajecijauzorakabrojp
2,var
(uzorci sa ponavljanjem);
n
N
sjednakaijansajecijauzorakabrojp
ic
i
2,var
(uzorci bez ponavljanja);
slu ajna promenljiva proporcija uzorka Pr:
si
si
rqqqq
ppppP
21
21 ,
gde je
n
ii
N
pjednakaproporcijajecijauzorakabrojq (uzorci sa ponavljanjem);
n
N
pjednakaproporcijajecijauzorakabrojq i
i (uzorci bez ponavljanja).
Poslovna statistika
137
Primer 4.2.1. Za datu populaciju 1, 2, 3, 4, odrediti sve uzorke
a) sa ponavljanjem, b) bez ponavljanja,
veli ine n=2 i prikazati raspodelu slu ajne promenljive aritmeti ka sredina
uzorka__
X .
Rešenje:
a) Broj uzoraka sa ponavljanjem veli ine n dobijenih iz populacije veli ine N
iznosi nN . U našem slu aju je n=2, N=4, pa je broj svih uzoraka sa
ponavljanjem jednak 42=16. Ovi uzorci i njihove srednje vrednosti date su u
Tabeli 4.2.1.a.
Redni broj
uzorka (i) Uzorak
Srednja
vrednost
uzorka )(_
ix
Redni broj
uzorka (i) Uzorak
Srednja
vrednost
uzorka
)(_
ix
1 (1,1) 1 9 (3,1) 2
2 (1,2) 1,5 10 (3,2) 2,5
3 (1,3) 2 11 (3,3) 3
4 (1,4) 2,5 12 (3,4) 3,5
5 (2,1) 1,5 13 (4,1) 2,5
6 (2,2) 2 14 (4,2) 3
7 (2,3) 2,5 15 (4,3) 3,5
8 (2,4) 3 16 (4,4) 4
Tabela 4.2.1.a.
Slu ajna promenljiva aritmeti ka sredina uzorka sa ponavljanjem X ima
slede u raspodelu verovatno a
16
1
16
2
16
3
16
4
16
3
16
2
16
1
45,335,225,11:X ,
dobijenu iz tablice 4.2.1.a.
Poslovna statistika
138
b) Broj uzoraka bez ponavljanja veli ine n dobijenih iz populacije veli ine N
iznosin
N. U našem slu aju je n=2, N=4, pa je broj svih uzoraka sa
ponavljanjem jednak .62
4 Ovi uzorci i njihove srednje vrednosti date su u
Tabeli 4.2.1.b.
Redni broj
uzorka (i) Uzorak
Srednja
vrednost
uzorka )(_
ix
Redni broj
uzorka (i) Uzorak
Srednja
vrednost
uzorka
)(_
ix
1 (1,2) 1,5 4 (2,3) 2,5
2 (1,3) 2 5 (2,4) 3
3 (1,4) 2,5 6 (3,4) 3,5
Tabela 4.2.1.b.
Slu ajna promanljiva aritmeti ka sredina uzorka bez ponavljanja X ima
slede u raspodelu verovatno a
6
1
6
1
6
2
6
1
6
1
5,335,225,1:X ,
dobijenu iz tablice 4.2.1.b.
U nekim okolnostima raspodele ovih slu ajnih promenljivih, koje u stvari predstavljaju parametre uzorka, podležu zakonitostima koje smo obradili u poglavlju 3. ovog udžbenika. Odredimo te okolnosti i raspodele po kojima se tada ponašaju ovi parametri uzoraka.
Poslovna statistika
139
4.2.1. Raspodela aritmeti ke sredine uzoraka __
X
Za matemati ko o ekivanje )(__
XE i varijansu )var(__
X slu ajne promenljive
aritmeti ka sredina uzorka __
X , formirane nad uzorcima veli ine n, iz populacije u kojoj je aritmeti ka sredina obeležja i varijansa obeležja 2
:
ri
ri
pppp
xxxxX
21
____
2
__
1
____
gde r predstavlja broj razli itih aritmeti kih sredina uzoraka iz skupa aritmeti kih sredina svih uzoraka, važi slede e:
- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez ponavljanja
kod kojih je 05.0N
n)
nN
x
pxX
N
x
pxXE
n
N
i
ir
i
ii
n
N
i
ir
i
ii
n
n
21
2__
1
2____
1
__
1
____
)()()var(
)(
- ako su uzorci bez ponavljanja kod kojih je 05.0N
n
Poslovna statistika
140
1
)()()var(
)(
21
2__
1
2____
1
__
1
____
N
nN
n
n
N
x
pxX
n
N
x
pxXE
nN
i
ir
i
ii
nN
i
ir
i
ii
Primer 4.2.1.1. Pokazati da u Primeru 4.2.1. važi
a) da je n
XiXEX
22
_
var ,
b) da je 1
var2
2_
N
nN
nXiXE
X
,
gde su i 2 aritmeti ka sredina i varijansa populacije respektivno.
Rešenje:
Srednja vrednost i varijansa populacije iznose
5,24
4321
4
5
4
5,245,235,225,21 22222 ,
pa je imaju i u vidu rezultate Primera 4.2.1.
Poslovna statistika
141
a)
.)(
5,216
14
16
25,3
16
33
16
45,2
16
32
16
25,1
16
11
)(7
1
_
XE
dakle
pxXEi
ii
8
55,2
16
14
16
25,3
16
33
16
45,2
16
32
16
25,1
16
11
)var(
2222
2222
222 XEXEXX
Kako je
n
jetoni
X
22
2
24
5
24
5
Poslovna statistika
142
b)
.)(
5,26
15,3
6
13
6
25,2
6
12
6
15,1
)(5
1
_
XE
dakle
pxXEi
ii
.114
24
24
5
12
55,2
6
15,3
6
13
6
25,2
6
12
6
15,1
)var(
22
222222
222
N
nN
n
odnosno
XEXEX
X
X
Raspodela slu ajne promenljive aritmeti ka sredina uzorka __
X može se odrediti u zavisnosti od raspodele samog obeležja u populaciji na slede i na in:
i) ako posmatrano obeležje u populaciji ima N( ,2) raspodelu, onda:
- ako je 2populacije poznato,
- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez
ponavljanja kod kojih je 05.0N
n),
onda
),(~2__
nNX ,
Poslovna statistika
143
- ako su uzorci bez ponavljanja kod kojih je 05.0N
n,
onda
)1
,(~2__
N
nN
nNX ;
- ako je 2populacije nepoznato,
- ako je poznato,
- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez
ponavljanja kod kojih je 05.0N
n) ,
onda
nt
n
S
X~
__
;
- ako su uzorci bez ponavljanja kod kojih je 05.0N
n ,
onda
nt
N
nN
n
S
X~
1
__
;
- ako je nepoznato,
- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez
ponavljanja kod kojih je 05.0N
n) ,
onda
Poslovna statistika
144
1
__
~ n
c
t
n
S
X ;
- ako su uzorci bez ponavljanja kod kojih je 05.0N
n,
onda
1
__
~
1
n
c
t
N
nN
n
S
X ;
ii) ako posmatrano obeležje u populaciji nema N( ,2) raspodelu,
onda aproksimativno važi:
- ako su uzorci sa ponavljanjem (ili N ),
uzimamo dovoljno veliki uzorak pod kojim podrazumevamo uzorak veli ine n 30 i za njega važe svi rezultati kao i uslu aju kad obeležje u populaciji imaN( ,
2) raspodelu;
- ako su uzorci bez ponavljanja,
uzimamo dovoljno veliki uzorak iz dovoljne velike populacije, pod kojim podrazumevamo uzorak veli ine
n 30 i populaciju za koju je 2
Nn , i za njega važe svi
rezultati kao i uslu aju kada obeležje u populaciji imaN( ,
2) raspodelu.
Prisetimo se da za n 30 možemo raspodelu tn dovoljno dobro aproksimirati N(0,1) raspodelom.
Poslovna statistika
145
Primer 4.2.1.2.
a) Pakovanja jedne vrste robe imaju težinu u proseku 50 kg i standardnu devijaciju 0.5 kg. Odrediti verovatno u da eprose na težina 250 pakovanja ove robe biti manja od 49.95 kg.
b) 1000 pakovanja jedne vrste robe imaju težinu u proseku 50 kg i standardnu devijaciju 0.5 kg. Odrediti verovatno u da eprose na težina slu ajno izabranih 250 od ovih 1000 pakovanja biti manja od 49.95 kg.
Rešenje:
a) Kako su podaci o prose noj težini kg50 i standardnoj devijaciji
kg5.0 odnose na beskona nu populaciju, i kako je veli ina uzorka
n=250>30, to slu ajna promenljiva prose na težina uzorka _
X ima približno
nN
2
, raspodelu, pa važi:
0571,09429,01)58,1(1)58,1(
250
5.05095.49
95.49_
FZP
n
XPXP
b) Kako su podaci o prose noj težini kg50 i standardnoj devijaciji
kg5.0 odnose na kona nu populaciju veli ine N=1000, i kako je veli ina
uzorka n=250>30 i 5002
25005,025,0N
niN
n , to slu ajna
promenljiva prose na težina uzorka _
X ima približno
1,
2
N
nN
nN raspodelu, pa važi:
Poslovna statistika
146
0344,09656,01)82,1(1)82,1(
11000
2501000
250
5.0
5095.49
1
95.49_
FZP
N
nN
n
XPXP
4.2.2. Raspodela razlike aritmeti kih sredina uzoraka, 2
__
1
__
XX
Ukoliko uzimamo nezavisne uzorke veli ine n1 i n2 iz dve populacije, gde u prvoj populaciji obeležje X1 ima parametre 2
1111 )var()( XiXE , a u
drugoj populaciji obeležje X2 ima parametre 22222 )var()( XiXE , onda
slu ajna promenljiva razlika aritmeti kih sredina uzoraka, 2
__
1
__
XX , ima
parametre 212
__
1
__
)( XXE i 2
22
1
21
2
__
1
__
)var(nn
XX .
Tako e važi:
- ako ),(~),(~ 2222
2111 NXiNX ,
onda
2
22
1
21
212
__
1
__
,~nn
NXX ;
- ako ne znamo zakon raspodele obeležja X1 i X2 ,
onda aproksimativno važi:
ako je n1 30 i n2 30 , tada:
2
22
1
21
212
__
1
__
,~nn
NXX .
Poslovna statistika
147
Zadatak 4.2.2. Baterije iz fabrike A imaju srednje vreme trajanja 200 asova i standardno odstupanje 30 asova, dok iz fabrike B srednje vreme trajanja 180 asova i standardno odstupanje 20 asova. Ako izaberemo 250 baterija iz fabrike A i 200 baterija iz
fabrike B, kolika je verovatno a da e srednje vreme trajanja baterija iz fabrike A biti duže bar 25 asova od srednjeg vremena trajanja baterija iz fabrike B?
4.2.3. Raspodela proporcije uzoraka Pr
Za matemati ko o ekivanje )( rPE i varijansu )var( rP slu ajne promenljive
proporcija uzorka rP , formirane nad uzorcima veli ine n, iz populacije u kojoj
je proporcija obeležja :
si
si
rqqqq
ppppP
21
21 ,
gde s predstavlja broj razli itih proporcija uzoraka iz skupa proporcija svih uzoraka, važi slede e:
- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez ponavljanja
kod kojih je 05.0N
n):
nN
p
qpP
N
p
qpPE
n
N
i
is
i
iir
n
N
i
is
i
iir
n
n
1)(
)()var(
)(
1
2
1
2
1
1
Poslovna statistika
148
- ako su uzorci bez ponavljanja kod kojih je 05.0N
n:
1
1)(
)()var(
)(
1
2
1
2
1
1
N
nN
n
n
N
p
qpP
n
N
p
qpPE
nN
i
is
i
iir
nN
i
is
i
iir
Ukoliko se radi o uzorcima sa ponavljanjem (ili N ), onda slu ajnapromenljiva proporcija uzorka rP podleže zakonu binomne raspodele, a ukoliko se radi o uzorcima bez ponavljanja, onda slu ajna promenljiva proporcija uzorka rP podleže zakonu hipergeometrijske raspodele, sa gore navedenim parametrima.
Ukoliko je veli ina uzorka takva da je 515 nin , tada aproksimativno važi slede e:
- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez ponavljanja
kod kojih je 05.0N
n), onda
)1
,(~n
NPr ;
- ako su uzorci bez ponavljanja kod kojih je 05.0N
n onda
)1
1,(~
N
nN
nNPr .
Poslovna statistika
149
Primer 4.2.3.1.
a) Poznato je da je u zdravstvu 65% zaposlenih ženskog pola. Na slu ajan na in je izabrano 50 osoba koje su zaposlene u zdravstvu. Kolika je verovatno a da je me u njima više od 35 žena?
b) U grupi od 800 osoba zaposlenih u zdravstvu 520 su ženskog pola. Iz te grupe na slu ajan na in je izabrano 50 osoba. Kolika je verovatno ada je me u njima više od 35 žena?
Rešenje:
a) Kako se podatak o proporciji žena u zdravstvu =0,65 odnosi na
beskona nu populaciju, i kako je 55.3265,050n i
55.1735,0501n , to slu ajna promenljiva proporcija žena u
uzorku Pr ima približno n
N1
, raspodelu, pa važi
.2296,07704,01)74,0(174,0
50
35,065,0
65,050
35
150
35
FZP
n
PPPP r
r
b) Kako se podatak o proporciji žena u zdravstvu 65,0800
520
odnosi na kona nu populaciju N=800 i kako je 55.3265,050n i
55.1735,0501n i 05,00625,0800
50
N
nto slu ajna
promenljiva proporcija žena u uzorku Pr ima približno
1
1,
N
nN
nN raspodelu, pa važi
Poslovna statistika
150
.2236,07764,01)76,0(176,0
1800
50800
50
35,065,0
65,050
35
1
150
35
FZP
N
nN
n
PPPP r
r
4.2.4. Raspodela varijanse uzoraka, 2S - poznato, 2cS - nepoznato
Ukoliko se slu ajna promenljiva X u populaciji raspodeljuje po zakonu N( ,2)
onda u slu aju kada je:
- poznato
za slu ajnu promenljivu varijansa uzorka 2S važi:
- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez
ponavljanja kod kojih je 05.0N
n), onda
22
2
~ n
Sn ;
- ako su uzorci bez ponavljanja kod kojih je 05.0N
n, onda
aproksimativno važi:
ako je n 30 i2
Nn , tada
22
2
~ n
Sn ;
Poslovna statistika
151
- nepoznato
za slu ajnu promenljivu varijansa uzorka 2cS važi:
- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez
ponavljanja kod kojih je 05.0N
n), onda
212
2
~)1(
ncSn
;
-ako su uzorci bez ponavljanja kod kojih je 05.0N
n, onda
aproksimativno važi:
ako je n 30 i2
Nn , tada
212
2
~)1(
ncSn
.
Zadatak 4.2.4. a) Iz populacije iji su parametri 5150 2i , uzet je prost
slu ajni uzorak veli ine n=11. Kolika je verovatno a da je varijansa tog uzorka manja od 9?
b) Iz populacije iji je parametar 502 , uzet je prost slu ajniuzorak veli ine n=11. Kolika je verovatno a da je varijansa tog uzorka manja od 20?
Poslovna statistika
152
5. STATISTI KO OCENJIVANJE
Suština analize uzoraka neke populacije ogleda se upravo u tome da se iz što manje uzoraka (obi no iz jednog) dobiju zadovoljavaju e informacije o ponašanju obeležja u itavoj populaciji. To ponašanje obeležja u itavojpopulaciji je zadovoljavaju e opisano analizom uzorka, ukoliko su analizom tog uzorka dovoljno dobro procenjeni parametri populacije (aritmeti kasredina, proporcija, varijansa) i ukoliko je dovoljno dobro procenjen zakon raspodele tog obeležja u populaciji.
Analiza uzorka pomo u koje se procenjuju parametri populacije naziva se parametarska analiza i ona e u nekom obimu biti obra ena u ovom udžbeniku.
Analiza uzorka pomo u koje se procenjuje zakon raspodele obeležja u populaciji naziva se neparametarska analiza i ona ne e biti obra ena u ovom udžbeniku.
Parametarska analiza se vrši na dva na ina, u zavisnosti od raspoloživih informacija o populaciji.
Prvi na in, koji se zove statisti ko ocenjivanje, primenjuje se u slu ajevima kada parametri populacije nisu poznati, pa ih iz uzetog uzorka procenjujemo, odnosno ocenjujemo. Ovaj na in emo obraditi u ovom 5. poglavlju udžbenika.
Drugi na in, koji se zove testiranje parametarskih statisti kih hipoteza,primenjuje se u slu ajevima kada su parametri populacije bili poznati, pa iz uzetog uzorka proveravamo da li su se promenili i u kom smeru je promena išla, odnosno da li su se pova ali ili smanjili. Ovaj na in emo obraditi u 6. poglavlju ovog udžbenika.
U postupku statisti kog ocenjivanja zaklju ak o nepoznatoj vrednosti parametra populacije koji ocenjujemo možemo dati u vidu jedne brojne vrednosti i tada se ta ocena zove ta kasta ocena, ili u vidu intervala mogu ihvrednosti i tada se ta ocena zove intervalna ocena.
Poslovna statistika
153
5.1 Ta kaste ocene
Obeležimo sa Q parametar populacije koji želimo da ocenimo (aritmeti kasredina, proporcija, varijansa...) pomo u neke ta kaste ocene dobijene iz prostog slu ajnog uzorka veli ine n. Neka je populacija okarakterisana slu ajnom promenljivom X koja uzima vrednosti iz skupa Nxxx ,...,, 21 i neka
je uzorak uzeo vrednosti nxxx ,...,, 21 . Obeležimo sa Un vrednost ocene
parametra Q izra unate iz uzorka ije su vrednosti nxxx ,...,, 21 . O igledno da
e vrednost ocene Un zavisiti od vrednosti nxxx ,...,, 21 , odnosno zavisi e od
izabranog uzorka. Dakle, na konkretnom uzorku ije su vrednosti nxxx ,...,, 21 ,
ocena Un je neka funkcija od nxxx ,...,, 21 , ),...,,( 21 nn xxxfU .
Ako bismo izvla ili više uzoraka od n elemenata, elementi koji su prvi izvu eni u svakom uzorku, a to su oni ozna eni indeksom 1, u razli itim uzorcima bi uzimali razli ite vrednosti sa razli itim verovatno ama, pa sve te vrednosti definišu jednu slu ajnu promenljivu koju emo obeležiti sa X1.Sli no, elementi koji su u više uzoraka izabrani na drugom mestu obrazuju slu ajnu promenljivu X2 itd. Na taj na in ocena U je funkcija n-dimenzionalne slu ajne promenljive (X1, X2, ..., Xn), U = f(X1, X2, ..., Xn), pa i sama predstavlja slu ajnu promenljivu sa nekom svojom raspodelom verovatno a.
Kako postoji beskona no veliki broj funkcija koje možemo definisati na promenljivima (X1, X2, ..., Xn), prirodno je definisati ocenu U na slede i na in:
ocenom parametra Q naziva se funkcija U=f(X1, X2, ..., Xn), koja sa verovatno om bliskom jedinici zadovoljava približnu jednakost U Q kada je brojnost uzorka dovoljno velika, to jest ako važi
nNn
CQUP 1lim ,
gde je C odre ena pozitivna konstanta.
Ova definicija dopušta da se na mnogo na ina definišu razne ocene za isti parametar Q. Na primer, aritmeti ku sredinu populacije možemo oceniti i aritmeti kom sredinom, i medijanom, i modom, i geometrijskom sredinom uzorka, itd. Ali, neke od ovih ocena ta nije ocenjuju parametar populacije od
Poslovna statistika
154
drugih. O igledno je da je ocena utoliko bolja ukoliko za manje vrednosti konstante C zadovoljava jednakost
nNn
CQUP 1lim .
U cilju nalaženja najefikasnije ocene parametra populacije Q, neophodno je izvršiti slede u klasifikaciju ocena:
- Saglasne (konzistentne) ocene. Saglasna (konzistentna) je ona ocena U=f(X1,X2,...,Xn) parametra populacije Q za koju važi
1)(lim0 QUP
nNn
.
Odnosno, ocena je saglasna (konzistentna) ako konvergira u verovatno i ka parametru koga ocenjuje kada broj elemenata uzorka raste.
- Centrirana (nepristrasna) ocena. Ocena U=f(X1,X2,...,Xn) parametra populacije Q je centrirana (saglasna) ako važi
QUE )( ,
to jest, ocena je centrirana (saglasna) ako je njeno matemati ko o ekivanjejednako parametru populacije koga ocenjuje.
- Najefikasnija ocena. Najefikasnija ocena je ona saglasna i centrirana
ocena koja ima najmanju varijansu.
Donja granica varijansi svih mogu ih ocena U parametra Q odre ena je nejednakoš u Rao-Kramera, koju ovde ne emo navoditi.
Za primenu su, naravno, najpogodnije najefikasnije ocene, ali one ne postoje uvek. U slu ajevima kada ih nema treba ispitati da li postoje asimptotski nejefikasnije ocene.
- Asimptotski najefikasnija ocena. Ukoliko ocena U0 ima najmanju mogu uvarijansu odre enu nejednakoš u Rao-Kramera, (a nije najefikasnija jer nije
Poslovna statistika
155
saglasna ili centrirana), onda za ocenu U koja je saglasna i centrirana kažemo da je asimptotski najefikasnija ukoliko važi:
1)var(
)var(lim 0
U
U
nNn
.
Pokazuje se da važi slede e:
1. Najefikasnija ocena za aritmeti ku sredinu populacije je aritmeti ka
sredina uzorka __
X , ija je realizacija na uzorku nxxx ,...,, 21 jednaka
n
x
x
n
i
i
1__
.
2. Najefikasnija ocena za proporciju populacije je proporcija uzorka Pr
ija je realizacija na uzorku od n elemenata me u kojima je m sa
osobinom iju proporciju ocenjujemo jednaka n
mpr .
3. Najefikasnija ocena za parametar populacije u kojoj obeležje podleže Puasonovoj P( ) raspodeli je aritmeti ka sredina realizovanih vrednosti parametra i u uzorku. Dakle, ako ocenu parametra populacije
, ozna imo sa oc, onda je na uzorku n,...,, 21 najefikasnija ocena
n
n
i
i
oc1 .
4. Asimptotski najefikasnija ocena za varijansu populacije 2, ija je aritmeti ka sredina -poznata je varijansa uzorka S2, ija je realizacija
na uzorku nxxx ,...,, 21 jednaka n
x
s
n
i
i
1
2
2
)(.
Poslovna statistika
156
5. Asimptotski najefikasnija ocena za varijansu populacije 2, ija je aritmeti ka sredina -nepoznata, je varijansa uzorka Sc
2, ija je
realizacija na uzorku nxxx ,...,, 21 jednaka 1
)(1
2__
2
n
xx
s
n
i
i
c .
Poslovna statistika
157
5.2. Intervalne ocene
Intervalna ocena parametra populacije Q predstavlja interval vrednosti u kome sa odre enom verovatno om o ekujemo da se nalazi parametar populacije Q, i to takav interval da je verovatno a da je vrednost parametra Q ve a od gornje granice intervala, jednaka verovatno i da je vrednost parametra Q manja od donje granice intervala. Takav interval nazivamo simetri an interval u pogledu
verovatno e.
Taj interval vrednosti predstavlja interval oko neke fiksne vrednosti izra unateiz konkretnog uzorka. Ta fiksna vrednost je obi no ta kasta ocena parametra iju intervalnu ocenu tražimo, odnosno parametra Q.
Verovatno a da se parametar Q nalazi u tom intervalu iznosi 1- i zovemo je koeficijent pouzdanosti intervalne ocene. Dakle, ako interval (a,b) predstavlja intervalnu ocenu za parametar Q sa koeficijentom pouzdanosti 1- , to zna i da važi slede e:
.2
)()(
1)(
bQPaQP
bQaP
O igledno da pove anje koeficijenta pouzdanosti pove ava širinu intervala, što sa svoje strane smanjuje preciznost, odnosno prakti nu upotrebljivost ocene.
Intervalne ocene parametra Q iz uzorka odre ujemo na osnovu zakonitosti po kojima se ta kasta ocena tog parametra U raspodeljuje u skupu svih mogu ihuzorka tog tipa uzetih iz populacije sa parametrom Q. Zakone raspodele koji su nam potrebni u ovom delu, analizirali smo u poglavlju 4. ovog udžbenika.
Poslovna statistika
158
5.2.1. Intervalna ocena aritmeti ke sredine populacije,
Kako je ta kasta ocena aritmeti ke sredine populacije , aritmeti ka
sredina uzorka __
X ija je raspodela data u 4. poglavlju, važi slede e:
j) ako posmatrano obeležje u populaciji ima N( ,2) raspodelu, onda:
- ako je 2populacije poznato:
- ako su uzorci sa ponavljanjem (ili N , ili uzorci
bez ponavljanja kod kojih je 05.0N
n),
onda:
),(~2__
nNX odnosno )1,0(~
__
N
n
X,
pa važi videti Sliku 5.2.1.1.
0
0.25
0.5
dnorm x 0 1( )
x
Slika 5.2.1.1. Funkcija raspodele N(0,1)
1-
2
z
2
2
z
Poslovna statistika
159
1)(
1)(
2
__
2
__
2
__
2
nzx
nzxP
z
n
xzP
Dakle, pod ovim uslovima simetri na intervalna ocena aritmeti ke sredine populacije sa koeficijentom pouzdanosti 1- je:
),(2
__
2
__
nzx
nzx .
Pod ovim uslovima možemo unapred odrediti veli inuuzorka n, pomo u koga emo dobiti interval ocene širine
L, sa nivoom pouzdanosti 1- . Naime, važi
2
2
2
2
2 L
z
nn
zL
- ako su uzorci bez ponavljanja kod kojih je
05.0N
n, onda:
)1
,(~2__
N
nN
nNX odnosno )1,0(~
1
__
N
N
nN
n
X,
pa važi videti Sliku 5.2.1.1.
Poslovna statistika
160
1)11
(
1)
1
(
2
__
2
__
2
__
2
N
nN
nzx
N
nN
nzxP
z
N
nN
n
xzP
Dakle, pod ovim uslovima simetri na intervalna ocena aritmeti ke sredine populacije sa koeficijentom pouzdanosti 1- je:
)1
,1
(2
__
2
__
N
nN
nzx
N
nN
nzx .
- Ako je 2populacije nepoznato:
ako je poznato, besmisleno je tražiti interval poverenja za ;
ako je nepoznato,
- ako su uzorci sa ponavljanjem (ili N , ili uzorci
bez ponavljanja kod kojih je 05.0N
n), onda:
1
__
~ n
c
t
n
S
X, pa važi videti Sliku 5.2.1.2.
Poslovna statistika
161
0
0.25
0.5
dnorm x 0 1( )
x
Slika 5.2.1.2. Funkcija raspodele tn-1
1)(
1)(
2,1
__
2,1
__
2,1
__
2,1
n
stx
n
stxP
t
n
s
xtP
c
n
c
n
nc
n
Dakle, pod ovim uslovima simetri na intervalna ocena aritmeti ke sredine populacije sa koeficijentom pouzdanosti 1- je:
),(2
,1
__
2,1
__
n
stx
n
stx c
n
c
n.
- Ako su uzorci bez ponavljanja kod kojih je
05.0N
n, onda :
1-
2,1n
t
2
2,1nt
Poslovna statistika
162
1
__
~
1
n
c
t
N
nN
n
S
X, pa važi videti Sliku 5.2.1.2.
1)11
(
1)
1
(
2,1
__
2,1
__
2,1
__
2,1
N
nN
n
stx
N
nN
n
stxP
t
N
nN
n
s
xtP
c
n
c
n
nc
n
Dakle, pod ovim uslovima, simetri na intervalna ocena aritmeti ke sredine populacije sa koeficijentom pouzdanosti 1- je:
)1
,1
(2
,1
__
2,1
__
N
nN
n
stx
N
nN
n
stx c
n
c
n.
iii) Ako posmatrano obeležje u populaciji nema N( ,2) raspodelu,
onda aproksimativno važi:
- ako su uzorci sa ponavljanjem (ili N ),
uzimamo dovoljno veliki uzorak pod kojim podrazumevamo uzorak veli ine n 30 i za njega važe svi rezultati kao i uslu aju kada obeležje u populaciji ima N( ,
2) raspodelu;
- ako su uzorci bez ponavljanja,
uzimamo dovoljno veliki uzorak iz dovoljne velike populacije, pod kojim podrazumevamo uzorak veli ine
Poslovna statistika
163
n 30 i populaciju za koju je 2
Nn , i za njega važe svi
rezultati kao i uslu aju kada obeležje u populaciji imaN( ,
2) raspodelu.
Primer 5.2.1. Poznato je da broj poena studenata na ispitu ima N( ,2)
raspodelu gde je parametar nepoznat. Slu ajan uzorak od 20 studenata uzet iz ogromne populacije, ima na ovom ispitu srednji broj poena 70 i na njemu je izra unata centrirana varijansa uzorka sc=10. Odrediti interval poverenja za srednji broj poena svih zadataka na ovom ispitu, ako je koeficijent pouzdanosti 1- jednak: 1- =0,99.
Rešenje:
Kako broj poena ima normalnu raspodelu sa nepoznatom varijansom i kako je
populacija ogromna, odnosno uzorak je manji od 5% populacije, to za
proizvoljan koeficijent pouzdanosti 1- važi:
12
,1
_
2,1
_
n
stx
n
stxP c
nc
n gde vrednost 2
,1nt itamo iz
Studentove t-tablice za n-1 stepeni slobode kao 22
,11
nn ttP . U ovom
slu aju broj stepeni slobode je 19.
Dakle, interval poverenja za srednji broj poena svih zadataka iznosi:
za 86,2005,02
99,01 005,0,19t , pa je
20
1086,270
20
1086,270 ,
odnosno
395.76605.63 .
Poslovna statistika
164
5.2.2. Intervalna ocena razlike aritmeti kih sredina populacija, 21
Za nezavisne uzorke veli ine n1 i n2 iz dve populacije gde u prvoj populaciji obeležje X1 ima parametre 2
1111 )var()( XiXE , a u drugoj populaciji
obeležje X2 ima parametre 22222 )var()( XiXE , važi:
- ako ),(~),(~ 2222
2111 NXiNX
onda:
2
22
1
21
212
__
1
__
,~nn
NXX , odnosno
)1,0(~)(
2
22
1
21
212
__
1
__
N
nn
XX, pa važi videti Sliku 5.2.1.1.
1)(
1))(
(
2
22
1
21
2
2
__
1
__
212
22
1
21
2
2
__
1
__
2
2
22
1
21
212
__
1
__
2
nnzxx
nnzxxP
z
nn
xxzP
Dakle, pod ovim uslovima simetri na intervalna ocena razlike aritmeti kihsredina ovih populacija sa koeficijentom pouzdanosti 1- je:
),(2
22
1
21
2
2
__
1
__
2
22
1
21
2
2
__
1
__
21nn
zxxnn
zxx .
Poslovna statistika
165
- Ako ne znamo zakon raspodele obeležja X1 i X2,
onda aproksimativno važi:
ako je n1 30 i n2 30, tada
2
22
1
21
212
__
1
__
,~nn
NXX , pa i tada važi da je simetri na
intervalna ocena razlike aritmeti kih sredina ovih populacija sa koeficijentom pouzdanosti 1- jednaka:
),(2
22
1
21
2
2
__
1
__
2
22
1
21
2
2
__
1
__
21nn
zxxnn
zxx .
Poslovna statistika
166
Primer 5.2.2. Testira se u inak novih lekova za spavanje pomo u dve grupe bolesnika sli nih karakteristika, tako što prva grupa od 50 bolesnika uzima ove lekove, dok ih druga grupa od 60 bolesnika ne uzima. Dužina spavanja bolesnika iz prve grupe je prose no 8.2 asova, a u drugoj 7.3 asova. Zna se da standardna devijacija dužine spavanja prve grupe bolesnika iznosi
30,01 asova, dok je standardna devijacija druge grupe bolesnika
40,02 asova. Odrediti interval poverenja za razliku srednjih vrednosti dužina spavanja koju prouzrokuje uzimanje ispitivanih lekova, ako je koeficijent pouzdanosti 1- jednak 0,95.
Rešenje:
Kako n1>30 i n2>30, to za proizvoljan koeficijent pouzdanosti 1- važi:
12
22
1
21
2
2
_
1
_
212
22
1
21
2
2
_
1
_
nnZxx
nnZxxP
gde vrednost 2
Z itamo iz tablice za N(0,1) raspodelu kao 2
12
ZF .
Dakle, interval poverenja za razliku srednjih vrednosti dužine spavanja iznosi:
za 96,1)975,0(025,02
95,012
FZ pa je
60
40,0
50
30,096,137.72.8
60
40,0
50
30,096,13.72.8
22
21
22
odnosno
967.0833.0 21 ,
tj. sa verovatno om 0,95 smatramo da je novi lek produžio spavanje u proseku
za 0.833 do 0.967 asova.
Poslovna statistika
167
5.2.3. Intervalna ocena proporcije populacije
Ukoliko su veli ina uzorka n i realizovana proporcija na uzorku pr takvi da je 3051,5 nipnpn rr , tada aproksimativno važi slede e:
-ako su uzorci sa ponavljanjem (ili N , ili uzorci bez ponavljanja
kod kojih je 05.0N
n), onda:
)1
,(~n
ppNP rr
r odnosno )1,0(~1
N
n
pp
P
rr
r ,
pa važi videti Sliku 5.2.1.1.
1)11
(
1)1
(
22
22
n
ppzp
n
ppzpP
z
n
pp
pzP
rrr
rrr
rr
r
Dakle, pod ovim uslovima, simetri na intervalna ocena proporcije populacije sa koeficijentom pouzdanosti 1- je:
)1
,1
(22 n
ppzp
n
ppzp rr
rrr
r .
Pod ovim uslovima možemo unapred odrediti veli inu uzorka n, pomo ukoga emo dobiti interval ocene proporcije, širine L, sa nivoom pouzdanosti 1- . Naime, važi:
Poslovna statistika
168
2
2
2
2
)1(1
L
ppz
nn
ppzL
rr
rr , a kako je
4
11 rr pp , to je
2
2
2
4 L
z
n .
- Ako su uzorci bez ponavljanja kod kojih je 05.0N
n, onda:
)1
1,(~
N
nN
n
ppNP rr
r , odnosno
)1,0(~
1
1N
N
nN
n
pp
P
rr
r ,
pa važi videti Sliku 5.2.1.1.
1)1
1
1
1(
1)
1
1(
22
22
N
nN
n
ppzp
N
nN
n
ppzpP
z
N
nN
n
pp
pzP
rrr
rrr
rr
r
Dakle, pod ovim uslovima simetri na intervalna ocena proporcije populacije sa koeficijentom pouzdanosti 1- je:
)1
1,
1
1(
22 N
nN
n
ppzp
N
nN
n
ppzp rr
rrr
r .
Poslovna statistika
169
Zadatak 5.2.3. U uzorku od 80 bolesnika od tuberkoloze, uzetog iz skupa od 500 bolesnika, ima 52 puša a. Odrediti interval poverenja za broj puša a u ovom skupu od 300 obolelih, ako je koeficijent pouzdanosti 1- jednak 0,90.
Poslovna statistika
170
5.2.4. Intervalna ocena varijanse populacije, 2
Ukoliko se slu ajna promenljiva X u populaciji raspodeljuje po zakonu N( ,
2), onda u slu aju kada je:
- poznato
za slu ajnu promenljivu varijansa uzorka 2S važi:
- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez
ponavljanja kod kojih je 05.0N
n), onda:
22
2
~ n
Sn , pa važi videti Sliku 5.2.4.1.
0 2 4 6 8 10 12 14 16 18 200
0.05
0.1
0.15
dchisq x 7( )
x
5.2.4.1. Funkcija raspodele 2n
22
1
2
21,n
2
2,n
Poslovna statistika
171
1)(
1)(
2
21,
22
2
2,
2
2
2,2
22
21,
nn
nn
SnSnP
SnP
Dakle, pod ovim uslovima simetri na intervalna ocena varijanse populacije sa koeficijentom pouzdanosti 1-je:
2
21,
2
2
2,
22 ,
nn
SnSn.
- Ako su uzorci bez ponavljanja kod kojih je 05.0N
n, onda
aproksimativno važi:
ako je n 30 i2
Nn , tada
22
2
~ n
Sn, pa i tada važi da je
simetri na intervalna ocena varijanse populacije sa koeficijentom pouzdanosti 1- jednaka:
2
21,
2
2
2,
22 ,
nn
SnSn.
Poslovna statistika
172
- nepoznato
za slu ajnu promenljivu varijansa uzorka 2cS važi:
- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez
ponavljanja kod kojih je 05.0N
n), onda:
212
2
~)1(
ncSn
, pa važi videti Sliku 5.2.4.1.
1))1()1(
(
1))1(
(
2
21,1
22
2
2,1
2
2
2,12
22
21,1
n
c
n
c
n
c
n
SnSnP
SnP
Dakle, pod ovim uslovima simetri na intervalna ocena varijanse populacije sa koeficijentom pouzdanosti 1- je:
2
21,1
2
2
2,1
22 )1(
,)1(
n
c
n
c SnSn.
- Ako su uzorci bez ponavljanja kod kojih je 05.0N
n, onda
aproksimativno važi:
ako je n 30 i2
Nn , tada
212
2
~)1(
ncSn
, pa i tada važi da je
Poslovna statistika
173
simetri na intervalna ocena varijanse populacije sa koeficijentom pouzdanosti 1- jednaka:
2
21,1
2
2
2,1
22 )1(
,)1(
n
c
n
c SnSn.
Zadatak 5.2.4. Centrirana ocena varijanse nekog obeležja iz uzorka veli inen=17, uzetog iz ogromne populacije u kojoj obeležje ima N( ,
2) raspodelu,
gde je nepoznato, iznosi .6251
1
2_
2
n
xx
s
n
i
i
c Odrediti interval
poverenja za varijansu datog obeležja na itavoj populaciji, ako je koeficijent pouzdanosti 1- jednak 0,99.
Poslovna statistika
174
6. TESTIRANJE PARAMETARSKIH STATISTI KIH HIPOTEZA
Kao što je ve re eno, testiranje parametarskih statisti kih hipoteza se primenjuje u slu ajevima kada su parametri populacije bili poznati, pa iz uzetog uzorka proveravamo da li su se promenili, to jest u kom smeru je promena izvršena, odnosno da li su se pove ali ili smanjili.
Obeležimo sa Q parametar populacije koji želimo da testiramo pomo u neke informacije dobijene iz jednog prostog slu ajnog uzorka veli ine n. Ta informacija je obi no ta kasta ocena parametra Q koja je izra unata na tom jednom prostom slu ajnom uzorku veli ine n, a koju, kao što smo rekli u poglavlju 5, obeležavamo sa Un, ),...,,( 21 nn xxxfU .
Zaklju ak testiranja izvodimo na osnovu poznavanja zakona raspodele slu ajnepromenljive U=f(X1,X2,...,Xn), koja je ta kasta ocena parametra Q (poglavlje 5) i njene vrednosti Un, ),...,,( 21 nn xxxfU , konkretno realizovane na tom
jednom prostom slu ajnom uzorku veli ine n.
Postupak testiranja parametarskih statisti kih hipoteza zapo injemo formiranjem nulte (obeležava emo je sa H0) i alternativne (obeležava emo je
sa H1) hipoteze.
Nulta i alternativna hipoteza predstavljaju dve pretpostavke o skupu vrednosti parametra populacije Q, koje su me u sobom disjunktne, a ija unija predstavlja skup svih mogu ih vrednosti testiranog parametra Q.
Nulta hipoteza H0 je pretpostavka o skupu vrednosti parametra Q koju želimo da osporimo.
Alternativna hipoteza H1 je pretpostavka o skupu vrednosti parametra Q koju želimo da dokažemo.
Nulta i alternativna hipoteza javljaju se u slede a tri oblika:
Poslovna statistika
175
1. Dvosmerna hipoteza. Nulta hipoteza pretpostavlja da je parametar Qjednak nekoj hipoteti koj (od ranije poznatoj) vrednosti Q0, a alternativna da je parametar Q razli it od te hipoteti ke (od ranije poznate) vrednosti Q0.
H0: Q=Q0 H1:Q Q0
2. Desnostrana jednosmerna hipoteza. Nulta hipoteza pretpostavlja da je parametar Q manji do jednak nekoj hipoteti koj (od ranije poznatoj) vrednosti Q0, a alternativna da je parametar Q ve i od te hipoteti ke (od ranije poznate) vrednosti Q0.
H0: Q Q0 H1:Q Q0
3. Levostrana jednosmerna hipoteza. Nulta hipoteza pretpostavlja da je parametar Q ve i do jednak nekoj hipoteti koj (od ranije poznatoj) vrednosti Q0, a alternativna da je parametar Q manji od te hipoteti ke(od ranije poznate) vrednosti Q0.
H0: Q Q0 H1:Q Q0
Proces testiranja hipoteza, koji emo kasnije objasniti, u svakom od ovih oblika e nas navesti da odlu imo da: ili prihvatimo alternativnu hipotezu H1, ili ne
prihvatimo alternativnu hipotezu H1.
Prilikom donošenja te odluke, možemo napraviti dve vrste grešaka.
Grešku I vrste emo napraviti ako nas test navede da zaklju imo da je hipoteza H1 istinita, a da je u stvarnosti hipoteza H1 neistinita.
Grešku II vrste emo napraviti ako nas test navede da zaklju imo da je hipoteza H1 neistinita, a da je u stvarnosti hipoteza H1 istinita.
Poslovna statistika
176
Verovatno u da emo na initi grešku I vrste obeležavamo sa i nazivamo je nivo zna ajnosti testa. Dakle, važi:
)|( 11 neistinitaHprihvatimoHP .
Verovatno u da emo na initi grešku II vrste obeležavamo sa i nazivamo je rizik greške II vrste. Dakle, važi:
)|( 11 istinitaHprihvatimoneHP .
Verovatno u da ne na inimo grešku II vrste obeležavamo sa i nazivamo je mo testa. Dakle, važi:
)|(11 11 istinitaHprihvatimoneHP .
U prakti noj primeni nivo zna ajnosti testa, , unapred biramo sa tendencijom da bude što manji, obi no =0.05 ili =0.01, dok smanjenje rizika greške II
vrste, , odnosno pove anje mo i testa , ostvarujemo pove anjem veli ineuzorka n.
Proces testiranja emo ilustrovati na slede em pojednostavljenom primeru testiranja vrednosti aritmeti ke sredine populacije , u kome unija nulte i alternativne hipoteze ne predstavlja skup svih mogu ih vrednosti aritmeti kesredine populacije, ve je, na primer:
H0: = 0 H1: = 1
Neka se vrednost datog obeležja raspodeljuje u populaciji po zakonu N( ,2).
Kao što smo ranije rekli, u tom slu aju aritmeti ka sredina slu ajnog uzorka
veli ine n,__
X , koja je ta kasta ocena aritmeti ke sredine populacije, ,
Poslovna statistika
177
raspodeljuje se po zakonu ),(~2__
nNX . U zavisnosti od toga da li je = 0
ili = 1 , ta raspodela aritmeti ke sredine slu ajnog uzorka veli ine n e, na primer za 1 0 , izgledati kao na slici 6.1.
10 0 10 200
0.1dnorm x 2 3( )
dnorm x 10 3( )
x
Izaberimo jedan slu ajan uzorak veli ine n iz ove populacije, nxxx ,...,, 21 , i
izra unajmo njegovu aritmeti ku sredinu n
x
x
n
i
i
1__
.
Neka je nivo zna ajnosti testa. Tada na imo vrednost krx__
(kriti nu vrednost aritmeti ke sredine uzorka), za koju važi da:
ako je ),(~2
0
__
nNX onda )(
____
krxXP .
),(2
1n
N
),(2
0n
N
0 1
Slika 6.1. Primeri raspodele
Poslovna statistika
178
Tada, ako je izra unata aritmeti ka sredina uzorka n
x
x
n
i
i
1__
ve a od kriti ne
vrednosti krx__
, krxx____
,
odbacujemo nultu hipotezu H0: = 0 i prihvatamo alternativnu hipotezu H1 : = 1 ,
i pri tome smo možda pogrešili sa istom onom verovatno om sa kojom je mogu e izvu i uzorak veli ine n te aritmeti ke sredine iz populacije koja se raspodeljuje po zakonu N( 0 ,
2), a ta je verovatno a, kao što smo videli,
manja od (jer je krxx____
). Odnosno, verovatno a da napravimo grešku I
vrste je (u ovom slu aju) manja od .
A ako je izra unata aritmeti ka sredina uzorka n
x
x
n
i
i
1__
manja do jednaka od
kriti ne vrednosti krx__
, krxx____
, ne možemo prihvatiti alternativnu hipotezu H1 : = 1 sa nivoom zna ajnosti .
Za ovako izabrano , a samim tim i krx__
, verovatno a da napravimo grešku II
vrste, , iznosi:
ako je ),(~2
1
__
nNX onda )(
____
krxXP
jer je to verovatno a da iz populacije koja se raspodeljuje po zakonu
N( 1 ,2) izvu emo uzorak ija je aritmeti ka sredina krxx
____
, što e nas naterati da ne prihvatimo alternativnu hipotezu H1 : = 1 i time pogrešimo.
Ilustracija za , , i krx__
data je na Slici 6.2.
Poslovna statistika
179
10 0 10 200
0.1dnorm x 2 3( )
dnorm x 10 3( )
x
O igledno je (Slika 6.2) da za istu veli inu uzorka n, smanjenje nivoa zna ajnosti testa , dovodi do pove anja rizika greške II vrste, , odnosno do smanjenja mo i testa . Smanjivanje parametra postiže se smanjivanjem širina krivih na slici 6.2, odnosno smanjivanjem varijanse raspodele
aritmeti ke sredine uzoraka. Kako je ta varijansa jednaka n
2
, smanjivanje
parametra postiže se pove anjem veli ine uzorka n.
Naša dalja analiza odnosi e se samo na testitranje parametarskih statisti kihhipoteza za unapred izabrani nivo zna ajnosti testa , dok se smanjivanjem rizika greške II vrste, , pove anjem veli ine uzorka, ne emo baviti. Zbog toga je važno imati na umu slede e:
- ako nas test navede da prihvatimo alternativnu hipotezu H1 sa nivoom zna ajnosti testa , to zna i da hipotezi H1 možemo verovati sa verovatno om 1- ;
- ako nas test navede da ne prihvatimo alternativnu hipotezu H1 sa nivoom zna ajnosti testa , to zna i da hipotezi H1 ne možemo verovati sa verovatno om 1- , a mera poverenja u nultu hipotezu H0 na osnovu ovog testa nam nije poznata.
),(2
1n
N
),(2
0n
N
0 krx__
1
Slika 6.2. Ilustracija , , krx__
Poslovna statistika
180
Tako e, kada su nulta i alternativna hipoteza me u sobom disjunktne, a njihova unija predstavlja skup svih mogu ih vrednosti testiranog parametra Q,možemo na osnovu uzorka odrediti nivo zna ajnosti sa kojim možemo prihvatiti alternativnu hipotezu H1.
Naime, neka je, na primer, u pitanju desni jednosmerni test aritmeti ke sredine populacije ,obeležja ija se aritmeti ka sredina u uzorku veli ine n
rasporedjuje po zakonu ),(~2__
nNX :
H0: 0 H1: 0.
Neka je iz te populacije uzet slu ajni uzorak veli ine n, i neka je njegova
izra unata aritmeti ka sredina jednaka n
x
x
n
i
i
1__
.
Tada, tabli nim rešavanjem jedna ine
ako je ),(~2
0
__
nNX onda )(
____
xXP ,
po nepoznatom parametru ,
možemo da konstatujemo da sa nivoom zna ajnosti možemo prihvatiti alternativnu hipotezu H1: 0.
U daljoj analizi koristi emo zakone raspodele parametara uzoraka, analizirane u 4. poglavlju ovog udžbenika, odnosno zakone raspodele ta kastih ocena, analizirane u 5. poglavlju ovog udžbenika.
Poslovna statistika
181
6.1. Testiranje aritmeti ke sredine populacije,
Neka je iz populacije iju aritmeti ku sredinu testiramo formiran jedan slu ajni uzorak veli ine n i neka je njegova aritmeti ka sredina jednaka
n
x
x
n
i
i
1__
.
Za dati nivo zna ajnosti testa , tada je:
k) ako posmatrano obeležje u populaciji ima N( ,2) raspodelu, onda:
- ako je 2populacije poznato
- ako je uzorak sa ponavljanjem (ili N , ili uzorak
bez ponavljanja kod koga je 05.0N
n), onda je
),(~2__
nNX odnosno )1,0(~
__
N
n
X,
pa važi za:
Poslovna statistika
182
1. dvosmerni test: H0: = 0 H1: 0
2
0
__
z
n
xprihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.1);
2
0
__
z
n
xne prihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.1);
0
0.25
0.5
dnorm x 0 1( )
x
Slika 6.1.1. Funkcija raspodele N(0,1)
2
z
2
2
z
2
Poslovna statistika
183
2. desni jednosmerni test: H0: 0 H1: 0
z
n
x 0
__
prihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.2);
z
n
x 0
__
ne prihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.2);
0
0.25
0.5
dnorm x 0 1( )
x
Slika 6.1.2. Funkcija raspodele N(0,1)
3. levi jednosmerni test: H0: 0 H1: 0
z
n
x 0
__
prihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.3);
z
Poslovna statistika
184
z
n
x 0
__
ne prihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.3);
0
0.25
0.5
dnorm x 0 1( )
x
Slika 6.1.3.Funkcija raspodele N(0,1)
- ako je uzorak bez ponavljanja kod koga je 05.0N
n
onda je
)1
,(~2__
N
nN
nNX , odnosno
)1,0(~
1
__
N
N
nN
n
X,
pa važi za:
z
Poslovna statistika
185
1. dvosmerni test : H0: = 0 H1: 0
2
0
__
1
z
N
nN
n
xprihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.1);
2
0
__
1
z
N
nN
n
xne prihvatamo H1: 0 sa
nivoom zna ajnosti (Slika 6.1.1);
2. desni jednosmerni test: H0: 0 H1: 0
z
N
nN
n
x
1
0
__
prihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.2);
z
N
nN
n
x
1
0
__
ne prihvatamo H1: 0 sa
nivoom zna ajnosti (Slika 6.1.2);
Poslovna statistika
186
3. levi jednosmerni test: H0: 0 H1: 0
z
N
nN
n
x
1
0
__
prihvatamo H1: 0 sa
nivoom zna ajnosti (Slika 6.1.3);
z
N
nN
n
x
1
0
__
ne prihvatamo H1: 0 sa
nivoom zna ajnosti (Slika 6.1.3);
- ako je 2populacije nepoznato:
- ako je poznato besmisleno je testirati ;
- ako je nepoznato:
- ako je uzorak sa ponavljanjem (ili N , ili uzorak
bez ponavljanja kod koga je 05.0N
n) onda
1
__
~ n
c
t
n
S
X, pa važi za:
Poslovna statistika
187
1. dvosmerni test: H0: = 0 H1: 0
2,1
0
__
nc
t
n
s
xprihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.4);
2,1
0
__
nc
t
n
s
xne prihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.4);
0
0.25
0.5
dnorm x 0 1( )
x
Slika 6.1.4. Funkcija raspodele tn-1
2,1n
t
2
2,1nt
2
Poslovna statistika
188
2. desni jednosmerni test: H0: 0 H1: 0
,10
__
n
c
t
n
s
xprihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.5);
,10
__
n
c
t
n
s
xne prihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.5);
0
0.25
0.5
dnorm x 0 1( )
x
Slika 6.1.5. Funkcija raspodele tn-1
,1nt
Poslovna statistika
189
3. levi jednosmerni test: H0: 0 H1: 0
,10
__
n
c
t
n
s
xprihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.6);
,10
__
n
c
t
n
s
xne prihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.6);
0
0.25
0.5
dnorm x 0 1( )
x
Slika 6.1.6. Funkcija raspodele tn-1
,1nt
Poslovna statistika
190
- ako je uzorak bez ponavljanja kod koga je
05.0N
n, onda:
1
__
~
1
n
c
t
N
nN
n
S
X, pa važi za:
1. dvosmerni test: H0: = 0 H1: 0
2,1
0
__
1
nc
t
N
nN
n
s
xprihvatamo H1: 0 sa
nivoom zna ajnosti (Slika 6.1.4);
2,1
0
__
1
nc
t
N
nN
n
s
xne prihvatamo H1: 0 sa
nivoom zna ajnosti (Slika 6.1.4);
2. desni jednosmerni test: H0: 0 H1: 0
,10
__
1
n
c
t
N
nN
n
s
xprihvatamo H1: 0 sa
nivoom zna ajnosti (Slika 6.1.5);
Poslovna statistika
191
,10
__
1
n
c
t
N
nN
n
s
xne prihvatamo H1: 0 sa
nivoom zna ajnosti (Slika 6.1.5);
3. levi jednosmerni test: H0: 0 H1: 0
,10
__
1
n
c
t
N
nN
n
s
xprihvatamo H1: 0 sa
nivoom zna ajnosti (Slika 6.1.6);
,10
__
1
n
c
t
N
nN
n
s
xne prihvatamo H1: 0 sa
nivoom zna ajnosti (Slika 6.1.6);
iv) ako posmatrano obeležje u populaciji nema N( ,2) raspodelu,
onda aproksimativno važi:
- ako je uzorak sa ponavljanjem (ili N ),
uzimamo dovoljno veliki uzorak pod kojim podrazumevamo uzorak veli ine n 30 i za njega važe svi rezultati kao i uslu aju kad obeležje u populaciji imaN( ,
2) raspodelu;
Poslovna statistika
192
- ako je uzorak bez ponavljanja,
uzimamo dovoljno veliki uzorak iz dovoljne velike populacije, pod kojim podrazumevamo uzorak veli ine
n 30 i populaciju za koju je 2
Nn , i za njega važe svi
rezultati kao i uslu aju kad obeležje u populaciji imaN( ,
2) raspodelu.
Primer 6.1.1. Prose an broj dnevnih posetilaca u beogradskim restoranima je 150 posetilaca po restoranu, sa standardnom varijansom = 30. Posle smanjenja cena mesa u restoranima od 10%, uzorkovano je 40 slu ajnoodabranih restorana, i na njima je izra unat srednji broj dnevnih posetilaca – 160 posetilaca po rastoranu.
i) Da li, sa nivoom zna ajnosti
a) =0,05b) =0,01
možemo konstatovati da se srednji broj posetilaca u restoranima pove ao?
ii) Sa kojim nivoom zna ajnosti možemo iz ovog uzorka konstatovati da se srednji broj posetilaca pove ao?
Rešenje:
Kako je uzorak n=40 > 30, to broj posetilaca možemo aproksimirati
N(150, 302) raspodelom. Po uslovu zadatka, nulta hipoteza je 150:0H , a
alternativna .150:1H
i)
a)
Za nivo zna ajnosti 64,105,0 Z
važi:
Poslovna statistika
193
64,111,2
40
301501600
_
n
x
Možemo konstatovati da se srednji broj posetilaca u
restoranima pove ao.
b)
Za nivo zna ajnosti 33,201,0 Z
važi:
33,211,2
40
301501600
_
n
x
Ne možemo konstatovati da se srednji broj posetilaca u
restoranima pove ao.
ii)
Iz uslova:
ZZ
n
x11,20
_
koriste i N(0,1) tablicu, dobijamo 9826,01 , odakle je
=0,0174.
Dakle, iz ovog uzorka možemo sa nivoom zna ajnosti =0,0174konstatovati da se srednji broj posetilaca pove ao.
Poslovna statistika
194
6.2. Testiranje razlike aritmeti kih sredina populacija, 21
Neka su iz dve populacije iju razliku aritmeti kih sredina 1 - 2 testiramo formirana dva nezavisna uzorka veli ine n1 i n2, i neka su njihove aritmeti ke
sredine redom jednake 1
11
__
1
n
x
x
n
i
i
i 2
12
__
2
n
x
x
n
i
i
.
Tako e, neka u prvoj populaciji obeležje X1 ima parametar 211 )var(X , a u
drugoj populaciji obeležje X2 ima parametar 222 )var(X .
Tada, za dati nivo zna ajnosti testa , važi:
- ako ),(~),(~ 2222
2111 NXiNX ,
onda:
2
22
1
21
212
__
1
__
,~nn
NXX ,odnosno
)1,0(~)(
2
22
1
21
212
__
1
__
N
nn
XX, pa važi:
1. dvosmerni test: H0: 1 - 2 = 10 - 20 H1: 1 - 2 10 - 20
2
2
22
1
21
20102
__
1
__
)(z
nn
xxprihvatamo H1: 1 - 2 10 - 20 sa
nivoom zna ajnosti (Slika 6.1.1);
Poslovna statistika
195
2
2
22
1
21
20102
__
1
__
)(z
nn
xxne prihvatamo H1: 1 - 2 10 - 20 sa
nivoom zna ajnosti (Slika 6.1.1);
2. desni jednosmerni test: H0: 1 - 2 10 - 20 H1: 1 - 2 10 - 20
z
nn
xx
2
22
1
21
20102
__
1
__
)(prihvatamo H1: 1 - 2 10 - 20 sa
nivoom zna ajnosti (Slika 6.1.2);
z
nn
xx
2
22
1
21
20102
__
1
__
)(ne prihvatamo H1: 1 - 2 10 - 20 sa
nivoom zna ajnosti (Slika 6.1.2);
3. levi jednosmerni test: H0: 1 - 2 10 - 20 H1: 1 - 2 10 - 20
z
nn
xx
2
22
1
21
20102
__
1
__
)(prihvatamo H1: 1 - 2 10 - 20 sa
nivoom zna ajnosti (Slika 6.1.3);
Poslovna statistika
196
z
nn
xx
2
22
1
21
20102
__
1
__
)(ne prihvatamo H1: 1 - 2 10 - 20 sa
nivoom zna ajnosti (Slika 6.1.3);
- ako ne znamo zakon raspodele obeležja X1 i X2 ,
onda aproksimativno važi: ako je n1 30 i n2 30, tada
2
22
1
21
212
__
1
__
,~nn
NXX ,
pa onda uzimamo uzorke veli ine n1 30 i n2 30 i za njih važi sve gore navedeno, kao da je ),(~),(~ 2
2222111 NXiNX .
Primer 6.2.1. Proizvo a A tvrdi da je prose an radni vek sijalica koje on proizvodi ve i za 80 radnih asova od radnog veka sijalica koje proizvodi proizvo a B. Standardne devijacije radnog veka sijalica proizvo a a A i B su poznate i iznose 3020 BA i asova. Uzorak od 50 sijalica proizvo a a A ima srednji vek trajanja 2590 asova, dok uzorak od 60 sijalica proizvo a a B ima srednji vek trajanja 2500 asova.
i) Da li, sa nivoom zna ajnosti
a) =0,05b) =0,01
možemo konstatovati da je proizvo a A u pravu?
ii) Sa kojim nivoom zna ajnosti možemo iz ovih uzoraka konstatovati da je proizvo a A u pravu?
Poslovna statistika
197
Rešenje:
Po uslovu zadatka, nulta hipoteza je 80:0 BAH , a alternativna
hipoteza je 80:1 BAH . Kako je nA >30, nB >30, i varijanse obe
populacije poznate, važi:
i)
a)
Za nivo zna ajnosti 64,105,0 Z ,
pa je
64,108,2
60
30
50
20
80250025902222
__
B
B
A
A
BABA
nn
xx.
Možemo konstatovati da je proizvo a A u pravu.
b)
Za nivo zna ajnosti 33,201,0 Z ,
pa je
33,208,2
60
30
50
20
80250025902222
__
B
B
A
A
BABA
nn
xx .
Možemo konstatovati da proizvo a A nije u pravu.
Poslovna statistika
198
ii)
Iz uslova:
ZZ
nn
xx
B
B
A
A
BABA08,2
22
__
,
koriste i N(0,1) tablicu, dobijamo 9812,01 , odakle je
=0,0188. Dakle, iz ovih uzoraka možemo sa nivoom zna ajnosti
=0,0188 konstatovati da je proizvo a A u pravu.
Poslovna statistika
199
6.3. Testiranje proporcije populacije,
Neka je iz populacije iju proporciju testiramo, formiran jedan slu ajniuzorak veli ine n i neka je njegova realizovana proporcija pr takva da je
3051,5 nipnpn rr ,
tada za dati nivo zna ajnosti testa aproksimativno važi slede e:
- ako je uzorak sa ponavljanjem (ili N , ili uzorak bez ponavljanja
kod koga je 05.0N
n), onda
)1
,(~n
ppNP rr
r odnosno )1,0(~1
N
n
pp
P
rr
r ,
pa važi za:
1. dvosmerni test: H0: = 0 H1: 0
2
0
1z
n
pp
p
rr
r prihvatamo H1: 0
sa nivoom zna ajnosti (Slika 6.1.1);
2
0
1z
n
pp
p
rr
r ne prihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.1);
Poslovna statistika
200
2. desni jednosmerni test: H0: 0 H1: 0
z
n
pp
p
rr
r
10 prihvatamo H1: 0
sa nivoom zna ajnosti (Slika 6.1.2);
z
n
pp
p
rr
r
10 ne prihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.2);
3. levi jednosmerni test: H0: 0 H1: 0
z
n
pp
p
rr
r
10 prihvatamo H1: 0
sa nivoom zna ajnosti (Slika 6.1.3);
z
n
pp
p
rr
r
10 ne prihvatamo H1: 0 sa nivoom
zna ajnosti (Slika 6.1.3);
- ako su uzorci bez ponavljanja kod kojih je 05.0N
n, onda
)1
1,(~
N
nN
n
ppNP rr
r , odnosno
)1,0(~
1
1N
N
nN
n
pp
P
rr
r ,
Poslovna statistika
201
pa važi za:
1. dvosmerni test: H0: = 0 H1: 0
2
0
1
1z
N
nN
n
pp
p
rr
r prihvatamo H1: 0
sa nivoom zna ajnosti (Slika 6.1.1);
2
0
1
1z
N
nN
n
pp
p
rr
r ne prihvatamo H1: 0 sa
nivoom zna ajnosti (Slika 6.1.1);
2. desni jednosmerni test: H0: 0 H1: 0
z
N
nN
n
pp
p
rr
r
1
10 prihvatamo H1: 0
sa nivoom zna ajnosti (Slika 6.1.2);
z
N
nN
n
pp
p
rr
r
1
10 ne prihvatamo H1: 0 sa
nivoom zna ajnosti (Slika 6.1.2);
3. levi jednosmerni test: H0: 0 H1: 0
z
N
nN
n
pp
p
rr
r
1
10 prihvatamo H1: 0
Poslovna statistika
202
sa nivoom zna ajnosti (Slika 6.1.3),
z
N
nN
n
pp
p
rr
r
1
10 ne prihvatamo H1: 0 sa
nivoom zna ajnosti (Slika 6.1.3).
Zadatak 6.3.1. Veruje se da e 25% glasa a iz jednog okruga glasati za stranku A na predstoje im izborima. Slu ajan uzorak od 50 glasa a iz tog okruga je pokazao da e njih 7 glasati za stranku A.
i) Možemo li sa nivoom zna ajnosti
a) =0,05b) =0,01
konstatovati da se u ovom okrugu promenio % glasa a koji e glasati za stranku A?
ii) Sa kojim nivoom zna ajnosti možemo iz ovog uzorka konstatovati da se u ovom okrugu promenio % glasa a koji e glasati za stranku A?
Poslovna statistika
203
6.4. Testiranje varijanse populacije, 2
Neka se slu ajna promenljiva X u populaciji raspodeljuje po zakonu N( ,2).
Neka je iz te populacije, iju varijansu 2 testiramo, formiran jedan slu ajniuzorak veli ine n i neka je njegova centrirana varijansa jednaka:
- ukoliko je aritmeti ka sredina populacije poznata
n
x
s
n
i
i
1
2
2
)( ;
- ukoliko je aritmeti ka sredina populacije nepoznata
1
)(1
2__
2
n
xx
s
n
i
i
c .
Tada važi:
- poznato
za slu ajnu promenljivu varijansa uzorka 2S važi:
- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez
ponavljanja kod kojih je 05.0N
n), onda:
22
2
~ n
Sn , pa važi za:
1. dvosmerni test: H0:2 =
20 H1:
2 20
Poslovna statistika
204
2
21,2
0
22
2,2
0
2
nn
snsn prihvatamo H1:
2 20
sa nivoom zna ajnosti (Slika 6.4.1);
2
2,2
0
22
21, nn
snne prihvatamo H1:
2 20
sa nivoom zna ajnosti (Slika 6.4.1);
0 2 4 6 8 10 12 14 16 18 200
0.05
0.1
0.15
dchisq x 7( )
x
6.4.1. Funkcija raspodele 2n
2. desni jednosmerni test: H0:2 2
0 H1:2 2
0
22
2
21,n
2
2,n
Poslovna statistika
205
2,2
0
2
n
snprihvatamo H1:
2 20 sa nivoom zna ajnosti
(Slika 6.4.2);
2,2
0
2
n
snne prihvatamo H1:
2 20 sa nivoom
zna ajnosti (Slika 6.4.2);
0 2 4 6 8 10 12 14 16 18 200
0.05
0.1
0.15
dchisq x 7( )
x
6.4.2. Funkcija raspodele 2n
3. levi jednosmerni test: H0:2 2
0 H1:2 2
0
21,2
0
2
n
snprihvatamo H1:
2 20 sa nivoom
zna ajnosti (Slika 6.4.3);
2,n
Poslovna statistika
206
21,2
0
2
n
snne prihvatamo H1:
2 20 sa nivoom
zna ajnosti (Slika 6.4.3);
0 2 4 6 8 10 12 14 16 18 200
0.05
0.1
0.15
dchisq x 7( )
x
6.4.3. Funkcija raspodele 2n
- ako je uzorak bez ponavljanja kod koga je 05.0N
n, onda
aproksimativno važi:
- ako je n 30 i2
Nn ,
tada 22
2
~ n
Sn ,
pa i tada važi sve navedeno za uzorak sa ponavljanjem podovim uslovima;
21,n
Poslovna statistika
207
- nepoznato
za slu ajnu promenljivu varijansa uzorka 2cS važi:
- ako su uzorci sa ponavljanjem (ili N , ili uzorci bez
ponavljanja kod kojih je 05.0N
n), onda:
212
2
~)1(
ncSn
, pa važi za:
1. dvosmerni test: H0:2 =
20 H1:
2 20
2
21,12
0
22
2,12
0
2 )1()1(n
c
n
c snsnprihvatamo
H1:2 2
0 sa nivoom zna ajnosti (Slika 6.4.1);
2
2,12
0
22
21,1
)1(n
c
n
snne prihvatamo H1:
2 20
sa nivoom zna ajnosti (Slika 6.4.1);
2. desni jednosmerni test: H0:2 2
0 H1:2 2
0
2,12
0
2)1(n
csnprihvatamo H1:
2 20 sa nivoom
zna ajnosti (Slika 6.4.2);
2,12
0
2)1(n
csnne prihvatamo H1:
2 20 sa nivoom
zna ajnosti (Slika 6.4.2);
Poslovna statistika
208
3. levi jednosmerni test: H0:2 2
0 H1:2 2
0
21,12
0
2)1(n
csnprihvatamo H1:
2 20 sa nivoom
zna ajnosti (Slika 6.4.3)
21,12
0
2)1(n
csnne prihvatamo H1:
2 20 sa nivoom
zna ajnosti (Slika 6.4.3);
- ako je uzorak bez ponavljanja kod koga je 05.0N
n, onda
aproksimativno važi:
- ako je n 30 i2
Nn ,
tada 212
2
~)1(
ncSn
,
pa i tada važi sve navedeno za uzorak sa ponavljanjem pod ovim uslovima.
Zadatak 6.4.1. Slu ajan uzorak veli ine n=16 uzet je iz populacije u kojoj analizirano obeležje ima N( ,
2), gde je aritmeti ka sredina obeležja
Poslovna statistika
209
nepoznata, a smatra se da varijansa obeležja iznosi .78020 Centralizovana
standardna devijacija ovog uzorka iznosi 33cs .
Da li, sa nivoom zna ajnosti
a) =0,05b) =0,01
možemo konstatovati da se promenila varijansa populacije?
Poslovna statistika
210
7. REGRESIJA I KORELACIJA
Vrlo esto postoji potreba za predvi anjem vrednosti nekog obeležja na osnovu njegove povezanosti sa jednim ili više drugih obeležja.
Jedan od važnijih zadataka statistike je da utvrdi stepen i oblik zavisnosti izme u odre enih obeležja od interesa, kod kojih egzaktan uzro no-posledi niodnos nije definisan. Takva analiza omogu ava predvi anje vrednosti jednog obeležja na osnovu poznavanja vrednosti drugih obeležja, i esto se koristi prilikom donošenja odre enih poslovnih odluka.
Pod pojmom regresiona analiza podrazumeva se skup statisti kih procedura za ispitivanje oblika zavisnosti izme u dva ili više obeležja.
Pod pojmom korelaciona analiza podrazumeva se skup statisti kih procedura za ispitivanje stepena (ja ine) zavisnosti izme u dva ili više obeležja.
Ukoliko se ispituje oblik i stepen zavisnosti samo izme u dva obeležja, onda se takav proces naziva prosta regresiona analiza (utvr ivanje oblika zavisnosti dva obeležja) i prosta korelaciona analiza (utvr ivanje stepena zavisnosti dva obeležja).
Ukoliko se ispituje oblik i stepen zavisnosti izme u više obeležja, onda se takav proces naziva višestruka regresiona analiza (utvr ivanje oblika zavisnosti više obeležja), odnosno višestruka korelaciona analiza (utvr ivanjestepena zavisnosti više obeležja).
U ovom udžbeniku bavi emo se samo prostom regresionom i korelacionom analizom.
Naša analiza e se kao i do sada odvijati na podacima iz slu ajnog uzorka, a rezultati koje dobijemo važi e za itavu populaciju iz koje je uzet uzorak.
Kod proste regresione analize neophodno je unapred odrediti koje obeležje eimati ulogu nezavisne promenljive, a koje zavisne promenljive. Ovo se utvr uje na osnovu prethodnih teorijskih ili empirijskih saznanja o prirodi analiziranih obeležja. Tako, na primer, ako u jednoj populaciji želimo izvršiti prostu regresionu analizu (prona i zavisnost) izme u mese nog prihoda pojedinca i koli ini mesa utrošenog u ishrani pojedinca za mesec dana, logi no
Poslovna statistika
211
je da mese ni prihod bude nezavisna promenljiva, a koli ina utrošenog mesa zavisna.
Kod proste korelacione analize, svejedno je koje se obeležje karakteriše kao zavisno, a koje kao nezavisno.
Regresiona i korelaciona analiza se, kao što smo rekli, bave analizom zavisnosti me u obeležjima koja su stohasti ke prirode, pa rezultati koje dobijamo ovim analizama nisu egzaktni, ve su verodostojni sa odre enim verovatno ama i u odre enim intervalima vrednosti. Ali, pomo u njih mi možemo da ocenimo i predvidimo interval vrednosti zavisne promenljive za željene vrednosti nezavisne promenljive, sa unapred definisanom, zadovoljavaju e velikom verovatno om.
Prvi korak u analizi zavisnosti dva obeležja je identifikovanje: koje obeležje predstavlja nezavisno, a koje zavisno obeležje. U daljoj analizi, nezavisno obeležje obeležava emo sa X, a zavisno sa Y. Na taj na in, ukoliko uzimamo podatke o obeležjima X i Y iz slu ajnog uzorka veli ine n, dolazimo do nparova podataka (x1, y1), (x2, y2), ..., (xn, yn).
Slede i korak je grafi ki prikaz ovih parova podataka koji se konstruiše u pravouglom Dekartovom koordinatnom sistemu, pri emu se na apscisnu osu nanose podaci nezavisne promenljive X, a na ordinatnu osu vrednosti zavisne promenljive Y. Takav grafi ki prikaz naziva se dijagram raspršenosti, i na osnovu njega se na prvi pogled može dobiti odre ena predstava o eventualnom postojanju zavisnosti, obliku zavisnosti i stepenu zavisnosti izme uposmatranih obeležja (Slika 7.1).
Poslovna statistika
212
X X
a) b)
X X
c) d)
Slika 7.1. Dijagrami raspršenosti
Tako, na primer, sa Slike 7.1. možemo zaklju iti da:
a) postoji direktna linearna veza (zavisno obeležje linearno raste kada raste nezavisno obeležje);
b) postoji inverzna linearna veza, slabija nego pod a. (zavisno obeležje linearno opada kada raste nezavisno obeležje);
c) ne postoji stohasti ka veza; d) postoji snažna kvadratna veza.
Y Y
Y Y
Poslovna statistika
213
Generalno, dijagramom raspršenosti možemo sagledati da li izme u dva obeležja postoji stohasti ka veza ako postoji koji je oblik te veze (linearni, kvadratni, eksponecijalni, logaritamski...), i ako je oblik slaganja linearni, da li je direktni ili inverzni.
Poslovna statistika
214
7.1. Prosta linearna regresija i korelacija
Neka smo iz populacije veli ine N uzeli slu ajan uzorak veli ine n, i neka su na njemu uzeti parovi uzora kih podataka (xi,yi), i = 1, 2, ..., n za obeležja X iY, iju zavisnost ispitujemo. Neka dijagram raspršenosti definisan ovim uzorkom, dat na slici 7.1, indicira da se radi o linearnoj zavisnosti obeležja X iY u itavoj populaciji,
XY (opravdano pretpostavljena zavisnost obeležja X i Y u itavoj
populaciji).
Zadatak linearne regresione analiza je da oceni koeficijente i , koji opisuju linearnu zavisnost u itavoj populaciji, na osnovu uzora kih podataka (xi,yi), i = 1, 2, ..., n.
x3 X
Slika 7.1.1. Dijagram raspršenosti uzorka
Y
y3
Poslovna statistika
215
Radi lakšeg objašnjenja, zamislimo da je dijagram raspršenosti itavepopulacije, ta ke (xi,yi), i = 1, 2, ..., N, dat na slici 7.1.2.
X
Slika 7.1.2. Dijagram raspršenosti populacije
O igledno da bi, i kada bi smo znali koeficijente i , zbog stohasti nostizavisnosti obeležja X i Y važilo:
iii xy , i = 1, 2, ..., N,
gde je sa i obeležen stohasti ki lan (slu ajni poreme aj) i-tog lanapopulacije.
Ovaj stohasti ki lan, i , posledica je injenice da na zavisno obeležje Y ne deluje samo nezavisno obeležje X, ve i veliki broj drugih faktora koji u ovom modelu nisu uzeti u obzir. Ove fluktuacije i se u ovakvom pristupu karakterišu kao fluktuacije zavisne promenljive neobjašnjenje ovim regresionim modelom.
Y
Poslovna statistika
216
Dalja analiza koju emo sprovesti, a pomo u koje emo iz uzora kih podataka (xi,yi), i = 1, 2, ..., n oceniti parametre i , podrazumeva e da za stohasti kilan i u itavoj populaciji (i = 1, 2, ..., N) važi slede e:
- 0)( iE , što zna i da je stohasti ki lan u proseku u populaciji jednak nuli;
- constVarVarVar N
221 )()()( , što zna i da svi stohasti ki
lanovi imaju istu varijansu; ova osobina se još naziva i homoskedasti nost;
- izme u bilo koja dva stohasti ka lana i i j ne postoji nikakva funkcionalna veza;
- i ima Normalan raspored, odnosno ).,0(~ 2Ni
7.1.1. Ocenjivanje parametara i iz uzora kih podataka
Pod navedenim uslovima za stohasti ki lan u populaciji, oceni emo parametre i iz uzora kih podataka (xi,yi), i = 1 ,2, ..., n metodom minimiziranja
sume svih kvadrata stohasti kog lana i , izra unate na uzora kim podacima u odnosu na ocenjene vrednosti za i .
Naime, neka je ocena parametra , recimo koeficijent a, a ocena parametrarecimo koeficijent b. Tada je uzora ka regresiona kriva, koju emo obeležiti sa ^
y , jednaka:
xbay^
,
a za svaki par uzora kih podataka (xi,yi), i = 1, 2, ..., n važi slede e:
iii xbay
ii xbay^
.
Videti Sliku 7.1.3.
Poslovna statistika
217
xi
X
Slika 7.1.3. Uzora ka regresiona kriva
Koeficijente a i b, kao što smo rekli, dobi emo minimiziranjem slede egizraza:
n
i
ii
n
i
ii
n
i
i xbayyy1
2
1
2^
1
2 ))(()( .
Postupak minimiziranja se sprovodi nalaženjem parcijalnih izvoda navedenog izraza po parametrima a i b i njihovim izjedna avanjem sa nulom:
iy^
iy
xbay^
Y
Poslovna statistika
218
0
))((
0
))((
1
2
1
2
b
xbay
a
xbay
n
i
ii
n
i
ii
,
odakle dobijamo slede i sistem jedna ina:
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
xbxayx
xbany
1
2
11
11 .
Ovaj sistem jedna ina ima jedinstveno rešenje po a i b:
n
x
bn
y
a
xxn
yxyxn
b
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
112
11
2
111 .
Ovako dobijene ocene za i su, pod gore navedenim regresionim pretpostavkama, najefikasnije ocene. Dakle, važi:
)(
)(
bE
aE .
7.1.2. Standardna greška regresije, se
Pomo u ovako dobijenih a i b možemo oceniti varijansu stohasti kih lanova
i,2 sa 2
es , po formuli:
Poslovna statistika
219
22
)(
2111111
2
1
2^
1
2
2
n
yxbyay
n
yy
ns
n
ii
n
i
n
i
n
i
ii
n
i
i
e
i dobiti standardnu grešku regresije, se , po formuli:
22
)(
2111111
2
1
2^
1
2
n
yxbyay
n
yy
ns
n
ii
n
i
n
i
n
i
ii
n
i
i
e .
Standardna greška regresije je apsolutna mera varijacije uzora kih podataka od regresione linije uzorka. Što je standardna greška regresije ve a, to su ta keuzorka više raspršene od uzora ke linije regresije, pa su i predvi anjazasnovana na toj liniji regresije manje pouzdana. Tako e, što je uzorak ve i, to je standardna greška regresije manja.
7.1.3. Standardna greška ocene nagiba regresione krive, sb
Standardnu grešku ocene nagiba regresione krive, sb , to jest standardnu grešku ocene parametra , pomo u na uzorku izra unatog parametra b,dobijamo po formuli:
n
x
x
ss
n
i
in
i
i
eb 2
1
1
2
.
Da bi primena regresione linije uzorka bila opravdana, neophodno je ispitati da li uopšte postoji linearno slaganje u itavoj populaciji, odnosno da li je parametar 0. To ispitivanje emo izvršiti dvosmernim testom hipoteza, gde je nulta hipoteza H0: =0, a alternativna H1: 0.
Ovim testom prihvati emo alternativnu hipotezu H1: 0 sa nivoom zna ajnosti (ovo predstavlja verovatno u da emo na initi grešku I vrste i nema
Poslovna statistika
220
nikakve veze sa parametrom iz regresione jedna ine populacije XY ), ukoliko je
2,2n
b
ts
b .
7.1.4. Koeficijent determinacije, r2
Relativna mera reprezentativnosti regresione linije koja pokazuje koji se deo varijabiliteta obeležja Y objašnjava promenom obeležja X po linearnom regresionom modelu, zove se koeficijent determinacije, r
2, i na uzorku se izra unava po formuli:
2
2
11
2
2
11
2
1112
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
yynxxn
yxyxn
r .
Vrednost koeficijenta determinacije varira od 0 do 1, to jest važi:
10 2r .
Što je koeficijent determinacije bliži jedinici, to regresiona kriva bolje opisuje zavisnost podataka. Tako, ako je na primer:
92.02r ,
to zna i da je 92% ukupnog varijabiliteta zavisne promenljive opisano varijabilitetom nezavisne promenljive po utvr enom regresionom zakonu, a da samo 8% varijabiliteta nije objašnjeno regresionom linijom, ve je uzrokovano nekim neidentifikovanim faktorima.
Poslovna statistika
221
7.1.5. Koeficijent proste linearne korelacije u uzorku, r
Sa koeficijentom determinacije je usko povezan koeficijent proste linearne
korelacije u uzorku, r, koji na uzorku izra unavamo po formuli:
2
11
2
2
11
2
111
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
yynxxn
yxyxn
r , odnosno
2rr .
Koeficijent proste linearne korelacije (negde se naziva i Pirsonov koeficijent) opisuje postojanje i ja inu linearne veze izme u dve pojave, u ovom slu ajuobeležja X i Y. To je broj koji uzima vrednosti izme u –1 i 1, to jest važi:
.11 r
Kada je ovaj koeficijent pozitivan, korelacija je pozitivna (direktna), odnosno pove anje obeležja X uslovljava pove anje obeležja Y, a kada je ovaj koeficijent negativan, korelacija je negativna (inverzna), odnosno pove anjeobeležja X uslovljava smanjenje obeležja Y. Što je ovaj koeficijent bliži jedinici po apsolutnoj vrednosti, to je sve ja a linearna korelaciona veza izme u obeležja, a što je bliži nuli, linearna korelaciona veza je slabija. U statisti koj literaturi ne postoji slaganje u pogledu tuma enja zna enja mogu ihvrednosti proste linearne korelacije r, ali možemo usvojiti slede u grubu podelu:
8.07.0 r - izražena linearna korelacija;
9.08.0 r - visoka linearna korelacija;
19.0 r - veoma visoka linearna korelacija;
1r - savršena linearna korelacija.
Poslovna statistika
222
7.1.6. Standardna greška ocene koeficijenta proste linearne korelacije, sr
Koeficijent proste linearne korelacije u itavoj populaciji obeležimo sa , i njega ocenjujemo parametrom koeficijent proste linearne korelacije u uzorku,
r. Time inimo odre enu grešku koju opisujemo standardnom greškom ocene koeficijenta proste linearne korelacije, koju obelažavamo sa sr.
Standardnu grešku ocene koeficijenta proste linearne korelacije, sr,
izra unavamo po formuli:
2
1 2
n
rsr .
Kako je koeficijent korelacije u itavoj populaciji nepoznat, potrebno je na osnovu uzorka ispitati da li i u itavoj populaciji postoji korelacija, odnosno da li je 0.
To ispitivanje emo izvršiti dvosmernim testom hipoteza, gde je nulta hipoteza H0: =0, a alternativna H1: 0.
Ovim testom prihvati emo alternativnu hipotezu H1: 0 sa nivoom zna ajnosti (ovo predstavlja verovatno u da emo na initi grešku I vrste i nema
nikakve veze sa parametrom iz regresione jedna ine populacije XY ), ukoliko je
2,2n
r
ts
r.
Poslovna statistika
223
7.1.7. Koriš enje linearnog regresionog modela za predvi anje vrednosti zavisnog obeležja
Primena linearnog regresionog modela za predvi enje vrednosti zavisnog obeležja opravdana je ukoliko je koeficijent determinacije visok (dovoljno je da je r2
>0.5) i ukoliko je 0 sa nivoom zna ajnosti =0.05.
Kako je priroda veze izme u X i Y stohasti ka, to za svaku vrednost xi iz populacije postoji mnogo mogu ih vrednosti za yi u populaciji, jer je
iii xy ,
a i je stohasti ki lan (slu ajni poreme aj).
Taj raspored mogu ih vrednosti zavisnog obeležja yi za neku odre enuvrednost xi, predstavlja slu ajnu promenljivu Yi.Kako je 0)( iE , to je prose na vrednost za yi, za unapred zadato xi , jednaka
iiiiii xExExEYE )()()()( ,
odnosno prose na vrednost zavisnog obeležja yi, za unapred zadatu vrednost nezavisnog obeležja xi, nalazi se na liniji regresije populacije XY .
Dakle, na osnovu ocenjenih parametara za i ( smo ocenili sa a, sa b),možemo za datu vrednost nezavisnog obeležja X=xp , predvi ati individualnu vrednost zavisnog obeležja Yp i prose nu vrednost zavisnog obeležja E(Yp).
Kako je
pp
ppp
xYE
axY
)( ,
to je predvi anje individualne vrednosti zavisnog obeležja neizvesnije od predvi anja prose ne vrednosti zavisnog obeležja, jer osim neizvesnosti usled ocenjivanja parametara i , kod predvi anja individualne vrednosti postoji i dodatna neizvesnost usled stohasti nosti lana p.
Poslovna statistika
224
Samim tim e odgovaraju i interval predvi anja individualne vrednosti biti širi od intervala predvi anja prose ne vrednosti zavisnog obeležja, za datu vrednost nezavisnog obeležja.
7.1.8. Interval predvi anja prose ne vrednosti zavisnog obeležja Y, za datu vrednost nezavisnog obeležja X=xp
Stvarna prose na vrednost zavisnog obeležja Y za datu vrednost nezavisnog obeležja X=xp iznosi
pp xYE )( ,
a ocenjena vrednost iznosi
ppxbay
^
.
Meru odstupanja ocenjene vrednosti p
y^
od prave vrednosti E(Yp), opisuje
standardna greška ocene prose ne vrednosti zavisnog obeležja, koju ozna avamo sa _
py
s , i koju za X=xp izra unavamo po formuli:
n
x
x
n
x
x
nss
n
i
in
i
i
n
i
i
p
ey p
2
1
1
2
2
1
1_ ,
Interval prose ne vrednosti zavisnog obeležja, koji e sa verovatno om 1-
obuhvatiti stvarnu prose nu vrednost zavisnog obeležja E(Yp), iznosi:
pp ynpp
ynp styYEsty __
2,2
^
2,2
^
.
Poslovna statistika
225
7.1.9. Interval predvi anja individualne vrednosti zavisnog obeležja Y, za datu vrednost nezavisnog obeležja X=xp
Stvarna individualna vrednost zavisnog obeležja Y za datu vrednost nezavisnog obeležja X=xp iznosi
ppp xY ,
a ocenjena vrednost iznosi
ppxbay
^
.
Meru odstupanja ocenjene vrednosti p
y^
od prave individualne vrednosti Yp,
opisuje standardna greška ocene individualne vrednosti zavisnog obeležja,koju ozna avamo sa
pys , i koju za X=xp izra unavamo po formuli:
n
x
x
n
x
x
nss
n
i
in
i
i
n
i
i
p
ey p 2
1
1
2
2
1
11 .
Interval individualne vrednosti zavisnog obeležja, koji e sa verovatno om 1- obuhvatiti stvarnu individualnu vrednost zavisnog obeležja Yp, iznosi:
pp yn
ppyn
p styYsty2
,2
^
2,2
^
.
Poslovna statistika
226
Evidentno je da je za datu verovatno u 1- , širina intervala i prose ne i individualne vrednosti direktno srazmerna standardnoj greški ocene _
py
s ,
odnosnopys . Analizom izraza za standardnu grešku ocene individualne i
prose ne vrednosti, zaklju ujemo da za širinu intervala i prose ne i individualne vrednosti, za datu verovatno u 1- , važi slede e:
- pove anjem standardne greške regresije, se, odnosno pove anjem
raspršenoš u ta aka oko linije regresije, pove avaju se širine oba
intervala;
- pove anjem veli ine uzorka (broja n), širine oba intervala se smanjuju;
- udaljavanjem izabrane vrednosti xp od uzora ke aritmeti ke sredine
obeležja X, širina oba intervala se pove ava; zbog toga bi trebalo predvi anje vršiti za vrednosti nezavisnog obeležja koja nisu previše
udaljene od uzora ke aritmeti ke sredine obeležja X;
- pove anjem disperzije obeležja X, širina oba intervala se smanjuje;
zbog toga se pri planiranju uzorka uzima što širi dijapazon mogu ih
vrednosti obeležja X.
Poslovna statistika
227
7.2. Kvadratna regresija i korelacija
Neka smo iz populacije veli ine N, uzeli slu ajan uzorak veli ine n, i neka su na njemu uzeti parovi uzora kih podataka (xi,yi), i = 1, 2, ..., n za obeležja X iY, iju zavisnost ispitujemo. Neka dijagram raspršenosti definisan ovim uzorkom, dat na slici 7.2.1, indicira da se radi o kvadratnoj zavisnosti obeležja X i Y u itavoj populaciji,
2XXY (opravdano pretpostavljena zavisnost obeležja X i Y uitavoj populaciji).
Zadatak kvadratne regresione analize je da oceni koeficijente , i , koji opisuju kvadratnu zavisnost u itavoj populaciji, na osnovu uzora kih podataka (xi,yi), i = 1, 2, ..., n.
x3 X
Slika 7.2.1. Dijagram raspršenosti uzorka
Sli no kao i kod linearne regresije, ukoliko bismo poznavali parametre , i ,zbog stohasti nosti zavisnosti obeležja X i Y važilo bi:
iiii xxy 2 , i = 1, 2, ..., N,
gde je sa i obeležen stohasti ki lan (slu ajni poreme aj) i-tog lanapopulacije.
Y
y3
Poslovna statistika
228
Ovaj stohasti ki lan i je, isto kao i kod linearne regresije, posledica fenomena koje ne opisuje kvadratna regresiona zavisnost obeležja X i Y.
U slu ajevima kada taj lan ima osobine navedene prilikom analize linearnog regresionog modela, oceni emo parametre , i iz uzora kih podataka (xi,yi), i = 1, 2, ..., n, metodom minimiziranja sume svih kvadrata stohasti kog lana
i, izra unate na uzora kim podacima u odnosu na ocenjene vrednosti za , i .
Naime, neka je, recimo, ocena parametra koeficijent a, ocena parametrakoeficijent b, a ocena parametra koeficijent c. Tada je uzora ka kvadratna
regresiona kriva, koju emo obeležiti sa ^
y , jednaka:
2^
xcxbay ,
a za svaki par uzora kih podataka (xi,yi), i = 1, 2, ..., n važi slede e:
iiii xcxbay 2
2^
iii xcxbay .
Koeficijente a, b i c, kao što smo rekli, dobi emo minimiziranjem slede egizraza
n
i
iii
n
i
ii
n
i
i xcxbayyy1
22
1
2^
1
2 ))(()( .
Postupak minimiziranja se sprovodi nalaženjem parcijalnih izvoda navedenog izraza po parametrima a, b i c, i njihovim izjedna avanjem sa nulom:
Poslovna statistika
229
0
))((
0
))((
0
))((
1
22
1
22
1
22
c
xcxbay
b
xcxbay
a
xcxbay
n
i
iii
n
i
iii
n
i
iii
odakle dobijamo slede i sistem jedna ina:
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i
n
i
ii
n
i
i
n
i
i
n
i
i
xcxbxayx
xcxbxayx
xcxbany
1
4
1
3
1
2
1
2
1
3
1
2
11
1
2
11
Ovaj sistem jedna ina ima jedinstveno rešenje po a, b i c.
Ovako dobijene ocene za , i su, pod navedenim regresionim pretpostavkama, najefikasnije ocene. Dakle, važi:
.)(
)(
)(
cE
bE
aE
Poslovna statistika
230
7.2.1. Standardna greška kvadratne regresije, se
Pomo u ovako dobijenih a, b i c, možemo oceniti varijansu stohasti kihlanova i ,
2 sa 2es , po formuli:
33
)(
311
2
111111
2
1
2^
1
2
2
n
yxcyxbyay
n
yy
ns
n
ii
n
ii
n
i
n
i
n
i
ii
n
i
i
e
i dobiti standardnu grešku regresije, se, po formuli:
33
)(
311
2
111111
2
1
2^
1
2
n
yxcyxbyay
n
yy
ns
n
ii
n
ii
n
i
n
i
n
i
ii
n
i
i
e
7.2.2. Koeficijent determinacije kvadratne regresije, r2
Koeficijent determinacije kod kvadratne regresije izra unavamo po formuli:
2
1
1
2
2
1
1
2
11
2
n
y
ny
n
y
nyxcyxbya
rn
i
in
i
i
n
i
in
i
ii
n
i
ii
n
i
i
.
Smisao parametara standardne greške kvadratne regresije, se, i koeficijenta
determinacije kvadratne regresije, r2, isti je kao i kod linearne regresije.
Poslovna statistika
231
7.3. Logaritamska regresija i korelacija
Neka smo iz populacije veli ine N uzeli slu ajan uzorak veli ine n, i neka su na njemu uzeti parovi uzora kih podataka (xi,yi), i = 1, 2, ..., n za obeležja X iY, iju zavisnost ispitujemo. Neka dijagram raspršenosti definisan ovim uzorkom, dat na slici 7.3.1, indicira da se radi o logaritamskoj zavisnosti obeležja X i Y u itavoj populaciji,
XY ln (opravdano pretpostavljena zavisnost obeležja X i Y u itavoj
populaciji).
Zadatak logaritamske regresione analize je da oceni koeficijente i , koji opisuju logaritamsku zavisnost u itavoj populaciji, na osnovu uzora kihpodataka (xi,yi), i = 1, 2, ..., n.
x3
XSlika 7.3.1. Dijagram raspršenosti uzorka
Y
y3
Poslovna statistika
232
Uvo enjem smene XX ln* , logaritamska regresija XY ln svodi
se na linearnu regresiju *XY , pa se ocena parametara i , kao i itava regresiona analiza sprovodi kao za linearnu regresiju, s tim što se umesto
uzora kih vrednosti za nezavisnu promenljivu xi, koriste njihovi logaritmi lnxi.To jest, sve formule i zaklju ci iz linearne regresije važe, samo što vrednosti za xi (i = 1, 2, ..., n) zamenjujemo vrednostima lnxi (i = 1, 2, ..., n).
7.4. Eksponencijalna regresija i korelacija
Neka smo iz populacije veli ine N uzeli slu ajan uzorak veli ine n, i neka su na njemu uzeti parovi uzora kih podataka (xi,yi), i = 1, 2, ..., n za obeležja X iY, iju zavisnost ispitujemo. Neka dijagram raspršenosti definisan ovim uzorkom, dat na slici 7.4.1, indicira da se radi o eksponencijalnoj zavisnosti obeležja X i Y u itavoj populaciji,
XeY (opravdano pretpostavljena zavisnost obeležja X i Y u itavoj
populaciji).
Zadatak eksponencijalne regresione analize je da oceni koeficijente i , koji opisuju eksponencijalnu zavisnost u itavoj populaciji, na osnovu uzora kihpodataka (xi,yi), i = 1, 2, ..., n.
x3 X
Slika 7.4.1. Dijagram raspršenosti uzorka
Y
y3
Poslovna statistika
233
Uvo enjem smena YY ln* , ln* , eksponencijalna regresija XeY se svodi na linearnu regresiju XY ** , pa se ocena
parametara * i , kao i itava regresiona analiza sprovodi kao za linearnu regresiju, s tim što se umesto uzora kih vrednosti za nezavisnu promenljivu yi,koriste njihovi logaritmi lnyi.
Na ovaj na in dobijamo ocenu parametra *, recimo a*, dok ocenu parametra
, koju obeležavamo sa a, dobijamo kao *aea .
Sve formule i zaklju ci iz linearne regresije važe, samo što vrednosti za yi (i = 1, 2, ..., n) zamenjujemo vrednostima lnyi (i = 1, 2, ..., n).
Primer 7.1. U Tabeli 7.1. prikazani su podaci o cenama i prodatoj koli ini(tražnji) jedne vrste proizvoda.
Cena po
1 kg u dinarima
(x)
Tražnja u tonama
(y)
5 42
10 30
12 22
15 14
16 6
Tabela 7.1.
a) Odrediti parametre linearne regresije i predstaviti je grafi ki. b) Odrediti standardnu grešku regresije se.
c) Odrediti standardnu grešku ocene nagiba sb. d) Odrediti koeficijent proste linearne korelacije r, i koeficijent determinacije r2.
e) Odrediti standardnu grešku ocene koeficijenta proste linearne korelacije sr.
f) Testirati postojanje linearne zavisnosti tražnje ovog proizvoda od njegove cene pomo u Studentovog t-testa sa nivoom zna ajnosti = 0,05za: 1) ocenu nagiba, 2) ocenu proste linearne korelacije.
Poslovna statistika
234
g) Odrediti standardnu grešku ocene prose ne vrednosti zavisne promenljive (u ovom slu aju tražnje) _
py
s , pri ceni xp=11 din./kg.
h) Odrediti standardnu grešku ocene individualne vrednosti zavisne promenljive (u ovom slu aju tražnje)
pys , pri ceni xp=11 din./kg.
i) Oceniti interval prose ne vrednosti tražnje pri ceni xp=11
din./kg sa nivoom pouzdanosti 1- = 0,95.
j) Oceniti interval individualne vrednosti tražnje pri ceni xp=11 din./kg sa nivoom pouzdanosti 1- = 0,95.
Rešenje:
a)
Linearna regresija ocenjena iz n uzora kih parova (xi , yi), data je u
obliku xbay^
, gde je:
n
x
bn
y
a
xxn
yxyxn
b
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
112
11
2
111 .
Analiziraju i podatke iz tablice 7.1.a. i imaju i u vidu da je n=5, dobijamo:
Cena po
1 kg u din.
(xi)
Tražnja u
tonama
(yi)xi yi xi
2yi
2
5 42 210 25 1764
10 30 300 100 900
12 22 264 144 484
15 14 210 225 196
16 6 96 256 36
585
1i
ix 1145
1i
iy 10805
1i
ii yx 7505
1
2
i
ix 33805
1
2
i
iy
Tabela 7.1.a.
Poslovna statistika
235
22.595
58)14.3(
5
11414.3
587505
11458108052
ab
Dakle, jedna ina linearne regresije je 22.5914.3^
xy i grafi ki je
predstavljena na slede oj slici.
y = -3.1399x + 59.223
R2 = 0.9745
0
5
10
15
20
25
30
35
40
45
50
0 2 4 6 8 10 12 14 16 18
b) Standardna greška regresije se iznosi:
59.23
108014.311422.593380
2111111
2
n
yxbyay
s
n
ii
n
i
n
i
e
Poslovna statistika
236
c) Standardna greška ocene nagiba sb, iznosi:
295,0
5
58750
59.222
1
1
2
n
x
x
ss
n
i
in
i
i
eb
d) Koeficijent proste linearne korelacije r je:
9872,011433805587505
114581080522
2
11
2
2
11
2
111
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
yynxxn
yxyxn
r
Koeficijent determinacije je kvadrat koeficijenta proste linearne korelacije. tj, koeficijent determinacije je:
9745,09872,0 22r
e)
Standardna greška ocene koeficijenta proste linearne korelacije sr iznosi:
092,02
1 2
n
rsr
Poslovna statistika
237
¸f)
1)
Kako je za n=5 i = 0,05
1824,364.10295.0
14.3
2,2n
b
ts
b,
zaklju ujemo pomo u testa nagiba, uz rizik verovatno e 0,05,
da se parametar nagiba b razlikuje od nule i da postoji linearna
veza izme u cene i tražnje ovog proizvoda.
2)
Kako je za n=5 i = 0,05
1824,373.10092,0
9872,0
2,2n
r
ts
r,
zaklju ujemo pomo u testa korelacije, uz rizik verovatno e 0,05,
da postoji linearna veza izme u cene i tražnje ovog proizvoda.
g)
Standardna greška ocene prose ne vrednosti tražnje ovog
proizvoda _
py
s , pri ceni xp=11 din./kg, je:
17,1
5
58750
5
5811
5
159.2
12
2
2
1
1
2
2
1
_
n
x
x
n
x
x
nss
n
i
in
i
i
n
i
i
p
ey p
Poslovna statistika
238
h)
Standardna greška ocene individualne vrednosti tražnje ovog
proizvodapys , pri ceni xp=11 din./kg, je:
11.3
5
58750
5
5811
5
1159.2
11
2
2
2
1
1
2
2
1
n
x
x
n
x
x
nss
n
i
in
i
i
n
i
i
p
ey p
i)
Kako je
683.24223.591114.3)11(^
py ,
to interval prose ne vrednosti tražnje pri ceni xp=11 din./kg sa nivoom
pouzdanosti 1- = 0,95, iznosi:
41.2895.20
17.11824,3683.2417.11824,3683.24
__
2,2
^
2,2
^
p
p
ynpp
ynp
YE
YE
styYEstypp
Poslovna statistika
239
j)
Kako je
683.24223.591114.3)11(^
py ,
to interval individualne vrednosti tražnje pri ceni xp=11 din./kg sa
nivoom pouzdanosti 1- = 0,95, iznosi:
58.3478.14
11.31824,3683.2411.31824,3683.242
,2
^
2,2
^
p
p
yn
ppyn
p
Y
Y
styYstypp
Poslovna statistika
240
8. INDEKSI
Dosadašnja analiza varijabiliteta odre enih obeležja u populaciji nije razmatrala promene obeležja u razli itim vremenskim trenucima, ve su se analizirale promene obeležja unutar osnovnog skupa (populacije) u okviru jednog vremenskog trenutka (ili intervala) i analiza se usmeravala na strukturu obeležja u okviru populacije ili na povezanosti koje ta struktura ima sa strukturama drugih obeležja. Vreme, dakle, u ovim analizama nije predstavljalo promenljivu, ili faktor zavisnosti, ve je samo odre ivalo trenutak (ili interval) u kome su analize vršene. Zbog toga se dosadašnji metodi statisti ke analize nazivaju metodi stati ke statisti ke analize.
Naravno da se sve pojave (a naro ito ekonomske) manje ili više menjaju u vremenu. Metodi statisti ke analize pomo u kojih se analizira vremenska zavisnost obeležja, odnosno vremenska zavisnost njegovog varijabiliteta, nazivaju se metodi dinami ke statisti ke analize.
Vremenska zavisnost obeležja prati se pomo u vremenskih serija, kojepredstavljaju nizove podataka o vrednosti odre enog obeležja u odre enim vremenskim trenucima. Poželjno je da ti izabrani vremenski trenuci budu takvi da su vremenski intervali izme u svaka dva uzajamno sukcesivna trenutka me usobno jednaki.
Naravno, da bi analiza vremenskih serija omogu ila ispravne zaklju ke o dinamici posmatranog obeležja, neophodno ja da isto obeležje bude definisano i mereno na isti na in u svim vremenskim trenucima. Na taj na in se dobijaju takozvane homogene vremenske serije, i one su predmet naše dalje analize.
U ovom udžbeniku upozna emo dva razli ita metoda dinami ke statisti ke
analize.
Prvi metod, koji emo analizirati u ovom poglavlju, jeste metod indeksa (iliskra eno – indeksi), po kome se vrši relativno upore ivanje vrednosti jednog ili više obeležja u razli itim vremenskim trenucima, i iz tih relativnih promena obeležja u razli itim vremenskim trenucima donose se odre eni zaklju ci.
Drugi metod, koji je analiziran u devetom poglavlju ovog udžbenika, jeste metod dekompozicije vremenskih serija, pomo u koga se pokušavaju prona i osnovne komponente vremenske serije. Tako e, u devetom poglavlju
Poslovna statistika
241
je dat i osvrt na predvi anja ponašanja vremenske serije u bliskoj budu nosti,odnosno na prognozu vrednosti obeležja u bliskoj budu nosti.Indeksi koji izražavaju relativnu promenu vrednosti jednog obeležja u razli itim trenucima, nazivaju se individualni indeksi, dok se indeksi koji izražavaju relativnu promenu vrednosti grupe obeležja u razli itim trenucima, nazivaju grupni (agregatni) indeksi.
Indeksi (i individualni i grupni) generalno se mogu svrstati u tri osnovne grupe: indeks cena, indeks koli ina (indeks fizi kog obima) i indeks vrednosti (indeks proizvoda koli ina i cena). Iz ovih indeksa izvedeni su razni drugi indeksi: indeks produktivnosti, indeks troškova života, indeks realnih primanja, itd.
8.1. Individualni indeksi
Kao što je re eno, individualni indeksi su relativni brojevi kojima se prati promena vrednosti jednog obeležja (cena, koli ina...) u razli itim vremenskim trenucima.
Ukoliko se prati promena obeležja u odnosu na jednu unapred izabranu vrednost obeležja iz nekog vremenskog trenutka, onda se takvi indeksi nazivaju bazni. Tada se ta izabrana vrednost obeležja, sa kojom se ostale vrednosti upore uju, naziva baza.
Ukoliko se prati promena vrednosti obeležja u jednom trenutku u odnosu na vrednost obeležja iz prethodnog trenutka, onda se takvi indeksi nazivaju lan ani.
8.1.1. Individualni bazni indeksi, Bi
Ozna imo sa nyyy ,,, 21 vrednosti obeležja u trenucima nttt ,,, 21 , gde je sa
iy ozna ena vrednost obeležja u trenutku it , i neka je sa By ozna ena bazna
vrednost obeležja u trenutku Bt .
Tada se individualni bazni indeksi, koje ozna avamo sa Bi, izra unavaju po formuli:
100B
ii
y
yB (i = 1, 2, ..., n).
Poslovna statistika
242
Ukoliko, recimo, bazni indeks u trenutku ti iznosi 35,106iB , to zna i da je
vrednost obeležja u trenutku ti za 6,35% ve a od vrednosti obeležja u baznom
trenutku, dok ako, recimo, bazni indeks u trenutku ti iznosi 34,92iB , to
zna i da je vrednost obeležja u trenutku ti za 7,66% manja od vrednosti obeležja u baznom trenutku.
Primer 8.1.1. Koriste i podatke iz Tabele 8.1.1, analizirati promene ukupnog broja zaposlenih u odnosu na 2002. godinu, koriste i bazne indekse.
Godina Broj zaposlenih (000)
2001. 178 2002. 169 2003. 180 2004. 195 2005. 201
Tabela 8.1.1
Rešenje:
Koriste i formulu za dobijanje baznih indeksa 100B
ii
y
yB , gde je bazna
godina 2002, dobijamo:
GodinaBroj
zaposlenih(000)
Bazni indeks
B2002=100
2001. 178 105,33
2002. 169 100
2003. 180 106,5
2004. 195 115,38
2005. 201 118,93
gde je, na primer, B2004 dobijen kao 38.115100169
195100
2002
20042004
y
yB .
Poslovna statistika
243
8.1.2. Individualni lan ani indeksi, Li
Ozna imo sa nyyy ,,, 21 vrednosti obeležja u trenucima nttt ,,, 21 , gde je sa
iy ozna ena vrednost obeležja u trenutku it .
Tada se individualni lan ani indeksi, koje ozna avamo sa Li, izra unavaju po formuli:
1001i
ii
y
yL ( i = 2, ..., n).
Dakle, ne postoji individualni lan ani indeks prvog lana vremenske serije jer prvi lan nema prethodni, pa se nema sa ime upore ivati.
Ukoliko, recimo, lan ani indeks u trenutku ti iznosi 35,106iB , to zna i da je
vrednost obeležja u trenutku ti za 6,35% ve a od vrednosti obeležja u prethodnom trenutku ti-1, dok ako, recimo, bazni indeks u trenutku ti iznosi
34,92iB , to zna i da je vrednost obeležja u trenutku ti za 7,66% manja od
vrednosti obeležja u prethodnom trenutku ti-1.
Primer 8.1.2. Koriste i podatke iz Tabele 8.1.2, analizirati promene ukupnog broja zaposlenih koriste i lan ane indekse.
Godina Broj zaposlenih (000)
2001 178 2002 169 2003 180 2004 195 2005 201
Tabela 8.1.2.
Poslovna statistika
244
Rešenje:
Koriste i formulu za dobijanje lan anih indeksa 1001i
ii
y
yL ( i=2,...,n),
dobijamo:
GodinaBroj
zaposlenih(000)
Lan ani indeks
2001. 178 2002. 169 94,94
2003. 180 106,5
2004. 195 108,33
2005. 201 103,08
gde je na primer L2004 dobijen kao 33.108100180
195100
2003
20042004
y
yL .
8.1.3. Srednji tempo porasta, S
Neka obeležje Y ima tendenciju rasta u periodu t1 do tn.
Ozna imo sa nyyy ,,, 21 vrednosti obeležja Y u trenucima nttt ,,, 21 , gde je
sa iy ozna ena vrednost obeležja u trenutku it .
Srednji tempo porasta, S, predstavlja prose nu porast vrednosti obeležja za posmatrani period, i izra unava se po formuli:
10011
1
nn
y
yS .
Poslovna statistika
245
Kako je
1321
12
3
1
21
1
nn
n
n
nn
n LLLy
y
y
y
y
y
y
y ,
to je srednji tempo porasta jednak:
1001132
nnLLLS .
Ukoliko, recimo srednji tempo porasta u periodu od t1 do tn iznosi 35,6S , to zna i da je vrednost obeležja u periodu od t1 do tn prose no rasla za 6,35% u svakom vremenskom intervalu (ti-1 , ti ), ( i = 2, ..., n).
Primer 8.1.3. Koriste i podatke iz Tabele 8.1.3, prona i srednji tempo porasta broja zaposlenih za period 2001-2005. godine.
Godina Broj zaposlenih (000)
2001. 178 2002. 169 2003. 180 2004. 195 2005. 201
Tabela 8.1.3.
Rešenje:
Srednji tempo porasta je 08.31001178
2011001 44
2001
2005
y
yS .
Dakle, u periodu od 2001. do 2005. godine, broj zaposlenih se prose no
pove avao za 3,08% godišnje.
Poslovna statistika
246
8.1.4. Srednji tempo pada, P
Neka obeležje Y ima tendenciju opadanja u periodu t1 do tn. Ozna imo sa
nyyy ,,, 21 vrednosti obeležja Y u trenucima nttt ,,, 21 , gde je sa iy
ozna ena vrednost obeležja u trenutku it .
Srednji tempo pada, P, predstavlja prose no opadanje vrednosti obeležja za posmatrani period, i izra unava se po formuli:
1001 1
1
nn
y
yP .
Kako je
1321
12
3
1
21
1
nn
n
n
nn
n LLLy
y
y
y
y
y
y
y ,
to je srednji tempo pada jednak:
1001 132
nnLLLP .
Ukoliko, recimo, srednji tempo pada u periodu od t1 do tn iznosi 35,6P , to zna i da je vrednost obeležja u periodu od t1 do tn prose no opadala za 6,35% u svakom vremenskom intervalu (ti-1 , ti ), (i = 2, ..., n).
Primer 8.1.4. Koriste i podatke iz Tabele 8.1.4, prona i srednji tempo pada broja zaposlenih za period 2001-2005. godine.
Godina Broj zaposlenih (000)
2001. 178 2002. 169 2003. 160 2004. 162 2005. 158
Tabela 8.1.4.
Poslovna statistika
247
Rešenje:
Srednji tempo pada je 93.2100178
15811001 44
2001
2005
y
yP .
Dakle, u periodu od 2001. do 2005. godine, broj zaposlenih se prose no
smanjivao za 2,93% godišnje.
8.2. Grupni (agregatni) indeksi
Grupni (agregatni) indeksi su relativni brojevi kojima se prati promena vrednosti grupe srodnih obeležja (cena prehrambenih proizvoda, cena mle nihproizvoda, koli ina poljoprivredne proizvodnje...) u razli itim vremenskim trenucima.
Svaki lan odre ene grupe obeležja dat je, naravno, u vidu vremenske serije individualnih indeksa tog lana, a zajedni ka (grupna) analiza se može izvršiti na dva na ina: metodom prose nih odnosa (srednjih vrednosti) i metodomagregata individualnih indeksa sastavnih serija.
U našoj daljoj analizi obeležimo sa pi i qi cenu i koli inu u posmatranom trenutku, a sa p0 i q0 cenu i koli inu u baznom periodu. Tada, naravno, vrednost u posmatranom trenutku iznosi ii qp , a vrednost u baznom trenutku iznosi
00 qp .
8.2.1. Metod prose nih odnosa (srednje vrednosti)
Po metodi prose nih odnosa, grupni indeks grupe obeležja izra unava se kao srednja vrednost individualnih baznih indeksa, izra unatih za istu bazu za svakog lana grupe.
Kako je aritmeti ka sredina prirodna srednja vrednost individualnih baznih indeksa, to se grupni indeksi cena, koli ina i vrednosti, po ovom metodu izra unavaju po slede im formulama:
Poslovna statistika
248
Indeks cena, Ip n
p
p
I
i
p
1000
Indeks koli ina, Iqn
q
q
I
i
q
1000
Indeks vrednosti, Ipqn
qp
qp
I
ii
pq
10000 ,
gde je n broj lanova grupe, odnosno broj individualnih indeksa, a znak ozna ava da se sumiranje vrši tako e po svim lanovima grupe.
Primer 8.2.1. Na osnovu podataka iz Tabele 8.2.1, izra unati za 2005. godinu kao teku u i 2000. godinu kao baznu, po metodi prose nih odnosa, grupni indeks cena, indeks koli ina i indeks vrednosti grupe mle nih proizvoda.
Proizvod Cena u din./kg2000. g.
(p0)
Cena u din./kg2005. g.
(pi)
Prodatakoli ina (t)
2000. g. (q0)
Prodatakoli ina (t)
2005. g. (qi)
Kajmak 1000 1200 55 60 Pavlaka 600 850 80 80 Mleko 300 450 90 100 Jogurt 400 550 40 60
Tabela 8.2.1.
Poslovna statistika
249
Rešenje:
Grupa mle nih proizvoda koju analiziramo sastoji se od n=4 lana
(kajmak, pavlaka, mleko, jogurt), pa koriste i rezultate Tabele 8.2.1.a.,
Proizvod100
0p
pi 1000q
qi 10000 qp
qp ii
Kajmak 120 109,09 130,91
Pavlaka 141,67 100 141,67
Mleko 150 111,11 166,67
Jogurt 137,5 150 206,25
=549,17 =470,2 =645,5
Tabela 8.2.1.a.
po metodi prose nih odnosa dobijamo:
indeks cena 29,1374
17,549100
0
n
p
p
I
i
p
indeks koli ina 55,1174
2,470100
0
n
q
q
I
i
q
indeks vrednosti 375,1614
5,645100
00
n
qp
qp
I
ii
pq .
8.2.2. Metod agregata
Generalno, postoje dva na ina primene metode agregata, odnosno izra unavanja agregatnih indeksa.
Jedan od njih je takozvani neponderisani metod agregata, dok je drugi takozvani ponderisani metod agregata.
Poslovna statistika
250
8.2.2.1. Neponderisani metod agregata
Neponderisanim metodom agregata se grupni neponderisani agregatni
indeks dobija kao koli nik zbira svih vrednosti obeležja lanova grupe u posmatranom trenutku i zbira svih vrednosti obeležja lanova grupe u baznom trenutku.
Dakle, grupni neponderisani agregatni indeksi cena, koli ina i vrednosti, izra unavaju se po slede im formulama:
Indeks cena, Ip 1000p
pI
i
p
Indeks koli ina, Iq 1000q
qI
i
q
Indeks vrednosti, Ipq 10000 qp
qpI
ii
pq ,
gde je n broj lanova grupe, odnosno broj individualnih indeksa, a znak ozna ava da se sumiranje vrši tako e po svim lanovima grupe.
Primer 8.2.2.1. Na osnovu podataka iz Tabele 8.2.2.1, izra unati za 2005. godinu kao teku u i 2000. kao baznu, po metodi neponderisanih agregata, grupni indeks cena, indeks koli ina i indeks vrednosti grupe mle nihproizvoda.
Proizvod Cena u din./kg2000. g.
(p0)
Cena u din./kg2005. g.
(pi)
Prodatakoli ina (t)
2000. g. (q0)
Prodatakoli ina (t)
2005. g. (qi)
Kajmak 1000 1200 55 60 Pavlaka 600 850 80 80 Mleko 300 450 90 100 Jogurt 400 550 40 60
Tabela 8.2.2.1.
Poslovna statistika
251
Rešenje:
Po metodi agregata, grupni neponderisani indeks cena je:
1000p
pI
i
p , indeks koli ina je 1000q
qI
i
q a , indeks vrednosti
je 10000 qp
qpI
ii
pq . Imaju i u vidu rezultate iz Tabele 8.2.2.1.a.,
Proizvod
Cena u din./kg2000. g.
p0
Cena u din./kg2003. g.
pi
Prodatakoli ina
(t)2000. g.
q0
Prodatakoli ina
(t)2003. g.
qi
p0 q0 pi qi
K 1000 1200 55 60 55000 72000 P 600 850 80 80 48000 68000 M 300 450 90 100 27000 45000 J 400 550 40 60 16000 33000
p0=2300 pi=3050 q0=265 qi=300 = 146000
= 218000
Tabela 8.2.2.1.a.
dobijamo:
indeks cena 61,1321002300
3050100
0p
pI
i
p
indeks koli ina 21,113100265
300100
0q
qI
i
q
indeks vrednosti 32,149100146000
218000100
00 qp
qpI
ii
pq .
Poslovna statistika
252
8.2.2.2. Ponderisani metod agregata
Grupni indeksi dobijeni metodom srednje vrednosti i neponderisanim metodom agregata su realni pokazatelji grupnih promena samo ukoliko svi lanovi grupe imaju približno isti zna aj u okviru grupe kao celine, što je u praksi veoma retko.
U slu ajevima kada lanovi grupe nemaju približno podjednak zna aj u okviru grupe kao celine, ponderisani agregatni grupni indeks je indeks koji adekvatno reprezentuje promenu grupe kao celine, izra unatu na osnovu podataka o promenama svakog lana grupe ponaosob.
Ponderisani agregatni grupni indeks je grupni indeks kod koga se vrednost svake komponente grupe množi nekim brojem (ponderom) koji odre ujezna aj te komponente u grupi. Osnovni je problem kako izabrati ponder svakoj komponenti i pomo u njega obezbediti realno predstavljanje dinamike svih delova složene grupe.
Uobi ajeno je da se prilikom izra unavanja indeksa cene za ponder uzimaju vrednosti koli ina, dok se prilikom izra unavanja indeksa koli ina za ponder uzimaju vrednosti cena lanova grupe. Analizira emo slede e na ine izbora pondera:
- Laspeyers-ov metod, - Pasche-ov metod, - Fisher-ov metod, - Marshal-Edgworth-ov metod.
8.2.2.2.1. Laspeyers-ov metod
Po ovom grupnom ponderisanom agregatnom metodu, ponderi se uzimaju kao vrednosti iz bazne godine, pa je po njemu:
Indeks cena, Ip: 10000
0
qp
qpI
i
p
Indeks koli ina, Iq: 10000
0
pq
pqI
i
q .
Poslovna statistika
253
Primer 8.2.2.2. Na osnovu podataka iz Tabele 8.2.2.2.
Proizvod Cena u din./kg2000. g.
(p0)
Cena u din./kg2005. g.
(pi)
Prodatakoli ina (t)
2000. g. (q0)
Prodatakoli ina (t)
2005. g. (qi)
Kajmak 1000 1200 55 60 Pavlaka 600 850 80 80 Mleko 300 450 90 100 Jogurt 400 550 40 60
Tabela 8.2.2.2.
Izra unati za 2005 god kao teku u i 2000god. kao baznu, po Laspeyers-ovom metodu ponderisanih agregata, grupni indeks cena i indeks koli ina,grupe mle nih proizvoda.
Rešenje:
Koriste i rezultate Tabele 8.2.2.2.a.,
Proizvod00 qp 0qpi 0pqi
Kajmak 55000 66000 60000
Pavlaka 48000 68000 48000
Mleko 27000 40500 30000
Jogurt 16000 22000 24000
=146000 =196500 =162000
Tabela 8.2.2.2.a.
dobijamo da je po Laspeyers-ovom metodu agregata grupni ponderisani
indeks cena 59,134100146000
196500100
00
0
qp
qpI
i
p
indeks koli ina 96,110100146000
162000100
00
0
qp
pqI
i
q .
Poslovna statistika
254
8.2.2.2.2. Pasche-ov metod
Po ovom grupnom ponderisanom agregatnom metodu, ponderi se uzimaju kao vrednosti iz teku e godine, pa je po njemu:
Indeks cena, Ip 1000 i
ii
pqp
qpI
Indeks koli ina, Iq 1000 i
ii
qpq
pqI .
Primer 8.2.2.3. Na osnovu podataka iz Tabele 8.2.2.3.
Proizvod Cena u din./kg2000. g.
(p0)
Cena u din./kg2005. g.
(pi)
Prodatakoli ina (t)
2000. g. (q0)
Prodatakoli ina (t)
2005. g. (qi)
Kajmak 1000 1200 55 60 Pavlaka 600 850 80 80 Mleko 300 450 90 100 Jogurt 400 550 40 60
Tabela 8.2.2.3.
Izra unati za 2005. godinu kao teku u i 2000. kao baznu, po Pasche-ovommetodu ponderisanih agregata, grupni indeks cena i indeks koli ina grupe mle nih proizvoda.
Poslovna statistika
255
Rešenje:
Koriste i rezultate Tabele 8.2.2.3.a.
Proizvodii qp 0qpi 0pqi
Kajmak 72000 66000 60000
Pavlaka 68000 68000 48000
Mleko 45000 40500 30000
Jogurt 33000 22000 24000
=218000 =196500 =162000
Tabela 8.2.2.3.a.
dobijamo da je po Pasche-ovom metodu agregata grupni ponderisani
indeks cena 57,134100162000
218000100
0 i
ii
pqp
qpI ,
indeks koli ina 94,110100196500
218000100
0 i
ii
qpq
pqI .
8.2.2.2.3. Fisher-ov metod (Idealni metod)
Po ovom grupnom ponderisanom agregatnom metodu, indeksi se dobijaju kao geometrijska sredina grupnih ponderisanih indeksa dobijenih Laspeyers-ovom metodom i Pasche-ovom metodom.
Dakle,
Fisher-ov (idealni)
Indeks cena, Ip 100000
0
i
iii
Pqp
qp
qp
qpI
Poslovna statistika
256
Indeks koli ina, Iq 100000
0
i
iii
qpq
pq
pq
pqI .
Primer 8.2.2.4. Na osnovu podataka iz Tabele 8.2.2.4.
Proizvod Cena u din./kg2000. g.
(p0)
Cena u din./kg2005. g.
(pi)
Prodatakoli ina (t)
2000. g. (q0)
Prodatakoli ina (t)
2005. g. (qi)
Kajmak 1000 1200 55 60 Pavlaka 600 850 80 80 Mleko 300 450 90 100 Jogurt 400 550 40 60
Tabela 8.2.2.4.
Izra unati za 2005. godinu kao teku u i 2000. kao baznu, po Fisher-ovommetodu ponderisanih agregata, grupni indeks cena i indeks koli ina grupe mle nih proizvoda.
Rešenje:
Imaju i u vidu rezultate dobijene dobijene u Primeru 8.2.2.2. i Primeru
8.2.2.3, dobijamo da je Fisher-ov idealni
indeks cena:
58,1341003457,13459,1100000
0
i
iii
Pqp
qp
qp
qpI
Poslovna statistika
257
indeks koli ina:
95,1101001094,11096,1100000
0
i
iii
qpq
pq
pq
pqI .
8.2.2.2.4. Marshal-Edgworth-ov metod
Po ovom grupnom ponderisanom agregatnom metodu, ponderi se uzimaju kao zbir vrednosti iz teku e i bazne godine, pa je po njemu:
Indeks cena, Ip 100)(
)(
00
0
i
ii
pqqp
qqpI
Indeks koli ina, Iq 100)(
)(
00
0
i
ii
qppq
ppqI
Primer 8.2.2.5. Na osnovu podataka iz Tabele 8.2.2.5.
Proizvod Cena u din./kg2000. g.
(p0)
Cena u din./kg2005. g.
(pi)
Prodatakoli ina (t)
2000. g. (q0)
Prodatakoli ina (t)
2005. g. (qi)
Kajmak 1000 1200 55 60 Pavlaka 600 850 80 80 Mleko 300 450 90 100 Jogurt 400 550 40 60
Tabela 8.2.2.5.
Poslovna statistika
258
Izra unati za 2005. godinu kao teku u i 2000. kao baznu, po Marshal-Edgworth-ovom metodu ponderisanih agregata, grupni indeks cena i indeks koli ina, grupe mle nih proizvoda.
Rešenje:
Na osnovu Tabele 8.2.2.5.a.,
Proizvod
ii qqp 0 iqqp 00 ii ppq 0 ippq 00
Kajmak 138000 115000 132000 121000
Pavlaka 136000 96000 116000 116000
Mleko 85500 57000 75000 67500
Jogurt 55000 40000 60000 38000
=414500 =308000 =383000 =342500
Tabela 8.2.2.5.a.
dobijamo da je po Marshal-Edgworth-ovom metodu
indeks cena
58,134100308000
414500100
)(
)(
00
0
i
ii
pqqp
qqpI
Poslovna statistika
259
indeks koli ina
82,111100342500
383000100
)(
)(
00
0
i
ii
qppq
ppqI .
Zadatak 8.3. Na osnovu podataka iz slede e tabele,
Proizvod Cena u din./kg2001. g.
Cena u din./kg2005. g.
Prodatakoli ina (t)
2001. g.
Prodatakoli ina (t)
2005. g. Kukuruz 950 1200 12 16 Pšenica 760 850 18 24
Raž 330 450 20 30 Je am 640 550 25 22 Ovas 450 500 17 24
Izra unati za 2005. godinu kao teku u i 2001. kao baznu:
a) po metodi agregata grupni neponderisani indeks cena, indeks koli ina, indeks vrednosti; b) po metodi prose nih odnosa grupni neponderisani indeks cena, indeks koli ina, indeks vrednosti; c) po metodi agregata grupni ponderisani indeks cena i indeks koli ina po Laspeyers-ovom metodu; d) po metodi agregata grupni ponderisani indeks cena i indeks koli ina po Pasche-ovom metodu; e) Fisher-ov idealni indeks cena i indeks koli ina;
f) Marshal-Edgworth-ov indeks cena i indeks koli ina.
Poslovna statistika
260
9. ANALIZA VREMENSKIH SERIJA
Neka posmatrano obeležje X u trenucima t1, t2, ..., tn (u našoj analizi ovi trenuci su ekvidistantni), ima vrednosti x1, x2, ..., xn. Tada niz
nitXxiX ii ,...,2,1)()( predstavlja jednu vremensku seriju.
Statisti ka analiza promene obeležja X u vremenu svodi se na kvantitativnu analizu varijacije niza X(i).
Naravno da su uzroci vremenskih varijacija obeležja X mnogobrojni i raznovrsni, i obi no nisu svi ni poznati. Zbog toga su razvijene mnogobrojne metode analiza vremenskih serija pomo u kojih se pokušavaju prona i makar bitni uzroci koji generišu vremenske varijacije, odnosno iz odre enevremenske serije pokušavaju se prona i inioci serije koji su posledica odre enih uzroka. Taj proces se obi no naziva dekompozicija vremenskih
serija na njene osnovne komponente.
Analiza vremenskih serija se osim u pravcu pronalaženja osnovnih komponenti serije, razvijala i u pravcu predvi anja vrednosti serije, odnosno obeležja, u budu nosti, obi no bliskoj. Analiza predvi anja vremenske serije obi no se naziva prognoza serije mada se kod nas ve odoma io i engleski izraz forecasting.
Postoji ogroman broj razli itih, matemati ki veoma komplikovanih metoda koje su razvijene radi analize vremenskih serija. Proces pronalaženja novih metoda e još dugo trajati, ali se, generalno, sve te metode mogu svrstati u dve grupe.
Prva grupa su metode koje vremenske serije analiziraju u vremenskom
domenu, a druga grupa su metode koje vremenske serije analiziraju u frekventnom domenu.
Ova druga grupa metoda (analiza u frekventnom domenu) je predmet spektralne (harmonijske) analize u kojoj vode u ulogu imaju Furijeovi redovi
i kojom se u ovom udžbeniku ne emo baviti.
U ovom udžbeniku emo vremenske serije analizirati u vremenskom domenu, kako u analizi dekompozicije serije, tako i u analizi prognoze, i upozna emo se sa metodama koje nisu previše komplikovane.
Poslovna statistika
261
9.1. Dekompozicija vremenskih serija
U ve em broju slu ajeva se kod vremenskih serija mogu izdvojiti njene etiriosnovne komponente: trend, cikli na komponenta, sezonska komponenta i rezidualna (slu ajna) komponenta.
- Trend je osnovna razvojna tendencija obeležja i nastaje od regularnih uticaja na posmatrnao obeležje. On predstavlja dugoro nu tendenciju razvoja vremenske serije. Trend komponentu vremenske serije obeležava emo sa T,odnosno sa T(i) , i=1,2,...,n.
- Cikli na komponenta su varijacije koje se pojavljuju kao oscilacije oko trenda sa promenljivom periodom koja je obi no ve a od jedne godine. Cikli nu komponentu vremenske serije obeležava emo sa C, odnosno sa C(i),i=1,2,...,n.
- Sezonska komponenta su varijacije koje se pojavljuju kao oscilacije oko trenda sa istom periodom koja je obi no manja do jednaka od jedne godine. Sezonsku komponentu vremenske serije obeležava emo sa S, odnosno saS(i), i=1,2,...,n.
- Rezidualna komponenta su slu ajne ili katastrofalne varijacije. Slu ajnevarijacije imaju karakter slu ajnih grešaka, dok su katastrofalne varijacije posledica nekih prirodnih ili društvenih kataklizmi (poplave, zemljotresi, ratovi i sl...). Rezidualnu komponentu vremenske serije obeležava emo sa R,odnosno sa R(i), i=1,2,...,n.
Za vremensku seriju kažemo da je desezonirana, DX(i), ukoliko iz nje uklonimo sezonsku komponentu S(i).
Naj eš i tipovi modela vremenske serije su aditivni model, multiplikativni
model i mešoviti (kombinovani) model.
Po multiplikativnom modelu vremenska serija je jednaka proizvodu svojih osnovnih komponenti, to jest:
RSCTX odnosno
)()()()()( iRiSiCiTiX i=1,2,...,n,
Poslovna statistika
262
)()()()( iRiCiTiDX i=1,2,...,n.
Po aditivnom modelu vremenska serija je jednaka zbiru svojih osnovnih komponenti, to jest:
RSCTX odnosno
)()()()()( iRiSiCiTiX i=1,2,...,n,
)()()()( iRiCiTiDX i=1,2,...,n.
Po kombinovanom modelu vremenska serija je jednaka zbiru proizvoda nekih svojih osnovnih komponenti, na primer:
RSCTX odnosno
)()()()()( iRiSiCiTiX i=1,2,...,n,
)()()()( iRiCiTiDX i=1,2,...,n.
Naravno da je mogu e da neka od ovih komponenti ne postoji u vremenskim varijacijama obeležja, što zavisi od prirode analiziranog obeležja. Tada ta komponenta nije sastavni deo modela, odnosno jednaka je jedinici u multiplikativnom modelu ili nuli u aditivnom modelu. Ovo se ne odnosi na rezidualnu komponentu, jer ona u svakoj statisti koj analizi vremenskih serija uvek postoji.
Dekompozicija vremenske serije predstavlja pronalaženje svake od gore navedenih komponetni. Kao jedna od provera pravilno izvedene dekompozicije originalne vremenske serije je i pronalaženje srednje vrednosti rezidualne (slu ajne) komponente. Naime, ako je ona u multiplikativnom modelu bliska jedinici, odnosno u aditivnom modelu bliska nuli, to je dovoljno dobar pokazatelj da je dekompozicija adekvantno izvedena.
Kombinovani model se veoma retko koristi, dok su multiplikativni i aditivni model dosta zastupljeni. Dekompoziciju vremenske serije emo analizirati na multiplikativnom metodu vremenske serije.
Poslovna statistika
263
U procesu dekompozicije vremenske serije koristi emo jedan specifi an metod izravnjanja vremenske serije, koji se zove metod pokretnih proseka, PP.
9.1.1. Metod pokretnih proseka (pokretnih sredina), PP
Metod pokretnih proseka naj eš e se koristi za odre ivanje osnovnog toka pojave, to jest za odre ivanje trenda (T) ukoliko cikli na komponenta ne postoji, ili za odre ivanje proizvoda trenda i cikli ne komponente (T C)ukoliko cikli na komponenta postoji.
Pokretni prosek je jedna vešta ka konstrukcija vremenske serije u kojoj je svaki originalni podatak vremenske serije zamenjen aritmeti kom sredinom tog podatka, odre enog broja prethodnih podataka i isto toliko narednih podataka. Ukupan broj lanova ija se aritmeti ka sredina traži je dakle neparan, i predstavlja red proseka.
Tako, ako svaki originalni podatak vremenske serije zamenimo aritmeti kom sredinom tog podatka, jednog prethodnog i jednog narednog podatka, dobijamo tro lani pokretni prosek.
Ukoliko svaki originalni podatak vremenske serije zamenimo aritmeti kom sredinom tog podatka, dva prethodna i dva naredna podatka, dobijamo peto lani pokretni prosek, itd.
Na primer, neka je data vremenska serija x1, x2, ..., xn.
Ako tražimo njen tro lani pokretni prosek, PP(3), tada e prva pokretna sredina biti
3321
2
__ xxxx i ona e zameniti originalni podatak 2x ,
druga pokretna sredina e biti
3432
3
__ xxxx i ona e zameniti originalni podatak 3x ,
Poslovna statistika
264
itd., sve do poslednjeg tro lanog pokretnog proseka
312
1
__nnn
n
xxxx i ona e zameniti originalni podatak 1nx .
Uo imo da ne možemo na i tro lani prosek prvog i poslednjeg originalnog podatka.
Ako tražimo peto lani pokretni prosek, PP(5), vremenske serije x1, x2, ..., xn,tada e prva pokretna sredina biti
554321
3
__ xxxxxx i ona e zameniti originalni podatak 3x ,
druga pokretna sredina e biti
565432
4
__ xxxxxx i ona e zameniti originalni podatak 4x ,
itd., sve do poslednjeg tro lanog pokretnog proseka
51234
2
__nnnnn
n
xxxxxx i ona e zameniti originalni podatak
2nx .
Uo imo da ne možemo na i peto lani prosek prva i poslednja dva originalna podatka.
Ukoliko želimo prona i (2 m+1)- lani pokretni prosek, PP(m), vremenske serije x1, x2, ..., xn,dobi emo izravnatu vremensku seriju
mnmmixm
xm
mj
jii ,,2,1,12
1__
.
Naravno, u ovom slu aju ne možemo na i (2 m+1)- lani pokretni prosek, prvih i poslednjih m originalnih podataka.
Poslovna statistika
265
Mogu e je koristiti i parne pokretne proseke. Tako, ako je data vremenska serija x1, x2, ..., xn, tada bi njen prvi pokretni prosek grupe od etiri podatka bio
44321
3/2
__ xxxxx , drugi
45432
4/3
__ xxxxx , itd., i poslednji
4123
1/2
__nnnn
nn
xxxxx ,
a podatak 3x bi zamenili aritmeti kom sredinom 3/2
__
x i 4/3
__
x ,
24/3
__
3/2
__
3
__ xxx ,
podatak 4x bi zamenili aritmeti kom sredinom 4/3
__
x i 5/4
__
x ,
25/4
__
4/3
__
4
__ xxx , itd., i na kraju
podatak 2nx bi zamenili aritmeti kom sredinom 2/3
__
nnx i 1/2
__
nnx ,
21/2
__
2/3
__
2
__nnnn
n
xxx i tako dobili PP(4) originalne serije.
Uo imo da u ovom slu aju ne možemo na i pokretni prosek prva i poslednja dva lana originalne serije.
Poslovna statistika
266
Primer 9.1.1. Za vremensku seriju iz Tabele 9.1.1. na i tro lani, etvro lani i peto lani pokretni prosek i prikazati ih grafi ki.
Period i xi
zima 2001. g. 1 182 prole e 2002. g. 2 153
leto 2002. g. 3 146 jesen 2002. g. 4 155 zima 2002. g. 5 167
prole e 2003. g 6 140 leto 2003 g. 7 138
jesen 2003. g. 8 164 zima 2003. g. 9 162
prole e 2004. g. 10 148 leto 2004. g. 11 129
jesen 2004. g. 12 139 zima 2004. g. 13 165
prole e 2005. g. 14 148 leto 2005. g. 15 133
jesen 2005. g. 16 145
Tabela 9.1.1.
Rešenje:
Tro lani PP(3), etvoro lani PP(4) i peto lani pokretni prosek PP(5)
originalne serije dat je u Tabeli 9.1.1.a.
Poslovna statistika
267
i xi
PP(3)
3
1
1__
j
ji
i
x
x4
2
1
1/
__
j
ji
ii
x
xPP(4)
21//1
__
iiii
i
xx
x
PP(5)
5
2
2__
j
ji
i
x
x
1 182
2 153 160.3 159
3 146 151.3 155.25 157.125 160.6
4 155 156 152 153.625 152.2
5 167 154 150 151 149.2
6 140 148.3 152.25 151.125 152.8
7 138 147.3 151 151.625 154.2
8 164 154.7 153 152 150.4
9 162 158 150.75 151.875 148.2
10 148 146.3 144.5 147.625 148.4
11 129 138.7 145.25 144.875 148.6
12 139 144.3 145.25 145.25 145.8
13 165 150.7 146.25 145.75 142.8
14 148 148.7 147.75 147 146
15 133 142
16 145
Tabela 9.1.1.a.
Grafi ki prikaz PP(3), PP(4) i PP(5) dat je na slici 9.1.1.
Poslovna statistika
268
0
20
40
60
80
100
120
140
160
180
200
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Originalna serija
PP(3)
PP(5)
PP(4)
Slika 9.1.1. Grafi ki prikaz PP(3), PP(4) i PP(5)
9.1.2. Odre ivanje trenda, T(i)
Kao što je ve napomenuto, ukoliko u vremenskoj seriji nije izraženo prisutna cikli na komponenta, onda trend aproksimiramo pokretnim prosecima, odnosno
T(i)=PP(i).
Me utim, ukoliko je evidentno prisustvo cikli ne komponente, onda pokretni prosek predstavlja proizvod trenda i cikli ne komponente, odnosno tada prihvatamo da važi
T(i) C(i)=PP(i).
U ovom slu aju (uo eno prisustvo cikli ne komponente), trend nalazimo pronalaženjem glatke krive T(i), koja ima najmanji kvadrat greške u odnosu na podatke originalne serije (i,xi). Dakle, potpuno identi no kao i kod regresione analize, samo što u ovom slu aju metodom najmanjih kvadrata tražimo
Poslovna statistika
269
zavisnost izme u vrednosti obeležja X i vremena t na osnovu podataka (i,xi)
i=1,2,...,n.
Naravno da i u ovom slu aju može postojati linearna veza izme u vrednosti obeležja i vremena koja odre uje linearni trend, zatim paraboli na,eksponencijalna, logaritamska, itd. Sve formule pomo u kojih se metodom najmanjih kvadrata dobijaju razne regresione krive, a koje su date u 7. poglavlju ovog udžbenika, važe i za odre ivanje trenda vremenske serije.
Primer 9.1.2. Prona i linearni trend vremenske serije iz Tabele 9.1.1. pod pretpostavkom da postoji cikli na komponenta. Predstaviti ga grafi ki i tabli no.
Rešenje:
Linearni trend ocenjen iz n uzora kih parova (i , xi), dat je u obliku
ibaiT )( gde je
n
i
bn
x
a
iin
xixin
b
n
i
n
i
i
n
i
n
i
n
i
i
n
i
n
i
i
112
11
2
111.
Rešavanjem ovih jedna ina dobijamo 45.1623618.1 ab , odnosno
linearni trend je oblika 45.1623618.1)( iiT .
Ovaj linearni trend je predstavljen grafi ki na Slici 9.1.2., a tabli no Tabelom
9.1.2.
Poslovna statistika
270
y = -1.3618x + 162.45
0
20
40
60
80
100
120
140
160
180
200
0 5 10 15 20
Series1
Linear (Series1)
Slika 9.1.2. Linearni trend serije iz Tabele 9.1.1.
i xi
T(i)
45.162
3618.1
)(
i
iT
1 182 161.1
2 153 159.7
3 146 158.4
4 155 157
5 167 155.6
6 140 154.3
7 138 152.9
8 164 151.6
9 162 150.2
10 148 148.8
11 129 147.5
12 139 146.1
13 165 144.7
14 148 143.4
15 133 142
16 145 140.7
Tabela 9.1.2. Trend serije
Poslovna statistika
271
9.1.3. Odre ivanje cikli ne komponente, C(i)
Kako je po multiplikativnom modelu , za PP reda 2 m+1,
)()()( iCiTiPP i=m+1,m+2, ... , n-m,
to se cikli na komponenta odre uje iz
)(
)()(
iT
iPPiC i=m+1,m+2, ... , n-m .
esto se radi lakšeg predstavljanja cikli na komponenta predstavlja u obliku C(i) 100.
Primer 9.1.3. Za vremensku seriju iz Tabele 9.1.1. prona i cikli nukomponentu, uz uslov izravnjanja tro lanim pokretnim prosecima. Predstaviti cikli nu komponentu tabli no i grafi ki.
Rešenje:
Imaju i u vidu da je
)(
)()(
iT
iPPiC i=m+1,m+2, ... , n-m ,
dobijamo slede e vrednosti za cikli nu komponentu (Tabela 9.1.3.
i Slika 9.1.3).
Poslovna statistika
272
i xi
PP(3)
3
1
1__
j
ji
i
x
x
T(i)
45.162
3618.1
)(
i
iT
C(i)
)(
))(3(
)(
iT
iPP
iC
C(i) 100
1 182 161.1
2 153 160.3 159.7 1.0038 100.38
3 146 151.3 158.4 0.9556 95.56
4 155 156 157 0.9936 99.36
5 167 154 155.6 0.9895 98.95
6 140 148.3 154.3 0.9614 96.14
7 138 147.3 152.9 0.9635 96.35
8 164 154.7 151.6 1.0205 102.05
9 162 158 150.2 1.0520 105.20
10 148 146.3 148.8 0.9832 98.32
11 129 138.7 147.5 0.9403 94.03
12 139 144.3 146.1 0.9879 98.79
13 165 150.7 144.7 1.0409 104.09
14 148 148.7 143.4 1.0368 103.68
15 133 142 142 0.9998 99.98
16 145 140.7
Tabela 9.1.3. Cikli na komponenta serije
Ciklicna komponenta C(I)
0.85
0.9
0.95
1
1.05
1.1
Ciklicna komponenta C(I)
Slika 9.1.3. Cikli na komponenta serije
Poslovna statistika
273
9.1.4. Odre ivanje sezonske komponente, S(i)
Sezonsku komponetu dobijamo usrednjavanjem proizvoda sezonske i rezidualne komponente. Usrednjavanje se vrši po sezonama za koje tražimo sezonsku komponentu, a proizvod sezonske i rezidualne komponente dobijamo kao koli nik originalne serije i serije pokretnih proseka. Naime, po multiplikativnom modelu važi:
)()()()()( iRiSiCiTiX i=1,2,...,n
)()()( iCiTiPP i=m+1,m+2, ... , n-m ,
pa je
)(
)(
)()(
)()()()()()(
iPP
iX
iCiT
iRiSiCiTiRiS i=m+1,m+2, ... , n-m.
Sezonsku komponentu, koja se još naziva i sezonski indeks, dobijamo usrednjavanjem proizvoda S(i) R(i) po sezonama za koje tražimo sezonski indeks.
esto se radi lakšeg predstavljanja sezonska komponenta predstavlja u obliku S(i) 100.
Pokažimo to na primeru vremenske serije iz Tabele 9.1.1.
Primer 9.1.4. Za vremensku seriju iz Tabele 9.1.1. prona i sezonsku komponentu, uz uslov izravnanja tro lanim pokretnim prosecima.
Rešenje:
Kako je
)(
)(
)()(
)()()()()()(
iPP
iX
iCiT
iRiSiCiTiRiS i=m+1,m+2, ... , n-m ,
to je (videti Tabelu 9.1.4).
Poslovna statistika
274
i xi
PP(3)
3
1
1__
j
ji
i
x
x
S(i) R(i)
))(3(
)(
)()(
iPP
iX
iRiS
S(i) R(i) 100
1 182
2 153 160.3 0.9543 95.43
3 146 151.3 0.9648 96.48
4 155 156 0.9936 99.36
5 167 154 1.0844 108.44
6 140 148.3 0.9438 94.38
7 138 147.3 0.9367 93.67
8 164 154.7 1.0603 106.03
9 162 158 1.0253 102.53
10 148 146.3 1.0114 101.14
11 129 138.7 0.9303 93.03
12 139 144.3 0.9630 96.30
13 165 150.7 1.0951 109.51
14 148 148.7 0.9955 99.55
15 133 142 0.9366 93.66
16 145
Tabela 9.1.4. Proizvod sezonske i rezidualne komponente serije
Sezonsku komponentu dobijamo usrednjavanjem proizvoda sezonske i
rezidualne komponente serije )()( iRiS , gde se usrednjavanje vrši po sezoni
za koju tražimo sezonski indeks ( u ovom slu aju po godišnjim dobima). Za
originalnu seriju iz našeg primera, indeksi reprezentuju:
i=1,5,9,13, zimski period,
i=2,6,10,14, prole ni,
i= 3,7,11,15 letnji,
i=4,8,12,16 jesenji period,
pa je (videti Tabelu 9.1.4.a),
Poslovna statistika
275
Zima Prole e Leto Jesen
2002 0.9543 0.9648 0.9936
2003 1.0844 0.9438 0.9367 1.0603
2004 1.0253 1.0114 0.9303 0.9630
2005 1.0951 0.9955 0.9366_____
RSS 1.0683 0.9762 0.9421 1.0056
Tabela 9.1.4.a
odnosno sezonska serija S(i) data je u Tabeli 9.1.4.b.
i xi
PP(3)
3
1
1__
j
ji
i
x
x
S(i) R(i)
))(3(
)(
)()(
iPP
iX
iRiS
S(i)
____________
)()(
)(
iRiS
iS
S(i) 100
1 182
2 153 160.3 0.9543 0.9762 97.62
3 146 151.3 0.9648 0.9421 94.21
4 155 156 0.9936 1.0056 100.56
5 167 154 1.0844 1.0683 106.83
6 140 148.3 0.9438 0.9762 97.62
7 138 147.3 0.9367 0.9421 94.21
8 164 154.7 1.0603 1.0056 100.56
9 162 158 1.0253 1.0683 106.83
10 148 146.3 1.0114 0.9762 97.62
11 129 138.7 0.9303 0.9421 94.21
12 139 144.3 0.9630 1.0056 100.56
13 165 150.7 1.0951 1.0683 106.83
14 148 148.7 0.9955 0.9762 97.62
15 133 142 0.9366 0.9421 94.21
16 145
Tabela 9.1.4.b. Sezonska komponenta serije
Poslovna statistika
276
9.1.5. Odre ivanje rezidualne komponente, R(i)
Rezidualna komponenta serije dobija se kao koli nik proizvoda sezonske i rezidualne komponete i sezonske komponente originalne serije, odnosno
)(
)()()(
iS
iRiSiR i=m+1,m+2, ... , n-m .
esto se radi lakšeg predstavljanja i rezidualna komponenta predstavlja u obliku R(i) 100.
Pokažimo to na primeru vremenske serije iz Tabele 9.1.1.
Primer 9.1.5. Za vremensku seriju iz Tabele 9.1.1. prona i rezidualnu komponentu, uz uslov izravnjanja tro lanim pokretnim prosecima. Prikazati je tabelarno i grafi ki i prokomentarisati njenu aritmeti ku sredinu.
Rešenje:
Kako je
)(
)()()(
iS
iRiSiR i=m+1,m+2, ... , n-m ,
to je (videti Tabelu 9.1.5).
Poslovna statistika
277
i xi
PP(3)
3
1
1__
j
ji
i
x
x
S(i) R(i)
))(3(
)(
)()(
iPP
iX
iRiS
S(i)
____________
)()(
)(
iRiS
iS
R(i)
)(
)()(
)(
iS
iRiS
iR
1 182
2 153 160.3 0.9543 0.9762 0.9775
3 146 151.3 0.9648 0.9421 1.0240
4 155 156 0.9936 1.0056 0.9881
5 167 154 1.0844 1.0683 1.0151
6 140 148.3 0.9438 0.9762 0.9668
7 138 147.3 0.9367 0.9421 0.9942
8 164 154.7 1.0603 1.0056 1.0544
9 162 158 1.0253 1.0683 0.9598
10 148 146.3 1.0114 0.9762 1.0360
11 129 138.7 0.9303 0.9421 0.9875
12 139 144.3 0.9630 1.0056 0.9577
13 165 150.7 1.0951 1.0683 1.0251
14 148 148.7 0.9955 0.9762 1.0198
15 133 142 0.9366 0.9421 0.9942
16 145
Tabela 9.1.5. Rezidualna komponenta
Grafik rezidualne komponente dat je na Slici 9.1.5.
Rezidualna komponenta R(I)
0.9
0.95
1
1.05
1.1
Rezidualna komponenta R(I)
Slika 9.1.5. Rezidualna komponenta
Poslovna statistika
278
Aritmeti ka sredina rezidualne komponente iznosi
000018.114
)(15
2i
iR
,
što ukazuje na injenicu da je dekompozicija originalne vremenske serije
adekvatno izvršena.
9.1.6. Odre ivanje desezonirane serije, DX(i)
Desezoniranu seriju dobijamo iz originalne serije kada iz nje eliminišemo sezonsku komponentu. Dakle,
)(
)()(
iS
iXiDX i=m+1,m+2, ... , n-m .
Primer 9.1.6. Desezonirati vremensku seriju iz Tabele 9.1.1, uz uslov izravnjanja tro lanim pokretnim prosecima. Prikazati desezoniranu seriju tabelarno i grafi ki.
Rešenje:
Kako je
)(
)()(
iS
iXiDX i=m+1,m+2, ... , n-m ,
to je (videti Tabelu 9.1.6).
Poslovna statistika
279
i xi
S(i)
____________
)()(
)(
iRiS
iS
DX(i)
)(
)(
)(
iS
iX
iDX
1 1822 153 0.9762 156.73
3 146 0.9421 154.97
4 155 1.0056 154.14
5 167 1.0683 156.32
6 140 0.9762 143.41
7 138 0.9421 146.48
8 164 1.0056 163.09
9 162 1.0683 151.64
10 148 0.9762 151.61
11 129 0.9421 136.93
12 139 1.0056 138.23
13 165 1.0683 154.45
14 148 0.9762 151.61
15 133 0.9421 141.17
16 145
Tabela 9.1.6. Desezonirana serija
Grafi ki prikaz dat je na Slici 9.1.6.
Desezonirana serija DX(I)
120
130
140
150
160
170
Desezonirana serija DX(I)
Slika 9.1.6. Desezonirana serija
Poslovna statistika
280
Zadatak 9.1.1. Za seriju xt iz slede e tabele
Period t xt
zima 2001. g. 1 375 prole e 2002. g. 2 344
leto 2002. g. 3 347 jesen 2002. g. 4 358 zima 2002. g. 5 369
prole e 2003. g. 6 335 leto 2003. g. 7 330
jesen 2003. g. 8 359 zima 2003. g. 9 357
prole e 2004. g. 10 348 leto 2004. g. 11 325
jesen 2004. g. 12 338 zima 2004. g. 13 364
prole e 2005. g. 14 342 leto 2005. g. 15 330
jesen 2005. g. 16 346
odrediti mulitiplikativnim metodom:
a) sezonsku i rezidualnu komponentu serije, sezonske indekse i desezoniranu seriju i predstaviti ih grafi ki; b) cikli nu komponentu serije, pretpostavljaju i da serija ima linearni trend, i predstaviti je grafi ki.
Poslovna statistika
281
9.2. Prognoza vremenske serije
Metod dekompozicije, baziran na poravnanju vremenske serije pokretnim prosecima, neupotrebljiv je za predvi anje ponašanja vremenske serije u budu nosti, jer se pokretnim prosecima gube informacije na krajevima vremenskog intervala (za poslednjih m ta aka originalne serije ne možemo na ipokretni prosek reda (2 m+1).
Zbog toga se u ovom slu aju prognoza vrednosti obeležja X u trenutku i+1,
dobija kao vrednost funkcije trenda u ta ki i+1. Ova prognoza nije dovoljno precizna za ozbiljnije analize predvi anja vrednosti obeležja u budu nosti.
Generalno, ako sa fi obeležimo prognozirane vrednosti obeležja xi u trenutku i,onda važi:
)1(1 iTf i .
Primer 9.2.1. Proceniti vrednost vremenske serije iz Tabele 9.1.1. za zimu 2005. pomo u linije trenda.
Rešenje:
Kako je linija trenda ove serije oblika 45.1623618.1)( iiT , i kako za
zimu 2005. indeks i=17, to je prognozirana vrednost analiziranog obeležja u
zimu 2005. iznosi:
30.13945.162173618.1)17(T .
Drugi, precizniji metod prognoze vremenske serije, postiže se metodom eksponencijalnog poravnanja.
9.2.1. Eksponencijalno poravnanje
Kod esponencijalnog poravnanja smatra se da su uslovi koji su generisali prvi prethodni lan od najve eg uticaja na prognozirani slede i lan, zatim uslovi koji su generisali drugi lan koji prethodi prognoziranom imaju drugi po veli ini stepen uticaja, itd.
Poslovna statistika
282
Po ovom modelu, ekponencijalno poravnate vrednosti, fi, vremenske serije, xi,i=1,2,...,n, dobijaju se po slede em rekurentnom obrascu:
.,,2,1,1011
11
niafaxaf
xf
iii
O igledno da na ovaj na in, za i=n, dobijamo prognoziranu vrednost u bliskoj budu nosti
nnn faxaf 11 .
Broj a je ponder koji odre uje stepen uticaja uslova koji su determinisali prvi prethodni lan, dok ponder (1-a) ukazuje na to da je uticaj svake prethodne opservacije (1-a) puta manji. Naime, važi:
33
22
1
111
11
111
111
iiii
iiiiii
xaaxaaxaaxa
faxaaxafaxaf
xf
Imaju i u vidu da je greška prognoze u trenutku i jednaka
iii fxe ,
ovaj model eksponencijalnog izravnjanja se može pretstaviti i u obliku
.,,2,1,10
11
11
nia
eaffxaffaxaf
xf
iiiiiiii
Poslovna statistika
283
Tako da je nova prognoza jednaka zbiru prethodne prognoze i korekcije za grešku prognoze.
Za primenu u prognozi, pošeljno je da ponder a bude ve i od 0.7. Dok, u slu ajevima u kojima eksponencijalno izravnjanje koristimo umesto serije pokretnih proseka u procesu desezoniranja, poželjno je da ponder a bude manji od 0.4.
Primer 9.2.2. Za vremensku seriju iz Tabele 9.1.1, predstaviti tabelarno i grafi ki eksponencijalno izravnjanje za parametar a=0.8 i a=0.3. Tako e,pomo u ekponencijalno poravnate serije parametrom a=0.8 predvidetivrednost obeležja za zimu 2005.
Rešenje:
Eksponencijalno izravnata serija ft izra unata po formuli
1,...2,111
11
nifaxaf
xf
iii
za a= 0,8 i a=0.3 prikazana je Tabelom 9.2.2. i Slikom 9.2.2.
Period i xi a=0.8 a=0.3 zima 2001 god. 1 182 182 182
prole e 2002 god 2 153 182 182 leto 2002 god 3 146 158.8 173.3
jesen 2002 god 4 155 148.56 165.11 zima 2002 god. 5 167 153.71 162.08
prole e 2003 god 6 140 164.34 163.55 leto 2003 god 7 138 144.87 156.49
jesen 2003 god 8 164 139.37 150.94 zima 2003 god. 9 162 159.07 154.86
prole e 2004 god 10 148 161.41 157 leto 2004 god 11 129 150.68 154.3
jesen 2004 god 12 139 133.34 146.71 zima 2004 god. 13 165 137.87 144.4
prole e 2005 god 14 148 159.57 150.58 leto 2005 god 15 133 150.31 149.8
jesen 2005 god 16 145 136.46 144.76
Tabela 9.2.2 Eksponencijalno poravnanje za a=0.8 i a=0.3
Poslovna statistika
284
Grafik originalne serije i serija eksponencijalnih izravnanja za a=0.8 i a=0.3
dat je na Slici 9.2.2.
0
20
40
60
80
100
120
140
160
180
200
Originalna serija X(I) Eksponencijalno poravnjanje a=0.8
Eksponencijalno poravnjanje a=0.3
Slika 9.2.2. Grafik originalne serije i
ekponencijalno poravnate serije za a=0.8 i a=0.3
Prognozirana vrednost obeležja za zimu 2005. po metodi ekponencijalnog
poravnanja za a=0.8 iznosi:
29.14346.1362.01458.01 161617 faxaf .
U smislu koriš enja metode eksponencijalnog izravnjanja za prognoze vrednosti vremenske serije, preporu uje se njena slede a modifikovana verzija, po kojoj se izravnate vrednosti fi, vremenske serije, xi, i=1,2,...,n, dobijaju po slede em rekurentnom obrascu:
.1,,2,1,10111
11
niafaxaf
xf
iii
Poslovna statistika
285
Na ovaj na in prognozirana vrednost u trenutku n+1 iznosi
nnn faxaf 11 .
Po ovom metodu, za podatke originalne serije iz Primera 9.2.2. dobijamo slede e vrednosti poravnanja i prognoze za zimu 2005. (Tabela 9.2.2.a.i Slika 9.2.2.a)
Period i xi a=0.8 a=0.3 zima 2001. g. 1 182 182 182
prole e 2002. g. 2 153 158.8 173.3 leto 2002. g. 3 146 148.56 165.11
jesen 2002. g. 4 155 153.71 162.08 zima 2002. g. 5 167 164.34 163.55
prole e 2003. g. 6 140 144.87 156.49 leto 2003. g. 7 138 139.37 150.94
jesen 2003. g. 8 164 159.07 154.86 zima 2003. g. 9 162 161.41 157
prole e 2004. g. 10 148 150.68 154.3 leto 2004. g. 11 129 133.34 146.71
jesen 2004. g. 12 139 137.87 144.4 zima 2005. g. 13 165 159.57 150.58
prole e 2005. g. 14 148 150.31 149.8 leto 2005. g. 15 133 136.46 144.76
jesen 2005. g. 16 145 143.29 144.83
Tabela 9.2.2.a. Poboljšano eksponencijalno poravnanje
za a=0.8 i a=0.3
Grafik originalne serije i serija poboljšanih eksponencijalnih izravnanja za a=0.8 i a=0.3 dat je na Slici 9.2.2.a.
Poslovna statistika
286
0
50
100
150
200
Originalna serija X(I)
Poboljsano eksponencijalno poravnjanje a=0.8
Poboljsano eksponencijalno poravnjanje a=0.3
Slika 9.2.2a. Grafik originalne serije i
poboljšano ekponencijalno poravnate serije za a=0.8 i a=0.3
Prognozirana vrednost obeležja za zimu 2005. po metodi poboljšanog ekponencijalnog poravnanja za a=0.8 iznosi:
66.14429.1432.01458.01 161617 faxaf .
Poslovna statistika
287
Zadatak 9.2.2. Za seriju iz slede e tabele prognozirati vrednost za januar 2006, koriste i oba metoda eksponencijalnog izravnanja sa konstantom a=0,9 i predstaviti grafi ki originalnu i poravnate serije.
2004. g. t xt 2005 god t xt
januar 1 110 januar 13 478 februar 2 138 februar 14 485
mart 3 215 mart 15 505 april 4 250 april 16 535 maj 5 203 maj 17 576 jun 6 248 jun 18 587 jul 7 308 jul 19 612
avgust 8 327 avgust 20 645 septembar 9 359 septembar 21 684
oktobar 10 375 oktobar 22 716 novembar 11 420 novembar 23 723 decembar 12 465 decembar 24 758
Poslovna statistika
288
LITERATURA
Aczel, A. D. – Sounderpandian, J.: Complete Business Statistics, 5th Edition, Mc Grew-Hill, 2002. Berenson, M. L. –Levine, D. M. – Krehbiel, T. C.: Basic Business Statistics Concepts and Applications, 8th Edition, Prentice Hall, 2002. Ivkovi , Z. A.: Matemati ka statistika, „Nau na knjiga”, Beograd, 1992.Mališi , J.: Vremenske serije, Matemati ki fakultet, Beograd, 2002. Mari , N. – Ralevi , N. – Filipovi , L.: Poslovna statistika, Megatrend univerzitet primenjenih nauka, Beograd, 2001. Merkle, M. – Vasi , P.: Verovatno a i statistika, „Akademska misao”, Beograd 2001.Mladenovi , P.: Verovatno a i statistika, Matemati ki fakultet, Beograd, 2002. Peter, J. – Brockwell, R. – Davis, A.: „Introduction to Time Series and Forecasting”, Springer Texts in Statistics, 2nd Edition, 2002.Spanos, Aris.: Probability Theory and Statistical Inference, Econometric Modeling with Observational Data, Cambridge University Press, 1999. Vukadinovi , S. V.: Elementi teorije verovatno e i matemati kestatistike, „Privredni pregled”, Beograd, 1990. Vukadinovi , S. V.: Zbirka rešenih zadataka iz matemati ke statistike,„Nau na knjiga”, Beograd, 1988. Vukadinovi , S. V.: Zbirka rešenih zadataka iz teorije verovatno e,„Privredni pregled”, Beograd, 1990. Žiži , M. –Lovri , M. –Pavli i , D.: Metodi statisti ke analize,Ekonomski fakultet, Beograd, 2001.
DODATAK
TABLICE
Prof. dr Dušan Joksimović rođen je 1966. godine u Beogradu.Diplomirao je na Elektrotehničkom fakultetu u Beogradu 1991. godine. Na istom fakultetu je magistrirao 1995. godine i doktorirao 2001. godine.Učesnik je više domaćih i inostranih kongresa i konferencija i ima preko trideset objavljenih ra-dova u domaćim i međunarodnim stručnim pub-likacijama.
Naučni je saradnik Instituta za fiziku i vanredni profesor na Fakulte-tu za poslovne studije Megatrend univerziteta primenjenih nauka za predmete Poslovna matematika i Poslovna statistika.
cyan magenta yellow black
POSLOVNA STATISTIKA
Prof. dr Dušan Joksimović
ISBN 86-7747-205-3 Megatrend univerzitet primenjenih nauka, Beograd, 2006.
Pro
f. d
r D
uša
n J
oks
imo
vić
• PO
SLO
VN
A S
TATI
STIK
A