statististika odgovori na pitanja

15
VELV Odgovori na pitanja iz Statistike Novak Mario

Upload: valentino-jovan

Post on 04-Jan-2016

85 views

Category:

Documents


6 download

TRANSCRIPT

Page 1: Statististika Odgovori Na Pitanja

VELV

Odgovori na pitanja iz Statistike

Novak Mario

Page 2: Statististika Odgovori Na Pitanja

1. STATISTIKA je znanstvena disciplina koja se bavi prikupljanjem,grupiranjem i analizom podataka i

informacfija te interpretacijom dobivenih rezultata provedenog istraživanjem,

Statisticke metode temelje se na teoriji vjerojatnosti.

Primjenjuje se u ekonomiji,prometu,poljoprivredi,zdrastvu,unutrašnjoj i vanjskoj trgovini,turizmu,itd.

2. KOMBINATORIKA-je grana matematike koja uglavnom proučava konačne skupove i strukture.

Ako imamo k praznih mjesta i pri tome se prvo mjesto može popuniti sa n1 različitih elemenata drugo mjesto sa

n2 različitih elemenata,...,k-to mjesto sa nk različitih elemenata tada se svih k mjesta može popuniti na

n1,n2,...,nk različitih načina.

3. PERMUTACIJE-jedan od osnovnih pojmova kombinatorike je pojam premutacije.Ako imamo n

različitih elemenata A1,A2,...,An njih je moguće poredati u jedan niz na više različitih načina.Svaki takav

niz,odnosno poredak naziva se permutacija.

PERMUTACIJE BEZ PONAVLJANJA- da bi se izračinao broj permutacija bez ponavljanja može se

zamisliti da su sva mjesta u nizu prazna.Svako moguće popunjavanje tih mjesta daje po jednu

permutaciju,prvo mjesto je moguće popuniti na n načina jer na to mjesto može doći svaki od n

elemenata.Kad je prvo mjesto popunjeno ide na drugo mjesto n-1,a kad je prvo i drugo ide na treće mjesto

n-2.Prema osnovnoj lemi kombinatorike može se zaključiti da će broj mogućih popunjavanja svih n mjesta

biti jednak n*(n-1)(n-2) ... za ovakav produkt prirodnih brojev uvodimo oznaku n faktorjela , broj

permutacija od n različitih elemenata bit će Pn( )

n=

4. PERMUTACIJE S PONAVLJANJEM- ako postoji n različitih elemenata,a izmeĎu njih je r1 jednakih

r2 jednakih,..,rk jednakih uz uvjet da je r1+r2+...+rk=n tada svaki poredak n elemenata u nizu predstavlja

po jednu permutaciju s ponavljanjem ,kada su svi elementi različiti broj permutacija bit će n faktorjela .Ako

imamo r1 meĎusobno jednakih elemenata tada će broj permutacija biti

za slučaj r1 i r2 jednakih elemenata broj permutacija je daljnjim razmatranjem

dolazimo do konačne relacije za broj permutacija s ponavljanjem u obliku

n

r1

n

r1 r2

Pr1r.2r.kn( ) n

r1 r2 ....rk=

5. VARIJACIJE-kod varijacije se od n elemenata uzima njih r pri čemu je r veće ili jednako n.Svako

uvoĎenje uzetih elemenata iz zadanog skupa predstavlja varijaciju.Kada je r=n,varijacije prelaze u

permutacije.

VARIJACIJE BEZ PONAVLJANJA-ako raspolažemo polaznim skupom od n različitih elemenata

A1,A2,......,An tada svaki slog odgovara elementu toga skupa koji predstavlja varijaciju n-tog reda i r-tog

razreda.Da bismo odredili broj varijacija,pretpostavimo r praznih mjesta u nizu.Prvo mjesto moguće je

popuniti na n različitih načina drugo mjesto na n-1 treće mjesto na n-2 itd. Stoga zaključujemo da se r

mjesta može popuniti n*(n-1)(n-2)...[n-(r-1)].Broj mogućih popunjavanja r mjesta odgovara broju varijacija

n-tog reda i r-tog razreda tj.

Množenjem i djeljenjem dobivenog izraza sa bit će Vr

n( )n n 1 n 2 ... n r 1 =

n r( )

Vrn( ) n

n r( )=

6. VARIJACIJE S PONAVLJANJEM- ako je zadano n različitih elemenata,iz kojeg se uzimaju slogovi od

po r elemenata,te ako se u jednom slogu isti elementi mogu pojavljivati dva ili više puta,dobivaju se varijacije

n-tog reda i r-tog razreda s ponavljanjem.Popunjavanje prva dva mjesta moguće je ostvariti na nn=n2 različitih

načina Vrn( )

nr

=

7. KOMBINACIJE- pri rješavanju raznih problema prebrojavanja često puta poredak elemenata u slogu

nije važan.Svaki podskup nekog skupa od n različitih elemenata kod kojega redosljed nje bitan naziva se

kombinacija.

KOMBINACIJE BEZ PONAVLJANJA-ako od n različitih elemenata tvorimo slogove od po r elementa

i pri tome nam nije važan poredak elemenata unutar sloga,tada dobivamo kombnacije n-toga reda i r-toga

razreda.Broj kombinacija odreĎujemo preko broja varijacija.Budući da svaka skupina obuhvaća r faktorjela

varijacija a sa stajališta kombinacija varijacije jedne skupine meĎusobno su identične kombinacije,tada će

broj kombinacija biti jednak broju skupina varijacija tj.

Krn( ) n

r n r( )=

Odgovori na pitanja iz STATISTIKE

Page 3: Statististika Odgovori Na Pitanja

8. KOMBINACIJE S PONAVALJANJEM- Kombinacije s ponavljanjem razlikuju se od kombinacija bez

ponavljanja po tome što se kod njih mogu pojavljivati isti elementi,broj kombinacija s ponavljanjem r-tog razreda

od n elemenata ,bit će Kr

n( ) n r 1 r n 1

=

9. SLUČAJAN DOGAĐAJ I SLUČAJAN POKUS-SLUČAJAN DOGAĐAJ- je takav dogaĎaj koji se u

odreĎenim uvijetima može,ali i ne mora dogoditi,kod proučavanja vjerojatnosti svaki proces promatranja

nekog dogaĎaja naziva se pokusom a rezultat promatranja je ishod pokusa.SLUČAJAN POKUS : bacanje

novčića,kocke; pokus se naziva slučajnim ako se njegov ishod ne može predvidjeti.

10. POJAM VJEROJATNOSTI- svaki ishod pokusa nazivamo elementarnim dogaĎajem a skup svih

elementarnih dogaĎaja nazivamo potpunim skupom dogaĎaja ili prostorom elementarnih dogaĎaja. Ako je

m(A) broj elementarnih dogaĎaja koji realiziraju neki dogaĎaj A tada je vjerojatnost dogaĎaja A omjer

broja m(A) i broja n jednako mogučih dogaĎaja koji tvore potpun skup.

Često se vjerojatnos definira kao omjer broja ponovljenih i broja svih mogučih ishoda pokusa.

P A( )m A( )

n=

11. PROTIVNA VJEROJATNOST- ako je P(A) vjerojatnos dogaĎaja A postavlja se pitanja

kolika je vjerojatnost da dogaĎaj A ne nastupi. Nenastupanje dogaĎaja A takoĎer je jedan dogaĎaj

koji označavamo A(čita se " non A" ) vjerojatnost dogaĎaja A je :

Vjerojatnost protivnog dogaĎaja A je :

Zbroj vjerojatnosti i protivne vjerojatnost jednakog dogaĎaja jednak je 1.

P A( )m A( )

n= p=

P A( )m A( )

n=

n m A( )

n=

n m A( )

n= q= P A( )= 1 P A( )= Q A( )=

P A( ) Q A( ) 1= p q 1=

12. ZBRAJANJE VJEROJATNOSTI-da bismo odredili vjerojatnost jednog složenog dogaĎaja koji je

sastavljen od više elementarnih dogaĎaja prvo čemo definirati pojam ISKLJUČIVOST dogaĎaja.

Elemenentarne dogaĎaje možemo predočiti točkama u ravnini.Ako se dogaĎaj A i B meĎusobno isključuju

tada odgovarajući skupovi A i B nemaju zajedničkih točaka. Za skupove koje nemaju zajednički element

kažemo da su DISJUNKTIVNI.Za dva dogaĎaja A1 i A2 kažemo da se meĎusobno isključuju ako

istovremeno ne mogu nastupiti oba,tj. ili može nastupiti dogaĎaj A1 ili A2.Vjerojatnost da se desi ili

dogaĎaj A1 ili A2 jednaka zbroju vjerojatnosti tih dogaĎaja

Istaknimo da znak "+" kada stoji meĎu dogaĎajima znači "ILI" (desna strana) ,dok znak "+" meĎu

brojevima znači "ZBRAJANJE" ( lijeva strana) na isti način možemo reći da se više dogaĎaja meĎusobno

isključuju , ako se uvijek može pojaviti jedan od njih a ne dva ili više.

P A1 A2 P A1 P A2 =

13. MNOŽENJE VJEROJATNOSTI- pretpostavimo da se dogaĎaj A1 i A2 meĎusobno ne isključuju što

znači da se istovremeno mogu pojaviti oba. Takvi dogaĎaji pripadaju skupovima koji se prisjecaju koji

imaju zajedničkih točaka u presjeku . Istovremeno pojavljivanje oba dogaĎaja je opet

jedan dogaĎaj koji čemo označiti pri čemu taj znak znači "i".DogaĎaji koji se meĎusobno

ne isključuju i mogu se istovremeno zbiti nazivamo nezavisnim dogaĎajima.Za dva nezavisna

dogaĎaja A1 i A2 vrijedi relacija

prema tome vjerojatnost istovremenog pojavljivanja i dogaĎaja A1 i A2 jednaka je produktu vjerojatnosti

pojedinih dogaĎaja A1 i A2 ovo je poznati multiplicioni teorem za dva nezavisna dogaĎaja a primjenjuje se

u slučajevima kada se istovremeno može zbiti dogaĎaj A1 i A2 .

A1 A2

A1 A2

P A1 A2 P A1 P A2 =

Page 4: Statististika Odgovori Na Pitanja

14. VJEROJATNOS SLOŽENIH DOGAĐAJA - meĎutim ako se dogaĎaji ne isključuju tako da može

nastupiti ili dogaĎaj A1 ili A2 ili istovremeno oba dogaĎaja tj. i A1 i A2 tada će vjerojatnost takva dogaĎaja

biti

Pri čemu znak "U" opet ima značenje "ili",ali u ovom slučaju da se može pojaviti ili jedan ili drugi ili oba

dogaĎaja.

Vjerojatnost da će se dogoditi ili dogaĎaj A1 ili A2 ili oba dogaĎaja istovremeno jednaka je zbroju

vjerojatnosti tih dogaĎaja umanjena za produkt njihovih vjerojatnosti.

P A1 A2 P A1 P A2 P A1 P A2 =

15. UVJETNA VJEROJATNOST-često puta vjerojatnost nekog dogaĎaja ovisi o tome što znamo o tjeku

pokusa koji se izvodi. Zamislimo neki pokus u kojem se zbivaju dogaĎaji A i B čije su vjerojatnosti P(A) i

P(B).Postavlja se pitanje kolika je vjerojatnost dogaĎaja A,ako znamo da se dogodio dogaĎaj B. Ovu

vjerojatnost označavamo P(A/B) i čitamo P od A ako je B ( vjerojatnost dogaĎaja A,ako se dogodio

dogaĎaj B).

Ova formula predstavlja poznati Bayesov teorem.Bayesova formula daje vjerojatnost neke hipoteze ako

znamo da se neki dogaĎaj već dogodio. Ona omogučuje mjenjanje vjerojatnosti nekog ishoda pod

utjecajem novih imformacija. Bayes je bio engleski svećenik koji se bavio problemima vjerojatnosti.

PAk

B

P Ak PB

Ak

i

P Ai PB

Ai

=

16. PRIKAZIVANJE STATISTIČKIH PODATAKA-jedan od osnovnh pojmova statistike je statistički

skup.Pod statističkim skupom podrazumijevamo skup elemenata koji posjeduju neko zajedničko obilježje

čija se mjerna vrijednost mijenja od elementa do elementa toga skupa.

1 obilježja-1 dimenzionalan skup

2 obilježja-2 dimenzionalan skup

-prema svojstvu obilježja statičke skupove dijelimo na kontinuirane i diskontinuirane.Kod kontinuiranih

skupova dotičbo obilježje koje ćemo označiti sa x,može poprimiti bilo koju vrijednost iz nekog intervala

(a,b).Npr. Imamo podatke da se neka staza može istračati u razmaku od 12 do 18 sekundi budući da ne

postoje valjani razlozi da vrijeme istrčavanja staze ne bi moglo biti bilo koje vrijeme izmeĎu 12 i 18

sekundi tada je vrijeme istrčavanja jedno kontinuirano obilježje.Skup je diskontinuiran ako obilježje x

poprima diskuntinuiran niz vrijednosti,primjerice x1,x2,...npr. ispit iz nekog predmeta i ocijene su samo od

1 do 5 i u ovom primjeru su te ocjene dijunktivnog karaktera jer mogu biti samo od 1 do 5.

17. UREĐIVANJE I GRUPIRANJE PODATAKA-prikupljene podatke treba urediti da pojava koju

želimo istražiti bude što uočljivija.MeĎu najvažnijim metodama ureĎivanja podataka spada metoda

grupiranja.GRUPIRANJE-podataka ostvaruje se tako da se podaci razvrstavaju u razrede.Jedan od načina

grupiranja jest stavljanje istih vrijednosti u jedan razred,što u stvari znači prebrojavanje koliko se puta

pojedina vrijednost javlja u podacima.MeĎutim na ovaj način često se dobije veliki broj razreda pa je

prikladnije u jedan razred stavljati više uzastopnih vrijednosti obilježja x.

18. SREDNJE VRIJEDNOSTI-MJERE CENTRALNE TENDENCIJE-razlikujemo potpune i položajne

srednje vrijednosti. U potpune srednje vrijednosti spadaju: aritmetička sredina,harmonijska sredina,

geometrijska sredina. Značajke potpunih srednjih vrijednosti je ta što se u njihovom izračunavanju uzimaju

sve vrijednosti varijable. Položajne srednje vrijednosti odreĎene su položajem podatka u nizu a tu spadaju

:mod i medijan.

Page 5: Statististika Odgovori Na Pitanja

19. ARITMETIČKA SREDINA-je jedna od najvažnijih najčešće korištenih mjera centralne tendencije.U

praksi se često naziva i prosjekom.

SVOJSTVA ARITMETIČKE SREDINE:

1. numerički niz x1,x2,...,xn ima samo jednu aritmetičku sredinu.

2.aritmetička sredina uvijek se nalazi izmeĎu najmanje i najveće vrijednosti niza.

3.aritmetička sredina ima svojstva da je suma svih odstupanja jednaka nuli

4.Zbroj kvadrata odstupanja svih vrijednosti obilježja od aritmetičke sredine je minimalan,tj.

manji od zbroja koje ddruge proizvodnje odabrane vrijednosti

5.Aritmetička sredina nije reprezantativna kada su u nemiričkom nizu ekstremno male i

ekstremno velike vrijednosti nekog obilježja

20. GEOMETRIJSKA SREDINA-računa se samo za numeričke nizove sastavljene od pozitivnih

brojeva.Za negrupiran niz x1,x2,...,xn geometrijska sredina se odreĎuje po formuli :

Za grupiran niz će biti

pri čemu xG ima smisla ako su xi>0,za i=1,2,...,k.

Geometrijska sredina obično se koristi kao mjera prosječne brzine promjene nekih pjava u vremenu.

xG

nx1 x2 ... xn=

xG

n

x1

f1x2

f2 ... xk

fk=

21. MOD- je vrijednost obilježja koja se najčešće javlja u statističkom nizu,odnosno to je vrijednost obilježja

s najvećom frekvencijom

Za odreĎivanja moda koristimo formulu

gdje je L donja granica modalnog razreda s najvećom ( korigiranom ) frekvencijom fj dok su fj-1 i fj+1

(korigirane) frekvencije ispred i iza modalnog razreda.Veličina modalnog razreda je ij.Mod je odreĎen

svojim položajem u nizu i na njega ne utječu ni izrazito male ni izrazito velike vrijednosti obilježja,kao što je

slučaj kod aritmetičke sredine.Nedostatak moda je u tome što je osjetljiv na način grupiranja razreda.

Mo xj= ako je fj max fi= 1 i k

Mo Lfj fj 1

fj fj 1 fj fj 1 ij=

22. MEDIJAN- je položajna srednja vrijednost koja po veličini ureĎeni numerički niz dijeli na dva

jednakobrojna dijela.Prema tome odreĎivanje medijana sastoji se u pronalaženju vrijednosti obilježja na

središnjoj poziciji u ureĎenom nizu.Ako je niz x1,x2,...,xn ureĎen po veličini tada je medijan

U slučaju razdiobe frekvencija po razredima tada se za odreĎivanje medijana koristi formula

gdje je L donja granica medijalnog razreda fMED frekvencija medijalnog razreda,"i" veličina razreda.

Medijalni razred odgovara prvoj kumulativnoj frekvenciji koja uključuje N/2.Sumacija se provodi do

medijalnog razreda

Me xj= n neparan jn 1

2=

Mexj xj 1

2= n paran

jn

2=

Me Li

fMED

N

21

n

i

fi

=

1

n

i

f1

Page 6: Statististika Odgovori Na Pitanja

24. MJERE RASPRŠENJA ( DISPERZIJE ) -pri mjerenju mnogih pjava računa se grupiranje rezultata

oko neke srednje vrijednosti .Kada su vrijednosti nekog niza mjerenja gusto grupirane oko neke srednje

vrijednosti tada ta srednja vrijednost dobro reprezentira rezultate,naprotiv ako grupiranost ima mallu

gustoću tada srednja vrijednost slabo reprezentira rezultate.

Skupovi podataka mogu imati jednake srednje vrijednosti,ali se razlikuju po stupnju raspršenosti

vrijednosti obilježja.Prema tome nije dovoljno poznavati samo srednju vrijednost prikupljupljenih

podataka nego treba poznavati i pokazatelje njihove raspršenosti ( DISPERZIJE).

MeĎu najpoznatije mjere raspršenosti spadaju : raspon varijance, interkvartil i koeficijent kvartilne

devijacije,varijanca te iz nje izvedena standardna devijacija i koeficijent varijance.

25. RASPON VARIJACIJE-je najjednostavnija mjera i predstavlja razliku izmeĎu najveće i

najmanje vrijednosti obilježja u numeričkom nizu dakle

Ako je Rx=0 tada nema raspršenja,jer su sve vrijednosti obilježja jednake.

Rx xmax xmin=

26. INTERKVARTIL I KOEFICIJENT KVARTILNE DEVIJACIJE-budući da je raspon varijacije

grupa mjera raspršenosti,računanje raspona preobliku se tako da uzmemo u obzir samo dio podataka.

Raspon varijacije numeričkog obilježja središnjih pedeset posto članova niza zovemo INTERKVARTIL.

Kvartil su vrijednosti statičkog obilježja koje statistički niz dijele na četri jednaka dijela.Mogu se podijeliti

na:donji kvartil i gornji kvartil.

DONJI KVARTIL(Q1)-dijeli ureĎeni niz na dva dijela i to na način da je prva četvrtina,odnosno 25%

članova niza, ima vrijednost obilježja manju od donjeg kvartila.Preostale tri četvrtine odnosno 75% imaju

vrijednosti veće od donjeg kvartila.

GORNJI KVARTIL(Q3)-dijeli ureĎen niz na dva dijela i to na način da prve tri četvrtine ,odnosno 75%

članova niza ima vrijednost obilježja manju od gornjeg kvartila.Preostala posljednja četvrtina,odnosno 25%

imaju vrijednost obilježja veću od gornjeg kvartila.

Ako broj članova niza dijeljiv s brojem četiri bez ostatka,tada je donji kvartil jednak vrijednosti varijable:

gdje je n/4 cijeli dio razlomka.

Kada je broj članova niza dijeljiv s brojem četiri bez ostatka,tada je donji kvartil dat izrazom:

Ako ureĎeni numeričkog niza ima n članova i ako razlomak 3n/4 nije cijeli broj ,tada je gornji kvartil

jednak vrijednosti varijable:

gdje je 3n/4 cijeli dio razlomka.

Kada je razlomak 3n/4 cijeli broj tada je gornji kvartil dat izrazom

U slučaju distribucije frekvencija s razredima vrijednosti kvartila računaju se slično kao kod medijana.

Donji kvartil dat je izrazom

dok je gornji kvartil

Ia Q3 Q1=

Q1 xr= rn

41=

Q1

xr xr 1

2= r

n

4=

Q3 xr= r3n

41=

Q3

xr xr 1

2= r

3n

4=

Q1 L1

N

4i

fi

fkvar

i=

Q3 L1

3N

4i

fi

fkvar

i=

Page 7: Statististika Odgovori Na Pitanja

Pri čemu je N zbroj frekvencija L1 donja granica kvartilnog razreda,fkvar frekvencija kvartilnog razreda "i"

je veličina kvartilnog razreda. a Σfi ozačava zbroj frekvencija do kvartilnog razreda.

Donji kvartilni razred je onaj razred čija komulativna frekvencija prvi put obuhvaća vrijednost N/4 odnosno

3N/4 za gornji kvartilni razred.

Uz interkvartil,koji je apsolutna mjera disperzije,može se definirati i koeficijent devijacije,kao relativna

mjera disperzije tj.

Disperzija će biti manja što je koeficijent kvartilne devijacije bliži nuli.Visoke vrijednosti koeficijenta

kvartilne devijacije pokazuju relazivno jaku raspršenost obilježja u nizu.

VQ

Q3 Q1

Q3 Q1= 0 VQ 1

27. VARIJANCA I STANDARDNA DEVIJACIJA-varijanca je najvažnija mjera raspršenja vrijednosti

kvantitativne varijable.Do varijance dolazimo kvadriranjem pojedinačkih razlika vrijednosti obilježja od

aritmetičke sredine.Kvadriranje se provodi kako bi se izbjegle negativne vrijednosti.Prema tome varijanca

je aritmetička sredina kvadrata odstupanja vrjednosti numeričke varijable od njezine aritmetičke sredine.Za

negrupiran niz data je izrazom

dok je za grupiran niz :

pri čemu je xi razredna sredina.

STANDARDNA DEVIJACIJA-je apsolutna mjera raspršenja i predstavlja prosječno odstupanje

vrijednosti numeričke varijable od aritmetičke sredine.Iskazuje se u istoj dimenziji kao i obilježje.

2 1

N xi xsr

2=

2 1

Nfi xi xsr

2=

i

fi xi2

x

2

=

28. MOMENTI-su parametri koji se računaju kao presjeci zbroja odstupanja numeričke varijable od

odabrane vrijednosti dignut na neku potenciju.

Razlikujemo centralne i pomoćne momente.Slično kao što se definira varijanca,može se definirati centralni

moment r-tog reda (r=0,1,2...) za grupiran niz bit će

kada je r=0 dobivamo Mo=1

dok je r=1 dobivamo M1=0.

Ova dva momenta su konstantne veličine i oni ne daju nikakvu informaciju o svojstvima same

distribucije.Za r=2 centralni moment jednak je varijanci i pokazuje rasprostiranje numeričke varijable oko

aritmetičke sredije tj. M2=σ2 . Momenti M3 i M4 služe za definiranje koeficijenta asimetrije α3 i

koeficijenta spljoštenosti α4.Pored centralnog momenta definiramo i pomoćne momente koje

izračunavamo oko nule ili neke druge vrijednosti ( parametar koji ima ulogu provizorne sredine ).

Mr

1

Nfi xi xsr r=

29. KOEFICIJENT ASIMETRIJE I KOEFICIJENT SPLJOŠTENOSTI-asimetriju nekog niza

najčešće mijerimo pomoću koeficijenta asimetrije (mogući su i drugi pokazatelji,kao što su Piersonova

mjera asimetrije ili Bowleyeva mjera simetrije). Koeficijent asimetrije je neimenovani broj definiran

izrazom

Za simetrične distribucije koeficijent asimetrije jednak je nuli (α3=0), što je rijedak slučaj u praksi.Većina

razdioba koje se u praksi javljaju imaju svojstvo da im je asimetrija veća što je koeficijent asimetrije veći.

Koeficijent asimetrije obično se kreće u intervalu od -2 do +2 kod izrazito asimetričnog rasporeda

koeficijent α3 izlazi izvan navedenog intervala.

3

M3

3

=

Page 8: Statististika Odgovori Na Pitanja

KOEFICIJENT SPLJOŠTENOSTI- mjeri zaobljenost krivulje numeričkog niza, definira se izrazom

Koeficijent α4 je karakteristika distribucije frekvencija i pokazuje kakva je zaobljenost vrha razdiobe

promatranog skupa u odnosu na normalnu razdiobu za koju je α4=3.Ako je α4,onda je pripadna razdioba

siljastija od normalne razdiobe,dok je α4<3 pripadna razdioba spljoštenija od normalne razdiobe.

4

M4

4

=

30. SLUČAJNE VARIJABLE-DISKONTRINUIRANA SLUČAJNA VARIJABLA-Diskuntinuirana ili

diskrena slučajna jest takva x1,x2,... tako da svaka od njih ima odreĎenu vrijednost p(x1),p(x2)...

Suma svih vjerojatnosti jednaka je jedinici tj Σp(xi)=1. Skup svih vrijednosti slučajne varijable i pripadajućih

vjerojatnosti čini razdiobu ili distribuciju slučajne varijable {xi,p(xi)}, i=1,2,...

Dakle svakoj vrijednosti varijable xi pripada vjerojatnosti p(xi).Zakon po kome se to ostvaruje naziva se

zakon razdiobe ili funkcija vjerojatnosti.Funkcija distribucije slučajne varijable x, zadana je formulom

i pokazuje vjerojatnost da slučajna varijabla x poprimi bilo koju vrijednost manju ili jednaku xo.

F xo xi xo

p xi =

31. OČEKIVANJE DISKONTINUIRANE SLUČAJNE VARIJABLE-pod očekivanjem E(x) slučajne

varijable podrazumijevamo sumu produkata vrijednosti varijable i pripadnih vjerojatnosti tj.

E(x)=Σxi*p(xi)

uz uvijet da red na desnoj strani konvergira apsolutno.

Ako ovaj uvijet nije zadovoljen tada kažemo da varijabla x nema konačnog očekivanja.

Aritmetička sredina u teoriji empiričkih distribucija izraženoj preko relativnih frekvencija

xsr=Σfri*xi

odgovara očekivanje E(x) u teoriji slučajnih varijabli.Ako je zadana slučajna varijabla x ,tada možemo

izgraditi novu varijablu ax+b koja je takoĎer slučajna varijabla, pri čemu su a i b realne konstante.

Očekivanje nove varijable E(ax+b) možemo odrediti preko E(x) na sljedeći način:

E(ax+b)=a*E(x)+b

za slučaj b=0 imamo

E(ax)=a*E(x)

32. VARIJANCA DISKONTINUIRANE SLUČAJNE VARIJABLE-momente drugoga reda naziva se

varijanca slučajne varijable x

dok je standarna devijacija slučajne varijable x.

Kvadriranjem binoma (x-μ)2 i kratkim sreĎivanjem imamo

V(x)=Σxi2*p(xi)-μ

2

Dobili smo relaciju koja je analogna relaciji za varijancu u empiričkim distribucijama.

M2 V x( )= E x ( )2

=

i

xi r p xi

2=

=

V x( )=

Page 9: Statististika Odgovori Na Pitanja

33. MOMENTI DISKONTINUIRANE SLUČAJNE VARIJABLE-kao što smo memente koristili u

empiričkim distribucijama iz istih razloga koristi ćemo ih i u teoriji slučajnih varijabli.Centralnim

momentom r-tog reda diskontinuirane slučajne varijable x predstavlja očekivanje varijable (x-μ)r tj.

gdje je μ=E(x).

Pomoćni moment r-tog reda bit će očekivanje slučajne varijable xr odnosno:

Centralni moment možemo odrediti preko pomoćnih momenata,koristeći relaciju:

U specijalnim slučaju za r=2 dobivamo M2=m2-m12 što odgovara relaciji V(x)=E(x2)-μ2.

Koeficijenti asimetrije i koeficijent spljoštenosti u teoriji slučajnih varijabli,definirat ćemo na isti način

kao i kod empiričkih distribucija tj.

Značenje i uloga ovih koeficijenata ista je kao i kod empiričkih distribucija.

Mr E x ( )r =

i

xi r p xi

=

mr E xr = xi

rp xi =

Mr

0

n

k

1 kr

k

mr k

m1k

=

3

M3

3

= 3

M4

4

=

34. BINOMNA RAZDIOBA-pretpostavimo neki slučajni pokus kojhi se u idealnim uvijetima ponavlja n

puta.Ako se u tom pokusu dogaĎaj A pojavljuje s konstantnom vrijednošću p,tada će vjerojatnost da dogaĎaj

A ne nastupi biti q=1-p.Primjer ovakvog pokusa imamo kod bacanja novčića.Sad se postavlja pitanje kolika

je vjerojatnost da se u n pokusa dogaĎaj A pojavi x puta.

Vjerojatnost da dogaĎaj A nastupi x puta u n pokusa,jednaka je vjerojatnosti da se u nizu na x mjesta pojav

dogaĎaj A ,a na preostali n-x mjesta dogaĎaj A povlaka (non A).Prema zakonu o množenju vjerojatnosti

nezavisnih dogaĎaja ta vjerojatnost je pxqn-x.

Budući da imamo (x povrh n ) kombinacija koje imaju istu vjerojatnost dobit ćemo

Dobili smo formulu koja odreĎuje vjerojatnost da u seriji od n pokusa dogaĎaj A nastupi x puta.

Skup svih parova{x,P(x)} x=1,2,...,n čini BINOMNU RAZDIOBU.

Binomna razdioba odreĎena je parametrima n i p, pa se može kratko označiti B{n,p}.

Prikladnija formula za odreĎivanje binomnih koeficijenata za veće vrijednosti od x i n je rekurzivna formula:

P x( )n

x

px

qn x

=

P x( )n x 1

x

p

q p x 1 =

35. KARAKTERISTIČNE VELIČINE BINOMNE RAZDIOBE- slučajnoj varijabli x binomne razdiobe

pripada Očekivanje E(x)=np

i varijanca slučajne varijable x σ2=npq

36. POISSONOVA RAZDIOBA-do Poissonove razdiobe možemo doći ako krenemo od binomne razdiobe

i pretpostavimo da se radi o rjetkim dogaĎajima,tako da je vjerojatnost p vrlo mala.IzvoĎenjem vrlo velikog

broja pokusa možemo uzeti da će produkt np biti konstantan.Pokazat ćemo da je Poissonova razdioba

granični slučaj binomne razdiobe kada n teži u beskonačno i p teži u nulu,jer u tom slučaju može biti

np=const. pa smo prema tome zakonu vjerojatnosti Poissonove razdiobe dobili :

Ovdje isto imamo rekurzivnu formulu koja glasi :

Očekivanje kod Poissonove razdiobe bit će E(x)=m , a Varijanca σ2=m , dok su koeficijent asimetrje

i spljoštenosti

P x( )m

x

xe

m=

p x( )m

xp x 1 =

3

1

m= 4 3

1

m=

Page 10: Statististika Odgovori Na Pitanja

37. ČEBIŠELJEV TEOREM-Vjerojatnost da slučajna varijabla x poprimi vrijednost izvan intervala

(μ-ε,μ+ε),za proizvoljno ε>0 manja je ili jednaka σ2/ε2

P x ( )

2

2

38. BERNOULLIJEV ZAKON VELIKIH BROJEVA-Neka je izvedeno n nezavisnih pkusa i neka se u

svakome od njih dogaĎah A pojavljuje se s vjerojatnošću p. Ako slučajna varijabla x poprima vrijednosti

jednake broju nastupanja dogaĎaja A u n pokusa ,tada vrijedi

Za velik broj pokusa i za proizvoljni ε>0, vjerojatnost da razlika bude veća od ε, je

isčezavajuće mala.

Bernoullijev teorem možemo jednostavnije intepretirati riječima:što se više pokusa izvodi,skoro je sigurno

da će relativna frekvencija biti bliža stvarnoj vjerojatnosti p dogaĎaja A.

Slučajna varijabla ima binomnu razdiobu pa će očekivanje i varijanca biti

Primjenom teorema Čebiševa imamo:

odnosno:

Ako sada potražimo limes kada n teži u beskonačno desna strana teži nuli pa će težiti i lijeva odnosno:

lim Px

np

0=

x

np

frnx

n=

Ex

n

1

nE x( )=

np

n= p=

2

Vx

n

=1

n2

V x( )=npq

n2

=pq

n=

Px

nE

x

n

vx

n

2

Px

np

pq

n2

lim Px

np

0=

39. KONTINUIRANE SLUČAJNE VARIJABLE-kod diskretnih slučajnih varijabli područje vrijednosti

bio je diskontinuiran niz točaka na brojnom pravcu.

Područje vrijednosti kontinuirane varijable bit će čitav interval,ponekad u granicama (-besk.do+besk.)

Za slučajnu varijablu x kažemo da je kontinuirana (neprekinuta) ako postoji funkcija f(x) sa sljedećim

svojstvima

Ako je područje vrijednosti varijable x interval (a,b) onda uzimamo da je f(x)=0 za sve vrijednosti izvan

tog intervala,pa relacija 2 poprima oblik

Iz prvog svojstva funkcije f(x) proizlazi da vjerojatnost ne može biti negativan broj,dok se drugim uvjetom

zahtjeva da vjerojatnost sigurnong dogaĎaja bude jednaka jedinici.

Funkcija f(x) odreĎuje vjerojatnost koja pripada svakom intervalu (x1,x2) dok je f(x)dx element

vjerojatnosti i predstavlja vjerojatnost da slučajna varijabla primi vrijednost iz intervala (x,x+dx)

f x( ) 0 xR

besk

besk

xf x( )

d 1=

a

b

xf x( )

d 1=

Page 11: Statististika Odgovori Na Pitanja

Funkcija distribucije slučajne varijable bit će

pri čemu f(x)nazivamo funkcijom gustoće vjerojatnosti.

Funkcija f(x) ima značenje vjerojatnosti da slučajna varijabla poprimi bilo koju vrijednost koja je manja ili

jednaka x i može se predstaviti površinom ispod krivulje do točke x (grafička interpretecaija.)

Ako je poznata funkcija distribucije F(x) onda se jednostavnim postupkom deriviranja dobiva funkcija

gustoće vjerojatnosti f(x) odnosno

Za svaki interval (x1,x2) možemo izraziti vjerojatnost P(x1<x<x2) preko funkcije F(x) pa je

F x( )

besk

x

xf x( )

d=

f x( )dF x( )

dx=

P x1 x x2 x1

x2

xf x( )

d= F x2 F x1 =

40. NORMALNA RAZDIOBA-je najvažnija kontinuirana razdioba koju koristimo u atematičkoj

statistici.Poznata je još pod imenom kao GAUSSOVA RAZDIOBA,prema njemačkom matematičaru

K.F.Gaussu (1777.-1855.). Normalna razdioba ima veliku važnost i primjenu u razim područjima,jer se

velik broj drugih razdioba može aproksimitirati ovom razdiobom.

Za kontinuiranu slučajnu varijablu x kažemo da ima normalnu ili Gaussovu razdiobu ako je područje

njenih vrijednosti (-besk. do +besk.) s funkcijom vjerojatnosti

Graf funkcije f(x) naziva se normalna ili Gaussova krivulja.

Gaussova krivulja je osno simetrična u odnosu na pravac x=μ na kojem se nalazi i tjeme krivulje s

maksimalnom vrijednošću

Gaussova krivulja ima točke infleksije za vrijednosti apscise x=μ+-σ.

ProvoĎenjem računa pokazuje se da normalna razdioba ima očekivanje E(x)=μ i varijancu V(x)=σ2,pa se

za ovu razdiobu koristi kraća oznaka N(μ,σ2).Za svaku razdiobu dobiva se da je koeficijent asimetrije α3=0

i koeficijent spljoštenosti α4=3

Zamjenom

dobivamo

gdje je

Funkcija vjerojatnosti jedinične ili standardne normalne razdiobe za koju je μ=0 i σ=1 tj. N(0,1) čije su

vrijednosti tabelirane.Vjerojatnost P(x1<x<x2) da varijabla x normalne razdiobe N(μ,σ2) poprimi neku

vrijednost iz intervala (x1,x2) bit će:

f x( )1

2

e

1

2

x

2

=

F ( )1

2

=

ux

=

f x( )1

2

e

1

2u2

=1

2 u( )=

u( )1

2e

1

2u2

=

P x1 x x2 1

2 x1

x2

xe

1

2

x

d=

Page 12: Statististika Odgovori Na Pitanja

uvoĎenjem već korištene zamjene

dobivamo

pri čemu je

ako uzmemo da je x1=μ,tada je u1=0 pa će biti

Vjerojatnost P(u2) za različite vrijednosti u2 nalaze se u tablicama i pomoću njih moguće je odrediti

svaku drugu vjerojatnost pri normalnoj razdiobi.

ux

=

P x1 x x2 1

2 u1

u2

ue

1

2u2

d=

u1

x1

= u2

x2

=

P u2 P x x2 =1

2 0

u2

ue

1

2u2

d=

41. GAMA RAZDIOBA-prije razmatranja gama razdiobe potrebo je nešto reći o gama funkciji koja je

sastavni dio ove razdiobe.Pod gama funkcijom Γ(n) podrazumijevamo funkciju definiranu izrazom

gdje je n pozitivan broj.

Za gama funkciju vrijedi rekurzivna relacija

Γ(n)=(n-1)*Γ(n-1), n>1

Ako uzmemo da je n cijeli pozitivan broj tada uzastopnim primjenama navedene formule dobivamo da je

Γ(n)=(n-1)!

Varijabla x ima gama razdiobu kada je područje njenih vrijednosti interval (0,+besk.) a funkcija

vjerojatnosti zadana je izrazom

pri čemu je

Parametar k je prirodni broj koji jednoznačno odreĎuje gama razdiobu i naziva se stupnjem slobode

razdiobe.Očekivanje i varijanca varijable x pri gama razdiobi su

E(x)=k V(x)=2*k

Koeficijent asimetrije je veći od nule (α3>0),što znači da je razdioba pozitivno asimetrična.MeĎutim

,pokazuje se da α3 teži nuli kada k teži u beskonačno.

Ako varijabla x ima normalnu razdiobu N(μ,σ2) tada varijabla

zadovoljava gama razdiobu sa stupnjem slobode k=1.

Iz formule

vidimo da je g(v),za k =1,funkcija vjerojatnosti gama razdiobe.

n( )

0

besk

xxn 1

ex

d=

f x( ) Ck x

k 2

2 e

x

2=

Ck

1

2

k

2

k

2

=

Vx

2

=

g v( )1

21

2

v

1 2

2e

1

2v

=

Page 13: Statististika Odgovori Na Pitanja

Za nezavisne normalne varijable x1,x2,...,xn koje imaju jednaka očekivanja i jednake varijance

tj.

E(xn)=μ

V(xn)=σ2

može se pokazati da varijabla

ima gama razdiobu sa stupnjem slobode k=n.

Za nezavisne varijable x1,x2,...,xn koje imaju

E(x1)=E(x2)=...=E(xn)

V(x1)=V(x2)=...=V(xn)=σ2

može se takoĎer pokazati da varijabla

ima gama razdiobu sa stupnjem slobode k=n-1 pri čemu je

2

1

n

i

xi

2

=

2

1

n

i

xi xsr

2

=

xsr

1

n

i

xi

n=

42. TEORIJA UZORKA-ODABIR UZORKA-vidjeli smo da se pomoću uzorka mogu dobiti procjene

pojedinih parametara osnovnog skupa.

Sada se postavlja pitanje koliko su te procjene pouzdane ?

Odnosno sa kojom sigurnušću možemo rezultate dobivene na uzorku proširiti na čitav osnovni skup.

Da bi se to utvrdilo razvijeni su postupci koji se u praksi nazivaju testovi.

IzvoĎenjem testiranja proizvoda tako da se iz osnovnog skupa izabere slučajni uzorak iz kojeg se računa

karakteristika koju želimo testirati.

Pretpostavimo li da je neki parametar osnovnog skupa najčešći aritmetička sredina jednaka odreĎenoj

hipotetičkoj vrijednosti.Slučajni uzorak dobiva se metodom slučajnog odabira elemenata iz osnovnog

skupa,pri čemu se slučajnost osigurava korištenjem objektivnih metoda odabira elemenata osnovnog skupa

treba imati jednaku vjerojatnost izbora u uzorku.To se postiže slučajnim izborom ,a jedna od metoda je

korištenje tablice slučajnih brojeva.Ako su elementi podjednako rasporeĎeni u osnovnom skupu tada se izbor

uzorka može postići uzimanjem svakog k-tog elementa (npr. svaki peti,deseti,stoti i sl. )

43. ARITMETIČKA SREDINA I VARIJANCA UZORAKA- Ako naš osnovni skup ima N elemenata

tj. x1,x2,...,xn tada je aritmetička sredina skupa

Ako iz osnovnog skupa izaberemo uzorke od n elemenata tada će ukupni broj uzorka biti

jer je to broj mogućih kombinacija bez ponavljanja elemenata skupa.

Aritmetička sredina k-tog uzorka bit će :

Prema tome za svaki od mogućih uzoraka možemo odrediti njegovu aritmetičku sredinu. Izračunate

aritmetičke sredine činit će jednu novu raspodjelu koju nazivamo raspodjelom aritmetičkih sredina uzoraka.

Varijanca k-tog uzorka :

Procijena standardne devijacije osnovnog skupa(sk),koja se još naziva i standardna greška bit će

xsr

x1 x2 .... xn

N=

N

n

N

n N n( )=

xk

xk 1

xk 2

.... xk n

n=

k2 1

n

1

n

i

xk i

xk 2

= sk kn

n 1=

Page 14: Statististika Odgovori Na Pitanja

44. PROCIJENE-NEPRISTRANA PROCIJENA-ako slučajna varijabla t(x1,x2,...xn) ima svojstvo da se

njene vrijednosti gomilaju oko neke stvarne vrijednosti parametra Θ u tom slučaju možemo imati

nepristranu procjenu.Za varijablu t(x1,x2,...xn) kaže se da nepristrano procjenjuje parametar Θ ako je

očekivanje E(t) upravo jednako parametru Θ tj. E(t) = Θ.

Tako npr. aritmetička sredina slučajnog uzorka nepristrano procijenjuje očekivanje μ varijable x osnovnog

skupa.

45. INTERVALNE PROCIJENE-intervalna procijena parametra Θ svodi se na odreĎivanje intervala

(a1,a2) za koji se s odreĎenom vjerojatnošću γ može tvrditi da sadrži parametar Θ tj.

P(a1<Θ<a2)=γ

Vjerojatnost γ nazivamo pouzdanost procijene,dok je dužina intervala (a1,a2) preciznost procijene.

46. TESTIRANJE HIPOTEZE svodi se na procjenu da li je razlika izmeĎu hipotetičke vrijednosti i rezultata

uzorka zančajna ili slučajna.Ta se procjena može vršiti uz vjerojatnost od 95% ili 99% odnosno na razini 5% ili

1% signifikantnosti testa.

47. χ2-TEST -Hi-kvadrat test se redovito koristi kada želimo utvrditi da li neke opažane frekvencije

odstupaju od frekvencija dobivenih na osnovi postavljene hipoteze.Razmotrit ćemo skup empiričkih

podataka varijable x,koji su grupirani u n razreda,tako da svakom razredu možemo pridružiti dvije

frekvencije,empiričku fi i teoretsku fti.Budući da se empiričke i teorijske frekvencije u potpunosti ne

podudaraju postavlja se pitanje da li se varijabla x na koju se odnose podaci,pokorava nekoj teorijskoj

razdiobi.

Odgovor na ovo pitanje dobivamo pomoću teorema K.Persona, po kojem se izračunava hi-kvadrat, a on

glasi :

gdje je fi emprička frekvencija,dok je fti teorijska frekvencija.

Hi-kvadrat je veličina koja se približno distribuira po zakonu gama razdiobe s odreĎenim stupnjem

slobode.

Broj stupnjeva slobode dat je izrazom k=n-r-1 pri čemu je n broj razreda,a r broj parametara koji odreĎuju

prilagoĎenu razdiobu.

Ako su teoretske frekvencije manje od pet (fti<5) za početne ili psljednje razreda,onda treba izvršiti

spajanja razreda,pa je u tom slučaju n broj pregrupiranih razreda.

2

1

n

i

fi fti 2

fti

=

Prema tome broj stupnjeva slobode k ovisi o broju razreda n i o razdiobi koju smo prilagodili pa je kod

normalne razdiobe k=n-3

binomne razdiobe k=n-2

Poissonove razdiobe k=n-2

Za broj stupnjeva slobode od k=1 do k=30 izraĎene su tablice iz kojih mogu očitati pripadajuće vrijednosti.

Ako su empirički podaci svrstani u tablicu,tada se broj stupnjeva slobode računa prema formuli

k=(n-1)(m-1)

gdje je n broj redaka,a n broj stupaca tablice.

Što su razlike izmeĎu empiričkih i teorijskih frekvencija manje to će i hi-kvadrat biti manji,pa će istinitost

postavljene hipoteze biti veća.

Ako je hi-kvadrat jednak nuli tada imamo potpuno slaganje izmeĎu empiričkih i teorijskih frekvencija ,što

je rijedak slučaj u praksi.

Po dogovoru uzeto da je hi-kvadrat prevelik ako pada izvan područja kojem pripada vjerojatnost 0.95 pa

se kaže da je hi-kvadrat signifikantan.

Testirano hipoteza se prihvaća ako je P(χ2)>0.05 a odbacuje ako je P(χ2)<0.05.Prema tome područje

prihvačanja hipoteze je P(χ2)>0.05 ili χ2<χo2.Navedeni postupak provodi se na isti način i kod testiranja

hipoteze od 1% signifikantnosti.

n 2 m 2

Page 15: Statististika Odgovori Na Pitanja

48. STUDENTOVA T-RAZDIOBA I T-TEST-do ovog testa došao je W.S.Goset u radu koji je pod

pseudinimom Student objavljeno 1908.godine.Kao što se hi-kvadratni test bazira na gama razdiobi tako se i

ovaj test bazira na t-razdiobi,koja se još naziva i Studentova t-razdioba.

Slučajna varijabla t u ovoj razdiobi ima područje vrijednosti intervala (-besk.,+besk.) i funkciju

vjerojatnosti

gdje je

Razdioba je jednoznačno odreĎena parametrom k koji se naziva stupanj slobode.To je prirodni broj

odreĎen izrazom k=n-1 pri čemu je n broj elemenata skupa n kojem je varijabla t distribuirana po zakonu

t-razdiobe.Pored toga t-razdioba ima sljedeće karakteristike

Formula za t distribuciju je

iz te formule je s procjena koju računamo po formuli

f t( ) C k( ) 1t2

k

k 1

2

=

C k( )

k 1

2

2k

2

=

E t( ) 0= V t( )k

k 2= k 2 3 0=

4 3=

t nxsr o

s=

s2 1

n 11

n

i

xi xsr 2

=