7. teorijske distribucije - unizd.hr · pdf filejosipa perkov, prof., pred. 3 • teorijske...
TRANSCRIPT
Josipa Perkov, prof., pred. 1
7. TEORIJSKE DISTRIBUCIJE7. TEORIJSKE DISTRIBUCIJE7. TEORIJSKE DISTRIBUCIJE7. TEORIJSKE DISTRIBUCIJE7. TEORIJSKE DISTRIBUCIJE7. TEORIJSKE DISTRIBUCIJE7. TEORIJSKE DISTRIBUCIJE7. TEORIJSKE DISTRIBUCIJE
Josipa Perkov, prof., pred. 2
• Dosad smo spominjali distribucije koje su formirane grupiranjem
opažanja ili elemenata skupa prema nekom obilježju –
originalne, empirijske, opažene distribucije
• Nasuprot empirijskim distribucijama postoje distribucije koje se
mogu očekivati u skladu s iskustvom ili na temelju nekih
pretpostavki – teorijske distribucije
• pretpostavljaju se u nekom statističkom modelu ili ih se
postavlja kao hipotezu koju treba ispitati
Josipa Perkov, prof., pred. 3
• Teorijske distribucije zadane su analitički
• Svaka teorijska distribucija ima svoj zakon vjerojatnosti po
kojem su distribuirane vrijednosti slučajne varijable X
• Osim funkcije vjerojatnosti, te distribucije imaju: očekivanje,
varijancu, koeficijent asimetrije i koeficijent zaobljenosti
Josipa Perkov, prof., pred. 4
VRSTE TEORIJSKIH DISTRIBUCIJA
Normalna (Gaussova) distribucija
Studentova ili t-distribucija
Gama distribucija (χ2 test)
KONTINUIRANE
DISTRIBUCIJE
Binomna distribucija
Poissonova distribucija
Hipergeometrijska distribucija
DISKONTINUIRANE
DISTRIBUCIJE
Josipa Perkov, prof., pred. 5
Binomna distribucijaBinomna distribucijaBinomna distribucijaBinomna distribucija
• Najjednostavnija teorijska distribucija za alternativna obilježja
• Bernoullijev pokus je slučajan pokus:
◘ sa samo dva ishoda (uspjeh/neuspjeh)
◘ svakom ponavljanju pokusa vjerojatnost “uspjeha” jednaka je p i ne mijenja se u različitim pokušajima
◘ vjerojatnost ishoda neuspjeh je q = 1 − p
◘ pokusi su neovisni
◘ broj pokušaja = n
Josipa Perkov, prof., pred. 6
• Ako je n broj ponavljanja Bernoullijevog pokusa, p vjerojatnost
ishoda “uspjeh” (konstantna u svakom ponavljanju), a X broj
ishoda uspjeh, varijabla X je binomna slučajna varijabla, a
pripadajuća distribucija vjerojatnosti naziva se binomnom
distribucijom.
• Slučajna varijabla X ravna se prema binomnoj distribuciji ako je
njezina distribucija vjerojatnosti dana izrazom:
skraćeno B(n, p).
( ) , 0,1, 2,...,x n xn
p x p q x nx
− = =
Josipa Perkov, prof., pred. 7
KOEFICIJENT ZAOBLJENOSTI
KOEFICIJENT ASIMETRIJE
STANDARDNA DEVIJACIJA
OČEKIVANA VRIJEDNOST
BINOMNA DISTRIBUCIJABINOMNA DISTRIBUCIJA
( )E X n p= ⋅
npqσ =
3
q p
npq
−α =
4
1 63
pq
npq
−α = +
Ako je p = q = 0.5, binomna je distribucija simetrična
Josipa Perkov, prof., pred. 8
PRIMJER 1. Varijabla X ravna se po zakonu binomne
distribucije B(5,0.4)
a) Kako glasi funkcija vjerojatnosti?
b) Odredite njezine vrijednosti.
c) Kolika je vjerojatnost da slučajna varijabla poprimi
vrijednosti: X = 0, X ≤ 3, X > 3, 2 ≤ X ≤ 5, 3 < X ≤ 5?
Distribucija B(5,0.4) je binomna, za koju je n = 5 i p = 0.4.
Ona glasi:
( ) 55
0.4 0.6 , 0,1, 2,3, 4,5x xp x x
x
− = =
Josipa Perkov, prof., pred. 10
Tražene vjerojatnosti su:
P(0) = 0.0778
P(X ≤ 3) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3)
= 0.0778 + 0.2592 + 0.3456 + 0.2304 = 0.9130
P (X > 3) = 1 - P(X ≤ 3) = 0.0870
P(2 ≤ X ≤ 5) = P(X = 2) + P(X = 3) + P(X = 4) + P(X = 5)
= 0.3456 + 0.2304 + 0.0768 + 0.0102 = 0.6630
P(3 < X ≤ 5) = P(X = 4) + P(X = 5)
= 0.0768 + 0.0102 = 0.0870
Josipa Perkov, prof., pred. 11
PRIMJER 2. Revizor kontrolira točnost knjiženja knjigovodstvenih
zapisa. Na temelju iskustva, zapis je netočan u približno 5%
slučajeva. Ako se kontroli podvrgne 20 slučajno izabranih zapisa,
kolika je vjerojatnost: da su svi izabrani zapisi točni, da 3 zapisa od
njih 20 sadrže pogrešku knjiženja? Koliki je očekivani broj
pogrešnih zapisa i prosječno odstupanje od prosjeka?
• Bernoullijev pokus: dva su ishoda kontrole zapisa, vjerojatnost
netočnog zapisa je konstantna i iznosi 0.05, a opisani proces
kontrole odgovara zahtjevu neovisnosti pokusa
• Broj netočnih zapisa u danoj kontroli slučajna je varijabla koja
se ravna po zakonu binomne distribucije B(20, 0.05), tj.
( )20
0.05 0.95 , 0,1, 2,..., 20x n xp x x
x
− = =
Josipa Perkov, prof., pred. 12
• Vjerojatnost da su svi zapisi točni jednaka je vjerojatnosti da je
broj netočnih zapisa jednak nuli, tj.:
• Vjerojatnost da 3 zapisa od njih 20 sadrže pogrešku jest:
• Očekivani broj netočnih zapisa iznosi:
a standardna devijacija:
( ) 0 2020
0 0.05 0.95 0.35850
p
= =
( ) 3 1720
3 0.05 0.95 0.05963
p
= =
( ) 20 0.05 1E X np= = ⋅ =
20 0.05 0.95 0.9747npqσ = = ⋅ ⋅ =
Josipa Perkov, prof., pred. 13
POISSONOVA distribucijaPOISSONOVA distribucijaPOISSONOVA distribucijaPOISSONOVA distribucija
• koristi se za opis rijetkih događaja (događaji koji imaju veliki
uzorak i malu vjerojatnost)
• ako je p ≤ 0.1, a n ≥ 50, tada se binomne vjerojatnosti mogu
izračunati aproksimativno pomoću izraza:
gdje je λ ≈ np , e = 2.71828...
• Ta teorijska distribucija zove se Poissonova distribucija.
Granični je slučaj binomne distribucije.
( ) , 0 , 0,1, 2,...!
xe
p x xx
−λ ⋅λ= λ =f
Josipa Perkov, prof., pred. 14
KOEFICIJENT ZAOBLJENOSTI
KOEFICIJENT ASIMETRIJE
STANDARDNA DEVIJACIJA
OČEKIVANA VRIJEDNOST
POISSONOVA DISTRIBUCIJAPOISSONOVA DISTRIBUCIJA
Ako se u konkretnom slučaju ne može odrediti vjerojatnost a priori,
onda se eksperimentiranjem može saznati aritmetička sredina
empirijske distribucije frekvencija
σ = λ
3
1α =
λ
4
13α = +
λ
λµ ==)(XE
Josipa Perkov, prof., pred. 15
PRIMJER 3. Očekivana vrijednost Poissonove distribucije
iznosi 4.
Odredite:
a) standardnu devijaciju,
b) koeficijent asimetrije,
c) koeficijent zaobljenosti i
d) P(X ≤ 3).
Josipa Perkov, prof., pred. 16
E(X) = 4 ⇒ λ = 4
3
4
4 2
1 10.5
2
1 13 3 3.25
4
σ = λ = =
α = = =λ
α = + = + =λ
P(X ≤ 3) = P(0) + P(1) + P(2) + P(3)
= 0.01832 + 0.07326 + 0.14653 + 0.019537 =
= 0.43348
Josipa Perkov, prof., pred. 17
PRIMJER 4. U jednoj banci u prosjeku 5 stranaka po satu zahtijeva
usluge oročavanja depozita. Pretpostavi li se da stranke prispijevaju
u banku neovisno i po satima u radnom vremenu s istom
vjerojatnosti, kolika je vjerojatnost da se pred šalterom za oročavanje
nađu: tri stranke, više od sedam stranaka?
• Broj stranaka koje u jednom satu za radnog vremena bilo kojeg
dana dolaze neovisno i s istom vjerojatnošću u banku pred šalter
za oročavanje depozita diskretna je slučajna varijabla koja
pripada Poissonovoj razdiobi s parametrom λ = 5
3 55(3) 0.1403
3!
ep
−⋅= =
7
0
( 7) 1 ( ) 0.1334x
p x p x=
= − =∑f
Josipa Perkov, prof., pred. 18
• Najvažnija statistička distribucija – model mnogih empirijskih
pojava
• Teorijska distribucija kontinuirane slučajne varijable
• Normalna distribucija N (µ ,σ2 ) je dvoparametarska funkcija
vjerojatnosti, s parametrima µ i σ2 (očekivana vrijednost i
varijanca):
Normalna (Normalna (Normalna (Normalna (gaussovagaussovagaussovagaussova) distribucija) distribucija) distribucija) distribucija
( )2
221
( )2
x
f x e
− −µ
σ=σ π
Josipa Perkov, prof., pred. 19
• Zvonasta je oblika, simetrična s točkama infleksije kojima su
apscise µ ± σ
µ-3σ µ-2σ µ-σ µ µ+σ µ+2σ µ+3σ
68.26%
95.44%99.74%
Očekivana vrijednost, mod i medijan poprimaju jednaku vrijednost. Sve mjere
asimetrije za tu distribuciju jednake su nuli. Koeficijent zaobljenosti normalne
distribucije jednak je 3.
Josipa Perkov, prof., pred. 20
• Svaka se normalna distribucija može svesti na standardiziranu
(aritmetička sredina standardiziranih obilježja jednaka je 0, a
standardna devijacija 1) ako se obilježje X linearno
transformira u X = µ + zσ tako da se umjesto varijable X dobiva
standardizirano obilježje z
• Formula za standardiziranu normalnu distribuciju:
2
21
( ) , 2
z
f z e z−
= − ∞ +∞π
p p
Josipa Perkov, prof., pred. 21
• Jedinična normalna distribucija je tabelirana. U tablici
distribucije vjerojatnosti navedene su površine koje predočuju
vjerojatnost da slučajna varijabla Z poprimi vrijednost iz
intervala 0 ≤ Z ≤ z
• U predstupcu te tablice nalaze se vrijednosti standardiziranog
obilježja z izražene s brojevima s jednom decimalom.
Druga decimala označena je u zaglavlju tabele.
Te vrijednosti označuju udaljenost standardiziranog obilježja
od aritmetičke sredine uzduž apscise.
Josipa Perkov, prof., pred. 22
• Ako se, npr., spuštamo brojevima u predstupcu do 1.9, pa
onda nastavimo udesno do stupca s oznakom 0.6 u zaglavlju,
tada ta vrijednost predstavlja udaljenost od 1.96 standardnih
devijacija od AS.
Broj koji se nalazi na tom mjestu znači proporciju 0.4750
ukupne površine (koja je jednaka jedan) što se nalazi između
ordinate podignute na mjestu AS i ordinate podignute u točki
1.96 standardnih devijacija na apscisi
• Normalna distribucija je simetrična, pa su tablične vrijednosti
dane samo za pozitivne vrijednosti varijable Z
Josipa Perkov, prof., pred. 23
PRIMJER 5. Slučajna varijabla X normalno je distribuirana s
očekivanjem 15 i standardnom devijacijom 3.
Odredite:
a) P(12 ≤ X ≤ 17),
b) P(X ≤ 20),
c) P(X ≤ 13).
Josipa Perkov, prof., pred. 24
P(12 ≤ X ≤ 17) = ?
12 15 17
P1 P2
1 2
11
22
12 151.00
3
17 150.67
3
0.34134 0.24857 0.58991z z
xz
xz
P P P
− µ −= = =
σ
− µ −= = =
σ
= + = + =
Josipa Perkov, prof., pred. 25
P(X ≤ 20) = ?
15 20
0.5
20 151.67
3
0.5 0.5 0.45254 0.95254
z
z
P P
xz
P P
= +
− µ −= = =
σ
= + = + =
Josipa Perkov, prof., pred. 26
P(X ≤ 13) = ?
13 15
0.5
13 150.67
3
0.5 0.5 0.24857 0.25143
z
z
P P
xz
P P
= −
− µ −= = =
σ
= − = − =
Josipa Perkov, prof., pred. 27
PRIMJER 6. Slučajna varijabla X distribuirana je po normalnoj
distribuciji N (µ ,σ2 ). Odredite vjerojatnost da varijabla poprimi
vrijednost iz intervala:
(1) µ < X < µ + σ , µ < X < µ + 2σ , µ < X < µ + 3σ,
(2) µ − σ < X < µ , µ − 2σ < X < µ , µ − 3σ < X < µ ,
(3) µ − σ < X < µ + σ , µ − 2σ < X < µ + 2σ , µ − 3σ < X < µ + 3σ
(4) µ − σ < X < µ + 2σ
(5) µ − 3σ < X < µ + 1.96σ
Josipa Perkov, prof., pred. 28
µ µ+σ
(1)
P (µ < X < µ + σ) = P (0 < Z < 1) = P ( z = 1) = 0.3413
P (µ < X < µ + 2σ) = P (0 < Z < 2) = P ( z = 2) = 0.4772
P (µ < X < µ + 3σ) = P (0 < Z < 3) = P ( z = 3) = 0.4987
Josipa Perkov, prof., pred. 29
(2)
P (µ −σ < X < µ) = P(−1 < Z < 0) = P( z = −1) = P( z = 1) = 0.3413
P (µ −2σ < X < µ) = P(−2 < Z < 0) = P( z = −2) = P( z = 2) = 0.4772
P (µ −3σ < X < µ) = P(−3 < Z < 0) = P( z = −3) = P( z = 3) = 0.4987
(3)
P(µ −−−− σ < X < µ + σ) = P (−1 < Z < 1) = 2P( z = 1) = 0.6826
P(µ −−−− 2σ < X < µ + 2σ) = P (−2 < Z < 2) = 2P( z = 2) = 0.9544
P(µ −−−− 3σ < X < µ + 3σ) = P (−3 < Z < 3) = 2P( z = 3) = 0.9974
Josipa Perkov, prof., pred. 30
(4)
P(µ − σ < X < µ + 2σ) =
= P(−1 < Z < 0) + P(0 < Z < 2) =
= P( z = 1) + P (z = 2) =
= 0.3413 + 0.4772 = 0.8185
0.3413 + 0.4772 = 0.8185
−1 0 2 z
(5)
P(µ − 3σ < X < µ + 1.96σ) = P(−3 < Z < 0) + P(0 < Z < 1.96) =
= P( z = 3) + P (z = 1.96) = 0.4987 + 0.4750 = 0.9737
Josipa Perkov, prof., pred. 32
PITANJA ZA USMENI DIO ISPITA:PITANJA ZA USMENI DIO ISPITA:PITANJA ZA USMENI DIO ISPITA:PITANJA ZA USMENI DIO ISPITA:
1.1.1.1. Binomna distribucijaBinomna distribucijaBinomna distribucijaBinomna distribucija
2.2.2.2. PoissonovaPoissonovaPoissonovaPoissonova distribucijadistribucijadistribucijadistribucija
3.3.3.3. Normalna (Normalna (Normalna (Normalna (GaussovaGaussovaGaussovaGaussova) distribucija) distribucija) distribucija) distribucija