raspodjele podataka

46
Inženjerska statistika Inženjerska statistika Raspodjele podataka Raspodjele podataka Raspodjele podataka Raspodjele podataka za diskretna Raspodjele podataka za diskretna obilježja obilježja Raspodjele podataka za Raspodjele podataka za kontinuirana obilježja kontinuirana obilježja Teorijske raspodjele podataka Teorijske raspodjele podataka

Upload: dympna

Post on 11-Feb-2016

55 views

Category:

Documents


2 download

DESCRIPTION

Raspodjele podataka. Raspodjele podataka za diskretna obilježja Raspodjele podataka za kontinuirana obilježja Teorijske raspodjele podataka. Raspodjele (diskretna obilježja). Hipergeometrijska (složene kombinacije) Binomna (Bernoulli-jev događaj) - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

Raspodjele podatakaRaspodjele podataka• Raspodjele podataka za diskretna Raspodjele podataka za diskretna

obilježjaobilježja• Raspodjele podataka za kontinuirana Raspodjele podataka za kontinuirana

obilježjaobilježja• Teorijske raspodjele podatakaTeorijske raspodjele podataka

Page 2: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

Page 3: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

Raspodjele (diskretna obilježja)Raspodjele (diskretna obilježja)

• Hipergeometrijska (složene kombinacije)Hipergeometrijska (složene kombinacije)

• Binomna (Bernoulli-jev događaj)Binomna (Bernoulli-jev događaj)

• Poisson-ova (zakon rijetkih događaja, potok događaja)Poisson-ova (zakon rijetkih događaja, potok događaja)

Page 4: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Hipergeometrijska raspodjelaHipergeometrijska raspodjela• proizlazi iz dvoslojnog skupa - složene kombinacije – skup od N proizlazi iz dvoslojnog skupa - složene kombinacije – skup od N

elemenata sadrži podskup elemenata sa svojstvom A i podskup elemenata sadrži podskup elemenata sa svojstvom A i podskup elemenata sa svojstvom elemenata sa svojstvom ĀĀ

nn

x el Ax el A (n-x) el (n-x) el ĀĀ

UZORAK

NN

M (M (AA)) N-M (N-M (ĀĀ))

SKUP

Page 5: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

nN

n-x

MNx

M

P(x)

• funkcija vjerojatnosti hipergeometrijske raspodjele:funkcija vjerojatnosti hipergeometrijske raspodjele:

parametri: M, N i n

- n – veličina uzorka

NMMNxn

Mx

1 Nn, M, N ..., N

21

• očekivana vrijednost:očekivana vrijednost: NMnxE

);(

• varijanca: varijanca: 1

1 ];)[( 222

nnN

NM

NMnxE

Page 6: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

543210

0,8

0,6

0,4

0,2

0,0

543210

0,8

0,6

0,4

0,2

0,0

N=10; M=5

X

Prob

abilit

y

N=10; M=3

N=50; M=5 N=50; M=3

Hypergeometric; n=5• utjecaj parametara na oblik hipergeometrijske raspodjele:utjecaj parametara na oblik hipergeometrijske raspodjele:

Page 7: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

Binomna raspodjelaBinomna raspodjela

• Bernoulli-jev događaj – samo dva ishodaBernoulli-jev događaj – samo dva ishoda- vjerojatnost događaja se ne mijenja i iznosi - vjerojatnost događaja se ne mijenja i iznosi pp- vjerojatnost - vjerojatnost q=1-pq=1-p- nezavisni pokušaji (slučajno uzorkovanje)- nezavisni pokušaji (slučajno uzorkovanje)- broj pokušaja (veličina uzorka), - broj pokušaja (veličina uzorka), nn

pp

AA ĀĀ

(1-p)=q(1-p)=q

UZORAK n - elemenataUZORAK n - elemenata

• broj N (elementi skupa) teži u beskonačnost – podvrsta broj N (elementi skupa) teži u beskonačnost – podvrsta hipergeometrijskehipergeometrijske

Page 8: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• funkcija vjerojatnosti binomne raspodjele B (n, p):funkcija vjerojatnosti binomne raspodjele B (n, p):

,...n,xqpxn

P(x) xnx 10,)(

za parametri: n, p

• očekivana vrijednost (aritmetička sredina):očekivana vrijednost (aritmetička sredina): pnxE )(

• varijanca:varijanca: qpn 2

• koeficijent asimetrije:koeficijent asimetrije:

• koeficijent zaobljenosti:koeficijent zaobljenosti:

qpn

q-pM

3 33

qpnqpM

613

44 4

- distribucija će biti uvijek asimetrična ako nijep=q=0,5

Page 9: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• utjecaj parametara utjecaj parametara nn i i pp na oblik binomne raspodjele: na oblik binomne raspodjele:

76543210

0,30

0,25

0,20

0,15

0,10

0,05

0,00

X

Prob

abili

ty

Binomial; n=10; p=0,2

1086420

0,25

0,20

0,15

0,10

0,05

0,00

X

Prob

abili

ty

Binomial; n=10; p=0,5

11109876543

0,30

0,25

0,20

0,15

0,10

0,05

0,00

X

Prob

abili

ty

Binomial; n=10; p=0,8

543210

0,4

0,3

0,2

0,1

0,0

X

Prob

abili

ty

Binomial; n=5; p=0,2

76543210

0,30

0,25

0,20

0,15

0,10

0,05

0,00

X

Prob

abili

ty

Binomial; n=10; p=0,2

121086420

0,25

0,20

0,15

0,10

0,05

0,00

X

Prob

abili

ty

Distribution PlotBinomial; n=20; p=0,2

Page 10: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• ‘‘Galtonova’ daskaGaltonova’ daska – binomni eksperiment – binomni eksperiment– kuglicu spuštamo na čavliće koji su složeni u pravilnu trokutastu rešetkukuglicu spuštamo na čavliće koji su složeni u pravilnu trokutastu rešetku– padom na čavlić kuglica može skrenuti na lijevo ili desno (Bernouli-jev događaj)padom na čavlić kuglica može skrenuti na lijevo ili desno (Bernouli-jev događaj)– daska je pravilna te su ishodi jednako vjerojatni daska je pravilna te su ishodi jednako vjerojatni p=0.5p=0.5– n – n – broj redova čavlićabroj redova čavlića

Link

Page 11: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

– primjer ‘Galtonove’ daske sa primjer ‘Galtonove’ daske sa n=4n=4 reda čavlića: reda čavlića:

- slučajna varijabla poprima vrijednost:0 - za jedan ishod1 - za 4 ishoda2 – za 6 ishoda3 – za 4 ishoda4 – za 1 ishod

- općenito:

Page 12: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• primjer 1. binomne raspodjele:primjer 1. binomne raspodjele:Primjer: Svaki izuzeti uzorak vode ima vjerojatnost da je kontaminiran otpadnom

tvari u iznosu od 10% . Pretpostavimo da se uzroci uzimaju nezavisno s obzirom na prisustvo otpadnih tvari. Potrebno je pronaći:

a) Vjerojatnost da će u 18 izuzetih uzoraka biti točno 2 uzorka kontaminirana?

284,0)2(

9,01,02

18)2(

181,0

162

xP

xP

np

vjerojatnost da će biti točno 2 kontaminirana uzorka

b) Vjerojatnost da će od 18 uzoraka biti barem 4 kontaminirana?

0,1 ; 18( 3) ( 0) ( 1) ( 2) ( 3)( 4) 1 [ ( 3)] 0,098

p nP x P x P x P x P xP x P x

Page 13: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

- grafički prikaz (binomna raspodjela):

76543210

76543210

0,30

0,25

0,20

0,15

0,10

0,05

0,00X

Prob

abili

ty

20 6

0,284

Binomial; n=18; p=0,1

a)

76543210

76543210

0,30

0,25

0,20

0,15

0,10

0,05

0,00X

Prob

abili

ty40

0,0982

Binomial; n=18; p=0,1

b)

Page 14: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• primjer 2. primjene binomne raspodjele:primjer 2. primjene binomne raspodjele:

Primjer: Rad jednog automata kontrolira se uzorcima od 15 proizvoda. U svakom uzorku se ustanovljuje broj defektnih proizvoda. Budući da je uzeto 200 uzoraka, dobiveni rezultati su dani kroz tablicu. Potrebno je pronaći adekvatnu raspodjelu po kojoj se ponašaju podaci te vjerojatnost pojave najviše 2 defektna u uzorku.

xx 00 11 22 33 44 55 66

ffii 7777 8181 3131 77 22 11 11

6543210

90

80

70

60

50

40

30

20

10

0

xi

Freq

uenc

y

Histogram of xi

- radi se o Binomnoj raspodjeli (n konačan):

061,0;15;915,0 nxpnx

9876543210

9876543210

0,4

0,3

0,2

0,1

0,0X

Prob

abili

ty

2

0,941

4

Binomial; n=15; p=0,061

941,0)2();2(

)1()0()2(

939.0061,015

)( )15(

xPxP

xPxPxPx

xP xxprilagodba

Page 15: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

xn P(x)x px q(n-x) P(x)

0 1 1 0,389031 0,389031 0,389031

1 15 0,061 0,414303 0,379087 0,768118

2 105 0,003721 0,441217 0,172386 0,940504

3 455 0,000227 0,46988 0,048528 0,989032

4 1365 1,38E-05 0,500405 0,009457 0,998489

5 3003 8,45E-07 0,532913 0,001352 0,999841

6 5005 5,15E-08 0,567532 0,000146 0,999987

7 6435 3,14E-09 0,6044 1,22E-05 0,999999

8 6435 1,92E-10 0,643664 7,94E-07 1

9 5005 1,17E-11 0,685478 4,01E-08 1

10 3003 7,13E-13 0,730009 1,56E-09 1

11 1365 4,35E-14 0,777432 4,62E-11 1

12 455 2,65E-15 0,827936 1E-12 1

13 105 1,62E-16 0,881721 1,5E-14 1

14 15 9,88E-18 0,939 1,39E-16 1

15 1 6,02E-19 1 6,02E-19 1

- tablica vjerojatnosti za primjer 2.

Page 16: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

Poisson-ova raspodjelaPoisson-ova raspodjela• proizlazi iz binomne r. uz određene uvjete:proizlazi iz binomne r. uz određene uvjete:

• opisuje rijetke događaje (oni koji se javljaju s malom vjerojatnošću)opisuje rijetke događaje (oni koji se javljaju s malom vjerojatnošću)• potok događaja – vjerojatnost promatranog događaja u vremenskom potok događaja – vjerojatnost promatranog događaja u vremenskom

periodu (valovi, naleti...) – periodu (valovi, naleti...) – odabir vremenskog perioda je bitanodabir vremenskog perioda je bitan

vremena) (tijekom .

0

konstpnnp

• funkcija vjerojatnosti Poisson-ove raspodjele P(x):funkcija vjerojatnosti Poisson-ove raspodjele P(x):

,..,xzaexmP(x) m

x

10,!

parametar: m=E(x)

(u literaturi se spominje i λ = parametar m)

Page 17: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

xmpnxE )(

mxmx )(;)(2 • varijanca:varijanca:

• očekivana vrijednost:očekivana vrijednost:

• koeficijent asimetrije:koeficijent asimetrije:m

M 133 3

• koeficijent zaobljenosti:koeficijent zaobljenosti:m

M 1344 4

• rekurzivna formula za Poisson-ovu raspodjelu:rekurzivna formula za Poisson-ovu raspodjelu:

mx

ex

mP(x) !

mx

exm)P(x

)!1(

11

xmxPP(x) )1(

Page 18: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• utjecaj parametra utjecaj parametra mm na Poisson-ovu raspodjelu : na Poisson-ovu raspodjelu :

43210

0,6

0,5

0,4

0,3

0,2

0,1

0,0

X

Prob

abili

ty

Poisson; Mean=0,5

121086420

0,20

0,15

0,10

0,05

0,00

X

Prob

abili

ty

Poisson; Mean=4

876543210

0,30

0,25

0,20

0,15

0,10

0,05

0,00

X

Prob

abili

ty

Poisson; Mean=2

- nakon pokazuje se mod – da su dvije susjedne vrijednosti istih vjerojatnosti

- kada gubi se asimetričnost i Poisson-ova raspodjela teži simetričnoj

m

1m

Page 19: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• primjer 1. primjene Poisson-ove raspodjele:primjer 1. primjene Poisson-ove raspodjele:Primjer: U slučaju tanke bakrene žice, pretpostavlja se da broj pukotina slijedi

zakon Poisson-ove raspodjele sa očekivanjem od 2.3 mikropukotine po milimetru. Potrebno je odrediti:

a) vjerojatnost da se dogodi baš 2 mikropukotine po jednom milimetru žice.

- varijabla x – broj mikropukotina po mm žice

32)( ,xmxE

3,2

!3,2 ex

P(x)x

265,0!23,22 3,2

2

e)P(x

0,30

0,25

0,20

0,15

0,10

0,05

0,00X

Prob

abili

ty

2

0,265

0 8

Distribution PlotPoisson; Mean=2,3

Page 20: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

b) Vjerojatnost da se pojavi barem jedna mikropukotina u 2 mm žice.- varijabla x – broj mikropukotina na 2mm žice

64322)( ,,xE

6,4

!6,4 ex

P(x)x

9899,0)0(11 xP)P(x

0101,0!06,40 6,4

0

e)P(x

0,20

0,15

0,10

0,05

0,00X

Prob

abili

ty

10

0,9899

Distribution PlotPoisson; Mean=4,6

Page 21: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• primjer 2. primjene Poisson-ove raspodjele:primjer 2. primjene Poisson-ove raspodjele:Primjer: Tijekom drugog svjetskog rata London je gađan projektilima V1. Britance je zanimalo kako iz podataka o padanju projektila zaključiti da li je riječ o gađanju nasumce ili se cilja neka točka u južnom Londonu.

- južni London je podijeljen na 576 sektora- u vremenskom periodu promatranja palo je 537 projektila

x >=43210

250

200

150

100

50

0

Valu

e

ExpectedObserved

Chart of Observed and Expected Values Poisson mean for x = 0,928819

Poisson Contributionx Observed Probability Expected Chi-Sq0 229 0,395020 226,74 0,0094791 211 0,366902 211,39 0,0005332 93 0,170393 98,54 0,2698463 35 0,052755 30,62 0,7003804 7 0,014931 7,14 0,0418605 (6,7..) 1 1,57

TEST: N N* DF Chi-Sq P-Value576 0 3 1,02210 0,796

- podaci se ponašaju po Poisson-ovoj razdiobi!- zaključak - V1 nije imao navođenje

Page 22: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

Raspodjele (kontinuirana obilježja)Raspodjele (kontinuirana obilježja)

• Normalna Normalna • Jedinična normalnaJedinična normalna• LognormalnaLognormalna• WeibullovaWeibullova

Page 23: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

Normalna raspodjela Normalna raspodjela • prvi definirao Abraham de Moivre prvi definirao Abraham de Moivre • upotrijebio Gauss (Gauss-ova raspodjela)upotrijebio Gauss (Gauss-ova raspodjela)• najčešće korištena raspodjela – čak 33% procesa u prirodi slijedi zakon najčešće korištena raspodjela – čak 33% procesa u prirodi slijedi zakon

normalne raspodjelenormalne raspodjele• funkcija gustoće vjerojatnosti funkcija gustoće vjerojatnosti f(x)f(x) – zbog kontinuiranog obilježja – zbog kontinuiranog obilježja • nastanak normalne r. - binomni poučak (razvijanje binoma u red , A. de nastanak normalne r. - binomni poučak (razvijanje binoma u red , A. de

Moivre) Moivre)

2

21

0

21)(

50

)()(

)(...)()()(

x

xnxn

x

xxnn

n

exfP(x)

n,qp

qpxn

xPbaxn

ba

babababa

i uvjet uz

binomna r.

funkcija gustoće vjerojatnosti normalne r.

Page 24: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• funkcija gustoće vjerojatnosti normalne raspodjele funkcija gustoće vjerojatnosti normalne raspodjele f(x)f(x)::

xexfx

- za 2

21

21)(

• očekivana vrijednost: očekivana vrijednost: E(x)= E(x)= μ

parametri: μ i σ2(x)

• varijanca: varijanca: σ2(x)

• koeficijent asimetrije: koeficijent asimetrije: αα33== 0 - 0 - simetrična razdiobasimetrična razdioba

• koeficijent zaobljenosti: koeficijent zaobljenosti: αα44== 3 (3 (αα’’44== 0) – 0) – normalno zaobljenanormalno zaobljena

• svojstva funkcije gustoće vjerojatnosti svojstva funkcije gustoće vjerojatnosti f(x)f(x)::

1.1.

2.2.

3.3.

xxf svaki za 0)(

1)( dxxf

2

121 )()(

x

xxxxPdxxf

Page 25: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• veza funkcije gustoće vjerojatnosti veza funkcije gustoće vjerojatnosti f(x)f(x) i funkcija distribucije i funkcija distribucije F(x)F(x) normalne raspodjele:normalne raspodjele:

2

1

)()(x

xdxxfxF

Page 26: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• vjerojatnosti ispod normalne raspodjele vjerojatnosti ispod normalne raspodjele N{N{μμ,, σ σ22}:}:

• utjecaj parametara utjecaj parametara μμ i i σσ22 na oblik normalne raspodjele: na oblik normalne raspodjele:

Page 27: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

Jedinična normalna raspodjela Jedinična normalna raspodjela N{0,1}N{0,1}• standardizirana normalna raspodjela sa parametrima standardizirana normalna raspodjela sa parametrima μμ=0 =0 i i σσ22=1=1 • sve druge normalne raspodjele svodimo (z-transformacija) na jediničnu sve druge normalne raspodjele svodimo (z-transformacija) na jediničnu

normalnu raspodjelunormalnu raspodjelu• bilo koja vrijednost u x domeni se može prikazati kao bilo koja vrijednost u x domeni se može prikazati kao μμ ±± k·k·σσ

x

z• transformacija:transformacija:

Page 28: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• funkcija gustoće vjerojatnosti jedinične normalne raspodjele funkcija gustoće vjerojatnosti jedinične normalne raspodjele f(z):f(z):

1;0;21)( 2

221

z

ezf

• upotrebom jedinične normalne razdiobe standardiziramo odstupanja upotrebom jedinične normalne razdiobe standardiziramo odstupanja preko parametra preko parametra z:z:

1.1. ||zz||=1 =1 → P(z)=0,6827→ P(z)=0,68272.2. ||zz||=1,96 =1,96 → P(z)=0,9500→ P(z)=0,95003.3. ||zz||=2,0 =2,0 → P(z)=0,9545→ P(z)=0,95454.4. ||zz||=3=3 → P(z)=0,9973→ P(z)=0,9973

• područje područje ±±33σσ koje se koristi u konstrukcijama naziva se tolerancija koje se koristi u konstrukcijama naziva se tolerancija• danas procesi u području danas procesi u području ±±33σσ više nisu dovoljno dobri pa se prelazi više nisu dovoljno dobri pa se prelazi

na sustav od na sustav od ±±66σσ • područje od područje od ±±66σσ ima vjerojatnost pojave od 99,9999998 % ima vjerojatnost pojave od 99,9999998 %

Page 29: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• ostale vjerojatnosti kod normalne razdiobe:

Page 30: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• primjer 1. primjene normalne raspodjele:primjer 1. primjene normalne raspodjele:Primjer: Pretpostavimo da se izmjerena jakost struje u vodiču pokorava zakonu normalne raspodjele sa očekivanjem μ=10 mA i varijancom σ2=4 mA2. Kolika je vjerojatnost da će jakost struje premašiti 13 mA?

17,515,012,510,07,55,0

17,515,012,510,07,55,0

0,20

0,15

0,10

0,05

0,00X

Dens

ity

1310

Normal; Mean=10; StDev=2

06681,0)5,1(1)5,1()13(

5,12

)1013()(

zPzPxP

zxz

3210-1-2-3

3210-1-2-3

0,4

0,3

0,2

0,1

0,0z

Dens

ity

1,5

0,0668

0

Normal; Mean=0; StDev=1transformacija

Page 31: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

Lognormalna raspodjela Lognormalna raspodjela

• slučaj kada je logaritam varijable slučaj kada je logaritam varijable xx ( ( ln(x) ln(x) )) normalno distribuiran normalno distribuiran

anadistribuir normalno - yx )ln(• vjerojatnosti pojave varijable vjerojatnosti pojave varijable xx se dobivaju transformacijom varijable se dobivaju transformacijom varijable yy

sa naznakom da je sa naznakom da je ),0( x

• ako ako yy ima normalnu distribuciju sa očekivanjem ima normalnu distribuciju sa očekivanjem αα i varijancom i varijancom ββ22 tada možemo napisati tada možemo napisati x=ex=ey y što je lognormalna varijabla sa funkcijom što je lognormalna varijabla sa funkcijom gustoće vjerojatnosti:gustoće vjerojatnosti:

ostalo za

, za

0

002

1)(

22

2)(ln

βxexxf

x

• raspodjela koja dobro opisuje slučajeve: duljina trajanja proizvodnje, raspodjela koja dobro opisuje slučajeve: duljina trajanja proizvodnje, plaće zaposlenika...plaće zaposlenika...

parametri: α i β2

Page 32: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• utjecaj parametara na oblik lognormalne raspodjele:utjecaj parametara na oblik lognormalne raspodjele:

Page 33: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• primjer primjene lognormalne raspodjele:primjer primjene lognormalne raspodjele:Primjer: Životni vijek poluvodičkog lasera je lognormalno distribuiran sa očekivanjem od =10 h i standardnom devijacijom =1,5 h. Kolika je vjerojatnost da životni vijek premaši 10 000 sati?

701,0)52,0(1)10000(

52,05,1

102103,9;2103,9

);ln(;;10000);10000(1)10000(

zFxP

zx

yxeyyxPxP

x

0,000008

0,000007

0,000006

0,000005

0,000004

0,000003

0,000002

0,000001

0,000000X

Dens

ity

10000

0,701

0

Lognormal; Loc=10; Scale=1,5; Thresh=0

Page 34: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

Weibull-ova raspodjela Weibull-ova raspodjela • definira vjekove trajanja tehničkih sustava – definira vjekove trajanja tehničkih sustava – krivulja kadekrivulja kade• parametri ove raspodjele daju veliku fleksibilnost prilikom opisivanja parametri ove raspodjele daju veliku fleksibilnost prilikom opisivanja

različitih slučajeva kada broj otkaza raste sa vremenom (trošenje različitih slučajeva kada broj otkaza raste sa vremenom (trošenje ležaja), ostaje konstantan ili pada s vremenom (neki poluvodiči) ležaja), ostaje konstantan ili pada s vremenom (neki poluvodiči)

• funkcija gustoće vjerojatnosti Weibull-ove raspodjele:funkcija gustoće vjerojatnosti Weibull-ove raspodjele:

ostalo za , za )

00,00(

)()(1 βxex

xfx

parametri: α, β

Page 35: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• utjecaj parametara na oblik Weibull-ove raspodjele:utjecaj parametara na oblik Weibull-ove raspodjele:

Page 36: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• krivulja kade (krivulja mortaliteta):krivulja kade (krivulja mortaliteta):

I. periodI. period – ‘dječje bolesti’ – 1. raspodjela – ‘dječje bolesti’ – 1. raspodjela ee--tt

II. periodII. period – ‘normalne eksploatacije’, slučajni kvarovi – 2. raspodjela – ‘normalne eksploatacije’, slučajni kvarovi – 2. raspodjela uniformnauniformnaIII. periodIII. period – zbog ‘trošenja dijelova’, vremenski kvarovi – 3. raspodjela – zbog ‘trošenja dijelova’, vremenski kvarovi – 3. raspodjela normalnanormalna

Page 37: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

Teorijske raspodjeleTeorijske raspodjele

• Studentova ‘t’ raspodjela Studentova ‘t’ raspodjela • raspodjelaraspodjela• F - raspodjelaF - raspodjela

Page 38: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

Studentova t-raspodjelaStudentova t-raspodjela• definirao ju W. S. Gosset kao razdiobu varijable definirao ju W. S. Gosset kao razdiobu varijable tt• proizašla iz raspodjele aritmetičkih sredinaproizašla iz raspodjele aritmetičkih sredina• za k>30, varijabla t se za k>30, varijabla t se

aproksimira varijablom zaproksimira varijablom z

12

2

11 2( ) (1 ) ; ( 1)!

2

nn

tf t n nn nn

Page 39: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• tablica Studentove ras.- tablica Studentove ras.- za određenu vrijednost za određenu vrijednost površine (vjerojatnosti) i površine (vjerojatnosti) i stupnja slobode daje stupnja slobode daje vrijednosti parametra tvrijednosti parametra t

Primjer: Za =0,01 u uzorku veličine 10 elemenata (k=10-1=9 stupnjeva slobode) t=2,821

• treba s oprezom treba s oprezom primjenjivati tablice zbog primjenjivati tablice zbog različitog korištenja različitog korištenja termina termina – – površina površina samo jednog ‘repa’ ili samo jednog ‘repa’ ili oba?!oba?!

Page 40: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

(hi-kvadrat) raspodjela(hi-kvadrat) raspodjela• varijance se ne pokoravaju normalnoj raspodjelivarijance se ne pokoravaju normalnoj raspodjeli• poseban slučaj poseban slučaj razdiobe definira raspodjelu varijable razdiobe definira raspodjelu varijable 2 2

• varijabla varijabla 2 2 sa samo jednim parametrom k=n-1 sa samo jednim parametrom k=n-1 →→ stupanj slobode stupanj slobode2

1

0

2

n

i

ixx

kE )( 2 - očekivana vrijednost

Page 41: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• tablica tablica 22 ras.- za ras.- za određenu vrijednost određenu vrijednost površine (vjerojatnosti) i površine (vjerojatnosti) i stupnja slobode daje stupnja slobode daje vrijednosti parametra vrijednosti parametra 22

• kod čitanja vrijednosti kod čitanja vrijednosti 22

PPtreba imati na umu da treba imati na umu da se to odnosi na se to odnosi na ‘unutrašnju’ površinu.‘unutrašnju’ površinu.

Primjer: Pronaći vrijednosti

i i za vjerojatnost za vjerojatnost

pogreške 5% i k=9. pogreške 5% i k=9.

= = =2,70=2,70

= =

=19,02=19,02

Page 42: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

F -F - raspodjela raspodjela• definirao G. Snedecor , R. Fisher definirao G. Snedecor , R. Fisher • to je raspodjela varijable F koja je definirana kao omjer to je raspodjela varijable F koja je definirana kao omjer

procijenjenih varijanciprocijenjenih varijanci• raspodjela ima samo dva parametra:raspodjela ima samo dva parametra:

– stupanj slobode brojnika kstupanj slobode brojnika kbrojnikabrojnika

– stupanj slobode nazivnika kstupanj slobode nazivnika knazivnikanazivnika

2

2

2

1

ssF

-parametri: kbrojnika=n1-1; knazivnika=n2-1

- preduvjet: (s1>s2)

Page 43: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

• Tablica F-raspodjele daje Tablica F-raspodjele daje vrijednosti varijable F za vrijednosti varijable F za vjerojatnost (površinu vjerojatnost (površinu desnog repa), stupanj desnog repa), stupanj slobode brojnika i slobode brojnika i nazivnika.nazivnika.

Primjer: Pronaći vrijednost varijable F za =0.25, kb=9 i kn=11.

F=1,53

vrijednosti parametra F

Page 44: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Papir vjerojatnostiPapir vjerojatnosti• još jedna od grafičkih metoda analize podataka (iz uzorka) još jedna od grafičkih metoda analize podataka (iz uzorka)

kontinuiranog obilježjakontinuiranog obilježja• utvrđuje se da li se podaci ponašaju po jednoj od promatranih utvrđuje se da li se podaci ponašaju po jednoj od promatranih

raspodjela i koliko koji elementi odstupaju raspodjela i koliko koji elementi odstupaju • za svaku raspodjelu posebno konstruira se papir vjerojatnosti:za svaku raspodjelu posebno konstruira se papir vjerojatnosti:

– papir vjerojatnosti normalne raspodjele (najčešće)papir vjerojatnosti normalne raspodjele (najčešće)– papir vjerojatnosti Weibull-ove raspodjelepapir vjerojatnosti Weibull-ove raspodjele– papir vjerojatnosti lognormalne raspodjelepapir vjerojatnosti lognormalne raspodjele– ......

• uzima se funkcija distribucije određene raspodjele i promjenom mjerila uzima se funkcija distribucije određene raspodjele i promjenom mjerila dobiva se funkcija distribucije u obliku pravca (Henry-jev pravac)dobiva se funkcija distribucije u obliku pravca (Henry-jev pravac)

Page 45: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• konstruiranje papira vjerojatnosti normalne raspodjelekonstruiranje papira vjerojatnosti normalne raspodjele

20151050

99

9590

80706050403020

105

1

x

%

Normal Papir vjerojatnosti

20151050

100

80

60

40

20

0

x

%

Normal Funkcija distribucije

~84%

• Henry-jev pravac se ucrtava tako da se odrede dvije čvrste točke:Henry-jev pravac se ucrtava tako da se odrede dvije čvrste točke:– 1. točka : (x=1. točka : (x=, y=50%), y=50%)– 2. točka : (x=2. točka : (x=y=84%)y=84%)

Page 46: Raspodjele podataka

Inženjerska statistikaInženjerska statistika

Raspodjele podataka

• primjena papira vjerojatnostiprimjena papira vjerojatnostiPrimjer: Provjeriti da li se podaci iz uzorka rasipaju po normalnoj raspodjeli.

- promatranjem podataka može se utvrditi da li se podaci rasipaju po normalnoj raspodjeli.- uzeta je raspodjela sa parametrima )(22

0xx i