statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13statistike.pdf• ako su podaci dati...

24
Statistike Statistike Statistike su slučajne promenljive Y =f (X 1 , X 2 , ..., X n ) koje se formiraju na osnovu prostog slučajnog uzorka X X X X 1 , X 2 , ..., X n . Na osnovu definicije prostog slučajnog uzorka, osobina funkcije f i raspodele obeležja, mogu se odrediti karakteristike sp Y. Polazeći od realizovanog uzorka (x 1 , x 2 , ..., x n ) računamo realizovanu vrednost =f ( ) sp Y realizovanu vrednost y =f (x 1 , x 2 , ..., x n ) sp Y. 1

Upload: lynhu

Post on 17-May-2018

225 views

Category:

Documents


4 download

TRANSCRIPT

Page 1: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

StatistikeStatistike

Statistike su slučajne promenljive Y =f (X1, X2, ..., Xn ) koje se formiraju na osnovu prostog slučajnog uzorka X X XX1, X2, ..., Xn .Na osnovu definicije prostog slučajnog uzorka, osobina funkcije f i raspodele obeležja, mogu se odrediti j f p j gkarakteristike sp Y.Polazeći od realizovanog uzorka (x1, x2, ..., xn ) računamo realizovanu vrednost =f ( ) sp Yrealizovanu vrednost y =f (x1, x2, ..., xn ) sp Y.

1

Page 2: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Uzoračka sredinaUzoračka sredina

• Defnicija. Neka je X1, X2, ..., Xn prost slučajan uzorak j j 1, 2, , n p jobima n za posmatrano obeležje X. Uzoračka sredina je statistika

1 )...(11 nn XX

nX ++=

• Na osnovu definicije prostog slučajanog uzorka i osobina matematičkog očekivanja

2σmXEXE n == )()(n

XD n )( σ=

2

Page 3: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Izračunavanje uzoračke sredineIzračunavanje uzoračke sredine

• Ako su podaci u uzorku dati kao niz vrednosti x1, ..., xnp 1, , nbez sređivanja, tada je realizovana vrednost uzoračke sredine

)(1

• Ako je uzorak dat u obliku tabele, tada je realizovana

)...(11 nn xx

nx ++=

j , jvrednost statistike

1

nX

)...(111 kkn xnxn

nx ++=

Vrednost obeležja

x1 x2 ... xk

Tabela 1.

obeležjafrekvencija n1 n2 ... nk 3

Page 4: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Izračunavanje uzoračke sredineIzračunavanje uzoračke sredine

• Ako je uzorak dat u obliku Tabele 2, prvo se odrede j , ppredstavnici intervala [aj, aj+1) – najčešće su to njihove sredine xj’. Tada je realizovana vrednost statistike nX

Vrednost obeležja

[a1, a2) [a2, a3) ... [aj, aj+1]

f k ijTabela 2.

frekvencija n1 n2 ... nk

1 )'...'(111 kkn xnxn

nx ++=

4

Page 5: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Uzoračka disperzijaUzoračka disperzija

• Uzoračka sredina je blisko povezana sa matematičkim j počekivanjem obeležja, daje nam podatak o prosečnoj vrednosti obeležja na uzorku.U čk di ij d j d t j d ti b l žj• Uzoračka disperzija daje odstupanje vrednosti obeležja od prosečne vrednosti.

• Neka je X1, X2, ..., Xn prost slučajan uzorak obima ne a je 1, 2, , n p ost s učaja u o a ob a nza posmatrano obeležje X. Ukoliko se smatra da je za obeležje X poznato matematičko očekivanje E(X)=m, tada je uzoračka disperzija statistikatada je uzoračka disperzija statistika

))(...)((1~ 221

2 mXmXS nn −++−=n

5

Page 6: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Uzoračka disperzija nastavakUzoračka disperzija, nastavak

• Ako matematičko očekivanje nije poznato, tada je j j p , juzoračka disperzija

))(...)((1 221

2nnnn XXXXS −++−= ))()(( 1 nnnn n

• Korigovana uzoračka disperzija je

1 ))(...)((1

1ˆ 221

2nnnn XXXX

nS −++−

−=

• Uzoračka disperzija se može računati i po formuli:• Uzoračka disperzija se može računati i po formuli:

( )221

2 )...(1nnn XXXS −++= ( )1 )( nnn n

6

Page 7: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Uzoračka disperzija i mat. očekivanjeUzoračka disperzija i mat. očekivanje

• Veza korigovane i uzoračke disperzije je:g p j j

22

nn Sn

nS−

=

• Na osnovu definicije uzoračke disperzije i osobina matematičkog očekivanja dobija se:

2221

2 )())(...)((1)~( σ==

−++−= XDmXmX

nESE nn

( ) )(1)...(1)( 221

2 XDn

nXXXn

ESE nnn−

=

−++=

n )(1

)ˆ( 22 XDSn

nESE nn =

−=

7

Page 8: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Uzorački moment drugog redaUzorački moment drugog reda

• Ako su podaci dati po intervalima, javlja se razlika p p , j jizmeđu vrednosti uzoračke disperzije dobijene na osnovu podataka i uzoračke disperzije koja se dobija na osnovu podataka sređenih intervalnoosnovu podataka sređenih intervalno.

• Neka je uzorački moment drugog reda računat na osnovu Tabele 1

2nx

∑=

=k

jjjn xn

nx

1

22 1

čki t d d č t i t d tka uzorački moment drugog reda računat za iste podatke predstavljene u Tabeli 2 je (intervali su dužine d). Tada

*2nx

2d Šepardova

12*22 dxx nn −=

Šepardovakorekcija

8

Page 9: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Uzorački modUzorački mod

• Mod uzorka je (u slučaju Tabele 1) svaka vrednost xjj ( j ) jobeležja za čiju odgovarajuću frekvenciju nj važi:

nj > nj-1 i nj > nj+1 .U l č j T b l 2 k d ži i t l j d k• U slučaju Tabele 2, ako su dužine intervala jednake c, a mod se nalazi u intervalu [aj, aj+1), tada je mod uzorka

δ∆+δ

δ+=

cam j0

δ ∆1−−=δ jj nn 1+−=∆ jj nn

• Ako postoji samo jedan mod, raspodela je unimodalna, ako ima dva moda bimodalna a ako ima više modovaako ima dva moda, bimodalna, a ako ima više modova, raspodela je polimodalna.

9

Page 10: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Medijana uzorkaMedijana uzorka

• Medijana uzorka se u slučaju Tabele 1 dobija tako što j j jse prvo napiše varijacioni niz

nyyy ≤≤≤ ...21

pa je medijana uzorka

+=+ knyk

112,1

=+

=+ knyym

kke 2),(

21

1

• Ako su podaci dati u obliku Tabele 2 a medijana se• Ako su podaci dati u obliku Tabele 2, a medijana se nalazi u intervalu [aj, aj+1), tada je uzoračka medijana:

j cn 1+

jkjje n

cnnam ]2

[1∑=

−+=10

Page 11: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Uzorački moment reda kUzorački moment reda k

• Neka je x1, ..., xn realizovani prost slučajan uzorak j 1, , n p jobima n za obeležje X. Obični uzorački moment reda kje

∑n

kx1∑=i

ixn 1

• Centralni uzorački moment reda k je

∑=

−n

i

kni xx

n 1)(1

• Uzoračka sredina je uzorački moment prvog reda, a uzoračka disperzija je uzorački moment drugog reda.

11

Page 12: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Uzorački koeficijentiUzorački koeficijenti

• Uzorački koeficijent varijacije jej j j j

n

nV x

sc = ∑=

−=k

jnjjn xxn

ns

1

2)(1

n

• Uzorački koeficijent asimetrije je

c k13

3

)( nsc

• Uzorački koeficijent spljoštenosti je

∑=

−=k

jnjj xxn

nc

1

33 )(1

Uzorački koeficijent spljoštenosti je

3)( 4

4 −sc

∑=

−=k

jnjj xxn

nc

1

44 )(1

)( ns j

12

Page 13: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Računanje realizovanih statistikaRačunanje realizovanih statistika• Za sledeći primer, odrediti uzoračku sredinu, disperziju, mod,

medijanu, koeficijent varijacije, koeficijent asimetrije i koeficijent j j j j j j jspljoštenosti.

Broj četvorki 0 1 2 3 4 5 6Broj godina 12 21 14 8 2 2 1j g

• Uzoračka sredina je 6167,1)16...120(601

60 =⋅++⋅=x

• Uzoračka disperzija je ( ) 8364,11)6(...12)0(601 2

602

60260 =⋅−++⋅−= xxs

• Uzorački mod je m0=1, uzoračka medijana je 3.j 0 j j

• Uzorački koeficijent varijacije je 8382,060

60 ==xscV

• Uzorački koeficijent asimetrije je ( ) ( ) 7839,11)6(...12)0(60

1 360

3603 =⋅−++⋅− xx

sj j j ( )60 60s

• Uzorački koeficijent spljoštenosti je ( ) ( ) 0048,131)6(...12)0(60

1 460

4604

60

=−⋅−++⋅− xxs 13

Page 14: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Statistike kao slučajne promenljiveStatistike kao slučajne promenljive

• Neka je dat prost slučajan uzorak X1, X2, ..., XN . Uz j p j 1, 2, , N standardnu oznaku ∑

=

=n

jjn X

nX

1

1

• Uzorački koeficijent varijacije je statistikan

nj XXn∑ − 2)(1

n

jj

V Xn

C∑== 1

• Uzorački koeficijent asimetrije je statistikaUzorački koeficijent asimetrije je statistika

31

3

1

)(1

−=π

∑=

n

jnj XX

n

1

2)(1

−∑

=

n

jnj XX

n 14

Page 15: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Statistike poretkaStatistike poretka

• Statistika poretka prvog ranga jep p g g j

jnjXY

≤≤=

11 min

St ti tik tk t j• Statistika poretka n-tog ranga je

jnjn XY≤≤

=1max

j

• Statistike poretka prvog, drugog, …, n-tog ranga su redom prvi, drugi, …, n-ti element varijacionog niza.

• Raspon uzorka je razlika statistike poretka n-tog i prvog ranga

1YYR n −=

15

Page 16: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Statistike kao slučajne promenljiveStatistike kao slučajne promenljive

• Uzorački koeficijent spljoštenosti je statistikaj p j j

3)(1

41

4

3 −

−=π

∑=

n

jnj XX

n

)(11

2

−∑

=

n

jnj XX

n

U čk dij j t ti tik• Uzoračka medijana je statistika

+=

=+ knY

mk

112,1

=+ + knYYm

kke 2),(

21

1

16

Page 17: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

ZadatakZadatak

• Neka je X1, X2, ..., Xn prost slučajan uzorak za obeležje j 1, 2, , n p j jX koje ima normalnu raspodelu N (m, σ2). Dokazati da je raspodela uzoračke sredine raspodela N (m, σ2/n) a raspodela za

nXσ2/n), a raspodela za

2

2~

σnS

je 2nχ raspodela.σ

))(...)((1~ 221

2 mXmXn

S nn −++−=

17

Page 18: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Uzorački kvantiliUzorački kvantili

• Uzorački l-procentni kvantil je broj koji je veći od l% p j j j jvrednosti iz uzorka. Ako je u pitanju 25% elemenata iz uzorka, kvantil se zove prvi kvartil i označava se sa q1.Ak j it j 50% l t i k d j ći• Ako je u pitanju 50% elemenata iz uzorka odgovarajući kvantil se poklapa sa medijanom.

• Ako je u pitanju 75% elemenata – treći kvartil - q3.j p j q3

18

Page 19: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Box-plot dijagramBox plot dijagram• Pravougaoni dijagram je jedan način grafičkog

prikazivanja podataka Na izabranoj osi se odrede tačkeprikazivanja podataka. Na izabranoj osi se odrede tačke koje odgovaraju uzoračkoj medijani i kvantilima q1 i q3.

• Zatim se računaju unutrašnje f1 i f3 i spoljašnje F1 i F3granice dijagrama

)(5,1 1311 qqqf −−= )(5,1 1313 qqqf −+=

)(3 1311 qqqF −−= )(3 1313 qqqF −+=

• Zatime se određuju a1–najmanji među elementima j 1 j juzorka koji su veći od f1 i a3–najveći među elementima uzorka koji su manji od f3.

F1 F3f1 f3a1 a3q1 q3me 19

Page 20: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Box-plot dijagramBox plot dijagram

• Dijagram se sastoji od pravougaonika čija je jedna j g j p g j j jstrana paralelna izabranoj osi i jednaka odsečku (q1, q3).

• U pravougaonik se ucrta linija koja odgovara uzoračkoj medijani m .medijani me.

• Ako je linija blizu sredine pravougaonika, raspodela bi mogla biti simetrična.

F1 F3f1 f3a1 a3q1 q3me

**

• Kružićem o su označeni svi elementi uzorka koji su u jintervalima [F1, f1] i [f3, F3], a zvezdicom * svi elementi uzorka manji od F1 ili veći od F3 (extreme outliers). 20

Page 21: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Korelaciona tabelaKorelaciona tabela

• Imamo prost slučajan uzorak obima n i posmatramo dva p j pobeležja X i Y na elementima uzorka. Podaci iz uzorka mogu biti dati u obliku tabele koja se naziva korelaciona tabelatabela.

X \ Y y1 y2 … ys zbirx1 n11 n12 … n1s n(x1)x2 n21 n22 … n2s n(x2)… … … … …

( )xm nm1 nm2 … nms n(xm)zbir n(y1) n(y2) n(ys) n

• Broj n označava da se par (x y ) pojavio n puta u uzorku• Broj nij označava da se par (xi, yj) pojavio nij puta u uzorku.mi ,...,1= sj ,...,1= ∑∑ =

i jij nn obim

uzorka21

Page 22: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Uzorački koeficijent korelacijeUzorački koeficijent korelacije• Kada su podaci dati u obliku korelacione tabele,

uzoračke sredine obeležja X i Y su:uzoračke sredine obeležja X i Y su:

∑=m

jjn xxnn

x )(1 ∑=s

jjn yynn

y )(1=jn 1 =jn 1

• Uzoračke disperzije obeležja X i Y su:m1 s1∑=

−=m

jnjjX xxxn

nS

1

22 ))((1 ∑=

−=j

njjY yyynn

S1

22 ))((1

• Uzoračke koeficijent korelacije meri međusobnuUzoračke koeficijent korelacije meri međusobnu zavisnost obeležja X i Y:

1 m s

nnjiij yxyxnn∑∑ −

22

1 1

YX

i jjj

SS

nr

∑∑= ==

22

Page 23: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

Uzorački koeficijent korelacijeUzorački koeficijent korelacije• Kada su podaci dati u obliku tabele

V d ti XVrednosti za X x1 x2 … xn

Vrednosti za Y y1 y2 … yn

• Uzoračke sredine su:

∑=

=n

jjn x

nx

1

1 ∑=

=n

jjn y

ny

1

1

• Uzoračke disperzije su:• Uzoračke disperzije su:

∑=

−=n

jnjnx xx

nS

1

22 )(1 ∑=

−=n

jnjny yy

nS

1

22 )(1=jn 1 =jn 1

• Uzorački koeficijent korelacije je:1

)(1 n

jnnjj yxyx

nr

∑=

22YX

j

SSr =

23

Page 24: Statistike - haos.ff.bg.ac.rshaos.ff.bg.ac.rs/nastava/radovi/13Statistike.pdf• Ako su podaci dati u obliku Tabele 2 a medijana seAko su podaci dati u obliku Tabele 2, a medijana

PrimerPrimer• Neka je obeležje X broj dobijenih šestica u jednom

bacanju, a obeležje Y broj dobijenih parnih brojeva.bacanju, a obeležje Y broj dobijenih parnih brojeva. X 2 1 0 2 0 1 1 1 1 2

Y 2 3 1 3 2 2 1 2 2 2

• Korelaciona tabela je U čk di

X/Y 1 2 30 1 1 0

• Uzoračke sredine su 1,110/11 ==nx .210/20 ==ny

• Uzoračke disperzije su2

1 1 3 12 0 2 1

• Uzoračke disperzije su 51,02 =nxS 4,02 =nyS

• Uzorački koeficijent korelacije je

53

2 6 2 10 Uzorački koeficijent korelacije je 4428,0=r

2 6 2 10

24