statistika za nematematicare

Upload: goran-miljevic-faks-profil

Post on 17-Jul-2015

1.925 views

Category:

Documents


37 download

TRANSCRIPT

OSNOVNE STATISTIKE METODE ZA NEMATEMATIARE (Boris Petz, Sveuilina naklada Liber)

1. ZATO STATISTIKA? 2. MJERE CENTRALNE TEDENCIJE 3. MJERE VARIJABILNOSTI

4. 5. 2008.

Pripremila: dr. sc. Tatjana Tuek

1. ZATO STATISTIKA?Statistiki nain miljenja jednog e dana za svakodnevni ivot graana postati jednako neophodan kao znanje itanja i pisanja. H. G. Wells (1866-1946). Statistika je obrada brojanih podataka radi jasnijeg prikazivanja. Statistika metodologija postala je u suvremenom ivotu donekle ak dio opeg obrazovanja i ope kulture, jer je npr. teko zamisliti danas ovjeka bilo koje struke, ako posjeduje visoko obrazovanje, da mu ne bi bili poznati pojmovi aritmetike sredine, varijabiliteta i tome slino.

1. ZATO STATISTIKA?Postoje etiri razine na kojima suvremeni ovjek treba statistiku:Poznavanje statistike potrebno je zbog praenja strune i znanstvene literature. Poznavanje statistike potrebno je pri obradi rezultata, prikupljenih istraivanjem ili eksperimentom, radi deskripcije i analize tih rezultata. Poznavanje statistike potrebno je u znanstvenom i strunom radu radi zakljuivanja iz konkretnog sluaja na opi zakon. Poznavanje statistike potrebno je pri planiranju istraivanja i eksperimenata.

2. MJERE CENTRALNE TENDENCIJE

2.1. 2.2. 2.3.

ARITMETIKA SREDINA ZAJEDNIKA ARITMETIKA SREDINA NEKE DRUGE MJERE CENTRALNE TENDENCIJE 2.3.1. CENTRALNA VRIJEDNOST 2.3.2. DOMINANTNA VRIJEDNOST 2.3.3. GEOMETRIJSKA SREDINA 2.3.4. HARMONINA SREDINA

2. MJERE CENTRALNE TENDENCIJE2.1. ARITMETIKA SREDINA

Najea i najpoznatija mjera prosjeka je aritmetika sredina, kao i najee izvoen raun za statistike potrebe. Osnovna formula za izraunavanje aritmetike sredine glasi:ARITMETIKA SREDINA = to se statistikim simbolima pie:SUMA SVIH REZULTATA BROJ REZULTATA

X X=N

2. MJERE CENTRALNE TENDENCIJE2.2. ZAJEDNIKA ARITMETIKA SREDINA

esto se u praksi dogaa da smo neku pojavu izmjerili nekoliko puta i svaki put izraunali aritmetiku sredinu iz vie mjerenja. Ako konano elimo dobiti zajedniku aritmetiku sredinu svih tih mjerenja (razliit broj mjerenja) izraunavamo po sljedeoj formuli: Zajednika X = N 1 X 1 + N 2 X 2 ........ + N n X n N 1 + N 2 + ........ + N n

2. MJERE CENTRALNE TENDENCIJE2.3. NEKE DRUGE MJERE CENTRALNE TENDENCIJE

2.3.1. CENTRALNA VRIJEDNOSTCentralna vrijednost (C) je vrijednost koja se u nizu rezultata, poredanih po veliini, nalazi tono u sredini. Prednost centralne vrijednosti pred aritmetikom sredinom sastoji se u tome to na nju ne utjee vrijednost pojedinih rezultata, pa prema tome jedan vrlo ekstremni rezultat nee nita promijeniti vrijednost C, koja je uvjetovana samo brojem rezultata. Praktina upotreba vrijednosti C sastoji se u lociranju optimalnog poloaja.

2. MJERE CENTRALNE TENDENCIJE2.3. NEKE DRUGE MJERE CENTRALNE TENDENCIJEPrimjer: Ako u jednom mjerenju dobijemo ovih 11 rezultata: 7 9 4 7 8 7 10 6 6 9 8, pa ih poredamo po veliini: 4 6 6 7 7 7 8 8 9 9 10. Budui da imamo 11 rezultata, srednji rezultat je esti rezultat (jer imamo 5 rezultata ispred i 5 rezultata iza njega) pa je C=7, poloaj rezultata koji zauzima centralna vrijednost, moe se odrediti pomou formule: Poloaj C = (N+1)/2. Ako je broj rezultata paran, centralna se vrijednost izraunava tako da se zbroje dva srednja rezultata, a suma podijeli s 2: Primjer: Kad bismo imali rezultate: 4 5 5 6 8 9, C = (5+6)/2 = 5,5.

2. MJERE CENTRALNE TENDENCIJE 2.3.2. DOMINANTNA VRIJEDNOSTDominantna vrijednost (D) je ona vrijednost koja je u nizu mjerenja najee postignuta (dakle koja dominira). Primjer: Uzorak od 550 branih parova ima ukupno 1660 djece. Prosjek za utvrivanje gradnje stanova raunao bi na 3,02 djeteta po branom paru i znatno pogrijeio u procjeni. Broj djece: 0 1 2 3 4 5 6 7 8 9 10 11 12 Broj branih parova s tim brojem djece: 70 90 108 86 70 47 30 20 15 5 4 3 2. D vrijednost je dvoje djece (108 branih parova). Prednost D vrijednosti ispred aritmetike sredine je to na nju ne utjee ni broj ni vrijednost rezultata, ve samo frekvencija pojedinih rezultata.

2. MJERE CENTRALNE TENDENCIJE2.3.3. GEOMETRIJSKA SREDINAGeometrijska sredina (G) izraunava se prema formuli:

G = n x1 x2 x3 ........ xn

2. MJERE CENTRALNE TENDENCIJE2.3.3. GEOMETRIJSKA SREDINA

Preteno se koristi kao prosjena mjera brzine nekih promjena (ako broj nije negativan ili nula). Primjer: Ako mjesto A ima 1960. 2000 stanovnika, 1961. 9000, a 1962. 18 000 stanovnika, onda je populacija 1961. bila 4,5 puta vea od populacije u 1960., a populacija 1962. dva puta vea od 1961. Postavimo li pitanje koliko je puta prosjeno populacija svake godine porasla, izraunat emo pomou geometrijske sredine:G=

4,5 2 = 9 = 3 puta

2. MJERE CENTRALNE TENDENCIJE2.3.4. HARMONINA SREDINA

Harmonina sredina (H) koristi se kad elimo dobiti prosjeke nekih odnosa (npr. prosjene km/h, prosjeni broj slova u minuti). H se ne moe izraunati ako je bilo koji broj negativan ili nula. H se izraunava prema formuli:

H=

N 1 x

2. MJERE CENTRALNE TENDENCIJE2.3.4. HARMONINA SREDINA

Primjer: Ako je automobilist, udaljenost od 100 km vozio brzinom od 100 km/h, a natrag je iao brzinom od 50 km/h, kojom je prosjenom brzinom vozio?

H=

2 1 1 + 100 50

= 66,7 km / h

2. MJERE CENTRALNE TENDENCIJEZ A D A C I ZA V J E B U

Izraunajte aritmetiku sredinu, centralnu vrijednost i dominantnu vrijednost za nie navedene podatke:10 , 8, 6, 0, 8, 3, 2, 2, 8, 0; b) 1, 3, 3, 5, 5, 5, 7, 7, 9; c) 120, 5, 4, 4, 4, 2, 1, 0. U kojem od prethodnih sluajeva aritmetika sredina predstavlja neprikladnu mjeru centralne tendencije i zato?a)

3. MJERE VARIJABILNOSTI

3.1. 3.2. 3.3. 3.4.

RASPON SREDNJE ODSTUPANJE STANDARNA DEVIJACIJA KOEFICIJENT VARIJABILNOSTI

3. MJERE VARIJABILNOSTI3.1. RASPONKod mjerenja mnogih pojava moemo opaziti da se rezultati grupiraju oko jedne srednje vrijednosti. Jedino pod tom pretpostavkom i imamo pravo raunati neku vrijednost, npr. aritmetiku sredinu, jer elimo da nam ona na neki nain reprezentira sve nae rezultate. Naime, sama aritmetika sredina nije nam jo nikakva garancija da se rezultati grupiraju oko te aritmetike sredine i zato je uvijek potrebno znati kako i koliko se oni grupiraju, tj. da li nam je dobivena aritmetika sredina dobar ili lo reprezentant naih rezultata.

3. MJERE VARIJABILNOSTI3.1. RASPONNajjednostavnija (ali i najnetonija) mjera grupiranja rezultata oko neke srednje vrijednosti je tzv. raspon, tj. razlika izmeu najveeg i najmanjeg rezultata. Primjer: Prilikom dva puta mjerenja po 10 mjerenja neke pojave, dobili smo ova dva niza rezultata (rezultati su poredani po veliini): 1. mjerenje: 8 8,5 8,5 9 9 9 9 9,5 9,5 10 2. Mjerenje: 1 2 3 5 9 9 13 15 16 17. U oba sluaja suma rezultata = 90 i aritmetika sredina = 9,0 to govori da se u prvom mjerenju rezultati bolje grupiraju oko aritmetike sredine, a u drugom ne.

3. MJERE VARIJABILNOSTI3.1. RASPONU prvom je sluaju raspon 10 8 = 2, a u drugom sluaju 17 1 = 16. Prema tome, prva aritmetika sredina mnogo je vrednija, jer ona znatno reprezentira rezultate iz kojih je dobivena. Meutim, raspon je vrlo nesigurna i varljiva mjera varijabilnosti rezultata, jer bilo koji osamljeni ekstremni rezultat znatno poveava raspon a da se grupacija rezultata oko aritmetike sredine ipak nije bitno promijenila. Osnovni se nedostatak raspona sastoji u tom to je on obino to vei to je vei broj mjerenja neke pojave.

3. MJERE VARIJABILNOSTI3.2. SREDNJE ODSTUPANJE

Zanima li nas prosjena veliina odstupanja pojedinanih rezultata (bez obzira na smjer odstupanja), moemo izraunati srednje odstupanje prema formuli:

srednje odstupanje =

X X N

3. MJERE VARIJABILNOSTI3.2. SREDNJE ODSTUPANJEU formuli oznake o zagradi predstavljaju apsolutnu veliinu odstupanja, dakle bez obzira na predznak. Primjer: Ako imamo ove rezultate: Rezultati: 5 7 4 6 5 6 5 2 4 6/ = 50, X = 50 / 10 = 5,0 Odstupanja: 0 2 1 1 0 1 0 3 1 1/ = 10 Srednje odstupanje = 10/10 = 1. Rezultati, prema tome, prosjeno odstupaju od aritmetike sredine za 1.

3. MJERE VARIJABILNOSTI3.3. STANDARNA DEVIJACIJAKada bismo prosjeno odstupanje raunali vodei rauna o predznaku, onda bismo uvijek kao sumu dobili nulu. Razlog tome ve nam je poznat: aritmetika sredina, kao teite rezultata, je vrijednost od koje suma odstupanja iznad i ispod nje uvijek iznosi 0. Jedan od naina da se izbjegnu predznaci odstupanja je taj da se odstupanja kvadriraju. Ako tako kvadrirana odstupanja zbrojimo i izraunamo im aritmetiku sredinu, dobit emo mjeru varijabiliteta koja se u statistici naziva varijanca. varijanca = s2 =

(X X )N 1

2

3. MJERE VARIJABILNOSTI3.3. STANDARNA DEVIJACIJAMeutim korijen iz varijance moe se kako emo vidjeti prikazati kao potpuno definirani razmak na skali rezultata. Taj drugi korijen iz varijance nazvan je standardna devijacija i oznaava se sa s ili S.D. Ili , i to zato to se ta mjera koristi kao standard za mjerenje varijabiliteta rezultata.

S=

s

2

3. MJERE VARIJABILNOSTI3.3. STANDARNA DEVIJACIJAPrimjer: RezultatiX 8 8,5 8,5 9 9 9 9 9,5 9,5 10 =90

xx-1 -0,5 -0,5 0 0 0 0 0,5 0,5 1

( X X )21 0,25 0,25 0 0 0 0 0,25 0,25 12

s=

3 9

s = 0,3333 = 0,58

(X X )

= 3,00

X = 9,0

3. MJERE VARIJABILNOSTI3.3. STANDARNA DEVIJACIJA

68,26 % svih rezultata, odnosno X 2s, 95,44 % svih rezultata i konano X 3s, 99,73 % svih rezultata. Stoga ukoliko u naem primjeru na jednu i na drugu stranu dodamo vrijednost standardne devijacije aritmetikoj sredini: ( 9-0,58=8,42 tj. 9,0+0,58=9,58), 68,26 % svih rezultata nalazi se izmeu 8,42 i 9,58.

Standardna devijacija pokazuje nam koliko vrijedi dobivena aritmetika sredina. Kada su rezultati simetrino i normalno grupirani oko aritmetike sredine onda je u intervalu koji obuhvaa X 1s,

3. MJERE VARIJABILNOSTI3.4. KOEFICIJENT VARIJABILNOSTIKada su nam poznate aritmetika sredina i standardna devijacija nekih rezultata, onda su ti rezultati potpuno definirani i moemo ih usporeivati s nekim drugim rezultatima. Ako imamo dvije razliite aritmetike sredine teko je naprvi pogled odmah ustanoviti koji rezultati relativno vie variraju? Da bismo mogli meusobno usporeivati varijabilnost razliitih pojava i svojstava, sluimo se tzv. koeficijentom varijabilnosti (V) koji nam pokazuje koliki postotak vrijednosti aritmetike sredine iznosi vrijednost standardne devijacije:V= s 100 X

3. MJERE VARIJABILNOSTI3.4. KOEFICIJENT VARIJABILNOSTIKoeficijent varijabilnosti vrlo je korisna mjera u svim onim sluajevima kada elimo znati:u kojem svojstvu neka grupa varira vie, a u kojem manje; koja od grupa varira vie, a koja manje u istom svojstvu. Primjer: Jednim mjerenjem zagrebake kolske djece 1951. utvreno je da 10-godinji djeaci (N=612) imaju visinu X v = 134,4cm sv = 6,06cm, a teinu X t = 29,2kg , st = 3,89kg , variraju li vie djeaci u visini ili u teini?Vv =Vt =

6,06 100 = 4,51% 134,43,89 100 = 13,32% 29,2

3. MJERE VARIJABILNOSTI3.4. KOEFICIJENT VARIJABILNOSTIPrema tome, djeaci variraju u teini znatno vie nego u visini. Primjer 2: Prilikom tog istog mjerenja utvreno je da 10-godinje djevojice (N=684) imaju visinu X v = 134,9cm, sv = 6,43cm, a teinu X t = 29,7 kg , st = 4,78kg. Variraju li u visini vie djeaci ili djevojice? Visina: V za djeake = 4,51 % 6,43 100 = 4,77% V za djevojice = Vv = 134,9 Teina: V za djeake = 13,32 % V za djevojice = Vt =4,78 100 = 16,09% 29,7

Prema tome, 10-godinje djevojice variraju u visini i teini neto vie od 10-godinjih djeaka.

3. MJERE VARIJABILNOSTIZ A D A C I ZA V J E B U

Izraunajte standardnu devijaciju za podatke a), b) i c) iz zadatka u poglavlju Mjere centralne tendencije! Izraunajte koeficijent varijabiliteta za podatke iz prethodnog zadatka!