neki temeljni statistički postupci umi.medri.hr/nastava/mldizv_rolp/rolp_statisticka terminologija...

6
13.3.2017. 1 Kolegij: ROLP Statistička terminologija I. - raspodjela i prikaz podataka Doc. Dr. sc. Ksenija Baždarić ožujak 2017. Neki temeljni statistički postupci u znanstvenom istraživanju odabir uzorka prikupljanje podataka određivanje mjerne ljestvice obrada podataka raspodjela podataka opis podataka (prikazi, ...) KVANTITATIVNI (BROJČANI) OMJERNA INTERVALNA BMI Krvni tlak Razina glukoze u krvi Broj djece Broj napadaja tjedno Dob (god) KVALITATIVNI (SKUPNI, KATEGORIČKI ) ORDINALNA NOMINALNA Stupanj karcinoma Bolje, jednako, lošije Ne slažem se, neopredijeljen/a, slažem se (Likertovaljestvica (stavovi) Spol Pozitivan i negativan nalaz Krvna grupa Pripadnost rasi VRSTE PODATAKA (mjerne ljestvice) Kvalitativni podatci -nominalna ljestvica frekvencije i relativne frekvencije -N(%) grafički prikaz -stupčasti grafikon Kvalitativni podatci -ordinalna ljestvica sve kao kod nominalne ljestvice ali i mjere središnjice i raspršenja -medijan, mod Medcalc -kategorijski podatci

Upload: others

Post on 31-Jan-2020

8 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Neki temeljni statistički postupci umi.medri.hr/nastava/mldizv_rolp/ROLP_Statisticka terminologija I_2016_17.pdfKrivulja normalne raspodjele ili Gaussova krivulja •simetrična u

13.3.2017.

1

Kolegij: ROLP

Statistička terminologija I. -raspodjela i prikaz podataka

Doc. Dr. sc. Ksenija Baždarić

ožujak 2017.

Neki temeljni statistički postupci u znanstvenom istraživanju

• odabir uzorka• prikupljanje podataka

određivanje mjerne ljestvice• obrada podataka

raspodjela podatakaopis podataka (prikazi, ...)

KVANTITATIVNI (BROJČANI)

OMJERNA INTERVALNABMI

Krvni tlakRazina glukoze u krvi

Broj djeceBroj napadaja tjedno

Dob (god)

KVALITATIVNI (SKUPNI, KATEGORIČKI )

ORDINALNA NOMINALNAStupanj karcinoma

Bolje, jednako, lošijeNe slažem se, neopredijeljen/a, slažem se (Likertova ljestvica

(stavovi)

SpolPozitivan i negativan nalaz

Krvna grupaPripadnost rasi

VRSTE PODATAKA (mjerne ljestvice)Kvalitativni podatci - nominalna ljestvica

• frekvencije i relativne frekvencije - N(%)• grafički prikaz - stupčasti grafikon

Kvalitativni podatci - ordinalna ljestvica• sve kao kod nominalne ljestvice ali i mjere

središnjice i raspršenja - medijan, mod

Medcalc - kategorijski podatci

Page 2: Neki temeljni statistički postupci umi.medri.hr/nastava/mldizv_rolp/ROLP_Statisticka terminologija I_2016_17.pdfKrivulja normalne raspodjele ili Gaussova krivulja •simetrična u

13.3.2017.

2

Kada se ispituje vrsta raspodjele?

... SAMO kada podaci vaših istraživanja pripadaju

INTERVALNOJ iliOMJERNOJ mjernoj ljestvici

- kontinuirani brojčani podatci: vrijednosti hemoglobina, broj leukocita u krvi, tjelesna težina, stav prema radu…

http://t2.gstatic.com/images?q=tbn:ANd9GcRH6n8Dpi9

IyT-R8g_XRiUZ84EiKaVOTLCWGVJbi3x1t4TRzfu-vg

Zašto je važno znati kakva je raspodjela podataka?

• za odabir mjere središnjice i mjere varijabilnosti

• za odabir statističkog testa

• u slikovnom prikazu daje jasan uvid u podatke

Mjere središnjice i odstupanja

Najčešće se upotrebljavaju:• aritmetička sredina i standardna devijacija (normalna

raspodjela, velik uzorak)• medijan i raspon (percentili, interkvartili)• interval pouzdanosti (aritmetičku sredina, medijan)

Rjeđe se upotrebljavaju: • varijanca, raspon, standardna pogrješka, mod

Mjere središnjice

Prikazuju prosječnu vrijednost neke skupine rezultata

• Aritmetička sredina• Medijan (središnja vrijednost)• Mod (najčešća vrijednost)

Aritmetička sredina (M, X)• srednja ili prosječna vrijednost

• Prosječna visina studenata • Srednja ocjena svih ispitanika na testu znanja

N

XXXXX

N++++

=...

321

Izračunavanje aritmetičke sredine

1 2 3 4 5

7 8 7 5 8

75

35

5

88775==

++++=X

Page 3: Neki temeljni statistički postupci umi.medri.hr/nastava/mldizv_rolp/ROLP_Statisticka terminologija I_2016_17.pdfKrivulja normalne raspodjele ili Gaussova krivulja •simetrična u

13.3.2017.

3

Medijan (C)• centralna vrijednost• vrijednost koja se u nizu rezultata poredanih po

rastućem iznosu nalazi točno u sredini

• Raspodjela ispitanika prema životnoj dobi

1 2 3 ... 26 ... 49 50 51

10 18 20 ... 52 ... 80 81 90

Mod (D)• najčešća vrijednost u nizu rezultata poredanih

po rastućem iznosu

• Vrijeme provedeno u bolnici

5 5 6 6 6 6 7 8 8 9 9

Mjere raspršenja

…iskazuju odstupanja rezultata oko neke od mjera središnjice

• standardna devijacija• raspon• kvartili, percentili

Standardna devijacija (SD)• vrijednost prosječnog odstupanja od aritmetičke sredine

• prikaz rezultata mjerenja (x ± 1 SD)• 95% granice pouzdanosti (x ± 1,96 SD)• varijanca = SD2

( )1

2

−Σ=

N

XXSD

Raspon (R)• površna mjera raspršenja (varijabilnosti)• razlika između najveće i najmanje vrijednosti

rezultataR = xnajveći-xnajmanji

• Raspon životne dobi od 10-89; R=79

1 2 3 ... 26 ... 49 50 51

10 18 20 ... 52 ... 80 81 89

Kvartil

• Kvartil je rezultat koji se nalazi točno na četvrtini raspona

• Interkvartilni raspon (IR)• Raspon 25 i 75 percentila (1 i 3 kvartila)• Razlika vrijednosti 3. i 1. kvartila

1 2 5 ... 26 ... 47 50 51

10 18 34 ... 52 ... 71 81 89

Min 1. kvartil 2. kvartil 3. kvartil maxmedijan

Page 4: Neki temeljni statistički postupci umi.medri.hr/nastava/mldizv_rolp/ROLP_Statisticka terminologija I_2016_17.pdfKrivulja normalne raspodjele ili Gaussova krivulja •simetrična u

13.3.2017.

4

Percentil• vrijednost odstupanja od medijana• određena mjestom gdje se nalazi u nizu

rezultata

1 2 ... 5 ... 26 ... 47 ... 50 51

10 18 ... 34 ... 52 ... 71 ... 81 89

10. percentila 90. percentila

Percentilna krivulja

Vrsta raspodjele određuje odabir mjere središnjice i mjere raspršenja

Normalna raspodjela: M i SDSrednja vrijednost membranskog biopotencijala iznosila je (70 ± 3,5) mV.

Odstupajuća raspodjela: medijan i percentilProsječna životna dob ispitanika iznosila je 52 (34 - 71) godine.

Prikaz rezultata deskriptivne statistike u programu MedCalc

Krivulja normalne raspodjele ili Gaussova krivulja

• simetrična u odnosu na aritmetičku sredinu• zvonolika• oblika koji ovisi o aritmetičkoj sredini i

standardnoj devijacijiSvojstva normalne raspodjele:• (x ± 1 SD) → 68,26% • (x ± 2 SD) → 95,44%• (x ± 3 SD) → 99,73%

Normalna raspodjela99.7 %99.7 %

aritmetička sredinaaritmetička sredina

XX

fxfx

-1SD-1SD-2SD-2SD-3SD-3SD +3SD+3SD+2SD +2SD +1SD +1SD

68 %68 %

95 %95 %

2,2%

13,6%

34% 34%

13,6%

2,2%

0,15%0,15%

Page 5: Neki temeljni statistički postupci umi.medri.hr/nastava/mldizv_rolp/ROLP_Statisticka terminologija I_2016_17.pdfKrivulja normalne raspodjele ili Gaussova krivulja •simetrična u

13.3.2017.

5

Normalna raspodjela

• podatci se opisuju s pomoću aritmetičke sredine i standardne devijacije

1500 2000 2500 3000 3500 4000 4500 5000

rodna masa

0

10

20

30

40

50

60

70

80

90

100

110

N

Odstupajuća raspodjela

• podaci se opisuju s pomoću medijana i percentila (kvartila, raspona)

10 20 30 40 50 60 70 80 90

% prepisanog teksta

0

2

4

6

8

10

12

14

16

bro

j ra

dova

Kako ispitati normalnost raspodjele?

• Kolmogorov-Smirnovljev test

•P ≥≥≥≥ 0,05 empirijska raspodjela je normalna

•P < 0,05 empirijska raspodjela značajno odstupa od normalne raspodjele

Testiranje normalnosti raspodjele

Vrsta raspodjele određuje odabir statističkog testa

podatci broj skupina

test

Normalna raspodjela

Nezavisni

Zavisni

2

t-test

parni t-test

Odstupajućaraspodjela

Nezavisni

Zavisni

Mann-Whitney

Wilcoxon

Koji prikaz podataka odabrati?

Ovisi o• podatcima• populaciji kojoj se prezentiraju • našem znanju i vještinama

Najčešće se koriste • tablice• slike (grafikoni)

Page 6: Neki temeljni statistički postupci umi.medri.hr/nastava/mldizv_rolp/ROLP_Statisticka terminologija I_2016_17.pdfKrivulja normalne raspodjele ili Gaussova krivulja •simetrična u

13.3.2017.

6

Tablični prikaz podataka

RB skupina dob spol ...

1 kontrola 56 M ...

... ... ... ... ...1 ispitanici 45 Ž ...

... ... ... ... ...

Vertikalni stupčasti grafikon(2 skupine)

Raspodjela ispitanika prema mjestu korištenja računala

0

5

10

15

20

25

30

35

40

ne služim se kod kuće na radnom mjestu kod kuće i na

radnom mjestu

%

KBC RI

KBD

Kružni dijagram Grafikon okvira s ručicama

Medijan Minimum Maximum 25. - 75. perc.

SE0 42 25 63 35 - 50

SE3 34 18 63 30 - 63

vrijednosti sedimentacije eritrocita prije (SE0) i tri tjedna poslije terapije (SE3)

25. percentil

75. percentil

odstupnici65

SE0 SE3

maksimum

minimum

medijan

60

55

50

45

40

35

30

25

20

15

I na kraju …