bio statistika

Gerontologija 2008; 9(3): 176180 GERONTOLOGIJA

Apraomoji statistikaApraomoji statistika nagrinja kintamj grupavi-

mo poymius, grupavimo intervalus, grupavim ris, vertina duomen variacij ir koncentracij, pavaizduoja statistikos duomenis grafikais ir lentelmis. Apraomo-sios statistikos objektas yra vidurkiai, moda, mediana, standartinis nuokrypis, variacijos koeficientas. Mediana (angl. median) poymio reikm, kuri variacin eilut dalija dvi lygias dalis. Moda (angl. mode) tai daniau-siai pasikartojanti poymio reikm variacinje eilutje. Vidurkis (angl. mean, average) tai vidutin poymio reikm, nustatyta tiriant skirtingus objektus. Jis apskai-iuojamas sudedant reikmes ir sum padalijant i t reikmi skaiiaus. Standartinis nuokrypis (SD, stan-dard deviation), vidutinis kvadratinis nuokrypis) tai dydis, rodantis, kiek kiekviena reikm yra vidutinikai nukrypusi nuo vidurkio. Tai tiriamojo poymio reik-mi sklaidos apibdinimas, apibriamas kaip poymio gyjam reikmi ir vidurkio skirtum kvadrat sumos vidurkis. is dydis yra ymimas vairiai: , s, SD. Vari-acijos koeficientas standartinio nuokrypio santykis su vidurkiu. Imtis, kurios kintamieji duomen apdorojimo

programoje idstyti didjimo arba majimo tvarka, va-dinama variacine eilute. Kai duomen daug, sudaromos vienod ar artim reikmi grups bei suraomi variant pasikartojimo daniai. Taip sudaroma intervalin (pa-siskirstymo) variacin eilut [1, 2].

1 lentel. Sistolinio kraujospdio intervalin variacin eilut tyrime

Sistolinio AKS dydis Danis

Iki 120 mmHg 0

Nuo 120 iki 130 mmHg 34




Diagramos vaizdus duomen pateikimo bdas. Stulpelins diagramos bna vairi ri. Danai naudo-jama dani histograma, nuokrypi nuo vidurki stulpe-lin diagrama. Sudtis (%) daniausiai vaizduojama skri-tuline diagrama [1, 2].

Analitin statistikaAnalitin statistika nagrinja taikym statistini krite-

rij, kuriais remiantis priimamos arba atmetamos hipote-zs pasirinktu reikmingumo lygmeniu. Hipotez tei-ginys apie kok nors reikin, kurio teisingumas i anksto

Teorija ir praktika

Statistikos taikymas mokslini tyrim analizje

V. Kasiuleviius, G. Denapien

Vilniaus universitetas, Medicinos fakultetas

Adresas: V. KasiuleviiusSantariki g. 2, VilniusTel. (8-682) 21009El. patas: [email protected]


neinomas. Statistikoje svarbios dvi hipotezi rys nu-lin ir alternatyvioji. Nulin hipotez (angl. null hypot-hesis) teigia, kad lyginam imi skirstiniai nesiskiria. Ji ymima H0. Alternatyvioji hipotez (angl. alternative hypothesis) teigia prieingai lyginam imi skirstiniai skiriasi. Ji ymima H1. Priimant sprendim dl hipotezs galimos dviej ri klaidos (2 lentel).

2 lentel. Hipotezi primimo klaidos

H0 teisinga H

0 neteisinga

Paneigti H0

I ries klaida:Paneigti H

0, kai ji yra teisinga

teisingas sprendimas

Priimti H0

teisingas sprendimasII ries klaida:Priimti H

0, kai ji yra netei-

singa

Hipotezs tikrinimas (angl. hypothesis testing) yra procedra, kai imties (ar imi) duomenys ti-krinami naudojant statistinius kriterijus. Tuo tarpu daug statistini kriterij yra skirta nustatyti, ar ski-riasi dviej arba daugiau populiacij poymiai vi-durkiai arba medianos.

Statistini kriterij taikymo principaiPrie taikant apibrt statistikos test, daniausiai

reikia atsakyti tris pagrindinius klausimus: 1) Kokiai matavimo skalei priklauso tiriamas kintamasis? 2) Ar kintamojo rezultatai interval skalje pasiskirst pagal normalj skirstin? 3) Ar lyginamos imtys yra priklauso-mos ar nepriklausomos?

Kokiai matavimo skalei priklauso tiriamas kintamasis?Atlik tyrim, gautus duomenis arba kintamuosius

suvedame statistin duomen apdorojimo program (EXCEL, Statistica, SPSS, EpiInfo ar kt.). Tai atlikdami turime pasirinkti matavimo skal. Yra ios tyrimo duo-men matavimo skals:

1) Vardin, arba nominalin skal. Bdingiausi var-dins skals pavyzdiai yra lytis, medikament sraas, medicinos specialybi sraas ir t. t. Kintamasis, gyjantis tik dvi reikmes (kategorijas), dar vadinamas binariniu. Skaiiai, kuriais koduojami atskiri objektai ar j savy-bs, neturi jokios empirins reikms, tik rodo, kokia ia ypatyb ar objektas. Kintamj, priklausani vardinei skalei (nominalij kintamj), apdorojimo galimybs gana ribotos galima tiktai vertinti, kuri objekt (sa-vybi) yra daugiau ar maiau, koks bendras vis srae esani objekt kiekis. Pagal nominaliuosius kintamuo-

sius danai vykdoma kokybin duomen klasifikacija, arba grupavimas imtis suskaidoma pagal i kintamj kategorijas. Gautoms dalinms imtims taikomi vienodi statistikos testai, j rezultatai palyginami tarpusavyje.

2) Rang skal. Joje nustatoma objekto (reikinio) vieta pagal pasirinkt kiekybin arba kokybin poym vienos ries objekt (reikini) grupje. Pavyzdiui, hipertenzijos laipsnis, ligos stadija, pacient fizinis ak-tyvumas (pvz.: 1 = jokio fizinio aktyvumo, 2 = fizikai aktyvs retkariais, 3 = pakankamas fizinis aktyvumas) ir t. t. Su matuojamais ranginiais kintamaisiais galima at-likti daugiau statistini operacij negu su nominaliaisias kintamaisiais. Be dani vertinimo, galima apskaiiuoti median, rang koreliacijos koeficient, palyginti atski-ras imtis naudojant neparametrinius testus.

3) Interval skal. ioje skalje nurodomi kiekybiniai kintamj reikmi skirtumai, ireikti matavimo vie-netais (milimetrais, sekundmis, laipsniais ir pan.). ie skirtumai gali bti tarp atskir interval arba nuo kurio nors pasirinkto atskaitos tako, t. y. nulin reikm dar nereikia, kad tiriamasis poymis visai nepasireikia, o tiktai, kad jis nesiskiria nuo slyginio atskaitos nulio. Duomenis interval skalje galima apdoroti visais be ap-ribojim statistikos metodais.

4) Santyki skal. i skal skiriasi nuo interval ska-ls tik tuo, kad joje nulinis takas yra grietai apibrtas ir visikai atitinka dydio nebuvim.

Ar kintamojo rezultatai interval skalje pasiskirst pagal normalj skirstin?Skirstinys (tikimybinis pasiskirstymas ar pasiskirs-

tymo dsnis; angl. probability distribution) tai poy-mio reikmi, arba atsitiktini dydi, ir j tikimybi tarpusavio ryys. Normalusis skirstinys (angl. normal distribution) tai tolydij poymi reikmi skirsti-nys (pasiskirstymo dsnis), atitinkantis tokias slygas: vidurkio (), modos ir medianos reikms sutampa, skirstinio kreiv yra simetrika, o simetrijos ais yra ties vidurkiu, skirstinio kreivs forma priklauso nuo vidurkio ir standartinio nuokrypio (), normalj skirstin turini atsitiktini dydi suma taip pat turi normalj skirstin. Normalusis skirstinys siejamas su vokiei matematiko Karlo Friedricho Gauso (vok. Gauss) (17771855) vardu ir vadinamas Gauso pasiskirstymu arba Gauso skirsti-niu (angl. Gaussian distribution). Normaliajam skirsti-niui taikoma trij sigm taisykl: 1) patekimo interval ir + tikimyb yra 68%, 2) patekimo interval

177


2 ir + 2 tikimyb yra 95%, 3) patekimo interva-l 3 ir + 3 tikimyb yra 99%.

Kaip matyti 1 paveiksle, beveik visas plotas po nor-malija kreive yra trij kvadratini nuokrypi nuo centro ribose. Taigi, jei kintamojo skirstinys normalus, tai prak-tikai visos kintamojo reikms yra ne daugiau kaip 3 atstumu nutolusios nuo centro.

KolmogorovoSmirnovo testu galima patikrinti, ar realus skirstinys atitinka normalj skirstin, kadangi nuo gaut rezultat priklauso, kokie analizs metodai para-metriniai ar neparametriniai bus taikomi. Tyrime anali-zuojamas skirstinys nuo normaliojo skiriasi reikmingai, jeigu gauta p reikm maesn u nustatyt reikmingu-mo lygmen (paprastai 0,05).

Ar lyginamos imtys yra priklausomos, ar nepriklausomos?Nepriklausomos imtys (angl. independent sam-

ples) dvi ar daugiau imi, kuri kiekvienos tiriami objektai niekaip nesusij su kit imi tiriamais objek-tais. Nepriklausomos imtys, t. y. imtys, kurioms nega-lima nustatyti dsningo ir vienareikmio atitikimo, jos gali turti skirtingus stebjimus, kuriuos paprastai skiria kategorinis vardins skals kintamasis.

Priklausomos imtys (angl. dependent samples) dvi ar daugiau imi, kuri kiekvienos tiriami objektai kaip nors susij su kit imi tiriamais obektais. Pvz., kelis kartus per metus atlikti t pai pacient kraujospdio matavimai. Tokiu atveju priklausomos imtys sudaro ti-riamo vyksmo parametr reikmes skirtingais laiko mo-mentais.

Statistinio kriterijaus pasirinkimasAtsak iuos tris klausimus galime nesunkiai pasi-

rinkti statistin kriterij ms tyrimo rezultatams pati-krinti.

3 lentel. Statistinio kriterijaus pasirinkimas, kai yra normalusis kintamj pasiskirstymas

Imtys Statistinis kriterijus

Dvi nepriklausomos imtys Stjudento t-testas

Trys ir daugiau nepriklausom imi Paprasta dispersin analiz ANOVA

Dvi priklausomos imtys Porinis studento t-testas

Trys ir daugiau priklausom imi Blokuotj duomen dispersin ana-liz ANOVA

4 lentel. Statistinio kriterijaus pasirinkimas, kai nra normaliojo kintamj pasiskirstymo

Imtys Statistinis kriterijus

Dvi nepriklausomos imtys WaldoWolfowitzo runs testasMano-Witnio U testas

Trys ir daugiau nepriklausom imi Kruskalo ir Wallis H-testasMedianos testas

Dvi priklausomos imtys Wilcoxono testasenklo testas

Trys ir daugiau priklausom imi Friedmano testas

Kas nulemia statistinio kriterijaus gali?Tikimyb pagrstai atmesti neteising H

0 hipotez

vadinama testo galia. Testo galia yra prieinga II ries klaidos tikimybei. Mainant I klaidos tikimyb didja II klaidos tikimyb. I to seka, kad maja ir testo galia. Statistinis kriterijus yra tuo geresnis, kuo yra maesns abiej ri klaidos. Paprastai kriterijai yra sudaromi taip, kad fiksuotai I ries klaidai II ries klaida bt mi-nimali. Todl daniausiai pasirenkama reikm tyrime yra 0,05. Paprastai yra skaiiuojama ne II ries klaidos tikimyb, o jai prieingo vykio tikimyb 1 krite-rijaus galia. Kriterijaus galia tai tikimyb atmesti hipotez H

0 , kai ji klaidinga. Kriterijaus galia leidia pa-

lyginti du kriterijus, turinius t pat ir taikomas tokio pat dydio imtims. Galingesnis kriterijus yra tas, kuriam 1 yra didesnis. Didinant imt kriterijaus galia paprastai didja [3, 4].

KoreliacijaTermin koreliacija pirmas pavartojo Kiuvje biologi-

joje (1806). Tuo tarpu matematikai koreliacij pirmasis apra pranczas O. Brave (1846). K. Galtonas 1886 m. koreliacij panaudojo biometrijoje. Taigi koreliacijos analiz statistikos metodas, tiriantis poymi tarpu-savio ryi stiprum. Pasiskirsiusiems pagal normalj

1 pav. Normalusis skirstinys

178


dsn intervaliniams kintamiesiems yra skaiiuojamas Pirsono (angl. Pearson) koreliacijos koeficientas. Inter-valiniams kintamiesiems, kuriems normalumo prielaida nra tenkinama, ir ranginiams kintamiesiems yra skai-iuojamas Spirmeno (angl. Spearman) arba Kendallo b koreliacijos koeficientas [5, 6].

5 lentel. Koreliacijos koeficiento (r reikms) vertinimas

r reikm Vertinimas

0,000,19 Labai silpnas tarpusavio ryys

0,200,39 Silpnas ryys

0,400,69 Vidutinis ryys

0,700,89 Stiprus ryys

0,901,00 Labai stiprus tarpusavio ryys

Regresin analizRegresin analiz nustato statistinio ryio pobd ir

aprao priklausomojo (pasekms) kintamojo vidutini reikmi priklausomyb nuo vieno ar keli nepriklau-somj (prieasties) kintamj reikmi matematine formule ir kartu prognozuoja io kintamojo reikmes. Regresin analiz skirstoma tiesin ir logistin regre-sij. Tiesin regresija (2 pav.) dalijama paprast tiesin regresij, kai egzistuoja vienas nepriklausomas kintama-sis, ir daugelio faktori tiesin regresij, kai egzistuoja keletas nepriklausom kintamj. Savo ruotu logistin regresija (3 pav.) skirstoma binarin logistin regresij ir daugiareikm logistin regresij [5, 6].

Dispersin analizDispersin analiz dviej ar daugiau populiacij

vidurki lygybs tikrinimas. Metodas pagrstas tarpgru-pins ir grupi vidini dispersij palyginimu, kur visos grups lyginamos vienu metu. Dispersinei analizei nau-dojami kintamieji turi bti pasiskirst pagal normalj dsn, atsitiktiniai ir nepriklausomi. Dispersin analiz leidia vertinti tiriamojo faktoriaus tak esant maam duomen ar kartotini bandym kiekiui. Tai efektyvus metodas skirtumo tarp trij ir daugiau grupi reikmin-gumui patikrinti. Yra trys dispersins analizs metodai: vieno faktoriaus, dviej faktori ir daugelio faktori dis-persin analiz.

Literatra:Armitage P, Matthews JNS, Berry G. Statistical 1.

Methods in Medical Research. Blackwell Science: 2001.Hogg R. Probability and Statistical Inference. 7th 2.

ed. Pearson: 2006.Hill T, Lewicki P. Statistics methods and applica-3.

tions. StatSoft, Tulsa, OK. 2007.Douglas G. Altman Practical Statistics for Medi-4.

cal Research. Chapman & Hall, CRC: 1999.Cohen J, Cohen P, West SG, Aiken LS. Applied 5.

multiple regression/correlation analysis for the beha-vioral sciences. (2nd ed.) Hillsdale, NJ: Lawrence Erl-baum Associates. 2003.

Pample FC.6. Logistic regression: a primer. Sage Publications: 2000.

Straipsnis teiktas redakcijai 2008 m. gegus 21 d.,parengtas spaudai 2008 m. birelio 28 d.2 pav. Grafinis tiesins regresijos modelis

3 pav. Grafinis logistins regresijos modelis

179


STATISTICS IN SCIENTIFIC RESEARCH ANALYSIS


Vilnius University, Faculty of Medicine

Abstract

The paper deals with descriptive and inferential statistics.

Descriptive statistics (DS) is used to describe the basic fea-tures of data under study. DS provides simple summaries about

a sample and the measures. DS helps researchers to simplify

large amounts of data in a sensible way. Each descriptive sta-tistics reduces lots of data to a simpler summary. Inferential

statistics (IS) helps to reach conclusions that extend beyond

the immediate data alone. IS is used to infer from a sample data

what the population might think. IS means the use of statistics

to make inferences concerning some unknown aspect of the

population from a sample. A common method used in infer-ential statistics is estimation. Examples of inferential statistics

methods include hypothesis testing, correlations, linear and lo-gistic regression, and dispersion analysis.

180

bio statistika

Documents