mc fmam 1 - statistica
TRANSCRIPT
NOTIUNI DE STATISTICA
Dr. Adina Ghemigian2013
Definitie
Statistica = ştiinţa, ramură a
matematicii, care permite aprecierea
unor parametri populaţionali prin
studiul unui număr redus de elemente
ale populaţiei în studiu (ţintă)
De ce avem nevoie de statistică?
Vrem sa tragem concluzii cât mai valide din cantităţi limitate de date.
• Diferenţe importante sunt deseori mascate de variabilitatea biologică şi/sau imprecizia experimentală
• Mintea umană excelează în găsirea de tipare şi relaţii, dar tinde să generalizeze în exces.
• Calculele statistice extrapolează de la eşantion la populaţie
• În cercetarea biomedicală se presupune că populaţia este infinită, sau cel puţin foarte mare în comparaţie cu eşantionul nostru.
De ce avem nevoie de statistică?
• Control de calitate O fabrică de cămăşi: se extrage la întâmplare
un eşantion din întreaga populaţie de cămăşi, iar concluziile legate de calitatea eşantionului se extrapolează la toată producţia.
• Sondajul politicSe extrage la întâmplare un eşantion de
votanţi, iar rezultatul se extrapolează la întreaga populaţie de votanţi
De ce avem nevoie de statistică?
• Studii cliniceEşantionul de pacienţi studiat este rareori
extras la întâmplare. Totuşi, pacienţii incluşi în studiu sunt reprezentativi pentru alţi pacienţi similari, iar extrapolarea de la eşantion la populaţie se poate face.
Care este definiţia precisă a populaţiei?– Toţi pacienţii care vin la acel spital?– Toţi pacienţii din oraş? Din ţară? Din lume?
De ce avem nevoie de statistică?
Ce pot face calculele statistice?
• Estimarea statistică– ex: media - estimare punctuală– interval de încredere
• Testarea statistică a unei ipoteze– decizia dacă o asociere observată este reală,
sau datorată întâmplării / p
• Construirea de modele statistice– testează cît de bine se încadrează datele
experimentale într-un model matematic (ex: regresia lineară)
Variabile - definitie
Variabila = orice calitate, caracteristică sau constituent al unei persoane sau lucru, care poate fi evaluat la nivelul unei populatii
• toată cercetarea medicală = studiul relaţiilor dintre variabile
• cercetătorii medicali sunt interesaţi de studierea fie a asociaţiilor, fie a diferenţelor dintre variabile.
Variabile - clasificare
Cantitative(caracteristică măsurabilă)
Calitative(caracteristică ce nu poate fi
măsurată)
• Nominale – grupuri de elemente ce nu pot fi ordonate una in raport cu cealalta (culoarea părului, rasa, grupa sanguina)
• Nominale ordonate (ordinale) – concluziile pot fi grupate in doua sau mai multe categorii intre care exista o ordine naturala (evolutie, clasificari, eficienţa unui tratament: slabă, bună, foarte bună)
• Binare – variabile ce nu pot lua decat 2 valori (bolnav / sănătos, mort/viu, fumator/nefumator, prezent/absent, DA/NU, prezent/absent)
Variabilele calitative
• Continue – o variabilă măsurabilă care poate lua o infinitate de valori, de obicei într-un interval (TAD, colesterol, inaltimea, greutatea, varsta)
• Discrete – variabile care nu pot lua decât valori întregi (scor APGAR)
Variabilele cantitative
Statistica
• Descriptiva – descrie valori obţinute pentru o variabila studiata
• Interferentiala (inductivă) este partea de analiză a datelor care permite extrapolarea unei concluzii trase pe baza unui eşantion spre populaţia ţintă pentru care a fost efectuat studiul.
Variabile nominale
• tabel de frecvenţă (frecvenţa observaţiilor pe categorii)
• grafic: bare, plăcintă• modul (categoria cea mai frecventă)
Statistica descriptivă
F ig u r a I I.3 . D is tr ib uţ ia p e o raş e a c a z u r i lo r in c lu s e în s tu d iu
BRASOV
BUCURESTI
CLUJ
IASI
SIBIU
TARGU MURES
TIMISOARA
98 (60%)
11 (6,7%)
3 (1,8%)
10 (6%)
13 (8%)
23 (14%)
6 (3,7%)
Variabile cantitativeMăsura tendinţei centrale:• Media aritmetica• Mediana = este acea valoare din şirul de date
care împarte în două părţi egale şirul ordonat de valori, situându-se la mijlocul seriei statistice.
• Modul = constituie valoarea care apare cel mai des, deci valoarea cu numărul cel mai mare de apariţii
Statistica descriptivă
Statistica descriptivă Variabile cantitative
Măsura dispersiei:• Amplitudinea = diferenta dintre valoarea maxima si
cea minima• Abaterea standard (deviatia standard = DS) =
indicator de imprastiere a datelor• Coeficientul de variatie = raport procentual între
abaterea standard şi valoarea medie a şirului de valori
• Curba de distributie – indica distributia datelor: normala/asimetrica
47,5%
(x-x)2
n-1SD =
Statistica interferentialaScopul analizei statistice este de a evalua efectul unui tratament
sau al unui factor de risc asupra unei populatii tinta prin intermediul datelor obţinute din eşantionul studiat.
Există posibilitatea ca rezultatele obţinute prin studiul unui eşantion să fie datorate întâmplării – incertitudine statistica.
Testele statistice ne ajută să apreciem în ce măsură rezultatele sunt întâmplătoare şi mai ales în ce măsură şi dacă se pot aplica populaţiei generale.
Se face prin testarea ipotezelor statistice = testarea semnificaţiei statistice.
populaţie
eşantion
eşantionare p, CI
P si intervalele de incredere
• Incertitudinea statistica poate fi cuantificata
prin:
– testarea ipotezei (cu calculul valorii p)
– calculul intervalelor de incredere (CI)
Masurarea incertitudinii statistice/Testarea semnificatiei
statistice
Valoarea pColectarea datelor din două eşantioane → valori medii
diferite.Observarea celor două medii diferite nu este suficientă pentru
a concluziona că populaţiile au medii diferite. E posibil ca populaţiile să aibă aceeaşi medie, iar diferenţa observată să fie o coincidenţă în urma eşantionării aleatorii → este necesara calcularea probabilitatăţii.
Valoarea p răspunde la această întrebare: dacă populaţiile au avut într-adevăr aceeaşi medie, care este probabilitatea de a observa o asemenea diferenţă (sau una mai mare) între mediile eşantioanelor într-un experiment de dimensiunea acestuia?
Valoarea p
Valoarea p este o probabilitate, cu valoarea oscilând între 0 şi 1. Dacă valoarea p este mică, concluzia este că diferenţa are şanse mici să fie provocată de eşantionarea aleatorie putându-se conchide că populaţiile au medii diferite.
Marimea esantionului conteaza!
INDICATORI
IncidenţaMăsoară frecvenţa cu care un eveniment (boală)apare în populaţie într-o perioadă de timp
Incidenţa = numărul de cazuri noi apărute într-o perioadă de timp dată / populaţia la risc în aceeaşi perioadă de timp
! nu include cazuri preexistente! este obligatorie mentionarea perioadei de timpExemplu: 0.2% sau 2 cazuri noi/1000 locuitori/an
Prevalenţa
Proporţia de persoane dintr-o populaţie care au boala sau altă caracteristică la un moment dat sau într-o perioadă de timp dată.
Exemplu: 2% din populatie are diabet
Riscul relativ (RR)Este o masura a asocierii intre un factor de risc si
aparitia bolii.Se calculeaza raportul dintre riscul la “expusi” si
la “neexpusi”:– RR = 1 (risc identic in ambele grupuri)– RR < 1 (riscul la neexpusi e mai mare →
posibil factor protector)– RR> 1 (riscul la expusi e mai mare → posibil
factor de risc)
Tabel de contingenta 2 x 2 pentrucalculul RR
Boala prezenta
Boala absenta
Total
Expus a b a + b
Neexpus c d c + d
Total a + c b + d a + b + c + d
a a + bRR =
c c + d
Sensibilitate, Specificitate
sensibilitate = a / (a+c)
specificitate = d / (b+d)
sensitivity = probability of a positive test among patients with disease
specificity = probability of a negative test among patients without disease
Patienti cu boala
Patienti fara boala
Test pozitiv a bTest negativ
c d
Valoare Predictiva
Valoare predictiva pozitiva= a / ( a+b)
Valoare predictiva negativa= d / (c+d)
Positive predictive value = probability of disease among patients with a positive test
Negative predictive value = probability of no disease among patients with a negative test
Patienti cu boala
Patienti fara boala
Test pozitiv a bTest negativ c d