aplicatii numerice de statistica in farmacie si · pdf filese spune, în acest caz, c:
TRANSCRIPT
Constantin Mircioiu Roxana Colette Sandulovici
APLICATII NUMERICE DE
STATISTICA IN FARMACIE SI IN
STUDIILE CLINICE VOL. I – metode manuale
Editia a – II – a Revizuita
EDITURA UNIVERSITARA “CAROL DAVILA” BUCURESTI, 2010
Prof. dr. farm., mat. CONSTANTIN MIRCIOIU Dr. farm., mat. ROXANA COLETTE SANDULOVICI
APLICATII NUMERICE DE
STATISTICA IN FARMACIE SI IN
STUDIILE CLINICE VOL. I – metode manuale
Editia a II – a revizuita
pentru
cursul de biostatistica
Facultatea de Farmacie, Universitatea de Medicina si Farmacie “Carol Davila”, Bucuresti
cursul de biostatistica doctoranzi
Universitatea de Medicina si Farmacie “Carol Davila”, Bucuresti
cursul de biostatistica si farmacocinetica Masterul de Biostatistica
Facultatea de Matematica, Universitatea Bucuresti
EDITURA UNIVERSITARA “CAROL DAVILA” BUCURESTI, 2010
Campuri de probabilitate
1
CÂMPURI DE PROBABILITATE In teoria probabilităţilor fiecărui rezultat posibil al unui experiment
aleator, rezultat considerat ca eveniment, i se asociază o masura numerică, numită “probabilitatea” evenimentului respectiv. Această valoare este o caracteristică obiectivă a evenimentului în condiţiile experimentului dat.
Pentru operatiile cu evenimente functioneaza aceleasi proprietati ale lor din teoria multimilor: 1. ABBA ∪=∪ ABBA ∩=∩ 2. ( ) ( ) CBACBA ∪∪=∪∪ ( ) ( ) CBACBA ∩∩=∩∩ 3. AA =Φ∪ Φ=Φ∩A 4. AAA =∪ AAA =∩ 5. EEA =∪ AEA =∩ 6. ( ) ( ) ( )CABACBA ∪∩∪=∩∪ ( ) ( ) ( CABACBA ∩∪ )∩=∪∩ 7. EAA =∪ Φ=∩ AA 8. Φ=E E=Φ 9. BABA ∩=∪ BABA ∪=∩ 10 BABA ∩=−
Daca avem o familie nevida de evenimente { } IiiA ∈ , unde I este o
familie de indici cel mult numarabila, vom putea extinde operatiile de reuniune si de intersectie astfel: 1. ∩∪
Iii
Iii AA
∈∈
= ∪∩Ii
iIi
i AA∈∈
=
2. ( )∪∪ ∩
Iii
Iii BABA
∈∈
∩=⎟⎟⎠
⎞⎜⎜⎝
⎛ ( )∩∩Ii
iIi
i BABA∈∈
∪=∪⎟⎟⎠
⎞⎜⎜⎝
⎛
Spunem ca doua evenimente A si B sunt incompatibile daca nu se
pot realiza simultan: Φ=∩ BA
si spunem ca sunt independente daca realizarile lor nu se influenteaza reciproc.
Exemplul clasic de câmp de probabilitate finit îl constituie evenimentele ce pot apărea atunci când, dintr-o urnă în care se află bile albe şi negre se extrag n bile. Dacă proporţia bilelor albe în urnă este p, şi deci a celor negre este q = 1 - p, probabilitatea evenimentului A, ca din n bile extrase, k să fie albe, este:
( ) qpCAP knkkn
−=
Campuri de probabilitate
2
Definitie: Fie E multimea finita a evenimentelor posibile la efectuarea unui
experiment si ( )E℘ multimea partilor lui E. Fie ( )EK ℘⊆ o multime nevida de parti ale lui E. Ea se numeste
corp de evenimente , daca verifica urmatoarele axiome: 1. KAavemKA ∈∈∀ 2. KBAavemKBA ∈∪∈∀ ,
Aplicatii:
Daca ( )EK ℘⊆ este un corp de evenimente, verificati urmatoarele proprietati: a. KEsiK ∈∈Φ
b. KAsiKAniKAn
ii
n
iii ∈∈⇒=∈∀
==∩∪
11
,1,
c. KBAKBA ∈−⇒∈, Solutie: a. Deoarece φ≠K , exista cel putin o multime KA ⊆ . Rezulta ca
KA∈ , deci KEKAA ⇒∈∪ ∈ si KE ∈ ceea ce inseamna ca K∈Φ b. Daca niKAi ,1, =∀∈ , atunci prin inductie completa se obtine ca
K An
ii ∈
=∪
1
Deoarece niKAi ,1, =∀∈ , avem niKAi ,1, =∀∈ si KAn
ii ∈
=∪
1
.
Dar KAAn
ii
n
ii ∈=
==∪∪
11
ceea ce implica KAAn
ii
n
ii ∈=
==∩∪
11
c. KBAKBAKBAKBA ∈−⇒∈∩⇒∈⇒∈ ,, Definitie:
Fie E o mulţime şi K o familie nevidă de părţi ale lui E, K ⊂℘(E) cu proprietăţile:
1. A∈ K ⇒CA∈ K 2. K⇒ ∪ K ( ) ⊂∈NiiA ∞
∈1
iA3. E∈ K
Deci, este închisă la operaţiile de complementare şi reuniune.
Campuri de probabilitate
3
Se spune, în acest caz, că familia K, împreună cu operaţiile menţionate, formează un corp bolerian. Definitie:
Un element KA∈ se numeste eveniment compus daca exista doua evenimente KDB ∈, , Φ≠Φ≠ DB , , ADAB ≠≠ , astfel incat
DBA ∪= . Un eveniment Φ≠A ce nu este compus se numeste eveniment elementar. Definitie:
Fiind dat un spaţiu măsurabil ( )KE, . O funcţie P: cu proprietăţile:
[ 1,0→K ]
a) P – măsură şi b) P ( )E =1
se numeşte probabilitate. Deci, probabilitatea ar fi o măsură “normată”.
Definitie: Se numeşte măsură orice funcţie pozitivă definită pe corpul mulţimilor
măsurabile, μ : K R+ , “aditivă” pe orice familie → ( ) IiiA ∈ numărabilă de mulţimi măsurabile disjuncte:
( ) ( )∑∞∞=⇒Φ=∩∀∀
11,, nnmn AAAAmn μμ∪
Aplicatii:
Fie KBsiA ∈ . Verificati urmatoarele proprietati: a. ( ) (APCAPavemKA )−=∈∀ 1 b. ( ) 0=Φ Pc. Daca BA ⊂ , atunci ( ) ( )BPAP ≤ d. ( ) 10 ≤≤∈∀ APavemKA e. ( ) ( ) ( )BAPBPABP ∩−=− f. ( ) ( ) ( )APBPABP −=− , daca BA ⊂ g. ( ) ( ) ( ) ( )BAPBPAPABP ∩−+=∪ daca Φ≠∩ BA
h. ( ) (inegalitatea lui Boole) ∑==
−≥⎟⎟⎠
⎞⎜⎜⎝
⎛ n
ii
n
ii CAPAP
11
1∩Solutie: a. Φ=∩=∪∈∀ AAsiEAAavemKA
Campuri de probabilitate
4
( ) ( ) ( ) ( ) 1==+=∪ EPAPAPAAP ( ) ( )APCAP −=⇒ 1 b. ( ) ( ) ( ) 0111 =−=−==Φ⇒=Φ EPCEPPCE c. ( )CABABBA ∩∪=⇒⊂ dar ( ) Φ=∩∩ CABA , deci
( ) ( ) ( ) ( )APCABPAPBP ≥∩+= d. ( ) ( ) ( ) ... deqEPAPPEAavemKA ⇒≤≤Φ⇒⊆⊆Φ∈∀ e. ( ) ( ) ( )CABABCAABEBB ∩∪∩=∪∩=∩=
Dar ( ) ( ) Φ=∩∪∩ CABAB , deci ( ) ( ) ( ) ( ) ( ) ... deqABPABPCABPABPBP ⇒−+∩=∩+∩=
f. ( ) ( ) ( ) ( ) ( ) (APBPABPBPABPBPABABA − )=∩−=−=⇒=∩⇒⊂
g. Deoarece Φ≠∩ BA putem scrie: ( ) ( ) ( )CBABACBBAEAA ∩∪∩=∪∩=∩= ( ) ( ) ( )CABABCAABEBB ∩∪∩=∪∩=∩=
Deci, ( ) ( ) ( )CABCBABABA ∩∪∩∪∩=∪ Cum evenimentele CABCBABA ∩∩∩ ,, sunt incompatibile
doua cate doua obtinem: ( ) ( ) ( ) ( CABPCBAPBAPBAP )∩+∩+∩=∪
Dar ( ) ( ) ( )BPAPCBAP −=∩ si ( ) ( ) ( )APBPCABP −=∩ de unde obtinem
( ) ( ) ( ) ( )BAPBPAPABP ∩−+=∪
h. Deoarece ∪ vom aplica probabilitatea obtinandu-se ∩i
ii
i CAAC =⎟⎟⎠
⎞⎜⎜⎝
⎛
( )
( )∑
∑
−≥⎟⎟⎠
⎞⎜⎜⎝
⎛⇒
⇒≤⎟⎟⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛−⇒⎟⎟
⎠
⎞⎜⎜⎝
⎛=⎟⎟
⎠
⎞⎜⎜⎝
⎛⎟⎟⎠
⎞⎜⎜⎝
⎛
ii
ii
ii
ii
ii
ii
ii
CAPAP
CAPCAPAPCAPACP
1
1
∩
∪∩∪∩
Definitie: Probabilitatea condiţionată
Fie B un eveniment a cărei probabilitate este diferită de 0. Probabilitatea unui eveniment A, reprezintă proporţia în care ne aşteptăm să se realizeze A în cadrul tuturor evenimentelor câmpului de probabilitate la care aparţine A
Campuri de probabilitate
5
Probabilitatea lui A se mai poate analiza însă şi în contextul în care ştim că s-a produs anterior evenimentul B. Probabilitatea evenimentului A condiţionată de B se notează, în acest caz, cu: P(A/B) sau PB(A).
În acest context apare naturală definiţia probabilităţii evenimentului A, condiţionată de B, prin formula:
( ) ( )( )BP
BAPAPB
∩=
Aplicatii: Demonstrati ca raportul de mai sus verifica axiomele
probabilitatilor: a. ( ) 0≥A PB
b. ( ) 1=EPB c. ( ) ( ) ( )DPAPDAP BBB +=∪ , daca Φ=∩ DA Demonstratie: a. Deoarece ( ) 0⟩AP si ( ) 0≥∩ BAP obtinem inegalitatea ceruta. b. Conform definitiei avem:
( ) ( )( )
( )( ) 1==
∩=
BPBP
BPBEPEPB
c.
( ) ( )[ ]( )
( ) ( )[ ]( )
( ) ( )( )
( )( )
( )( )
( ) ( )DPAPBP
BDPBP
ABPBP
BDPABPBP
BDABPBP
BDAPDAP
BB
B
+=
=∩
+∩
=∩+∩
=
=∩∪∩
=∩∪
=∪
Teorema probabilităţii cauzelor
Probabilitatea producerii oricărui eveniment X, este egală cu suma probabilităţilor de producere a lui X, condiţionate de evenimentele complete ale sistemului ( ) niiA ,1= şi
( ) ( ) ( )( ) ( )∑
= XPAPXPAPAPi
j
Ai
AjjX
Campuri de probabilitate
6
Exercitii: 1. Masa, rezistenta si inaltimea sunt caracteristici independente ale unui comprimat. Probabilitatile ca un comprimat sa nu corespunda din aceste puncte de vedere sunt: 0,03; 0,05 si 0,02. Care este probabilitatea ca tableta sa corespunda in raport cu cele trei caracteristici? Solutie:
Fie E1, E2, E3 evenimentele care se realizeaza cand produsul corespunde in raport cu fiecare dintre caracteristici.
Conform ipotezei avem: ( ) ( )1 0,03P CE P comprimatul nu corespunde in raport cu masa= =
( ) ( )2 0,05P CE P comprimatul nu corespunde in raport cu rezistenta= =
( ) ( )3 0,02P CE P comprimatul nu corespunde in raport cu inaltimea= = Deci, probabilitatile de producere a evenimentelor E1, E2, E3 vor fi:
( ) ( ) 97.01 11 =−= CEPEP ( ) 95.02 =EP ( ) 98.03 =EP
Daca CE1 , CE2 , CE3 sunt independente si E1, E2, E3 sunt independente.
Asadar: ( ) ( ) ( ) ( )1 2 3 1 2 3* * 0.97 *0.95*0.98 0.9031P E E E P E P E P E∩ ∩ = = =
2. Cu datele din problema precedenta sa se calculeze probabilitatea ca produsul sa nu corespunda. Solutie: ( )
( )( )( )
P comprimatul nu corespunde
comprimatul nu corespunde in raport cu masa
P comprimatul nu corespunde in raport cu inaltimea
comprimatul nu corespunde in raport cu rezistenta
=
∪⎛ ⎞⎜ ⎟
= ∪ ∪⎜ ⎟⎜ ⎟∪⎝ ⎠
Conform ipotezei avem: ( ) ( )1 0,03P CE P comprimatul nu corespunde in raport cu masa= =
( ) ( )2 0,05P CE P comprimatul nu corespunde in raport cu rezistenta= =
( ) ( )3 0,02P CE P comprimatul nu corespunde in raport cu inaltimea= = Se utilizeaza relatia
Campuri de probabilitate
7
( ) ( ) ( ) ( )( ) ( ) ( )( )
P A B D P A P B P D
P A B P A D P B D
P A B D
∪ ∪ = + + −
− ∩ − ∪ − ∩ +
+ ∩ ∩
si se obtine ( )
0969.002.0*05.0*03.002.0*05.002.0*03.005.0*03.002.005.003.0321
=+−−−−++=∪∪ CECECEP
O alta demonstratie, tinand cont de rezultatele obtinute la exercitiul
precedent: ( ) ( )11 0,9031 0,0969
P comprimatul nu corespunde P comprimatul corespunde= − =
= − =
3. In cazul la 5% din comprimatele verificate rezistenta este necorespunzatoare din cauza nerespectarii formulei de fabricatie, iar 10% din cauza reglajului incorect al masinii de comprimat. Care este probabilitatea ca rezistenta comprimatului sa fie buna? Solutie:
Fie A evenimentul care se realizeaza cand rezistenta nu corespunde din cauza formulei de fabricatie si B evenimentul care se realizeaza cand rezistenta nu corespunde din cauza reglajului masinii. ( ) ( ) 0,05P A P formulare necorespunzatoare= =
( ) ( ) 0,10P B P reglaj necorespunzator= =
( )( ) (( )( ) ( ) ( )1
P rezistenta buna
P formulare corespunzatoare reglaj corespunzator
P CA CB P C A B P A B
=
= ∩
= ∩ = ∪ = − ∪⎡ ⎤⎣ ⎦
) =
Dar ( ) ( ) ( ) ( ) 145.010.0*05.010.005.0 =−+=∩−+=∪ BAPBPAPBAP Deci, ( ) 855.0=∩CBCAP 4. O capsula este considerata corespunzatoare standardului daca indeplineste conditiile A1, A2, A3, A4. Datele statistice arata ca 90% dintre capsule indeplinesc conditia A1, 80% indeplinesc conditia A2, 85% indeplinesc conditia A3 si 95% indeplinesc conditia A4. Care este probabilitatea minima ca o capsula sa corespunda standardului?
Campuri de probabilitate
8
Solutie Se aplica inegalitatea lui Boole ( ) ( )∑−≥∩ ii CAPAP 1 ( ) ( )ii APCAP −= 1
Deci ( ) ( ) (∑=
−−≥∩n
iii nAPAP
1
1)
Obtinem ( ) ( ) ( ) ( ) ( ) ( )1 2 3 4 1 2 3 4 4 10,90 0,80 0,85 0,95 3 3,5 3 0.5
P A A A A P A P A P A P A∩ ∩ ∩ ≥ + + + − − =
= + + + − = − =
Deci probabilitatea ca o capsula sa fie corespunzatoare este cuprinsa intre 0.5 si 1, probabilitatea minima fiind 0,5. 5. O instalatie este deservita de trei pompe cu functionare independenta a caror probabilitate de defectare este 0.1 ; 0.15 si 0.25. Instalatia trebuie oprita daca se defecteaza prima pompa sau pompele 2 si 3 simultan. Daca se defecteaza numai una dintre pompele 2 sau 3 instalatia poate functiona. Care este probabilitatea ca instalatia sa functioneze? Solutie
Fie A1, A2, A3 evenimentele care corespund functionarii pompelor 1, 2 si respectiv 3 si fie A evenimentul cere se realizeaza cand instalatia functioneaza.
Deci, evenimentul A se realizeaza daca: • Functioneaza toate pompele, sau • Functioneaza prima pompa, nu functioneaza pompa 2 dar functioneaza
pompa 3, sau • Functioneaza primele doua pompe si nu functioneaza pompa 3 Deci,
( ) ( ) ( )321321321 CAAAACAAAAAA ∩∩∪∩∩∪∩∩= ( ) ( ) ( ) ( )( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )
866.025.0*85.0*9.075.0*15.0*9.075.0*85.0*9.0321321321
321321321
=++==++=
=∩∩+∩∩+∩∩=CAPAPAPAPCAPAPAPAPAP
CAAAPACAAPAAAPAP
6. Un produs farmaceutic este prelucrat in doua etape A si B. In prima etapa are loc comprimarea propriu-zisa, iar in a doua etapa are loc ambalarea produsului intermediar obtinut. Dupa etapa A comprimatele vrac sunt controlate obtinandu-se un randament de 97%. Comprimatele vrac
Campuri de probabilitate
9
corespunzatoare vor fi prelucrate in etapa B obtinandu-se un randament de 95%. Care este probabilitatea ca produsul finit sa corespunda? Solutie ( ) ( ) 0,95P A P comprimat vrac corespunzator= =
( ) ( ) 0,97AP B P comprimat ambalat corespunzator= =
Conform definitiei probabilitatilor conditionate avem: ( ) ( )( )AP
ABPBPA
∩=
( ) ( ) ( ) 9215.095.0*97.0* ===∩⇒ BPAPBAP A 7. Se considera doua recipiente de reactiv B1 si B2. In recipientul B1 se afla pastile de KOH, iar in recipientul B2 pastile de KOH si de NaOH in numar egal. O pastila scoasa la intamplare din unul din recipienti se dovedeste a fi KOH. Care este probabilitatea ca aceasta pastila sa provina din B1? Solutie Fie A evenimentul ca pastila sa fie de KOH. Se aplica relatia lui Bayes:
( ) ( ) ( )( ) ( ) ( ) ( )APBPAPBP
APBPBP
BB
BA
21
1
21
11 +=
( ) ( )21
21 == BPBP
( ) 11
=APB
( )21
2=APB
Deci ( )32
1 =BPA
8. Se considera cinci loturi de comprimate cu structurile: a. Doua loturi cu 60% comprimate corespunzatoare; b. Doua loturi cu 55% comprimate corespunzatoare; c. Un lot cu 70% comprimate corespunzatoare.
Loturile constau din acelasi numar de piese. Se face controlul unui comprimat luat la intamplare. a) Care este probabilitatea ca acest comprimat sa fie necorespunzator? b) Daca se presupune ca acest comprimat este necorespunzator care este probabilitatea ca acesta sa provina dintr-un lot de tipul 2?
Campuri de probabilitate
10
Solutie a) Se noteaza cu B evenimentul de a controla un comprimat necorespunzator si cu A1, A2, A3 evenimentele care constau din efectuarea controlului unui comprimat din loturile 1, 2 sau respectiv 3. ( ) ( ) ( )BPAPBP
iAi
i∑=
( )52
1 =AP , ( ) 4.01
=BPA
( )52
2 =AP , ( ) 45.02
=BPA
( )51
3 =AP , ( ) 3.03
=BPA
Deci, ( )51
51*3.0
52*45.0
52*4.0 =++=BP
b) ( ) ( ) ( )( ) 45.0
52
52*45.0
222 ===
BPBPAP
AP AB
9. Zece loturi dintre care trei de tipul A1, cinci de tipul A2 si doua de tipul A3 trec verificarile la care sunt supuse in proportie de 90%, 75% si resprectiv 85%. a) Care este probabilitatea ca un lot ales la intamplare sa fie
corespunzator. b) Care este probabilitatea ca un lot corespunzator sa fie de tipul A1. Solutie ( ) 3.01 =AP , ( ) 5.02 =AP , ( ) 2.03 =AP
Se noteaza cu B evenimentul care constata in faptul ca lotul ales trece verificarile.
( )1
0,90AP B = , ( )2
0,75AP B = , ( )3
0,85AP B =
( ) ( ) ( ) 0.815Ii A
iP B P A P B= =∑
( )( ) ( )
( )11
1 0.33AB
P A P BP A
P B= =
Variabile aleatoare
11
VARIABILE ALEATOARE Definiţii:
a) Se numeşte variabilă aleatoare (întâmplătoare sau statistică) o funcţie reală f definită pe mulţimea K a evenimentelor, cu proprietatea că, oricare ar fi numărul real a, mulţimea x∈ K pentru care f(x) ≤ a este un eveniment din K.
În termeni de teoria măsurii, o variabilă aleatoare este o funcţie f : (E, K, P) (R, B), măsurabilă. →Practic vorbind avem definită probabilitatea ca variabila să aibă valori
mai mici decât orice număr dat a. b) O variabilă aleatoare se numeşte variabilă aleatoare simplă dacă ia
un număr finit de valori: f : E→R, f (E) finită şi P( f (x) = xi ) = P( f-1(xi) ) = pi
c) Doua variabile aleatoare sunt independente, daca iau valori independente una de cealaltă:
( )( ) ( )( )( ) ( )( ) ( )( )jiji yygPxxfPyygxxfP ====∩= * , ji yx ,∀ Exemplu:
Fie X o variabila aleatoare discreta (v.a.) avand tabelul de distributie:
⎟⎟⎠
⎞⎜⎜⎝
⎛
n
n
px
ppxx
X......
:21
21 unde ⎪⎩
⎪⎨⎧
=
=≥
∑=
n
ii
i
p
nip
1
1
,1,0
atunci functia de repartitie corespunzatoare va fi:
( )
⎪⎪⎪⎪
⎩
⎪⎪⎪⎪
⎨
⎧
⟩
≤⟨
≤⟨+≤⟨
≤
=∑−
=−
n
k
ikki
xxdaca
xxxdacap
xxxdacappxxxdacap
xxdaca
xF
,1.
,.
,,,0
1
11
3221
211
1
Definitie:
Fie ( )xF functia de repartitie a unei v.a. X. Daca exista o functie
integrabila astfel incat ,atunci X se numeste variabila ( )xf ( ) ( )∫∞−
=x
duufxF
Variabile aleatoare
12
aleatoare continua, iar ( )xf se numeste densitatea de probabilitate sau densitatea de repartitie a lui X Caracteristici ale variabilelor aleatoare Media:
Se numeşte valoare medie (sau speranţă matematică) a unei valori aleatoare f, numărul
M(f) = , atunci când ξ este o variabilă aleatoare simplă şi, respectiv
∑ iipx
M(f) = , atunci când ξ este o variabilă aleatoare continuă,
cu densitatea de probabilitate ρ.
( )dxxx∫+∞
∞−ρ
Momentul de ordin k al unei variabile aleatoare reprezinta generalizarea notiunii de medie:
( ) kk i iM f x= p∑ , atunci când ξ este o variabilă aleatoare simplă
şi respectiv,
Mk(f) = xkρ(x)dx , atunci când ξ este o variabilă aleatoare
continuă. ∫+∞
∞−
Momentul centrat de ordin k al unei variabile aleatoare f este momentul de ordinul k al abaterii sale faţă de medie. ( ) ( ) i
kfi
ck pxfM ∑ −= μ
şi respectiv, ,în cazul unei variabile aleatoare
continue.
( )[ ] ( )dxxfMxk
ck ρμ ∫
+∞
∞−−=
Dispersia variabilei aleatoare X de notează D(X) sau σ2 şi este, în particular, momentul centrat de ordinul doi.
D(X) = σ2 = M[(X-M(X))2] = ( )( ) ( dxxXMx ρ2
∫+∞
∞−− )
şi respectiv σ2 = M[(X-M(X))2] = ( ) iXi px 2∑ − μ , atunci când variabila aleatoare
este discretă. Rădăcina pătrată a dispersiei, σ, se numeşte abaterea medie pătratică a
variabilei X, iar sx abaterea standard.
Variabile aleatoare
13
Exercitiu: Verificati urmatoarele proprietati ale mediei: dacă f şi g sunt
independente, atunci avem: a) M(af) = aM(f) b) M(f+g) = M(f) + M(g) c) M(fg) = M(f)M(g)
Solutie: Fie variabilele independente:
⎟⎟⎠
⎞⎜⎜⎝
⎛
n
n
pf
ppff
f......
:21
21 unde ⎪⎩
⎪⎨⎧
=
=≥
∑=
n
ii
i
p
nip
1
1
,1,0si
⎟⎟⎠
⎞⎜⎜⎝
⎛
m
m
qg
qqgg
g......
:21
21 unde ⎪⎩
⎪⎨
⎧
=
=≥
∑=
m
jj
j
q
mjq
11
,1,0
a) ( ) ( )faMpfapafafMi
iii
ii === ∑∑
b) ( ) ( ) ( ) ( )[ ]==∩=+=+ ∑ji
jiji ggffpgfgfM,
( ) ( ) ( )[ ] ( )
( )
( ) ( )gMfMqgpfpqgqpf
qpgqpf
qpgqpfqpgqpf
qpgfggpffpgf
jjj
iii
j iijj
i jjii
j ijij
i jjii
jijij
jijii
jijijjii
jji
ijiji
jiji
+=+=+=
=⎟⎠
⎞⎜⎝
⎛+⎟⎟
⎠
⎞⎜⎜⎝
⎛=
=+=+=
=+===+=
∑∑∑ ∑∑ ∑
∑ ∑∑ ∑
∑∑∑
∑∑
,,,
,,*
c) ( ) ( ) ( ) ( )[ ]==∩==∑ji
jiji ggffpgfgfM,
**
( ) ( ) ( )[ ] ( ) ===== ∑∑ jji
ijiji
jiji qpgfggpffpgf,,
***
( )
( ) ( ) ( )fMgMpfgM
gMpfqgpfqpgfqpgf
iii
iii
jjj
iii
i jjijijij
jii
==
==⎟⎟⎠
⎞⎜⎜⎝
⎛===
∑
∑∑∑∑∑∑,
Variabile aleatoare
14
Exercitiu: Verificati urmatoarele proprietati ale dispersiei: a) Pentru orice variabilă aleatoare X şi orice constante a şi b
D(aX+b) = a2D(X) b) Dacă X, Y sunt două variabile aleatoare independente
D(X+Y) = D(X) + D(Y) c) Între dispersie, valoarea medie şi momentul de ordinul doi există relaţia:
D(X) = M(X2) – (M(X))2 Solutie: a) ( ) ( )∑ −=
iii pxXD 2μ
( ) ( ) ( )( ) ( )
( ) ( )( ) ( )
( ) ( )XDapxa
pxapxapaax
pbabaxpbabaxbaXD
iii
iii
iii
iii
iii
iii
222
2222
22
=−=
=−=−=−=
=−−+=+−+=+
∑
∑∑∑
∑∑
μ
μμμ
μμ
b)
( ) ( ) ( )( ) ( ) ( )( )( ) ( ) ( )( )
( ) ( ) ( )( )
2 2
, ,
22
, , ,
22
2
2
i j X Y i j i X j Y i ji j i j
i X i j j Y i j i X j Y i ji j i j i j
i X i j j Y i j i X j Y i ji j j i i j
D X Y x y p q x y p q
x p q y p q x y p q
x p q y p q x y p q
μ μ μ μ
μ μ μ μ
μ μ μ
+ = + − + = − + − =
= − + − − − − =
= − + − − − −
∑ ∑
∑ ∑ ∑
∑∑ ∑∑ ∑∑( )
μ =
( ) ( ) ( )∑ ∑∑∑∑∑ =−−−−+−=i j
jYjiXii
ij
jYjj
ji
iXi qypxpqyqpx μμμμ 222
( ) ( ) ( ) ( )YDXDqypx jj
Yjii
Xi +=−−+−= ∑∑ 0*222 μμ
c) D(X) = ( ) iXi px 2∑ − μ = ii px∑ 2 -2 iXi px μ∑ + iX p∑ 2μ =
( ) ( )( )2222
2222 1**22
XMXMpx
pxppxpx
Xi
ii
XXXi
iii i
iXiiXi
ii
−=−=
=+−=+−=
∑
∑∑ ∑∑μ
μμμμμ
Deci, M(X2) - 2 + = M(X2) – (M(X))2 2Xμ
2Xμ
Variabile aleatoare
15
Exercitii: 1. Fie urmatoarea variabila aleatoare:
⎟⎟⎠
⎞⎜⎜⎝
⎛4,03,0
431,02,0
21:X
Sa se determine functia sa de repartitie. Solutie:
( )
0, 10,2 1 2
0,2 0,1 0,3 2 30,2 0,1 0,3 0,6 3 4
1, 4
daca xdaca x
F x daca xdaca x
daca x
≤⎧⎪ ⟨ ≤⎪⎪= + = ⟨ ≤⎨⎪ + + = ⟨ ≤⎪
⟩⎪⎩
2. La o farmacie a fost inregistrat numarul de antibitice cerut zilnic pe o perioada de 50 de zile, obtinandu-se urmatoarele valori:
Cererea zilnica 3 4 5 6 7 8 Numarul de zile 3 7 12 14 10 4
a. Sa se reprezinte tabelul de distributie a variabilei aleatoare reprezentand cererea zilnica de antibiotice; b. Sa se determine functia de repartitie corespunzatoare c. Care este probabilitatea ca numarul cererilor sa fie cuprins intre 4 si 7, putand lua valoarea 4 sau 7; d. Care este probabilitatea ca cererea de antibiotice sa fie mai mare de 6; Solutie:
a. ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
5048
50107
50146
50125
5074
5033
:X deci
⎟⎟⎠
⎞⎜⎜⎝
⎛08,08
20,07
28,06
24,05
14,04
06,03
:X
b. Din definitia functiei de repartitie avem ( ) ( )xXPxF ⟨= , deci:
Variabile aleatoare
16
( )
0, 30,06 3 4
0,06 0,14 0,20 4 50,06 0,14 0,24 0,44 5 6
0,06 0,14 0,24 0,28 0,72 6 70,06 0,14 0,24 0,28 0,20 0,92 7 8
1 8
daca xdaca x
daca xdaca x
F xdaca x
daca xdaca x
≤⎧⎪ ⟨ ≤⎪⎪ + = ⟨ ≤⎪ + + = ⟨ ≤⎪= ⎨ + + + = ⟨ ≤⎪⎪ + + + + = ⟨ ≤⎪
⟩⎪⎪⎩
c. ( ) ( ) ( ) ( ) ( ) ( )4 7 4 7 7 7 4 70,72 0,06 0,20 0,86
P X P X P X F F P X≤ ≤ = ≤ ⟨ + = = − + = =
= − + =
Putem demonstra si altfel: ( ) ( ) ( ) ( ) ( )( )( ) ( ) ( ) ( )
4 7 4 5 6 7
4 5 6 77 12 14 10 43 0,8650 50 50 50 50
P X P X X X X
P X P X P X P X
≤ ≤ = = ∪ = ∪ = ∪ =
= = + = + = + = =
= + + + = =
=
d. ( ) ( ) ( ) ( ) ( ) ( )6 1 6 1 6 6 1 6 6
1 0,44 0,28 0,28
P X P X P X P X F P X⟩ = − ≤ = − ⟨ + = = − − =⎡ ⎤⎣ ⎦= − − =
=
3. Sa se determine Rx∈ astfel incat variabila aleatoare X sa aiba repartitia:
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛++ 8
14
: 2x
b
xxa
X
Solutie:
Conditiile impuse sunt:
[ ][ ]
⎪⎪⎪
⎩
⎪⎪⎪
⎨
⎧
=+++
∈+
∈+
181
4
1,081
4
1,0
2
2
xxx
xxx
Variabile aleatoare
17
2 2 21 1 8 8 2 1 8 8 10 74 8xx x x x x x x+ + + = ⇒ + + + = ⇒ + − = 0
1,2 1 210 18 28 1
16 16 2x x si− ±
⇒ = ⇒ = − =x
21
=⇒ x singura solutie a sistemului
4. Sa se calculeze media si dispersia pentru urmatoarea variabila
aleatoare⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
322
311
:X
Solutie:
( ) 1 2 51* 2* 1.663 3 3i i
iM X x pμ= = = + = =∑
( ) ( )2 2
2 5 1 5 2 4 2 61 * 2 * 0,3 3 3 3 27 27 27i i
i
D X x pμ ⎛ ⎞ ⎛ ⎞= − = − + − = + = =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
∑ 22
5. Sa se calculeze suma urmatoarelor variabile aleatoare:
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
322
311
:X si ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
211
210
:Y
Solutie:
⎟⎟⎠
⎞⎜⎜⎝
⎛+
321
321:
pppYX
( ) ( ) ( )( ) ( ) ( )
61
21*
31
0*10111
==
=====∩===+= YPXPYXPYXPp
( ) ( ) ( )( ) ( ) ( )( )[ ]
( ) ( ) ( ) ( )21
63
21*
32
21*
310*21*1
121122
==+===+===
==∩=∪=∩===+=
YPXPYPXP
YXYXPYXPp
( ) ( ) ( )( ) ( ) ( )
31
62
21*
32
1*21233
===
=====∩===+= YPXPYXPYXPp
Pe 3p il putem calcula si astfel: 3 1 21 1 11 16 2 3
p p p= − − = − − =
Variabile aleatoare
18
Deci, ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛+
313
212
611
:YX
6. Cunoscandu-se urmatoarea variabila aleatoare ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
322
311
:X sa
se calculeze ( )23 +X DSolutie:
Vom calcula ( ) 1 21* 2*3 3i i
ix x pμ 5
3= = + =∑
( ) ( ) ( ) ( )22
2 2
3 2 3 9* 9*
5 1 5 29* 1 * 2 *3 3 3 3
4 1 1 2 69* * * 29 3 9 3 3
i ii
D X D X D X x pμ+ = = = − =
⎛ ⎞⎛ ⎞ ⎛ ⎞= − + − =⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟⎝ ⎠ ⎝ ⎠⎝ ⎠⎛ ⎞= + = =⎜ ⎟⎝ ⎠
∑
7. Sa se calculeze media si dispersia pentru suma urmatoarelor variabile aleatoare:
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
211
210
:X si ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
212
411
410
:Y
Solutie: Vom calcula media si dispersia pentru cele doua variabile aleatoare:
( )21
21*1
21*0 =+== ∑
iii pxXM si
( ) ( )2 2
2 1 1 1 1 1 1 1 1 10 * 1 * * *2 2 2 2 4 2 4 2i i
i
D X x pμ ⎛ ⎞ ⎛ ⎞= − = − + − = + =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
∑ 4
Analog, ( )45
21*2
41*1
41*0 =++== ∑
iiiqyYM si
( ) ( )2 2 2
2 5 1 5 1 5 10 * 1 * 2 *4 4 4 4 4 2
25 1 1 1 9 1 44 11* * *16 4 16 4 16 2 32 8
i ii
D Y y qμ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞= − = − + − + −⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ ⎝ ⎠
= + + = =
∑ =
Variabile aleatoare
19
( ) ( ) ( )47
45
21
=+=+=+ YMXMYXM
( ) ( ) ( ) 5 11 214 8 8
D X Y D X D Y+ = + = + =
8. Un transport de recipienţi cu materie primă sunt controlaţi astfel: se analizează conţinutul unui recipient ales la întâmplare şi se stabileşte dacă poate fi acceptat sau nu. Se cercetează 6 recipienţi. Dacă recipientul controlat la extracţia de rang k=1,2,3,4,5 nu corespunde întregul transport este respins şi se opreşte analiza. a) Care este repartiţia variabilei aleatoare care dă numărul de recipienţi analizaţi? Se ştie că probabilitatea ca un anumit recipient să corespundă este de 2/3. b) Să se calculeze media acestei variabile. Rezolvare: Variabila aleatoare X ia valorile: X=1 dacă primul recipient este respins ⇒
P(X=1)=P(primul recipient este respins)=31
X=2 dacă primul recipient corespunde, dar al doilea recipient este respins ⇒P(X=2)=P(primul recipient corespunde şi al doilea recipient este respins)=P(primul recipient corespunde)*P(al doilea recipient este
respins)= 232
31*
32
=
X=3 dacă primele două recipiente corespund, dar al treilea recipient este respins ⇒P(X=3)=P(primul recipient corespunde, al doilea recipient corespunde şi al treilea recipient este respins)=P(primul recipient corespunde)*P(al doilea
recipient corespunde)*P(al treilea recipient este respins)= 3
2
32
31*
32*
32
=
.
.
. X=6 dacă toate recipientele corespund ⇒
P(X=6)=P(primele 5 recipientele corespund)=5
32⎟⎠⎞
⎜⎝⎛
Deci, repartiţia de probabilitatea este:
Variabile aleatoare
20
X: ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
5
5
5
4
4
3
3
2
2 32
32
65
32
32
43
32
31
21
Media acestei variabile este:
( ) 5
5
5
4
4
3
3
2
2 32*6
32*5
32*4
32*3
32*2
31*1 +++++=XM
9. Fie q probabilitatea ca o reacţie de policondensare să se producă şi qp −= 1 probabilitatea ca reacţia să se întrerupă. Să se calculeze repartiţia, media şi dispersia variabilei aleatoare care dă gradul de policondensare. Solutie:
Probabilitatea formării unui polimer cu gradul de condensare n, care să conţină n-1 legături formate prin policondensare este , înmulţită cu probabilitatea de întrerupere
1−nqpq =−1 . Deci repartiţia variabilei aleatoare
este:
X: ⎟⎟⎠
⎞⎜⎜⎝
⎛− .
.....321
12 npqn
pqpqp
Se observă că 111
1 =−
=∑=
−
qppq
n
n
( ) ( )......321......32 1212 +++++=+++++= −− nn nqqqpnpqpqpqpXE
Deoarece din q
qqqq n
−=++++
1......2 prin derivare se obtine
( )212
11...321q
nqqq n
−=++++ − rezulta ca
( )( ) pq
pXE 11 2 =−
=
( ) ( ) ( )XEXEXD 22 −= ( ) ( )......321......32 12222122222 +++++=+++++= −− nn qnqqppqnpqpqpXE
Dar ( )2
32
1...32
qqnqqqq n
−=++++
Prin derivare rezulta:
( ) ( ) ( )( )3
122222
11......321
qpqqnqqpXE n
−+
=+++++= −
Variabile aleatoare
21
( )( ) 22 1
pXE =
Rezulta ( ) ( )( ) 223
11
1pq
pqqpXD =−
−+
=
Abaterea medie patratica este ( )pq
X =σ
10. Un lot de comprimate este supus controlului pe flux in ceea ce priveste greutatea, rezistenta si inaltimea. Probabilitatea ca un comprimat sa corespunda la fiecare incercare este de 0,9. Experienta este intrerupta daca tableta nu corespunde la o anumita incercare. Sa se scrie repartitia variabilei aleatoare X care reprezinta numarul de comprimate testate. Solutie:
Se noteaza cu 9,0=q probabilitatea ca tableta sa reziste si cu probabilitatea ca ea sa nu reziste. Probabilitatea ca tableta sa
fie supusa la n incercari este deoarece ea trebuie sa reziste la n-1 incercari si sa reziste la incercarea n.
1,01 =−= qppq n 1−
Asadar:
( ) ( )⎟⎟⎠⎞
⎜⎜⎝
⎛− 1.0*9.0
: 1k
kX k=1,2,....
11. Sa se calculeze media si dispersia variabilei cu repartitia
X: ⎟⎟⎠
⎞⎜⎜⎝
⎛−− nknkk
nn
nn pqpC
nqpqCq ........
......10
11
Solutie:
( ) knkn
k
kn qpkCXE −
=∑=
0
Se porneste de la relatia: ( ) . Prin derivare dupa t
rezulta
knkkn
k
kn
n qtpCqpt −
=∑=+
0
( ) knkkn
k
kn
n qtpkCqptnp −−
=
− ∑=+ 1
0
1
Se considera 1=t si se obtine:
Variabile aleatoare
22
( ) ( ) npXEqpkCqpnp knkn
k
kn
n ===+ −
=
− ∑0
1
Derivand din nou dupa t obtinem:
( ) ( ) ( ) knkkn
k
kn
nn qtpCkqpttpnnqptnp −−
=
−− ∑=+−++ 1
0
22221 1
Se considera 1=t si se obtine:
( ) ( )2
0
221 XEqpCkpnnnp knkkn
n
k==−+ −
=∑
( ) ( ) ( )( ) npqXEXEXD =−= 22 12. Sa se calculeze media si dispersia variabilei cu repartitia
X: ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛−−
− .....!
......!1
10
ke
kee
k λλλ λλ
Solutie: ( ) ( ) λλλλλ λλλλ
==−
== −∞
=
−−
∞
=
−
∑∑ eek
ekekXE
k
k
k
k
1
1
0 !1!
( ) ( ) ( )
( ) λλλλλλλ
λλλλ
λλλ
λλλλ
+=+=+−
=
=+−=+−==
−∞
=
−−
∞
=
−∞
=
−∞
=
−∞
=
−
∑
∑∑∑∑
22
2
22
000
2
0
22
!2
!!1
!!
eek
e
kke
kkke
kkkke
kekXE
k
kk
k
k
k
k
k
k
k
( ) ( ) ( )( ) λ=−= 22 XEXEXD
Distributii de probabilitate
23
DISTRIBUTII DE PROBABILITATE Distributia binomiala
Distribuţia binomială apare la descrierea evenimentelor asociate extracţiilor dintr-o urnă cu bile albe şi bile negre.
Distribuţia variabilei aleatoare “numărul k de bile albe din n bile extrase” se poate reprezenta şi sub formă matricială:
⎟⎟⎠
⎞⎜⎜⎝
⎛= −− 011100 ......
10qpC
nqpC
kqpCqpC
X nkn
knkkn
nn
nn
Probabilitatea evenimentului este knkknk qpCp −=
Proprietati: Media şi dispersia unei variabile aleatoare repartizate binomial sunt si npM = npqD =
Repartiţia binomială apare întotdeauna atunci când un experiment
cu numai două răspunsuri posibile se repetă de n ori. Distributia Poisson
Un caz particular al distributiei binomiale îl prezintă experimentele care se repetă de un număr foarte mare de ori, iar evenimentul în a cărui apariţie suntem interesaţi are o probabilitate foarte mică, categorisit uzual ca “eveniment rar”.
Distribuţia Poisson se obţine la limită, când ∞→n , , dar rămâne constant,
0→pnp λ=np .
Deci, distribuţia Poisson este dată de matricea
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛= −−−− λλλλ λλλ
en
n
ek
keeX nk
!...
!...
!1
10
Proprietati: Media şi dispersia unei variabile aleatoare distribuite Poisson sunt
( ) λ=XM si ( ) λ=XD Distributia normala
Spunem că o variabilă aleatoare este normal repartizată ( )2,σmN , atunci când densitatea sa de probabilitate este data de formula:
( )( )
2
2
2
21,, σ
πσσρ
mx
emx−
−=
Distributii de probabilitate
24
Aplicatie: Daca X este o variabilă aleatoare normal repartizată ( )2,σmN ,
atunci variabila aleatoare σ
mXZ −= este normal repartizată . ( )1,0N
Variabila Z se numeste variabila aleatoare normal standardizata. Distributia χ2 Helmert - Pearson Se consideră n observaţii independente x1, x2, …, xn (variabile aleatoare independente) normal distribuite ( )2,σmN .
Variabilele standard σ
mxu i
i−
= , ni ,1= sunt de asemenea
independente, iar suma pătratelor lor va avea o distributie ce poate fi determinată. Se defineşte ∑= n
iuX1
2 . Distribuţia variabilei X rezultate se notează χ2(n)
Distributia STUDENT
Dacă sunt date două variabile aleatoare ( )1,0NZ ∈ si
independente, se spune că variabila
( )nV 2χ∈
( )ZT TVn
= ∈ n este repartizată
Student cu n grade de libertate. Distributia F (Behrens - Fisher – Snedecor) a raportului a două dispersii
Se consideră frecvent în statistică raportul a două dispersii care estimează aceeaşi dispersie generală a unei colectivităţi. Dintr-o colectivitate generală se extrag două selecţii ( )1
2 nU χ∈ , . ( )22 nV χ∈
Raportul lor este o variabilă aleatoare repartizată F
( )21
2
1 ,nnF
nVnU
F ∈=
Distributii de probabilitate
25
Exercitii: 1. Probabilitatea ca un comprimat sa se sfarame este de 0.1. Presupunand ca un lot cuprinde 200 comprimate sa se calculeze numarul mediu de comprimate care se sfarama si abaterea medie patratica. Solutie: Deoarece p =0.1 este constant se utilizeaza repartitia binomiala ( ) 20200*1.0 === npXE ( ) 189.0*1.0*2002 ==== npqXD σ
2. Se stie ca 3 muncitori din 2000 fac alergie la medicamente. Care este probabilitatea ca intr-o fabrica cu 1000 de muncitori sa existe 3 muncitori alergici? Solutie: a) Se poate utiliza repartitia binomiala cu p=3/2000=0.0015 si n=1000.
knP = knkk
n qpC −
31000P =
31000331000 2000
312000
3 −
⎟⎠⎞
⎜⎝⎛ −⎟
⎠⎞
⎜⎝⎛C =0.12555
b) Folosind repartitia Poisson se obtine: ( ) 125.0!3
5.1 35.13 ==
−eP unde 5.1== npλ
3. Se stie ca probabilitatea ca un lot sa fie corespunzator este de 0.9. a. Care este probabilitatea ca din 10 loturi sa fie rebutat unul singur? b. Care este probabilitatea ca din 10 de loturi sa fie rebutat mai mult de 2 loturi? Solutie:
Suntem in cazul distributiei binomiale in care avem: ( ) 0,9P lotul este corespunzator q= =
( ) 1 0,9 0,1P lotul este necorespunzator p= − = = a) Fie X numarul de loturi rebutate. In acest caz avem 20n = si 1k = , deci:
( ) ( ) 387,09,09,0*1,0*!110!1
!109,0*1,0*1 999110 ==
−==== − CqpCXP knkk
n
b) ( ) ( ) ( ) ( ) ( )2 1 2 1 0 1 2P X P X P X P X P X⟩ = − ≤ = − = + = + = =⎡ ⎤⎣ ⎦
Distributii de probabilitate
26
)( ) (
0 0 10 1 9 2 2 810 10 10
10 9 8 8 2
1 *0,1 *0,9 *0,1*0,9 *0,1 *0,9
1 0,9 0,9 0, 45*0,9 1 0,9 * 0,9 0,9 0, 45
C C C⎡ ⎤= − + + =⎣ ⎦
= − + + = − + + =
8 2 9 90,9 1 4,81 0,9 * 0,9 0,9 1 0,9 * 0,9 1 1 0,9 *2 2
1 0,387*2, 4 1 0,929 0,071
⎛ ⎞ ⎛ ⎞= − + + = − + + = − =⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
= − = − =2
0
4. Se stie ca 20% dintre anumite produse sunt defecte. Se aleg la intamplare 8 produse. a. Care este probabilitatea ca 0.1 sau 2 produse sa fie defecte? b. Care este probabilitatea ca cel putin doua produse sa fie
defecte? c. Care este probabilitatea ca cel mult doua produse sa fie
defecte? Solutie: Fie X numarul de produse defecte. Se ia , ( ) 0,20p P produse defecte= = 1 0,8q p= − = si 8n = . a) ( ) ( ) ( ) ( ) ==+=+=== 21021.0 XPXPXPsauXP
( ) ( )( ) ( ) 798.08,0*8,34,16,18,08,004,0*288,0*6,18,08,0
8,0*2,0*!28!2
!88,0*2,0*!18!1
!88,0
8,0*2,0*8,0*2,0*8,0*2,0*
7726
6278
6228
718
8008
==++=++=
=−
+−
+=
=++= CCC
b) ( ) ( ) ( ) ( ) ( )[ ]==+=−=≤−=⟨−=≥ 10111212 XPXPXPXPXP
[ ] ( ) =⎥⎦
⎤⎢⎣
⎡−
+−=+−= 78718
8008 8,0*2,0*
!18!1!88,018,0*2,0*8,0*2,0*1 CC
( ) 49,051,013*17,013*8,016,18,08,01 87 =−=−=−=+−= c) ( ) ( ) ( ) ( ) 798,02102 ==+=+==≤ XPXPXPXP 5. 8% din recipientele cu materie prima sunt rebutate. Care este probabilitatea ca din 20 de recipiente 2 sa fie rebutate. Solutie:
Distributii de probabilitate
27
Folosind repartitia binomiala pentru p=0.08 si n=20 se obtine
( ) ( ) 2711.092.008.0!18!2
!20 182220 ==P
Folosind repartitia Poisson pentru 6.1== npλ se obtine ( ) 258.0!2
6.1 26.12 ==
−eP ⇒ Se observa ca rezultatele sunt apropiate.
6. Se stie ca 10% din productia unei fabrici este alcatuita din produse cu defectiuni. Sa se calculeze probabilitatea ca din 10 produse alese la intamplare ( cu punerea inapoi a produsului) k sa fie defecte, k=0,1,2,...,7. Solutie: Se poate aplica fie repartitia binomiala, fie repartitia Poisson.
knkkn
kn qpCP −= ,
!keP
kk
λλ −
= unde n=10; p=0.1; q=0.9 si 1== npλ
k 0 1 2 3 4 5 6 7 k
nP 0.348 0.387 0.193 0.057 0.011 0.001 0.001 0 kP 0.368 0.368 0.184 0.061 0.015 0.003 0.001 0
7. Probabilitatea de a avea un consum zilnic normal de energie este de 0.75. Fie X numarul de zile lucratoare pe saptamana, in care consumul este normal. Sa se determine : a. Repartitia variabilei aleatoare X b. Probabilitatea unui consum normal in cel mai putin 4 zile c. Media, dispersia si abaterea medie patratica a lui X. Solutie: Se aplica repartitia binomiala cu n=6 , p=3/4 si q=1/4
a) ⎟⎟ ⎠
⎞⎜⎜⎝
⎛−knkk
n qpCk
X :
Deci ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
40967296
40961458
40961215
54
4096540
4096135
32
409618
40961
10:X
b) ( ) ( ) ( ) ( ) 83.06544 ==+=+==≥ XPXPXPXP c) ( ) 5.4== npXE ( ) 125.1== npqXD ( ) ( ) 06.1== XDXσ
Distributii de probabilitate
28
8. Norma prevede pentru caprolactama punctul de solidificare 2.67≥ °C. Experientele efectuate asupra unui lot arata ca punctul de
solidificare este repartizat normal cu media C07.67 si dispersia 09.02 = . Sa se determine procentul de sarje care nu corespund calitatii.
=μσSolutie:
Din ipoteza avem ca variabila aleatoare X (punctul de solidificare) este normal repartizata cu media si dispersia deci, C07.67=μ 09.02 =σ
( )( )
( )1,0NXD
XEXZ ∈−
= 66,135
3,05,0
3,07,672,67
−=−=−
=−
⇒
Se observa ca:
( ) ( )67,7 67, 2 67,767.2 1,66 0,5 0, 45150,09 0,09
XP X P P Z⎛ ⎞− −
⟨ = ⟨ = ⟨ − = −⎜ ⎟⎝ ⎠
Deci, ( )67.2 0.0485P X ⟨ = 9. Un echipament pentru producerea apei pentru solutii injectabile este alcatuit din patru sisteme independente. Probabilitatea ca un sistem sa se defecteze in timpul functionarii este de 0.1. Care este repartitia variabilei aleatoare X care da numarul de sisteme ce se pot defecta in timpul functionarii? Solutie: X este probabilitatea binomiala in care 4=n , 1.0=p si 9.01 =−= pq
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ⎟⎟⎠
⎞⎜⎜⎝
⎛4313
4222
431
44 1.0
41.09.0
31.09.0
21.09.0
19.00
:CCC
X
Distributii de probabilitate
29
10. Un operator poate controla vizual doua fiole de vaccin pe minut. Pe durata unui schimb (480 minute) se constata ca 40 de fiole de vaccin prezinta defecte de inchidere. Considerand ca numarul de fiole defecte este repartizat Poisson sa se determinde probabilitatea ca din 5 fiole cel putin doua sa fie defecte. Solutie:
Intr-un minut se constata 083.048040
= fiole defecte si sunt
inspectate vizual 2 fiole. Deci, 5 fiole de vaccin vor fi inspectate in
5.225= minute.
In acest timp se constata 2.05.2*083.0 = fiole defecte. La o repartitie Poisson λ este media, deci 2=λ
( ) ( )!
2.0 2.0
kekP
k −
=
Probabilitatea ceruta corespunde lui 5,4,3,2=k ( ) ( ) ( ) ( )5432 PPPPP +++= =0.0175
11. Sa se calculeze probabilitatea ca o variabila aleatoare normala sa ia valori intr-un interval de lungime σk de-o parte si de alta a valorii medii. Se ia k=1,2,3. Solutie: Se calculeaza ( ) ( ) ( )
( ) ( ) ( ) ( ) kzkZPkkkZkPkXkP
kXkPkXkPkXP
*2*2 =⟨=−Φ−Φ=⟨⟨−=⎟⎠⎞
⎜⎝⎛ ⟨
−⟨−=
=⟨−⟨−=+⟨⟨−=⟨−
σμ
σμσσμσμσμ
unde ( 1,0NXZ ∈−
= )σμ si ( )kk zZPz ⟨=
a) Pentru 1=k avem ( ) ( ) 6826,03413,0*2*211 1 ===⟨⟨−=⟨− zZPXP σμ
Distributii de probabilitate
30
b) Pentru 2=k avem
( ) ( ) 9544,04772,0*2*2222 2 ===⟨⟨−=⟨− zZPXP σμ
c) Pentru 3=k avem ( ) ( ) 9974,04987,0*2*2333 3 ===⟨⟨−=⟨− zZPXP σμ
Se observa ca probabilitatea ca o variabila aleatoare normala sa ia
valori inafara intervalului ( )σσ 3,3− de-o parte si de alta a valorii medii este infima.
Distributii de probabilitate
31
12. O variabila aleatoare este repartizata normal cu media 30 si dispersia 1002 =σ . Care este probabilitatea ca variabila aleatoare sa ia valori mai mari decat 5 ( mai mici decat -5)? Solutie:
( ) ( )5 305 210
0,5 0, 4938 0.0062
X XP X P Pμ μσ σ− − −⎛ ⎞ ⎛ ⎞⟨ = ⟨ = ⟨ − = Φ − =⎜ ⎟ ⎜ ⎟
⎝ ⎠ ⎝ ⎠= − =
,5 2.5
( ) ( )
0002.04998,05,0
5.35,310
3055
=−=
=−Φ=⎟⎠⎞
⎜⎝⎛ −⟨
−=⎟
⎠⎞
⎜⎝⎛ −−
⟨−
=−⟨σμ
σμ XPXPXP
Distributii de probabilitate
32
13. O variabila aleatoare are media 2=μ si dispersia 42 =σ . Sa se calculeze ( )30 ⟨≤ XP si ( )1≤XP . Solutie:
( ) ( )0 2 2 3 20 3 1 0,52 2 2
XP X P P Z− − −⎛ ⎞≤ ⟨ = ≤ ⟨ = − ≤ ⟨ =⎜ ⎟⎝ ⎠
0 2 3 2 0,1915 0,3413 0,53282 2− −⎛ ⎞ ⎛ ⎞= Φ −Φ = + =⎜ ⎟ ⎜ ⎟
⎝ ⎠ ⎝ ⎠
b)
( ) ( ) ( )
2417.01915,04332,02
212
21
5,05,12
212
22
21111
=−=⎟⎠⎞
⎜⎝⎛ −−
Φ−⎟⎠⎞
⎜⎝⎛ −
Φ=
=−≤≤−=⎟⎠⎞
⎜⎝⎛ −
≤−
≤−−
=⟨⟨−=≤ ZPXPXPXP
Distributii de probabilitate
33
14. Fie X o variabila aleatoare repartizata normal cu parametrii μ si σ . Sa se calculeze ( )μ−XE Solutie:
( ) ( ) ( ) ( )( )2
2212
x
E X x f x dx x eμ
σμ μ μσ π
− −+∞ +∞
−∞ −∞
− = − = −∫ ∫ dx =
( )( )
( )( )2 2
2 2
2 2
2 2
2
2
2 2
02 2
0 0
22
0
1 12 2
1 1 22 2 2
2 22
x x
y y
y
x e dx x e dx
ye dy ye dy ye dy
e
μ μμσ σ
μ
μ μσ π σ π
σ π σ π σ π
σ σπσ π
− −+∞− −
−∞
+∞ +∞− −
−∞
+∞−
= − − + − =
= − + = =
= − =
∫ ∫
∫ ∫ ∫2
22y
−
15. Densitatea de repartitie a duratei de functionare a unui sistem de
centrifugare este ( ) ττ
ττ
−= ef 1 unde τ este 3 ani. Sa se determine
probabilitatea ca intr-o instalatie formata din trei sisteme de centrifugare sa nu se defecteze nici o centrifuga in primii 6 ani de functionare. Solutie:
Probabilitatea ca durata de functionare a unei singure centrifugi sa fie mai mare de 6 ani este
26
6
1 −−−∞
==∫ eede τττ
ττ
Deoarece duratele de functionare ale evaporatoarelor sunt variabile independente, probabilitatea cautata va fi ( ) 632 −− = ee
16. Intr-un strat fluidizat se afla M=1000 kg de granula. Debitul de material prin strat este de hkgGm /4000= .
Sa se determine ce fractiune de particule se afla in strat un timp mai mic (mai mare) decat timpul mediu de stationare. Solutie:
Distributii de probabilitate
34
min1560*40001000
===mG
Mτ si ( ) ττ
ττ
−= ef 1
( ) ( ) 11 −−−∞∞
=−===⟩ ∫∫ eededfP ττ
ττ
ττ
τττ
τττττ
( ) ( ) 1
01 −−==⟨ ∫ edfP ττττ
τ
Estimarea intervalelor de incredere
35
ESTIMATII Problema estimării intervalelor pentru un parametru θ se reduce la
găsirea unui interval de încredere ( )UL θθ , cu un coeficient de încredere α−1 astfel încât: ( ) αθθθ −=⟨⟨ 1ULP .
Aplicatie: Presupunem ca dorim sa estimam θ , fractia oamenilor care au
tuberculoza intr-o populatie omogena cu un numar mare de indivizi. In acest scop vom alege la intamplare n indivizi pentru a fi cercetati si gasim ca x dintre ei au boala. Deoarece populatia are un numar mare de indivizi si este omogena, presupunem ca indivizii alesi pentru cercetare sunt independenti si ca fiecare are probabilitatea θ de a avea tuberculoza. Probabilitatea ca din cei n indivizi x sa aiba tuberculoza este:
( )1 n xx xnC θ θ −− , daca 0 1θ≤ ≤
Deci spatiul parametrilor este [ ]0,1H = Vom considera functia de verosimilitate:
( ) ( )1 n xxP x θ θ −= − Avem:
( ) ( ) ( )ln ln ln 1P x n xθ θ θ= + − −
( )ln1
P x n xθθ θ θ
∂ −= −
∂ − si ( )
( )
2
22 2
ln1
P x n xθθ θ θ
∂ −= − −
∂ −
Daca 1 1x n≤ ≤ − , ecuatia ( )ln0
P θθ
∂=
∂ are solutia unica x
nθ = .
Deoarece xn
θ = , ( )2
2
ln0
P θθ
∂⟨
∂acesta este un maxim relative.
Deoarece ( ) 0P θ = pentru 0θ = sau 1θ = , acesta este maximul
absolute si deci xn
θ = .
Daca 0x = , ecuatia ( )ln0
P θθ
∂=
∂nu are solutie si maximul se
realizeaza pe frontiera spatiului parametrilor [ ]0,1H = . In acest caz avem
( ) ( )1 nP θ θ= − , pentru 0 1θ≤ ≤
( )P θ are valoarea cea mai mare cand 0θ = si deci 0θ = .
Estimarea intervalelor de incredere
36
Similar 1θ = pentru x n= si astfel avem xn
θ = pentru 0,1, 2,...,x n= .
Observam ca:
( ) ( )1 1 * *M M X nn n
θ θ θ= = =
Ceea ce arata ca xn
θ = este un estimator nedeplasat pentru θ .
Estimarea intervalelor de încredere pentru medii a) Cazul când se cunoaste dispersia.
Se consideră o populaţie repartizată normal ( )2,σμN . Dacă se
cunoaşte dispersia se foloseste variabila aleatoare
n
XZσμ−
= care este
repartizată ( )1,0N . Intervalul de incredere pentru medie va fi:
( ) ⎟⎟⎠
⎞⎜⎜⎝
⎛+−=
−− nzX
nzXUL
σσθθ αα2
12
1,,
Mărimea n
zE σα2
1−= poartă numele de eroare.
b) Cazul când dispersia este necunoscută Dacă nu se cunoaste dispersia se utilizeaza variabila aleatoare
1nXT Ts
n
μ−
−= ∈ , unde ( 21
1 is xn
= −− ∑ )X este dispersia de selectie.
Intervalul de incredere pentru medie va fi:
( ) ⎟⎟⎠
⎞⎜⎜⎝
⎛+−=
−−−− nstX
nstX
nnUL
21,1
21,1
,, ααθθ
În acest caz eroarea este nstE
n2
1,1 α−−
=
Dacă numărul de experienţe este , se poate folosi aproximaţia 30⟩n
21
21,1 αα
−−−= zt
n
Estimarea intervalelor de incredere
37
Estimarea intervalului de încredere α−1 pentru diferenţa a două medii Se consideră două selecţii din populaţii normal repartizate
( )211 ,σμN şi ( )2
22 ,σμN . a) Cazul dispersiilor 2
221 ,σσ cunoscute..
Variabila aleatoare ( ) ( )1 2 1 2
2 21 2
1 2
X XZ
n n
μ μ
σ σ
− − −=
+
este repartizată N(0,1).
Intervalul de estimaţie pentru diferenţa mediilor este
( ) ( ) ( ) ⎟⎟⎠
⎞⎜⎜⎝
⎛++−+−−=ΘΘ
−−2
22
1
21
21
212
22
1
21
21
2121 ,,nn
zXXnn
zXX σσσσαα
În acest caz, eroarea este 2
22
1
21
21 nn
zEσσ
α +=−
.
b) Dispersii necunoscute dar presupuse egale În cazul în care nu cunoaştem dispersiile dar ştim că sunt egale
utilizăm variabila aleatoare 222
21 σσσ ==
( ) ( )
21
2121
11nn
s
XXT
p +
−−−=
μμ repartizată ( )221 −+ nnT
unde ( ) ( )2 21 1 22
1 2
12p
n s n ss
n n− + −
=+ −
21 este dispersia ponderată de selecţie
Deci, intervalul de incredere este:
( ) ⎟⎟⎠
⎞⎜⎜⎝
⎛++−+−−=ΘΘ
−−+−−+212
1,221
2121,2
212111,11,
1221 nn
stXXnn
stXX pnn
pnn
αα
cu eroarea 212
1,2
1121 nn
stE pnn+=
−−+α .
Estimarea intervalelor de incredere
38
Estimarea intervalelor de încredere pentru dispersie
Considerăm o selecţie de volum n dintr-o populaţie normală ( )2,σμN . Variabila aleatoare
( ) 2
2
1n sV
σ−
=
este repartizată ( )12 −nχ şi ca urmare intervalul de incredere pentru dispersie este:
( ) ( )2
2,1
22
2
21,1
2 11
αα χσ
χ−−−
−⟨⟨
−
nn
snsn .
Estimarea intervalului de încredere pentru raportul a două dispersii
Se consideră selecţia aleatoare dintr-o populaţie 111211 ,...,, nxxx
( )21, ,σμN şi o selecţie dintr-o populaţie
222221 ,...,, nxxx ( )222 ,σμN .
Raportul
22
22
21
21
σ
σs
s
F =
este repartizat ( )1,1 21 −− nnF şi deci intervalul de estimaţie pentru raportul dispersiilor este:
( ) ⎟⎟⎠
⎞⎜⎜⎝
⎛=ΘΘ
−−−−−2
1,1,121
22
2,1,12
1
22
2121
,, ααnnnn
UL fssf
ss
Estimarea intervalelor de incredere
39
Exercitii: 1. Sa se calculeze un interval de incredere pentru media determinarilor colorimetrice exprimate in molaritati 10-4: 1.22; 1.23; 1.18; 1.29, daca se cunoaste dispersia pentru o observatie individuala 210 . Se alege
2 10*16 M−=σ95.01 =−α
Solutie
Se utilizeaza faptul ca
n
XZσμ−
= este repartizat ( )1,0N
nzX
nzz
n
Xzz
n
Xz σμσσμ
σμ
αααααα **2
12
12
12
12
12
−−−−−⟨−⟨−⇒⟨
−⟨−⇒⟨
−⟨
⇒+−⟨−⟨−−⇒−− n
zXn
zX σμσαα **2
12
1
nzX
nzX σμσ
αα **2
12
1 −−+⟨⟨−⇒
Dar avem: ( ) Mnx
X i 44
10*23.14
10*29,118,123,122,1 −−
=+++
== ∑ ;
96.1975.02
1==
−zz α ; 4=n
Deci intervalul de incredere pentru media μ este:
210*7*96,110*23,1
210*7*96,110*23,1
54
54
−−
−− +⟨⟨− μ
MM 44 10*622,110*838,0 −− ⟨⟨⇒ μ
Estimarea intervalelor de incredere
40
2. La receptionarea unei substante in recipienti care trebuie sa aiba 40 kg se efectueaza un control cantarind prin sondaj 4 recipiente. Se obtin greutatile: 39.75; 40.25; 39.50; 39.50. Sa se determine un interval de incredere pentru greutatea medie cu un coeficient de incredere 95.01 =−α daca se presupune ca greutatile sunt distribuite normal. Solutie
Deoarece nu se cunoaste dispersia se utilizeaza faptul ca 2σ
ns
XTX
μ−= este repartizat ( )1−nT unde:
( ) 75,394
50,3950,3925,4075,39=
+++== ∑
nx
X i
( )( ) ( ) ( ) ( )
=−
−+−+−+−=
=−−
= ∑
1475,3950,3975,3950,3975,3925,4075,3975,39
11
2222
22 Xxn
s iX
( ) ( ) ( )=
⎥⎥⎦
⎤
⎢⎢⎣
⎡⎟⎠⎞
⎜⎝⎛−+⎟
⎠⎞
⎜⎝⎛−+⎟
⎠⎞
⎜⎝⎛=
−+−++=
222222
41
41
21
31
325,025,050,00
221
81
83*
31
161
161
41
31
=⇒==⎟⎠⎞
⎜⎝⎛ ++= Xs
4=n ; 18,3975.0;3 =t
Intervalul de incredere este:
Estimarea intervalelor de incredere
41
22*21*18,375,39
22*21*18,375,39 +⟨⟨− μ
Eroarea este 56,022*2
1*18,3 ≅=E , deci 31,4019,39 ⟨⟨ μ
3. 7 containere au greutatile 9.8; 10.2; 10.4; 9.8; 10.0; 10.2; 9.6. Sa se gaseasca un interval de incredere cu 95.01 =−α pentru media greutatii presupunand ca greutatea este distribuita normal. Solutie
Vom utiliza variabila aleatoare
ns
XTX
μ−= repartizata ( )1−nT
0.107
6,92,10108,94,102,108,9=
++++++== ∑
nx
X i ;
( )
( ) ( ) ( ) ( ) ( ) ( )
09,0104
102
102
104
102
102
61
17106,9102,10108,9104,10102,10108,9
1
222222
222222
2
2
≅⎥⎥⎦
⎤
⎢⎢⎣
⎡⎟⎠⎞
⎜⎝⎛−+⎟
⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛−+⎟
⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛+⎟
⎠⎞
⎜⎝⎛=
=−
−+−+−+−+−+−
=−
−= ∑
nXx
s iX
447.2975.0;6 =t
Intervalul de incredere:
73.0*447.210
73.0*447.210 +⟨⟨− μ
Deci ( ) ( )26.10;74.9, =ΘΘ UL
Estimarea intervalelor de incredere
42
4. La determinarea continutului de substanta activa a unui numar de 2500 fiole s-a gasit greutatea medie mgX 18.126= , mgs 05.4= . Sa se calculeze un interval de incredere pentru medie. Se alege 99.01 =−α Solutie:
Deoarece 302500 ⟩=n , se poate folosi aproximaţia 2
12
1,1 αα−−−
= ztn
si se va lua 58.2995.0 =z
Avem 2500
05.4*58.218.1262500
05.4*58.218.126 +⟨⟨− μ , deci
intervalul de incredere este: 39,12697,125 ⟨⟨ μ
5. Se efectueaza 8 titrari volumetrice si se obtin rezultatele: 76.48; 76.43; 77.20; 76.45; 76.25; 76.48; 76.48; 76.60 cm3. Sa se calculeze un interval de incredere pentru media masuratorilor. Se ia 95.01 =−α Solutie
546.768
60,7648,7648,7625,7645,7620,7748,7648,76
=
=+++++++
== ∑nx
X i
( )0790.0
1
2
2 =−
−= ∑
nXx
s iX
36.2975.0;72
1;1==
−−tt
n α
Avem 2
1;12
;1 ααμ
−−−⟨
−⟨
nX
nt
sXt , deci,
XnXnstXstX **
21;1
21;1 αα μ
−−−−+⟨⟨− adica:
79.7631.76 ⟨⟨ μ 6. Determinarile succesive efectuate in doua vase deschise care contin HCl au dat normalitatile: N1 N2 15.75 15.58 15.64 15.49 15.92 15.72
Se stie ca dispersia concentratiilor este . 016,02 =σ
Estimarea intervalelor de incredere
43
Sa se construiasca un interval de incredere cu coeficientul 95.01 =−α pentru diferenta 21 μμ − unde 1μ si 2μ sunt valorile teoretice
ale concentratiilor medii. Solutie
Se utilizeaza variabila ( )
2
22
1
21
2121
nn
XXz
σσ
μμ
+
−−−=
77,153
92,1564,1575,1511 =
++== ∑
nx
X i
60,153
72,1549,1558,1522 =
++== ∑
nx
X i
96.1975.0 =z
Avem, 2
12
αα−
⟨⟨ zZz ,deci ( )2
1
2
21
1
21
2121
21 αα
σσ
μμ−−
⟨
+
−−−⟨− z
nn
XXz ceea ce
inseamna ca: errXXerrXX +−⟨−⟨−− 212121 μμ unde eroarea este:
20,010,0*96,13016,0
3016,0*96,1*
2
22
1
21
21
==+=+=− nn
zerrσσ
α
Obtinem astfel: 20,060,1577,1520,060,1577,15 21 +−⟨−⟨−− μμ
1 20,03 0,37μ μ− ⟨ − ⟨ 7. Au fost examinate 75 esantioane de substanta de tipul 1 cu procentul de substanta activa 8.2 si abaterea medie patratica 0.8 si 50 esantioane de substanta de tipul 2 cu procentul de substanta activa 7.6 si abaterea medie patratica 0.6. Sa se gaseasca un interval cu coeficientul de incredere
96.01 =−α pentru diferenta 21 μμ − a continuturilor medii de substanta activa. Solutie:
2
22
1
21
212121
2
22
1
21
2121
nnzXX
nnzXX
σσμμ
σσαα ++−⟨−⟨+−−
−−
6.06.72.821 =−=− XX ; 054.298.02
1==
−zz α
Estimarea intervalelor de incredere
44
5036.0
7564.0054.26.0
5036.0
7564.0054.26.0 21 ++⟨−⟨+− μμ
858.0342.0 21 ⟨−⟨ μμ 8. Pentru a studia influenta concentratiei de component catalitic asupra reactiei de obtinere a NO2 se fac doua grupe de experiente indexate prin 1 si 2 pentru concentratiile 0.5 si respectiv 1%. Se obtin datele urmatoare :
1 5.18 5.52 5.42 2 5.58 5.62 5.82
Sa se construiasca un interval de incredere cu coeficientul 0.95
pentru diferenta 21 μμ − . Se considera ca dispersiile sunt necunoscute dar egale si 95,01 =−α Solutie:
Se utilizeaza variabila ( )1 2 1 2
1 2
1 1p
X XT
Sn n
μ μ− − −=
+ distribuita Student cu
grade de libertate. 221 −+ nnAvem
37.51 =X ; 67.52 =X ; ; 08425.021 =s 07325.02
2 =s
07875.02
22
21
22
212 =
−++
=nn
ssS p ; 776.2975.0;4 =t
Estimarea intervalelor de incredere
45
Deci
31
31*07875.0*776.267.537.5
31
31*07875.0*776.267.537.5
21
21
++−⟨−
−⟨+−−
μμ
μμ
Rezulta 2361.09361.0 21 ⟨−⟨− μμ 9. Greutatile unor containere sunt (in kg): 16.4; 16.1; 15.8; 17.0; 16.1; 15.9; 15.8; 16.9; 15.2; 16.0. Sa se gaseasca un interval de incredere cu
95.01 =−α pentru dispersia acestora. Solutie
Se utilizeaza variabila aleatoare ( )2
21σ
snV −= , iar intervalul de
incredere este: ( ) ( )
2
2,1
22
2
21,1
2 11
αα χσ
χ−−−
−⟨⟨
−
nn
snsn
Estimarea intervalelor de incredere
46
023.192975.0;9 =χ ; 700.22
025.0;9 =χ
Avem 161, 2 16,1210
ixX
n= = =∑ si ( )22 1 0.286
1 is x Xn
= − =− ∑
Deci,
700.2286.0*9
023.19286.0*9 2 ⟨⟨ σ Rezulta 953.0125.0 2 ⟨⟨ σ
10. Cinci masuratori similare asupra debitului apei reci la un schimbator de caldura au dat rezultatele (kg / s): 5.76; 6.03; 5.84; 5.90; 5.89. Sa se gaseasca un interval de incredere 95.01 =−α pentru dispersia debitelor. Solutie:
5.88X = ; ; 00975.02 =s1.112
975.0;4 =χ ; 484.02025.0;4 =χ
484.000975.0*4
1.1100975.0*4 2 ⟨⟨ σ
Rezulta 08057.000351.0 2 ⟨⟨ σ
Estimarea intervalelor de incredere
47
11. Se efectueaza 8 titrari volumetrice si se obtin rezultatele: 76.48; 76.43; 77.20; 76.45; 76.25; 76.48; 76.48; 76.60 cm3. Sa se calculeze un interval de incredere pentru dispersia masuratorilor. Se alege 95.01 =−α . Solutie:
( ) ( )2
2,1
22
2
21,1
2 11
αα χσ
χ−−−
−⟨⟨
−
nn
snsn
612,37 76,558
ixX
n= = =∑
( )22 1 0,07901 is x X
n= − =
− ∑
013.162975.0;7 =χ
690.12025.0;7 =χ
690.10790.0*7
013.160790.0*7 2 ⟨⟨ σ
Rezulta 3262.003452.0 2 ⟨⟨ σ 12. S-au facut 20 de analize ale unei materii prime si s-au gasit o dispersie a concentratiei de substanta activa 2132.0 . Sa se calculeze un interval de incredere pentru dispersia masuratorilor. Se alege 95.01 =
2 =s−α .
Solutie: 9.322
975.0;19 =χ ; 91.82025.0;19 =χ
91.82132.0*19
9.322132.0*19 2 ⟨⟨ σ
Rezulta 4545.01231.0 2 ⟨⟨ σ
Estimarea intervalelor de incredere
48
13. S-a efectuat o analiza asupra continutului de substanta activa a doua loturi de materie prima. S-au analizat 25 de probe din primul lot si 16 probe din cel de al doilea lot de materie. S-a obtinut o concentratia medie 82 cu dispersia 64 pentru primul lot si concentratia medie 78 cu dispersia 49 pentru al doilea lot. Sa se gaseasca un interval de incredere cu coeficientul
98.01 =−α pentru raportul dispersiilor. Solutie:
1 2 1 2
2 2 22 2 22 2 21, 1, 1, 1,11 1 12 2
n n n n
s sf fs sα α
σσ− − −
⟨ ⟨− −
251 =n 642
1 =s
162 =n 492
2 =s
304.001.0;24.15 =f 89.299.0;24.15 =f
2221
49 49*0.304 *2.8964 64
σσ
⟨ ⟨
Avem: 2221
0.23 2,22σσ
⟨ ⟨ ⇒ 2
1
0.48 1.49σσ
⟨ ⟨ ⇒ 1
2
1 11, 49 0, 48
σσ
⟨ ⟨ ⇒
1
2
0,67 2,08σσ
⟨ ⟨
14. Se stie ca 90% din produsele unei intreprinderi sunt corespunzatoare.
Sa se gaseasca un interval de estimatie pentru proportia p de produse corespunzatoare. Se alege 95.01 =−α si se face o selectie de 100 produse. Solutie
Se utilizeaza
nqpppZˆ*ˆ
ˆ −= , unde 9.0ˆ =p ; 9.0ˆ =q ; 96.1025.0975.0 =−= zz
1001.0*9.0*96.19.0
1001.0*9.0*96.19.0 +⟨⟨− p
959.0841.0 ⟨⟨ p
Verificarea ipotezelor statistice
49
VERIFICAREA IPOTEZELOR STATISTICE
Ipoteze statistice Ipotezele statistice sunt ipoteze asupra repartiţiei unor variabile
aleatoare. Ele se referă fie la parametrii repartiţiei, fie la legea propriu zisa de repartiţie. In cele ce urmeaza ne vom referi numai la ipotezele privind parametrii.
Notaţii conventionale
Ipoteza testată, presupusă adevarată, se numeşte ipoteza nulă şi se notează H0. Testarea necesită şi formularea unei ipoteze complementare, numită ipoteză alternativă şi notată HA. Probabilitatea unei decizii gresite
La verificarea ipotezelor se pot comite două feluri de erori: 1. Erorile de tipul 1 constau în respingerea ipotezei H0 atunci când aceasta este adevărată. 2. Erorile de tipul 2 constau în acceptarea ipotezei H0 atunci când aceasta este falsă. Notatii uzuale: α = P (respinge H0 / H0 adevărată) = riscul de a respinge în mod greşit H0 se numeşte nivel de semnificaţie β = P (acceptă H0 / H0 falsă) = P (respinge HA / HA adevărată) = riscul de a respinge în mod greşit HA ( )0 01 P respinge H H falsaπ β= − = se numeşte puterea testului. Pentru a verifica o ipoteză se folosesc datele de selecţie pentru calcularea unui test statistic. Domeniul de valori ale testului care corespunde respingerii ipotezei H0 cu probabilitatea α se numeşte regiune critică. Metodologia de verificare cuprinde în principiu următoarele etape: 1. se presupune, pe baza unor teste anterioare sau pe baza structurii fenomenului studiat, o repartiţie pentru populaţia statistică din care se face selectia; 2. se formulează ipoteza; 3. se calculează valoarea testului ales şi se compară cu limitele de acceptare, respectiv respingere; 4. se acceptă sau se respinge, în funcţie de rezultat, ipoteza H0.
Verificarea ipotezelor statistice
50
Ipoteze asupra mediei 1. Dispersia cunoscută
Se consideră X o selecţie dintr-o populaţie normală ( )2,σμN . Ca urmare a teoremei limită centrală, variabila aleatoare
( )( )
X E X XZD X
n
μσ
− −= = este repartizata ( )1,0N .
Pentru un nivel de semnificatie α , ipotezele şi criteriile de acceptare sau respingere sunt prezentate mai jos:
H0 HA Regiunea critică
12
Z z α−
⟩ 0μμ = 0μμ ≠
12
Z z α−
⟨−
0μμ = 0μμ⟩ 1Z z α−⟩
0μμ = 0μμ⟨ 1Z z α−⟨−
2. Dispersia necunoscută În acest caz se înlocuieşte în formula anterioară σ cu estimaţia sa
şi se ţine cont că variabila aleatoare XSX
XT Sn
μ−= este repartizată
Student cu n-1 grade de libertate, unde ( )22
1
11
n
X ii
S xn =
= −− ∑ X
Verificarea ipotezelor statistice
51
Ipoteze asupra diferenţelor a două medii 1. Cazul când se cunosc dispersiile
Se consideră două populaţii normale ( )211 ,σμN şi ( )2
22 ,σμN , o selecţie aleatoare din din populaţia
111211 ,...,, nxxx ( )211 ,σμN şi o selecţie
aleatoare din populaţia 222221 ,...,, nxxx ( )2
22 ,σμN . Variabila aleatoare
( ) ( )
( )( ) ( )1 1 2 1 2 1
2 21 21 2
1 2
X X X XZ
D X Xn n
2μ μ μ
σ σ
− − − − − −= =
− +
μ
este repartizată N(0,1).
2. Cazul dispersiilor necunoscute, dar presupuse egale În cazul în care nu cunoaştem dispersiile dar ştim că sunt egale
utilizăm dispersia ponderată de selecţie 222
21 σσσ ==
( ) ( ) ( ) ( )22
11
21
1 12
2
2
11
21
222
2112
1 2
−+
−+−=
−+−+−
= ∑ ∑nn
XxXxnn
snsnsn n
iip
ca un estimator nedeplasat pentru . 2σ
Variabila aleatoare ( ) ( )
21
2121
11nn
s
XXT
p +
−−−=
μμ
este repartizată ( )221 −+ nnT
3. Cazul observaţiilor perechi In cazul când observaţiile formează în mod natural perechi considerăm
variabila aleatoare 21 XXd −= . În cazul în care selecţiile aparţin la aceiaşi populaţie, media lui d va fi
zero: ( ) 0=dE .
Când se cunosc dispersiile avem ( )nn
dD d
22
212 σσ
σ +== şi variabila
aleatoare d
dσ
este repartizată ( )1,0N .
Verificarea ipotezelor statistice
52
Când nu se cunosc dispersiile se folosesc dispersiile de selecţie şi se ţine
cont că variabila aleatoare
nsdd
este repartizată Student cu n-1 grade de
libertate.
Compararea proporţiilor Dacă vom considera un experiment în care răspunsul este de tip da sau
nu, de exemplu vindecare sau nevindecare, supravieţuire sau moarte, etc., numărul de rezultate k de un anumit tip în n repetări ale experimentului este o variabilă aleatoare repartizată binomial.
Variabila aleatoare standardizată ( )( )
npq
pnk
npqnpk
kDkEkz
−=
−=
−= se
aproximează ca fiind normal repartizată.
Estimarea dispersiei Considerăm o selecţie de volum n dintr-o populaţie normală ( )2,σμN .
Variabila aleatoare ( ) 2
2
1n sV
σ−
= este repartizată ( )12 −nχ .
Estimarea raportului a două dispersii
Se consideră selecţia aleatoare dintr-o populaţie 111211 ,...,, nxxx
( )211 ,σμN şi o selecţie aleatoare dintr-o populaţie
222221 ,...,, nxxx
( )222 ,σμN .
Raportul
22
22
21
21
σ
σs
s
F = este repartizat ( )1,1 21 −− nnF .
Verificarea ipotezelor statistice
53
Exercitii: 1. Se presupune că efectuarea a 4 măsuratori de normalitate conduc la valoarea medie 31.2*10X M− . Se ştie ca dispersia corespunzătoare unei măsuratori este 8 2
=49*102 Mσ = − . Să se verifice ipoteza potrivit căreia
valoarea medie a normalităţii este M3 . Se alege 05.00 10−=μ =α . Soluţie: Ipotezele statistice sunt: vs. MH 3
0 10: −=μ MH A310: −≠μ
Testul utilizat:
n
XZ
σμ0−
=
Regiunea critica este
12
Z z α−
⟩ sau 1
2
Z z α−
⟨ −
3 3
4
3
4
1, 2*10 107*10
40,2*10 *2 4 0,6
7*10 7
Z− −
−
−
−
−= =
= = ≅
0,05 0,9751 12 2
z z zα− −
= =
Deci, regiunea critică este sau 96.1⟩z 96.1−⟨z
Cum 1,96 0,6 1,96− ⟨ ⟨ ⇒ z nu apartine regiunii critice, deci se acceptă ipoteza 0H
2. O întreprindere trebuie să livreze recipiente cu material recuperat cu greutatea de 15 kg şi abaterea medie pătratică kg5.0=σ . Un control efectuat asupra a 49 de piese duce la o valoare medie kgX 8.14= . Să se verifice ipoteza potrivit căreia masa medie este de 15 kg. Se alege 01,0=α . Soluţie: Ipotezele statistice sunt: 15:0 =μH vs 15: ≠μAH
Testul utilizat: 0XZ
n
μσ−
=
Verificarea ipotezelor statistice
54
Regiunea critica: 1
2
Z z α−
⟩ sau 1
2
Z z α−
⟨−
14.8 15 0, 2*7 1, 4 2,80.5 0,5 0,549
Z − − −= = = = −
58.2995.02
1==
−zz α
Deoarece 58,28,2 −⟨− , rezulta ca z este in regiunea critica, deci
ipoteza se respinge. 0H 3. Experientele anterioare arata ca greutatea unui comprimat este o variabila aleatoare cu abaterea medie patratica de 15 mg. O selectie de volum 9 ne da o greutate medie mgX 400= . Sa se verifice la un prag de semnificatie 01.0=α ipoteza potrivit careia greutatea medie este de 420 mg. Soluţie: Ipotezele statistice sunt: 420:0 =μH vs. 420: ≠μAH
Testul utilizat: 0XZ
n
μσ−
=
Regiunea critica: 1
2
Z z α−
⟩ sau 1
2
Z z α−
⟨−
400X = 15σ = 9n = 0 420μ = 400 420 415
3
Z −= = −
58.2995.02
1==
−zz α
Deoarece 57.24 −⟨− rezulta ca Z este in regiunea critica, deci se
respinge 0H
Verificarea ipotezelor statistice
55
4. O selectie de 16 loturi de coprolactoma cristalizata are continutul de baze volatile 23.0=X miliechivalenti / kg. Presupunand ca acest continut este o variabila aleatoare cu abaterea medie patratica 0.07 sa se verifice ipoteza :
20.0:0 =μH 20.0: ⟩μAH
Se alege 99.01 =−α . Soluţie :
Testul utilizat: 0XZ
n
μσ−
=
Regiunea critica: 1Z z α−⟩
0, 23X = 0,07σ = 16n = 0 0, 20μ = 0.23 0.20 1.720.07
16
Z −= ≅
33.299.0 =z
Deoarece 33,272,1 ⟨ , Z nu este in regiunea critica, deci se accepta
ipoteza 0H
5. Durata de functionare a unui electrod este o variabila aleatoare cu h200=σ . O selectie de 25 astfel de electrozi da o durata de functionare de
1380 h. Cu 01.0=α sa se verifice ipoteza: hH 1500:0 =μ hH A 1500: ⟨μ
Soluţie:
Testul utilizat: 0XZ
n
μσ−
=
Regiunea critica: Z zα⟨
Verificarea ipotezelor statistice
56
hX 1380= h15000 =μ 25=n h200=σ
3200
5*120
25200
15001380−=
−=
−=Z
0.01 0,99 2.33z z= − = −
Deoarece 33,23 −⟨− rezulta ca Z se afla in regiunea critica, deci se
respinge ipoteza hH 1500:0 =μ
6. Rezultatele unor cantariri de etaloane sunt urmatoarele: 26,7 ; 26,8 ; 25,8 ; 25,7. Se poate afirma ca media greutatilor este mai mica decat 26.5 g? Se alege 05.0=α . Soluţie: Ipotezele statistice sunt: 5.26:0 =μH vs 5.26: ⟨μAH
Testul utilizat:
nS
XT 0μ−= , unde ( )22 1
1 iS xn
= −− ∑ X
Regiunea critica: α;1−⟨ ntT , unde 35,295.0;31;1,1 −=−=−= −−− ttt nn αα
25,264
7,258,258,267,26=
+++== ∑
nx
X i
( )
( ) ( ) ( ) ([ ])( ) ( )[ ] 34,0
301,155,045,055,045,0
31
25,267,2525,268,2525,268,2625,267,2614
11
1
2222
2222
22
≅=−+−++=
=−+−+−+−−
=
=−−
= ∑ Xxn
S i
Deci, 58,0≅S
86,058,050,0
58,02*25,0
458,0
5.2625,26−≅−=
−=
−=T
Verificarea ipotezelor statistice
57
Deoarece 86,035,2 −⟨− , T nu este situat in regiunea critică deci se
accepta ipoteza adica 0H 5.26⟨μ 7. Douazeci si cinci de determinari ale unei conversii au dat valoarea medie 76.54=X si dispersia de selectie 42 =S . Sa se verifice daca conversia medie este mai mica decat 55. Se alege 01.0=α . Soluţie:
55:0 =μH 55: ⟨μAH
60,0220,1
25*24,0
252
5576,540 −=−=−
=−
=−
=
nS
XT
μ
Regiunea critică este α;1−⟨ ntT unde 49,299.0;241;1,1 −=−=−= −−− ttt nn αα .
Deci T nu apartine regiunii critice ceea ce inseamna ca se poate
accepta ipoteza . 0H
Verificarea ipotezelor statistice
58
8. Se stie ca greutatea media a unor recipienti este 0 6.80 kgμ = . O
selectie de volum 9=n ne da greutatea medie 5.6=X si dispersia de selectie medie 25.02 = . Acest rezultat infirma experientele anterioare? Se alege 05.0=
Sα .
Soluţie: Ipotezele statistice sunt: 00 : μμ =H vs 0: μμ ≠AH
Testul utilizat:
nS
XT 0μ−= , unde ( )22 1
1 iS xn
= − X− ∑
Regiunea critica: 2
1;1 α−−
⟩n
tT sau 2
1;1 α−−
−⟨n
tT
8.1
35.0
8.65.60 −=−
=−
=
nS
XT
μ
306.2975.0;8
21;1
==−−
ttn α
Deci T nu apartine regiunii critice ceea ce inseamna ca se poate
accepta ipoteza . 0H 9. S-au facut 25 determinari asupra continutului de component activ al unui amestec etalon si s-a determinat media 45.34=X mg/l si 9.0=S . In etalon s-a introdus cantitatea 00.340 =μ mg/l. Valoarea gasita pentru medie este intamplatoare sau este datorata unor erori sistematice de metoda? Se alege 05.0=α . Soluţie Se verifica ipoteza 00 : μμ =H ; 0: μμ ≠AH
5,29,0
5*45,0
259,0
00,3445,340 ==−
=−
=
nS
XT
μ
Regiunea critică este 2
1;1 α−−
⟩n
tT sau 2
1;1 α−−
−⟨n
tT .
Verificarea ipotezelor statistice
59
06,2975.0;24 =t
Deoarece , T se gaseste in regiunea critica deci respingem
ipoteza . Aşadar valoarea gasita pentru media de selectie este datorata unor erori sistematice de metoda.
06,25,2 ⟩
0H
10. Patru termometre sunt introduse intr-un mediu cu temperatura fixa 1000ºC. Ele dau indicatiile: 986, 1005, 991, 994. Sa se verifice ipoteza potrivit careia abaterile de la valoarea 10000 =μ ºC sunt datorate experientelor. Se alege 05.0=α . Soluţie: Se verifica ipoteza 00 : μμ =H ; 0: μμ ≠AH
nS
XT 0μ−= ; Regiunea critică este
21;1 α−−
⟩n
tT sau 2
1;1 α−−
−⟨n
tT .
9944
9949911005986=
+++== ∑
nx
X i ;
( )∑ −−
=22
11 Xx
nS i
( ) ( ) ( ) ( )[ ]( ) ( )[ ] 7,64194*
3103118
31
99499499499199410059949861
1
222
22222
≅=+−++−=
−+−+−+−−
=n
S
Verificarea ipotezelor statistice
60
Deci 5,104,8
2*6
44.64
1000994−≅−=
−=T unde 18,3975.0;3 =t
Deoarece 18,35,118,3 ⟨−⟨− nu se respinge adica erorile sunt
datorate experientelor. 0H
11. Zece determinari ale procentului de clor dintr-o soluţie au condus la
832.0=X % si 02.0=S %. Daca adevaratul continut este 9.00 =μ % sa se verifice ipoteza 00 : μμ =H ; 0: μμ ⟨AH Se alege 05.0=α . Soluţie :
9.5
1002.0
9.0832.00 −=−
=−
=
nS
XT
μ
Zona critică este α,1−⟨ ntT
1, 9;0,05 9;0,95 2, 262nt t tα− = = − = −
Se respinge ipoteza . 0H
Verificarea ipotezelor statistice
61
12. Determinarile succesive efectuate in doua vase deschise care contin HCl au dat rezultatele :
I II 15.75 15.58 15.64 15.49 15.92 15.72
Sa se stabileasca daca cele doua vase au in medie aceeasi compozitie. Se cunoaste distersia . Se alege 16.02
221 == σσ 95.01 =−α
Soluţie : Se verifica 210 : μμ =H ; 21: μμ ≠AH
Se utilizează variabila ( )
2
22
1
21
2121
nn
XXZσσ
μμ
+
−−−= unde
77.153
92,1564,1575,151 =
++=X si 60.15
372,1549,1558,15
2 =++
=X
Conform ipotezei 210 : μμ =H , deci 021 =− μμ
Deci 5,023
4,017,0
316,0
316,0
060,1577,15≅=
+
−−=Z ;
96.1975.02
1==
−zz α
Zona critică este 2
1 α−
⟩ zZ sau 2
1 α−
−⟨ zZ
Nu se poate respinge deoarece 0H 96.15,096.1 ⟨⟨−
Verificarea ipotezelor statistice
62
13. Doua cantare automate M1 si M2 sunt folosite pentru ambalarea unui produs in pachete de 1000 g. Se stie ca produsele ambalate au masele repartizate normal cu mediile 1μ si 2μ si abaterile medii patratice g31 =σ , respectiv g42 =σ . Se cantaresc cate 100 pachete din produsele ambalate de fiecare dintre cantare si se obtin rezultatele gX 10071 = si g1002=X 2 .
La un prag de semnificatie 01.0=α sa se verifice daca pachetele ambalate au aceeasi masa. Soluţie:
Ipotezele statistice sunt: 0 1 2 0 1 2
1 2 1 2
: :: :A A
H HH H
μ μ μ μμ μ μ μ
00
= − =⎧ ⎧⇔⎨ ⎨≠ − ≠⎩ ⎩
;
Testul utilizat: ( )1 2 1 2
2 21 2
1 2
X XZ
n n
μ μ
σ σ
− − −=
+
Regiunea critica: 1
2
Z z α−
⟩ sau 1
2
Z z α−
⟨−
2 2
1007 1002 0 5 10253 4
100100 100
Z − −= = =
+
58.2995.0 =z
Deoarece
21 α−
⟩ zZ se respinge ipoteza . 0H
14. Se analizeaza doua loturi de materii prime indexate prin 1 si 2. Pentru cele 75 (80) de probe din lotul 1 (2) se obtin concentratiile medii
441 =X (respectiv 402 =X ). Se stie ca dispersiile sunt 10021 =σ si
402 =σ . Cu un prag de semnificatie 01.02 =α sa se verifice daca diferenta medie de concentratie intre cele doua loturi este mai mare decat 2. Soluţie:
2: 210 =− μμH ; 2: 21 ⟩− μμAH
Verificarea ipotezelor statistice
63
( )
2
22
1
21
2121
nn
XXZσσ
μμ
+
−−−=
751 =n 802 =n 441 =X 402 =X 1002
1 =σ 4022 =σ
221 =− μμ
Deci, ( )5.1
116*2
21
34
2
8040
75100
24044
2
22
1
21
2121 ≅=+
=+
−−=
+
−−−=
nn
XXZ
σσ
μμ
Regiunea critică este unde α−⟩ 1zZ 33.299.01 ==− zz α , deci se acceptă 0H 15. Pentru a studia efectul concentratiei de catalizator asupra conversiei se fac doua grupe de observatii si se obtin datele:
I II 5.18 5.58 5.52 5.62 5.42 5.82
Se poate considera ca cele doua tipuri de catalizator duc la aceeasi conversie medie? Se alege 05.0=α si se considera dispersiile egale. Soluţie :
210 : μμ =H vs 21: μμ ≠AH
Verificarea ipotezelor statistice
64
37.53
42,552,518,51 ≅
++=X ; 67.5
382,562,558,5
2 ≅++
=X ;
Avem: ( )∑=
−−
=1
1
2
111
21 1
1 n
ii Xx
ns ; ( )∑
=
−−
=2
1
2
222
22 1
1 n
ii Xx
ns si
( ) ( )2
11
21
222
2112
−+−+−
=nn
snsnS p
Deci,
( ) ( ) ( )[ ] 03,006,0*2137,542,537,552,537,518,5
131 2222
1 =≅−+−+−−
=s
( ) ( ) ( )[ ] 015,003,0*2167,582,567,562,567,558,5
131 2222
2 =≅−+−+−−
=s
( ) 0225.04
015,003,02233
22 22
212 =
+=
−++
=ssS p , deci 15,0=pS
( )
21
2121
11nn
S
XXT
p +
−−−=
μμ este distribuita T cu 221 −+ nn grade de libertate.
44,262
3*4232
23
15,03,0
31
3115,0
067,537,5−≅−=−=−=−=
+
−−=T
Regiunea critica este 2
;221α
−+⟨
nntT si
21;221α
−−+⟩
nntT
776.2975.0;4 =t
Deoarece 776.244,2776.2 ⟨−⟨− nu se poate respinge . 0H
Verificarea ipotezelor statistice
65
16. Pentru a compara doua benzine cu cifrele octanice 90 si 98 o anumita cantitate este folosita in 5 automobile pentru incercare. Se masoara distanta parcursa pana la oprire si se obtin valorile
98 90 X (km) 22.7 21.3 S (km) 0.45 0.55
Sa se verifice daca cele doua benzine sunt diferite. Se alege 05.0=α Soluţie:
90980 : μμ =H vs 9098: μμ ≠AH
252.0255
55.0*445.0*42
22 22
21
22
212 =
−++
=−+
+=
nnssS p deci 5.0=pS
45.4
32*5.0
3.217.2211
21
9098 =−
=+
−=
nnS
XXT
p
;
306.2975.0;8 =t deci se respinge 0H 17. Cinci determinari de debit pentru un schimbator de caldura au dat valorile: 5.84; 5.76; 6.03; 5.90; 5.87 kg / s. Se poate presupune ca dispersia pentru aceste masuratori este mai mica decat 0.01? se alege 025.0=α Soluţie :
01.0: 20 =σH ; vs. 01.0: 2 ⟨σAH
Verificarea ipotezelor statistice
66
Se utilizează variabila ( ) 20
22 1
σχ Sn −= ; 5,88X = , ; 2 0.009S =
2 4*0.009 3.90.01
χ = = Regiunea critică este data de 2,1
2αχχ −⟨ n
Deoarece nu se respinge si nu putem considera
484.02025.0;4 =χ 0H
01.02 ⟨σ 18. Doua echipe de experimentatori au efectuat cate 13 observatii asupra unor temperaturi de reactie. S-au obtinut rezultatele:
8423.3101 =X °C, , respectiv 1867.121 =s
5246.3102 =X °C, 5757.122 =s
Exista diferente semnificative intre rezultatele obtinute? Se alege 02.0=α . Soluţie:
Inainte de a aplica testul T se aplica testul F pentru a ne asigura de egalitatea dispersiilor.
a) Aplicam testul F privind egalitatea dispersiilor
22
210 : σσ =H ; vs. 2
221: σσ ≠AH
Se utilizează variabila 3.11867.15757.1
22
21 ===
ssF
Se alege 02.0=α ; 16.499.0;12,12 =f ; 241.001.0;12,12 =f Deoarece 16.43.1241.0 ⟨⟨ se acceptă ipoteza , deci dispersiile
sunt egale. 0H
b) Aplicam testul T privind egalitatea mediilor
Verificarea ipotezelor statistice
67
689.046095.03117.0
11
21
21 ==+
−=
nnS
XXT
p
;
3812.124
5757.1*121867.1*122 =+
=pS ; 064.2025.0;24 −=t ; 064.2975.0;24 =t
Deoarece 064.2689.0064.2 ⟨⟨− nu se respinge ipoteza , deci intre cele doua echipe nu exista deosebiri semnificative.
0H
19. Doua pompe cu debitul nominal de 100 l/min au functionat cu debitele: 1 97.8 98.9 101.2 98.8 102 99 99.1 100.8 100.9 100.5 2 97.2 100.5 98.2 98.3 97.5 99.9 97.9 96.8 97.4 97.2 Sa se verifice daca sunt caracterizate de aceeasi dispersie. Se alege 05.0=α Soluţie Se aplica testul F:
22
210 : σσ =H ; 2
221: σσ ≠AH
9.991 =X , , 69.121 =s
1.982 =X , 44.122 =s
17.144.169.1
22
21 ===
ssF ; 03.4975.0;9,9 =f ; 248.0025.0;9,9 =f
Deoarece 03.417.1248.0 ⟨⟨ nu se respinge ipoteza . 0H
Verificarea ipotezelor statistice
68
20. Doua clase de experiente dau rezultatele: 219.11 =X , , 28.02
1 =s 161 =n 179.12 =X , , 143.02
2 =s 152 =n Se poate trage concluzia ca ambele experiente duc la acelasi rezultat? Se alege 05.0=α Soluţie: Se aplica testul F si pe aceasta baza testul T.
22
210 : σσ =H ; 2
221: σσ ≠AH
08.1143.0208.0
22
21 ===
ssF ; 89.2975.0;14,15 =f ; 339.0025.0;14,15 =f
Deoarece 89.208.1339.0 ⟨⟨ nu se respinge ipoteza . 0HIn continuare se aplica testul T
210 : μμ =H ; vs. 21: μμ ≠AH
201.029
193.0*14208.0*152 =+
=pS
252.035.0*447.0
179.1219.111
21
21 =−
=+
−=
nnS
XXT
p
; 045.2975.0;27 =t
Deoarece 045.2252.0045.2 ⟨⟨− se acceptă ipoteza 210 : μμ =H .
Verificarea ipotezelor statistice
69
21. S-au efectuat doua serii de cate 25 de experiente obtinandu-se abaterile standard 023.01 =s si 019.02 =s . Sa se compare dispersiile celor doua serii de experiente. Soluţie Se aplica testul F
22
210 : σσ =H ; 2
221: σσ ≠AH
5.1019.0023.0
2
2
22
21 ===
ssF
Se alege 05.0=α si 98.195.0;24,24 =f ,
deci nu se poate respinge ipoteza . 0H Pentru 10.0=α si 70.190.0;24,24 =f concluzia este aceeasi.
Verificarea ipotezelor statistice
70
22. Determinarea efectului antiinflamator al Algopirinului s-a efectuat pe modelul de inflamaţie experimentală cu carrageenan la nivelul labei piciorului posterior la şobolani. S-au utilizat şobolani Wistar cu greutate de 120 ± 10 g în loturi de câte 10 şobolani pentru fiecare variantă experimentală. S-a utilizat o soluţie salină de 1% carrageenan injectată în volum de 0,1 ml s.c. în laba posterioară.
Volumul labei a fost determinat înainte de administrare şi la 3 ore după injectarea soluţiei de carrageenan. Preparatele antiinflamatorii s-au administrat cu 1 oră în prealabil carageenanului, iar la 3 ore după administrarea acestora a fost determinat volumul labelor posterioare. Laba contralaterală a constituit referinţa.
S-au obtinut urmatoarele date experimentale: Acetyl salicylic acid
Chlorpheniramin ALGOPIRIN Lot control Sobolan
Initial inflamat Initial inflamat Initial inflamat Initial inflamat 1 0,8 1,6 1 2 1,1 1 0,9 1,6 2 1 1,5 1,1 1,8 0,9 1,4 0,8 1,5 3 1 1,7 1 2 1 1,5 0,9 1,6 4 0,9 1,4 1 2 1 0,8 0,9 1,6 5 0,9 1,5 0,9 1,7 1 0,6 0,9 1,5 6 1 1,6 0,9 2 1 0,7 1 1,8 7 0,9 1,2 1 1,9 1 1,2 0,9 1,7 8 0,9 1,5 9 0,9 1,6 10 0.9 1,6
Sa se verifice daca cresterea volumului labei sobolanului ca urmare a inflamatiei provocata de carrageenan este semnificativa.
absolute value of inflammation (ml) of the rat paw induced by caragenaan
-1
0
1
21
2
3
4
57
8
9
10
Patent
AAS
clorpheniramin
control
Verificarea ipotezelor statistice
71
Solutie: Pentru fiecare produs utilizat vom aplica un test t – pereche:
1nd
dT Tsn
−= ∈
unde • d este diferenta dintre volumul initial si volumul inflamatiei • d este media lui d
• ( )22 11d is d d
n= −
− ∑Obtinem astfel urmatoarele rezultate pentru d Sobolan Acetyl salicylic acid Chlorpheniramin ALGOPIRIN Lot control 1 -0,8 -1 0,1 -0,7
2 -0,5 -0,7 -0,5 -0,7
3 -0,7 -1 -0,5 -0,7
4 -0,5 -1 0,2 -0,7
5 -0,6 -0,8 0,4 -0,6
6 -0,6 -1,1 0,3 -0,8
7 -0,3 -0,9 -0,2 -0,8
8 -0,6
9 -0,7
10 -1,7
d -0.57 -0.93 -0.03 -0.8
ds 0.16 0.14 0.35 0,31
Pentru fiecare produs in parte vom verifica ipotezele statistice: 0 0:H μ μ= vs. 0:AH μ μ≠
considerandu-se 1 0.90α− = . Regiunea critica:
21;1 α−−
⟩n
tT sau 2
1;1 α−−
−⟨n
tT ; 6;0,95 1,94t = ; 9;0,95 1,83t =
S-au obtinut urmatoarele valori: 9, 43acetyl salicylic acidT = − min 17,80chlorpheniraT = − lg 0, 22A opirinT = − 8, 25lot controlT = −
Verificarea ipotezelor statistice
72
Deci, exceptand Algopirinul toate celelalte valori ale testelor sunt situate in regiunea critica. 23. Evoluţia funcţiei renale reziduale (FRR) în funcţie de boala primară renală a fost calculată la intervale de 3 luni timp de 1 an de la iniţierea dializei obtinandu-se urmatoarele rezultate:
FRR la initierea dializei FRR la 1 an Boala renala primara Media SD Numar Media SD Numar
1 GNC 7.9 1.45 10 3.76 1.18 10 2 NTI 14.33 2.99 16 11.52 3.37 16 3 NI 12.08 4.63 13 6.55 3.25 13 4 NH 12.25 5.42 19 6.33 3.32 19 5 BPI 10.70 2.55 8 7.26 3.26 8 6 NV=NI+NH 12.18 5.03 32 6.42 3.24 32 unde: GNC = glomerulonefrita cronica NTI = nefropatie tubulointerstitiala cronica NI – nefropatie ischemica NH = nefropatie hipertensiva BP = boala polichistica renala NI+NH = nefropatii vasculare = NV
Sa se verifice urmatoarele ipoteze: I. La initierea dializei:
la initierea HD (dializei), pacienţii cu media FRR ( functia renala reziduala) cea mai mare sunt cei având ca boală renală primară o nefropatie tubulointerstiţială cronică (nti), în timp ce glomerulopaţii (gnc) au FRR cea mai mică; II. Evoluţie la 1 an
Ritmul cel mai rapid de deteriorare a FRR a fost înregistrat în cazul bolnavilor cu nefropatii vasculare (nv) Solutie: I FRR la initierea dializei
media SD n GNC 7.9 1.45 10 NTI 14.33 2.99 16 NI 12.08 4.63 13 NH 12.25 5.42 19 BP 10.70 2.55 8
FRR la initierea dializei
0
2
4
6
8
10
12
14
16
GNC NTI NI NH BP
Verificarea ipotezelor statistice
73
Aplicam testul t ( Student) pentru a verifica semnificatia statistica a diferentei intre NTI si NI
( )
21
2121
11nn
S
XXT
p +
−−−=
μμ este distribuita T cu 221 −+ nn grade de libertate.
( ) ( ) ( ) ( )2 2 2 21 1 2 22
1 2
1 1 16 1 2,99 19 1 5, 4247,38
2 16 19 2p
n s n sS
n n− + − − + −
= =+ − + −
=
14,33 12, 25 0 0,891 16,88
16 19
T − −=
+≅ Regiunea critica este
1 2 2;1 33;12 2
n nT t tα α
+ − − −⟩ =
Intrucat numarul de grade de libertate este mai mare de 30, cuantilele t sunt practice egale cu cele pentru repartitia normala . Pentru riscul obisnuit de 0.05, valoarea calculate cade in zona de acceptare. Deci valoarea cea mai mare corespunde NTI dar diferenta fata de urmatoarea afectiune – NI, nu este semnificativa.
Similar , daca se calculeaza, se obtine ca valoarea cea mai mica este pentru GNC, dar aceasta valoare nu difera semnificativ de cea pentru BP. Diferenta este semnificativa intre NTI si GNC
Observatie: aplicarea testului t nu este chiar ortodoxa in aceste cazuri deoarece dispersiile nu apar sa fie egale. II. FRR evolutie
media SD nGNC -4.14 0.71 10NTI -2.81 1.33 16NI -5.52 1.60 13NH -5.92 2.72 19BP -3.44 0.97 8NV=NI+NH -5.76 2.31 32
Evolutia FRR
-6
-5
-4
-3
-2
-1
0
GNC NTI NI NH BP NV=NI+NH
Din tabel se observa ca diferenta cea mai mare apare la NV. Compararea cu testul t nu este prea corecta deoarece dispersiile sunt foarte diferite. Aplicarea testului F pentru compararea lor va duce la aceasta concluzie.
Verificarea ipotezelor statistice
74
Aplicarea mecanica duce se pare la concluzia unei diferente semnificative de exemplu intre deteriorarea la NV si deteriorarea la NTI. Diferenta intre NV si GNC.
( )1 2
1 2 1 22
1 2
1 1 n n
p
X XT T
Sn n
μ μ+ −
− − −= ∈
+.
Regiunea critica este α−−+
⟩1;221 nn
tT( ) ( )
( )( ) ( )( )2 22 21 1 2 22
1 2
1 1 32 1 5,76 10 1 4,145,65
2 32 10 2p
n s n sS
n n− + − − − + − −
= = =+ − + −
( )5,76 4,14 01,88
1 12,3832 10
T− − − −
= ≅+
−
Cu riscurile obisnuite ( 0.05 sau 0.01) se obtine concluzia ca cele doua “degradari” (NV si GNC ) difera semnificativ. Evident, cu atat mai mult vor diferi semnificativ NV si NTI. 24. Distribuţia gravitatii HTA (hipertensiune arteriala), în funcţie de boala renală primară, la 3 luni de la iniţierea programului de dializă cronică (când s-a considerat că pacienţii au ajuns la un echilibru din punct de vedere hemodinamic), a fost următoarea:
HTA Boala renala primara
non - HTA monoterapie biterapie > 3 medicamente
1 GNC glomerulonefrite cronice 5 5 15 25
2 NTI nefropatii tubulointerstiţiale 59 9 6 5
3 NI nefropatie ischemica 19 3 2 0
4 NH nefropatie hipertensiva 0 7 14 16
5 BP boala polichistica renala 18 6 8 4
Sa se verifice ipoteza potrivit careia HTA este mai severa in grupul pacientilor cu GNC. Severitatea e tradusa prin numarul de medicamente necesare pentru a controla tensiunea. Se considera 0,10α =
Verificarea ipotezelor statistice
75
Solutie: Vom calcula procentul de pacienti hipertensivi care au si boli renale. Total pacienti cu HTA ( ) = pacienti cu monoterapie + pacienti cu biterapie + pacienti cu peste 3 medicamente
ik
Total pacienti ( ) = Total pacienti cu HTA ( )+ pacienti non HTA in ikProcent = Total pacienti cu HTA ( ) / Total pacienti ( ) ik in
Numar de medicamente administrate
non HTA 1 2 Peste 3
Total pacienti cu HTA ( ) ik
Total pacienti ( ) in
Procent
GNC 5 5 15 25 45 50 0,9 NTI 59 9 6 5 20 79 0,25 NI 19 3 2 0 5 24 0,21 NH 0 7 14 16 37 37 1 BP 18 6 8 4 18 36 0,5
Concluzie: intr-adevar proportia de hipertensivi este cea mai mare la bolnavii cu GNC ( NH nu se ia in cosiderare deoarece este prin definitie “hipertensiva”).
Vom verifica ipotezele 0 1 2:H p p p vs= = 1:AH p p2≠ calculand testul
( )1 2
ˆ ˆ1p pZp p
n
−=
−, unde 1 1 2 2 1 2
1 2 1 2
ˆ n p n p k kpn n n n+ +
= =+ +
a) Vom face o comparare intre GNC si NTI desi rezultatul se vede cu ochiul liber: cele doua proportii difera semnificativ
Numar de medicamente administrate
non HTA 1 2 Peste 3
Total pacienti cu HTA ( ) ik
Total pacienti ( ) in
Procent
GNC 5 5 15 25 45 50 0,9 NTI 59 9 6 5 20 79 0,25
0 : GNC NTIH p p p vs= =
:A GNC NTIH p p≠
( )ˆ ˆ1GNC NTIp pZp p
n
−=
−
1 2
1 2
45 20 65ˆ 0,5050 79 129
k kpn n+ +
= = = =+ +
0,90 0, 25 0,65 16,250,040,50*0,50
129
Z −= = =
Dar si 1 0,90 1, 28z zα− = = 16, 25 1, 28Z = ⟩ , deci se gaseste in zona de respingere.
Verificarea ipotezelor statistice
76
Concluzie: Se respinge ipoteza 0 : GNC NTIH p p= si se accepta ca ele difera semnificativ cu probabilitatea >0,90 (si chiar 0,99)
b) Comparatia GNC - NI
Numar de medicamente administrate
non HTA 1 2 Peste 3
Total pacienti cu HTA ( ) ik
Total pacienti ( ) in
Procent
GNC 5 5 15 25 45 50 0,9 NI 19 3 2 0 5 24 0,21
0 : gnc NIH p p p v= = s
:A gnc NIH p p≠
( )ˆ ˆ1GNC NIp pZp p
n
−=
−
1 2
1 2
45 5 50ˆ 0,6850 24 74
k kpn n+ +
= = = =+ +
0,90 0,21 0,69 13,80,050,68*0,32
74
Z −= = =
Dar , deci se gaseste in zona de respingere. 13,8 1, 28Z = ⟩Concluzie: Se respinge ipoteza 0 : GNC NIH p p= si se accepta ca ele difera semnificativ cu probabilitatea >0,90 (si chiar 0,99) c) Comparatia GNC - BP
Numar de medicamente administrate
non HTA 1 2 Peste 3
Total pacienti cu HTA ( ) ik
Total pacienti ( ) in
Procent
GNC 5 5 15 25 45 50 0,9 BP 18 6 8 4 18 36 0,5
0 : GNC BPH p p p vs= =
:A GNC BPH p p≠
( )ˆ ˆ1GNC BPp pZp p
n
−=
−
1 2
1 2
45 18 63ˆ 0,7350 36 86
k kpn n+ +
= = = =+ +
0,90 0,50 0,40 100,040,73*0,27
86
Z −= = =
Dar , deci se gaseste in zona de respingere. 10 1, 28Z = ⟩Concluzie:
Se respinge ipoteza 0 : GNC BPH p p= si se accepta ca ele difera semnificativ cu probabilitatea >0,90 (si chiar 0,99)
Verificarea ipotezelor statistice
77
25. In cadrul loturilor de hemodializaţi s-a comparat procentul de pacienţi care au necesitat tratament cu stimulatori ai eritropoiezei, precum şi doza medie administrată obtinandu-se urmatoarele valori: Boala renala
primara Anemie
necesitand ASEDoză ASE sub 5000
Doze ASE 5000-10000
Doze ASE peste 10000
1. GNC 50 6 9 29 2. NTI 79 26 22 0 3. NI 24 6 12 3 4. NH 37 22 8 0 5. BP 36 9 3 0 6. NV 37 28 20 3
Sa se verifice ipoteza potrivit careia procentul pacienţilor care au necesitat tratament cu ASE (eritropoietină) nu a avut diferenţe semnificative între glomerulonefrite cronice (44 din 50 – 88%), nefropatii ischemice ( 21 din 24 – 87%) şi cele hipertensive (30 din 37 – 81%), dar a fost semnificativ mai mic la pacienţii cu nefropatii tubulointerstiţiale ( 48 din 79 – 61%) şi boli chistice (12 din 36 – 33%). Solutie: OBSERVATIE 1: LIPSA SEMNIFICATIILOR SEMNALATE ( 88%, 87%, 81%) ESTE EVIDENTA SI NU SE MAI IMPUNE O TESTARE STATISTICA. Testam diferenta intre cele mai apropiate valori 0.88 si 0.61 considerate diferite. OBSERVATIE 2: procentele se refera numai la numarul total de pacienti tratati. Testarea o aplicam intai comparand numai proportiile mentionate cu testul Z . ASE
sub 5000
ASE 5000-10000
ASE peste 10000
TOTAL pacienti cu anemie ( ) ik
Total pacienti ( ) in Procent
GNC 6 9 29 44 50 0.88 NTI 26 22 0 48 79 0.61
Testul Z Pentru a verifica ipotezele
0 : GNC NTIH p p p vs= = :A GNC NTIH p p≠ cu α = 0,10, calculam
( )ˆ ˆ1GNC NTIp pZp p
n
−=
−, unde 1 2 1 2
1 2 1 2
44 48ˆ 0,7150 79
GNC NTIn p n p k kpn n n n+ + +
= = =+ + +
=
Verificarea ipotezelor statistice
78
0,88 0,61 0,27 6,750,040,71*0,29
129
Z −= = =
Dar si 1 0,90 1, 28z zα− = = 6,75 1, 28Z = ⟩ , deci se gaseste in zona de respingere. Concluzie: Se respinge ipoteza 0 : gnc NTIH p p= si se accepta ca ele difera semnificativ cu probabilitatea >0,90 (si chiar 0,99) 26. Aprecierea stării de nutriţie a fost realizată prin măsurarea albuminemiei serice (s-au luat mediile pe 6 luni) şi prin aplicarea chestionarului de evaluare globală subiectivă a stării de nutriţie (SGA = Subjective Global Assesment) la intervale de 1 an. S-au obtinut urmatoarele valori:
Boala renala primara
Malnutritie albumina
Alb 3-3,5 Alb 2,5-3 Alb < 2,5
1 GNC 16 6 8 2 2 NTI 12 8 3 1 3 NI 14 2 8 4 4 NH 10 4 4 2 5 BPI 6 4 2 0
Malnutritie Nr. pacienti
non Usoara SGA
Media – Severa SGA cu SGA Total
Procent
GNC 31 9 10 19 50 0.38 NTI 65 8 6 14 79 0.18 NI 5 4 15 19 24 0.79 NH 24 10 3 13 37 0.35 BP 29 6 1 7 36 0.19
0.00
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
GNC NTI NI NH BP
p
Verificarea ipotezelor statistice
79
Sa se verifice ipoteza ca atat din punct de vedere al albuminei serice - ca marker al malnutritiei – cat si al SGA (subjective global assessment) – care include si comorbiditati – malnutritia este mai frecventa si mai severa la NI . Solutie:
a) Testam din punct de vedere al albuminei serice Albumina Pacienti 3 - 3,5 2,5 - 3 sub 2,5 cu Albumina ( )ik Total ( ) in
Procent
NI 2 8 4 14 24 0.58 NH 4 4 2 10 37 0.27
Pentru a verifica ipotezele 0 : NI NHH p p p vs= = :A NI NHH p p≠ cu α = 0,10, calculam
( )ˆ ˆ1NI NHp pZp p
n
−=
−, 14 10ˆ 0,39
24 37p += =
+⇒
0,58 0,27 0,31 5,170,060,39*0,61
61
Z −= = =
Dar 1 0,90 1, 28z zα− = = si 5,17 1, 28Z = ⟩ , deci se gaseste in zona de respingere.
Se respinge ipoteza si se accepta ca ele difera semnificativ cu probabilitatea >0,90 (si chiar 0,99)
0 : NI NHH p p=
b) Testam din punct de vedere al SGA
Se observa ca procentul de malnutritie cel mai mare apare intr-adevar la NI. Comparam proportiile cu testul Z, intre pNI si urmatoarea proportie ca marime pNH
Malnutritie Pacienti
non Usoara SGA
Media - Severa SGA cu SGA ( ) ik Total ( ) in
Procent
NI 5 4 15 19 24 0.79 NH 24 10 3 13 37 0.35
Pentru a verifica ipotezele 0 : NI NHH p p p vs= = :A NI NHH p p≠ cu α = 0,10, calculam
( )ˆ ˆ1NI NHp pZp p
n
−=
−, 19 13ˆ 0,52
24 37p += =
+⇒
0,79 0,35 0,44 7,330,060,52*0,48
61
Z −= = =
Dar , deci se gaseste in zona de respingere. 7,33 1, 28Z = ⟩Se respinge ipoteza si se accepta ca ele difera
semnificativ cu probabilitatea >0,90 (si chiar 0,99) 0 : NI NHH p p=
Verificarea ipotezelor statistice
80
27. Incidenta osteodistrofiei la pacienti sub dializa renala s-a determinat prin compararea incidenţei hiperparatiroidismului şi hiperfosfatemiei in diferite subgrupuri, obtinandu-se rezultatele urmatoare:
Boala renala
primara
PTH > valoare optima
PTH normal sau suboptim
PTH ≥ 800pg/ml
P>N P in limite
1 GNC 36 14 2 36 14 2 NTI 56 23 18 51 28 3 NI 17 7 0 15 9 4 NH 27 10 0 24 13 5 BPI 26 10 1 22 14
PTH = parathormon, are valoare optimă în jur de 200pg/ml Hiperparatiroidism = creşterea PTH peste valoarea optimă
Sa se verifice ipoteza statistica potrivit careia valori mari ale parathormonului seric (PTH), peste 800pg/dl au fost înregistrate aproape exclusiv la pacienţi cu nefropatii tubulointerstiţiale cronice. Solutie:
Observatie: nu mai este nevoie de statistica dar, ca moft, aplicam testul Z de comparare a doua proportii PTH ≥
800pg/ml total P
GNC 2 50 0.04NTI 18 79 0.23NI 0 24 0.00NH 0 37 0.00BP 1 36 0.03
P
0.00
0.05
0.10
0.15
0.20
0.25
GNC NTI NI NH BP
Pentru a verifica ipotezele
0 : GNC NTIH p p p vs= = :A GNC NTIH p p≠ cu α = 0,10, calculam
( )ˆ ˆ1GNC NTIp pZp p
n
−=
−, 2 18ˆ 0,16
50 79p += =
+, 0,04 0,23 0,19 6,33
0,030,16*0,84129
Z −= = − = −
Dar , deci se gaseste in zona de respingere. 6,33 1, 28Z = − ⟨ −Se respinge ipoteza 0 : gnc NIH p p= si se accepta ca ele difera
semnificativ cu probabilitatea >0,90 (si chiar 0,99).
Teste neparametrice
81
TESTE NEPARAMETRICE
Testele independente de distributie, numite şi teste de rang,
înlocuiesc valorile variabilei cantitative observate cu rangurile lor. Testele neparametrice sunt valabile şi pentru variabile normal distribuite, dar sunt mai puţin eficiente, pentru acelaşi prag de semnificaţie fiind necesare eşantioane mai mari decât pentru testele parametrice.
Aplicarea lor este posibila atunci cand variabilele aleatoare sunt continue si independente. Testul Wilcoxon
Testul de rang Wilcoxon este un test cu ipoteza nulă că două populaţii sunt identice, fată de ipoteza alternativă că ele diferă printr-o translaţie lineară.
Testul înlocuieşte observaţiile prin rangurile lor. Rangurile sunt repartizate la valorile din selecţii în ordinea creşterii mărimii fără să ţină cont de probele cărora le aparţin.
Să presupunem că o probă este de mărime n şi alta de mărime N-n. Testul presupune că orice combinaţie de ranguri în aceste două grupuri este egal probabilă. Numărul total de moduri de grupare a rangurilor este . n
NCNu este uşor să calculăm toate posibilităţile, astfel încât vom folosi
faptul că media rangurilor unei probe este distribuită aproximativ normal cu urmatorii parametri:
( )2
1+=
NRE si ( ) ( )( )n
nNNRD121 −+
=
Sunt disponibile tabelele care dau limitele de acceptare a ipotezei pentru suma obţinută, ca o funcţie de n, N şi riscul asumat. 0H
Fie R suma rangurilor şi R media rangurilor probei de mărime n.
Variabila aleatoare ( )( ) ( )( )
nnNN
NR
RD
RERZ
121
21
−+
+−
=−
= va fi
repartizată aproximativ ( )1,0N .
Teste neparametrice
82
Notatii alternative: a) Daca 21 nnN += ; 1nn = si 2nnN =− , ( 21 nn ≤ ) se obtine:
( )
1 2
1 2 2
1
12
112
n nRz
n n nn
+ +−
=+ +
(testul Mann – Whitney)
b) Se amplifica cu , se obtine 1n 1Rn R= si
( )
( )
1 1 2
1 2 1 2
121
12
n n nR
zn n n n
+ +−
=+ +
c) Kruskal si Wallis au observat ca aproximaţia este îmbunătăţită când valoarea α este mai mare de 0,02 prin aducerea lui R mai aproape de
media lui cu n2
1 .
( )( )
1 12 2112
NRnZ
N N nn
+− +=
+ −
Ajustarea pentru valori egale în testul Wilcoxon
Dacă apar egalităţi, o alternativă pentru neglijarea lor este de a repartiza la aceste observaţii media rangurilor pe care le-ar fi primit dacă nu erau egale.
În acest caz, variabila aleatoare ( )2
1 12 21
*12 1
NRnZ
N N T N nnN N
+− +=
− − −−
va fi
repartizată aproximativ ( )1,0N , unde ( ) ( ) 31 1T k k k k k= − + = − Testul Wilcoxon pereche
Wilcoxon a propus deasemenea un test pentru determinări pare în care rangurile sunt atribuite mărimii absolute a diferenţelor şi apoi se dă rangurilor semnul diferenţelor.
Teste neparametrice
83
i
Ipoteza nulă este că distribuţia diferenţelor este simetrică faţă de zero, astfel orice rang este pozitiv sau negativ cu aceiaşi probabilitate. Valorile egale primesc ca rang media rangurilor grupului.
Să ataşăm rangurilor i variabilele aleatoare di , unde
⎩⎨⎧
=negativesteidacapozitivesteidaca
di ,0,1
,
Cea mai mica suma a rangurilor trebuie sa fie cel mult egala cu cea din Anexa V: Tabelul 1 pentru a considera cele doua grupuri de rezultate ca fiind diferite la nivelul de incredere specificat.
Se foloseste insa cea mai mica valoare dintre suma rangurilor pozitive si a celor negative.
Să considerăm suma rangurilor positive iS d=∑ .
În acest caz, variabila aleatoare ( )( )
( )
( )( )
14
1 2 124
N NsS E S
ZD S N N N
+−−
= =+ +
va fi repartizată aproximativ ( )1,0N . Dacă apar valori egale, Z trebuie să fie ajustat la factorul
( )
( )( )
14
1 2 124 48
N NS
ZTN N N
+−
=+ +
−∑, ( ) ( ) 31 1T k k k k k= − + = −
Testul H, Krusskal – Wallis, de analiza a variatiei “pe o cale” aplicata rangurilor
Testul H, sau testul Kruskal – Wallis este o generalizare a testului Wilcoxon în cazul a k probe, . La fel ca şi în testul Wilcoxon, observaţiile primesc ranguri, şi media rangurilor Ri se calculează pentru fiecare grup.
2⟩k
( )2
1+=
NRE i şi ( ) ( )( )i
ii n
nNNRD
1212 −+
=
Raportul ( )( )i
ii
RD
RER2
− va fi repartizat ( )1,0N , conform teoremei limita
centrala.
Teste neparametrice
84
Kruskal şi Wallis au arătat că suma pătratelor lor, cu un factor de
ponderare ⎟⎟⎠
⎞⎜⎜⎝
⎛−
Nni1 are aproximativ distribuţia ( )12 −kχ
( )( )( )⇒∑ −≅⎟
⎠⎞
⎜⎝⎛ −
⎥⎥⎥⎥⎥
⎦
⎤
⎢⎢⎢⎢⎢
⎣
⎡
−+
+−
==
k
i
i
i
i
ik
Nn
nnNN
NRH
1
2
2
11
121
21
χ
( )( )( )
( )( )1
121
1222
+∑ −
=−
⋅−+
∑ −=
NNRRn
NnN
nNNRRn
H iii
i
ii
Dacă apar valori egale, H trebuie să fie împărţit la factorul NN
T−
− ∑31
unde ( ) ( ) 31 1T k k k k= − + = − k
si Diletti .
este calculat pentru fiecare grup de legături. Estimarea intervalelor de incredere prin calculul “non – parametric”
Daca nu sunt verificate ipotezele necesare aplicarii testului t
(ipotezele privind normalitatea si egalitatea dispersiilor), intervalul de incredere se determina folosind testele non-parametrice. Metoda se bazeaza pe compararea rangurilor.
O metoda de calcul neparametric a intervalului de incredere pentru raportul parametrilor a fost data de Hollander si Wolfe1 si aplicata ulterior la bioechivalenta alaturi de alte metode nonparametrice de Steinijens 2
Consideram N subiecti dintr-o populatie care nu este normal distribuita carora li se aplica doua medicamente diferite (X si Y).
Vom avea N perechi de valori ( ),i ix y unde ix X∈ si iy Y∈ .
1 Hollander M, Wolfe D A, Non-parametric Statistical Methods,Wiley, New York, 1973 2 Steinijens V W, Diletti E, Statistical Analysis of Bioavailability Studies: Parametric and Non-parametric Confidence Intervals, Eur. J. Clin. Pharmacol 24, 127-136,1983
Teste neparametrice
85
Vom calcula rapoartele i
i
xy
si vom compara R′ , media geometrica
pentru rapoarte, pentru toate perechile posibile de N rapoarte individuale
(R), unde N este numarul de subiecti. Exista ( )2
1+NN astfel de perechi,
incluzand si raportul R/R intre un subiect si el insusi. Valorile lui R′ sunt apoi ordonate crescator in functie de rang.
Limita inferioara si superioara a intervalului de incredere nonparametric de 90%, respectiv 95%, sunt redate in tabelul privind intervalele de incredere folosind testul de rang Wilcoxon (Anexa V: Tabel 2). Coeficientul de corelatie de rang Spearman
Consideram in continuare problema compararii in functie de doua criterii diferite (X si Y) a unor indivizi dintr-o populatie care nu este normal distribuita. Vom testa ipoteza nula privind absenta corelatiei intre X si Y. Vom avea n perechi de valori ( ),i ix y unde ix X∈ si iy Y∈ .
Vom ordona crescator, separat, valorile { }1 2, ,..., nx x x si
{ }1 2, ,..., ny y y notand rangurile corespunzatoare cu ix′ , respectiv iy′ . Valorile egale primesc ca rang media rangurilor grupului.
Vom determina diferentele rangurilor dintre cele doua criterii: i id x y′ ′= − i
Se numeste coeficient de corelatie de rang Spearman numarul
( )
2
12
61
1
n
ii
S
dr
n n== −−
∑
• Daca 10n ≥ vom folosi variabila aleatoare:2
21
S
s
r nTr−
=−
repartizata Student cu 2n− grade de libertate. • Daca 10n ⟨ nu putem utiliza aproximarea precedenta. In acest caz vom determina din tabelul de corelatie de rang Spearman (Anexa V: Tabel 3) valoarea corespunzatoare rα .
Vom spune ca se accepta ipoteza nula daca Sr rα≤ .
Teste neparametrice
86
Exercitii: 1. Sa se verifice ca urmatoarele esantioane
1x 1,1 2,2 3,1 4,3
2x 10 2,4 3,3
apartin aceleiasi populatii. Se considera riscul 0.10α = Solutie:
Ordonam crescator valorile acordandu-le rangul corespunzator: 1x 1,1 2,2 3,1 4,3
Rangurile 1 2 4 6 10 2,4 3,3
2xRangurile 7 3 5
1 3.25R = 2 7 3 5 15R + + = ; 2 5R = 1 1 2 4 6 13R = + + + = ; ; =Pentru a se accepta ipoteza 0 :H cele doua esantioane apartin aceleiasi populatii
cea mai mica suma a rangurilor trebuie sa fie cel putin egala cu cea din tabelul testului Wilcoxon corespunzatoare numarului N (Anexa V: Tabel 1).
In cazul nostru aceasta valoare este 2. Cum 13 vom spune ca se accepta ipoteza . 2⟩ 0HVom verifica aceste rezultate cu cele obtinute prin aproximarea
normala a distributiei rangurilor.
Aplicand testul Wilcoxon ( )( )
1 12 2112
NRnZ
N N nn
+− +
=+ −
unde 7N = , si 3n =
5R = obtinem
( )( )
7 1 152 2*3 1.23
7 1 7 312*3
Z
+− +
= ≅+ −
Deoarece 64.195.0 =z si ( )1.23 1.64 ,1.64Z = ∈ − se accepta ipoteza,
deci selectiile apartin aceleiasi populatii .
Teste neparametrice
87
2. Sa se compare daca esantioanele de mai jos provin din aceiasi populatie considerand riscul ca fiind 0.10α = : E1 3 9,8 2 5,2 3,6 5,9 8,5 9,4 E2 9,3 12,5 11,3 7,6 3,2 8,6 7,2 14,2 9,6 3,8
Solutie: Deoarece nu stim nimic despre populatia din care provin cele doua
esantioane nu vom putea aplica teste neparametrice. Vom ordona crescator toate cele 18 valori determinand apoi rangurile
corespunzatoare: E1 3 9,8 2 5,2 3,6 5,9 8,5 9,4 Rang 2 15 1 6 4 7 10 13 E2 9,3 12,5 11,3 7,6 3,2 8,6 7,2 14,2 9,6 3,8 Rang 12 17 16 9 3 11 8 18 14 5
Calculam media rangurilor pe fiecare esantion:
12 15 1 6 4 7 10 13 58 7, 25
8 8R + + + + + + +
= = =
212 17 16 9 3 11 8 18 14 5 113 11,30
10 10R + + + + + + + + +
= = =
Pentru 18N = valoarea corespunzatoare testului Wilcoxon este 40. Cum cea mai mica valoare a sumei rangurilor este mai mare decat valoarea testului (58 ) vom spune ca acceptam ipoteza 40⟩
Aplicand testul Wilcoxon ( )( )
1 12 2112
NRnZ
N N nn
+− +
=+ −
.
In cazul nostru: 18N = , 8n = , 7, 25R = , deci . 0H
( )( )
18 1 17,25 2,182 2*8 1,551, 4018 1 18 8
12*8
Z
+− +
= = − ≅ −+ −
Deoarece 64.195.0 =z si ( )1,55 1.64 ,1.64z = − ∈ − se accepta ipoteza.
Teste neparametrice
88
3. Se dau datele urmatoare date: 1x : 1.1; 2.2; 3.1; 4.3; 2.5 si : 10; 2.4; 3.3; 2.5; 2.5 2x
Sa se verifice ipoteza ca aceste esantioane apartin aceleiasi populatii asumandu-ne riscul 0.10α = .
Solutie:
1x 2x Valoare 1.1 2.2 3.1 4.3 2.5 10 2.4 3.3 2.5 2.5 Rang 1 2 7 9 5 10 3 8 5 5
4.8 6.2 R
8.45
597211 =
++++=R 2.6
5558310
2 =+ + + + =R
( )2
1 12 21
*12 1
NRnz
N N T N nnN N
+− +
=− − −
−
unde ( ) ( )11 +−= kkkT si 3k = numarul de cozi⇒ 2*3*4 24T = = .
( )
( )
2
10 1 16.2 0,82 2*50, 2610 10 1 24 10 5*
12*5*10 10 13,08 1.64 ,1.64
Z
Z
+− +
= =− − −
−⇒ ≅ ∉ −
Vom respinge ipoteza, deci esantioanele nu apartin aceleiasi
populatii.
4. Pentru a determina metoda optima de dozare a continutului in substanta activa dintr-un lot de comprimate se compara doua metode analitice diferite. S-au luat in lucru cate 12 comprimate pentru fiecare metoda analitica si s-au obtinut urmatoarele rezultate: cpr. 1 2 3 4 5 6 7 8 9 10 11 12 M 1 9,2 10 9 9,4 10,1 9,5 10 10,3 10,2 10,2 9,8 10,1 M 2 9,5 9 8,8 9,5 9,1 10 10,1 9,3 9 9,7 9,1 9,3
Exista diferente semnificative intre cele doua metode? Se considera 0.10α = .
Teste neparametrice
89
Solutie: Vom face diferenta dintre cele doua metode
cpr. 1 2 3 4 5 6 7 8 9 10 11 12 M 1 9,2 10 9 9,4 10,1 9,5 10 10,3 10,2 10,2 9,8 10,1 M 2 9,5 9 8,8 9,5 9,1 10 10,1 9,3 9 9,7 9,1 9,3 d -0.3 1 0.2 -0.1 1 -0.5 -0.1 1 1.2 0.5 0.7 0.8
1 2d M M= − Vom aloca rangurile corespunzatoare diferentelor. Vom ordona
crescator valorile absolute ale diferentelor si in final vom aloga semnele corespunzatoare. cpr. 1 2 3 4 5 6 7 8 9 10 11 12 d -0.3 1 0.2 -0.1 1 -0.5 -0.1 1 1.2 0.5 0.7 0.8 rang -4 10 3 -1,5 10 -5.5 -1,5 10 12 5.5 7 8
10 3 10 10 12 5.5 7 8 65.5S+Suma rangurilor pozitive este + + + + + + + = =Suma rangurilor negative este 4 1,5 5,5 1,5 12,5S− = + + + =
Vom aplica testul
( )
( )( )
14
1 2 124 48
N NS
ZTN N N
+−
=+ +
−∑ unde
• 65,5 S S+= =• 12N = numarul de perechi • si vom obtine: 1*2*3 1*2*3 2*3*4 36T = + + =∑
( )
( ) ( )
12 12 165,5
412 12 1 2*12 1 36
24 4826,4 26,4 2,07
12,72161,75
Z
Z
+−
=+ +
−
⇒ = = =
Deoarece 64.195.0 =z si se respinge ipoteza. (2,07 1.64 ,1.64Z = ∉ − )
Teste neparametrice
90
5. Dozand calciul din 3 izvoare diferite de apa s-au obtinut valorile (mg/l):
Izvor 1 18 20 22 25 Izvor 2 15 16 17 21 Izvor 3 15 20 21 25
Sa se determine daca zona geografica influenteaza semnificativ cantitatea de calciu din apa. Se considera 05.0=α . Solutie:
Testul statistic utilizat: ( )( )
( )
2
2
1
12 1 1
112
k ii
i i
i
NR nH kNN N n
n
χ=
⎡ ⎤+⎢ ⎥− ⎛ ⎞⎢ ⎥= − ≅ −⎜ ⎟⎢ ⎥ ⎝ ⎠+ −⎢ ⎥
⎢ ⎥⎣ ⎦
∑
unde , 12N = 1 2 3 4n n n= = = si 3k = Vom calcula rangurile corespunzatoare:
Ranguri ( iR ) iR
Izvor 1 5 6.5 10 11.5 8.25 Izvor 2 1.5 3 4 8.5 4.25 Izvor 3 1.5 6.5 8.5 11.5 7
Vom obtine
( )( ) ( )( )
2 2
12 1 12 18,25 4,254 42 21 112 1212 1 12 4 12 1 12 4
12*4 12*4
H
⎡ ⎤ ⎡ ⎤+ +⎢ ⎥ ⎢ ⎥− −⎛ ⎞ ⎛ ⎞⎢ ⎥ ⎢ ⎥= − +⎜ ⎟ ⎜ ⎟⎢ ⎥ ⎢ ⎥⎝ ⎠ ⎝ ⎠+ − + −⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦
− +
( )( )
( )
2 2 2
2
2 2 2
12 17 4 8,25 6,5 2 4,25 6,5 22 1 *12 3 313 1312 1 12 4
6 612*4
7 6,5 2* 1,75 2,25 0,5 0,31 8,375*0,31 2,6313
6
⎡ ⎤ ⎛ ⎞ ⎛ ⎞+⎢ ⎥− ⎜ ⎟ ⎜ ⎟− −⎛ ⎞⎢ ⎥ ⎜ ⎟ ⎜ ⎟+ − = +⎜ ⎟⎢ ⎥ ⎜ ⎟ ⎜ ⎟⎝ ⎠+ −⎢ ⎥ ⎜ ⎟ ⎜ ⎟
⎝ ⎠ ⎝ ⎠⎣ ⎦
⎛ ⎞⎜ ⎟−⎜ ⎟+ = + + = =⎜ ⎟⎜ ⎟⎝ ⎠
* +
Deoarece apar cozi (valori egale), H trebuie să fie împărţit la factorul
Teste neparametrice
91
NNT−
− ∑31
unde ( ) ( ) 31 1T k k k k= − + = − k este calculat pentru fiecare grup de legături.
In cazul nostru avem 4 grupe a cate 2 cozi fiecare, deci 1*2*3 6T = = .
Factorul de impartire va fi 3
4*6 241 1 012 12 12*143
− = − = ,986−
Se obtine astfel 2,6 2,637
0,986H ′ = =
repartizat 2χ cu 2 grade de libertate.
Cum , si 2
2;0.025 0,05χ = 22;0.975 7,38χ = 0,05 2,637 7,38⟨ ⟨ se accepta
ipoteza 3210 : μμμ ==H . 6. Consideram cazul cand acelasi lot primeste succesiv doua tratamente obtinandu-se urmatoarele rezultate:
Subiect Tratament 1 Tratament 2 1 1.1 10 2 2.2 2.4 3 3.1 2.8 4 4.3 2.5 5 2.5 2.6
Testati ipoteza ca efectele celor doua tratamente nu difera semnificativ. Se considera riscul
0H05.0=α
Solutie: In aceste conditii pentru a inlatura intervariabilitatea se compara fiecare
subiect cu sine insusi. In acest caz testul de compararea a mediilor este testul Wilcoxon pereche si se bazeaza pe analiza diferentelor perechilor de date.
Vom face diferenta dintre valorile (tratament 2) si (tratament 1) si vom aloca rangurile corespunzatoare valorilor obtinute:
2x 1x
1x 1.1 2.2 3.1 4.3 2.5
2x 10 2.4 2.8 2.5 2.6
Teste neparametrice
92
12 xx − 8.9 0.2 -0.3 -1.8 0.1
Rangul 5 2 -3 -4 1 Suma rangurilor pozitive: 8
( )
( )( )24
1214
1
++
+−
=NNN
NNSz
( )
( ) ( )01.0
2415*2*15*5
415*58
≅++
+−
=z
Deoarece 64.195.0 =z si ( )64.1,64.101.0 −∈=z se accepta ipoteza
7. Se studiaza activitatea acetilcolinesterazei la un lot de animale expusi actiunii unui insecticid organofosforic. Activitatea enzimatica este exprimata in micromoli de substrat hidrolizat pe minut si pe mg de proteine.
Rezultatele obtinute in functie de timpul de expunere la pesticid sunt urmatoarele:
Animal tratat Animal martor 1 zi 2 zile 3 zile 15.0 15.0 2.0 0.5 8.5 9.0 2.2 3.0 10.0 8.0 4.0 2.3 10.0 2.0 2.4 0.6 7.6 5.0 1.1 0.9 5.0 3.0 0.7 0.5
Insecticidul produce o diminuare semnificativa a enzimei (vom compara global cele 4 esantioane)? Solutie: H0: nu exista diferente semnificative intre activitatile medii ale celor 4 esantioane HA: exista diferente semnificative intre activitatile medii ale celor 4 esantioane Alocam rangurile corespunzatoare:
Animal tratat Animal martor 1 zi 2 zile 3 zile
Rangurile medii
23.5 23.5 7.5 1.5 14 19 20 9 12.5 15,125
Teste neparametrice
93
21.5 18 14 10 15,875 21.5 7.5 11 3 10,75 17 15.5 6 5 10,875 15.5 12.5 4 1.5 8,375
Aplicam testul ( )( )
( )
2
2
1
12 1 1
112
k ii
i i
i
NR nH kNN N n
n
χ=
⎡ ⎤+⎢ ⎥− ⎛ ⎞⎢ ⎥= − ≅ −⎜ ⎟⎢ ⎥ ⎝ ⎠+ −⎢ ⎥
⎢ ⎥⎣ ⎦
∑
1 2 3 4 4n n n n
unde
24N = , = = = , 6k = =
( )( ) ( )( )
2 2
24 1 24 114 15,1254 42 21 124 2424 1 24 4 24 1 24 4
12*4 12*4
H
⎡ ⎤ ⎡ ⎤+ +⎢ ⎥ ⎢ ⎥− −⎛ ⎞ ⎛ ⎞⎢ ⎥ ⎢ ⎥= − +⎜ ⎟ ⎜ ⎟⎢ ⎥ ⎢ ⎥⎝ ⎠ ⎝ ⎠+ − + −⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦
− +
( )( ) ( )( )
2 2
24 1 24 115,875 10,754 42 21 124 2424 1 24 4 24 1 24 4
12*4 12*4
⎡ ⎤ ⎡ ⎤+ +⎢ ⎥ ⎢ ⎥− −⎛ ⎞ ⎛ ⎞⎢ ⎥ ⎢ ⎥+ − +⎜ ⎟ ⎜ ⎟⎢ ⎥ ⎢ ⎥⎝ ⎠ ⎝ ⎠+ − + −⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦
− +
( )( ) ( )( )
( )
2 2
2 2 2 2 2 2
24 1 24 110,875 8,3754 42 21 124 2424 1 24 4 24 1 24 4
12*4 12*41,5 2,625 3,375 1,75 1,625 4,125 *0,48 43.25*0.48
20.76
⎡ ⎤ ⎡ ⎤+ +⎢ ⎥ ⎢ ⎥− −⎛ ⎞ ⎛ ⎞⎢ ⎥ ⎢ ⎥+ − + −⎜ ⎟ ⎜ ⎟⎢ ⎥ ⎢ ⎥⎝ ⎠ ⎝ ⎠+ − + −⎢ ⎥ ⎢ ⎥⎣ ⎦ ⎣ ⎦
= + + + + + =
=
=
=
Deoarece apar cozi (valori egale), H trebuie să fie împărţit la factorul
NNT−
− ∑31
unde ( ) ( ) 31 1T k k k k= − + = − k este calculat pentru fiecare grup de legături.
Avem 5 cozi a cate 2 elemente ⇒ 1*2*3 6T = = deci factorul cu care se va imparti este
3
5*61 1 0,002 0,99824 24
− = − =−
Teste neparametrice
94
Se obtine astfel 20,76 20,800,998
H ′ = = repartizat 2χ cu 5 grade de
libertate.
Deoarece , si 2
5;0.025 0,831χ = 25;0.975 12,833χ = 20,80 12,833H ′ = ⟩ se
respinge ipoteza. 8. Se dau datele urmatoare:
1x 2x 3x 1.1 2.2 3.1 4.3 2.5 10 2.4 2.8 2.5 2.6 - 2.2 3 3.5 2.7 Sa se verifice ca esantioanele provin din aceiasi populatie, 0.05α = . Solutie: Alocam rangurile corespunzatoare:
1x 2x 3x
x 1.1 2.2 3.1 4.3 2.5 10 2.4 2.8 2.5 2.6 - 2.2 3 3.5 2.7 R 1 2.5 11 13 5.5 14 4 9 5.5 7 2.5 10 12 8
R 6.6 7,9 8.125
Aplicam testul ( )( )
( )
2
2
1
12 1 1
112
k ii
i i
i
NR nH kNN N n
n
χ=
⎡ ⎤+⎢ ⎥− ⎛ ⎞⎢ ⎥ − ≅ −⎜ ⎟⎢ ⎥ ⎝ ⎠+ −⎢ ⎥
⎢ ⎥⎣ ⎦
∑ unde =
14N = , 1 2 5n n= = , 3 4n = , 3k = 2 2
6.6 7.5 5 7,9 7.5 5* 1 * 114 1415*9 15*9
12*5 12*5
H
⎛ ⎞ ⎛ ⎞⎜ ⎟ ⎜ ⎟− −⎛ ⎞ ⎛ ⎞⎜ ⎟ ⎜ ⎟= − +⎜ ⎟ ⎜ ⎟⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
− +
Teste neparametrice
95
2
8.125 7.5 4* 1 0,351415*10
12*4
⎛ ⎞⎜ ⎟− ⎛ ⎞⎜ ⎟+ −⎜ ⎟⎜ ⎟ ⎝ ⎠⎜ ⎟⎝ ⎠
≅
Deoarece apar cozi (valori egale), H trebuie să fie împărţit la factorul
NNT−
− ∑31 unde T este calculat pentru fiecare grup de legături.
Pentru grupul 2, 2x = avem 2 cozi, deci 1*2*3 6T = = , aceeasi situatie repetandu-se si pentru grupul 2,5x = , deci factorul cu care se va imparti este
3
6 61 1 0,004 0,99614 14
+− = − =
−
Se obtine astfel 0,35 0,3510,996
H ′ = =
Deoarece , si 22;0.025 0,05χ = 2
2;0.975 7,38χ =0,05 0,351 7,38H ′⟨ = ⟨
se accepta ipoteza.
9. La testarea a doua preparate farmaceutice (testat –T si referinta – R) s-au obtinut urmatoarele valori pentru concentratia maxima in plasma ( maxC µg/ml) . Subiect 1 2 3 4 5 6 7 8 9
maxC R 0.92 1.74 0.77 0.80 0.70 0.92 0.71 0.80 0.93
maxC T 1.29 1.86 0.73 1.73 1.03 1.63 1.38 1.21 1.05
T/R 1,4 1,07 0,95 2.17 1,47 1,77 1,95 1,51 1,13
Vom determina media geometrica pentru fiecare raport RT adica
radicalul dintre produsul a doua rapoarte. Astfel: pentru subiectul 1 media geometrica este radicalul dintre produsul raportului subiectului 1 combinat cu el insusi: 1, 4*1, 4 1, 4≈
Teste neparametrice
96
Pentru subiectul 1 combinat cu subiectul 2, media geometrica este radicalul produsului dintre raportul subiectului 1 si raportul subiectului 2:
1, 4*1,07 1, 22≈ Acest rationament il vom aplica pentru fiecare dintre cei 9 subiecti.
Se vor determina ( )1 9*10 452 2
N N += = de combinatii diferite incluzand si
fiecare raport cu el insusi. Mediile geometrice determinate, considerate o singura data, sunt:
1 2 3 4 5 6 7 8 9 1 1.40 2 1.22 1.07 3 1.15 1.00 0.95 4 1.74 1.52 1.43 2.17 5 1.43 1.25 1.18 1.79 1.47 6 1.57 1.37 1.29 1.96 1.62 1.77 7 1.65 1.44 1.36 2.06 1.70 1.86 1.95 8 1.45 1.27 1.19 1.81 1.49 1.64 1.72 1.51 9 1.26 1.10 1.03 1.57 1.29 1.42 1.49 1.31 1.13
Vom determina rangurile corespunzatoare 1 2 3 4 5 6 7 8 9
1 19 2 10 4 3 7 2 1 4 37 29 21.5 45 5 21.5 11 8 39 25 6 30.5 18 14.5 43 32 38 7 34 23 17 44 35 41 42 8 24 13 9 40 26.5 33 36 28 9 12 5 3 30.5 14.5 20 26.5 16 6
Dupa cum se observa, limita inferioara, respectiv superioara a intervalului de incredere 95% este valoarea rangului 6, respectiv 40 al mediilor geometrice determinate anterior, deoarece numarul de subiecti este
. 9N =Vom determina mediile geoametrice corespunzatoare rangurilor
obtinute si vom obtine un interval de incredere 95% : ( )95% 1,13 ,1,81CI =
Tabel Intervalele de incredere folosind testul de rang Wilcoxon
Rangul limitei inferioare Rangul limitei superioare Numarul de subiecti (N) 95% 90% 95% 90% 8 4 6 33 31 9 6 9 40 37
10 9 11 47 45
Teste neparametrice
97
Pentru a determina un rang al mediilor geometrice vom construi, in
EXCEL, tabelul mediilor geometrice luate o singura data Vom folosi functia small(array;k) care calculeaza valoarea de rang
k dintr-un set de date (array). In cazul nostru array, in tabelul Exccel, a fost F3:Q20, ,
respectiv 40 pentru intervalul de incredere , deci am avut: 6k =
%95CI• =small(F3:Q20; 6)=1,13 • =small(F3:Q20; 40)=1,81
ceea ce inseamna un interval de incredere ( )95% 1,13 ,1,81CI = In cazul intervalului de incredere 90% limita inferioara va avea
rangul 9, iar cea superioara rangul 37 corespunzand astfel intervalului . ( )90% 1,19 ;1,74CI =
10. Vom considera notele unui grup de 12 studenti in functie de rezultatele obtinute la matematica (an I) si biostatistica (an IV).
Student A B C D E F G H I J K l Sem I 7 8 8 8 9 10 5 5 6 9 8 9 Sem II 5 5 6 7 7 10 8 8 8 6 10 8
Sa se verifice daca exista o corelatie semnificativa intre rezultatele obtinute la cele doua materii. 1 0,90α− = Solutie:
Vom aplica testul de rang Spearman. 0 : intH nu exista corelatie re materii
: intAH exista corelatie re materii Determinam rangurile pentru fiecare materie, aplicand conventiile
anterioare privind rangurile pentru valori egale (“cozi”): Student A B C D E F G H I J K l Sem I 4 6.5 6.5 6.5 10 12 1.5 1.5 3 10 6.5 10 Sem II 1.5 1.5 4.5 6.5 6.5 11.5 9.5 9.5 9.5 4.5 11.5 9.5
Determinam diferenta dintre ranguri pentru fiecare student ( ): idStudent A B C D E F G H I J K l
id 2.5 5 2 0 3.5 0.5 -8 -8 -6.5 5.5 -5 0.5 2id 6.25 25 4 0 12.25 0.25 64 64 42.25 30.25 25 0.25
2 273.5id =∑
Teste neparametrice
98
Calculam ( ) ( )
2
12 2
66*273.51 1
1 12 12 1
n
ii
S
dr
n n== − = − ≅− −
∑0.04
Intrucat avem 12 10n = ⟩ vom aplica variabila
2 2
2 0.04 12 2 0.131 1 0.04
S
s
r nTr− −
= =− −
Deoarece 2;1 10;0.90 1.81nt tα− − = = si 0.13 1.81⟨ se accepta ipoteza , deci rezultatele nu sunt corelate.
0H
11. Studiem inhibitia colinesterazei de catre o serie de compusi organofosforici. Pentru fiecare compus s-a determinat: • Capacitatea inhibitoare, exprimata prin constanta K de formare a complexului enzima – compus; • Lipofilia, exprimata prin coeficientul de partitie P intre apa si octanol log K 2.27 2.44 2.46 2.56 3.08 3.23 3.27 3.32 3.71 log P 0.089 -0.67 0.021 0.66 0.82 1.88 2.53 2.39 1.67
Exista o corelatie semnificativa intre actiunea inhibitoare si lipofilie?
Solutie: Vom aplica testul de rang Spearman.
0 : intH nu exista corelatie re actiunea inhibitoare si lipofilie : intAH exista corelatie re actiunea inhibitoare si lipofilie
Determinam rangurile pentru fiecare compus
log K 1 2 3 4 5 6 7 8 9 log P 3 1 2 4 5 7 9 8 6
Determinam diferenta dintre ranguri pentru fiecare compus ( ): id
id -2 1 1 0 0 -1 -2 0 3 2id 4 1 1 0 0 1 4 0 9
2 20id =∑
Calculam ( )2
6*201 09 9 1Sr = − ≅
−.83
Teste neparametrice
99
Intrucat avem 9 10n = ⟨ vom utiliza valoarea corespunzatoare din tabelul de corelatie (tabel 2): 0.59rα = pentru 0.10α =
Deoarece Sr rα⟩ vom respinge ipoteza , deci nu exista o corelatie semnificativa intre actiunea inhibitoare si lipofilie.
0H
12. La testarea bioechivalentei a doua preparate farmaceutice (testat –T si referinta – R) continand MELOXICAM s-a constatat ca distributia datelor din tabelul de mai jos nu poate fi considerata ca fiind normala nici pentru datele primare, nici pentru datele logaritmate.
Din acest motiv testarea bioechivalentei cu ajutorul testelor parametrice nu este aplicabila si rezultatul negativ in ceea ce priveste bioechivalenta nu este un rezultat care sa reflecte adevarul.
Vom verifica daca in acest caz, aplicarea testelor nonparametrice schimba concluzia negativa privind bioechivalenta comparand ariile de sub curba (AUC) pentru un studiu efectuat pe 18 subiecti din care s-au selectat ilustrativ 6 voluntari.
Subject AUC-R AUC-T 1 36,7 44,9 6 3,5 12,6 12 24,8 34,6 16 29,1 37,1 19 48,7 38,4 21 31,4 24,9
Solutie: Ipotezele statistice sunt:
0 :H produsele nu sunt bioechivalente :AH produsele sunt bioechivalente
Se studiaza mai intai diferentele dintre AUC pentru medicamentul testat si medicamentul referinta.
Subject AUC-R AUC-T RT AUCAUC −
1 36,7 44,9 8,2 6 3,5 12,6 9,1
12 24,8 34,6 9,7 16 29,1 37,1 8,0 19 48,7 38,4 -10,2 21 31,4 24,9 -6,5
Vom ordona crescator aceste diferente netinandu-se cont de semn. Subject
RT AUCAUC − Rang 21 -6,5 1 16 8,0 2 1 8,2 3
Teste neparametrice
100
6 9,1 4 12 9,7 5 19 -10,2 6
Dupa ordonarea completa a diferentelor (netinandu-se cont de semne) se vor adauga semnele corespunzatoare diferentelor originale care au determinat aceste ranguri:
Subject
RT AUCAUC − Rang Rangurile continand semn
21 -6,5 1 - 1 16 8,0 2 2 1 8,2 3 3 6 9,1 4 4
12 9,7 5 5 19 -10,2 6 -6
Astfel, subiectul 21 care avea inainte rangul 1 va capata rangul -1
deoarece diferenta pentru acest subiect este negativa. Acelasi lucru se va intampla si cu subiectul 19 care va capata rangul -6.
Vom calcula suma rangurilor pozitive si suma rangurilor negative: 145432 =+++=+R si 761 =+=−R
In tabelul de mai jos sunt prezentate valorile “critice” ale celor doua sume de ranguri necesare pentru nivelul de semnificatie 5%, respectiv 1%, pentru N valori (N se considera numarul de perechi excluzand perechile a caror diferenta este 0). Cea mai mica suma a rangurilor trebuie sa fie cel mult egala cu cea din tabelul de mai jos pentru a considera cele doua grupuri de rezultate ca fiind diferite la nivelul de incredere specificat 05,0=α .
Tabel 1 N 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 α 0 2 3 5 8 10 13 17 21 25 30 35 40 46 52
In exemplul nostru 6=N , suma minima a rangurilor este si
(valoarea corespunzatoare din tabel). De aceea, spunem ca cele doua medicamente realizeaza nivele plasmatice asemanatoare pentru
7=−R07 ≥
05,0=α . Pentru valorile date aproximarea normala este mai la indemana pentru a compara cele doua populatii:
Teste neparametrice
101
( )
( )( )24
1124
1
++
+−
=NNN
NNRZ
unde R este suma rangurilor (poate fi utilizata oricare dintre suma rangurilor pozitive sau negative) si N este numarul de elemente (exceptand valorile egale).
In cazul nostru, 6=N si 14=R , deci 73,0
247*13*6
47*614
≅−
=Z .
Deci, cele doua produse nu sunt bioechivalente.
13. Determinarea efectului antiinflamator al medicamentului Algopirin s-a efectuat pe modelul de inflamaţie experimentală cu carrageenan la nivelul labei piciorului posterior la şobolani. S-au utilizat şobolani Wistar cu greutate de 120 ± 10 g pentru fiecare variantă experimentală. S-a utilizat o soluţie salină de 1% carrageenan injectată în volum de 0,1 ml s.c. în laba posterioară.
Volumul labei a fost determinat înainte de administrare şi la 3 ore după injectarea soluţiei de carrageenan. Preparatele antiinflamatorii s-au administrat cu 1 oră în prealabil carageenanului, iar la 3 ore după administrarea acestora a fost determinat volumul labelor posterioare. Laba contralaterală a constituit referinţa.
S-au obtinut urmatoarele date experimentale privind volumul
inflamatiei (ml):
Acetyl salicylic acid
0.8 0.5 0.7 0.5 0.6 0.6 0.3
Chlorpheniramin 1 0.7 1 1 0.8 1.1 0.9 ALGOPIRIN -0.1 0.5 0.5 -0.2 -0.4 -0.3 0.2 Lot control 0.7 0.7 0.7 0.7 0.6 0.8 0.8 0.6 0.7 0.7
Sa se verifice ipoteza ca medicamentele pot reduce inflamatia.
Teste neparametrice
102
absolute value of inflammation (ml) of the rat paw induced by caragenaan
-1
0
1
21
2
3
4
57
8
9
10
Patent
AAS
clorpheniramin
control Solutie: Vom aplica testul H
( )( )( )
2
2
1
12 1 1
112
k ii
i i
i
NR nH kNN N n
n
χ=
⎡ ⎤+⎢ ⎥− ⎛ ⎞⎢ ⎥= − ≅ −⎜ ⎟⎢ ⎥ ⎝ ⎠+ −⎢ ⎥
⎢ ⎥⎣ ⎦
∑
Pentru aceasta vom ordona crescator toate valorile si vom aloca rangurile corespunzatoare tinandu-se cont ca in cazul in care apar cozi (valori egale) acestea vor avea drept rang media rangurilor pe care le-ar fi primit daca nu erau egale.
Acetyl salicylic acid 24.5 8.5 18.5 8.5 12.5 12.5 6 Chlorpheniramin 29 18.5 29 29 24.5 31 27 ALGOPIRIN 4 8.5 8.5 3 1 2 5 Lot control 18.5 18.5 18.5 18.5 12.5 24.5 24.5 12.5 18.5 18.7
Calculam iR media rangurilor pentru fiecare produs (pe linie).
iR
Acetyl salicylic acid 13.00Chlorpheniramin 26.86ALGOPIRIN 4.57Lot control 19.36
31N = 1 2 3 7n n n= = =
4 10n = ; 4k =
16,01R =
Teste neparametrice
103
Vom calcula statistica H distribuita 2χ cu 3 grade de libertate:
( )( )
( )( ) ( )( ) ( )
2
2 2
2 2
12
1
7 13,00 16,01 7 26,86 16,0112 23,1731 31 1 7 4,57 16,01 10 19,36 16,01
i in R RH
N N
−= =
+
⎡ ⎤− + − +⎢ ⎥= =
+ ⎢ ⎥+ − + −⎣ ⎦
∑
Deoarece apar valori egale, H trebuie impartit cu factorul NN
T−
− ∑31
unde ( ) ( ) 31 1T k k k k= − + = − k este calculat pentru fiecare grup de legături.
In cazul nostru avem: Grup de legaturi (rangul) Nr. Legaturi (k) ( ) ( )1 1T k k k= − +
8,5 4 60 12,5 4 60 18,5 8 504 24,5 4 60 29 3 24
T∑ 704
3 3
704 7041 1 131 31 29760
TN N
− = − = −− −
∑ 0,98
Deci, vom obtine 23,17 23,640,98
H = = .
Dar cuantila deci H este in zona de respingere si deci se poate vorbi de o actiune antiinflamatoare pusa in evidenta prin modelul experimental prezentat.
23;0,90 6,25χ =
Teste neparametrice
104
Regresia liniara
105
REGRESIA LINIARA Dacă reprezentarea grafică a două mărimi ce sunt observate
simultan sugerează o dependenţă liniară, ajungem la problema determinării dreptei ce descrie “cel mai bine” această dependenţă.
O soluţie a acestei probleme o constituie “dreapta prin cele mai mici pătrate”, dreapta pentru care suma pătratelor distantelor de la ea la punctele experimentale este minimă.
Să admitem că pentru un x fixat, valoarea măsurată y este o variabilă aleatoare cu urmatoarea structură: y xη ε α β ε= + = + + distribuită normal cu dispersia şi media 2σ xβαη += Estimarea ecuaţiei de regresie o notam : bxaY += Metoda celor mai mici pătrate dă valorile a şi b care minimizează suma pătratelor deviaţiilor (erorilor) între valorile observate şi cele prezise de ecuaţia de regresie:
iy
( ) ( )22 ∑∑ −−=−= iiiiE bxayYySS Valorile lui a şi b care minimizează suma pătratelor erorilor sunt:
( )∑ ∑∑ ∑ ∑ ∑
−
−= 22
2
ii
iiiii
xxn
yxxxya şi
( )( )( )2 22
i ii i i i
i i i
x x yn x y x yb
n x x x x
−−= =
− −
∑∑ ∑ ∑∑ ∑ ∑
Estimaţii şi ipoteze asupra coeficientului b: a) Cazul dispersiilor cunoscute
În cazul în care se cunoaşte dispersia erorilor de măsurare 2σ se
foloseşte variabila aleatoare
( )2
2
i
bZ
x X
β
σ
−=
⎡ ⎤⎢ ⎥⎢ ⎥−⎢ ⎥⎣ ⎦∑
repartizată . ( )1,0N
b) Cazul dispersiilor necunoscute În acest caz se folosest variabila aleatoare
( ) ( ) ⎥⎥
⎦
⎤
⎢⎢
⎣
⎡
−−
−=
∑2
2 Xxn
SS
bT
i
E
β repartizată Student cu n-2 grade de libertate.
Regresia liniara
106
Coeficientul de corelaţie Coeficientul de corelaţie se defineşte prin formula
( )( )( )
( ) ( )1
2 2
1 1
,n
i i
n ni i
x x y yx y
x x y yρ
− −=
− −
∑∑ ∑
Observatie: Obtinerea unui coeficient de corelatie bun nu implica obligatoriu
faptul ca legea care coreleaza datele este o functie liniara. Consideram de exemplu urmatoarele puncte de pe parabola 2y x= .
x y 1 1 2 4 3 9 4 16
y = 5x - 5R2 = 0.969
0
2
4
6
8
10
12
14
16
18
0 2 4 6
Vom calcula coeficientul de corelatie:
ix iy x y xxi − iy y− ( )2xxi − ( )2
iy y−
( )( )i ix x y y− −
1 1 -1.5 -6.5 2.25 42.25 9.75 2 4 -0.5 -3.5 0.25 12.25 1.75 3 9 0.5 1.5 0.25 2.25 0.75 4 16
2.5 7.5
1.5 8.5 2.25 72.25 12.75 Vom avea:
( )2 5ix x− =∑ ; ( )2 129iy y− =∑ ; ( )( ) 25i ix x y y− − =∑
( )( )( )
( ) ( )1
2 2
1 1
25, 0.9845*129
ni i
n ni i
x x y yx y
x x y yρ
− −= =
− −=
∑∑ ∑
Deci, , dar punctele nu sunt corelate liniar ci parabolic. 2 0.969R =
Regresia liniara
107
COMPARAREA A DOUA DREPTE DE REGRESIE In farmacologie se poate pune problema compararii a doua
medicamente nu numai in ceea ce priveste efectele la o doza administrata ci la mai multe doze aceasta mai ales in cazul unor farmacocinetici neliniare.
Relatia biodisponibilitatea – doza sau efect – doza se poate insa liniariza in urma unor transformari (de regula logaritmice).
Se pune in acest caz problema compararii celor doua drepte obtinute cu medicamentele respective. Acestea pot fi paralele, sau mai mult, pot fi estimari diferite ale uneia si aceleiasi drepte.
In alt context se pot compara doua metode bioanalitice prin compararea curbelor de etalonare liniarizate.
Deci matematic avem doua probleme : • verificarea ipotezei privind paralelismul si • verificarea ipotezei privind identitatea dreptelor 1. Verificarea ipotezei privind paralelismul
Presupunem ca am obtinut experimental doua grupe de date si . ( )ii yx 11 , ( )ii yx 22 ,
Presupunem ca aceste date sunt corelate de dreptele : ( )1111 xxy −+= βα si ( )2222 xxy −+= βα
si deci noi avem sa verificam ipoteza : βββ == 210 :H vs 21: ββ ≠AH
Similar cu demonstrarea facuta pentru o simpla dreapta se arata ca:
( ) ( ) ( )∑ ∑ −+−= 2
22
2
11
2
xxxxbD
ii
σ
Deci, pentru testarea ipotezei egalitatii pantelor folosim testul t. Pentru aceasta observam ca,
( ) ( ) ( )∑∑ −+
−=− 2
22
22
211
21
21xxxx
bbDii
σσsi ( ) 02121 =−=− ββbbE
Deci statistica de calculat este:
( ) ( )1 2
1 24
2 2
1 1 2 2
1 1n n
p
i i
b bTS
x x x x
+ −
−=
+− −∑ ∑
unde este dispersia ponderata a reuniunii celor doua populatii : pS
( ) ( )4
22
21
222
2112
−+−+−
=nn
SnSnS p
Regresia liniara
108
2. Verificarea ipotezei privind identitatea dreptelor. Dupa verificarea ipotezei ca cele doua drepte sunt paralele, se pune
problema daca ele sunt efectiv identice si deic dreptele obtinute prin metoda celor mai mici patrate sunt estimari ale uneia si aceiasi drepte.
Pentru aceasta vom considera dreptele ( )111 xxy −+= βα si ( )222 xxy −+= βα
si estimarile , si pentru 1a 2a b 1α , 2α , respectiv β obtinute prin metoda celor mai mici patrate.
Deci vom calcula valorile , si care minimizeaza suma patratelor abaterilor :
1a 2a b
( ) ( )[ ] ( )[ ]22222
2
111121 ,, ∑∑ −−−+−−−= xxbayxxbaybaaSP iiii Conditia necesara ca ( )baaSP ,, 21 sa fie minim este ca :
021
=∂∂
=∂∂
=∂∂
bSP
aSP
aSP
Calculand se obtine :
( )[ ] 02 11111
=−−−−=∂∂ ∑ xxbay
aSP
ii
( )[ ] 02 22222
=−−−−=∂∂ ∑ xxbay
aSP
ii
( )[ ]( )( )[ ]( )222222
111111
2
2
xxxxbay
xxxxbayb
SP
iii
iii
−−−−−
−−−−−−=∂∂
∑∑
Deoarece ( ) ( ) 02211 =−=−∑ ∑ xxxx ii (suma diferentelor fata de medie), rezulta imediat din primele doua ecuatii:
11
11 y
ny
a i == ∑ si 22
22 y
ny
a i == ∑
Inlocuind in a treia ecuatie se obtine:
( )( ) ( )( )( ) ( ) 0
2222222
2
111111
=−+−−−
−−+−−−
∑∑∑∑
xxbxxyy
xxbxxyy
iii
iii
de unde ( )( ) ( )( )
( ) ( )∑∑∑∑
−+−
−−+−−= 2
222
11
22221111
xxxx
xxyyxxyyb
ii
iiii
Regresia liniara
109
Deoarece ( ) ( )2211 xxxx −+≡−+ βαβα si ( )2121 xx −≡− βαα consideram estimarea ( ) ( )2121 xxbaaZ −−−= avand • ( ) 0=Z deoarece E 11 ya = si 22 ya = •
( ) ( ) ( )
( )( ) ( ) ⎥
⎥
⎦
⎤
⎢⎢
⎣
⎡
−+−
−++=
=−++=
∑ ∑2
222
11
2
21
21
2
2
212
22
1
21
11
xxxx
xxnn
bDxxnn
ZD
ii
σ
σσ
Astfel se compara valoarea raportului ( ) ( )
( )( ) ( )
1 2
1 2 1 23 2
1 22 2
1 2 1 1 2 2
1 1n n
p
i i
a a b x xT
x xS
n n x x x x
+ −
− − −=
−+ +
− + −∑ ∑
cu valorile pragului de acceptare (respingere) a ipotezei pentru un interval de incredere α−1 fixat. In ceea ce priveste estimarea a dispersiei, se poate lua suma erorilor .
2pS
( )baaSP ,, 21
Aplicatii: 1. La stabilirea curbei de calibrare pentru inceperea unei noi sesiuni de lucru s-au obtinut urmatoarele rezultate:
Concentratie (µg/mol)
Arie analit / Arie standard intern
1 0,1 3 0,3 6 1,7
10 3,4
y = 0.3848x - 0.5489R2 = 0.9747
-0.5
0
0.5
1
1.5
2
2.5
3
3.5
4
0 2 4 6 8 10 12
Regresia liniara
110
Stiind, de la validare ca sa se calculeze pentru panta dreptei de regresie.
2 0.09σ = 90%CI
Solutie: Dreapta care aproximeaza punctele este de forma *y xβ α= + . Panta dreptei care aproximeaza dependenta liniara este ( )xy( )( )∑
∑−
−= 2
xx
yxxb
i
ii . Deoarece se cunoaste dispersia, pentru determinarea
pentru panta dreptei de regresie, vom folosi variabila aleatoare 90%CI
( )2
2
i
bZ
x X
β
σ
−=
⎡ ⎤⎢ ⎥⎢ ⎥−⎢ ⎥⎣ ⎦∑
repartizată ( )1,0N .
In cazul nostru avem: ix iy x xxi − ( ) ii yxx − ( )2xxi − ( )∑ −
2xxi
( )∑ − ii yxx
1 0,1 -4 -0.4 163 0,3 -2 -0.6 46 1,7 1 1.7 110 3,4
5
5 17 25
46 17,7
Vom obtine astfel 17,7 0,3846
b = =
Vom folosi urmatoarea variabila aleatoare 0,38 0,380,040,09
46
Z β β− −= = .
Deoarece 0.05 0.95 1,65z z= − = − , avem 0,381,65 1,65 0,900,04
P β−⎛ ⎞− ⟨ ⟨ =⎜ ⎟⎝ ⎠
( )0.07 0,38 0.07 0.9P β− ⟨ − ⟨ = ⇒ ( )0,45 0,31 0.9P β− ⟨ − ⟨ − =
( )0,31 0,45 0.9P β⟨ ⟨ = ⇒ ( )90% 0,31; 0,45CI = 2. Masurand absorbanta unor solutii de 4 – nitrofenol de diferite concentratii la lungimea de unda 400 nmλ = s-au obtinut urmatoarele rezultate:
Concentratia C (moli*10-5/l) 1 2 3 4 5 Absorbanta (A) 0,2 0,4 0,5 0,7 0,9
Regresia liniara
111
Presupunand ca dreapta prin cele mai mici patrate care aproximeaza punctele trece prin origine sa se determine intervalul de incredere 90% pentru panta dreptei. Solutie:
Dreapta care aproximeaza punctele este de forma xy *β= . Din metoda celor mai mici patrate, panta dreptei care aproximeaza
dependenta liniara ( )xy este ( )( )∑
∑−
−= 2
xx
yxxb
i
ii .
In cazul nostru avem: ix iy x xxi − ( ) ii yxx − ( )2xxi − ( )∑ −
2xxi
( )∑ − ii yxx
1 0.2 -2 -0.4 42 0.4 -1 -0.4 13 0.5 0 0 04 0.7 1 0.7 15 0.9
3
2 1.8 4
10 1.7
1.7 0.1710
b = = 0.17*y xdeci, dreapta de regresie este =
y = 0.1782xR2 = 0.9869
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
0 2 4 6
Intervalul de incredere 90% pentru β se calculeaza pornind de la
distributia T a variabilei aleatoare.
( ) ( )∑ −−
−=−
2
2
2 xxn
SSbT
i
En
β
Regresia liniara
112
* =( ) ( ) ( )( ) ( ) ( )( ) ( )
22 2
2 2 2
2 2
* * 0,17
0,2 0,17*1 0,4 0,17*2 0,5 0,17*3
0,7 0,17*4 0,9 0,17*5 0,008
E i i i i i iSS y a b x y b x y x= − + = − = −⎡ ⎤⎣ ⎦
= − + − + − +
+ − + − =
∑ ∑ ∑
30,17 0,17
0.020,0083*10
T β β− −= =
Deoarece 35.205.0:3 −=t , avem 0,172.35 2.35 0.90.02
P β−⎛ ⎞− ⟨ ⟨ =⎜ ⎟⎝ ⎠
( )0.05 0,17 0.05 0.9P β− ⟨ − ⟨ = ⇒ ( )0,22 0,12 0.9P β− ⟨ − ⟨ − =
( )0,12 0,22 0.9P β⟨ ⟨ = ⇒ ( )90% 0,12 ; 0,22CI = 3. Sa se calculeze dreapta prin cele mai mici patrate care aproximeaza punctele
ix 1 2 3 4 5
iy 2 5 5 8 11 si care trece prin origine si sa se determine intervalul de incredere 90% pentru panta dreptei. Solutie:
Dreapta care aproximeaza punctele este de forma xy *β= . Din metoda celor mai mici patrate, panta dreptei care aproximeaza
dependenta liniara ( )xy este ( )( )∑
∑−
−= 2
xx
yxxb
i
ii .
In cazul nostru avem: ix iy x xxi − ( ) ii yxx − ( )2xxi − ( )∑ −
2xxi
( )∑ − ii yxx
1 2 -2 -4 4 2 5 -1 -5 1 3 5 0 0 0 4 8 1 8 1 5 11
3
2 22 4
10 21
1.21021
==b x*1,2deci, dreapta de regresie este Y =
Regresia liniara
113
y = 2,1x
0
2
4
6
8
10
12
0 2 4 6
Intervalul de incredere 90% pentru β se calculeaza pornind de la
distributia T a variabilei aleatoare.
( ) ( )∑ −−
−=−
2
2
2 xxn
SSbT
i
En
β
( ) ( ) ( )( ) ( ) ( ) ( ) (
22 2
2 2 2 2
* * 2,1*
2 2.1*1 5 2.1*2 5 2.1*3 8 2.1*4 11 2.1*50.01 0.36 1.69 0.16 0.25 2.77
E i i i i i iSS y a b x y b x y x= − + = − = − =⎡ ⎤⎣ ⎦
= − + − + − + − + − =
= + + + + =
∑ ∑ ∑)2
3.01.2
09.01.2
10*377.2
1.23
βββ −=
−=
−=T
Deoarece 35.205.0:3 −=t , avem 9.035.23.0
1.235.2 =⎟⎠⎞
⎜⎝⎛ ⟨
−⟨−
βP
( ) 9.07.01.27.0 =⟨−⟨− βP ⇒ ( ) 9.04.18.2 =−⟨−⟨− βP ( )1.4 2.8 0.9P β⟨ ⟨ = ⇒ ( )90% 1,4 ; 2,8CI =
4. Metforminul se foloseste in doza de 500 – 2500 mg si problema este daca farmacocinetica este liniara sau nu, daca la dublarea dozei se dubleaza si concentratia maxima si aria de sub curba sau nu.
Datele furnizate de Bristol Myers Squibb pentru metforminul retard ,
Glucophage XR privind concentratia maxima la echilibru dupa administrarea repetata (1 cpr/zi) sunt urmatoarele:
Regresia liniara
114
Doza administrata (g)
Concentratia (µg/ml)
0.5 0.6 1 1.1
1.5 1.4 2 1.8
Metformin
y = 0.78x + 0.25R2 = 0.9909
0
0.5
1
1.5
2
0 0.5 1 1.5 2 2.5
Doza (g)
Con
cent
ratia
(mg/
l)
Deoarece in cercetarile publicate1,2,3 au sugerat lipsa unei
proportionalitati intre parametrii farmacocinetici la marirea dozei, verificati corelarea liniara a datelor de mai sus. Solutie:
Din metoda celor mai mici patrate, vom determina
( )∑ ∑
∑ ∑ ∑ ∑−
−= 22
2
ii
iiiii
xxn
yxxxya şi
( )∑ ∑∑ ∑ ∑
−
−= 22
ii
iiii
xxn
yxyxnb
In cazul nostru nu cunostem dispersia, deci pentru a determina pentru panta dreptei de regresie, vom folosi variabila aleatoare 90%CI
( ) ( )∑ −−
−=−
2
2
2 xxn
SSbT
i
En
β repartizată Student cu 2n− grade de libertate.
Vom obtine urmatoarele date:
1 N.C.Sambol, J.Chiang, M.O’Conner, Chui Y.Liu, E.T.Lin, A.M.Goodman, Leslie Z. Benet, J.H.Karam, Pharmacokinetics and pharmacodynamics of Metformin in healthy subjects and patients with noninsulin – dependent diabetes mellitus, Br. J.Clin Pharmacol 1996; 36:1012 - 1021 2 E.Cullen, J.Liao, P.Lukacsko, R.Niecestro, L.Friedhoff, Pharmacokinetics and dose proportionality of extended release Metformin following administration of 1000, 1500, 2000 and 2500 mg in healthy volunteers, Biopharmaceutics & Drug Disposition 25: 261 – 263 (2004) 3 N.C.Sambol, L.G.Brookes, J.Chiang, A.M.Goodman, E.T.Lin, C.Y.Liu, L.Z.Benet, Food intake and dosage level, but not tablet vs solution dosage form, affect the absorption of Metformin HCl in man, , Br. J.Clin Pharmacol 1996; 42:510 - 512
Regresia liniara
115
ix iy 2ix x i ix y
ix x− ( )2
ix x−
0.5 0.6 0.25 0.3 -0.75 0.5625 1 1.1 1 1.1 -0.25 0.0625
1.5 1.4 2.25 2.1 0.25 0.0625
2 1.8 4
1.25
3.6 0.75 0.5625 Suma 5 4.9 7.5 7.1 1.25 Deci,
( )2
2 22
4.9*7,5 5*7,1 0.254*7.5 5
i i i i i
i i
y x x x ya
n x x
− −= =
−−∑ ∑ ∑ ∑
∑ ∑=
( )2 22
4*7,1 5*4,9 0.784*7.5 5
i i i i
i i
n x y x yb
n x x
− −= =
−−
∑ ∑ ∑∑ ∑
=
Deci, dreapta de regresie este 0.25 0.78*y x= +
Vom calcula ( ) ( )i ⇒22
* 0.25 0.78*E i i iSS y a b x y x= − + = − −⎡ ⎤⎣ ⎦∑ ∑)( ) (
( ) ( )
2 2
2 2
0.6 0.25 0.78*0.5 1.1 0.25 0.78*1
1.4 0.25 0.78*1.5 1.8 0.25 0.78*2 0.007ESS = − − + − − +
+ − − + − − =
Variabila aleatoare este
( )
0.78 0.780.050.007
4 2 1.25
T β β− −= =
−
distribuita
Student cu 2 grade de libertate.
Deoarece 2:0.05 2:0.95 2.92t t= = − , avem 0.782.92 2.92 0.90.05
P β−⎛ ⎞− ⟨ ⟨ =⎜ ⎟⎝ ⎠
( )0.15 0.78 1.5 0.9P β− ⟨ − ⟨ = ⇒ ( )0.93 0.63 0.9P β− ⟨ − ⟨ − =
( )0.63 0.93 0.9P β⟨ ⟨ = ⇒ ( )90% 0.63 ; 0.93CI = 5. Pentru un lot de 9 compusi organofosforici s-a analizat relatia dintre constanta de inhibitie a colinesterazei ( iK ) si un parametru ( aB ) ce caracterizeaza alcalinitatea compusilor. Aceasta relatie a fost exprimata sub forma urmatoarei drepte de regresie:
( ) ( )8.1 3.1 13.0 5.7i aK B= ± + − ± (parametrii sunt sub forma urmatoare: valoarea estimata ± dispersia de selectie). Este aceasta regresie semnificativa?
Regresia liniara
116
Solutie: Estimarea dreptei de regresie este : bxaY += unde:
• 13.0 ; 5.7aSa = − = ; • 8.1b = ; 3.1bS = ; si • 9n =
Vom avea de testat urmatoarele ipoteze statistice: 0 : 0H β = vs : 0AH β ≠
Vom considera variabila aleatoare b
bTSβ−
= este repartizata Student cu
grade de libertate. 2n−
In aceste conditii avem 8.1 0 2.613.1
T −= = este repartizata Student cu
7 grade de libertate. Deoarece 7:0.05 7:0.95 1.90t t= = − si , rezulta ca T este in
zona de respingere. 2.61 1.90⟩
Vom spune ca se respinge ipoteza 0 :H 0β = , deci regresia este semnificativa.
6. Consideram o anumită formulare (ex.: comprimate) care fac obiectul studiului stabilităţii. Produsul luat în considerare are o concentraţie declarată de 50 mg şi cu o specificaţie tehnică care prevede o supradozare de 4%; în acest caz producătorul va fabrica tablete cu o concentraţie de 52 mg de substanţă activă.
Se aleg trei tablete la întâmplare, se analizează la: 0,3, 6, 9, 12 şi 18 luni, după producţie, în condiţiile temperaturii camerii (20 de grade Celsius). Datele sunt prezentate în tabelul de mai jos.
Timp t (luni)
Concentratia C Media
0 51 51 53 51.7 3 51 50 52 51.0 6 50 52 48 50.0 9 49 51 51 50.3 12 49 48 47 48.0 18 47 45 49 47.0
44
45
46
47
48
49
50
51
52
53
54
0 5 10 15 20
timp (luni)
Con
cent
ratie
(mg)
Presupunem că concetraţia şi timpul sunt în relaţie liniară:
Regresia liniara
117
( ) 0C t C kt= − unde • C(t) = concentraţia la timpul t • C0 = concentraţia la timpul 0 • k = constanta • t = timpul de depozitare Sa se determine dreapta care aproximeaza cel mai bine aceste date. Solutie : Când facem calculele celor mai mici pătrate, reţinem că fiecare valoare a timpului este asociată cu trei valori ale concentraţiei medicamentului. Dacă calculăm C0 şi K, fiecare valoare de timp este numărată de trei ori şi N este egal cu 18. Avem:
( ) ( ) ( )0 0 0 1 1 1 .... 18 18 18 144ix = + + + + + + + + + =∑
( ) ( ) ( )2 2 2 2 2 2 2 2 2 20 0 0 1 1 1 .... 18 18 18 1782ix = + + + + + + + + + =∑
144 818
ixx
N= = =∑
( ) ( )51 51 53 .... 47 45 49 894iy = + + + + + + =∑
( ) ( )2 2 2 2 2 2 251 51 53 .... 47 45 49 44476iy = + + + + + + =∑ 894 49.67 5018
y = = ≅
( ) ( )0*51 0*51 0*53 .... 18*47 18*45 18*49 6984i ix y = + + + + + + =∑
( ) ( ) ( )2 2 23* 0 8 ... 18 8 630ix x ⎡ ⎤− = − + + − =⎣ ⎦∑
( ) ( ) ( ) ( ) ( )2 2 2 2 251 50 51 50 53 50 ... 49 50 74y y− = − + − + − + + − =∑
Obtinem:
( )2 22
18*6984 144*894 0,267 /18*1782 144
i i i i
i i
N x y x yb mg luna
N x x
− −= = = −
−−∑ ∑ ∑∑ ∑
( )894* 0, 267 *8 51,8018
a y b x= − = − − =
Ecuaţia dreptei de regresie este: ( ) 51,80 0, 267*C t t= −
Regresia liniara
118
7. In conformitate cu exercitiul precedent, ( ) 0 51,80 0,267*C t C kt t= − = − ,
iar datele experimentale sunt urmatoare: Timp t (luni) Concentratia C
0 51 51 53 3 51 50 52 6 50 52 48 9 49 51 51 12 49 48 47 18 47 45 49
sa se calculeze intervalul de incredere 90% pentru constanta k. Solutie:
Vom folosi variabila aleatoare:
( ) ( )2
2
0, 267
2
NE
i
kTSS
N x
−
x
− −=
− −∑
( )
( ) ( )( ) ( )
( )
2exp
222 2 2 22
22
2 2
2 244476 894 /18 0,267 *630
1,182518 2
thi i
ii i
y ySSEN N
yy b xy y b x x N
N N
−= =
− −
− − −− − −= =
− −
− − −= =
−
∑
∑∑ ∑∑ ∑ x=
( ) ( ) ( )2 2 23* 0 8 ... 18 8 630ix x ⎡ ⎤− = − + + − =⎣ ⎦∑
Deci, avem variabila aleatoare 0, 2670.043
kT − −= distribuita Student cu
16 grade de libertate.
Deoarece 16;0.05 16;0.95 1.75t t= = − , avem 0,2671,75 1,75 0.90,043
kP − −⎛ ⎞− ⟨ ⟨ =⎜ ⎟⎝ ⎠
( )0.075 0,267 0.075 0.9P k− ⟨ − − ⟨ = ⇒ ( )0.342 0.192 0.9P k− ⟨ − ⟨ − =
( )0.192 0.342 0.9P k⟨ ⟨ = ⇒
( )90% 0.192 ; 0.342CI =
Regresia liniara
119
8. Dandu-se date din exercitiul nr. 6, sa se calculeze termenul de valabilitate (timpul cand produsul a obtinut 90% din doza initiala). Solutie:
Conform exercitiului nr. 6, am obtinut dreapta de regresie care reprezinta dependenta concentratiei in functie
de timp. ( ) 51,80 0, 267*C t t= −
Avem de calculat timpul în care concentraţia comprimatului este de 90% din cantitatea de substanţă activă declarată, adică 45 mg.
45 51,80 0, 267* t= − ⇒ 25,5t luni= Estimarea timpului la care concetraţia comprimatului va fi de 90% din cantitatea declarată iniţial (se regăsesc 45 mg de substanţă activă după 25,5 luni de la data fabricaţiei). Aceasta este un rezultat mediu bazat pe datele a 18 tablete. 9. Consideram urmatoarele selectii din doua populatii corelate:
1ix 1iy 2ix 2iy0 2 0 3 1 3 1 4 2 5 2 5 3 6 3 7
y = 1.3x + 2.8R2 = 0.9657
y = 1.4x + 1.9R2 = 0.98
0
1
2
3
4
5
6
7
8
0 1 2 3 4
Series1Series2Linear (Series2)Linear (Series1)
Sa se verifice ipoteza ca dreptele sunt paralele.
Solutie : Vom determina si . 1b 2bPentru calculul lui avem 1b
1ix 1iy 1x 1 1ix x− ( )1 1i i1x x y− ( )2
1 1ix x− ( )211ix x−∑ ( )1 1i i1x x y−∑
0 2 -1.5 -3 2.251 3 -0.5 -1.5 0.252 5 0.5 2.5 0.253 6
1.5
1.5 9 2.25
5 7
Regresia liniara
120
Obtinem ( )( )
1 1 11 2
1 1
7 1,45
i i
i
x x yb
x x
−= = =
( )−
∑∑
si
2112
11
5 1,671 3
ix xS
n
−= = =
−∑
Pentru calculul lui avem 2b
2ix
2iy 2x
2 2ix x−
( )2 2 2i i (x x y−
)2
2 2ix x−
( )222ix x−∑
( )2 2i i2x x y−∑
0 3 -1.5 -4.5 2.251 4 -0.5 -2 0.252 5 0.5 2.5 0.253 7
1.5
1.5 10.5 2.25
5 6.5
Obtinem ( )( )
2 2 22 2
2 2
6,5 1,35
i i
i
x x yb
x x
−= = =
−
( )∑∑
si
2222
22
5 1,671 3
ix xS
n
−= = =
−∑
Vom calcula dispersia ponderata a reuniunii celor doua populatii ( ) ( )2 2
1 1 2 22
1 2
2 2 2*1,67 2*1,67 4*1,67 1,674 4 4 4 4p
n S n SS
n n− + − +
= = =+ − + −
= ⇒
1, 29pS = Calculam variabila
( ) ( )1 2
1 24
2 2
1 1 2 2
1, 4 1,3 0,1 0,120,821 1 1 11,29
5 5
n n
p
i i
b bTS
x x x x
+ −
− −= =
+ +− −∑ ∑
= =
distribuita Student cu 4 grade de libertate. Deoarece 4;0.05 4;0.95 2,13t t= = − si 0,12 2,13⟨ , rezulta ca T este in
zona de acceptare, deci cele doua drepte sunt paralele. 10. Sa se verifice ipoteza ca dreptele de la exercitiul anterior sunt identice. Solutie :
Pentru a verifica ipoteza privind egalitatea celor doua drepte se compara valoarea raportului
Regresia liniara
121
( ) ( )( )
( ) ( )
1 2
1 2 1 23 2
1 22 2
1 2 1 1 2 2
1 1n n
p
i i
a a b x xT
x xS
n n x x x x
+ −
− − −=
−+ +
− + −∑ ∑
cu valorile pragului de acceptare (respingere) a ipotezei pentru intervalul de incredere α−1 fixat, unde :
• 11
11 y
ny
a i == ∑
• 22
22 y
ny
a i == ∑ si
• ( )( ) ( )( )
( ) ( )∑∑∑∑
−+−
−−+−−= 2
22
2
11
22221111
xxxx
xxyyxxyyb
ii
iiii
1ix 1iy ( )1 1ix x− ( )1 1iy y− ( )( )1 1 1 1i ix x y y− − ( )2
1 1ix x−
0 2 -1.5 -2 3 2.25 1 3 -0.5 -1 0.5 0.25 2 5 0.5 1 0.5 0.25 3 6 1.5 2 3 2.25
1 1,5x = 1 4y = 7=∑ 5=∑ si:
2ix 2iy ( )2 2ix x− ( )2 2iy y− ( )( )2 2 2 2i ix x y y− − ( )2
2 2ix x−
0 3 -1.5 -1.75 2.625 2.25 1 4 -0.5 -0.75 0.375 0.25 2 5 0.5 0.25 0.125 0.25 3 7 1.5 2.25 3.375 2.25
2 1,5x = 2 4,75y = 6,5=∑ 5=∑ Conform exercitiului precedent avem:
• 1, 29p S =
• 1 4a = • 2 4,75 si a =
• 7 6,5 1,355 5
b += =
+
Regresia liniara
122
Deci, vom obtine variabila aleatoare: ( ) ( )
( )4 4 3 2
4 4,75 1,35 1,5 1,5 0,75 2 0,81,291,5 1,51 11,29
4 4 5 5
T + −
− − − −= =
−+ +
+
2= −
distribuita Student cu 5 grade de libertate. Deoarece 5;0.05 5;0.95 2,02t t= = − si 2,02 0,82− ⟨ − , rezulta ca T este in
zona de acceptare, deci cele doua drepte sunt paralele.
ANOVA
123
METODE STATISTICE DE ANALIZA FACTORILOR DE VARIABILITATE IN EXPERIMENTUL BIOLOGIC (ANOVA) Se pune problema comparării mai multor selecţii provenite din aceiasi populatie sau din populaţii pe care le ştim ca fiind normal repartizate, de exemplu concentraţiile plasmatice realizate de tablete care conţin diferiţi excipienţi, dar care au aceeaşi substanţă activă, în aceeaşi doză. Vrem să verificăm ipoteza compusă că acestea provin de fapt din aceiaşi populaţie, având media μ şi dispersia σ, deci că excipienţii folosiţi nu influenţează semnificativ cedarea şi absorbţia substanţei active: 43210 : μμμμ ===H
faţă de ipoteza alternativă că cel puţin două medii nu sunt egale. Analiza dispersională este o metodă fundamentală a statisticii care, în plus faţă de mijloacele de calcul a “tendinţei centrale” a rezultatelor experimentelor repetate, caracterizează mai ales variabilitatea acestora. Privita din unghiul de vedere al factorilor de variabilitate ANOVA se transforma in « analiza factoriala » care porneste de la aceeasi metode dar incearca sa rezolve alte probleme. Cea mai simplă analiză dispersională, numită analiză dispersională unidimensională sau unifactorială (numită în literatura engleză şi “one-way ANOVA”) sau “experiment complet aleator”, “experiment cu grupuri paralele”, corespunde testului t de analiză a două eşantioane independente şi compară două sau mai multe grupuri.
In ipoteza că toate grupurile aparţin aceleiaşi populaţii, ideea testului este aceea că variabilitatea în interiorul grupurilor trebuie să fie de acelaşi ordin cu variabilitatea între mediile grupurilor.
În consecinţă, dispersia totală, evaluată ca suma a pătratelor diferenţelor între valorile individuale şi media întregii populaţii selectate SST, este separată într-o parte datorită variaţiei între grupuri (within), sau variabilităţii “interioare” şi o parte datorită variabilităţii “dintre” (between) grupuri: BWT SSSSSS += .
ANOVA
124
Daca comparam intra si intervariabilitatea cu testul Fischer – Snedecor si se obtine un rezultat pozitiv, atunci vom putea spune ca grupurile nu difera intre ele.
Fie modelul statistic : ijiijx εαμ ++= unde : • μ este media populatiei • iαμ + este media grupului respectiv • ijε este eroarea de masurare
Dacă numărul de grupuri este k şi numărul de subiecţi în grupul i este atunci eroarea totala poate fi scrisa sub forma: in
(2
1∑∑
=
−=n
i
n
jijT
i
XxSS )
Dupa cum s-a demonstrat la curs, aceasta relatie poate fi scrisa sub forma identitatii analizei dispersionale:
( ) ( ) WB
k
i
n
jiij
k
iiiT SSSSXxXXnSS
i
+=−+−= ∑∑∑22
si raportul W
B
W
B
MSMS
kNSSkSS
F =
−
−= 1 este distribuit ( )1,F k N k− − .
Dupa cum se observă, ( )
2
2
11 x
k
iii
B sk
XXn
kSS
=−
−=
−
∑ reprezintă
dispersia de selecţie ponderată a mediilor de grup faţă de marea medie. Abaterile mediilor grupurilor faţă de media generală depind atât de
hazardul măsuratorilor cât şi de factori ce ţin de însăsi natura grupurilor. Abaterile în interiorul grupurilor sunt independente de aceşti factori, deoarece fiecare valoare măsurată este raportată la însăşi media grupului respectiv. Ele reprezintă fluctuaţii aleatoare.
Variabilitatea în interiorul grupurilor reprezintă diferenţa între variabilitatea totală şi variabilitatea între grupuri.
ANOVA
125
TESTAREA EFECTELOR DE FORMULARE, SECVENTA SI PERIOADA IN EXPERIMENTUL INCRUCISAT CU 2 PERIOADE SI 2 SECVENTE
Pornind de la modelul statistic : ( ) ( ) ijkkjkjjikijk eCFPSY +++++= − ,1,μ
se formeaza combinatiile liniare (“contrastele”): • kikiik YYU 21 += , kni ,1= , 2,1=k (R+T si respective T+R)
• ( )kikiik YYd 1221
−= , kni ,1= , 2,1=k .
• ( )( )⎭
⎬⎫
⎩⎨⎧
−−−
=TRventainsubiectiipentrud
RTventainsubiectiipentrudO
ik
ikik 2sec.,
1sec.,
prezenta sau absenta efectelor rezultand din aplicarea testului t acestor variabile aleatoare, conform tabelului de mai jos:
Variabila test ( ) ..%100/1 ICα− Test statistic
Car
ry
- ov
er ( ) ( )22.12.21.11.
1.2.
YYYY
UUC
+−+
=−=
212,2
1121 nn
tC unn
+±⎟⎠⎞
⎜⎝⎛ −+
σα
21
11nn
CT
u
c
+=σ
Efec
t fo
rmul
are
( ) ( )[ 12.22.11.21.
2.1.
21 YYYY
ddF
−−−
=−=
212,2
1121 nn
tF dnn
+±⎟⎠⎞
⎜⎝⎛ −+
σα
]
21
11nn
FT
d
d
+=σ
Peri
oada
( ) ( )[ ]22.12.11.21.
2.1.
21 YYYY
OOP
−+−
=−=
212,2
1121 nn
tP dnn
+±⎟⎠⎞
⎜⎝⎛ −+
σα
21
11nn
PT
d
p
+=σ
ANALIZA DISPERSIONALA IN TESTAREA CORELATIEI SI REGRESIEI LINIARE
Consideram o variabila aleatoare care depinde liniar de variabila aleatoare
yx :
xy βα += Atunci cand facem determinarile experimentale noi nu stim nici daca
cele doua variabile se coreleaza liniar si nici care este dreapta care descrie
ANOVA
126
dependenta lor. Putem insa, prin analiza datelor experimentale sa determinam, prin metoda celor mai mici patrate, o estimare a dreptei
bxay +=ˆ daca vom considera un set de determinari ( )
jNjijy,1=
corespunzatoare pentru
un dat : ix
Distanta de la un punct dat la ijy y se poate descompune in trei
componente: distanta pana la iy - media punctelor , distanta de la media grupului la valoarea estimata prin dreapta si distanta de la punctele de
pe dreapta la media totala
ijy
iy
y : ( ) ( ) ( )yyyyyyyy iiiiijij −+−+−=− ˆˆ
Ridicand la patrat, sumand si tinand cont ca sumele de produse mixte sunt zero, se obtine :
( ) ( ) ( ) ( )2222ˆˆ ∑∑∑∑ −+−+−=− yyNyyNyyyy iiiiiiijij
sau elinearitatelinearitatladedeviatieeroareT SSSSSSSS ++=
Observam ca, daca toate punctele ar fi pe o dreapta va fi zero, deci aceasta suma este o masura a corelarii liniare.
elinearitatladedeviatieSS
Intr-adevar :
( ) ( )xxSS
rxxbbxabxayyx
y −=−=−−+=−ˆ
ANOVA
127
Facem observatia ca datele pot fi aproximate foarte bine dupa o alta lege (de exemplu xky = cum este in cazul in care se aplica la dizolvare legea lui Higuchi).
Se definesc coeficientul de corelatie si a raportului de corelare ca :
total
linear
SSSS
r =2 si total
elinearitatladedeviatielinear
Y
XYY
SSSSSS
s
ss +=
−= 2
22
2η
• Raportul de corelare 2η este proportia de variabilitate a lui Y atribuabila covariantei cu X ; • Coeficientul de determinare (corelatie) este proportia de variabilitate a lui Y atribuabila covariantei liniare cu X .
Legatura intre panta dreptei de regresie si coeficientul de corelatie Avem dupa definitie
∑ ⎟⎟⎠
⎞⎜⎜⎝
⎛ −⎟⎟⎠
⎞⎜⎜⎝
⎛ −=
y
i
x
i
Syy
Sxx
Nr 1
In cazul in care punctele sunt toate pe o dreapta iy ii bxay +=
( )yx
i
y
i
x
i
SSxxb
NSxbabxa
Sxx
Nr ∑∑
−=⎟
⎟⎠
⎞⎜⎜⎝
⎛ −−+⎟⎟⎠
⎞⎜⎜⎝
⎛ −=
211
dar, ( ) ( ) 22
222
2x
iiy Sb
Nxxb
Nxbabxa
S =−
=−−+
= ∑∑
Deci, inlocuind mai sus ( )
yx
i
y
i
x
i
SSxxb
NSxbabxa
Sxx
Nr ∑∑
−=⎟
⎟⎠
⎞⎜⎜⎝
⎛ −−+⎟⎟⎠
⎞⎜⎜⎝
⎛ −=
211
( )11
2
22
==−
= ∑x
x
xx
i
SS
bSSxxb
Nr
Cand punctele nu sunt pe dreapta, panta dreptei prin cele mai mici patrate b este:
( )( )( )
( )( ) ( )( )x
y
x
y
yx
ii
x
ii
i
ii
SS
rSS
SSyyxx
Syyxx
xx
yyxxb =
−−=
−−=
−
−−= ∑∑
∑∑
22
Deci, x
y
SS
rb =
ANOVA
128
Testarea linearitatii : Observam ca are eroareSS IN − grade de libertate si deci
INSS
MS eroareeroare −
= avem ca ( ) 2eeroareMSE σ=
In cele ce urmeaza vom calcula media sumei ; linearMS
( ) ( )( ) ( )( ) ( ) ( )2222ˆ bExxxbabxaEyyEMSE iiilinear ∑∑∑ −=−−+=−=
Dar, ( ) ( ) ( )[ ] ( ) ( )[ ]22
222 bE
xxbEbDbE
i
y +−
=+=∑
σ
Folosind relatia x
y
SS
rb = ⇒ ( )y
xbEσσ
ρ= si
( ) ( ) ( )( ) 222
2
222
2
2
22
2
2
yyx
yiy
x
y
i
yilinear
Nxx
xxxxMSE
σρσσ
σρσ
σσ
ρσ
+=−
+=
=⎟⎟
⎠
⎞
⎜⎜
⎝
⎛+
−−=
∑
∑∑
In fapt aici am presupus ca pentru fiecare punct valorile corespunzatoare au o dispersie
ix
ijy 2xyσ care este aceeasi pentru toate
punctele si deci putem sa o notam cu sau . ix 2yσ 2
eσLucrurile nu se intampla intotdeauna in acest fel. De exemplu in
cazul dreptei de etalonare in bioanalitica dispersiile sunt practic semnificativ mai mari la limita de cuantificare (pana la 20%) – fata de restul concetratiilor la care limita admisa pentru « precizie » este de 15%.
Ipotezele de verificat sunt : 0:0 =ρH echivalenta cu 0:0 =βH folosind variabila
aleatoareeroare
linearIN MS
MSF =−,1 .
Testarea ipotezei de nonlinearitate : 0: 22
0 =− ρηHPentru aceasta se compara valorile testului
eroare
elinearitatladedeviatieINI MS
MSF =−− ,2 cu valorile din distributia Fischer.
ANOVA
129
• Raportul de corelare 2η este proportia de variabilitate a lui Y atribuabila covariantei cu X ; • Coeficientul de determinare (corelatie) este proportia de variabilitate a lui Y atribuabila covariantei liniare cu X . Distributia comuna a doua variabile
Fie X, Y variabile aleatoare, ( ),j kP X Y este distributia de probabilitate comuna.
Fie X, Y variabile aleatoare continue, ( ),X Yφ este o suprafata si
de exemplu ( ),P a x b c y d≤ ≤ ≤ ≤ este volumul de sub suprafata sprijinit pe dreptunghiul
Se noteaza j
j Y Xμ μ= si 2 2
Y X jjσ σ= media si dispersia lui Y pentru
jx x= fixat. Daca x nu este fixat media si dispersia intregii populatii Y se
noteaza Yμ si 2Yσ si se numesc parametrii ai distributiei marginale a lui Y.
Cand x este fixat incertitudinea privind Y (deci dispersia) se reduce. Se defineste un raport de corelare, procentul reducerii dispersiei prin fixarea lui x:
2 22
2
Y Y X
Y
σ ση
σ
−=
Daca relatia intre x si y este liniara, atunci 2 2η ρ= raportul de corelare este egal cu coeficientul de corelare (numit si coeficient de determinare)
Daca relatia nu este lineara: 2 2XYρ η≤
ANOVA
130
Aplicatie: 1. Consideram trei grupe de determinari conform tabelului de mai jos:
I 2 3 4 II 3 4 5 III 4 5 6
a caror medii au fost respectiv 3, 4 si 5.
Considerand un risc 05,0=α se poate spune ca diferentele obtinute sunt aleatoare si in fapt cele trei selectii sunt din aceeasi populatie omogena? Solutie:
Avem de verificat urmatoarele ipoteze: 3210 : μμμ ==H vs. egaletoatesuntnumediileH A :
Calculam ( )∑∑ −=k
i
n
jiijW
i
XxSS2
, adica:
( ) ( ) ( ) ( ) ( ) ( )( ) ( ) ( ) 6565554
454443343332222
222222
=−+−+−+
+−+−+−+−+−+−=WSS
Conform definitiei ( )∑ −=ji
ijT XxSS,
2 unde
49
369
654543432==
++++++++== ∑
Nx
X ij deci,
( ) ( ) ( ) ( ) ( ) ( )( ) ( ) ( ) 12464544
454443444342222
222222
=−+−+−+
+−+−+−+−+−+−=TSS
O alta metoda de calcul pentru este folosirea urmatoarei formule prescurtate:
TSS
( ) ( )( ) 12144156
936156
9654543321
654543432
22
222222222
2
2
=−=−=++++++++
−
−++++++++=−= ∑∑ NX
XSST
Pentru determinarea lui putem tine cont de relatia , adica
BSS
WBT SSSSSS += 6612 =−=−= WTB SSSSSS sau putem pleca de la definitia lui
ANOVA
131
( ) ( ) ( ) ( ) 6303453443433 2222=++=−+−+−=−= ∑
k
iiiB XXnSS
O alta metoda de calcul pentru foloseste formula echivalenta: BSS
( )
( ) ( ) ( ) 61441509
363
6543
5433
432 2222
2
2
=−=−++
+++
+++
=
=−⎟⎟⎠
⎞⎜⎜⎝
⎛
= ∑∑∑
Nx
n
xSS ij
i i
jij
B
Deci, 3
396
136
1 =
−
−==
−
−=W
B
W
B
MSMS
kNSSkSS
F este distribuit Fischer cu 2, 6
grade de libertate Conform tabelelor Fischer avem 14,595,0;6,2 =f .
Cum 14,53 ⟨ se accepta ipoteza ceea ce inseamna ca cele trei
selectii sunt din aceeasi populatie omogena. 0H
ANOVA
132
2. Dizolvarea unor tablete retard de 400 mg Pentoxifilina a fost testata folosind aparatul USP XXIII, tip 2, in apa la 50 rpm in cele 6 vase ale aparatului, o parte din rezultate fiind prezentate mai jos:
Timp (h) Vas 1 Vas 2 Vas 3 0 0 0 0 1 12 11 12 2 19 23 23 3 29 32 31 4 40 45 38 6 45 49 48 8 48 52 52
Reprezentarea grafica sugereaza aparitia unor diferente intre curbe in
intervalul 4 – 6 h.
a. Folosind ANOVA testati ipoteza ca cele 3 curbe sunt distribuite aleator in jurul unei curbe de dizolvare medii.
0 1 2:H 3μ μ μ= = b. Comentati aplicabilitatea sau non aplicatibilitatea metodei ANOVA in compararea curbelor de dizolvare. Solutie:
Rezerva in aplicarea ANOVA apare din aceea ca in “interiorul curbelor” distributia datelor nu este normala deoarece valorile cresc in timp.
ANOVA
133
Aplicarea este justificata atunci cand suntem in faza de saturare a dizolvarii, se poate neglija dependenta de timp si deci se compara doar “gradul de dizolvare”. 3. Studiul efectelor antiinflamatoare comparativ al aspirinei, clorfeniraminului si asocierea ALGOPIRIN (aspirina 125 mg, paracetamol 75 mg, cofeina 15 mg, clorfeniramin 3 mg) cu ajutorul testului de reducere a inflamatiei labei de sobolan indusa de injectarea carragenan a dus la rezultatele:
Acetyl salicylic acid
Chlorpheniramin Produs X Lot control Sobolan
Initial inflamat Initial inflamat Initial inflamat Initial inflamat 1 0,8 1,6 1 2 1,1 1 0,9 1,6 2 1 1,5 1,1 1,8 0,9 1,4 0,8 1,5 3 1 1,7 1 2 1 1,5 0,9 1,6 4 0,9 1,4 1 2 1 0,8 0,9 1,6 5 0,9 1,5 0,9 1,7 1 0,6 0,9 1,5 6 1 1,6 0,9 2 1 0,7 1 1,8 7 0,9 1,2 1 1,9 1 1,2 0,9 1,7 8 0,9 1,5 9 0,9 1,6 10 0.9 1,6 a. Verificati prin ANOVA ca testul este adecvat in compararea efectului prin aceea ca rezultatele sunt diferite de lotul de control. b. Comparati folosind ANOVA cele trei tratamente intre ele. 4. Presupunem ca testam 4 medicamente(M1-M4) continând aceeaşi substanţă activă, administrate în 4 perioade diferite (PI-PIV).
Considerăm că efectele determinate de cei doi factori analizaţi (medicament – perioada) sunt variabilele aleatoare independente prezentate mai jos.
Medicament
M1 M2 M3 M4 PI 4 5 5 4
.1x PII 3 4 4 3
.2x PIII 3 4 4 3
3.x Perio
ada
PIV 3 4 4 3 4.x
1.x 2.x .3x .4x
ANOVA
134
Considerand un risc 05,0=α se poate spune ca diferentele intre linii si respectiv coloane, obtinute sunt aleatoare si in fapt cele patru selectii sunt din aceeasi populatie omogena?
Solutie:
O primă ipoteză ce trebuie verificata se referă la egalitatea mediilor liniilor, iar a doua la egalitatea mediilor coloanelor. Ipoteza alternativă presupune existenţa unor diferenţe între linii sau respectiv între coloane.
Deci, avem de verificat urmatoarele ipoteze: 3210 : μμμ ==H vs. egaletoatesuntnumediileH A :
Valorile experimentale le considerăm ca rezultanta unor efecte aditive corespunzător liniilor, coloanelor şi erorilor întâmplătoare:
ijjiijx εβαμ +++= unde iα este partea lui datorată liniei (schemei de administrare), ijx jβ reprezintă contribuţia coloanei (forma medicamentoasă), iar ijε este eroarea experimentală. 5. Sa se verifice ipoteze privind lipsa efectelor de perioada, secventa si formulare intr-un experiment incrucisat cu 2 perioade si 2 secvente, comparand doua medicamente testat (T) si referinta (R) si in care s-au obtinut rezultatele de mai jos :
PI PII
2 3 3 2
Secventa1 RT
2 3 4 2 3 2
Secventa 2 TR
3 3 Solutie :
PI PII iku 1•u ikd
1•d ikO 1•O
2 3 5 1/2 1/2 3 2 5 -1/2 -1/2
RT
2 3 5
5
1/2
1/6
1/2
1/6
TR 4 2 6 5,6 -2/2 -1/2 2/2 1/2
ANOVA
135
3 2 5 -1/2 1/2 3 3 6 0 0
• Existenţa efectelor carry – over inegale poate fi determinată prin testarea următoarelor ipoteze:
RT CCCH =⇔= 0:0
RTA CCCH ≠⇔≠ 0: Respingerea ipotezei nule duce la concluzia prezenţei efectelor carry
– over inegale. Pentru testarea ipotezelor asupra lui C se folosesc următoarele medii de selecţie corespunzând fiecărei secvenţe:
∑=
=kn
iik
kk U
nU
1.
1 , 2,1=k unde 1 2ik i k i kU Y Y= +
Deci, 53211 =+=U , 52321 =+=U , 53231 =+=U 62442 =+=U , 52352 =+=U si 63362 =+=U
ceea ce implica 53
5551 =
++=•U si 6,5
3656
2 =++
=•U
In ipoteza , variabila 0H
21
11ˆ
ˆ
nn
CT
u
c
+=σ
are o repartiţie Student
cu grade de libertate. 221 −+ nn6,056,5ˆ
12 =−=−= •• UUC
( ) ( )
( ) ( ) ( ) ( ) ( ) ( )
2 2
1 1 2 2
1 2
2 2 2 2 2 2
ˆ2
5 5 5 5 5 5 6 5,6 5 5,6 6 5,6
3 3 20,16 0,36 0,16 0,68 0,17 0, 4
4 4
i iu
U U U U
n nσ
• •− + −= =
+ −
⎡ ⎤ ⎡− + − + − + − + − + −⎣ ⎦ ⎣= =+ −
+ += = ≅ ≅
∑ ∑
⎤⎦
Obtinem astfel variabila 0,6 6 20, 4*0,71 10, 4
3 3
cT = ≅ ≅+
ANOVA
136
Vom respinge ipoteza nulă RT CCH =:0 în favoarea ipotezei alternative RTA CCH ≠: la un nivel 05,0=α de semnificaţie, dacă
⎟⎠⎞
⎜⎝⎛ −+
⟩2,
2 21 nnc tT α .
Din tabele distributiei Student avem 78,24;975,02,
2 21
==⎟⎠⎞
⎜⎝⎛ −+
ttnnα
Cum acceptam ipoteza , deci nu avem efecte reziduale. 2 2,78⟨ 0H • Pentru testarea efectelor de formulare se vor verifica urmatoarele ipoteze :
TRTR FFFFH =⇔=− 0:0
TRTRA FFFFH ≠⇔≠− 0: Pentru testarea acestor ipoteze vom folosi variabila
21
11ˆnn
FT
d
d
+=σ
distribuita Student cu 221 −+ nn grade de libertate,
unde 2.1. ddF −= si ( ) ( )2 2
11 22
1 2
ˆ2
i id
d d d d
n nσ
• •− + −=
+ −∑ ∑ 2 .
Dar, mediile diferenţelor între perioade în interiorul fiecărei secvenţe
sunt ∑=
=kn
iik
kk d
nd
1.
1 , unde ( )kikiik YYd 1221
−= .
In cazul nostru avem:
21
223
11 =−
=d , 21
232
21 −=−
=d , 21
223
31 =−
=d
122
242
42 −=−=−
=d , 21
232
52 −=−
=d , 02
3362 =
−=d
ceea ce implica: 61
321
21
21
1 =+−
=•d si 21
3
0211
2 −=+−−
=•d
Facand inlocuirile obtinem:
ANOVA
137
( ) ( )2 2
2 211 2 22
1 2
2 2 2
1 1 1 1 1 12 6 2 6 2 6
ˆ2 3 3 2
1 1 1 11 02 2 2 2
ˆ0,29 0,543 3 2
i id
d
d d d d
n nσ
σ
• •
2⎡ ⎤⎛ ⎞ ⎛ ⎞ ⎛ ⎞− + − − + −⎢ ⎥⎜ ⎟ ⎜ ⎟ ⎜ ⎟− + − ⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎢ ⎥⎣ ⎦= =+ − + −
⎡ ⎤⎛ ⎞ ⎛ ⎞ ⎛ ⎞− + + − + + +⎢ ⎥⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎢ ⎥⎣ ⎦+ ≅ ⇒ ≅
+ −
∑ ∑+
Vom obtine astfel variabila aleatoare:
1 2
1 16 2 1,51
1 1 1 1ˆ 0,54*3 3
d
d
FT
n nσ
+= =
+ +≅
Aceasta variabila aleatoare este repartizata Student cu 221 −+ nn grade de libertate.
Cum 2; 0,9751,51 2,78 t⟨ = acceptam ipoteza , deci nu avem efecte formulare.
0H
• Existenţa efectelor de perioada poate fi determinată prin testarea următoarelor ipoteze:
IIIIII PPPPH =⇔=− 0:0
IIIIIIA PPPPH ≠⇔≠− 0: Dupa cum am definit 11 ii dO = , respectiv 22 ii dO −= si 11 •• = dO ,
respectiv 22 •• −= dO Pentru testarea ipotezei vom folosi variabila 0H
21
11ˆnn
PT
d
p
+=σ
repartizata Student cu 221 −+ nn grade de libertate, unde
2.1. OOP −= si ( ) ( )2 2
11 22
1 2
ˆ2
i id
d d d d
n nσ
• •− + −=
+ −∑ ∑ 2
ANOVA
138
Vom obtine astfel variabila
1 16 2 0,76
1 10,54*3 3
T−
= ≅+
−
t
si
deoarece 2; 0,025 2; 0,9752,78 0,76 2,78t = − ⟨ − ⟨ = acceptam ipoteza , deci nu avem efecte de perioada.
0H
6. Sa se testeze ipotezele
0
: 0 1: : 0 1
: 0 1 1
A k
B j
AB jk
H unde k KH H unde j J
H unde j J si k K
αβ
γ
⎧ = ≤ ≤⎪ = ≤ ≤⎨⎪ = ≤ ≤ ≤ ≤⎩
vs. cu riscul : 0alternativaH cel putin un factor este diferit de 05,0=α pentru datele din tabelul de mai jos:
PI PII 1 2 2 3
S1
3 4 3 5 4 6
S2
5 4 Solutie: Vom calcula 1
jk ijkIi
Y Y• = ∑ , deci:
23
32111 =
++=•Y 3
3432
21 =++
=•Y
43
54312 =
++=•Y 5
3465
22 =++
=•Y
Avem 1
k ijkIJi j
Y Y•• = ∑∑ :
5,22
322
21111 =
+=
+= ••
••
YYY si 5,42
542
22122 =
+=
+= ••
••
YYY
Avem 1j ijkIK
i kY • • = Y∑∑ , sau altfel calculat:
ANOVA
139
32
422
12111 =
+=
+= ••
••
YYY si 4
253
22221
2 =+
=+
= ••••
YYY
Si ∑∑∑=•••i j k
ijkYIJK
Y 1 , sau alternativ:
5,34
53424
22211211 =+++
=+++
= •••••••
YYYYY
Calculand eroarea totala conform definitiei obtinem: ( ) ( ) ( ) ( )
( ) ( ) ( ) ( ) ( ) ( )( ) ( ) ( ) ...................5,345,365,35
5,345,335,325,355,345,33
5,335,325,31
222
222222
222
,,
2
=−+−+−+
+−+−+−+−+−+−+
+−+−+−=−= ∑ •••kji
ijkT YYSS
ceea ce este o metoda foarte lunga de calcul. Pentru a simplifica modul de determinare pentru vom folosi
urmatoarea formula prescurtata: TSS
N
YYSS kji
ijk
kjiijkT
2
,,
,,
2⎟⎟⎠
⎞⎜⎜⎝
⎛
−=∑
∑
unde ; 42465543432321,,
=+++++++++++=∑kji
ijkY
170465543432321 222222222222
,,
2 =+++++++++++=∑kji
ijkY si
12=N
deci 231242170
2
=−=TSS
a. Pentru testarea efectelor de secventa vom calcula ( )∑ ••••• −=kji
k YYSS,,
2
α .
Trebuie avut in vedere ca sumarea se face dupa toti indicii de sumare, respectiv dupa 2,1=j ; 2,1=k si kni ,1= , deci nu este corect sa se calculeze:
( ) ( ) ( ) ( ) 25,35,45,35,2 222
2
2
1 =−+−=−+−= •••••••••• YYYYSSα ⇒ fals Calculul corect:
ANOVA
140
( ) ( ) ( )
( ) ( ) (
( ) 12332
21*21*25,35,45,35,2 212
2
11
1
22
1 1
2
2
1 1
22
2
1 1
21
,,
2
21
21
=+=
=+=+=−+−=
=−+−=−=
∑∑∑∑
∑∑∑∑∑
= == =
= =•••••
= =••••••••••
nnnn
YYYYYYSS
j
n
ij
n
i
j
n
ij
n
ikjikα
)
Deci, 1212
121
=−
=−
=KSS
MS αα
b. Pentru testarea efectelor de perioada vom calcula ( )∑ ••••• −=kji
j YYSS,,
2
β .
In mod analog,
( ) ( ) ( )
( ) ( ) ( )( ) 325,0*6*25,025,335,33 221
2
1 1
22
1 1
2
2
1 1
22
2
1 1
21
,,
2
==−+=−+−=
=−+−=−=
∑∑∑∑
∑∑∑∑∑
= == =
= =•••••
= =••••••••••
nn
YYYYYYSS
k
n
ik
n
i
k
n
ik
n
ikjik
kk
kk
β
Deci, 312
31
=−
=−
=JSS
MS ββ
c. Pentru testarea efectelor de interactiune vom calcula ( )∑ •••••••• +−−=
kjijkjk YYYYSS
,,
2γ
j k ( )∑ •••••••• +−−=
kjijkjk YYYYSS
,,
2γ
1 1 ( ) ( ) 05,335,22 221111 =+−−=+−−= •••••••• YYYY
2 1 ( ) ( ) 05,345,23 222121 =+−−=+−−= •••••••• YYYY
1 2 ( ) ( ) 05,335,44 221212 =+−−=+−−= •••••••• YYYY
2 2 ( ) ( ) 05,345,45 222222 =+−−=+−−= •••••••• YYYY
0=γSS
Deci, ( )( ) 011=
−−=
KJSS
MS γγ
d. Pentru determinarea lui nu vom pleca de la definitia sa RSS
( 2∑ •−= jkijkR YYSS ) deoarece am avea prea multe sume de calculat (9
sume) ci vom tine cont de uratoarea relatie: γβα SSSSSSSSSS TR −−−=
ANOVA
141
Inlocuind in formula precedenta obtinem: 8031223 =−−−=RSS ceea ce
implica ( ) ( ) 188
13*2*28
1==
−=
−=
IJKSS
MS RR
Vom testa ipoteza
0
: 0 1: : 0 1
: 0 1 1
A k
B j
AB jk
H unde k KH H unde j J
H unde j J si k K
αβ
γ
⎧ = ≤ ≤⎪ = ≤ ≤⎨⎪ = ≤ ≤ ≤ ≤⎩
vs : 0alternativaH cel putin un factor este diferit deaplicand testul Fischer astfel: • Pentru efectul de secventa testul Fischer este:
FMSMS
R
=α ⇒ 121
12==F ; 32,595,0;8,1 =f
Deoarece 1232,5 ⟨ se respinge ipoteza 2,1,0:0 =∀= kH kα ⇒ avem efect de secventa • Pentru efectul de perioada testul Fischer este:
FMSMS
R
=β ⇒ 313==F ; 32,595,0;8,1 =f
Deoarece nu se respinge ipoteza 32,53 ⟨ 2,1,0:0 =∀= jH jβ ⇒nu avem efect de perioada
• Pentru interactiuni:
FMSMS
R
=γ ⇒ 010==F ; 32,595,0;8,1 =f
Deoarece nu se respinge ipoteza32,50 ⟨ 2,1;2,1,0:0 =∀=∀= kjH jkγ
ANOVA
142
⇒nu avem efect datorat interactiunilor
Modelul mult mai adevarat este cel care foloseste in loc de
, fiecare subiect fiind in acest fel propriul sau martor. raMS int
RMS
ra
rara
SSMS
int
intint ν
=
unde :
• ∑∑∑∑ •••• +−−=k
kki
k
jk
kjiijkra n
YYn
YYSS
22
222
,,
2int
• 221int −+= nnraν In cazul nostru avem :
170465543432321 222222222222
,,
2 =+++++++++++=∑kji
ijkY
321 == nn j k
∑ •
k
jk
nY 2
1 1 ( ) 123
3632131 2 ==++=
2 1 ( ) 27381432
31 2 ==++=
1 2 ( ) 483
14454331 2 ==++=
2 2 ( ) 753
22546531 2 ==++=
∑ =+++=• 162754827122
k
jk
nY
ANOVA
143
( ) ( ) ( ) ( ) ( ) ( )
1642
328281
2100
264
249
225
29
245
264
253
243
232
221
2
2222222
==+++++=
=+
++
++
++
++
++
=∑ •kiY
( ) ( )
1596
9546
7296
2253*2
4655433*2
432321222
22
2
22
1
21
2
==+=
=+++++
++++++
=+= ∑∑∑ ••••••
nY
nY
nY
k
k
Deci, 3159164162170int =+−−=raSS ⇒ 75,043
2333
int ==−+
=raMS
In aceasta situatie vom obtine urmatoarele teste Fischer : • Pentru efectul de secventa testul Fischer este:
FMSMS
ra
=int
α ⇒ 1675,0
12==F ; 71,795,0;4,1 =f
Deoarece 1671,7 ⟨ se respinge ipoteza 2,1,0:0 =∀= kH kα ⇒ avem efect de secventa
• Pentru efectul de perioada testul Fischer este:
FMSMS
ra
=int
β ⇒ 475,03
==F ; 71,795,0;4,1 =f
Deoarece nu se respinge ipoteza 71,74 ⟨ 2,1,0:0 =∀= jH jβ ⇒nu avem efect de perioada
ANOVA
144
• Pentru interactiuni:
FMSMS
ra
=int
γ ⇒ 075,00
==F ; 71,795,0;4,1 =f
Deoarece nu se respinge ipoteza 71,70 ⟨ 2,1;2,1,0:0 =∀=∀= kjH jkγ ⇒nu avem efect datorat interactiunilor
Facem observatia ca efectul de interactiune corespunde efectului medicamentului. 7. Consideram urmatoarele puncte de pe dreapta 12 += xy
ix iy 0 1 1 3 2 5 3 7
ANOVA
145
Sa se calculeze r si b . Indicatie:
ix iy x y xxi − yyi − ( )( )yyxx ii −− ( )2xxi −
0 1 -1,5 -3 4,5 2,25 1 3 -0,5 -1 0,5 0,25 2 5 0,5 1 0,5 0,25 3 7
1,5
4 1,5 3 4,5 2,25
8. Consideram in continuare ca punctele iy sunt afectate de erori :
ix iy 0 1 1 2 2 5 3 6
Sa se calculeze r si b 9. Sa se testeze daca datele de la exercitiul anterior sunt corelate dar nu sunt corelate linear.
ANOVA
146
Estimarea bioechivalentei a doua medicamente
147
ESTIMAREA BIOECHIVALENTEI A DOUA MEDICAMENTE
Una din aplicatiile cele mai importante ale metodei de studiu clinic incrucisat priveste studiile de bioechivalenta care urmaresc testarea ipotezei privind bioechivalenta unui medicament generic cu medicamentul inovator.
Definitia cantitativa a bioechivalentei, aprobata prin lege federala in SUA si adoptata de toate autoritatile de reglemetare a medicamentului in lume, este dupa cum urmeaza:
Doua medicamente sunt bioechivalente daca intervaul de incredere 90% pentru raportul mediilor parametrilor farmacocinetici esentiali (aria de sub curba si concentratia maxima ) se incadreaza in intervalul ( ) .
∞−0AUC maxC25,1,8,0
0,8 1,25 0,90T
R
P μμ
⎛ ⎞⟨ ⟨ ≥⎜ ⎟
⎝ ⎠
Este de retinut faptul ca se recomanda de regula, analiza datelor dupa logaritmare considerandu-se ca acestea urmeaza mai curand o distributie lognormala decat o distributie normala.
Metoda celor “doua teste unilaterale”, Schuirmann Ipoteza nula este ipoteza compusa din doua ipoteze simple, testul de
bioechivalenta descompunandu-se de fapt in doua teste unilaterale: IRTH θμμ ≤−:01 vs 1 :a T RH Iμ μ θ− ⟩ si
SRTH θμμ ≥−:02 vs SRTaH θμμ ⟨−:2 O biodisponibilitate mai mare a produsului testat decat cel de
referinta, implica posibilitatea unor efecte secundare sau toxice crescute si o “siguranta” mai mica. Bioechivalenta implica o echivalenta atat in ceea ce priveste efectul cat si in ceea ce priveste siguranta.
Daca vrem sa testam ipotezele enuntate la un nivel de semnificatie α , in conditiile in care presupunem ca datele sunt normal repartizate, putem aplica testul t. Echivalenta este stabilita atunci cand
( )( )1 2
1 2
, 21 1ˆ
T R II
d
Y YT t n n −
( )
n n
θα
σ
− −= ⟩ +
+si ( )1 2
1 2
, 21 1ˆ
T R SS
d
Y Yn n
n n
θα
σ
− −T t⟨ − + −
+ =
Estimarea bioechivalentei a doua medicamente
148
2
2d
MSEσ =
Estimarea bioechivalentei folosind testul non – parametric Wilcoxon, pornind de la un model care ia in considerare si efectele de perioada
Fie, folosind notatiile standard de la modelul incrucisat cu doua
perioade si doua secvente, diferenta intre formularile testate
RT μμθ −= .
Consideram testarea bioechivalentei folosind doua teste unilaterale:
LLLAL undeHvsH θθθθθ −=⟩≤ ∗∗∗ 0:0: 101 si
UUUAU undeHvsH θθθθθ −=⟨≥ ∗∗∗ 0:0: 202
In vederea testarii ipotezelor enuntate consideram combinatia (“contrastul”):
⎩⎨⎧ =−
=2sec;
1sec,;ventadinsubiectiipentrud
ventadinsubiectiipentruULhdb
ik
hikhik
θ,
unde: • kni ,1= , 2,1=k , reprezinta numarul de subiecti in cele doua secvente
• 2
12 PPdik−
= este jumatate dintre diferentele intre cea de-a II a
perioada si prima perioada • UsauL dupa cum ne referim la compararea cu limita inferioara sau cea superioara a intervalului de acceptare a bioechivalentei
h =
Consideram suma rangurilor: i i
variabilele aleatoare
(∑==
1
11
n
iLiL bRR s) )(∑=
=
1
11
n
iUiU bRR s
( )2
111 +−=
nnRW LL si ( )
2111 +
−=nnRW UU .
Tragem concluzia ca produsele sunt bioechivalente atunci cand amandoua ipotezele i sunt respinse. 01H s 02H
Deci, relatia: ( )αwWU ≤ si ( )α−⟩ 1wWL
Estimarea bioechivalentei a doua medicamente
149
unde valorile ( )αw se gasesc in tabele, iar valorile complementare se calculeaza cu formula: ( ) ( )αα wnnw −=− 211 , implica biochivalenta celor doua produse.
Aplicatie : 1. Consideram ca intr-un experiment de bioechivalenta au terminat experimentul 7 voluntari (4 in secventa RT si 3 in secventa TR), iar concentratiile maxime (mg/l) au fost dupa cum urmeaza:
Secventa Subiecti P1 P2s1 3 4 s2 4 6 s3 5 5
1S RT
s4 4 5 s5 4 6 s6 5 5
2S TR
s7 6 5
Sa se verifice ipoteza privind bioechivalenta celor doua medicamente prin compararea intervalului de incredere 90% pentru raportul
mediilor R
T
μμ
cu limitele de acceptare.
Solutie:
P1 P2
ikd
kd•
2
1
•
•
−
−
d
d
k
ik
d
d
•−
−
2
⎟⎟⎠
⎞⎜⎜⎝
⎛
−
−
•k
ik
d
d ∑ ⎟
⎟⎠
⎞⎜⎜⎝
⎛
−
−
•
2
k
ik
d
d
2dS dS
3 4 0.5 0 04 6 1 0.5 0.255 5 0 -0.5 0.25
secv. 1 RT 4 5 0.5
0.5 0 0
0.5
P1 P2 4 6 1 0.83 0.695 5 0 -0.17 0.03
secv. 2 TR 6 5 -0.5
0.17
0.33
-0.67 0.45
1.17
0.33
0.6
41 =n 32 = 48.190.0;5; n ; =t ( )kikiik yyd 12*21
−=
Deci
Estimarea bioechivalentei a doua medicamente
150
( ) 5.02134*
21
11 ==−=d ; ( ) 12246*
21
21 ==−=d ;
( ) 02055*
21
31 ==−=d ; ( ) 5.02145*
21
41 ==−=d
( ) 12246*
21
12 ==−=d ; ( ) 02055*
21
22 ==−=d
( ) 5.02165*
21
32 −=−=−=d
k
iik
k n
dd
∑=•
1
413121111 n
ddddd
+++=• ; 5.0
45.0015.0
1 =+++
=•d
2
423222122 n
ddddd
+++=• ; 17.0
35.001
2 =−+
=•d
33.017.05.021 =−=− •• dd
( ) ( )221
1 2
2
22
2
112
1 2
−+
−+−=∑ ∑= =
••
nn
ddddS
n
i
n
iii
d ; 33.0234
17.15.02 =−+
+=dS ;
Putem verifica ca RT YYdd −=− •• 21 .
22211 •• +
=YYYR ; 66.4
23
5564
4543
=
+++
+++
=RY
21221 •• +
=YYYT ; 5
23
6544
5564
=
+++
+++
=TY
Observam ca 2133.066.45 •• −==−=− ddYY RT
2190.0;2
90 11**21 nn
StYYIC dnnRTS +−−= −+ ;
33.067.033.076.0*6.0*48.133.090 −=−=−=SIC
2190.0;2
90 11**21 nn
StYYIC dnnRTD ++−= −+ ;
167.033.076.0*6.0*48.133.090 =+=+=DIC
Estimarea bioechivalentei a doua medicamente
151
Prin definitie avem RR F+= μμ ; TT F+= μμ si deci
RTRT FF −=− μμ (in ipoteza absentei efectelor reziduale). Deci, ( ) 90.09090 =⟨−⟨ DRTS ICICP μμ
( )1;33.0−⊂− RT μμ ; ⎟⎠⎞
⎜⎝⎛−⊂
−66.41,
66.433.0
R
RT
μμμ
;
( )21.0;07.0−⊂−
R
RT
μμμ
; ( ) ( 25.1;8.021.1;93.0 ⊂⊂R
T
μμ )
Deoarece intervalul de incredere 90% pentru raportul mediilor R
T
μμ
este inclus in intervalul de acceptare a ipotezei privind bioechivalenta rezulta ca cele doua medicamente sunt echivalente. ( 25.1;8.0 )
2. Testarea bioechivalentei pe datele de mai sus, logaritmate. Solutie:
P1 P2
ikd
kd•
2
1
•
•
−
−
d
d
k
ik
d
d
•−
−
2
⎟⎟⎠
⎞⎜⎜⎝
⎛
−
−
•k
ik
d
d ∑ ⎟
⎟⎠
⎞⎜⎜⎝
⎛
−
−
•
2
k
ik
d
d
1.1 1.39 0.14 0.03 0.00111.39 1.79 0.20 0.09 0.00861.61 1.61 0 -0.11 0.0121
secv. 1 RT 1.39 1.61 0.11
0.11 0 0
0.02
P1 P2 1.39 1.79 0.20 0.16 0.02651.61 1.61 0 -0.04 0.0016
secv. 2 TR 1.79 1.61
-0.09
0.04
0.08
-0.13 0.0172
0.05
2 0,01dS = ⇒ 0,12dS =
52.12
67.137.12
361.161.179.1
439.161.139.11.1
=+
=
+++
+++
=RY
06.014.008.076.0*12.0*48.108.0 −=−=−=−− errYY RT 22.014.008.076.0*12.0*48.108.0 =+=+=+− errYY RT
( )22.0;06.0lnln −⊂− RT μμ
Estimarea bioechivalentei a doua medicamente
152
( )22.0;06.0ln −⊂R
T
μμ
, ( )22.006.0 ; eeR
T −⊂μμ
, ( )24.1;94.0⊂R
T
μμ
Concluzie:
Produsele sunt bioechivalente, intervalul de incredere 90% fiind inclus in intervalul (0.8, 1.25). 3. Fiind date rezultatele de mai jos, obtinute intr-un studiu de bioechivalenta pilot sa se testeze bioechivalenta.
PI PII
1 3 2 5
S1 RT
4 2
2 3 S2 TR 1 4
a) Sa se calculeze intervalul de incredere 90% pentru raportul T
R
μμ
PI PII ikd 1di ik kd d− i ( )2
ik kd d− i ( )2
ik kd d−∑ i
1 3 1 0,5 0,25 2 5 1,5 1 1
S1 RT
4 2 -1
0,5
-1,5 2,25
3,5
2di
2 3 0,5 -0,5 0,25 S2 TR 1 4 1,5
1 0,5 0,25
0,5
2 3,5 0,5 43 2 2 3dS +
= =+ − 1 21 ; 2 5;0,95 2,35n nα− + − t t = =
1 2 1 21 ; 2 1 ; 21 2 1 2
1 1 1 1,T R T RT R n n d n n dY Y t S Y Y t S
n n n nα αμ μ ∗ ∗ ∗ ∗− + − − + −
⎡ ⎤− ∈ − − + − + +⎢ ⎥
⎣ ⎦
[ ]0,5 1 2,35*1,05 ; 0,5 1 2,35*1,05T Rμ μ− ∈ − − − +
[ ]2,97 ;1,97T Rμ μ− ∈ − impartim la
1 2 4 3 4353 2 3
2 12R∗
+ + ++
= = =
Estimarea bioechivalentei a doua medicamente
153
[1 0,99 ; 0,66T
R
]μμ
− ∈ − [ ]0,01;1,66T
R
μμ
∈
Concluzie: Produsele nu sunt bioechivalente. b) Folosind testul “Schuirman” sa se verifice bioechivalenta celor doua formulari
1 21 ; 2
1 2
1 1T R L
L n n
d
Y YT tS
n n
αθ∗ ∗
− + −
− −= ⟩
+ ;
1 2; 2
1 2
1 1T R U
U n n
d
Y Y
Sn n
αθ∗ ∗
T t + −
− −= ⟨
+
L
;
20%* 0.6L Rθ ∗= − = − 20%* 0.6U Rθ ∗= = Bioechivalenta:
1 2 1 2; 2 1 ; 2U n n n nT t t Tα α+ − − + −⟨ ⟨ ⟨ , 29 35 0,6 0,112 12 0,09
1,054 1 13 3 2
LT− +
= =+
=
Deoarece nu avem produsele nu sunt bioechivalente. 5;0.95LT t⟩ c) Verificati ipoteza privind “egalitatea efectelor de formulare”
T RF F= PI PII ikd
1di ik kd d− i ( )2
ik kd d− i ( )2
ik kd d−∑ i
1 3 1 0,5 0,25 2 5 1,5 1 1
S1 RT
4 2 -1
0,5
-1,5 2,25
3,5
2di
2 3 0,5 -0,5 0,25 S2 TR 1 4 1,5
1 0,5 0,25
0,5
Estimarea bioechivalentei a doua medicamente
154
2 3,5 0,5 43 2 2 3dS +
=+ −
= 0,5 1 0,5 0, 474 1 1 4 5* *3 3 2 3 6
T − −= = =
+−
Concluzie: Deoarece
1 21 ; 2 3;0,95 2,35n nt tα− + − = = , formularile sunt “egale”
d) Sa se testeze bioechivalenta folosind teste neparametrice
I. Testul Mann – Whitney – Wilcoxon de rang1
PI PII ikd ikL ik Lb d θ= − ( )ikLR b ikU ik Ub d θ= − ( )ikUR b 1 3 1 1,6 4 0,4 2 2 5 1,5 2,1 5 0,9 4
S1 RT
4 2 -1 -0,4 1 -1,6 1 ikL ikb d= ikU ikb d=
2 3 0,5 1,5 2 0,5 3 S2 TR 1 4 1,5 1,5 3 1,5 5
1 2 4 3 4353 2 3
2 12R∗
+ + ++
= = =
=
=
20%* 0.6L Rθ ∗= − = − 20%* 0.6U Rθ ∗= =
( )1
1
1 4 5 10n
L ikLi
R R b=
= = + +∑
( )1
12 4 1 7
n
U ikUi
R R b=
= = + +∑( )1 1 1 3*410 4
2 2L L
n nW R
+= − = − =
( )1 1 1 3*47 12 2U U
n nW R
+= − = − =
3;2;0.05 0w = 3;2;0.95 1 2 6w n n wα= − =
1 D.Hauschke, V.W.Steinijans, E.Diletti, A distribution – free procedure for the statistical analysis of bioequivalence studies, International Journal oh Clinical Pharmacology, Therapy and Toxicology, vol 28 no 2 – 1990 (72-78)
Estimarea bioechivalentei a doua medicamente
155
LBioechivalenta: 1 2 1 2; ; ; ;1U n n n nW w w Wα α−⟨ ⟨ ⟨
Concluzie: Produsele nu sunt bioechivalente.
II. Construiti un interval de incredere 90% pentru raportul T
R
μμ
in
ipoteza ca nu avem nici efecte carry – over si nici efecte de perioada2
R T T/R 1 2 3 4 51 3 3,0 1 3,0 2 5 2,5 2 2,7 2,5 4 2 0,5 3 1,2 1,1 0,5 3 2 0,7 4 1,4 1,3 0,6 0,7 4 1 0,3 5 0,9 0,8 0,4 0,4 0,3
0,3; 0,4; 0,4; 0,5; 0,6; 0,7; 0,8; 0,9; 1,1; 1,2; 1,3; 1,4; 2,5; 2,7; 3,0 Intervalul de incredere: 0,4 – 2,7 Concluzie: Produsele nu sunt bioechivalente. 2 V.W.Steinijans, E.Diletti, Statistical analysis of biovailability studies: parametric and nonparametric confidence intervals, Eur. J. clin. Pharmacol 24, 1983, p. 127-136
Estimarea bioechivalentei a doua medicamente
156
Teste statistice de discordanta
157
TESTE STATISTICE DE DISCORDANTA
Problema valorilor discordante este extrem de complexa, ea fiind mai mult o problema de analiza a structurii si conditiilor intre datele experimentale si numai in secundar o problema matematica.
Ca metoda de matematica in esenta se folosesc doua tipuri de teste: • « teste de tip Dixon » care compara distanta intre valoarea « discordanta » si celelalte valori cu distantele intre aceste valori ; • teste de tip t care se bazeaza pe tendinta valorilor de a se acumula in jurul valorilor medii.
Consideram in continuare aplicarea celor doua tipuri de metode in cazul unui sir de valori pe care le consideram mai mult sau mai putin « normal » distribuite. Aplicatii: 1. Folosind testul Dixon, sa se determine valorile aberante din urmatorul sir de valori:
ix 1 2 3 4 5 10
0
2
4
6
8
10
12
1 2 3 4 5 6
Solutie :
Se calculeaza 555,095
110510
1
110 ==
−−
=−−
= −
xxxx
rn
nn .
Conform Criteriului Dixon pentru respingerea valorilor aberante pentru si un nivel de semnificatie 6=n 05,0=α obtinem valoarea 0,56 ceea ce inseamna ca orice valoare mai mare de 0,56 este o valoare aberanta.
Valoarea obtinuta de noi de 0,555 este frontiera domeniului.
Teste statistice de discordanta
158
2. Pentru exercitiul precedent sa se determine valorile aberante folosind testul t. Solutie :
Vom considera variabila aleatoare s
xxT n
n−
= care este distribuita
Student cu grade de libertate. n
Avem : 16,46
1054321=
+++++== ∑
nx
x i si
( )
( ) ( ) ( ) ( ) ( ) ( )
16,1016
16,41016,4516,4416,4316,4216,411
222222
2
2
=
=−
−+−+−+−+−+−=
=−
−= ∑
nxx
s i
Obtinem astfel 18,3=s si inlocuind in formula de mai sus avem
83,118,388,5
6 ==T .
Deoarece conform tabelelor distributiei Student avem deci punctul este “normal”.
94,195,0;6 =t94,183,1 ⟨
3. Sa se determine valorile aberante din urmatorul sir de valori:
ix 1 2 3 4 5 10 12
0
2
4
6
8
10
12
14
1 2 3 4 5 6 7
Solutie : • Folosind testul Dixon, in mod similar exercitiului 1 avem :
Teste statistice de discordanta
159
18,0112
1121012
1
110 ==
−−
=−−
= −
xxxx
rn
nn .
Conform Criteriului Dixon pentru respingerea valorilor aberante(Anexa VII) pentru 7=n si un nivel de semnificatie 05,0=α obtinem valoarea 0,507 ceea ce inseamna ca valoare 127 =x este o valoare normala fiind mai mica decat 0,507.
In acest caz observam ca valoarea anormala este 106 =x
• Folosind testul t avem variabila aleatoare s
xxT n
n−
= unde :
28,57
121054321=
++++++== ∑
nx
x i si
( )20,422,17
1
2
2 =⇒=−
−= ∑ s
nxx
s i ; 90,195,0;7 =t
Obtinem 60,120,4
28,5127 =
−=T .
Deoarece 90,160,1 ⟨ punctul este normal. 4. Sa se determine valorile aberante din urmatorul sir de valori:
ix 1 2 3 3 3 4 4 4 5 10 12
0
2
4
6
8
10
12
14
1 2 3 4 5 6 7 8 9 10 11
Solutie :
Deoarece sunt 11 valori, Dixon schimba regula de testare :
Teste statistice de discordanta
160
7,0107
212512
2
221 ==
−−
=−−
= −
xxxx
rn
nn
Conform criteriului Dixon pentru respingerea valorilor aberante, pentru un prag 05,0=α avem valoarea 0,576, deci valoare este o valoare aberanta.
1211 =x
5. Consideram spre exemplu valorile concentratiilor maxime ale MELUOL, un metabolit activ al nicergolinei la 7 voluntari sanatosi. Pentru a lua o decizie cat mai corecta, vom examina atat valorile individuale, cat si raportul valorilor pentru un acelasi voluntar.
Mai mult decat atat, pentru a avea si o imagine a acestor valori si a raportului dintre ele, consideram reprezentarile valorilor pentru medicamentul de referinta (R) si pentru cel testat (T) precum si a raporturilor T/R si a „dependentei” T ( R ) ( care, daca valorile s-ar corela perfect, ar trebui sa fie o dreapta). Subject
maxTC ( )/ng ml max RC ( )/ng ml T/R 1 60 50 1,2 2 8 7 1,1 3 10 20 0,5 4 4 3 1,3 5 30 22 1,4 6 11 15 0,7 9 17 6 2,8
Mean 20,5 19,5 1,1 Stdev 19,5 16,0 0,7
CMAX,T (ng/ml)
0
10
20
30
40
50
60
70
4 2 3 6 9 5 1
CMAX,R (ng/ml)
0
10
20
30
40
50
60
9 4 2 3 6 5 1
T/R
0
0,5
1
1,5
2
2,5
3
3 6 2 1 4 5 9
Teste statistice de discordanta
161
Vom ordona crescator valorile:
Subject maxTC ( )/ng ml Subject
max RC ( )/ng ml Subject T/R 4 4 9 2,8 3 0,5 2 8 4 3 6 0,7 3 10 2 7 2 1,1 6 11 3 15 1 1,2 9 17 6 20 4 1,3 5 30 5 22 5 1,4 1 60 1 50 9 2,8
Observam dupa ordonare, ca valorile concentratiilor maxime pentru
voluntarul 1 sunt cele mai mari si, cel putin pentru T, mult mai mari (aparent discordante) decat pentru ceilalti voluntari.
Voluntarul 9 apare normal in contextul valorilor individuale pentru T si R dar raportul lor este cel mai mare, si probabil destul de indepartat de celelalte rapoarte. In continuare sunt redate rezultatele aplicarii testelor Dixon si Tn pentru R, T si T/R
Vom calcula testul Dixon conform criteriului Dixon de respingere a outliers: avem 7 voluntari ( 7k = ) si este suspecta valoarea cea mai mare,
deci testul folosit este 110
1
k k
k
X XrX X
−−=
−, avand pragul de 0,507 pentru un
nivel de semnificatie de 5% • pentru referinta:
1 7 610
1 7 1
50 22 28 0,5950 2,8 47, 2
k k
k
X X X XrX X X X
−− − −= = = = =
− − −
• pentru testat: 1 7 6
101 7 1
60 30 30 0,5460 4 56
k k
k
X X X XrX X X X
−− − −= = = = =
− − −
• pentru raportul T/R: 1 7 6
101 7 1
2,8 1, 4 1, 4 0,612,8 0,5 2,3
k k
k
X X X XrX X X X
−− − −= = = = =
− − −
Vom aplica testul unilateral 1k
kX XT
S−
−= , 7k = , cuantila : 6,0,90 1, 44t =
• pentru referinta:
Teste statistice de discordanta
162
2,8 3 ... 50 19,57
X + + += = ;
( )2
2
1iX X
Sk
−=
−∑
16S⇒ =
77 1
50 19,5 30,5 1,9116 16
X XTS−
− −= = = =
• pentru testat:
20,5X = ; ( )2
2
1iX X
Sk
−=
−∑
19,5S⇒ =
77 1
60 20,5 39,5 2,0319,5 19,5
X XTS−
− −= = = =
• pentru raportul T/R:
1,1X = ; ( )2
2
1iX X
Sk
−=
−∑
0,7S⇒ =
77 1
2,8 1,1 1,7 2, 430,7 0,7
X XTS−
− −= = = =
Aplicand testul , voluntarul 9 este de eliminat dat fiind raportul T/R discordant.
kT
Acelasi test arata insa ca voluntarul 1 este anormal din punct de vedere al celor doua valori, dar nu si din punct de vedere al raportului T/R.
Dat fiind ca decizia privind bioechivalenta este influentata doar de intravariabilitate si nu depinde de intravariabilitate, voluntarul 1 nu este de eliminat.
In final, decizia privind clasificarea unei valori drept discordante, depinde de analiza fenomenologica si mai putin de rezultatul testelor statistice.
Distributia binomiala
163
DISTRIBUTIA BINOMIALA Aplicatii: 1. Distribuţia gravitatii HTA (hipertensiune arteriala), apreciata prin numarul de medicamente necesar in tratament, în funcţie de boala renală primară, la 3 luni de la iniţierea programului de dializă cronică (când s-a considerat că pacienţii au ajuns la un echilibru din punct de vedere hemodinamic), a fost următoarea:
HTA Boala renala primara
non - HTA monoterapie biterapie > 3 medicamente
1 GNC glomerulonefrite cronice 5 5 15 25
2 NTI nefropatii tubulointerstiţiale 59 9 6 5
3 NI nefropatie ischemica 19 3 2 0
4 NH nefropatie hipertensiva 0 7 14 16
5 BP boala polichistica renala 18 6 8 4
a. Sa se veriffice ipoteza potrivit careia in cazul GNC, HTA nu depinde semnificativ in ceea ce priveste severitatea (distributia) de NH. b. Sa se compare severitatea (distributia intre clase de HT) intre GNC si BP Se considera 0,10α = Solutie: a. Ipotezele statistice sunt:
0 : intH nu exista diferente re cele doua boli : intAH exista diferente re cele doua boli
Comparam DISTRIBUTIILE folosind testul 2χ . Valorile observate ( ) sunt prezentate in tabelul urmator: iO
non HTA monoterapie biterapie peste 3 medicamente sum
GNC 5 5 15 25 50 NH 0 7 14 16 37 sum 5 12 29 41 87
Distributia binomiala
164
Valorile asteptate - expectation ( ) sunt prezentate in tabelul urmator:
iE
non HTA monoterapie biterapie peste 3 medicamente sum
GNC 550* 2,87
87=
1250* 6,9087
=2950 * 16,6787
=4150 * 23,5687
= 50
NH 537 * 2,13
87=
1237 * 5,1087
=2937 * 12,3387
=4137 * 17, 4487
= 37
sum 5 12 29 41 87 Testul statistic este:
( )( )( ) ( ) ( ) ( )2 2 2 2
2 232 1 4 1
5 2,87 0 2,13 16 17, 44... 5, 52
2,87 2,13 17, 44i i
i
O EE
χ χ− −
− − − −= = = + + + =∑
Pentru un nivel de semnificatie 0,05α = avem valoarea de prag pentru distributia 2χ cu 3 grade de libertate pentru aria de 0,95 de 7,85.
Concluzie: cu probabilitate mai mare de 95 % severitatea HT la
pacientii cu GNC este aceiasi cu cea la pacientii cu NH b. Ipotezele statistice sunt:
0 : intH nu exista diferente re cele doua boli : intAH exista diferente re cele doua boli
Comparam proportiile folosind testul 2χ . Valorile observate ( ) sunt prezentate in tabelul urmator: iO
non HTA monoterapie biterapie peste 3 medicamente sum
GNC 5 5 15 25 50 BP 18 6 8 4 36 sum 23 11 23 29 86
Distributia binomiala
165
Valorile asteptate - expectation ( ) sunt prezentate in tabelul urmator:
iE
non HTA monoterapie biterapie peste 3 medicamente sum GNC 13.37 6.40 13.37 16.86 50 NH 9.63 4.60 9.63 12.14 36 sum 23 11 23 29 86
Testul statistic este:
( )( )( ) ( ) ( ) ( )2 2 2 2
2 232 1 4 1
5 13, 37 18 9, 63 4 12,14... 23,11
13, 37 9, 63 12,14i i
i
O EE
χ χ− −
− − − −= = = + + + =∑
Pentru un nivel de semnificatie 0,05α = avem valoarea de prag pentru distributia 2χ cu 3 grade de libertate pentru aria de 0,95 de 7,85.
Concluzie: cu probabilitate de 95 % distributia severitatii la cele
doua categorii de bolnavi este diferita 2. In cadrul unor loturi de hemodializaţi s-a comparat procentul de pacienţi care au necesitat tratament cu stimulatori ai eritropoiezei, precum şi doza medie administrată obtinandu-se urmatoarele valori: Boala renala
primara Anemie
necesitand ASEDoză ASE sub 5000
Doze ASE 5000-10000
Doze ASE peste 10000
1. GNC 50 6 9 29 2. NTI 79 26 22 0 3. NI 24 6 12 3 4. NH 37 22 8 0 5. BP 36 9 3 0 6. NV 37 28 20 3
Sa se verifice ipoteza potrivit careia: a. Dozele cele mai mari de ASE au fost necesare la GNC, cele mai mici predomina la BP. b. In randul bolnavilor cu NV, cei cu NH au nevoie de doze mai mici Solutie:
Distributia binomiala
166
a. Vom testa ipotezele cu testul 2χ
ASE sub 5000
ASE 5000-10000
ASE peste 10000
TOTAL pacienti cu anemie
GNC 6 9 29 44 BP 9 3 0 12 NV 28 20 3 51 Total 43 32 32 107
0 :H distributia dozelor nu depinde de boala :AH distributia depinde de boala
Valorile observate ( ) sunt prezentate in tabelul urmator: iO
ASE sub 5000
ASE 5000-10000
ASE peste 10000
TOTAL pacienti cu anemie
GNC 6 9 29 44 BP 9 3 0 12 NV 28 20 3 51 Total 43 32 32 107
Valorile asteptate - expectation ( ) sunt prezentate in tabelul
urmator: iE
ASE sub 5000
ASE 5000-10000
ASE peste 10000
TOTAL pacienti cu anemie
GNC 43
44* 17, 68107
=32
44 * 13,16107
=32
44 * 13,16107
=44
BP 43
12* 4,82107
=32
12 * 3,59107
=32
12 * 3,59107
=12
NV 43
51* 20,50107
=32
51* 15, 25107
=32
51* 15, 25107
=51
Total 43 32 32 107
Testul statistic este:
( )( )( ) ( ) ( ) ( )2 2 2 2
2 243 1 3 1
6 17,68 9 4,82 3 15,25... 49,48
17,68 4,82 15, 25i i
i
O EE
χ χ− −
− − − −= = = + + + =∑
Pentru un nivel de semnificatie 10,0=α avem valoarea de prag pentru distributia 2χ cu patru grade de libertate pentru aria de 0,90 de 9,49.
Distributia binomiala
167
Deoarece 49,48 este mai mare decat 9,49, se accepta ipoteza AH ,
deci ca doza depinde de boala (diferente semnificative). b. in randul bolnavilor cu NV, cei cu NH au nevoie de doze mai mici
ASE sub 5000
ASE 5000-10000
ASE peste 10000
TOTAL pacienti cu anemie
NI 6 12 3 21 NH 22 8 0 30 Total 28 20 3 51
0 : iH NI si NH nu difera re elent
nt
0 : iH NI si NH difera re ele Comparam proportiile folosind testul 2χ .
Valorile observate ( ) sunt prezentate in tabelul urmator: iO
ASE sub 5000
ASE 5000-10000
ASE peste 10000
TOTAL pacienti cu anemie
NI 6 12 3 21 NH 22 8 0 30 Total 28 20 3 51
Valorile asteptate - expectation ( ) sunt prezentate in tabelul urmator:
iE
ASE sub 5000
ASE 5000-10000
ASE peste 10000
TOTAL pacienti cu anemie
NI 28
21* 11,5351
=20
21* 8, 2451
=3
21* 1, 2451
=21
NH 28
30 * 16, 4751
=20
30* 11, 7651
=3
30* 1, 7651
=30
Total 28 20 3 51
Testul statistic este:
Distributia binomiala
168
( )( )( ) ( ) ( ) ( )2 2 2 2
2 223 1 2 1
6 11,53 22 16, 47 0 1,76... 11,72
11,53 16, 47 1,76i i
i
O EE
χ χ− −
− − − −= = = + + + =∑
Pentru un nivel de semnificatie 10,0=α avem valoarea de prag pentru distributia 2χ cu doua grade de libertate pentru aria de 0,90 de 9,21.
Deoarece 11,72 este mai mare decat 9,21, se respinge ipoteza 0H ,
deci diferentele sunt semnificative. Concluzie : in randul bolnavilor cu nv, cei cu nh au nevoie de doze semnificativ mai mici 3. Aprecierea stării de nutriţie a fost realizată prin măsurarea albuminemiei serice (s-au luat mediile pe 6 luni) şi prin aplicarea chestionarului de evaluare globală subiectivă a stării de nutriţie (SGA = Subjective Global Assesment) la intervale de 1 an. S-au obtinut urmatoarele valori:
Boala renala primara
Malnutritie albumina
Alb 3-3,5 Alb 2,5-3 Alb < 2,5
1 GNC 16 6 8 2 2 NTI 12 8 3 1 3 NI 14 2 8 4 4 NH 10 4 4 2 5 BPI 6 4 2 0
Malnutritie Nr. pacienti
non Usoara SGA
Media – Severa SGA cu SGA Total
Procent
GNC 31 9 10 19 50 0.38 NTI 65 8 6 14 79 0.18 NI 5 4 15 19 24 0.79 NH 24 10 3 13 37 0.35 BP 29 6 1 7 36 0.19
Sa se verifice ipoteza ca: a. “distributiile“ non-malnutritie, SGA usoara, SGA medie sau severa difera semnificativ intre grupele de boli
Distributia binomiala
169
ntnt
b. Din punct de vedere al albuminei serice - ca marker al malnutritiei – malnutritia este mai frecventa si mai severa la NI . Solutie:
0 : iH distributiile nu difera re ele
0 : iH distributiile difera re ele a. Comparam distributiile folosind testul 2χ .
Valorile observate ( ) sunt prezentate in tabelul urmator: iO
non Malnutritie
Usoara SGA
Media - Severa SGA sum
GNC 31 9 10 50NTI 65 8 6 79NI 5 4 15 24NH 24 10 3 37BP 29 6 1 36sum 154 37 35 226
Valorile asteptate - expectation ( ) sunt prezentate in tabelul urmator:
iE
non MalnutritieUsoara SGA Media - Severa SGA sum
GNC 154
50* 34,07226
=37
50* 8,19226
=35
50 * 7, 74226
=50
NTI 154
79 * 53,83226
=37
79 * 12,93226
=35
79 * 12, 23226
=79
NI 154
24 * 16,35226
=37
24* 3,93226
=35
24* 3,72226
=24
NH 154
37 * 25, 21226
=37
37 * 6, 06226
=35
37 * 5, 73226
=37
BP 154
36 * 24,53226
=37
36 * 5,89226
=35
36 * 5,58226
=36
sum 154 37 35 226 Testul statistic este:
( )( )( ) ( ) ( ) ( ) ( )2 2 2 2
2 283 1 5 1
31 34,07 65 53,83 3 5,73 1 5,58...
34,07 53,83 5,73 5,5859,02
i i
i
O EE
χ χ− −
− − − − −= = = + + + + =
=
∑2
Pentru un nivel de semnificatie 0,05α = avem valoarea de prag
pentru distributia 2χ cu 8 grade de libertate pentru aria de 0,95 de 15,51.
Distributia binomiala
170
Deoarece 59,02 este mai mare decat 15,51, se respinge ipoteza
egalitatii.
b. Comparam proportiile folosind testul 2χ . Valorile observate ( ) sunt prezentate in tabelul urmator: iO
non Malnutritie
Albumina 3 - 3,5
Albumina 2,5 - 3
Albumina sub 2,5 sum
GNC 34 6 8 2 50NTI 67 8 3 1 79NI 10 2 8 4 24NH 27 4 4 2 37BP 30 4 2 0 36sum 168 24 25 9 226
Valorile asteptate - expectation ( ) sunt prezentate in tabelul urmator:
iE
non MalnutritieAlbumina 3 - 3,5
Albumina 2,5 - 3
Albumina sub 2,5 sum
GNC 168
50 * 37,17226
=24
50* 5,31226
=25
50* 5,53226
=9
50* 1,99226
=50
NTI 168
79 * 58, 73226
=24
79 * 8,39226
=25
79 * 8, 74226
=9
79* 3,15226
=79
NI 168
24 * 17,84226
=24
24* 2,55226
=25
24 * 2, 65226
=9
24* 0,96226
=24
NH 168
37 * 27,50226
=24
37 * 3,93226
=25
37 * 4, 09226
=9
37 * 1, 47226
=37
BP 168
36* 26, 76226
=24
36* 3,82226
=25
36* 3,98226
=9
36* 1, 43226
=36
sum 168 24 25 9 226Testul statistic este:
Distributia binomiala
171
( )( )( ) ( ) ( ) ( ) ( )2 2 2 2
2 2124 1 5 1
34 37,17 67 58,73 2 1,47 0 1, 43...
37,17 58,73 1,47 1,4334,92
i i
i
O EE
χ χ− −
− − − − −= = = + + + +
=
∑2
=
Pentru un nivel de semnificatie 0,05α = avem valoarea de prag pentru distributia 2χ cu 12 grade de libertate pentru aria de 0,95 de 21,03.
Deoarece 34,92 este mai mare decat 21,03, se respinge ipoteza
egalitatii, deci calitatea fizica difera intre cele doua boli.
4. Incidenta osteodistrofiei la pacienti sub dializa renala s-a determinat prin compararea incidenţei hiperparatiroidismului şi hiperfosfatemiei in diferite subgrupuri, obtinandu-se rezultatele urmatoare:
Boala renala
primara
PTH > valoare optima
PTH normal sau suboptim
PTH ≥ 800pg/ml
P>N P in limite
1 GNC 36 14 2 36 14 2 NTI 56 23 18 51 28 3 NI 17 7 0 15 9 4 NH 27 10 0 24 13 5 BPI 26 10 1 22 14
PTH = parathormon, are valoare optimă în jur de 200pg/ml Hiperparatiroidism = creşterea PTH peste valoarea optimă
Sa se verifice ipoteza statistica potrivit careia hiperparatiroidismul şi hiperfosfatemia au incidenţe comparabile în diferitele subloturi etiologice (nu diferă statistic) Solutie: Verificarea statistica a ipotezei: hiperparatiroidismul şi hiperfosfatemia au incidenţe comparabile în diferitele subloturi etiologice (nu diferă statistic) a.1. hiperparatiroidismul
0 : intH nu exista diferente re boli : intAH exista diferente re boli
Comparam proportiile folosind testul 2χ . Valorile observate ( ) sunt prezentate in tabelul urmator: iO
Distributia binomiala
172
PTH > valoare optima PTH normal sau suboptim total GNC 36 14 50 NTI 56 23 79 NI 17 7 24 NH 27 10 37 BP 26 10 36 sum 162 64 226
Valorile asteptate - expectation ( ) sunt prezentate in tabelul urmator:
iE
PTH > valoare optima PTH normal sau suboptim total
GNC 16250* 35,84226
= 6450* 14,16226
= 50
NTI 16279* 56,63226
= 6479* 22,37226
= 79
NI 16224* 17, 20226
= 6424* 6,80226
= 24
NH 16237* 26,52226
= 6437* 10, 48226
= 37
BP 16236* 25,81226
= 6436* 10,19226
= 36
sum 162 64 226 Testul statistic este:
( )( )( ) ( ) ( ) ( )2 2 2 2
2 242 1 5 1
36 35,84 56 56,63 10 10,19... 0,07
35,84 56,63 10,19i i
i
O EE
χ χ− −
− − − −= = = + + + =∑
Pentru un nivel de semnificatie 0,05α = avem valoarea de prag pentru distributia 2χ cu 4 grade de libertate pentru aria de 0,95 de 9,49.
Deci, cu o probabilitate mai mare de 95 % ipoteza ca hiperparatiroidismul are incidenţe comparabile în diferitele subloturi etiologice (nu diferă statistic) este adevarata
Distributia binomiala
173
hiperfosfatemia 0 : intH nu exista diferente re boli
: intAH exista diferente re boli Comparam proportiile folosind testul 2χ .
Valorile observate ( ) sunt prezentate in tabelul urmator: iO
P>N P in limite total GNC 36 14 50 NTI 51 28 79 NI 15 9 24 NH 24 13 37 BP 22 14 36 sum 148 78 226
Valorile asteptate - expectation ( ) sunt prezentate in tabelul urmator:
iE
P>N P in limite total
GNC 14850* 32,74226
= 7850* 17, 26
226=
50
NTI 14879* 51,73226
= 7879* 27, 27
226=
79
NI 14824* 15,72226
= 7824* 8, 28
226=
24
NH 14837* 24, 23226
= 7837* 12, 27
226=
37
BP 14836* 23,58226
= 7836* 12, 42
226=
36 sum 148 78 226
Testul statistic este:
( )( )( ) ( ) ( ) ( )2 2 2 2
2 242 1 5 1
36 32,74 51 51,73 14 12,42... 1,37
32,74 51,73 12, 42i i
i
O EE
χ χ− −
− − − −= = = + + + =∑
Pentru un nivel de semnificatie 0,05α = avem valoarea de prag pentru distributia 2χ cu 4 grade de libertate pentru aria de 0,95 de 9,49.
Distributia binomiala
174
Deci, cu o probabilitate mai mare de 95 % ipoteza ca
hiperparatiroidismul are incidenţe comparabile în diferitele subloturi etiologice (nu diferă statistic) este adevarata
Puterea testului. Calculul numarului de voluntari
175
PUTEREA TESTULUI. CALCULUL NUMARULUI DE VOLUNTARI Aplicatii: 1. Sa se stabileasca numarului de subiecti necesari pentru testarea bioechivalentei a doua forme farmaceutice de supozitoare cu MELOXICAM. Dintr-un studiu pilot avem ca estimare a intravariabilitatii pentru AUC si maxC , 20%CV = si respectiv 30%.CV = Conform reglementarilor avem: • 0,10α = • diferenta semnificativa clinic 20%*μΔ = atat pentru maxC cat si AUC Solutie:
I. Se considera: secventele egale 1 2n n n= = puterea testului 80%, deci 0, 20β =
Formula cea mai simpla de aplicat, dar mai putin precisa este cea de la compararea a doua medii cu testul T. Pentru fiecare secventa avem:
22
2 22 2 22
2 22 22 2 2
ˆ2ˆ ˆ
22
*100
e
d e
z zCVn z z z z z z
α β
α β α β α β
σσ σ μ
μ μ
⎛ ⎞+⎜ ⎟⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎝ ⎠= + = = + = +⎜ ⎟ ⎜ ⎟ ⎜ ⎟Δ Δ ⎛ ⎞ ⎛ ⎞Δ Δ⎝ ⎠ ⎝ ⎠ ⎝ ⎠
⎜ ⎟ ⎜ ⎟⎝ ⎠ ⎝ ⎠
2
22
2e
dσσ = 0.05
2
1,64z zα = = − 0,20 0,84z zβ = = −
Se alege CV valoarea cea mai mare, 30%. Pentru fiecare secventa vom avea:
( )2
2 301,64 0,84 13,84 1420
n ⎛ ⎞= − − = ≈⎜ ⎟⎝ ⎠
Deci, numarul total de subiecti trebuie sa fie de cel putin 28. II. Daca producatorul considera ca riscul 0, 20β = este prea mare si
doreste o putere de 0,90 , deci 0,10β = , n devine:
( ) ( ) ( )2
2 2 20,05 0,10
30 1,64 1, 28 1,5 19,1820
n z z ⎛ ⎞= + = + =⎜ ⎟⎝ ⎠
Deci, pentru studiu trebuiesc luati circa 40 de subiecti, ceea ce este deja cam mult din punct de vedere al comisiilor de etica.
Puterea testului. Calculul numarului de voluntari
176
III. Formula de mai sus poate fi inlocuita cu una mai precisa bazata pe faptul ca testarea bioechivalentei foloseste testul T si nu testul Z.
In acest caz, numarul de subiecti in fiecare secventa este dat de: 2 2
2 2;2 2;2
nn
CVn t tα β−−
⎛ ⎞ ⎛ ⎞≥ +⎜ ⎟ ⎜ ⎟Δ⎝ ⎠⎝ ⎠
In cazul in care 0,10α = si 0, 20β = , avem:
( )2
22 2;0.05 2 2;0,20
3020n nn t t− −
⎛ ⎞≥ + ⎜ ⎟⎝ ⎠
Problema este ca n apare in ambii membri ai ecuatiei. Incercam intai cu valoarea obtinuta plecand de la testul Z: si
avem: 14n =
26; 0,05 1,71t = − si 26; 0,20 0,856t = −
( ) ( )2 214 1,71 0,856 1,5≥ − − ⇒ 14,81≥ 14 si deci rezultatul nu difera semnificativ de cel obtinut anterior. IV. Formulele anterioare au fost deduse pornind de la bioechivalenta tratata ca un test de egalitate. Cand aplicam insa un test bazat pe intervalul de incredere , echivalente cu cele doua teste Schuirmann, formula se modifica prin aceea ca
2 2;2
nt α
− trebuie inlocuit cu 2 2;nt α− si 2 2;nt β− trebuie
inlocuit cu 2 2;
2n
t β−
obtinandu-se:
2 2
2 2; 2 2;2
n n
CVn t tα β−−
⎛ ⎞ ⎛ ⎞≥ +⎜ ⎟ ⎜ ⎟Δ⎝ ⎠⎝ ⎠
Considerand tot 0,10α = si 0, 20β = , avem:
( )2
22 2;0,10 2 2;0,10
3020n nn t t− −
⎛ ⎞≥ + ⎜ ⎟⎝ ⎠
Incercam intai cu valoarea obtinuta plecand de la testul Z: si avem:
14n =
26; 0,10 1,32t = − ( ) ( )2 214 1,32 1,32 1,5 14 17,14⇒ ≥ − − ⇒ ≥ Incercam cu 16n = si avem:
30; 0,10 1,31t = − ( ) ( )2 216 1,31 1,31 1,5 16 15, 44⇒ ≥ − − ⇒ ≥ Deci, numarul de subiecti trebuie sa fie de 16 pe fiecare secventa.
Puterea testului. Calculul numarului de voluntari
177
Comparand cu formula pentru testarea ipotezei punctuale, cifra difera fiind mai mare. Deci, formula anterioara duce la o subestimare a numarului necesar de subiecti.
V. Atunci cand intre produse exista efectiv o diferenta θ , formula pentru calculul numarului de subiecti pornind de la ipotezele de interval este:
( ) ( )( )
22
2 2; 2 2; 2%n n
CVn t tα β
θ− −≥ +
Δ −
unde % 100*R
θθμ
=
Pentru 0,10α = si 0, 20β = % 10%θ = pornind de la 20n = , avem:
( ) ( )( )
( )2
2 238;0,10 38;0,20 2
3020 20 1,30 0,848 *9 20 41
20 10t t≥ + ⇒ ≥ + ⇒ ≥
−
Rezultatele fiind prea diferite vom lua in calcul 30n =
( ) ( )( )
( )2
2 258;0,10 58;0,20 2
3030 30 1,30 0,848 *9 30 41
20 10t t≥ + ⇒ ≥ + ⇒ ≥
−
In fapt pentru 2 2 3n 0− ≥ avem 2 2;nt zα α− ≈ deci termenul din dreapta nu se mai modifica si alegerea este practic 40n = .
Pentru intreg studiul numarul de subiecti este urias 80 pentru un studiu de bioechivalenta.
Puterea testului. Calculul numarului de voluntari
178
Studii epidemiologice
179
STUDII EPIDEMIOLOGICE. CALCULAREA RISCULUI RETROSPECTIV (ODDS RATIO)
Riscul din cauza expunerii ( )( )DPDP
RNE
E= se evalueaza intr-un studiu
prospectiv si este definit ca raportul dintre probabilitatea imbolnavirii celor expusi si probabilitatea imbolnavirii celor neexpusi
Dar, in case – study, noi nu expunem subiectii, ci consideram bolnavi deci eveniment produs este boala, si obtinem: ( )•DP
Riscul prospectiv (“odds ratio”) Consideram raportul “defectelor - odds ratio” OR care se obtine
intr-un studiu retrospectiv (case-study): Rapoartele odds sunt rapoartele intre proportia celor expusi si
proportia celor de neexpusi in populatia de bolnavi si respectiv acelasi raport in populatia de sanatosi. Spre exemplu se considera proportia intr-un lot de bolnavi de cancer pulmonar si proportia fumatorilor intr-un lot din intreaga populatia. Raportul acestor proportii, numit odds ratio, este o masura a riscului de imbolnavire al celor expusi.
)()()()(
)()()(
)(
EPNEPNEPEP
NEPEP
NEPEP
ORNDD
NDD
ND
ND
D
D
==
In exemplul nostru:
lnproportia fumatorilor in populatia de bo aviORproportia fumatorilor in populatia de sanatosi
=
In cazul bolilor rare ar trebui determinat numarul de imbolnaviri intr-un lot expus comparativ cu un lot neexpus pe perioade foarte lungi ceea ce este foarte scump si, in general, nu este fezabil datorita iesirii din studiu a foarte multi dintre subiecti.
In aceasta situatie insa, daca aproximam ca probabilitatea imbolnavirii este aproximativ zero ( ) 0≅DP ) si probabilitatea de neimbolnavire este aproape 1 ( ( ) 1≅NDP ), riscul obtinum retrospectiv OR este o estimare a riscului din cauza expunerii : ORR ≅
Consideram rezultate dintr-un studiu privind incidenta cancerelor de gura efectuat in Olanda 1 1 KP Schepman, PD Bezemer, EH van der Meij, LE Smeele, I van der Waal: Tobacco usage in relation to the anatomical site of oral leukoplakia, Oral Diseases 7, 25-27, 2001
Studii epidemiologice
180
Femei Fumătoare Nefumătoare Total Paciente cu Leucoplakie localizare mucoasă
obraji 6 5 11
Control (femei populaţie Olanda) 30.3 69.7 100 Total 36.3 74.7 111
Bărbaţi Fumători Nefumători Total
Pacienţi cu Leucoplakie localizare mucoasă obraji
11 1 12
Control (bărbaţi populaţie Olanda) 36.7 63.3 100 Aplicatie 1. Calculati riscul relativ retrospectiv ( OR ) si un interval de incredere pentru acest risc pentru cele doua populatii. Consideram notatia
uzuala a bc d
⎛ ⎞⎜ ⎟⎝ ⎠
a. Femei
Deci, a adcb bcd
= = ⇒OR 6*69,7 418, 2 2,765*30,3 151,5
OR = = =
Intervalul de incredere de 95% pentru ln este egal cu: OR
( ) 1 1 1 1ln 1,96ORa b c d
± + + +
Limitele inferioare si superioare ale lui ( )ORln sunt:
( ) ( ) 1 1 1 1ln ln 1,96LOR ORa b c d
= − + + + , limita inferioara (lower)
( ) ( ) 1 1 1 1ln ln 1,96UOR ORa b c d
= + + + + , limita superioara (upper)
Avem:
( ) ( ) 1 1 1 1ln ln 2,76 1,96 1,01 1, 26 0, 256 5 30,3 69,7LOR = − + + + = − = −
( ) ( ) 1 1 1 1ln ln 2,76 1,96 1,01 1, 26 2,076 5 30,3 69,7UOR = + + + + = + =
Intervalul de incredere in scala originala de risc relativ estimat este prin urmare dat de ( ) ( )[ ]UL OROR ee lnln ; Vom obtine un interval de incredere pentru riscul retrospectiv:
( ) ( )lnln 0,25 2,07; ;UL OROROR e e OR e e−⎡ ⎤ ⎡ ⎤∈ ⇒ ∈⎣ ⎦⎣ ⎦ ⇒ [ ]0,78 ; 7,93OR∈
Studii epidemiologice
181
b. Barbati Aplicand acelasi rationament pentru barbati obtinem:
11*63,3 696,3 18,971*36,7 36,7
adORbc
= = = =
( ) ( ) 1 1 1 1ln ln 18,97 1,96 2,94 2,09 0,8511 1 36,7 63,3LOR = − + + + = − =
( ) ( ) 1 1 1 1ln ln 18,97 1,96 2,94 2,09 5,0311 1 36,7 63,3UOR = + + + + = + =
Vom obtine un interval de incredere pentru riscul retrospectiv: [ ]0,85 5,03; 2,34 ;152,93OR e e OR⎡ ⎤∈ ⇒ ∈⎣ ⎦
Cand avem mai multe studii clinice epidemiologice, de exemplu
unul pe femei si unul pe barbati, in ipoteza ca nu exista diferente semnificative intre cele doua sexe in ceea ce priveste riscul unei anumite boli indus de un factor de risc dat, este natural sa reunim loturile si sa facem calculele pentru populatia reunita. c. Populatia reunita
In acest caz 17a = , 6b = , 67c = si 133d = 17*133 2261 5,626*67 402
adORbc
= = = =
( ) ( ) 1 1 1 1ln ln 5,62 1,96 1,73 0,98 0,7517 6 67 133LOR = − + + + = − =
( ) ( ) 1 1 1 1ln ln 5,62 1,96 1,73 0,98 2,7117 6 67 133UOR = + + + + = + =
Vom obtine un interval de incredere pentru riscul retrospectiv: [ ]0,75 2,71; 2,12 ;15,03OR e e OR⎡ ⎤∈ ⇒ ∈⎣ ⎦
Daca insa nu putem presupune acest lucru, o metoda alternativa de
calcul este metoda Mantel-Haenszel .Metoda Mantel-Haenszel este folosită pentru a estima „pooled odds ratio” din mai multe straturi sau mai multe studii similare:
Studii epidemiologice
182
2
12
1
ki i
i iMH
ki i
i i
a dn
ORb cn
=
=
⎛ ⎞⎜ ⎟⎝ ⎠=⎛ ⎞⎜ ⎟⎝ ⎠
∑
∑,
unde i i i in a b c d= + + + i
Strat / Studii Cazuri Control Total
Expusi 1a 1b 11n
Neexpusi 1c 1d 01n
1
Total 11m 01m 1n
......... ........................ ............ ............ ............. Expusi
ja jb 1 jn
Neexpusi jc jd 0 jn
j
Total 1 jm 0 jm jn
......... ........................ ............ ............ ............. Expusi
Ka Kb 1Kn Neexpusi
Kc Kd 0Kn
K
Total 1Km 0Km Kn
Dispersia lui ORMH se calculează conform ecuaţiei
( )( ) 112
1 11
12
1
* **ln
22
*
2
KKj j j j j j j jj j j j
j j j j jj j jMH
K KK j j j jj j
j jj jj j
Kj j j j
j j j
Kj j
j j
b c a d b c a da d a dn n n nn n
D ORa d b ca dn nn
b c b cn n
b cn
==
= ==
=
=
⎛ ⎞+ +++⎜ ⎟⎜ ⎟
⎝ ⎠= + +⎛ ⎞⎛ ⎞⎛ ⎞⎜ ⎟⎜ ⎟⎜ ⎟ ⎜ ⎟⎜ ⎟⎜ ⎟ ⎝ ⎠⎝ ⎠⎝ ⎠
+
+⎛ ⎞⎜ ⎟⎜ ⎟⎝ ⎠
∑∑
∑ ∑∑
∑
∑
Studii epidemiologice
183
Intervalul de încredere se poate obţine folosind ecuaţia:
( )( )2
exp logMH MHOR z D ORα
⎛ ⎞±⎜ ⎟⎝ ⎠
Aplicatie 2. Calculati riscul combinat al celor doua subpopulatii.
Vom aplica relatia 1
1
ki i
i iMH
ki i
i i
a dn
ORb cn
=
=
⎛ ⎞⎜ ⎟⎝=⎛ ⎞⎜ ⎟⎝ ⎠
∑
∑⎠ in care avem:
1 6a = 2 11a =
1 5b = 2 1b =
1 30,3c = 2 36,7c =
1 69,7d = 2 63,3d =
1 111n = 2 112n = In cazul nostru obtinem:
1 1 2 2
1 2
1 1 2 2
1 2
6*69.7 11*63.3111 112 5.95*30.3 1*36.7111 112
MH
a d a dn nOR b c b cn n
+ += =
++=
deci riscul la nivelul intregii populatii este de circa 6 ori mai mare in cazul fumatorilor decat in cazul nefumatorilor.
In cazul nostru dispersia pentru OR va fi:
( )( )1 1 1 1 2 2 2 2
1 1 2 22
1 1 2 2
1 2
* *ln
2MH
a d a d a d a dn n n nD OR
a d a dn n
+ ++
= +⎛ ⎞
+⎜ ⎟⎝ ⎠
1 1 1 1 2 2 2 2
1 1 2 2
1 1 2 2 1 1 2 2
1 2 1 2
* *
2
b c a d b c a dn n n n
a d a d b c b cn n n n
+ ++
+ +⎛ ⎞⎛ ⎞
⎟⎠
+ +⎜ ⎟⎜⎝ ⎠⎝
1 1 1 1 2 2 2 2
1 1 2 22
1 1 2 2
1 2
* *
2
b c b c b c b cn n n n
b c b cn n
+ ++
⇒⎛ ⎞
+⎜ ⎟⎝ ⎠
Studii epidemiologice
184
( )( ) 2
6*69,7 6 69,7 11*63,3 11 63,3* *111 111 112 112ln
6*69,7 11*63,32111 112
MHD OR
+ ++
= +⎛ ⎞+⎜ ⎟⎝ ⎠
5*30,3 6 69,7 1*36,7 11 63,3* *111 111 112 112
6*69,7 11*63,3 5*30,3 1*36,72111 112 111 112
+ ++
+ +⎛ ⎞⎛+ +⎜ ⎟⎜⎝ ⎠⎝
⎞⎟⎠
2
5*30,3 5 30,3 1*36,7 1 36,7* *111 111 112 112
5*30,3 1*36,72111 112
+ ++
+ ⇒⎛ ⎞+⎜ ⎟⎝ ⎠
( )( ) ( ) ( )( )22,57 4,12 0,93 0, 22ln
2 3,77 6, 22 1,36 0,332 3,77 6, 22MHD OR + +
= + ++ ++
( )20, 43 0,11
2 1,36 0,33+
+ ⇒+
Deci,
( )( ) 7 1,15 0,54ln 0,035 0,034 0,094 0,1632*100 2*10*1,69 2*2,85
MHD OR ≅ + + = + + =
deci, ( )( )ln 0,40MHD OR = ( )( )2
log 1,96*0,04 0,08MHz D ORα⇒ = =
Intervalul de încredere se poate obţine folosind ecuaţia:
( )( ) [ ]0,08 0,08
2
exp log 5,9* ;5,9* 5,46 ;6,39MH MHOR z D OR e eα−⎛ ⎞
⎡ ⎤± = =⎜ ⎟ ⎣ ⎦⎝ ⎠
Anexa I
185
Tabele pentru z
z 0 1 2 3 4 5 6 7 8 9 0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359 0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0754 0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141 0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517 0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879 0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224 0,6 0,2258 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2518 0,2549 0,7 0,2580 0,2612 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852 0,8 0,2881 0,2910 0,2939 0,2967 0,2996 0,3023 0,3051 0,3078 0,3106 0,3133 0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389 1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621 1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830 1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015 1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177 1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319 1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441 1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545 1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4639 1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706 1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767 2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817 2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857 2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890 2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916 2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936 2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952 2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964 2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974 2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981 2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986 3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990 3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
Anexa I
186
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995 3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997 3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998 3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
Anexa II
187
Tabele pentru t
ν
55,0t 60,0t 70,0t 75,0t 80,0t 90,0t 95,0t 975,0t 99,0t 995,0t
1 0,158 0,325 0,727 1,000 1,376 3,08 6,31 12,71 31,82 63,66 2 0,142 0,289 0,617 0,816 1,061 1,89 2,92 4,30 6,96 9,92 3 0,137 0,277 0,584 0,765 0,978 1,64 2,35 3,18 4,54 5,84 4 0,134 0,271 0,569 0,741 0,941 1,53 2,13 2,78 3,75 4,60 5 0,132 0,267 0,559 0,727 0,920 1,48 2,02 2,57 3,36 4,03 6 0,131 0,265 0,553 0,718 0,906 1,44 1,94 2,45 3,14 3,71 7 0,130 0,263 0,549 0,711 0,896 1,42 1,90 2,36 3,00 3,50 8 0,130 0,262 0,546 0,706 0,889 1,40 1,86 2,31 2,90 3,36 9 0,129 0,261 0,543 0,703 0,883 1,38 1,83 2,26 2,82 3,25 10 0,129 0,260 0,542 0,700 0,879 1,37 1,81 2,23 2,76 3,17 11 0,129 0,260 0,540 0,697 0,876 1,36 1,80 2,20 2,72 3,11 12 0,128 0,259 0,539 0,695 0,873 1,36 1,78 2,18 2,68 3,06 13 0,128 0,259 0,538 0,694 0,870 1,35 1,77 2,16 2,65 3,01 14 0,128 0,258 0,537 0,692 0,868 1,34 1,76 2,14 2,62 2,98 15 0,128 0,258 0,536 0,691 0,866 1,34 1,75 2,13 2,60 2,95 16 0,128 0,258 0,535 0,690 0,865 1,34 1,75 2,12 2,58 2,92 17 0,128 0,257 0,534 0,689 0,863 1,33 1,74 2,11 2,57 2,90 18 0,127 0,257 0,534 0,688 0,862 1,33 1,73 2,10 2,55 2,88 19 0,127 0,257 0,533 0,688 0,861 1,33 1,73 2,09 2,54 2,86 20 0,127 0,257 0,533 0,687 0,860 1,32 1,72 2,09 2,53 2,84 21 0,127 0,257 0,532 0,686 0,859 1,32 1,72 2,08 2,52 2,83 22 0,127 0,256 0,532 0,686 0,858 1,32 1,72 2,07 2,51 2,82 23 0,127 0,256 0,532 0,685 0,858 1,32 1,71 2,07 2,50 2,81 24 0,127 0,256 0,531 0,685 0,857 1,32 1,71 2,06 2,49 2,80 25 0,127 0,256 0,531 0,684 0,856 1,32 1,71 2,06 2,48 2,79 26 0,127 0,256 0,531 0,684 0,856 1,32 1,71 2,06 2,48 2,78 27 0,127 0,256 0,531 0,684 0,855 1,31 1,70 2,05 2,47 2,77 28 0,127 0,256 0,530 0,683 0,855 1,31 1,70 2,05 2,47 2,76 29 0,127 0,256 0,530 0,683 0,854 1,31 1,70 2,04 2,46 2,76 30 0,127 0,256 0,530 0,683 0,854 1,31 1,70 2,04 2,46 2,75 40 0,126 0,255 0,529 0,681 0,851 1,30 1,68 2,02 2,42 2,70 60 0,126 0,254 0,527 0,679 0,848 1,30 1,67 2,00 2,39 2,66 120 0,126 0,254 0,526 0,677 0,845 1,29 1,66 1,98 2,36 2,62 ∞ 0,126 0,253 0,524 0,674 0,842 1,28 1,645 1,96 2,33 2,58
Anexa II
188
Anexa III
189
Tabele pentru 95,0F
2
1ν
ν
1 2 3 4 5 6 7 8 9 10
1 161 200 216 225 230 234 237 239 241 242 2 18,5 19,0 19,2 19,3 19,3 19,4 19,4 19,4 19,4 19,4 3 10,1 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14
10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 28 4,20 3,43 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 ∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83
Anexa III
190
2
1ν
ν
12 15 20 24 30 40 60 120 ∞
1 244 246 248 249 250 251 252 253 254 2 19,4 19,4 19,5 19,5 19,5 19,5 19,5 19,5 19,5 3 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53 4 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63 5 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,37 6 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67 7 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23 8 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93 9 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71
10 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54 11 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40 12 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30 13 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21 14 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13 15 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07 16 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01 17 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96 18 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92 19 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88 20 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84 21 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81 22 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78 23 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76 24 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73 25 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71 26 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69 27 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67 28 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65 29 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64 30 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62 40 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51 60 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39 120 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25 ∞ 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00
Anexa IV
191
Tabele 2χ
Aria Numar grade de libertate 0,025 0,950 0,975 0,990 1 0 3,842 5,024 6,635 2 0,0501 5,992 7,378 9,210 3 0,216 7,815 9,348 11,345 4 0,484 9,488 11,143 13,277 5 0,831 11,071 12,833 15,086 6 1,237 12,592 14,449 16,812 7 1,690 14,067 16,013 18,475 8 2,180 15,507 17,535 20,090 9 2,700 16,919 19,023 21,666 10 3.247 18,307 20,483 23,209 11 3,816 19,675 21,920 24,725 12 4,404 21,026 23,337 26,217 13 5,009 22,362 24,736 27,688 14 5,629 23,685 26,119 29,141 15 6,262 24,996 27,488 30,578 16 6,908 26,296 28,845 32,000 17 7,564 27,587 30,191 33,409 18 8,231 28,869 31,526 34,805 19 8,907 30,144 32,852 36,191 20 9,591 31,410 34,170 37,566 21 10,283 32,671 35,479 38,932 22 10,982 33,924 36,781 40,289 23 11,689 35,173 38,076 41,638 24 12,401 36,415 39,364 42,980 25 13,120 37,653 40,647 44,314 26 13,844 38,885 41,923 45,642 27 14,573 40,113 43,195 46,963 28 15,308 41,337 44,461 48,278 29 16,047 42,557 45,722 49,588 30 16,791 43,773 46,979 50,892
Anexa IV
192
Anexa V
193
Tabel 1. Valorile “critice” ale celor doua sume de ranguri necesare pentru nivelul de semnificatie 5%, respectiv 1%, pentru N valori
Numarul de subiecti N
05,0=α 01,0=α
6 0 - 7 2 - 8 3 0 9 5 1
10 8 3 11 10 5 12 13 7 13 17 10 14 21 13 15 25 16 16 30 19 17 35 23 18 40 28 19 46 32 20 52 37
Tabel 2. Intervalele de incredere folosind testul de rang Wilcoxon Rangul limitei inferioare Rangul limitei superioare Numarul de subiecti
(N) 95% 90% 95% 90% 6 1 3 21 19 7 3 4 26 25 8 4 6 33 31 9 6 9 40 37
10 9 11 47 45 11 11 14 56 53 12 14 18 65 61 13 18 22 74 70 14 22 26 84 80 15 26 31 95 90 16 30 36 107 101 17 35 42 119 112 18 41 48 131 124 19 47 54 144 137 20 53 61 158 150 21 59 68 173 164 22 66 76 188 178 23 74 84 203 193 24 82 93 219 208
Anexa V
194
Tabel 3: Coeficientul de corelatie de rang Spearman
n 4 5 6 7 8 9 10 11 12 13 0,10 0,99 0,87 0,77 0,69 0,64 0,59 0,56 0,53 0,51 0,49 0,05 - 0,95 0,85 0,78 0,73 0,68 0,64 0,61 0,59 0,56 0,02 - 0,99 0,87 0,87 0,82 0,77 0,73 0,70 0,67 0,64
α
0,01 - - 0,91 0,91 0,86 0,82 0,79 0,75 0,72 0,70
Anexa VI
195
Criteriul Dixon pentru respingerea outliers
Nivel de semnificatie k 5% 1%
3 ( )( )1
1210 XX
XXrk −
−=
daca cea mai mica valoare este suspecta
0.941 0.988
4 0.765 0.889 5 ( )
( )1
110 XX
XXrk
kk−
−= −
daca cea mai mare valoare este suspecta
0.642 0.780
6 0.560 0.698 7 0.507 0.637 8 ( )
( )11
1211 XX
XXrk −
−=−
daca cea mai mica valoare este suspecta
0.554 0.683
9 0.512 0.635 10 ( )
( )2
111 XX
XXrk
kk−
−= −
daca cea mai mare valoare este suspecta
0.477 0.597
11 ( )( )11
1321 XX
XXrk
k−
−=−
−
daca cea mai mica valoare este suspecta
0.576 0.679
12 0.546 0.642 13 ( )
( )2
221 XX
XXrk
kk−
−= −
daca cea mai mare valoare este suspecta
0.521 0.615
14 ( )( )12
1322 XX
XXrk −
−=−
daca cea mai mica valoare este suspecta
0.546 0.641
15 0.525 0.616 16 ( )
( )3
222 XX
XXrk
kk−
−= −
daca cea mai mare valoare este suspecta
0.507 0.595
17 0.490 0.577 18 0.475 0.561 19 0.462 0.547 20 0.450 0.535 21 0.440 0.524 22 0.430 0.514 23 0.421 0.505 24 0.413 0.497 25 0.406 0.489
Anexa VI
196
Valorile critice pentru t ca test bilateral la nivelul de semnificatie
5 % pentru eliminarea valorilor discordante:
Valoare T Valoare T 3 1.155 15 2.549 4 1.481 16 2.585 5 1.715 17 2.620 6 1.887 18 2.651 7 2.020 19 2.681 8 2.126 20 2.709 9 2.215 25 2.822 10 2.290 30 2.908 11 2.355 35 2.979 12 2.412 40 3.036 13 2.462 50 3.128 14 2.507 100 3.383
IV. BIBLIOGRAFIE
197
1. W.J.Westlake: Use of confidence intervals in analysis of comparative biovalability trials, J. Pharm. Sci. , 61 (8), 1340 – 1, 1972. 2. F.Wilcoxon: Individual comparisons by ranking methods, Biometrics Bul.,180-83,1947 3. W.H.Kruskal, W.Allen Wallis: Use of ranks in one-criterion analysis of variance, J. Am. Stat. Assoc.,47,583-621,1952 4. Hollander, Wolfe DA; Non parametric statistical methods, J.Wiley, New York, 1973 5. Hollander, Wolfe DA; Non parametric statistical methods, J.Wiley, New York, 1973 6. Chow, S.C. & Liu, J.P. (1992) Design and analysis of bioavailability and bioequivalence studies. New York, Marcel Dekker (cap. 3) [1]. 7. Saporta, C. (1990) Probabilité, Analyse des données et statistique. Paris, Ed. Technip (cap. 15) [2]. 8. Vaduva, I. (1970) Analiză dispersională. Bucureşti, Ed. Tehnică (cap. 4) [3]. 9. K.A.Brownlee, Statistical Theory and metodology in Science and Engineering, J. Wiley, New – York, 1960 10. D. Ceausescu, Tratarea statstica a datelor chimico – analitice, Ed. Tehnica, Bucuresti, 1973 11. M. Tiron, teoria erorilor de masurare si metoda celor mai mici patrate, Ed. Tehnica, Bucuresti, 1972 12. F. Gremy, D. Salmon, Bases statistiques pur la recherchemedicale et biologique, Dunod, Paris, 1969 13. M. R. Spiegel, Probability and statistique, McGraw – Hill, New – York, 1980 14. D. Ceausescu, Utilizarea statisticii matematice in chimia analitica, Ed. Tehnica, Bucuresti, 1980 15. M. Iosifescu, T. Postelnicu, Curs de biomatematica, Univ. Ecologica, Bucuresti, 1990 16. M. Iosifescu, Gh. Mihoc, R. Teodorescu, Teoria probabilitatilor si statistica matematica, Ed. Tehnica, Bucuresti, 1966 17. S. Bolton, Statistics, in Remington: The Science and Practice of Pharmacy, 9 – th ed., Mark publ., Easton, Pennsylvania, 1995 18. United States Pharmacopoeia, ed. XXIII, cap. Statistical Procedures for Bioequivalence Studies Using a Standard Two – treatment Crossover design, 1995 19. P. G. Welling, F.L.S. tse, S. Dighe, Pharmaceutical Bioequivalence, cap. 3, C.M. Metzler: Statistical criteria, M. Dekker, New – York, 1991
IV. BIBLIOGRAFIE
198
20. V.W.Steinijans, D. Hauschke, Update on the statistical analysis of bioequivalence studies, Int. J.Clin.Pharmacol. Ther. Toxicol,. 28(3), 105 – 110, 1990 21. M. Rowland (ed), Variability and Drug Therapy: Description, Estimation and Control, Raven Press, New York, 1985 22. S.C. Chow, J.P.Liu, Design and Analysis of Biovailability and Bioequivalence Studies, M. Dekker, London, New York, 1992 23. A. Rescigno. A. Marzo, U. Thyroff – Friesinger, A new measure of bioequivalence, 1 –st European Congress of Pharmacology, Milano, june 1995, poster nr. 19 24. A Marzo, Open questions in bioequivalence, 1 –st European Congress of Pharmacology, Milano, june 1995, poster nr. 18 25. E. Beyssac, C. Lauro. Marty, H-l Chabard, J-M Aiache, Study of bioequivalence metrics, 6-th European Biopharmaceutics and Pharmacokinetics, Atena, aprilie 1997 26. C. Mircioiu, V. Voicu: Degenerated, solutions of pharmacokinetics models for some lipophilic drugs, Canad. J. Physiol, Pharmacol. 72 (suppl.1), 305, 1994 27. C. Mircioiu, V. Voicu, M. Jiquidi: Mathematical algoritms and computer programs as source of variability in population drugs, 1-st Congress of the European Association for Clinical Pharmacology and Therapeutics, September, 27-30, 1995, Paris 28. C. Mircioiu: „Mathematical variability” in pharmacokinetics, 6-th Europ. Congress of Biopharmaceutics and Pharmacokinetics, Atena, 22-24 April 1996, Europ. J. Drug Metab. Pharmacokin. (special issue), abstract 371
CUPRINS
1. Elemente de teoria probabilitatilor 1 2. Variabile aleatoare 11 3. Distributii de probabilitate 23 4. Estimarea intervalelor de incredere 35 5. Verificarea ipotezelor statistice 49 6. Teste neparametrice 81 7. Regresia liniara 105 8. Metode statistice de analiza factorilor de variabilitate in
experimentul biologic (ANOVA) 123
9. Estimarea bioechivalentei adoua medicamente 147 10. Teste statistice de discordanta 157 11. Distributia binomiala 163 12. Puterea testului. Calculul numarului de voluntari 175 13. Studii epidemiologice 179 14. Tabele pentru z 185 15. Tabele pentru t 187 16. Tabele pentru 95,0F 189 17. Tabele 2χ 191 18. Intervale de incredere folosind testul Wilcoxon 193 19. Criteriul Dixon pentru respingerea outiers 195 20. Bibliografie 197 21. Cuprins 199
199
200