clase repaso bioestadistica urv 2010
Post on 24-Jun-2015
727 Views
Preview:
DESCRIPTION
TRANSCRIPT
Bioestadística FMCS Reus
Curs 2010-11 1
REPÀSPROBABILITAT
Bioestadística FMCS Reus
Curs 2010-11 2
Repàs probabilitat
elementsdtotalNombre
AticacaracterisambelementsNombreAp
'__
____)(
)(1)( ApAp
)()()()( BApBpApBAp
Bioestadística FMCS Reus
Curs 2010-11 3
Repàs probabilitat
)(
)()(
Bp
BApBAp
)()()()()( ABpApBApBpBAp
Bioestadística FMCS Reus
Curs 2010-11 4
Repàs probabilitat
)()()()()()()( 2211 kk ABpApABpApABpApBp
BABABAB k 21
A
A1B AkA2
Bioestadística FMCS Reus
Curs 2010-11 5
Repàs probabilitat
iii ABpAp
BAp
Bp
BApBAp
)()(
)(
)(
)()(
Teorema de Bayes:
Bioestadística FMCS Reus
Curs 2010-11 6
Exercici
La probabilitat de ser del grup A es d’un 40%
El 60% dels individus del grup A desenvolupen una malaltia
El 30% dels individus que no pertanyen al grup A desenvolupen una malaltia
Si agafem a l’atzar un individu malalt quina es la probabilitat que pertanyi al grup A?
Quina es la probabilitat de que un individu o pertany al grup A o estigui malalt (o les dues coses a la vegada)?
Bioestadística FMCS Reus
Curs 2010-11 7
Exercici
30'0)(;60'0)(;40'0)( AMpAMpAp
)()(
)(
)(
)()(
MApMAp
MAp
Mp
MApMAp
24,06'04'0)()()( AMpApMAp
5714'042'0
24'0
3'06'06'04'0
6'04'0
)()()()( MApMpApMAp
58'024'042'040'0
Bioestadística FMCS Reus
Curs 2010-11 8
REPÀSVARIABLE ALEATORIA
Bioestadística FMCS Reus
Curs 2010-11 9
Distribució Binomial
Un experiment binomial es aquell que compleix aquestes característiques:
N proves idèntiques A cada prova dos resultats possibles (Èxit o fracàs) La probabilitat d’èxit (p) o fracàs (1-p) es constant a cada prova El resultat de cada prova es independent al de altres proves El nostre interès estarà en la variable aleatòria X, el nombre
d'èxits a cada prova
xnxnx ppxXp -)1()(
Distribució binomial
X~B(n,p)
E(X)=np V(X)=np(1-p)
Bioestadística FMCS Reus
Curs 2010-11 10
Distribució Poisson
El nombre de successos que ocorren en un interval de temps, de longitud, de espai segueix una distribució de Poisson si
La probabilitat de un succés es la mateixa en tot l’interval La probabilitat de un succés no depèn dels successos
ocorreguts amb anterioritat
Distribució Poisson
X~P(λ) λ:Nombre mig de successos en un interval
E(X)=λ V(X)=λ
!)(
-
x
exXp
x
Bioestadística FMCS Reus
Curs 2010-11 11
Propietats Esperança i Variança
Propietats esperança: E(k) = k E(X+Y)=E(X)+E(Y) E(kX)=kE(X) E(k1X+k2Y)=k1E(X)+k2E(Y)
Propietats variança: V(k) = 0 V(X+Y)=V(X)+V(Y) V(kX)=k2V(X) V(k1X+k2Y)=k1
2V(X)+k22V(Y)
Bioestadística FMCS Reus
Curs 2010-11 12
Exercici
La probabilitat de una reacció al·lèrgica es del 1% Quina es la probabilitat de que en una mostra de
10 individus hi hagi alguna reacció al·lèrgica? Quina es la probabilitat de que en una mostra de
100 individus hi hagi mes de 3 reaccions al·lèrgiques?
Bioestadística FMCS Reus
Curs 2010-11 13
Exercici
N=10P=0’01 X: Nombre de persones amb reacció al·lèrgica X~B(10,0’01)
P(X≥1)= 1-P(X=0) = 1 – 0’9044 = 0’0966
Quina es la probabilitat de que en una mostra de 10 individus hi hagi alguna reacció al·lèrgica?
Bioestadística FMCS Reus
Curs 2010-11 14
Exercici
N=120 P=0’01 X: Nombre de persones amb reacció al·lèrgica X~B(120,0’01)
X~B(120,0’01)
N gran
X~Poisson(λ=120·0’01)X~Poisson(λ=1’2)
Quina es la probabilitat de que en una mostra de 100 individus hi hagi mes de 3 reaccions al·lèrgiques?
Bioestadística FMCS Reus
Curs 2010-11 15
Exercici
X~Poisson(λ=1’2)
p(X>2) = 1 – [ p(X=0) + p(X=1) + p(X=2) ] =
= 1 – [ 0’3012 + 0’3614 + 0’2169] =
= 1 – 0’8795 = 0’1205
Bioestadística FMCS Reus
Curs 2010-11 16
Distribución normal o de Gauss
Està caracteritzada per dos paràmetres:
La mitjana, μ, la desviació típica, σ.
σ
)μx(21
2
2
eπ2σ
1=)x(f
--
X ~ N( µ, σ)
Bioestadística FMCS Reus
Curs 2010-11 17
);(N∈X σμ
0 µ xi
σ P (x ≥ x i)
)1;0(NZ ∈
1 P (z ≥ zi)
0
-X
Z
P(X>a)
a
P(Z > (a-µ) / σ )
a-µ
σ
Bioestadística FMCS Reus
Curs 2010-11 18
Distribución normal o de Gauss
P(a≤X≤b)=p(X≥a) – p(X≥b)
P(Z>-a) = p(Z<a)
P(Z<a) = 1 - p(Z>a)
P(Z>-a) = 1 - p(Z>a)
Bioestadística FMCS Reus
Curs 2010-11 19
Exercici
El pes de les persones d'una determinada població es distribueix normalment amb una mitjana de 80 kg. i una desviació típica 10 kg.
1. Quina és la probabilitat de que una persona pesi entre 70 i 85 kg?
2. Quina és la probabilitat de que una persona pesi més de 95 Km
Bioestadística FMCS Reus
Curs 2010-11 20
Exercici
X~N(80,10) Z~N(0,1)10
80-- XXZ
a a - 80
10
P(X>a) P(Z > (a-80) / 10 )
1) P(70>X>85)
2) P(X>95)
Bioestadística FMCS Reus
Curs 2010-11 21
Exercici
10
80X10
80X10
8070
X: N(80,10)
P(70 < X < 85) = P (X > 70) – P (X >85) =
= P ( > ) - P ( > )
= P (Z > -1) – P (Z > 0’5) =
= [1 – P(Z>1)] – P(Z>0’5) =
10
8085
Bioestadística FMCS Reus
Curs 2010-11 22
P(z) 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4841 0,4801 0,4761 0,4721 0,4681 0,4641
0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,2 0,4207 0,4168 0,4129 0,4091 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
0,6 0,2743 0,2709 0,2676 0,2644 0,2611 0,2579 0,2546 0,2514 0,2483 0,2451
0,7 0,2420 0,2389 0,2358 0,2327 0,2297 0,2266 0,2236 0,2207 0,2177 0,2148
0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
1,0 0,1587 0,1563 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
1,2 0,1151 0,1131 0,1112 0,1094 0,1075 0,1057 0,1038 0,1020 0,1003 0,0985
1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
1,8 0,0359 0,0352 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
Distribució normal (0;1) P ( X ≥ a ) a
Bioestadística FMCS Reus
Curs 2010-11 23
Exercici
10
80X10
80X10
8070
X: N(80,10)
P(70 < X < 85) = P (X > 70) – P (X >85) =
= P ( > ) - P ( > )
= P (Z > -1) – P (Z > 0’5) =
= [1 – P(Z>1)] – P(Z>0’5) =
= [1 – 0’1687] – 0’3086 = 0’8313 – 0’3086 = 0’5227
10
8085
Bioestadística FMCS Reus
Curs 2010-11 24
Exercici
10
80X10
8095
X: N(80,10)
P (X > 95) =
= P ( > )
= P (Z > 1’5) = 0’0668
Bioestadística FMCS Reus
Curs 2010-11 25
P(z) 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4841 0,4801 0,4761 0,4721 0,4681 0,4641
0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
0,2 0,4207 0,4168 0,4129 0,4091 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
0,6 0,2743 0,2709 0,2676 0,2644 0,2611 0,2579 0,2546 0,2514 0,2483 0,2451
0,7 0,2420 0,2389 0,2358 0,2327 0,2297 0,2266 0,2236 0,2207 0,2177 0,2148
0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
1,0 0,1587 0,1563 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
1,2 0,1151 0,1131 0,1112 0,1094 0,1075 0,1057 0,1038 0,1020 0,1003 0,0985
1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
1,8 0,0359 0,0352 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
Distribució normal (0;1) P ( X ≥ a ) a
Bioestadística FMCS Reus
Curs 2010-11 26
REPÀSPROVES D’HIPÒTESIS
Bioestadística FMCS Reus
Curs 2010-11 27
Repas proves d’hipòtesi
Una prova d’hipòtesis consta de quatre elements:
Hipòtesis Nul·la (H0) Hipòtesis alternativa (Hα) El estadístic de la prova La regió de rebuig o regió crítica
Bioestadística FMCS Reus
Curs 2010-11 28
Repàs proves d’hipòtesi
• Hipòtesis Nul·la (H0) H0: µ = a
• Hipòtesis alternativa (Hα) Hα : µ ≠ a
• El estadístic de la prova (σ coneguda)
• Sota la hipòtesi H0 certa
• La regió de rebuig o regió crítica
Rebuig de H0 si z Є (-∞,-zα/2) o z Є (zα/2,∞)
Acceptació de H0 si z Є (-zα/2,zα/2)
Si α=0.05 z α/2= z 0.025=1.96
nNX ,:
)1,0(-X-X
2N
n
EEZ
EE: Desviació estándar de la mitjana.
Bioestadística FMCS Reus
Curs 2010-11 29
Repàs proves d’hipòtesi
• Hipòtesis Nul·la (H0) H0: µ ≤ a
• Hipòtesis alternativa (Hα) Hα : µ > a
• El estadístic de la prova (σ coneguda)
• Sota la hipòtesi H0 certa
• La regió de rebuig o regió crítica
Rebuig de H0 si z Є (zα,∞)
Acceptació de H0 si z Є (-∞,zα)
Si α=0.05 z α= z 0.05=1.645
nNX ,:
)1,0(-X-X
2N
n
EEZ
EE: Desviació estándar de la mitjana.
Bioestadística FMCS Reus
Curs 2010-11 30
Contrastos unilateral i bilateral
La posició de la regió crítica depèn de com es facin les hipòtesis.
Unilateral Unilateral
Bilateral
H0: µ ≤ aH1: µ ≥ a
H0: µ ≥ aH1: µ ≤ a
H0: µ = aH1: µ ≠ a
- z/2 z/2
- z z
Bioestadística FMCS Reus
Curs 2010-11 31
Exercici
Sigui X una variable aleatòria amb desviació Standard = 2
Volem testar:
• Si la mitjana de X es 40
• Si la mitjana de X es igual o menor que 40
Agafem una mostra de 16 elements.
Calculem la seva mitjana i ens dona 40’90
Bioestadística FMCS Reus
Curs 2010-11 32
Exercici
• Hipòtesis Nul·la (H0) H0: µ = 40 H0: µ ≤ 40
• Hipòtesis alternativa (Hα) Hα : µ ≠ 40 Hα : µ > 40
• El estadístic de la prova (σ coneguda)
• Sota la hipòtesi H0 certa 162,40: NX
)1,0(
162
04-X-X22
N
n
Z
8'15'0
90'0
162
4090'40
90'40
2
z
X
Bioestadística FMCS Reus
Curs 2010-11 33
Exercici
Pel test bilateral, la regió de rebuig o regió crítica es:
Rebuig de H0 si z Є (-∞,-zα/2) o z Є (zα/2,∞)
Acceptació de H0 si z Є (-zα/2,zα/2)
Si α=0.05 z α/2= z 0.025=1.96
Rebuig de H0 si z Є (-∞, -1’96) o z Є (1’96,∞)
Acceptació de H0 si z Є (-1’96,1’96)
1’80 esta dintre de la regió de acceptació.
Acceptem la hipòtesi nul·la, la mitjana es igual a 40
Bioestadística FMCS Reus
Curs 2010-11 34
Exercici
Pel test unilateral, la regió de rebuig o regió crítica és:
Rebuig de H0 si z Є (zα,∞)
Acceptació de H0 si z Є (-∞ ,zα)
Si α=0.05 z α= z 0.25=1.645
Rebuig de H0 si z Є (1’645,∞)
Acceptació de H0 si z Є (-∞, -1’645)
1’80 esta dintre de la regió de rebuig.
Rebutgem la hipòtesi nul·la,
Acceptem hipòtesi alternativa, la mitjana es major que 40
Bioestadística FMCS Reus
Curs 2010-11 35
Tipus de error, poder i nivell de confiança
DecisióPoblació real
H0 és falsa H0 és certa
Es refusa la H0 Decisió correcte1- (poder)
Risc (error tipus I)
No es refusa la H0 Risc (error tipus II)
Decisió correcte1- (confiança)
[ ] [ ]certaésH|HrefusarobPr=ItipuserroruncometreobPr=α 00
[ ] [ ]falsaésH|HrefusaesnoobPr=IItipuserroruncometreobPr=β 00
[ ]falsaésH|HrefusarobPr=potenciaoPoder=β1 00
1- és el nivell de confiança
[ ]falsaésH|HrefusarobPr=potenciaoPoder=β1 00
1- és el nivell de confiança
[ ] [ ]falsaésH|HrefusaesnoobPr=IItipuserroruncometreobPr=β 00
[ ]falsaésH|HrefusarobPr=potenciaoPoder=β1 00
1- és el nivell de confiança
[ ] [ ]certaésH|HrefusarobPr=ItipuserroruncometreobPr=α 00
[ ] [ ]falsaésH|HrefusaesnoobPr=IItipuserroruncometreobPr=β 00
[ ]falsaésH|HrefusarobPr=potenciaoPoder=β1 00
1- és el nivell de confiança
[ ]falsaésH|HrefusarobPr=potenciaoPoder=β1 00
1- és el nivell de confiança
Bioestadística FMCS Reus
Curs 2010-11 36
Contrast per al paràmetre p
n
p1p
ppz
oo
o
- z
1 -
z
1 -
- z/2 z/2
1 -
Hipòtesi nul·la
Ha
Hipòtesi alternativa
Ha
Tipus de contrast
Estadístic de contrast
Regió d’acceptació
P = Po P ≠ pobilater
al
segueix una llei N(0,1)
(-z/2,z/2)
P po P > pounilater
al(-∞,z)
P ≥ po P < ppunilater
al(-z,+∞)
Bioestadística FMCS Reus
Curs 2010-11 37
REPÀSCOMPARACIÓ DUES
MITJANES
Bioestadística FMCS Reus
Curs 2010-11 38
Resum de la comparació de dues mitjanes observades• Hipòtesis Nul·la (H0) H0: µA- µB = 0• Hipòtesis alternativa (Hα) Hα : µA- µB ≠ 0• El estadístic de la prova
• Sota la hipòtesi H0 certa
• La distribució del estadístic de la prova i la formula del estimador de EE depèn de:
• La mida de les mostres• La normalitat de X en els dos grups• La variança de X sigui igual en els grups
^^
BA XX
EE
d
EE
EE: Desviació estándar de la diferencia de mitjanes
Bioestadística FMCS Reus
Curs 2010-11 39
Resum de la comparació de dues mitjanes observadesEstratègia:
coneguda (1) desconeguda
nA i nB 30 (2) nA i/o nB < 30
Distribució Normalvariàncies homogènies (2
A = 2B) (3)
variàncies NO homogènies (2A 2
B)(4) Distribució no Normal proves no paramètriques
Bioestadística FMCS Reus
Curs 2010-11 40
1 coneguda
2 desconeguda, n gran
3 desconeguda, n petita, X normal, 2A = 2
B
desconeguda, n petita, X normal, 2A 2
B
EEBA nnBA 22
+ = EE B
2
A
2
ns
ns BA
EE BA n
sns
22
ˆˆ
2 - +
2BB
2AA
= nn
s1)-n(+s1)-n( s
BA
2
)1,0(NEE
dZ
)1,0()2( _ NnntEE
dT grann
bA
)2( bA nntEE
dT
Bioestadística FMCS Reus
Curs 2010-11 41
Exercici
Un grup de 16 individus que segueix una dieta A te una mitjana de IMC de 27 amb una desviació estàndard de 4.
Un grup de 13 individus que segueix una dieta B te una mitjana de IMC de 27 amb una desviació estàndard de 5.
Tenen els dos grups el mateix IMC amb una significació α=0’05 ?
Quin es el grau de significació?
Bioestadística FMCS Reus
Curs 2010-11 42
• Hipòtesis Nul·la (H0) H0: µA- µB = 0• Hipòtesis alternativa (Hα) Hα : µA- µB ≠ 0• El estadístic de la prova
• Sota la hipòtesi H0 certa
• Situació: desconeguda • n petita, • X normal, 2
A = 2B
^^
BA XX
EE
d
EE
EE: Desviació estándar de la diferencia de mitjanes
Exercici
Bioestadística FMCS Reus
Curs 2010-11 43
desconeguda, n petita, X normal, 2A = 2
B
EE BA n
sns
22
ˆˆ
2 - +
2BB
2AA
= nn
s1)-n(+s1)-n( s
BA
2
)2( bA nntEE
dT
Exercici
Bioestadística FMCS Reus
Curs 2010-11 44
Resultats
Estimació de la variància comuna (2) a partir de la mitjana ponderada pels graus de llibertat de les variàncies s2
A i s2B
'444427
120
2 - 13 165 1)-(134 1)-(16
s2
5;B 23; ;31
4;A 27; ;61
sXn
sXn
2
BB
2
AA
27 2 - 13 16 gl
Bioestadística FMCS Reus
Curs 2010-11 45
+ = EE ns
ns
O
2
P
2
Càlcul de l’Error Estàndard
1'659 13
16
EE 4'4444'444
22
Bioestadística FMCS Reus
Curs 2010-11 46
⇒
-
EE
d t ⇒
- d
tyy
yy
27
O
2
P
2
O P
O P
ns
ns
Càlcul de l’estadístic de contrast: t de Student
2'411 1'659
4 t ⇒
432-72 d
Bioestadística FMCS Reus
Curs 2010-11 47
Resultats
El grau de significació es aquell valor de α tal que
411,22
,27t
La regió critica o de rebuig serRebuig de H0 si t Є (-∞,-t 27,α/2) o t Є (t27,α/2 ,∞)
Acceptació de H0 si t Є (-t27,α/2 ,t27,α/2 )
Si α=0.05 t27,α/2= t27,0.025=2’0518
2’2411 esta en la regió critica,
Rebutgem H0, les mitjanes del IMC en el grup A i el grup B no es poden considerar iguals
top related