universidad salesiana de boliviavirtual.usalesiana.edu.bo/web/contenido/dossier/22011/640.pdf ·...
TRANSCRIPT
UNIVERSIDAD SALESIANADE BOLIVIA
CARRERA DE INGENIERÍA DE SISTEMAS
DOSSIERINFERENCIA PROBABILÍSTICA
Cuarto Semestre
PORFIRIO ARDUZ URQUIETAI - 2011
I ÍNDICE DEL CONTENIDO: PAG.UNIDAD I DISTRIBUCIONES DE PROBABILIDAD 21.1.Introducción –Distribución Bernoulli 31.2.Distribución Binomial 51.3.DistribuciónGeométrica 81.4.DistribucionPascal 91.5Distribución Multinomial 111.6Distribución Hipergeométrica 131.7Distribución Multivariante 171.8Distribución Poisson 181.9Distribución Uniforme 231.10Distribución Exponencial 251.11Distribución Normal 281.12 Teorema Central del límite 311.13Aproximaciones a la Normal 33
UNIDAD II DISTRIBUCIONES MUESTRALES 372.1.Población ,muestra aleatoria. 382.2 Distribución muestral de la media 392.3Distribución Chi Cuadrado 412.4Distribución T-student 452.5.Distribución F-Fisher 472.6.Distribución muestral de la Proporción 49
UNIDAD III ESTIMACIÓN PUNTUAL Y POR I.C. 523.1.Estimación puntual 533.2 Propiedades de un buen estimador 543.3Métodos de estimación puntual 563.4 Estimación por Intervalos de confianza 583.5.Tamaño muestral para estimar la media 613.6.Tamaño muestral para estimar la proporción 643.7.Tamaño muestral para poblaciones finitas 653.8.Intervalo de confianza para diferencia de proporciones 663.9.Intervalo de confianza para la media con varianza desconocida 673.10.Intervalo de confianza para la varianza 693.11.Intervalo de confianza para la razón de varianzas 70
UNIDAD IV PRUEBA DE HIPÓTESIS 724.1.Hipótesis Estadística 734.2 Tipos de errores 734.3.Pruebas relativas a medias y la varianza 754.4.Pruebas relativas a proporciones 82
UNIDAD V ANÁLISIS DE REGRESIÓN Y CORRELACIÓN 845.1Distribuciones Bidimensionales Correlación lineal 845.2.Regresión lineal simple 875.3. Coeficiente de determinación 875.4 Técnicas de estimación 885.5 Extensión de la Regresión lineal simple 905.6 Modelos de Regresión múltiple 93
PRACTICASPráctica Nº1 Modelo Binomial 95Práctica Nº2 Modelo Geométrico y Pascal 95Práctica Nº3 Modelo Multinomial 96Práctica Nº4 Modelo Hipergeométrico 96Práctica Nº5 Modelo Multivariado 97Práctica Nº6 Modelo Poisson 97Práctica Nº7 Modelo Uniforme 98Práctica Nº8 Modelo Exponencial 98Práctica Nº9 Modelo Normal 99Práctica Nº10 Teorema central del Límite 100Práctica Nº11 Aproximaciones a la Normal 100Práctica Nº12 Distribución muestral de la Media 101Práctica Nº13 Distribución muestral de la Proporción 102Práctica Nº14 Distribución muestral de la Varianza 102Práctica Nº15 Distribución T-Student 103Práctica Nº16 Distribución F-Fisher 103Práctica Nº17 Estimación puntual 103Práctica Nº18 Estimación por I.C. 104Práctica Nº19 Pruebas de Hipótesis sobre la Media y Varianza 107Práctica Nº20 Pruebas sobre Proporciones 108
BIBLIOGRAFIA 109
GLOSARIO 110
PRESENTACIÓN
El presente Dossier se realizó en coordinación con los docentes de la Materia con el fin deque cualquier estudiante del cuarto nivel de Ing. de Sistemas, pueda facilitar su proceso deaprendizaje y enseñanza,de tal manera que :-Identifique y utilice los modelos probabilísticos en problemas inherentes a variablesaleatorias-Utilice la Docimasia de Hipótesis para probar,verificar, alguna característica de unapoblación._Utilice correctamente el análisis de regresión en la predicción,mediante el proceso deaprendizaje cooperativo.Cabe aclarar que el Dossier ha sido actualizado de acuerdo al formato emanado del Deptode Planificación.Es decir al principio de cada unidad, se incorporó las competencias su objetivo,ladescripción específica de la unidad ,las lecturas complementarias, la bibliografía básica yelectrónica .En cuanto a las prácticas se insertó al final del presente conjuntamente lastablas y el glosario de términos técnicos elementalesLa unidad I comprende el desarrollo de los principales modelos probabilísticos másutilizados en la Ingeniería,La unidad II trata sobre las distribuciones muestrales o especiales como (t-student,Chicuadrado,y la Fisher) más utilizadas en la InferenciaLa Unidad III está abocado a la estimación tanto puntual como por intervalos de confianzaDe los principales parámetros de una poblaciónLa unidad IV se refiere a la realización de las diferentes pruebas de hipótesis paramétricasprincipalmente y no paramétricasFinalmente la unidad V trata sobre el análisis de la regresión en la predicción,el mismo queestá en power pointPor lo tanto el presente documento está basado en 4 partes: I la IntroducciónII El contenido o cuerpo del dossierIII PrácticasIV Tablas estadísticasV BibliografíaVI Glosario
Esperamos que el presente documento sea de mucha utilidad para los estudiantes por lo queestamos prestos a recibir sugerencias para que el mismo pueda ser mejorado.
La Paz ,28 de Febrero del 2011
Lic. Porfirio Arduz Urquieta.
UNIDAD N° 1
DISTRIBUCIÓN DE PROBABILIDADES
Competencia:
-Identifica y utiliza correctamente los modelos probabilísticos en la resolución deproblemas inherentes a variables aleatorias en forma general.
Objetivos.
-Resolver correctamente todo tipo de problema que tengan que ver con la incertidumbre ,mediante la utilización de los modelos probabilísticos
Descripción general de la unidad:
-Esta unidad comprende el desarrollo de las diferentes distribuciones de probabilidadestanto discretas como las continuas con sus respectivas características más aplicadas en elcampo de la IngenieríaTema Nº1 :Distribuciones DiscretasCompetencia: Identifica y utiliza los Modelos de Distribuciones Discretas en la resoluciónde problemas inherentes a variables aleatorias discretasDescripción del tema:Se desarrollarán los principales Modelos de Distribución Discretos,con sus respectivas características,para su posterior aplicación a la resolución de problemas.Tema Nº 2:Distribuciones ContinuasCompetencia: Identifica y aplica los principales Modelos de Distribución Continuos en laresolución de problemas inherentes a variables continuasDescripción del tema:Se desarrollarán los Modelos de distribución Continuas másutilizadas en la Ingeniería de acuerdo a sus características,y su posterior aplicaciópn en laresolución de problemas.
Lectura:Millar/Freund/Jonson “Probabilidad y Estadística paraIngenieros”Edo.de México 1992 Pgs. 93 al 128 Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e InferenciaEstadística((2ª ed) Perú .Pags.407 al 553
Referencia electrónica:http://www.itchihuahua.edu.mx/academic/industrial/sabaticiruta/private/01UNIDAD%20IV.uhtm
INTRODUCCIÓN
Entre uno de los objetivos de la Estadística Matemática es de determinar unadistribución de probabilidad o un modelo probabilistico que satisfaga una serie desupuestos para analizar los resultados obtenidos de un experimento aleatorio.
Entre las distribuciones de probabilidades tenemos:
a) Las distribuciones discretas como ser la Bernoulli, Binomial, Hipergeométrica,Geométrica, Poisson, etc.
b) Las Distribuciones continuas tenemos la Uniforme, Experimental, la Normal, X2,F, t
DISTRIBUCIONES DISCRETASSon aquellas distribuciones cuya variable aleatoria es discreta
1.DISTRIBUCIÓN BERNOULLI : X~Bernoulli (p)
Se tiene la distribución Bernoulli, cuando las pruebas ó ensayos son de carácterdicotómico, es decir sólo tienen 2 posibles resultados:
E = éxito ; F = fracaso Þ ],[ FE=WÞe por ejemplo: Sean los siguientes experimentos aleatorios:
1e : “Lanzar una moneda” ],[1 SC=WÞ
2e “Determinar el sexo del ” ],[2 MV=WÞ
3e : “verificar el resultado de un examen” ],[3 ra=WÞ
DEFINICIÓN
Se dice que una v. d. X~Bernoulli sii sv Rx= [0,1]; donde la V.A.D. x:” N° de éxitosobtenidos en un ensayo dicotómico”; cuya
FUNCIÓN DE PROBABILIDAD O CUANTÍA p(x)=p[X=x]=px(1-p)1-x; Rx= 0.1
Dondep = probabilidad del éxitoq = probabilidad del fracasode tal manera que p+q=1
ó p = 1-q ó q = 1-p
cuya distribución de probabilidad y representación gráfica es:
x P(x)0 q1 p
p q
0 1
FUNCION DE DISTRIBUCION ACUMULADA F (x)
F(x) = p (X£ x) = 0 si x < 0q si 0£ x<11 si x³1
CARACTERISTICAS
Entre sus principales caracteristicas tenemos:
1) LA MEDIA
ppqxEpxPxxE=+==
=== å)(1)(0)(
)()(
m
m
pxxPpxP
x
0)(9)(
10
Mediante la F.g.m. sabemos que uno de los teoremas de la f.g.m.
rx
r
dttMdr )(' =m por lo tanto debemos antes determinar
la [ ] å -=== xxtxtxx qpeeEtMfgm 1)( desarrollando la å
=+== -- 111)1(010)0()( qpeqpetMfgm ttx
sabemos que =+=+=== ==
001 0
')('')(
0pepe
dtpeqdxE t
tt
tmm
2) LA VARIANZA
å -=-== - 212222 )()( pqpxxExV xxms
=-=-+== - )1(10)( 20201022 PpppqqpxV s
mediante la f.g.m. 22
2 ')( mms -==xV
P(x)
x
t =0
p
q+etp
p.q
donde [ ]===
+== ===
00002 '
'''
)(''' pepe
dtpeqd
dttMd
tt
t
t
txm
=-=-=Þ )1()( 2 ppppxV
DISTRIBUCIÓN BINOMIAL X~ B(n,p) ó b(x :np)
Se llama experimento aleatorio binomial a un N° fijo “n” de reiteracionesindependientes de un experimento aleatorio Bernoulli que tiene las siguientescaracterística:
1. Los resultados de cada prueba son de carácter dicotómico, es decir Bernoulli2. Las n pruebas Bernoulli son independientes3. La probabilidad de éxito “p” supuestamente se mantiene constante en cada
prueba
DEFINICIÓN una v.a.d X~b(n,p), donde
X : “ N° de éxitos obtenidos en “n” ensayos Bernoulli” con Rx = 0,1,2,3,... n cuya
FUNCIÓN DE PROBABILIDAD O CUANTÍA
P(X)= P[X=x]=(nx )pxqn-x:Rx0,1,2,3...n
Dondep = probabilidad de éxitoq = probabilidad de fracason = N° de ensayos Bernoulli
FUNCIÓN DE DISTRIBUCIÓN Ó ACUMULADA F(x)
F(x)= P(X£ x) =B(x;np)=å=
-
><£
<x
k
xnkn
nxsinxsi
xsiqpk
0
10
00
)(
CARACTERÍSTICAS
1) LA MEDIA npqpxxxPxxE xnxn
Rx==== -åå )()()( m
2) LA VARIANZA å =-=-== - npqnpqpxxxExV xnxn
22222 )()()()( ms
3) LA FGM [ ] nttxx epeEtM )]1(1[)( -+==
p
p.
RESOLUCIÓN DE PROBLEMAS CON MODELOS PROBABILISTICOS
Para resolver correctamente problemas inherentes a modelos probabilìsticos, sesugiere en un principio seguir los siguientes pasos:
1. Determinar el tipo de distribución de probabilidad que sigue la v. a. X deacuerdo las características del experimento en cuestión.
2. Definir la v. a X de manera clara y completa con su Rx.3. Determinar los parámetros de la función de probabilidad.4. Utilizar correctamente la función de probabilidad, ó la acumulada ó tablas ó
CPU.
Ejemplo
La probabilidad de que cierto ordenador de cierta marca determinada falla, anteuna descarga eléctrica es del 1% ¿cuales son las probabilidades de que entre 10ordenadores de dicha marca en un laboratorio.
a) 3 fallenb) a lo más 2 fallenc) al menos 3 fallend) el promedio y varianza que un ordenador falle
SOLUCIÓN
1) Como todo ordenador tiene sólo 2 posibles resultados falle o no falle(dicotómico)
2) Suponiendo que cada ordenador funciona independientemente3) Suponiendo que la probabilidad de falla de los ordenadores es casi constante
Entonces asumimos que la v.a.d. X~ b(n. p)ÞP(x)=(nx )px qn-x Rx =0,1,2....n
Donde la v. a. d. X: “N° de ordenadores que fallan ante una descarga eléctrica deentre 10”
n=10: p=0.01:q=0.99 Rx=0,1,2.......10 10...2,1,0;99.001.0)( 1010
=÷øö
çèæ=Þ -
xxx RxxP
a) 3 fallen 00011.0)99.0()01.0(3)3( 7310
=÷øö
çèæ==Þ xP
b) a los más 2 fallen 9999.0)2()1(1)0()()2(2
0=++==£Þ å PPPxPxP
c) al menos 3 fallen )10(...)4()3()()3(10
3
PPPxPxP +++==³Þ å
mediante el complemento 00011.09999.01)2(1)3( =-=£-=³Þ xPxP
d) El promedio E(x)=np=10(0.01)=0.1=10%La VarianzaV(x):npq=10(0.01)(0.99)=0.099
APLICACIÓN DE LA BINOMIAL EN EL MUESTREO
Considerando cada elemento de una muestra aleatoria (m.a.) como un ensayoBenoulli entonces la Distribución Binomial puede aplicarse en el muestreo bajo lassiguientes circunstancias:
1. Cuando el muestreo es con o sin reemplazo de una población infinita o muygrande
2. Cuando el muestreo es con reemplazo de una población pequeña o finita
Bajo estas 2 circunstancias entonces la v.a.d. X se define
X:”N° de elementos de la clase de nuestro interés en una m.a. de tamaño n”
DondePoblación
eresdenuestroelementosdeNNKp int°
==
nxNk
NkxxXPxp
xnxn...3,2,1,0:1][)( =÷
øö
çèæ -÷
øö
çèæ÷øö
çèæ===
-
NOTA.- en la práctica el muestreo se lo realiza sin reemplazo de poblacionesfinitas especialmente cuando se realiza control de calidad, por lo tanto ladistribución adecuada es la hipergeométrica.
USO DE TABLAS
Cuando el tamaño de la m.a. es muy grande )30( ³n el cálculo de lasprobabilidades resulta tedioso porque lo que se sugiere utilizar paquetesestadísticos ó las tablas las que están construidas en términos de la función dedistribución ó acumulada F(x); para ello se debe utilizar las siguientes relaciones
Para probabilidades acumuladas
[ ] å=
===£=x
k
nxpnkbpnxBxXPxF0
....2,1,0);.;().;()(
Para probabilidades puntuales
P(x=x)=b(x:n.p)= B(x:n;p)-B((x-1);n.p)
Ejemplo
En una importación de computadoras muy grande, se sabe que por experienciaque el 25% de las mismas están infectadas con cierto virus. Se relaciona al azar20 computadoras del lote de importación, para efectuar un control de calidad.
a) Cual es la verdadera distribución de probabilidad y cual debe asumirse pornecesidad del N° de computadoras infectadas con el virus
b) Cual es la probabilidad de que 3 cpu estas infectadosc) Cual la probabilidad que más de 3 estén infectadasd) Determinar la media, la varianza y la desviación estándar
SOLUCIÓN
a) Como se trata de realizar un control de calidad la verdadera distribución es lahipergeométrica, pero como no se conoce la población N se asume la
distribución Binomial. X b(n,p) 20...2.1,0)75.0()25.0()( 2020
=÷øö
çèæ=Þ - xxxp xx
Donde P=0.25; q=0.75; n=20; x:”N° de CPU infectados en una m.a. de 30”Rx=0,1,2......20
b) P ( ) ( ) 1339.075.025.03)3( 17320=÷
øö
çèæ==xP
Tablas P(x=3)=b(3;20;0.25)=B(3;20;0.25)-B(2;20;0.25)=0.2252-0.0913=0.1339c) ( ) ( ) ( ) ( ) ( ) PxPxPxP 7748.075.025.0375.025.0275.025.0175.0)25.0(01)3(1)(3 173
20182
2019
20200
2020
4
=úû
ùêë
é÷øö
çèæ+÷
øö
çèæ+÷
øö
çèæ+÷
øö
çèæ-=£-==> å
tablas P[x>3]=1-P[x £ 3]=1-B(3;20;0.25)=1-0.2252=0.7748d) 94.175.3)75.0)(25.0(20)(;5)25.0(20)( 2 ========= ssm npqxVnpxE
DISTRIBUCIÓN GEOMÉTRICA
Esta distribución es una de los casos especiales de la Binomial y se utiliza cuandoexiste un proceso Bernoulli y se desea obtener el primer éxito.
DEFINICIÓN
Se dice que la v.a.d.x...G(p): donde p= probabilidad del éxito en cada intentoDonde X:”N° de ensayos Bernouli hasta obtener el 1er éxito “Rx=1,2,3...
FUNCIÓN DE PROBABILIDAD P(x)=P[x=x]=pqx-1 : Rx=1,2,3...
FUNCIÓN DE DISTRUBUCION F(x)=P[x £ x]= 0 si x<1 1-qx si ³1
LA MEDIAp
xxPxE 1)()( === åm
LA VARIANZA 2222 )()(
pqxExV =-== ms
LA DESVIACIÓN TÍPICA 2)(pqxV ==s
LA f.g.m [ ] 2
12)(qeq
pqeqptM tt
x-
=-=-
PROPIEDADES
1. No tiene memoria2. Es decreciente, es decir P[x]<P(x-1) 3,2="x
Ejemplo
1. Si la probabilidad que un postulante para aprobar la tesis en un intento alfinalizar sus estudios académicos es del 75% ¿cuál la probabilidad de que unpostulante apruebe la tesis?
a) En el primer intentob) En el segundo intentoc) En el cuarto intentod) Cual su esperanza matemática
SOLUCIÓN
Como X~G(p)Þ P(x)=0.75(0.25)x-1 Rx =1,2,3...donde p=0.75; q=0.75; “Nº deintentos hasta aprobar la tesis”
a) Primer intento X=1 )Þ P(x=1)=(0.75)(0.25)1-1=0.75=75%b) Segundo intento X=2Þ P(x=2)=(0.75)(0.25)2-1=0.1875 @ 19%c) Tercer intento X=4Þ P(x=4)=(0.75)(0.25)4-1=0.0117@ 2%
Ejemplo
2. Suponga que la probabilidad de obtener línea durante la mayor congestión dellamadas telefónicas de un canal de TV es del 3% en cada intento que se haga.
Calcular la probabilidad de que sean necesarios exactamentea) 6 intentos para tener líneab) A lo más 3 intentos
SOLUCIÓN
X~G(p)ÞP(x)= 0.03(0.97x-1 : Rx= 1,2,3,….
p =0.03 : q =0.97 Þ x: “Nº de intentos hasta obtener línea” Rx= 1,2,3,….
a) x= 6 intentos ÞP(x=6) = 0.03(0.97)6-1 = 0.0258b) x£ 3ÞP(x£ 3)= F(x=3)= 1-qx= 1-0.973= 0.0873
P(x£3)=
0873.002823.00291.003.0)97.0(03.0)97.0(03.0)97.0(03.0)( 2103
1=++=++=å xP
DISTRIBUCION BINOMIAL NEGATIVA O PARCIAL
Es otro caso especial de la Binomial y es una extensión de la Geométrica, que seutiliza cuando los experimentos aleatorios son también un proceso Bernoulli, hastaque ocurra el n-ésimo éxito:
DEFINICIÓN
Se dice que una v.a.d. ).(.~ pvPx donde:
r = Nº de exactos obtenidosp = probabilidad del éxitoX:” Nº de veces o intentos que se realiza el experimento Beunoulli hasta obtener réxitos” tal que r£ x; Sii
FUNCION DE PROBABILIDAD
[ ] ( ) ( )...2:1,:11
)( --=÷÷ø
öççè
æ--
=== - vvvPqpvx
xxPxP xvxv
FUNCION DE DISTRIBUCIÓN F(x)
( )rxSirxSi
qprk
xxP rkr
³<
÷÷ø
öççè
æ--
îíì
=£ -å ::
110
LA MEDIA
pvqp
vx
xxE vxv =÷÷ø
öççè
æ--
== -å 11
)( m
LA VARIANZA
2222 )()(
prxExV
q
=-== ms
Ejemplo 1
Una maquina se utiliza para fabricar ciertos chips en serie se sabe que laprobabilidad de cada chip sea defectuosos es del 10%. Si se controla la calidaddel CHIP producido sabiendo que la máquina se apaga cuando se producen 4chips defectuosos; cual es la probabilidad de que la máquina pare en el 10mochip producido.
p=10q =90v=4x=10
( ) ( ) ( )
[ ]
( ) [ ] ( ) ( ) 0045.0.......0(849.01.014110
10
10:"4º:"
...6,,4:9.01.0141
),(.~
4104
44
==÷÷ø
öççè
æ--
===Þ
==Þ
=÷÷ø
öççè
æ--
==
-
-
xPAP
xAparemaquinalaAsdefectuosocontrolarhastaproducidoschipsdeNx
TRx
xPpvPx xx
Ejemplo 2
La probabilidad que un CPU de cierta marca expuesto a cierto virus se contagie esdel 0.40. cual es la probabilidad de que la 10ma CPU expuesto sea al 3ra encontraerla
SOLUCION
p =0.40q =0.60v =3x =10
( )
[ ] ( ) ( ) 0645.060.040.029
10
310expº:"
,...2,1,::11
),(.~
73 =÷÷ø
öççè
æ==
++÷÷ø
öççè
æ--
== -
xP
contraerlaenlaseahastavirusaluestosCPUsdeNx
vvvxqpvx
xPpvPx
aa
vxv
DISTRIBUCIÓN MULTINOMIAL
Es una generalización de la distribución Binomial, se utiliza cuando se tienenensayos o experimentos aleatorios que tienen más de 2 posibles resultados,donde las probabilidades de los resultados son los mismos en cada ensayo, todoslos ensayos son independientes.
DEFINICIÓN
Sea un experimento aleatorio ε que tiene las siguientes características1) tiene K posibles resultados E1,E2.... Ek que son:
a. Mutuamente excluyentes jiEjE ¹"= f.:I
b. Colectivamente exhaustivos W==
i
k
iE
1U
2) La [ ] å=
=-==k
iiii PquetalresultadoesimoideléxitodeladprobabilidpEP
1
1
Se dice que las vs.as.ds. ( ) kipnlMultinomiax ii ...3,2,1:,.~ =
Donde Xi:”Nº de veces que el evento Ei ocurre en los n ensayos
Rxi=[0,1,2...n];i=1,2,3...k Sii
FUNCIÓN DE PROBABILIDAD P(x1,x2.... xk)= kxk
xx
kppp
xxxn ...
!!...!! 21
2121
MEDIA E(xi)=npi
LA VARIANZA V(xi)= npiqi donde qi=1-pi i=1,2,...k
EjemploLas probabilidades de que una lamparilla de cierto tipo de proyector dediapositivas dura
menos de 40 hrs. de uso continuo es 0.30Entre 40 y 80 hrs. de uso continuo es 0.50Ó de mas de 80 hrs. de uso continuo es 0.20 respectivamente
Calcular la probabilidad de entre 8 lamparillas:2 duran menos de 40 hrs.5 duran menos de 40-80 hrs.1 dura más de 80 hrs.
SOLUCIONSean los eventosE1:”Duran menos de 40 hrs”ÞP[E1] = 0.30E2:”Duran entre 40 y 80 hrs”ÞP[E2] = 0.50E3:”Duran menos de 80 hrs”ÞP[E3] = 0.30
Como å =W===
1)( 1
3
1EPademasUyEjE
ii fI
( )slamparillaentreientoEocurreelevdevecesqueNx
pnlMultinomiax
i
iii
8)3,2,1(º:".~
=Þ
0945.0)20.0()50.0()30.0(!1!5!2
!8)1,5,2(152
152
3
2
1
==Þ===
Pxxx
EjemploLa probabilidades que una declaración de impuestos sea llenado correctamente es del 60%que tenga un error favorable del declarante es del 20%que tenga un error favorable al fisco es del 10%que tenga ambos tipos de errores es del 10%
Se elige al azar 10 de tales declaraciones para una auditoria
Cual es la probabilidad que
5 estén correctas; 3 tengan error favorable al declarante1tenga error que favorece al fisco y1temga ambos tipos de error.
SOLUCIONSean los eventosE1: “Declaración correcta”ÞP[E1] = 0.60E2: “Declaración favorable al declarante”ÞP[E2] = 0.20E3: “Declaración favorable al fisco”ÞP[E3] = 0.10E4: “Declaración error de ambos tipos”ÞP[E4] = 0.10Como 1)( 1 == EPademasEjE i fI
( )ii plMultinomiaxUE ,10.~1ÞW=nesdeclaracioentreiEeventoelocurrequevecesdeNx i 10)4,3,2,1(º:" =
0314.0)10.0()10.0()20.0()60.0(!1!1!3!5
!10)11,3,5( 1135 ==P
DISTRIBUCIÓN HIPERGEOMÈTRICA
Esta distribución se utiliza generalmente cuando se realiza un muestreo sinrepetición de una población finita N conocida que se divide en : 2 clases M éxito yN-M fracasos, donde la probabilidad del éxito ya no es constante porque en cadaextracción es diferente por lo tanto los ensayos ya no son independientes, tienemucha aplicación cuando se efectúa control de calidad.
DEFINICIÓN
Se dice que una v.a.d X ~ H(N,nM)ó h(x:NnM)donde
N =tamaño de la poblaciónX:”Nº exactos en un m.a. de tamaño n sin reposiciónn =tamaño de la m.a. ó Nº de extracciones Rx=[0,1,2..Min (n, M) SiiM =Nº de elementos exitosos
FUNCION DE PROBABILIDAD
[ ] ( )MnMinR
nN
xnMN
xM
xxPxp c ....2,1,0:)( =
÷÷ø
öççè
æ
÷÷ø
öççè
æ--
÷÷ø
öççè
æ
==
FUNCION DE DISTRIBUCIÓN
[ ]
9,(
00
1
0),(0)(
MnMinxSi
xSii
x
kMnMinx
nN
knMN
kM
xxPxF
³
<
=
<£
÷÷ø
öççè
æ
÷÷ø
öççè
æ--
÷÷ø
öççè
æ
ïïï
î
ïïï
í
ì
=£= å
MEDIA
úûù
êëé=== å N
MnxPxxE )()( m
VARIANZA
úûù
êëé
--
úûù
êëé -úûù
êëé==
11)( 2
NnN
NM
NMnxV s factor de corrección
EjemploComo parte de un estudio sobre la contaminación del aire un Ing. Geológicodecide examinar la emisión de gases tóxicos de 6 de los 24 camiones de una CIAsi 4 de esos camiones, emiten cantidades de gases tóxicos. Cual es laprobabilidad de que:
a) Ninguno de ellosb) Mas de 3 emitan gases
SOLUCION
Como se trata del control de calidad X~H(N,n,M)
N = 24n = 6M =4 éxitosN-M = 20 fracasos
( )
[ ] 0014.0134596
190624
4620
44
)4()4(3)
2880.0596.134760.38
624
0620
04
0)
4,3,2,1,0
6246
204
)(
==÷÷ø
öççè
æ÷÷ø
öççè
æ-÷÷
ø
öççè
æ==³=>
==
÷÷ø
öççè
æ
÷÷ø
öççè
æ-÷÷
ø
öççè
æ
==
=
÷÷ø
öççè
æ
÷÷ø
öççè
æ-÷÷
ø
öççè
æ
=
å PxPxPb
xPa
xxx
xP
EjemploEn el laboratorio de Sistemas hay 20 CPUs donde existen 6 CPUs condesperfecto. Si se elige aleatoriamente 4 CPUs para su reparación.
a) cual es la probabilidad de que al menos 1 CPU deba ser reparadob) cual es el Nº esperado de CPU para ser reparado y su varianza
SOLUCIONComo se trata de control de calidad y se tiene el tamaño de la población
N = 20n = 6M =4N-M = 14
X~H(N,nM)
Donde X: “Nº de CPUs que tienen desperfecto de entre 20”
Rx=0,1,2,3,4
( )
7074.0600.7376.5
1916
2014
2024)(
120420
2061
2064
11)(
2.12064)()
7934.0
420
414
06
1)0(11)
==÷øö
çèæ÷øö
çèæ÷øö
çèæ=
úûù
êëé
--
úûù
êëé -úûù
êëé=úû
ùêëé
--
úûù
êëéúûù
êëé=
=úûù
êëé=úû
ùêëé=
=
÷÷ø
öççè
æ
÷÷ø
öççè
æ÷÷ø
öççè
æ
-=£-=³
xV
NnN
NM
NMnxV
NMnxEb
xPxPa
APROXIMACIÓN DE LA HIPERGEOMETRICA A LA BINOMIAL
Cuando la población N es grande con relación a n es máximo el 10% de N;n£0.1N Þpor lo tanto el muestreo puede ser con o sin reemplazo, por lo tanto laprobabilidad del éxito son casi independienteÞ se puede aproximar a la binomial
con MqnMp -== 1:
)(...2,1,0:1):(),,,( nMMInxNM
NMxnMxbMnNxh
xnxn=÷
øö
çèæ -÷
øö
çèæ÷øö
çèæ@@Þ
-
LA MEDIA
úûù
êëé»==
NMnnpE x m
LA VARIANZA
úûù
êëé -úûù
êëé»==
NM
NMnnpqxV 1)( 2s
EjemploUna importación de 100 computadoras, de las cuales 25 se sabe que tienendesperfecto. Se realiza un control de calidad para ello se toman 10 computadoras,cual es la probabilidad:
a) de que 2 tengan desperfectosb) cual el Nº esperado de CPUs con desperfecto y para ello utiliza la
verdadera distribución y una aproximación si se puede
SOLUCIONComo se trata de control de calidad
La verdadera distribución X ~ H(N.n.M)
÷÷ø
öççè
æ
÷÷ø
öççè
æ--
÷÷ø
öççè
æ
=Þ
nN
xMMN
xM
xp )(
N = 100n = 10M =25N-M =75
X: “Nº de computadores que tienen desperfecto entre 10
( )
( ) 5.21002510)
292.0
10100
875
225
2)
10....2,1,0
=úûù
êëé=
=
÷÷ø
öççè
æ
÷÷ø
öççè
æ÷÷ø
öççè
æ
==
=
xEb
xPa
Rx
Como n=10 £N 10/de 100Þse puede aproximar mediante la binomial
( ) ( ) 2515.075.025.02
10)2()
0751
25.010025
82 =÷÷ø
öççè
æ=-
=-=
===
xpa
NMq
NMp
DISTRIBUCIÓN MULTIVARIADA
Es una extensión de la hipergeométrica y se aplica cuando se realiza control decalidad de una población que se clasifica en k clases de diferentes tipos M1, M2, Mk
Tal que N= i
k
iMU
1=donde se extraen un m.s. de tamaño n sea reposición de una
población tamaño N, donde:a) Cada extracción tiene k posibles resultadosb) Los ensayos no son independientes
DEFINICIÓNSe dice que los vs.as.ds. Xi ~ Multivariante
Donde Xi=”Nº de objetos del i-esimo tipo”
Rxi=0,1,2... Mn(Mi,n) Sii tal que å = nxi
FUNCION DE POBABILIDAD
P(xi,x2... xk: N,n)=÷øö
çèæ
÷÷ø
öççè
æ÷÷ø
öççè
æ÷÷ø
öççè
æ
N
k
k
n
xM
xM
xM
...2
2
1
1
EjemploEn un depósito hay 20 TV de los cuales 10 son de 20’’: 6 de 18’’ ;4 de 15’’, se eligeal azar 10TV. Cual es la probabilidad de que haya 5 de 20’’, 3 de 18’’ y 2 de 15’’.SOLUCION
Como N= M1+ M2+M3=10+6+4=20Þxi ~Multivariado
M1=Nº TV de 20” = 10Þx1 =5 Xi: “Nº de TV del i= esimo tipo” i=1,2,3M2= Nº TV de 18”=6ÞX2=3 Rxi=0,1,2,3,4
M3= Nº TV de 15”=4ÞX3=2 1637.0189.46
560.7
1020
24
36
510
)10:20:2,3,5( ==
÷÷ø
öççè
æ
÷÷ø
öççè
æ÷÷ø
öççè
æ÷÷ø
öççè
æ
=p
DISTRIBUCIÓN DE POISSON
Por su aplicación es una de las mas importantes tanto como Proceso Poisson ocomo aproximación a la Binomial
1) COMO PROCESO POISSON
Se considera como proceso, cuando la v.a.d. X es el Nº de eventos queocurren en un intervalo de tiempo o en una región espacio o volumen.
DEFINICIÓN
Se dice que una v.a.d. x ~ ótp )(l x~ );( txf i ldonde l =Nº promedio de ocurrencias de eventos en una unidad de medida:que pueden ser intervalo de tiempo, región especificad, dichas ocurrenciasson independientes Sii
FUNCIÓN DE PROBABILIDAD
..71828.2...3,2,1,0:)()( ===== - exetxXPxP tx ll
dondel t = Nº promedio de ocurrencias de los eventos en las t unidades demedidacuando t= fijoÞ l t=a
3,2,1,0:!
)()( =-
===-
xx
exxPxPx aa
FUNCIÓN DE DISTRIBUCIÓN
[ ]
ïïï
î
ïïï
í
ì
³=£=
<-
=å 0
!)(
00
0
xkexxPxF
xSikx a
a
a
LA MEDIA alm === txE )(
LA VARIANZA als === txV 2)(
USO DE TABLAS
Para facilitar el calculo se tiene confeccionados tablas en función dedistribución
[ ] ):()( lxFxxPxF =£=
En caso de valores puntuales [ ] ):1();(),( lll --=== xFxFxfxxP
Ejemplo
Supongan Que llegan en forma aleatoria una serie de llamadas a unacentral telefónica con promedio de 3 llamadas por minuto. Calcular laprobabilidad de que ocurran:
a) 4 o más llamadas en el periodo de un minutob) 4 o mas llamadas en el periodo de 2 minutosc) 4 o mas llamadas en el periodo de 20 segundosSOLUCIONComo la ocurrencia de los eventos se da en periodos de tiempo )(.~ tPx l
Donde l = 3 llamadas t=1 minuto ...3,2,1,0!
3)(3
==Þ-
xxexP
x
x:”Nº de llamadas en un minuto
a)
( ) ( ) [ ] ( ) ( ) ( ) ( )[ ]
3520.0627
29
13
131
!33
!23
!13
!031
32101314
03
33323130
4
=úû
ùêë
é+++-=
úû
ùêë
é+++-=
+++-=£-==³
-
----
¥
å
e
eeee
PPPPxPxPxP
b) ( ) ( ) ( ) 849.0151.013131462*3 =-=-=£-=³Þ== FxPxPtlc) ( ) ( ) 019.09801.01)3(131)4(13 3
1 =-=-£-=³Þ== FxPxPtl
2) COMO APROXIMACIÓN A LA BINOMIAL
Cuando la muestra N y la probabilidad del evento es muy pequeño existedistribución binomial, es decir p<0.1 y np£5: p£0.005: n³20: n>30
Entonces se puede utilizar la PISSON como límite o aproximación de labinomial
Donde ctenpxE Þ== l)(
2,1,0!
ˆ!
)( ==÷øö
çèæ»=
--
xxepnxb
xetxP
x
i
tx lll ll
FUNCION DE PROBABILIDAD ctenpxxexP
x
====-
ll l
...3,2,1,0!
)(
FUNCION DE DISTRIBUCIÓN
[ ]ïî
ïíì
³=£=
<-
=å 0:
!)(
0:0
0
xkexxPxF
xSikx
k
ll
LA MEDIA lm === npxE )(
LA VARIANZA npxV === ls 2)(
Ejemplo
Se sabe que el 5% de la CPUs ensamblados en cierta factoría tieneensamblaje defectuoso. Cual la probabilidad de que 2 de 100 CPUsensamblados estén defectuosos:
a) mediante la verdadera distribuciónb) mediante una aproximación
SOLUCION
n =100p = 0.05q = 0.95
( ) ( )
( ) ( )
0842.02
)(25!2
5)2(
2,1,0:!
5)(5)05.0(100
)
0812.095.005.02)2(
"500º"
100...3,2,1;95.005.0)()05.0;100(.~)
552
5
2102100
10100
====
==Þ===
=÷øö
çèæ==
=
=÷øö
çèæ=Þ
--
-
-
-
eexP
xxexPnp
POISSONlaaónaproximaciunamedianteb
xP
entresensambladamalCPUsNx
xxxpbxa
x
xx
l
PROPIEDAD REPRODUCTIVA
Si 2 o mas variables tienen una misma distribución entonces la resultantede sumar o restar será una nueva variable que tendrá la misma distribuciónde probabilidad que sus sumandos.
Si Xi ~ misma distribución .~1
YxSi i
n
i=å
=
misma distribución i= 1,2...n
Si nPX iii ,...2,1)(.~ ="a
åå =Þ=Þ=
i
n
ii PYxY aa
1(.~
Ejemplo
En una fabrica el Nº de accidentes por semana sigue un proceso dePOISSON con parámetro 2=a .
Determinar:
a) la probabilidad de que haya 4 accidentes en el transcurso de 3 semanasb) la probabilidad que haya 2 accidentes en una semana y otros 2
accidentes en la semana siguiente
c) Es lunes y ya hubo un accidente. La probabilidad que en aquellasemana no haya mas de 3 accidentes
SOLUCION
Definiendo las variables POISSON con parámetro 3,2,1:2 == iiaX= “Nº de accidentes en cualquier semanaX1: “Nº de accidentes en la 1ra semana”X2: “Nº de accidentes en la 2da semana”X3: “Nº de accidentes en la 3ra semana”
Como las 3 v.a son independientes 6222(.~321 =++=++=Þ aPxxxY
( ) [ ]
8348.08647.0
1429.08647.0)1(
)0()3()1(
)31()1(
)1(3(13)
22
0733.0!2
2)2()2()22()
"3º:"1339.0!4
6)4()
21
22
2121
64
=-
=
³£-£
=³³£
=³
³Ù£=³£
==
=÷÷ø
öççè
æ=====Ù=
===
-
-
xPxPxP
xPxP
xPxPxPxxPc
exPxPXxPb
semanasenaccidentesdeNYeYPa
aa
DISTRIBUCIONES CONTINUAS
Los espacios muéstrales continuos y las v.a.c. surgen cuando se trabaja concantidades que se miden en una escala continua (velocidad de una CPU; lacantidad de alcohol en la sangre, la cantidad de nicotina en un cigarrillo, etc.)
Entre las principales distribuciones de probabilidad continua tenemos la uniforme,la experimental, la norma, algunas distribuciones muéstrales como la Chicuadrado, la t estudiante, la Fisher, etc.)
LA DISTRIBUCIÓN UNIFORME X~U [a,b]
DEFINICIÓN
Se dice que una v.a.c. X tiene distribución uniforme o rectangular en el intervalo [a,b] tal que a< b Sii
FUNCION DE PROBABILIDAD O DENSIDAD
ïïî
ïïí
ì
££-
= bxa
eocab
xf ;
;0
1)(ab -
1
a c d bPara cualquier sub. intervalo [c, d] donde
[ ] [ ] [ ]abcdcd
ababdx
abdxcPbdca x d
c
d
c --
=--
=-
=-
=££Þ£££ ò 111
además P(x=x) =0
Se dice distribución uniforme porque la [ ]dxcP ££ es la misma para todos los subintervalos que tienen la misma longitud.
FUNCION DE DISTRIBUCIÓN O ACUMULADA
[ ]
[ ]baxSi
bxaSiaxSi
abaxxxPxF
abaxdx
abdx
abxxPxF
x
a
x
³<£
<
ïî
ïíì
--
=£=
--
=-
=-
=£= òòµ0
1
)(
11)(
a b x’LA MEDIA
21)( badx
abxxE
a
b
+=
-== òm
LA VARIANZA
( ) ( )1212
1)(222
22 baóabx
badxab
xxVb
a
-=
-=÷
øö
çèæ +
--
== òs
Ejemplo 1
Suponga que un punto es elegido al azar en el intervalo (1;4)Calcular la probabilidad de que el punto esté:
a) En la posición 3b) El punto este entre 3/2 y 3
SOLUCION
X ~ U[a, b]donde a =1 ; b =4
F(x)
X: “posición del punto en el intervalo [1,4]”
ïïî
ïïí
ì
ïïî
ïïí
ì
³<£
<
--
££=Þ4
411
1141
0
)(;41;
031)(
; xSixSi
xSixxFxxf
eoc
[ ]
[ ]ò
ò
=úûù
êëé=úû
ùêëé -===úû
ùêëé <<
=====
3 3
33
3
3
23 2
3
21
23
31
233
31
31
313
23)
0)0(31
31
31)3()
xdxxPb
xdxxPa
o también mediante la función distribución acumulada
[ ]
21
63
332
31
32
23)3(
2333
23
21
23
==-=-
-=
÷øö
çèæ-=úû
ùêëé £-<=úû
ùêëé << FFxPxPxP
Ejemplo 2
Suponga que cierta línea de transporte publico pasa por un determinado paraderode control o de espera, a un horario estricto con intervalos de 30 minutos duranteel día. Si un pasajero llega a ese paradero en un instante aleatorio durante el día.Calcular la probabilidad de que tenga que esperar:
a) más de 15 minutosb) Exactamente 7 minutos
SOLUCION
X ~ U[0.30]donde a = 0 ; b =30X = “tiempo de espera en minutos del pasajero”
30300
0
301
0300
0
)(;300;
0301)(
;³<££
ïïî
ïïí
ì
=--
££
ïïî
ïïí
ì
=xSi
xSixSi
xxxFxxf
eoc
[ ][ ] 07)
21
3015
301
301)15() 30
15
30
15
==
====> òxPb
minutoxdxxPa
Ejemplo 3Sea la v.a. X...U[0,6] calcular
( ) ( ) ( ) ( )
31
61
651
151]15[1]51[1]232[1]23[1]23[
326:]2[
=+-=
+-=<-£-=££-=
£-£--=£--=>-
==>-
FFxPxPPxPxPxPxP
doreemplazanquesabemosxP mm
DISTRIBUCIÓN EXPONENCIAL
Es un caso particular de la distribución gamma, que se aplica no solo a laocurrencia del 1er acierto en un proceso POISSON, si no también en los tiemposde espera entre los aciertos; también se aplica en la teoría de la confiabilidad deun sistema, y la teoría de colas.
DEFINICIÓN X ~ EXP ( )lSe dice que una v.a.c. X tiene distribución exponencial con parámetro ( )l
FUNCION DE PROBABILIDAD O DENSIDAD
ïî
ïíì ³
=-
eocxexf
x
;00;)(
ll
donde e = 2.71828...:; ( )l = Cte. >0 0 l
1 x
FUNCION DE DISTRIBUCIÓN
1
00
10
][)(³<
îíì
-=£=
- xSixSi
exXPxF xl
l1 x
MEDIA
llm l 1)(
0=== -µ
ò dxexxE x
ll 368.0=e
F(x)
F(x)
VARIANZA
2222
0
22 112)(lll
mls l =-=-== -ò dxexxV xx
Ejemplo 1
Si el Nº de automovilistas que corren a cierta velocidad, que un radar detecta porhora en cierta localidad es una v.a. POISSON con l =8.4 hrs. Cual es laprobabilidad de tomar un tiempo de espera menos a 10 minutos entreautomovilistas sucesivos?
SOLUCION
X ~ EXP( l ) donde l =8.4 hrs.
Donde X: “tiempo de espera en minutos”
00
1
0)(;
;00;4.8)( 4.8
4.8
³<
ïî
ïíì
-=
ïî
ïíì ³
=-
-
xSixSi
exF
eocxexf x
x
Como X =10 minutos x horasmin
hora61
601 =
( )
[ ][ ] 7534.012466.0
4.84.861
)0(4.8)(4.80
4.8
4.8
00
4.8
61
61
61
61
=--=úûù
êëé --=-=
--==úûù
êëé £
---
-- òòeee
dxedxexP
x
x
mediante la acumulada [ ] ( ) 7534.01 )(4.861
61 6
1
=-==< -eFxP
Ejemplo 2
El tiempo durante el cual una marca de computadora que opera en forma efectivaantes de su primera reparación, se distribuye exponencialmente con un promediode fallas de 360 días
a) Si una de estas computadoras ha durado al menos 400 días, cual laprobabilidad de que dure al menos 200 días más
b) Si se están usando 5 de tales ordenadores, cual la probabilidad de que almenos 3 de ellos continúan funcionando después de 360 días
SOLUCION
X~EXP( l )Þ X ~ EXP )(3601
Como E(x)=360= 6011 =Þ ll
00
1
0)(;
;00;)(
360
3603601
³<
ïî
ïíì
-=
ïî
ïíì ³=
-
-
xSixSi
exF
eocxexf x
x
X: “ tiempo que opera el ordenador hasta la primera falla
[ ] [ ] [ ][ ]
[ ][ ]
95
360
360
400 3601
600 3601
400600
400400600400600400200200 -
-
-
==³³
=³
³³=³³=³+³
òò e
dxe
dxe
xpxp
xPxxPxxxxP x
x
a
a
I
Ó mediante la acumulada
[ ][ ]
[ ][ ]
5556.095
3620
360400
360600
360400
360600
360400
360600
11
11
)400(1)600(1
40016001
400600 -=-+-
-
-
-
-
====
úûù
êëé --
úûù
êëé --
=--
=<-<-
=³³ -
eeee
e
e
e
FF
xPxP
xPxp e
RELACION ENTRE EL MODELO EXPONENCIAL Y POISSON
La distribución exponencial tiene una relación especial con la PISSON porqueX~P[ l ]donde X: “N° de veces que ocurre un evento en un periodo “t” conpromedio l ”Þ la v.a. T: “tiempo entre la ocurrencia de 2 eventos consecutivos de POISSONÞ T ~ EXP[l ]
TEORIA DE LA CONFIABILIDAD (Rt)
Una de las aplicaciones principales de la distribución exponencial se da en laconfiabilidad del funcionamiento normal de un sistema o componente electrónico.
DEFINICIÓN
La confiabilidad (Rt) de un sistema en determinado medio ambiente, durante unperiodo “t”, se define como la probabilidad de que su tiempo para fallar (T) excedea su tiempo de funcionamiento normal (t)
[ ] [ ] [ ] tt eetTPtTPtR ll -- =--=£=>=Þ 111)(
Ejemplo
La probabilidad de buen funcionamiento de un elemento de cierto equipo desonido se distribuye exponencialmente con:
eocte
tft
:0
0;02.0
)(02.0 >
îíì
= Determinar la confiabilidad del elemento en un periodo de
50 hrs.
SOLUCION
[ ] 3679.0)50(50 1)50(02.0 ====> -- eeRTP
DISTRIBUCIÓN NORMAL
Es la distribución mas importante de la teoría estadística, porque casi todos losfenómenos físicos, científicos sociales psicológicos, tienen un comportamientonormal, además casi todas las distribuciones bajo ciertos requisitos se puedenaproximar mediante la normal.
DEFINICIÓN
Se dice que una v.a.c. X ~ N( 2,sm ) Sii
FUNCION DE PROBABILIDAD
( )[ ]¥<<-¥
P=
--
xexfx
;2
1)( 2
2/ sm
s
donde71828.2
...1416.3==P
e
CARACTERÍSTICAS
1. Es simétrica respecto aP
=2
1)(s
m xfdonde
2. Es creciente en el intervalo >-¥< m, cuando x< m
3. Es decreciente en el intervalo >¥< ,m cuando x> m
P21
s
F(x)
MoMe ==m
FUNCION DE DISTRIBUCIÓN
dxxfxxxPxFx
)(][)( ò¥=£= ½
m
LA MEDIA
m== ò¥
¥-dxxfxxE )()(
LA VARIANZA
222 )()( sm =-= ò¥
¥-dxxfxxV
DISTRIBUCIÓN NORMAL ESTANDAR
Estandarizar la Normal significa llevaro trasladar la distribución hasta que 0=m y 12 =s
Mediante la v.a.e.= ( )1.0....; Nzz xsm-=
m =0 z z xUSO DE TABLAS
Cuando la v.a.c. X ~ N( 2,sm ) no esta estandarizada ( 1:0 2 ¹¹ sm ), la misma se la
debe estandarizar consm-
=xz y colocar en acumulada F(z)ó ( )zzPz £=)(f
Ejemplo
Sea X...N(5,4)cual la probabilidad de que x
a) toma valores entre 4 y 7?b) Toma valores mayores que 10?
SOLUCION
a)P[4<x<7]estandarizando mediantesm-
=xz
F(x) - 1
P21
s
F(x)
m
F(z)
donde 2;4;5 2 === ssm
[ ] [ ] [ ] 5328.03085.08413.0)5.0()1(5.0115.02
571
54=-=--=-£-<=<<-=úû
ùêëé -
<-
<- FFzPzpzpxP
sm
[ ] [ ] [ ] 0062.0)5.2(15.215.22
51010) =-=£-=>=úûù
êëé -
>-
=> FzpzPxPxPbsm
Ejemplo
El tiempo T requerido para contagiarse un computadora por cierto virus es una v.a.normal con media 31 segundos y desviación estándar 5 segundos.
a) Cual la probabilidad que un ordenador se contagie con el virus en menos de35 segundos
b) Si un ordenador particular se observa que no está siendo contagiado por elvirus en 30 segundos, cual es la probabilidad de contagiarse antes de los35 segundos
SOLUCION
T ~ N(31,5)T: “tiempo requerido para contagiarse una CPU con el virus en segundos”
[ ] 7881.0)8.0(54
5313535) ==úû
ùêëé <=úû
ùêëé -
<-
=< FzPTPTPasm
[ ] [ ][ ]
[ ][ ]
[ ][ ] 63.0
5793.03674.0
)2.0(1)2.0()8.0(
2.08.02.0
30353030/35)
53130
53135
53130
==--
--=
-><<-
=>
<<=
><<
=><-
--
FFF
zPzP
zPzP
TPTPTTPb
PROPIEDAD REPRODUCTIVA
La distribución normal también goza de esta propiedad, es decir:Sean n.v.a. independiente : X1+ X2+...+Xn donde Xi...N ( )2; ii sm si sumamos dichas
variables å=
=n
ii Yx
1~ ( )sm 2; yyN donde åå
==
==n
iiy
n
iiy
1
22
1; ssmm
÷÷ø
öççè
æ=Þ åå
==
n
iiy
n
iiNY
1
22
1
;.~ ssm
Ejemplo
Sea una v.a. 32
2x
xxy i -ú
û
ùêë
é += donde Xi...N ( )2; ii sm ; i =1,2,3
5;11;52525;20
23
22
21
321
======
sssmmm
a) Cual la distribución de probabilidad Y?b) Calcular P[Y>0]
SOLUCION
Como Xi...N ( )2; ii sm =Y...N ( )2; yy sm
donde
[ ]
[ ]
( ) ( ) ( )[ ] ( )
[ ])9;7(.~
39511541
41
2
725162021
)()(21
2)(
2
3213212
321321
-Þ
=Þ=++=
++=÷øö
çèæ -
+==
-=-+=
-+úûù
êëé -
+==
NY
xvxvxvxxxvyv
ExxExExxxEyE
yy
y
y
y
ss
s
m
m
[ ] 0099.09901.01)33.2(137
3)7(00 =-=-=úû
ùêëé >=
úúû
ù
êêë
é -->
-=> FzP
YPYP
y
y
sm
TEOREMA CENTRAL DEL LIMITE
Este es el teorema mas importante de la estadística, porque mediante la mismanos permite aproximar a la distribución normal sumas finitas de v.a.independientes, que pueden tener cualquier distribución de probabilidad conmedia y varianzas conocidas
DEFINICIÓN
Sea una sucesión de n. v. a. i.: X1, X2, ... Xn
Cuyas medias E(Xi)= im y cuyas varianzas V(Xi)= 2is (conocidas y finitas)
Þ Si sumamos los n.v.a.i.: X1+X2+...+ Xn=Yn, con la condición que los Xicontribuyan con una cantidad mínima despreciable a la variación de la suma
Þ La v.a.e. de la variación: 1) )1.0(.~;2
1
2
11 NZY
xZ n
i
in
n
ii
n
ii
n
ii
n
åå
å
åå -=
-
=
=
==
s
m
s
m
CASO ESPECIAL
Cuando Xi....MISMA DISTRIBUCIONÞ La secuencia de las n.v.a.i.: X1,X2,..., Xn
Þ E(Xi)= m y V(Xi)= 2s
Þ Yn=X1+X2+...+ Xn=å 1x
2)n
nx
n
nxxZ
iiin s
m
s
m
s
m ååååå -
=-
=-
=22
ó también dividiendo entre “n”
( ))1.0(.~; NZn
xZ n
n
nn
nnx
n
i
sm
s
m-
=-
=åå
Ejemplo1
Suponiendo que la vida útil de un componente electrónico de uso continuo, tienedistribución exponencial, con un promedio de 100 hrs. Tan pronto como sedeteriora, es reemplazado por otro para que continúe funcionando.
a) calcular la probabilidad de que durante 209,5 días se necesiten mas de 36de estos componente
b) cuantos de estos componentes se necesitan par que duren al menos 4536hrs., con una probabilidad de 0.9901
SOLUCIONComo ÷
øö
çèæl1.~EXPX i donde X: “Duración del i=esima componente” en horas”
I=1,2,......36Donde l
lÞ== 1001)(xE
;100;1001)( 22 === s
lxV Yn: “tiempo total de duración de los n componentes”
n=36
n.u ( )600
3600363610036003610036 -
=-
=-
=Þ= å YYn
nxZ i
ns
m
a) [ ]
[ ] ( ) 9913.038.238.2600
360050285028
36
3636
==<
úûù
êëé -
<Þ=<
FZP
ZPandoestandarizYP
b)
[ ] [ ][ ]
643.64018.8018.8
33.2100
100536.4
0099.0100
100536.4
0099.09901.01536.49901.0536.419901.0536.4
22 »=Þ==Þ=
=-=-
=úû
ùêë
é -£
=-=£=£-Þ=³
nxnX
nXhaciendoecuaciónlaoresolviendn
n
críticovaloreldonden
nZP
adoestandarizYPYPYP
n
n
nn
Ejemplo 2
La longitud que se puede estirar sin ruptura un filamento de nylon es una v.a.exponencial con media de 5000 pies. Cual es la probabilidad aproximadamenteque la longitud media de 100 filamentos este comprendido entre 4750 y 5550 pies.
SOLUCION
úûù
êëé5000
1.~: EXPX
X: “longitud de estiramiento sn ruptura del i-esimo filamento” i=1,2....100
[ ] ( )
[ ] 5558.03085.08643.0)5.0()1(1.15.0100
500010050005550100
50005000457055504750)5000(1)(
)(50001)(
100
1002
2
=-=--=££-=
úû
ùêë
é -££
-=££=÷
øö
çèæ=
-===
FFzP
zxPxV
andoestandariznxZporxE nn
s
rl
sm
l
APROXIMACIONES DE LAS DISTRIBUCIONES DISCRETAS A LA NORMAL
Mediante el teorema central del limite, se pueden aproximar distribucionesdiscretas a la norma, para ello se debe convertir un v.a continuo, mediantefactores de corrección de acuerdo a las siguientes situaciones:
[ ] [ ][ ] [ ][ ] [ ][ ] [ ][ ] [ ][ ] [ ]5.05.0)6
5.0)55.0)4
5.0)35.0)2
5.05.0)1
+££-=££+³=>-³=³
-££=<+££=£
+££-==
bxaPbxaPxxPxxPxxPxxP
xxxPxxPxxxPxxP
xxxPxxP
RESUMEN DE LAS APROXIMACIONES MEDIANTE
)1.0(.~2
NZX
Zi
iiÞ
-=
åå å
s
m
DISTRIBUCION REQUISITO MEDIA VARIANZA V.A ESTANDARCORREGIDA
BINOMIAL
21
2121
;
;5
;10
>>
£>
»>
pnq
pnp
pnnpqxV
np=
=)(
ll
npqnpxZ -±
»5.0
HipergeométricaNn
Nn05.01.0
³³
êëéúûù
êëé -úûù
êëé=
úûù
êëé=
1)(NM
NMnxV
NMnm [ ]
[ ][ ]11
5.0
---
-±»
NnN
NM
NM
NM
n
xZ
POISSON5>¥®
lnn
ls
lm
=
=2 l
ln
nxZ -±»
5.0
Ejemplo 11 si la v.a. X....b(20;0.5) calcular la P[x =7]a) De manera exacta, b)Aproximada
SOLUCION
Sabemos que nxqpxxP xnxn
...2.1.0;)( =÷÷ø
öççè
æ= -
Donde n=20p=0.5q=0.5
a) Exactamente o con la verdadera distribución binomial
( ) ( ) 0739.05.05.07)7( 13720=÷÷
ø
öççè
æ==xP
b) Aproximadamente mediante la Normal
Donde np =10 corrigiendo ]5.075.07[ +££- xP
( )( ) [ ][ ] [ ][ ] [ ]( ) ( ) 0732.057.112.1
57.112.1
5.75.624.25.05.010
24.2105.6
24.2105.7
=---=-£--£=
£-£
££Þ=--
FFZPZP
ZPZP
andoestandarizxPnpq
Ejemplo 2
[ ]5.75.6 ££ xP[ ]5.75.6 ££ xP
Suponga que la probabilidad de que cierta marca de CPU, esta en serviciodespués de 1 año es 0.80. Si la “U” adquiere 35 de tales CPUs. Cual laprobabilidad de que
a) 7,b)al menos 5 de las CPUs adquiridos NO esta en servicio después de 1año?
SOLUCION
X~b(n,p)Þ X~b(35;0.20)n = 35; p =0,20; q =0,80
Como n = 35>10 y p=0.20<0.5 podemos aproximar mediante la Normal con np=7 y3664.26.5 ==npq
a)
[ ] [ ]
[ ] [ ] [ ]
1664.0)21.0()21.0(
21.021.02113.02113.03664.2
75.73664.2
75.6
5.05.75.67
=--=
-£-£=££-=úûù
êëé -
££-
Þ
-±=££==
FF
ZPZPZPZP
npqnpxZdondexPxP
b)[ ] [ ] [ ] [ ]
[ ] 8554.0)06.1(1056.113664.2
75.41
515.45.055
=--=-<-=úûù
êëé -
£-=
<-=³=-³=³
FZPZP
xPxPxPxP
Ejemplo 3
El tiempo que un cajero de un banco emplea para atender a un cliente es una v.a.con media 3.1 minutos y una desviación estándar de 1.7 minutos. Si se observanlos tiempos y corresponden a 64 clientes ¿Cuál la probabilidad de que el tiempopromedio de los mismos sea por menos 3.4 minutos?
SOLUCIÓN
Como X .~ P(x)
647.1
1.31.3
2
==
==
==
ns
ls
lm [ ] [ ]( ) [ ]
0793.09207.01)41.1(1
41.117.1
641.34.31
4.36414.364
=-=-=
<-=úû
ùêë
é -<-
<-=>
F
zPzP
xPxP
UNIDAD II
DISTRIBUCIONES MUESTRALES
Competencia:
-El estudiante debe saber utilizar las diferentes distribuciones muestrales ,es decir lasdiferentes distribuciones de cualquier estadístico estimado a partir de muestras aleatoriaspara realizar eficientemente la Inferencia Estadística
Objetivos.
-Utilizar correctamente el concepto de muestra aleatoria en las diferentes distribucionesmuestrales ,para realizar generalizaciones respecto de una población en base a estadísticos
Descripción general de la unidad:-Esta unidad comprende el desarrollo de los siguientes conceptos:Población-ParámetroMuestra aleatoria-Estadístico; Distribución muestral:de la Media ,Diferencia de Medias,dela Proporción y la diferencia de Proporciones,de la Varianza y razón de Varianzas,con susrespectivas distribuciones especiales como: la “t” student,La Normal,La “Chi Cuadrado” yLa “F” de Fisher.
Lectura:Millar/Freund/Jonson “Probabilidad y Estadística paraIngenieros”Edo.de México 1992 Pgs. 187 al 205 Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e InferenciaEstadística((2ª ed) Perú .Pags.559 al 623
Referencia electrónica:http://www.itcomitan.edu.mx/tutoriales/estadística/contenido/unidad_2_4.html
INTRODUCCIÓNSe llama distribución muestral, cuando la variable resulta ser un estadístico o estadígrafo, calculado enbase a los datos de una m.a.Estos estadísticos se utilizan para realizar inferencia estadística para la toma dedecisiones, respecto alguna característica de la población ó respecto a ladistribución de la misma.Para desarrollar las distribuciones muéstrales es necesario recordar algunosconceptos básicos:POBLACION f(x);P(x);X,YEstadísticamente población es el conjunto de todas las observaciones posiblesque puede tomas una v.a. X. Por lo tanto la distribución de la población es ladistribución de la v.a. X. Las poblaciones de acuerdo a su magnitud pueden ser:POBLACIONES FINITAS (N)Son aquellas que están limitadas o acotadas
POBLACIONES INFINITASSon aquellas que no están imitadas, estadísticamente las poblaciones muygrandes se las consideran infinitas.- El proceso para obtener la información de toda la población es el CENSO
PARÁMETROS
Son todas las medidas descriptivas que caracterizan a la población como porejemplo la media = m, la varianza s2 etc. Los parámetros se denotan con las letrasgriegas
MUESTRA ALEATORIA(m.aÞn) una m.a. de tamaño “n” es un subconjunto representativo de lapoblación, el proceso para obtener la información se llama muestreo
ESTADISTICO,Son todas las medidas descriptivas que se obtienen a partir de la información de alm.a. como por ejemplo: la media = x , la varianza= S2 etc. Generalmente se lasdenota con las letras castellanas.
DEFINICIÓN DE m.a.
Dada una población f(x);P(x) ó X con media m y varianza s2
Se llama m.a. De tamaño “n” al conjunto de n.v.a X1, X2,... Xn tal que satisfacen 2requisitos:
1. Xi son independientes donde la distribución conjunta esa) Si X es discreta )()()....()(),....,( 2121 xPXpXPXPXXXP nn P==Þb) Sí X ex continua )()()....()(),....,( 2121 xfXfXfXfXXXf nn P==Þ
2. Xi tienen la misma distribución Xa) f(xi) = f(x)ó P (xi)= P(x); i=1,2…nb) 2)(;)( sm == ii xVxE
Nota. Esta definición es valida cuando:1. La población es infinita con ó sin reposición2. La población es finita, con reposición
EjemploSea una población X~N (m,s2), se toma un m.a. tamaño n X1, X2,... Xn
a) Escribir la función de probabilidad conjunta de la m.a.b) Sí n = 6 ; m=20; s2 =25 Calcular la probabilidad de que b) X1 +X3+ X4
-X6 sea mayor que 52DEFINICIÓN
como X~N (m,s2) sabemos que f(x)=
2
21
21
÷øöç
èæ-
-
P
s
m
s
x
e
a) la función de probabilidad conjunta de la m.a. de tamaño “n” es
f(X1, X2,... Xn)= [ ]
n
niini
x
exfxfxfxfxfúúú
û
ù
êêê
ë
é
P==P=
÷øöç
èæ-
- 2
21
21)()()()...()( 2
sm
s
b) Sí X1 +X3+ X4 -X6 =Y por la propiedad reproductivaÞY~N(mysy2), donde:
my=E(Y)=E(X1 +X3+ X4 -X6)= E(X1)+E(X3)+E( X4 )-E(X6)=20+20+20-20=40
sy2=V(Y)= V(X1 +X3+ X4 -X6)= V(X1)+V(X3)+V( X4 )-V(X6)=25+25+25-25=100
sy=10
Mediante el teorema central del limiteY
YYZsm-
=Þ ;~(0.1)
[ ] [ ] [ ] ( ) 1151.02.112.112.110
405252 =-=£-=>=úûù
êëé -
>=>Þ FZPZPZYP
DISTRIBUCIÓN MUESTRAL DE LA MEDIA
Sea una población X con media m y varianza s2 del cual se toma una m.a. detamaño n: X1, X2,... Xn del cual se obtiene su media muestral x
ÞSe cumple:
a) ;)( m=xE
b)n
xV2
)( s=
c) ( )sm nxZ -
= ; ~N (0.1)
Nota
1) Cuando xn Þ¥® ~ ÷÷ø
öççè
æn
N j
2sm cuando n³ 30, no importa si la población
es discreto o continuo
2) Cuando n³ 2 si X~N(m,s2)Þ x ~ ÷÷ø
öççè
æ
nN
2sm
3) Si el muestreo es sin reemplazo de una población finita de tamaño N
ÞV( x )= ÷øö
çèæ
--
=1
22
NnN
nx s
s factor de corrección
EjemploSuponiendo que una población consta de los siguientes valoresobservados:3,4,7,9,12. Calcular
a) La media y Varianza poblacionalesb) Determinar la distribución muestral de la media de la m.a. de tamaño 2
escogidos con reposiciónc) Se extrae una m.a de tamaño 36 con reposición cual la [ ]85 ££ xP
SOLUCIÓN
Como N=5Þ 75
129743=
++++==å
Nxim
å ===-=-= 2863.3;8.105547
5299)( 2222 sms xPx
b) La distribución muestral de la media se obtiene mediante:
x P( x ) x P( x ) 2x P( x )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )
( )12.12
12.9
12.7
12.4
12.3
9.12
9.9
9.7
9.4
9.3
7.12
7.9
7.7
7.4
7.3
4.12
4.9
4.7
4.4
4.3
3.12
3.9
3.7
3.4
3.3
12
9
7
4
3
12
5.10
5.9
8
5.7
12
5.10
9
8
5.6
6
9
5.9
8
7
5.5
5
8
5.6
5.5
4
5.3
4
5.7
6
5
5.3
3
3 7
x
x
x
x
x
33.5455.566.577.5899.510.512 25
125
225
2
251
254
252
251
252
252
252
252
251
252
251
253
2512
259
25144
TOTAL25
175
( ) ( )
( ) 4.5725
1360)(
725
175
2222 =-=-==
====
å
åms
m
xPxxV
xPxxEx
x
c) Se extrae una m.a. tamaño 36 con reposición
n = 36 sabemos que x ~( )
smsm nxZy
n-
=2
,
7=m
( ) ( )úû
ùêë
é -££
-==
2863.33678
2863.3367512863.32 ZPs
[ ] [ ] [ ]( ) 9664.009664.065.3)83.1(
65.383.183.165.3=-=--=
-£-£=££-ÞFF
ZPZPZP
DISTRIBUCIONES ESPECIALES UTILIZADAS EN PRUEBAS
Cuando las m.a, son pequeñas n<30 no se pueden suponer que la distribuciónmuestral es NORMAL, TAMPOCO SE PUEDE APLICAR EL teorema central dellimite, por lo que se debe recurrir otras distribuciones muéstrales las especialesque estén relacionadas con la NORMAL;entre estas distribuciones tenemos: laCHI-cuadrado, la t-Student y la F de Fisher
DISTRIBUCIÓN CHI CUADRADO 22aXÓX R
Es un caso particular de la distribución gamma, tiene muchas aplicaciones entreellas para la construcción de IC y las pruebas de Hipótesis de la Varianza
DEFINICION
Sean r v.a. independientes: Z1,Z2,…Zr tal que Zi~N (0.1)
Sumando los cuadrados å=
=++r
iir ZZZZ
1
2222
21 ~ 2
rX grados de libertas, Sii
FUNCIÓN DE DENSIDAD
( ) ( )ïî
ïíì
¥<<=-- XeXxf
XV
r rx 0;2
122
22
1
2h
;esc
Donde h = función gammar = grados de libertad o Nº de variables
CARACTERÍSTICAS
1) A medida que aumente los grados de libertad tienden a normalizarse2) LA MEDIA rxE == )( 2m
3) LA VARIANZA rxE 2)( 22 ==s
PROPIEDAD REPRODUCTIVA
Sean K v.a. independiente: X1, X2,... Xk tal que Xi ~ X2(ri)
ÞSi sumamos å 2iX ~ 2
1÷÷ø
öççè
æå=
k
iir
X
FUNCIÓN DE DISTRIBUCIÓN
[ ] aa
a ==£= ò dxxfXxPxFx
)()(2
0
2
Cuando [ ] [ ] aaa -=£-=> 11 22 XxPXxP
USO DE TABLAS
Dada la importancia y la complejidad de su calculo, se tiene confeccionado tablas,en base a la función de distribución con 2 entradas, donde:
La 1ra columna representa los grados de libertad “r”La 1ra fila representa el nivel de significancia ó probabilidad 10 ££aLa intersección de fila columna de le valor critico 2
aX
R=1
R=3 R=7 R=10
aa-1
F(x)
Ejemplo 1
X ~ 226X Determinar las siguientes probabilidades
a) [ ]29.17£xPb) [ ]88.38³xPc) [ ]64.4584.13 ££ xPd) [ ]40£xP
SOLUCIÓN
Como v=26
a) [ ] [ ] 10.029.17 210.0 =£=£ XxPxP
b) [ ] [ ] [ ] 05.095.01188.38188.38 295.0 =-=<-=<-=³ XxPxPxP
c)[ ] [ ] [ ] [ ] [ ] 965.0025.099.084.1364.4564.4584.13 2
025.02
99.0 =-=£-£=£-£=££ XxPXxPxPxPxP
d) [ ] [ ] 96.040 296.0 =£=£ XxPxP mediante interpolación
96.0409.41
975.09.3840
95.0
975.0
9.4140
95.0
9.38=Þ
--
=--
¯¯¯ aaa
a
Ejemplo 2
Si X~ 2rX hallar los valores críticos:
a) “a” tal que [ ] 30999.0 ==£ rsiaxPb) “a” y “b” tal que [ ] 1395.0 ==££ rsibxaP ; además ( ) 023.0=> bxPc) “a” tal que ( ) 8015.0 ==£ rsiaxP
a) [ ] [ ] 7.59999.07.5930999.0 =Þ=£Þ==£ axPrsiaxP
b) [ ] ( ) 95.0)(95.0 =£-£Þ=££ axPbxPbxaP
como 7.24975.0025.01025.0)(1025.0)( =Þ=-Þ=£-Þ=> bbxPbxP
c) ( ) 8015.0 ==£ rsiaxP
interpolando
8267.13533.018.2015.001.0
53.018.2
025.001.0025.0015.0
18.265.118.2
01.0
65.1
015.0025.0
18.2
=-=Þ--
=--
--
=--
¯¯¯
a
a
aa
DISTRIBUCIÓN MUESTRAL DE LA VARIANZA
DEFINICIÓN
Sea una v.a. ó una población X~N(m,s2) donde m,y s2 son desconocidos, por lotanto se toma una m.a. de tamaño n para estimar la media x y la varianza S2 talque
a) x y S2.son dos estadísticos independientes donde( )
nxx
S iå -=
22 además la
varianza muestral insesgada es( )
1ˆ
22
-
-=å
nxx
S i
b) El estadístico ( )2
2ˆ1s
Sn - ~X2(n-1) g.d.l. cuando ¥®n
c) ( ) ( )n
nSE2
2 1s-=
d) 2
2
snS ~ X2(n-1) g.d.l.
EjemploSe tiene una población X ~ N(m,s2)del cual se toma una m.a. tamaño 15 y se tieneS2. Calcular:
a) úû
ùêë
飣£ 9427.13107.0 2
2
sSP ;
b)úúû
ù
êêë
飣 0814.2
ˆ3329.0 2
2
sSP
SOLUCIONa)
( )[ ][ ] [ ] [ ][ ] [ ] 98.001.099.0
6605.41405.291405.296605.4
)15(9427.115.03107.09427.13107.0
201.0
214
299.0
214
214
214
214
2142
2
=-=<-<Þ
£-£=££Þ
££=úû
ùêë
飣
XXPXXPXPXPXP
XPSPs
;
b)
[ ][ ] [ ] [ ]
98.001.0991.06606.491396.291396.26606.4
)14(20814.0)14(3329.00814.2ˆ
3329.0
214
214
214
2142
2
=-=£-£=££Þ
££=úúû
ù
êêë
飣
XPXPXP
XPSPs
DISTRIBUCIÓN t –STUDENT (T)- Es otra distribución relacionada con la NORMAL y la gamma que se usaprincipalmente en las estimaciones y en las pruebas de hipótesis de la mediacuando las m.a. son pequeñas:n<30
DEFINICIÓNSean 2 variables aleatorias independientes:
- Z ~ N(0.1); Y ~ 2RX dividiendo ambas variables
Þ=ÞrY
ZT Se dice que tiene una distribución t-student con v grados de libertad
Sii
FUNCION DE PROBABILIDAD
( ) ( )( )[ ] ¥<<-¥+
P=
+
tr
tf rt
r
r
:12
2
21
h
h
Esta distribución está completamente determinado solo por el parámetro rGráficamente tienen las siguientes características
1) Es simétrica con respecto t=0=m2) Cuando n o v se hace grande tiende a normalizarse3) Tiene mayor dispersión que la normal
t=0=mESPERANZA MATEMÁTICA
( ) 1;0)()( >==== ò¥
¥-rdttftTExE m
VARIANZA
( ) ò¥
¥->
-=-=-== 2;
20)()()( 22222 v
rrdttftttETV ms
USO DE TABLAS
N(0.1)
r=5
r=3
Dada la importancia en la Estadística Inferencial y la complejidad de su calculo, setiene confeccionado tablas con 2 entradas.
Esta tabla esta confeccionada en función de la acumulada [ ]tTP £ Donde en laprimera fila se tiene los percentiles o probabilidades en la primera columna setiene los grados de libertad n ó r, la intersección de fila columna corresponde a losvalores críticos at Porque [ ] a
a
aa ==£ ò- dttftTPt
)(
Como la distribución es simétrica aa --=Þ itt
Ejemplo
Determinar el valor critico de [ ]90.0tTP £ con v=5 g.d.l.
SOLUCIÓN
[ ] 90.0176.1 =£TP
EJEMPLO 2
Determinar el valor crítico de [ ]10.0tTP £ con v=5 g.d.l.
SOLUCIÓN
[ ] [ ] [ ] 010476.190.010.01 =-£=£=£ - TPtTPtTP
DISTRIBUCIÓN DE ( )S
nx m- ~t(n-1)g.d.l.
LA V. A. O ESTADÍSTICO
Ejemplo
Si x es la media y S2 es la varianza de una m.a. de tamaño 9 seleccionado de unapoblación NORMAL con media 90=m Calcular
f(t)
at
[ ][ ] [ ] [ ]
245.075.0995.07059.03549.33549.37059.0
91183.192353.01183.1902353.0
888
=-=£-£=££
££=úûù
êëé £
-£
TPTPTP
TPs
xP
DISTRIBUCIÓN F O DE FISHER X~ ( )órrF 21 , ~21 ,; rrfa
Esta distribución especial generalmente se utiliza para comparar las varianzas de2 v.a independientemente o de 2 poblaciones normales, mediante los IC y laspruebas de hipótesis sobre sus varianzas mediante la razón de las mismas
DEFINICIÓN
Sean 2 v.a. independientes V~ 22r
x y r~ 22rx
Si se donde2
1
rV
rU
F = ~ ...)( 21 ldgrrF Sii
FUNCIÓN DE DENSIDAD
( ) ( )( ) ( ) ahh
h<<
ïïî
ïïí
ì
=+
Zvv
Zf vv
vv
F
vv
0;
022
21221
212
21
21
Cuya gráfica nos permite determinar sus características
1) A medida que aumentan losgrados de libertad tienen anormalizarse de manera positiva
MEDIA
2;2
)()( 22
2 >-
=== vv
vFEF mm
2) VARIANZA
( )( )
4;4)2(
2)()( 22
221
21222 >
---+
== vvvv
vvZvFVFs
ff(2)F(10.2)
F(10.2)
FUNCIÓN DE DISTRIBUCIÓN O ACUMULADA
( ) [ ] aa =£= fFPxF
Cuando [ ] [ ] aaa -=£-=> 11 fFPFFP
criticovf .=a
USO DE TABLAS
Se tiene 3 entradas:
La 1ra columna representa los g.d.l. del denominado r2La 2da columna representa la probabilidad (p=a )La 1ra fila representa los grados de libertad (g.d.l.) del numerador r1La intersección de filas columnas nos da el valor critico af
Ejemplo 1
Si X ~ )5.4(F hallar probabilidadesa) [ ]39.7£xPb) [ ]4.11>xPc) [ ]8£xPd) [ ]0645.0£xP
SoluciónComo v1= 4: v2=5a) [ ] [ ] 975.039.7 975.0 =£=£ fxPxPb) [ ] [ ] [ ] 01.099.0114.1114.11 99.0 =-=£-=£-=> fxPxPxPc) [ ] [ ] 9773.08 9773.0 =£=£ fxPxP interpolando
Ejemplo 2Si F ~F(6,10) Hallar el valor “c”(valor crítico) tal quea) [ ] 99.0=£ cxPb) [ ] 05.0=³ cxP
SOLUCIÓNa) [ ] [ ] 246.099.0246.099.0 =Þ=£Þ=£ cxPcxP
b) [ ] [ ] ( )[ ] 22.395.022.3
95.005.0105.0===³=
=<==<-Þ=³cxP
cxPcxPcxP
DISTRIBUCIÓN MUESTRAL DE LA PROPORCION
1-aa
F(x)
Sea una población X~b(n.p) Donde se desconoce p, se toma una m.a. tamaño “n”:
X1, X2,... Xn se estima la proporciónnx
np =
+++=
X...XX n21
Donde
1) ( )xEnn
xEpE p1)( =÷
øö
çèæ== m de la distribución binomial E(x)=np
reemplazando pnpn
pE ==1)(
2)( )
npqnpq
n
xVnn
xVpV
==
=÷øö
çèæ=
2
2
1
)(1
de la binomial V(x)= npq
( )n
pPÓnpq
npqpV pp
)1( -==Þ= ss
3) Cuando nnpq
ppZcavla -=Þ¥® ... :Z~N(0.1)
Nota 1 Si la m.a. de tamaño”n” se obtiene de una población finita de tamaño N Sinreemplazo
1--
=ÞN
nNnpq
ps
ZppZN
nNnpq
:1-
-
-=Þ ~N(0.1)
El factor de corrección por continuad en la distribución muestral de proyección es
n21
EjemploSuponiendo que un lote de 50 ordenadores hay 10 defectuososCual la probabilidad de que en una m.a. de tamaño n, ordenadores elegidos alazar
1) Con reposición a)n=5 b)n=60 :i)20%; ii) más de 20% ordenadores seandefectuosos
2) SIN REPOSICION
SOLUCION
1. con reposición :n=5; 80.0:205010
=== qp
a)i) X~b(5;0.20) dondeX:”Nº de PC ordenadores entre 5 con reposición
( ) 5...2,1,0:)80.0(20.0)( 55
=÷øö
çèæ= -
xxx RxxP
x= el 20% de 5=1
[ ] ( )( ) 4096.08.020.01)1(20.0 45=÷
øö
çèæ==Þ=Þ xPpP
[ ] [ ] [ ] 2627.07373.01)20.0;5;1(111120.0) =-=-=£-=>=> BXPXppPii
b)i) con n=60 como n>30 podemos aproximar mediante la normal
[ ] [ ] [ ]5.125.111220.0 ££==== xPocorrigiendxPpP
Estandarizando mediante0984.3
12)80.0)(2.0(60
)20.0(60 -=
- xxZ
( ) [ ]
[ ] [ ] ( ) ( ) ( ) ( )1272.01)16.0(2
16.0116.016.016.016.016.0
16.016.00984.3
125.120984.3
125.1112
=-=+-=--=-£-£
££-=úûù
êëé -
££-
==
FFFFFzPZP
ZPZPxp
Mediante la binomial ( ) ( ) 1278.08.020.012)12( 481260=÷
øö
çèæ==xP
Aplicando la verdadera distribución de la proporción, mediante
npq
ppZ -= donde el factor de corrección es
n21
úû
ùêë
é+££-Þ=
)60(2120.0
)60(2120.0)020( pPpP
[ ]2083.01917.0 ££ pP ; estandarizado
[ ]16.016.020.02083.00201917.0
60)80.0)(20.0(
60)80.0)(20.0(
££-=úú
û
ù
êê
ë
é -££
- ZPZP
[ ] [ ] ( ) ( ) ( ) ( )( ) 1272.01)5636.0(2116.02
16.0116.016.016.016.016.0=-=-=
+--=--=-£-£F
FFFFzPzP
ii) [ ]Þ> 20.0pP Binomialmente
[ ] [ ] =-=£-=> å )(11211212
0
xPxPxP como es demasiado largo recurrimos
mediante la aproximación a la normal, mediante
[ ] [ ]5.1215.01215.0£-=+£-Þ
-±= xPxp
npqnpxZ donde np=(60)(0.2)=12
estandarizando [ ] 4364.05636.01)16.0(116.010984.3
125.121 =-=-=£-=úûù
êëé -£- FzPzP
mediante la distribución de la proporción
=-
=npq
ppZ cuyo factor de corrección es n21
[ ] [ ] úû
ùêë
é+£-=£-=>
)60(2120.0120.0120.0 pPpPpP
[ ]
[ ] ( ) 4364.05636.0116.0116.010516.00083.01
20.02083.01tan2083.0160
)80.0)(20.0(
=-=-=£-=úûù
êëé £-=
úú
û
ù
êê
ë
é -£-Þ=>-
FZPzP
ZPdarizandoespP
UNIDAD IIIUNIDAD III :ESTIMACION PUNTUAL Y POR INTERVALOS
Competencia:
-El estudiante debe saber construir los diferentes Intervalos de Confianza a partir de lasestimaciones puntuales utilizando las diferentes distribuciones de cualquier parámetro ,parapoder realizar Inferencia Estadística
Objetivos.
-Utilizar correctamente el concepto de Estimación Puntual para la construcción eficiente deIntervalos de Confianza de cualquier parámetro sujeto de investigación ,para poder realizargeneralizaciones respecto de la población en estudio y tomar decisiones coherentes
Descripción general de la unidad:
-Esta unidad comprende el desarrollo de los siguientes conceptos:Estimación-Estimador ,Tipos de estimación:Puntual ,las propiedades de un buen estimador puntual y porIntervalos de Confianza,La construción de los Intervalos de confianza de: La media,diferencia de medias,(muestras grandes y pequeñas),la proporción y la diferencia deproporciones,la varianza y la razón de varianzas ,utilizando las respectivas Distribucionesespeciales muestrales.
Lectura:Millar/Freund/Jonson “Probabilidad y Estadística paraIngenieros”Edo.de México 1992 Pgs.208 al 213
Córdova Zamora “Estadística Descriptiva e Inferencial” 2ª ed.Perú 1996Pags,333 al 375 Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e InferenciaEstadística((2ª ed) Perú .Pags.627al 684
Referencia electrónica: http://e-stadistica.bio.ucm.es/mod_intervalos5.html
ESTIMACIÓN PUNTUAL Y por INTERVALOS DE CONFIANZA
INTRODUCCIÓN
La teoría de la inferencia estadística se divide en 3 grandes áreas:
1. La estimación2. Las pruebas de hipótesis3. la teoría de la decisión
ESTIMACIÓN ESTADÍSTICA
Estadísticamente la estimación es el proceso por el cual se aproxima el valor decualquier parámetro desconocido de una población ( rssm ,,, 2 ) mediante losestadísticos ( .,,,, 2 etcvSSX ) etc. obtenidos de una m. a. tomados de la población.
PRUEBA DE HIPÓTESIS
La prueba de hipótesis o docimasia de hipótesis consiste en comprobar, verificarconfirmar o rechazar si algún parámetro j ó alguna función dej es igual algúnvalor preconcebido de j
TEORÍA DE LA DECISIÓN
La teoría de la decisión trata sobre las diferentes estrategias y diversos criteriosde decisión, para la toma de decisión frente a la incertidumbre.
MÉTODOS DE ESTIMACIÓN
Para estimar parámetros en base a m.a. y sus estadísticos se tiene 2 métodos deestimación: 1) PUNTUAL 2) POR INTERVALOS DE CONFIANZA
ESTIMACIÓN PUNTUAL
Se dice que una estimación puntual cuando se obtiene un solo valor para cadaestadístico que nos permite aproximarnos al valor del parámetro en cuestion.
ESTADÍGRAFO
Llamado también estadístico, es toda medida descriptiva que se obtiene de la m.a. y que sirve para estimar parámetros. Por lo tanto el estadígrafo esta en funciónde la m.a.
),...,( 2,1 nXXXGY = cuyo valor ( )nxxxgy ,..., 21=
PARÁMETRO jEs toda medida descriptiva que sintetiza alguna característica de la población cuyovalor se obtiene de toda la población
),...,( 21 nXXXf=j cuyo valor ( )nxxxg ,..., 21=jESTIMADOR jSe llama estimador de un parámetro a cualquier estadígrafo: ),...,( 21 nxxxgy = quenos permite aproximar al valor del parámetro.
- Un mismo parámetro puede tener varios estimadores puntuales, se elegiráaquel que se aproxime mas al valor del parámetro j
- Para poder elegir el mejor estimador se debe recurrir a:LAS PROPIEDADES DE UN BUEN ESTIMADORSe dice que un estimador es un buen estimador si cumple minimamente lossiguientes requisitos o propiedades.
1. INSESGABILIDADSea un estimador cualquiera j del parámetro j , entonces se dice que esINSESGADO sii
La [ ] [ ] 0ˆˆ =-= jjjj EóE2. CONSISTENCIA
Se dice que un estimador insesgado es consistente sii
a) Lim [ ]¥®=
nE jj
b) [ ]¥®=
nVlím 0j
3. EFICIENCIAConsiderando todos los posibles estimadores insesgados de unparámetroj , será eficiente aquel que tiene mínima varianza, llamándosetambién estimadores de mínima varianza del parámetro j .Sean dos estimadores insesgados jjj dey 21 ˆˆ
Þsi ( ) ( ) ( )( ) Þ<< 1
ˆˆˆˆ2
121 j
jjj
VVóVV el estimador 1j es mas eficiente que 2j
4. ERROR CUADRÁTICO MEDIO (MSE) jSea un estimador ( )nxxxG ...,ˆ 21=j un jj deˆ
( ) [ ] ( ) ( )[ ]22 ˆˆˆˆ jjjjjj EVarEMSE -+=-=Þcuando el estimador es insesgado ( ) ( )jj ˆˆ VarMSE =Þ
EFICIENCIA RELATIVA Sean dos estimadores 21 ˆˆ jj y con ( )1jMSEÞ y( )2jMSE
Þ la eficiencia relativa de 2j respecto de 1j se define como:( )( ) Þ<1
ˆˆ
2
1 SIMSEMSE
jj
2j es mas eficiente que 1j
Ejemplo
Se tienen 2 v.a o dos poblaciones X1 y X2 distribuidas independientemente
X1 ~ ( ) ( ) ( ) 211
2 ;2,2 sjsj ==Þ XVXEIX2 ~ ( ) ( ) ( ) 2
222 ;4,4 sjsj ==Þ XVXEI
Donde j es el parámetro poblacional en cuestión; para ello se proponen 2estimadores:
510ˆ;
84ˆ 21
221
1XXXX
+=+= jj Cual de los 2 estimadores es el mejor, elija de acuerdo
alas propiedades de un buen estimador
SOLUCIÓN1) INSESGABILIDAD sabemos que ( ) jj =ˆEPara el 1er estimador 1j Para el 2do estimador 2j
( ) ( ) ( ) ( )2121
2121
51
101
510;
81
41
84XEXEXXEXEXEXXE +=úû
ùêëé +=+=úû
ùêëé +=
( ) ( ) ( ) ( ) insesgadoesinsesgadoes 21 ˆ4512
101;ˆ4
812
41 jjjjjjjj Þ=+Þ=+
EFICIENCIA Será eficiente aquel estimador que tenga mínima varianza
( )
( ) ( ) ( )211
211
641
161ˆ
84ˆ
XVXVV
XXVV
+=
÷øö
çèæ +=
j
j ;
( )
( ) ( ) ( )212
212
251
1001ˆ
510ˆ
XVXVV
XXVV
+=
÷øö
çèæ +=
j
j
( ) ( ) 22
2221 100
5ˆ645
641
161ˆ sjsssj ==+= VV
( ) ( )Þ>Þ>= 212
2
ˆˆ15625.1
1005645
jjs
sVVcomo El estimador 2j es mas eficiente que 1j
2) CONSISTENCIA Deben satisfacer 2 requisitos
a) Lim [ ] [ ]¥®¥®==
nnVlímóE 0ˆˆ jjj
[ ] jjj ==¥®¥® nn
límE limˆ1 ; [ ] jjj ==¥®¥® nn
límE limˆ2
[ ] 0limˆ 252645
1 === ¥¥®¥®
ssjnn
límV ; [ ] 0limˆ 252100
52 === ¥
¥®¥®
ssjnn
límV
significa que ambos estimadores son consistentes
MÉTODO DE ESTIMACIÓN PUNTUAL
La estimación puntual se lo puede realizar principalmente por 2 métodos:1) mediante la máxima verosimilitud2) mediante los momentos3)1) METODO DE LA MÁXIMA VEROSIMILITUD (M.V.)
Este método se fundamenta en el principio de elegir el valor del parámetro j aestimarse para el cual );,...,( 21 jnXXXf es la probabilidad conjunta de obtener losvalores muestrales es una función máxima.De acuerdo a este método se obtiene estimadores
a) suficientesb) insesgados y de mínima varianzac)
DEFINICIÓN
Sea una v.a. X cuya función de probabilidad: f(X, j ) depende del parámetro j quese desconoce, para ello se toma una m.a. tamaño nXXXn ,...,: 21 cuyos valores
ÞnXXX ,..., 21 la función verosimilitud de la m.a. se define
( ) ( ) ( ) ( ) ( ) ( )jpjjjjj ,,...,,,,...,12121 XifXfXfXfXXXfV
n
inn=
=== , si X es continuo
( ) ( ) ( ) ( ) ( ) ( )jpjjjjj ,,...,,,,...,12121 XipXpXpXpXXXpV
n
inn=
=== , si X es discreta
El método de M.V. consistente en tomar como valor estimadoj , el valor quemaximice la v (j ) para ello se debe logaritmizar
( ) ( )jj ,lnln xfVL å== luego se debe derivar e igualar a 0
( )0
ln== å
jj
djd
SxfSL i
Nota.- Cuando la distribución de probabilidad tiene varios parámetrosdesconocidos, se obtendrán tantas ecs. Como parámetros estimarAsí si se tiene K parámetros a estimar kjjj ..., 21
0...:0021
===Þk
LLLdjd
djd
djd
EjemploObtener el estimador de M.V. de lal probabilidad de éxitos “p” para una v.a.x~Bernoulli, mediante el método de la M.V.
SOLUCIÓNSabemos que x~B(1,p) dondeP(x)= xx pp -- 1)1( ; x=0.1 donde 0<p<1Sea una m.a. tamaño nXXXn ,...,: 21 cuyos valores nxxx ,..., 21 donde
1) x~B(1,p) ( ) nipppxp xxi
i ,...2,1;)1(, 11 =-=Þ -
2) ( ) ( ) ( ) ( ) ( )åå --
==-===Þ iiii xxxx
n
ii
n
ipppppxppV 11
111,1, pp
3) Þaplicando logaritmos ( ) ( )pXnpxpVLn
iii -úû
ùêë
é-+==Þ åå
=
1lnlnln1
4) Þderivando con respecto a p e igualando a cero ( ) 011
=--
-+= åå
pxn
px
pL ii
dd
5) Resolviendo la ecuación
xpnx
px
np
xn
pxxn
pp
pxn
px
i
i
ii
iii
=Þ=Þ=Þ
-=--
=-
Þ-
-=
åå
ååååå
ˆˆ1
111;11
2) MÉTODO DE LOS MOMENTOSEste método consiste en igualar los primeros momentos muestrales originales conlos primeros momentos poblacionales originales ''
vv M=m
Donde ( ) ( ) kvxpxxxEM kirrr
v ,...2,1:...,, 21' ==== åå jjj
( )nx
xEMvir
vå=='
( )dxxfx kiRx
vv jjjm ...,, 21' ò=
EjemploSea una m.a. tamaño nXXXn ,...,: 21 de una población X con distribución POISSONcon parámetro l Se pide estimar l .mediante el método de los momentos
SOLUCIÓNComo solo se debe estimar un solo parámetrol , solo debemos hallar los primerosmomentos originales poblacionales y muestrales e igualarlos
Sabemos å ===== XnXMXE 1'
1'1 ;)( lmm
Igualando XM =Þ= lm ˆ'1
'1
ESTIMACION POR INTERVALOS DE CONFIANZA
INTRODUCCION
La estimación puntual aunque reúna todas las propiedades de una buenaestimación (insesgamiento, consistencia, eficiencia) adolece de una desventaja yes que no nos proporciona ningún nivel de significación y/o de confianza. Por lotanto es necesario recurrir a otro tipo de estimación que nos permite algún nivel designificación que es la estimación por intervalos de confianza.
INTERVALO ALEATORIO
Es aquel intervalo que tiene por lo menos uno de sus extremos una variablealeatoria.
INTERVALO DE CONFIANZA (IC)
Sea una v.a. o una población X cuya DISTRIBUCIÓN de probabilidad: f(X; j )donde el j se desconoce
Þ Se toma una m. a. de tamaño n: X1, X2 ,....Xn cuyos valores : x1, x2 ,....xn del quese toman 2 estadísticas 1j = G (X1, X2 ,....Xn); 2j = G (X1, X2 ,....Xn) talque 1j < 2j : para los cuales se cumple: [ ] )%1(100%10021 ajjj -==££ vP
donde
v= nivel de confianza Þ 100%a = nivel de significanciaÞ 0%
1j = limite inferior del IC para el parámetro j
2j =limite superior del IC para el parámetro j
NIVEL DE CONFIANZA (r) Y NIVEL DE SIGNIFICACIONa
La elección de los niveles de confianza y/o de significación depende delinvestigador los que generalmente son:
r= 0.90 0.95 0.975 0.98 0.99a = 0.10 0.05 0.025 0.02 0.01
CLASES DE INTERVALOS DE CONFIANZA
De acuerdo al tipo de sus limites se tiene 3 clases de IC. Suponiendo una v.a. ouna población X con DISTRIBUCIÓN de probabilidad ( )j;Xf del que se toma unam.a. tamaño nÞ 1j = G (X1, X2 ,....Xn); 2j = G (X1, X2 ,....Xn) tal que 1j < 2j
Þ tenemos:
1. BILATERAL [ ] [ ]2121; jjjjj ££óP =100v%2. UNILATERAL INFERIOR [ ] [ ]jjj £¥£ 11 óP =100v%3. UNILATERAL SUPERIOR [ ] [ ]22; jjja £- óP =100v%
NOTA.- Para construir un IC para j es necesarioa) Elegir el nivel de confianza rÞ 1: (99%, 95%, 90%) ó
Elegir el nivel de significancia a Þ 0: (1%, 3%, 10%)b) Hallar 2 estadísticos 1j y 2j tal que 21 jj £
INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL ( m ) CUANDOSE CONOCE LA VARIANZA POBLACIONAL ( )2s EN MUESTRAN GRANDES
30³nSea una v.a. o una población X~ ( )2,sm donde se desconoce m, pero se conoce( )2s , se toma una m. a. grande 30³n del que se estima la media X
Þ El IC para m con ( )2s (conocido) 30³n = úû
ùêë
é±
nZ
X 0s
ERROR
donde [ ]2
10
rZZPZ +=£Þ
NOTA1. Cuando no se conoces y la m.a. 30³n Þ se utiliza S2. Cuando X~N ( )2,sm , aun cuando n<30, la definición del IC es valida3. Cuando el muestreo es SIN REPOSICION de una población finita, se debe
corregir el ERROR
Þ El IC=úúû
ù
êêë
é
--
±1
0
NnN
nZ
Xs
4. Cuando se quiere construir el IC para el total ÞÞ [ ] [ ] %100,;, 22 vNTOTALNPóNN =££ jjjj
Ejemplo
Un analista de mercado desea estimar el ingreso per cápita familiar mensuales deuna determinada población. Para ello toma una m.a de tamaño 100 de esapoblación la cual determinó que el promedio del ingreso familiar es de $us. 500.-.Suponiendo que el ingreso familiar mensual sigue una distribución normal condesviación típica igual a $us. 100.-
a) Construya un IC para la media del ingreso familiar de toda esa poblaciónb) Construya un IC para la media del ingreso familiar de toda esa población si es
de 2000c) Construya un IC para el total de ingreso familiar de toda esa población, al nivel
del 95%
SOLUCIÓN
a) Sabemos que el IC para m, con 2s (conocida) cuando 30³n = úû
ùêë
é±
nZ
X 0s
Donde v=0.95 Þ [ ] 96.1975.02
95.01975.000 =Þ=
+=£Þ ZZZPZ
100100500 ==»= nSX s
EL ERROR = 6.19100
)96.1(10000 ===nZs
nZs
6.5196.19500;4.4806.19500 02
01 =+=ú
û
ùêë
é+==-=ú
û
ùêë
é-=
nZS
XnZS
X jj
Þ El IC para m al 95% =[480.4;519.6]ó [ ] 95.06.5194.480 =££ mP
Significa que de 100 m.a que se toma de esa población; 95 m.a arrojaran unpromedio comprendido en el intervalo y solo 10 m.a. no se están comprometidoen el IC.
b) Como se conoce N=2000 Þ IC para m al 95% Þúúû
ù
êêë
é
--
±1
0
NnN
nZ
Xs
Þ ERROR= ( ) 11.1912000
1002000100
96.1100=
--
11.51911.19500;89.48011.19500 21 =+==-= jj
Þ El IC para m al 95% =[480.89; 519.11]ó [ ] 95.011.51989.480 =££ mP
c) El IC para el total al 95%= [ ] [ ] [ ]1038220;961780)2000(11.519);2000(89.480;, 2 ==NN jj
TAMAÑO MUESTRAL PARA ESTIMAR LA MEDIA
Para determinar el tamaño de la m.a cuando se quiere estimar la mediapoblacional mediante el IC, se presenta 2 situaciones
a) Cuando el muestreo se hace con reposición ó cuando no se conoce la
población se toma su errornZ
E 0sÞ del cual se despeja n
20÷÷ø
öççè
æ=
EZ
ns
b) Cuando el muestreo se hace sin reposición, es decir cuando se conoce la
población, se toma su errorúúû
ù
êêë
é
--
Þ1
0
NnN
nZs del cual se despeja n
)1(2220
220
-+=
NEZNZ
ns
s
Ejemplo
Un grupo de 50 animales experimentales reciben una cierta clase de raciones porun lapso de 2 semanas. Sus aumentos de pesos arrojan los valores X =420 grs. yS=60 grs.
a) ¿Que tamaño debe tomarse, si se desea que X difiera de m por menos de 10grs. con 0.95 de probabilidad de ser correcto?
b) Encontrar el IC del 95% para m ?
SOLUCIÓN
a) Como el ERROR=10=2
00÷÷ø
öççè
æ=Þ
EZS
nnZs
además v=0.95 =Z0=1.96
( ) 13830.13810
96.160 2
»=÷øö
çèæ=n
b) Como n=138Þ El IC para m al 95% = ( )138961.160
420±
[ ] [ ]0108.430;99.4090108.104207473.11
6.117420 =±=úûù
êëé ±
O =P( 409.99 ≤ m≤ 430.0108) = 0.95
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE 2POBLACIONES CON DESVIACIONES TÍPICAS CONOCIDAS MUESTRALESGRANDES ( )30, ³mn
Sean 2 v.a. independiente ó 2 poblaciones, de las cuales se desconocen susmedia, pero se conocen sus varianzas o desviaciones típicas se quiere estimar,mediante un IC del 100v% la diferencia de sus medias ( )yx mm - ; de las cuales setoman 2 m.a. ;grandes y luego se obtienen sus medias respectivas
Ymtamañoam
Y
Xntamañoam
X yyyx
30..
)(.~
30..
)(.~ 22
³¯
³¯
smsm
El IC para ( )úú
û
ù
êê
ë
é+±-=-
mnZyx yx
valyx
22
0%100ss
mm
Donde Z0 se obtiene mediante la [ ]2
10
vZZP +=£
NOTA
1) Si X~ ( )2xxN sm y Y~ ( )2
yyN sm conocidos 22yx y ss aun cuando las muestras son
pequeñas n. m <30 la definición anterior es válida2) Si no se conoce, 22
yx y ss , pero se tienen muestras grandes
El IC para ( )úú
û
ù
êê
ë
é+±-=-
mS
nS
Zyx yxvalyx
22
0%100mm
Ejemplo
Una m.a. de 200 pilas de la marca “A” para calculadores muestra una vida mediade 140 hrs. y una desviación típica de 10 hrs. Otra m.a. de 120 pilas de la marca“B” de una vida media de 125 hrs. Con una desviación típica de 9 hrs. determinar:
a) Un IC del 95% para la diferencia de la vida media de las poblaciones A y Bb) Un IC del 99% para la diferencia de la vida media de ambas poblaciones
SOLUCIÓN
Como x =140 : Sx=10 con n=200 de la marca “A”y =125 : Sy=9 con m=120 de la marca “B”
a) r=0.95 =Z0=1.96 =El IC para ( )úú
û
ù
êê
ë
é+±-=-
mS
nS
Zyxal yxyx
22
0%95mm
1246.2)08401.1(1961209
2001096.1
2222
0 ==+=+=mS
nS
ZE yx
( ) 15125140 =-=- yx El IC para [ ] [ ]12.1788.121246.215%95 £-£=±=- yxyx al mmmm
b) r=0.99 [ ] 575.2995.0299.1
995.00 =Þ==<Þ ZZZP
Þ E=(2.575(1.0840)=2.7913
Þ El para yx mm - al 99%=[15 ± 2.7913]=[12.2087;17.7913]=[12;18]
INTERVALO DE CONFIANZA PARA LA PROPORCIÓN, MUESTRA GRANDE( )30³n
Sea una v.a ó una población X~b(n,p) donde se desconoce la proporciónpoblacional p, se toma una m.a tamaño grande ( )30³n : X1 ,X2 ,....Xn del cual se
estima la proporciónn
x
nxp
iå==ˆ
Þ El IC para “p” al 100v%=úúû
ù
êêë
é±
nqpZp ˆˆ
ˆ 0 donde [ ]2
100
vZZPZ +=£Þ
NOTA
Cuando el muestreo es SIN REPOSICIÓN de una población finita se debe corregir
el modulo error con1-
-N
nN
Þ El IC para “p” al 100v%=úúû
ù
êêë
é
--
±1
ˆˆˆ 0 N
nNnqpZp
Ejemplo
Se toma una m.a. de 600 estudiantes de una población estudiantil 360 sostuvieronsu preferencia por una determinada marca de CPU
a) Hallar el IC del 95% para la proporción “p” de preferencia de dicha marca deCPU
b) Si la proporción de preferencia se estima en 0.6 determine el error máximo deestimación, si se quiere confianza del 98%
SOLUCIÓNa) Sabemos y n=600 ; x=360 6.0
600360
ˆ ==Þ p
Þ El IC para “p” 30³n =úúû
ù
êêë
é±
nqpZp ˆˆ
ˆ 0 ; v=0.95 Þ Z0=1.96
donde el error ( )( ) 0392.0)02.0(96.1600
4.06.096.1ˆˆ0 ===
úúû
ù
êêë
é
nqpZ
Þ El IC para “p” al 95% =[0.6 ± 0.0392]=[0.5608;0.6392]
también [ ][ ] 95.0%92,63%08,56
95.06392.05608.0=££Þ
=££ÞpP
pP
b) Como p =0.6; v=0.98 [ ] 33.299.0298.1
99.00 =Þ==£ ZZZP
Error máximo ( )( ) ( ) 0466.002.033.2600
4.06.033.2 ===
TAMAÑO MUESTRAL PARA ESTIMAR UNA PROPORCIÓNPara estimar el tamaño de la m.a. cuando se quiere construir un IC para laproporción, se toma su error ya sea con reposición o sin reposición dependiendo sise conoce ó no la población
a) Cuando no se conoce la población
2
20
0
ˆˆˆˆE
qpZnnqpZE =Þ=
b) Cuando no se conoce la población ni la p
2
20
4EZ
n =
c) Cuando se conoce la población
proporciónlaestimarparamedialaestimarparaE
Znó
EZ
dondeNnNn
n
NnN
nqpZE
2
20
02
220
0
0
0
4)1(
1ˆˆ
=-+
=
--
=
s
Ejemplo
Una importación de 2000 focos tiene una desviación típica de la duración de losmismos de 100 hrs. El ingeniero de control de calidad desea determinar el tamañode la m.a. para estimar la duración promedio, con aproximación de ± 20 hrs. Delpromedio real con 95% de confianza.
SOLUCIÓNLos datos son s=100; N=2000; E =20 v=0.95 Þ Z0=1.96Como se conoce la población y no se conoce la proporción muestral
Þ utilizamos( )( ) 9265.91
2095192000
199996200096
»==+
=n
EjemploEl gerente de una agencia bancaria que tiene 1000 cuenta correntistas quieradeterminar la proporción de sus cuenta correntistas a los cuales les paga el sueldomensual, Para ello quiere determinar el tamaño de la m.a. con un error de ± 0.05con un 90% de confianzaSOLUCIÓN
Como N=1000; E=0.05; v=0.90 Þ Z0=1.645( )( ) 21439.213
1270271000
9992711000271
»==+
=Þ n
TAMAÑO DE LA MUESTRA PARA POBLACIONES FINITAS
Cuando el muestreo se realiza sin reposición de una población finita, se debeutilizar el factor de corrección, por lo tanto se debe determinar mediante 2 fases:
1ra fase.- Se debe determinar la muestra inicial
2
20
0E
Zn
s= Cuando se quiere estimar la media
2
20
0ˆˆ
EqpZ
n = Cuando se quiere estimar la proporción cuando se conoce p
2
20
04EZ
n = Cuando se quiere estimar la proporción cuando no se conoce p
2da Fase.- Se determina la muestra final
)1(0
0
-+=
NnNn
n donde N= tamaño de la población conocida
Ejemplo
La desviación típica de la duración de cierto “chips” de una determinada fabrica es100 hrs. Para un embarque de 10.000 chips, el gerente de control de calidad de lafabrica, desea determinar el tamaño de la m.a para estimar la duración media conaproximación de ± 20 hrs. del promedio real con 95%
SOLUCION
s=100: N=10.000 n=? E =20 r=0.95 ÞZ0=1.96
De acuerdo al muestreo sin reposición de una población finita
1ra fase
( ) ( )( )
9604.9620
10096.12
22
2
20
0 »===E
Zn
s
2da fase
)1(0
0
-+=
NnNn
n = ( ) 9510095960000
999.9961000096
»=+
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES
Sean 2 poblaciones X~b(n1p1) : Y~b(n2p2) donde se desconocen las proporcionespoblacionales.
Se toman 2 m.a. tamaños grandes 30, 21 ³nn
nxxxn ...,: 211 nyyyn ...,: 212
Se estiman sus proporciones muestrales
111
1 ˆ1ˆˆ Pqynxp -== 22
22 ˆ1ˆˆ Pqy
nyp -==
Þ El IC para P1-P2 al 100v% con 30, 21 ³nn
( ) [ ]2
1ˆˆˆˆˆˆ 002
22
1
11021
vZZPZdonden
qpn
qpZPP -
=£Þúúû
ù
êêë
é+±-
EjemploUn fabricante afirma que su nuevo producto de consumo popular prefieren mas losvarones que las mujeres. Para verificar tal afirmación se toma una m.a. de 250varones hallándose que 175 prefieren el nuevo producto y otra m.a de 200mujeres, hallándose que 120 prefieren el nuevo producto. Mediante un IC del 95%para la verdadera diferencia de proporciones de preferencias entre hombres ymujeres se puede concluir que el fabricante del nuevo producto tiene razón?
SOLUCIÓN
3.0ˆ
7.0250175
ˆ
175var250
2
1
1
=
==
==
q
p
xonesn
4.0ˆ
6.0200120
ˆ
120200
2
2
2
=
==
==
q
p
ymujeresn
Sabemos ;r=0.95Þ Z0=1.96
donde el ERROR
( )( ) ( )( ) 0882.0200
4.06.0250
3.07.096.1 =úúû
ù
êêë
é+=E
21 ˆˆ pp - =0.7-0.6=0.1
Þ El IC para P1=P2 al 95 %[0.1± 0.0882]=[0.0118;0.1882]
ó también p [ ]1882.00118.0 21 £-£ PP
Como la diferencia de la proporción de varones y mujeres que prefieren el nuevoproducto es positivo, se puede concluir que P1>P2, es decir que el fabricante tienerazón al 5% de significancia.
INTERVALO DE CONFIANZA PARA LA MEDIA CON VARIANZA DESCONOCIDAMUESTRAS PEQUEÑAS
Sea una v.a. o una población X~N( 2,sm ) donde se desconocen 2,sm se toma unam.a tamaño pequeño :n<30: nxxxn ...,: 211 del cual se estima n la media y varianza
con( )
1
22
-
-== åå
nxx
Synx
x ii respectivamente
Þ El IC para m con 2s desconocido n<30=nSt
xnSt
x 00 ; +-
NOTA.-1. Cuando el muestreo es un reemplazo de población finita
El IC para m al 100%=úúû
ù
êêë
é
--
±1
0
NnN
nSt
x
2. Cuando se quiere estimar el total = [ ]NN 21 ˆ;ˆ jj
EJEMPLOLos contenidos de 5 latas de café instantáneo de una determinada marca handado los siguientes pesos netos en grs.: 280, 290, 285, 275, 284
a) Construya un IC para la media de todos los contenidos de latas de caféb) Con qué grado de confianza se estima de tal manera que el contenido
promedio d café tenga los límites : 277,432; 288,168
SOLUCIONSuponiendo que los pesos de las latas tienen distribución Normal:
a) Sabemos que el IC para m al 100v%nSt
x 0±
( )6303.57.31
1:8.282
22 ==
-
-=== åå S
n
xxS
n
xx
ii
El 9898.65
)6303.5(776.2==E
El IC para m al 95% =[275.8102;289.7898]
b) Sabemos quenSt
xnSt
x 02
01 ˆ;ˆ +=-= jj
( ) ( )0
02 6303.5
58.282168.2885
6303.58.282168.288ˆ t
t=
-Þ+==j
[ ] 95.02
11319.21319.20 =+
=£Þ=vTPt
( ) %9090.01295.0 ==-=r
INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS CON VARIANZASDESCONOCIDAS, PERO IGUALES, MUESTRAS PEQUEÑAS; n, m<30
Sean 2 v.a. ó 2 poblaciones X~N( 2, xx sm ) : Y~N( 2, yy sm ) donde se desconocer lasmedias, pero que tienen una misma varianza.Se toman 2 m.a tamaño pequeños n<30:m<30 donde se obtienen 22 :;: yX SySx
El estadístico de prueba para ( )yxesyx -- mm
Þ El IC para yx mm - al 100v% = ( )[ ]mncStyx 110 +±-
donde [ ]2
10
vtTP +=£
t0~t(n+m-2)gdl.( )
2)1(1 22
-+
-+-=
mnSmSn
S yxc
EjemploEn 2 m.a. independientes de 10 bolsas de arroz de un kilo de 2 molinera “A” y “B”se encontraron los siguientes porcentajes de grano quebrados por kiloA: 6,5,6,7,4,7,6,4,3,6B: 7,6,7,9,5,8,7,6,10,8Suponiendo que los porcentajes de granos quebrados por kilo en cada molinera sedistribuye normalmente con la misma varianza. Determine un IC del 95% para ladiferencia de las 2 medias de porcentajes de granos quebrados por kilo de arrozde las molineras “A” y “B”
SOLUCIÓN
V=.95 P[t£t0]= 101.218;975.0295.1
=Þ gdlt
“A” n=10; x =5.4 : Sx=1.35“B” m=10: y =7 ; Sy=1.49
E =1.345El IC para la yx mm - al 95%= ( )[ ][ ] [ ]555.0;245.3345.19.1345.13.74.5 --=-- mm
INTERVALO DE CONFIANZA PARA LA VARIANZA
Sea una v.a. ó una población X~N( 2,sm ) con 2,sm desconocidos. Se toma una
m.a de tamaño ( )1
:...,:2
1221 -
-=== åå
n
xxS
n
xxxxxn
in El IC para 2s al 100 r
%= ( )( )
( )( )
úú
û
ù
êê
ë
é--
--- xx nn
SnSn2
1;
2
2
1;1
2
22
1;1
aa
Donde 222 22
; aa XX - son valores críticos que tienen distribución CHI cuadrado con (n-1)
g.d.l., es decir2
1;2
21
222
22
aaaa -=úûù
êëé £=úû
ùêëé £ -XXPXXP
CONSECUENCIA
El IC para s al 100v%= ( ) ( )úú
û
ù
êê
ë
é --
-22
1 22
1;1aa X
nSXnS
Ejemplo
A un laboratorio de ensayo de materiales se lleva una m.a. de 10 cables paraobtener sus cargas de rotura a la tracción, cuyos resultados en kg/cm2son :280,295,308,320,265,350,300,310,285,310; considerando que estas cargasposeen distribución normal. Se pude construir
a) El IC del 90% para la varianzab) El IC del 90% para la desviación
SOLUCION
( )9
10.49861
;3.30210
30232
2 =-
-==== åå
n
xxS
n
xX
ii
S2=554.0111 Þ S=23.5374
a) El IC para la 2s al 90% = ( ) ( )
úúú
û
ù
êêê
ë
é--
---2
)1(
2
2)1(1
2
22
1:1
nn XSn
XSn
aa
Como v =0.90; n=10 S2=554.011 10.0=a
[ ] [ ] 92.169;9;...9; 295.0
295.0
221
2
210.0 =Þ£=£Þ
-XXXPldgXXP
[ ] 325.39;05.09;...9; 205.0
205.0
221
2
210.0 =Þ=£=úû
ùêëé £ - XXXPldgXXP
( ) ( ) [ ]
90.0]5786.14996867.294[
5786.1499;6867.294325.3
011.5549;92.16011.5549
2 =££
=úûù
êëé=
sóP
b) El IC para s al 90%= [ ] [ ]7244.38;1664.175786.1499;6867.294 =[ ] 90.07244.381664.17 =££ sóP
INTERVALO DE CONFIANZA PARA LA RAZON DE VARIANZAS
Sean 2 v.a. o 2 poblaciones
X~N( 2, xx sm ) se desconoce 2xs = se toma una m.a “n”
( )1
:2
2
-
-==Þ åå
n
xxS
n
xx
ix
i
Y~N( 2, yy sm ) se desconoce Þ2ys se toma una m.a “m”
( )1
:2
2
-
-==Þ åå
m
yyS
m
xy
iy
i
El estadístico para2
2
2
2
y
x
y
x
SS
ess
s
Þ El IC para la2
2
y
x
s
s al 100v%=( )( )
( )( )úú
û
ù
êê
ë
é---
---11;12
2
11;12
2
;2
;2
;1nm
y
x
mny
x fSS
fSS
a
a
Þ El IC para lay
x
ss al 100v%=
( )( )( )( ) ú
ú
û
ù
êê
ë
é
------
11;12
2
11;12
2
;2
;2
;1nm
y
x
mny
x fSS
fSS
a
a
donde( )( )
( )( ) 21
21
111:
111:
2
2
a
a
a
a
-=úûù
êëé --£
-=úûù
êëé --£
-
-
nmfFP
mnfFP
EJEMPLO
Suponga que 2 maquinas “A” y “B” producen independientemente el mismo tipo deobjeto y que el tiempo que cada una emplea en producirlos se distribuyenormalmente con respectivas varianzas 22 ; yx ss desconocidos. Se toma 2 m.a unade “A” y otra de “B” obteniéndose los siguientes resultados.
m.a tamaño n=8 Þ”A”: 17,23,21,18,22,20,21,19m.a tamaño m=6 Þ”B”: 13,16,14,12,15,14 Se pide construir
a) Un IC para la razón de varianzas al 95%b) Un IC para la razón de desviaciones al 95%
SOLUCIÓNr=0.95 a=0.05 n=8; m=6; 2
XS =4.13 : 2YS =2
a)[ ]
[ ] 29.57.5:...7.5:
85.65.7:...5.7:
7.5;975.0975.01
5.7;975.0975.01
205.0
205.0
=Þ£=úûù
êëé £
=Þ£=úûù
êëé £
-
-
ffFPldgfFP
ffFPldgfFP
Þ El IC para la2
2
y
x
s
s al 95%= ( ) [ ]9239.10;3015.029.5213.4;
85.61
213.4
=úû
ùêë
é÷øö
çèæ
ó 95.09239.103015.02
2=
úúû
ù
êêë
飣
y
xPs
s
b)Þ El IC para la
y
x
ss al 95%= [ ]3051.3;5491.0
ó 95.03051.35491.0 =úúû
ù
êêë
飣
y
xPss
UNIDAD IV PRUEBAS DE HIPOTESIS
Competencia:
-El estudiante debe utilizar correctamente las diferentes formas del protocolo paraefectuar pruebas de hipótesis ,tanto paramétricas como no paramétricas sobre cualquierparámetro o distribución de una población para la toma de decisiones coherentes.
Objetivos.
-Utilizar correctamente la Docimasia de hipótesis para probar cualquier aspecto de unapoblación que con lleva un grado de incertidumbre para tomar decisiones coherentes.
Descripción general de la unidad:
-Esta unidad comprende el desarrollo de los siguientes conceptos: Hipótesis estadística,clases de hipótesis estadísticas,Tipos de errores; como también la realización de lasdieferentes pruebas de Hipótesis tales como :acerca de la media con varianza poblacionalconocida como desconocida ,acerca de la varianza y de la razón de varianzas, acerca de laproporción como diferencia de proporciones.
Lectura:Millar/Freund/Jonson “Probabilidad y Estadística paraIngenieros”Edo.de México 1992 Pgs.225 al 286 Córdova Zamora “Estadística Descriptiva e Inferencial” 2ª ed.Perú 1996Pags,385 al 440 Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e InferenciaEstadística((2ª ed) Perú .Pags.701al 749
Referencia electrónica: http://descartes.cnice.mecd.es/materiales-didacticos/Muestreo/-Inferencia-Estadística/pruebas-hipotesis.html
PRUEBAS DE HIPOTESIS
INTRODUCCIÓN
En la estadística inferencia el área de las pruebas de hipótesis constituye uno delos aspectos importantes por su utilización.La mayoría de las pruebas de hipótesis estadística se refieren a 2 aspectos:
1) A probar los valores de los parámetros de una variable o población,llamadas pruebas paramétricas.
2) También se refieren al tipo o naturaleza de las diferentes distribuciones delas diferentes variables o poblaciones, llamándose pruebas noparamétricas.
La que generalmente se utiliza con las pruebas paramétricas, la que suponeconocer la naturaleza de la población.Para desarrollar las diferentes pruebas de hipótesis es necesario desarrollaralgunos conceptos básicos como ser:
HIPÓTESIS ESTADÍSTICAUna hipótesis estadística es una afirmación ó conjetura con relación a los valoresde los parámetros ó con relación a las distribuciones de una ó más variablesaleatorias o poblaciones.De acuerdo a su especificación tenemos 2 tipos de hipótesis:
1) HIPÓTESIS ESTADÍSTICA SIMPLESon aquellas hipótesis completamente especificas, es decir están definidossus valores y el tipo de distribución.
2) HIPÓTESIS ESTADÍSTICA COMPUESTA
Son aquellas hipótesis que no están completamente especificadas, es decirpuede no estar bien definido los valores de sus parámetros ó no estarespecificado el tipo de distribución de la variable ó población.
DOCIMACIA DE HIPÓTESISEs el proceso por el cual se efectúa la prueba de hipótesis. Para docimar senecesita 2 tipos de hipótesis:
1) LA HIPÓTESIS NULA H0Es aquella hipótesis completamente especificada es la que se quiere probarcon el fin de rechazarla. Para identificar si una hipótesis es nula debe tenerpor lo menos la igualdad ³=£ ;;
2) HIPÓTESIS ALTERNA H1Es aquella hipótesis contraria a la nula, es decir que no está completamenteespecificada y que se acepta cuando se rechaza la hipótesis nula y quegeneralmente para identificarla no debe tener el signo de la igualdad > ¹ <
TIPOS DE ERRORES
Se toma decisiones en base a las muestras, nos conduce inevitablemente acometer 2 tipo de errores:
1) ERROR TIPO ISe comete este tipo de error cuando se rechaza H0 y se acepta H1 cuandoH0 es verdadera.
2) ERROR TIPO IISe comete este tipo de error cuando se rechaza H0 y se acepta H1 cuandoH0 es falsa.
Estos errores se los resume de la siguiente manera
NATURALEZADECISION H0 :VERDADERO H1: VERDADERO
ACEPTA H0 CORRECTA ERROR TIPO IIACEPTA H1 ERROR TIPO I CORRECTA
NIVEL DE SIGNIFICANCIÓNAl cometer estos tipos de errores, se presentan bajo 2 niveles de significación:
1) NIVELa DE SIGNIFICACIÓNSignifica:P[comete error tipo I]= P[rechazar H0/H0 verdadero]
2) NIVEL b DE SIGNIFICACIÓNSignifica:P[comete error tipo II]= P[aceptar H0/H0 verdadero]
Generalmente el nivel de significación mas utilizado es a =10%, 5%, 1%, paratomar decisiones se deben establecer regiones críticas y /ó regiones deaceptación.
REGION CRÍTICA R.C.Es parte del rango del estimador que de acuerdo a una prueba prescrita nosconduce a rechazar H0 y aceptar H1 a cierto nivel de significación. Esta RC sesugiere determinar o utilizar cuando se presentan pruebas unilaterales.REGION DE ACEPTACIÓN R.A.Es parte del rango del estimador que de acuerdo a una prueba presenta permiteaceptar H0 y rechazar H1. Se sugiere utilizar esta RA cuando se presentanpruebas bilaterales.
TIPOS DE PRUEBADe acuerdo a los planteamientos de los problemas se tiene 3 tipos de pruebas:
1. BILATERAL
Planteamiento
00 : jj =H vs 01 : jj ¹Hdonde j = cualquier parámetro ( ) 0
2 ,,, jsm etc = valor del parámetro
2. UNILATERAL DERECHAPlanteamiento
00 : jj £H vs 01 : jj >H3. UNILATERAL IZQUIERDA
Planteamiento00 : jj ³H vs 01 : jj <H
Nota.- El tipo de prueba lo sugiere generalmente la hipótesis alterna.PROCEDIMIENTO PARA DOCIMAR
1. Plantear las hipótesis00 : jj =H vs 01 : jj ¹H Bilateral
00 : jj £H vs 01 : jj >H Unilateral Derecha
00 : jj ³H vs 01 : jj <H Unilateral Izquierda2. Elegir el nivel de significación a =10%, 5%, 1% si no se conoce a se elige
a = 5%.3. Elegir el estadístico de prueba apropiado, cuya distribución muestral sea
conocido, bajo el supuesto de que H0 es cierto4. Establecer la RC ó la RA (determinando los valores críticos: tablas)5. Determinar o calcular los valores de los estadísticos de prueba6. Comparar estos valores con la RC y /o RA y concluir si:
El valor calculado ÎRCÞ rechazar H0 y aceptar H1El valor calculado ÏRCÞ aceptar H0 y rechazar H1
El valor calculado ÎRCÞ aceptar H0 y rechazar H1Al nivel a de significación.
PRUEBAS RELATIVAS A MEDIAS MUESTRAS GRANDES
El estadístico de prueba es ( ) Znxx ;0
sm-
® ~N(0.1) también se puede utilizar S
en reemplazo de s cuando no se conoce
TIPO DE PRUEBA
BILATERAL R.A (ACEPTAR H0 YRECHAZAR H1)
R.A (RECHAZAR H0 YACEPTAR H1)
00 : mm =H vs 01 : mm ¹H22
; aa ZZ-
UNILATERAL DERECHA00 : mm £H vs 01 : mm >H aa ;1-Z
UNILATERAL IZQUIERDA00 : mm ³H vs 01 : mm <H aa Z®-
EjemploUn banco estudia la posibilidad de abrir una sucursal en la ciudad de “El Alto”,para ello establece el siguiente criterio para tomar la decisión “abrir la sucursal siel ingreso per cápita familiar no es menor a Bs. 500.- en contrario no abrir”. Paraellor toma una m.a. de 100 ingresos familiares, de esa ciudad la que da una mediade Bs. 480.-a) Cuál es la decisión a tomar al nivel del 5% de significación suponiendo que la
desviación típica de esa población es de Bs. 50.-
SOLUCIONPlanteamiento:1) 500:0 ³mH vs 500:1 <mH 100:50:480 === nx s
abrir la sucursal No abrir la sucursal2) a =5% = 0.05
3) El estadístico de prueba es ( ) ;0 nxxsm-
® ~N(0.1)
4) La RC = 645.1;; 05.0 --=- aa Z
5) Calculando ( )4
50100500480
-=-
=CZ
6) Comparando: Como Zc=-4 ÞÎ RC Rechazamos H0 y aceptamos H1, es decirno debe abrir la sucursal al 5% de significación.
PRUEBA RELATIVA A LA MEDIA: MUESTRAS PEQUEÑAS n<30 DE UNA VARIABLE OPOBLACION NORMAL
El estadístico de prueba es ( ) tnxTxsm0-
=® ~(n<1) g.d.l.
TIPO DE PRUEBA R.A (ACEPTAR H0 YRECHAZAR H1)
R.A (RECHAZAR H0 YACEPTAR H1)
BILATERAL22
11; aa --
- tt
UNILATERAL DERECHA aa ;1-tUNILATERAL IZQUIERDA
aa t®-
Ejemplo
Se sabe que el ingreso per cápita de un gran número de ciudadanos, se distribuyenormalmente con un promedio de $us. 152.- Un estudio estadístico reciente unam.a de 9 personas de esa población ha dado los siguientes resultados en $us.158,154, 152, 156, 151, 150, 153, 155, 157. Al 5% de significancia. Ha cambiado elingreso per cápita de ésa población?.
SOLUCION
Planteamiento152:0 =mH vs 152:1 ¹mH 7386.2:154 == Sx
abrir la sucursal No abrir la sucursal
a =5% = 0.05
El estadístico de prueba es ( )sm nxTx 0-
=® .
La RA = 306.28;; 975.011205.0
205.0 -=-=-
--gdlttt
306.2:306.2-=RA
Calculando ( )1909.2
7386.29152154=
-=cT
Comparando: Como Tc=2.1909 ÞÎ RA aceptamos H0 y rechazamos H1, es decirel ingreso per cápita ha cambiado al 5% de significación.
PRUEBA DE HIPOTESIS SOBRE DIFERENCIA DE MEDIAS: MUESTRASGRANDES
Sean 2 v.a. ó 2 poblaciones Y~ ( )yxx2sm Y~ ( )2
yysm donde m se desconoce
Se quiere verificar si existe diferencia significativa entre las medias de las 2poblaciones
El estadístico de prueba es ( ) ( )( )nn
yx
yx
yxZyx
22 ss
mm
+
--=®- ~N(0.1)
Se puede utilizar 2S en reemplazo de 2s
TIPO DE PRUEBA R.A (ACEPTAR H0 YRECHAZAR H1)
R.A (RECHAZARH0 Y ACEPTAR H1)
BILATERAL0:0 =- yxH mm vs 0:1 ¹- yxH mm
2211
; aa --- ZZ |
UNILATERAL DERECHA0:0 £- yxH mm vs 0:1 >- yxH mm aa ;1-Z
UNILATERAL IZQUIERDA0:0 ³- yxH mm vs 0:1 <- yxH mm aa Z®-
Ejemplo
Para probar la afirmación de que la resistencia de un alambre eléctrico puedereducirse en más de 0.050 W (homios), mediante aleación, 32 valores obtenidosde alambre ordinario produjeron: una media= 0.1360 Ω ;y desviacion = 0.004 Ωy32 valores obtenidos con alambre fabricado a base de aleación produjeron unamedia de 0.083 Ω con una desviación tipica de 0.005 Ω Se apoya la afirmación al5%?
050.0:0 £- yxH mm vs 050.0:1 >- yxH mmno se apoya la afirmación Se apoya la afirmación
a=0.05
El estadístico de prueba ( ) ( )( )mn
yx
yx
yxZyx
22 ss
mm
+
--=®- ~N(0.1)
RC= [ ]¥Þ¥>Þ- 645.1:; 95.01 tZZ aa
( )( ) ( )
154.29001131923.0
033.0050.0083.01360.0
32005.0
32004.0 22
==+
--=cZ
Como Zc=29.154 ÎRC ÞRechazar H0 y aceptar H1, es decir se apoya laafirmación que la resistencia de un alambre eléctrico puede reducirse en más de0.050 (homios).
PRUBA DE HIPOTESIS SOBRE LA DIFERENCIA DE MEDIAS: MUESTRASPEQUEÑAS
Sean 2 v.a. ó 2 poblaciones X~N ( )yxx2sm Y~N ( )2
yysm donde m y 2s se desconocepara verificar si existe diferencia significativa entre las medias poblacionalesmediante 2 muestras aleatorias pequeñas n<30 y m<30
El estadístico de prueba es ( ) ( ) ( )( ) ( ) mn
mnnmSmSn
yxTyx
yx
yx
+-+
-+-
---=®-
)2(11 22
mm ~ at :n+m-2 gdl
TIPO DE PRUEBA R.A (ACEPTAR H0 YRECHAZAR H1)
R.A (RECHAZARH0 Y ACEPTAR H1)
BILATERAL0:0 =- yxH mm vs 0:1 ¹- yxH mm
2211
; aa --- tt |
UNILATERAL DERECHA0:0 £- yxH mm vs 0:1 >- yxH mm aa ;1-t
UNILATERAL IZQUIERDA0:0 ³- yxH mm vs 0:1 <- yxH mm aa t--
Ejemplo
Diez barras de acero fabricadas por un proceso A tienen una fuerza de rupturamedia de 50, con una desviación estándar muestral de 10; muestras que 8fabricadas por un proceso B, tienen una fuerza de ruptura media de 55 con unadesviación estándar muestral de 12. Suponiendo que la población de fuerzas deruptura normal con la misma desviación estándar, ......... con un nivel designificancia del 5% la hipótesis que los 2 procesos producen acero de la mismafuerza en contra de la posibilidad que no es así.
SOLUCION
BAH mm =:0 vs BAH mm ¹:1
a=0.05
El estadístico de prueba ( ) ( )( ) ( ) mn
mnnmSmSn
yxTyx
BA
BA
+-+
-+-
--=®-
)2(11
022
RA 12.212.2:; 975.0975.01 -=-=Þ - ttt aa
Con 965.018
)16(80)12(7)10(9
555022
-==+
-=cT
Como Tc=-0.965 ÎRA Þaceptamos H0 y rechazamos H1, es decir no hay razonpara creer que los 2 procesos producen acero con fuerzas diferentes.
PRUEBA DE HIPOTESIS SOBRE LA VARIANZA
Para realizar la prueba de hipótesis para la varianza poblacional ( )2s se utiliza elestadístico de prueba
( )1
22
--S
=n
xxS i ~( )
20
22 1
sSnX -
= ~X2 (n-1) gdl
TIPO DE PRUEBA R.A (ACEPTAR H0 YRECHAZAR H1)
R.A (RECHAZAR H0Y ACEPTAR H1)
BILATERAL20
20 : ss =H vs 2
01 : ss ¹H22
122 ; aa -XX |
UNILATERAL DERECHA20
20 : ss £H vs 2
01 : ss >H Si )1(;11
2 --> nXX c aUNILATERAL IZQUIERDA
20
20 : ss ³H vs 2
01 : ss <H Si )1(;21
2 -> nXX c a
Nota.- 20s valor de varianza postulada
Ejemplo
Una m.a. de 10 objetos elegidos al azar entre los producidos en cierta plantaindustrial han mostrado los siguientes pesos en grs. 71, 66, 64, 72, 69, 67, 70, 68,65, 69. Podrá aceptarse la hipótesis de que la varianza de los pesos de losobjetos es igual a 4 grs2 al 5% de significación. Suponiendo que la población delos pesos tiene distribución normal.
SOLUCION
220 4: grsH =s vs 2
1 4: grsH ¹sa=0.05
El estadístico de prueba es ( )20
222 1
sSnXS -
=® ~X2 (n-1) gdl
Media 1.68=x : Desviación S=2.60128
RA=(2.70 : 19.2)
Como ( ) 225.154
60128.29 22 ==cX
Como 2cX =15.225 ÎRA (2.7 ; 19.02) aceptamos H0 y rechazamos H1, es decir la
varianza es de 4 grs2 al 5% de significación.
PRUEBA DE HIPOTESIS RELATIVAS A 2 VARIANZAS
Para realizar la prueba de hipótesis sobre la diferencia de 2 varianzas de 2poblaciones que supuestamente tienen distribución normal, se utiliza el estadísticode prueba, la razón de varianzas muestrales
2
2
y
x
SSF = ~F (n-1)(m-1) gdl
TIPO DE PRUEBA R.A (ACEPTAR H0 YRECHAZAR H1)
R.A (RECHAZAR H0Y ACEPTAR H1)
BILATERAL22
210 : ss =H vs 2
2211 : ss ¹H )1)(1();1)(1(
221
-----
mnfmnf aa|
UNILATERAL DERECHA22
210 : ss £H vs 2
2211 : ss >H Si F<fa;(n-1)m-1)
UNILATERAL IZQUIERDA22
210 : ss ³H vs 2
2211 : ss <H Si F>fa;(n-1(m-1)
Nota.- generalmente se coloca en el numerador del estadístico la varianza másalta
Ejemplo
2 máquinas A y B producen independientemente el mismo tipo de articulo cuyopeso es de importancia. La varianza de los pesos de A ha sido siempre igual a lavarianza de los pesos de B, frecuentemente se han tomado una m.a. de A y otrade B obteniéndose los siguientes resultados:
muestra de A: 17, 23, 21, 18, 22, 20, 21, 19muestra de B: 13, 16, 14, 12, 15, 14
presentan estos datos suficiente evidencia para concluir que la varianza de lospesos de A y B ya no son iguales? Suponiendo poblaciones normales use a=0.05
Planteamiento22
210 : ss =H vs 2
2211 : ss ¹H
a=0.05
El estadístico de prueba es 2
2
ˆˆ
y
x
SSF = ~Fa(7.5)
RA= 85.6;189.0;5.7;;5.7; 975.0025.01205.0
205.0 ==
-ffff
Fc= 0625.22125.4
=
Como Fc ÎRA = aceptamos H0 y rechazamos H1, es decir que las varianzas de laproducción de A y B son iguales al 5% de significación.
EjemploSe quiere determinar si existe menos variabilidad en el plateado realizado por alCIA A que en el efectuado por la CIA B. Si muestras aleatorias independientes detamaño 12 del trabajo desempeñado por las compañías producen SA=0.062 mil.Pruébese la hipótesis de que 2
221 ss = contra 2
221 ss < con un nivel de significancia
del 5%
SOLUCION
H0: 22
21 ss = vs H1: 2
221 ss <
a=0.05
El estadístico de prueba es 2
2
ˆˆ
y
x
SSF = ~Fa(n-1)(m-1)
La RA= Si Fc<f0.05;11,11 f0.95:11:11 =2.82
Calcular Fc=( )( )
14.3035.0062.0
2
2
=
Como Fc =3.14>F2.82 rechazar H0 y aceptar H1, por lo tanto el plateado realizadopor la CIA A es menor variable que el plateado efectuado por la CIA B al 5% designificación.
PRUEBAS RELATIVAS A PROPORCIONES: MUESTRAS GRANDES
Para efectuar la prueba sobre una proporción en base a muestras grandes que........de poblaciones Binomiales se utiliza el estadístico:
nqp
ppqnp
npxZ00
0
00
0 ˆ -=-
= ~ Z~ N(0,1) dondeMxp =ˆ
TIPO DE PRUEBA R.A (ACEPTAR H0 YRECHAZAR H1)
R.A (RECHAZAR H0 YACEPTAR H1)
BILATERAL
00 : rr =H vs 01 : rr ¹H22
11; aa --
- ZZ
UNILATERAL DERECHA00 : rr £H vs 01 : rr >H aa ;1-Z
UNILATERAL IZQUIERDA00 : rr ³H vs 01 : rr <H aa Z)(--
Nota.- 0r =valor de la proporción postuladaEjemploUn fabricante afirma que el porcentaje de consumidores de su producto es del30%. Con el fin de evaluar ésta afirmación, se tomó una m.a. de 400consumidores y se encontró que 100 prefieren el producto. Es ésta suficienteevidencia para concluir que el porcentaje de preferencia del antiguo producto hacambiado al 1% de significación?
SOLUCION30.0:0 =rH vs 30.0:1 ¹rH
a=0.01 25.0400100
ˆ ==r
El estadístico de pruebanqp
ppZ00
0ˆ -= ~ Z~ N(0,1)
RA= 575.2:575.2;; 995.0995.011201.0
201.0 -=-=-
--ZZZZ
Como 1834.230.025.0
400)70.0)(30.0(
-=-
=cZ
Comparando Zc=-2.1834 RAÞaceptamos H0 y rechazamos H1 ; es decir elporcentaje de preferencia de consumidores para el producto no ha cambiado al1% de significación
Ejemplo
En un estudio diseñado para investigar si ciertos detonadores empleados conexplosivos en una mina de carbón cumplan con los requerimientos de que almenos el 90% encenderá el explosivo al ser detonado se encontró que 174 de 200detonadores funcionan adecuadamente. Probar la hipótesis de que
90.0=r contra 90.0<r al 5% de significación.
SOLUCION
H0: 90.0=r vs H1: 90.0<r
a=0.05 87.0200174
ˆ ==r
RC= 645.1::: 05.0 --=-=- aaa a ZZ
Como 414.1021213203.0
03.090.087.0
200)10.0)(90.0(
-=-
=-
=cZ
Comparando -1.414 Î RCÞaceptamos H0 y rechazamos H1 ; es decir no hayrazón para afirmar que la clase determinada de detonador no cumple con lasnormas especificadas al 5% de significación.