universidad salesiana de boliviavirtual.usalesiana.edu.bo/web/contenido/dossier/22011/640.pdf ·...

UNIVERSIDAD SALESIANADE BOLIVIA

CARRERA DE INGENIERÍA DE SISTEMAS

DOSSIERINFERENCIA PROBABILÍSTICA

Cuarto Semestre

PORFIRIO ARDUZ URQUIETAI - 2011

I ÍNDICE DEL CONTENIDO: PAG.UNIDAD I DISTRIBUCIONES DE PROBABILIDAD 21.1.Introducción –Distribución Bernoulli 31.2.Distribución Binomial 51.3.DistribuciónGeométrica 81.4.DistribucionPascal 91.5Distribución Multinomial 111.6Distribución Hipergeométrica 131.7Distribución Multivariante 171.8Distribución Poisson 181.9Distribución Uniforme 231.10Distribución Exponencial 251.11Distribución Normal 281.12 Teorema Central del límite 311.13Aproximaciones a la Normal 33

UNIDAD II DISTRIBUCIONES MUESTRALES 372.1.Población ,muestra aleatoria. 382.2 Distribución muestral de la media 392.3Distribución Chi Cuadrado 412.4Distribución T-student 452.5.Distribución F-Fisher 472.6.Distribución muestral de la Proporción 49

UNIDAD III ESTIMACIÓN PUNTUAL Y POR I.C. 523.1.Estimación puntual 533.2 Propiedades de un buen estimador 543.3Métodos de estimación puntual 563.4 Estimación por Intervalos de confianza 583.5.Tamaño muestral para estimar la media 613.6.Tamaño muestral para estimar la proporción 643.7.Tamaño muestral para poblaciones finitas 653.8.Intervalo de confianza para diferencia de proporciones 663.9.Intervalo de confianza para la media con varianza desconocida 673.10.Intervalo de confianza para la varianza 693.11.Intervalo de confianza para la razón de varianzas 70

UNIDAD IV PRUEBA DE HIPÓTESIS 724.1.Hipótesis Estadística 734.2 Tipos de errores 734.3.Pruebas relativas a medias y la varianza 754.4.Pruebas relativas a proporciones 82

UNIDAD V ANÁLISIS DE REGRESIÓN Y CORRELACIÓN 845.1Distribuciones Bidimensionales Correlación lineal 845.2.Regresión lineal simple 875.3. Coeficiente de determinación 875.4 Técnicas de estimación 885.5 Extensión de la Regresión lineal simple 905.6 Modelos de Regresión múltiple 93

PRACTICASPráctica Nº1 Modelo Binomial 95Práctica Nº2 Modelo Geométrico y Pascal 95Práctica Nº3 Modelo Multinomial 96Práctica Nº4 Modelo Hipergeométrico 96Práctica Nº5 Modelo Multivariado 97Práctica Nº6 Modelo Poisson 97Práctica Nº7 Modelo Uniforme 98Práctica Nº8 Modelo Exponencial 98Práctica Nº9 Modelo Normal 99Práctica Nº10 Teorema central del Límite 100Práctica Nº11 Aproximaciones a la Normal 100Práctica Nº12 Distribución muestral de la Media 101Práctica Nº13 Distribución muestral de la Proporción 102Práctica Nº14 Distribución muestral de la Varianza 102Práctica Nº15 Distribución T-Student 103Práctica Nº16 Distribución F-Fisher 103Práctica Nº17 Estimación puntual 103Práctica Nº18 Estimación por I.C. 104Práctica Nº19 Pruebas de Hipótesis sobre la Media y Varianza 107Práctica Nº20 Pruebas sobre Proporciones 108

BIBLIOGRAFIA 109

GLOSARIO 110

PRESENTACIÓN

El presente Dossier se realizó en coordinación con los docentes de la Materia con el fin deque cualquier estudiante del cuarto nivel de Ing. de Sistemas, pueda facilitar su proceso deaprendizaje y enseñanza,de tal manera que :-Identifique y utilice los modelos probabilísticos en problemas inherentes a variablesaleatorias-Utilice la Docimasia de Hipótesis para probar,verificar, alguna característica de unapoblación._Utilice correctamente el análisis de regresión en la predicción,mediante el proceso deaprendizaje cooperativo.Cabe aclarar que el Dossier ha sido actualizado de acuerdo al formato emanado del Deptode Planificación.Es decir al principio de cada unidad, se incorporó las competencias su objetivo,ladescripción específica de la unidad ,las lecturas complementarias, la bibliografía básica yelectrónica .En cuanto a las prácticas se insertó al final del presente conjuntamente lastablas y el glosario de términos técnicos elementalesLa unidad I comprende el desarrollo de los principales modelos probabilísticos másutilizados en la Ingeniería,La unidad II trata sobre las distribuciones muestrales o especiales como (t-student,Chicuadrado,y la Fisher) más utilizadas en la InferenciaLa Unidad III está abocado a la estimación tanto puntual como por intervalos de confianzaDe los principales parámetros de una poblaciónLa unidad IV se refiere a la realización de las diferentes pruebas de hipótesis paramétricasprincipalmente y no paramétricasFinalmente la unidad V trata sobre el análisis de la regresión en la predicción,el mismo queestá en power pointPor lo tanto el presente documento está basado en 4 partes: I la IntroducciónII El contenido o cuerpo del dossierIII PrácticasIV Tablas estadísticasV BibliografíaVI Glosario

Esperamos que el presente documento sea de mucha utilidad para los estudiantes por lo queestamos prestos a recibir sugerencias para que el mismo pueda ser mejorado.

La Paz ,28 de Febrero del 2011

Lic. Porfirio Arduz Urquieta.

UNIDAD N° 1

DISTRIBUCIÓN DE PROBABILIDADES

Competencia:

-Identifica y utiliza correctamente los modelos probabilísticos en la resolución deproblemas inherentes a variables aleatorias en forma general.

Objetivos.

-Resolver correctamente todo tipo de problema que tengan que ver con la incertidumbre ,mediante la utilización de los modelos probabilísticos

Descripción general de la unidad:

-Esta unidad comprende el desarrollo de las diferentes distribuciones de probabilidadestanto discretas como las continuas con sus respectivas características más aplicadas en elcampo de la IngenieríaTema Nº1 :Distribuciones DiscretasCompetencia: Identifica y utiliza los Modelos de Distribuciones Discretas en la resoluciónde problemas inherentes a variables aleatorias discretasDescripción del tema:Se desarrollarán los principales Modelos de Distribución Discretos,con sus respectivas características,para su posterior aplicación a la resolución de problemas.Tema Nº 2:Distribuciones ContinuasCompetencia: Identifica y aplica los principales Modelos de Distribución Continuos en laresolución de problemas inherentes a variables continuasDescripción del tema:Se desarrollarán los Modelos de distribución Continuas másutilizadas en la Ingeniería de acuerdo a sus características,y su posterior aplicaciópn en laresolución de problemas.

Lectura:Millar/Freund/Jonson “Probabilidad y Estadística paraIngenieros”Edo.de México 1992 Pgs. 93 al 128 Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e InferenciaEstadística((2ª ed) Perú .Pags.407 al 553

Referencia electrónica:http://www.itchihuahua.edu.mx/academic/industrial/sabaticiruta/private/01UNIDAD%20IV.uhtm

http://www.itchihuahua.edu.mx/academic/industrial/sabaticiruta/private/01UNIDAD IV.uhtm

http://www.itchihuahua.edu.mx/academic/industrial/sabaticiruta/private/01UNIDAD IV.uhtm

INTRODUCCIÓN

Entre uno de los objetivos de la Estadística Matemática es de determinar unadistribución de probabilidad o un modelo probabilistico que satisfaga una serie desupuestos para analizar los resultados obtenidos de un experimento aleatorio.

Entre las distribuciones de probabilidades tenemos:

a) Las distribuciones discretas como ser la Bernoulli, Binomial, Hipergeométrica,Geométrica, Poisson, etc.

b) Las Distribuciones continuas tenemos la Uniforme, Experimental, la Normal, X2,F, t

DISTRIBUCIONES DISCRETASSon aquellas distribuciones cuya variable aleatoria es discreta

1.DISTRIBUCIÓN BERNOULLI : X~Bernoulli (p)

Se tiene la distribución Bernoulli, cuando las pruebas ó ensayos son de carácterdicotómico, es decir sólo tienen 2 posibles resultados:

E = éxito ; F = fracaso Þ ],[ FE=WÞe por ejemplo: Sean los siguientes experimentos aleatorios:

1e : “Lanzar una moneda” ],[1 SC=WÞ

2e “Determinar el sexo del ” ],[2 MV=WÞ

3e : “verificar el resultado de un examen” ],[3 ra=WÞ

DEFINICIÓN

Se dice que una v. d. X~Bernoulli sii sv Rx= [0,1]; donde la V.A.D. x:” N° de éxitosobtenidos en un ensayo dicotómico”; cuya

FUNCIÓN DE PROBABILIDAD O CUANTÍA p(x)=p[X=x]=px(1-p)1-x; Rx= 0.1

Dondep = probabilidad del éxitoq = probabilidad del fracasode tal manera que p+q=1

ó p = 1-q ó q = 1-p

cuya distribución de probabilidad y representación gráfica es:

x P(x)0 q1 p

p q

0 1

FUNCION DE DISTRIBUCION ACUMULADA F (x)

F(x) = p (X£ x) = 0 si x < 0q si 0£ x<11 si x³1

CARACTERISTICAS

Entre sus principales caracteristicas tenemos:

1) LA MEDIA

ppqxEpxPxxE=+==

=== å)(1)(0)(

)()(

m

m

pxxPpxP

x

0)(9)(

10

Mediante la F.g.m. sabemos que uno de los teoremas de la f.g.m.

rx

r

dttMdr )(' =m por lo tanto debemos antes determinar

la [ ] å -=== xxtxtxx qpeeEtMfgm 1)( desarrollando la å

=+== -- 111)1(010)0()( qpeqpetMfgm ttx

sabemos que =+=+=== ==

001 0

')('')(

0pepe

dtpeqdxE t

tt

tmm

2) LA VARIANZA

å -=-== - 212222 )()( pqpxxExV xxms

=-=-+== - )1(10)( 20201022 PpppqqpxV s

mediante la f.g.m. 22

2 ')( mms -==xV

P(x)

x

t =0

p

q+etp

p.q

donde [ ]===

+== ===

00002 '

'''

)(''' pepe

dtpeqd

dttMd

tt

t

t

txm

=-=-=Þ )1()( 2 ppppxV

DISTRIBUCIÓN BINOMIAL X~ B(n,p) ó b(x :np)

Se llama experimento aleatorio binomial a un N° fijo “n” de reiteracionesindependientes de un experimento aleatorio Bernoulli que tiene las siguientescaracterística:

1. Los resultados de cada prueba son de carácter dicotómico, es decir Bernoulli2. Las n pruebas Bernoulli son independientes3. La probabilidad de éxito “p” supuestamente se mantiene constante en cada

prueba

DEFINICIÓN una v.a.d X~b(n,p), donde

X : “ N° de éxitos obtenidos en “n” ensayos Bernoulli” con Rx = 0,1,2,3,... n cuya

FUNCIÓN DE PROBABILIDAD O CUANTÍA

P(X)= P[X=x]=(nx )pxqn-x:Rx0,1,2,3...n

Dondep = probabilidad de éxitoq = probabilidad de fracason = N° de ensayos Bernoulli

FUNCIÓN DE DISTRIBUCIÓN Ó ACUMULADA F(x)

F(x)= P(X£ x) =B(x;np)=å=

-

><£

<x

k

xnkn

nxsinxsi

xsiqpk

0

10

00

)(

CARACTERÍSTICAS

1) LA MEDIA npqpxxxPxxE xnxn

Rx==== -åå )()()( m

2) LA VARIANZA å =-=-== - npqnpqpxxxExV xnxn

22222 )()()()( ms

3) LA FGM [ ] nttxx epeEtM )]1(1[)( -+==

p

p.

RESOLUCIÓN DE PROBLEMAS CON MODELOS PROBABILISTICOS

Para resolver correctamente problemas inherentes a modelos probabilìsticos, sesugiere en un principio seguir los siguientes pasos:

1. Determinar el tipo de distribución de probabilidad que sigue la v. a. X deacuerdo las características del experimento en cuestión.

2. Definir la v. a X de manera clara y completa con su Rx.3. Determinar los parámetros de la función de probabilidad.4. Utilizar correctamente la función de probabilidad, ó la acumulada ó tablas ó

CPU.

Ejemplo

La probabilidad de que cierto ordenador de cierta marca determinada falla, anteuna descarga eléctrica es del 1% ¿cuales son las probabilidades de que entre 10ordenadores de dicha marca en un laboratorio.

a) 3 fallenb) a lo más 2 fallenc) al menos 3 fallend) el promedio y varianza que un ordenador falle

SOLUCIÓN

1) Como todo ordenador tiene sólo 2 posibles resultados falle o no falle(dicotómico)

2) Suponiendo que cada ordenador funciona independientemente3) Suponiendo que la probabilidad de falla de los ordenadores es casi constante

Entonces asumimos que la v.a.d. X~ b(n. p)ÞP(x)=(nx )px qn-x Rx =0,1,2....n

Donde la v. a. d. X: “N° de ordenadores que fallan ante una descarga eléctrica deentre 10”

n=10: p=0.01:q=0.99 Rx=0,1,2.......10 10...2,1,0;99.001.0)( 1010

=÷øö

çèæ=Þ -

xxx RxxP

a) 3 fallen 00011.0)99.0()01.0(3)3( 7310

=÷øö

çèæ==Þ xP

b) a los más 2 fallen 9999.0)2()1(1)0()()2(2

0=++==£Þ å PPPxPxP

c) al menos 3 fallen )10(...)4()3()()3(10

3

PPPxPxP +++==³Þ å

mediante el complemento 00011.09999.01)2(1)3( =-=£-=³Þ xPxP

d) El promedio E(x)=np=10(0.01)=0.1=10%La VarianzaV(x):npq=10(0.01)(0.99)=0.099

APLICACIÓN DE LA BINOMIAL EN EL MUESTREO

Considerando cada elemento de una muestra aleatoria (m.a.) como un ensayoBenoulli entonces la Distribución Binomial puede aplicarse en el muestreo bajo lassiguientes circunstancias:

1. Cuando el muestreo es con o sin reemplazo de una población infinita o muygrande

2. Cuando el muestreo es con reemplazo de una población pequeña o finita

Bajo estas 2 circunstancias entonces la v.a.d. X se define

X:”N° de elementos de la clase de nuestro interés en una m.a. de tamaño n”

DondePoblación

eresdenuestroelementosdeNNKp int°

==

nxNk

NkxxXPxp

xnxn...3,2,1,0:1][)( =÷

øö

çèæ -÷

øö

çèæ÷øö

çèæ===

-

NOTA.- en la práctica el muestreo se lo realiza sin reemplazo de poblacionesfinitas especialmente cuando se realiza control de calidad, por lo tanto ladistribución adecuada es la hipergeométrica.

USO DE TABLAS

Cuando el tamaño de la m.a. es muy grande )30( ³n el cálculo de lasprobabilidades resulta tedioso porque lo que se sugiere utilizar paquetesestadísticos ó las tablas las que están construidas en términos de la función dedistribución ó acumulada F(x); para ello se debe utilizar las siguientes relaciones

Para probabilidades acumuladas

[ ] å=

===£=x

k

nxpnkbpnxBxXPxF0

....2,1,0);.;().;()(

Para probabilidades puntuales

P(x=x)=b(x:n.p)= B(x:n;p)-B((x-1);n.p)

Ejemplo

En una importación de computadoras muy grande, se sabe que por experienciaque el 25% de las mismas están infectadas con cierto virus. Se relaciona al azar20 computadoras del lote de importación, para efectuar un control de calidad.

a) Cual es la verdadera distribución de probabilidad y cual debe asumirse pornecesidad del N° de computadoras infectadas con el virus

b) Cual es la probabilidad de que 3 cpu estas infectadosc) Cual la probabilidad que más de 3 estén infectadasd) Determinar la media, la varianza y la desviación estándar

SOLUCIÓN

a) Como se trata de realizar un control de calidad la verdadera distribución es lahipergeométrica, pero como no se conoce la población N se asume la

distribución Binomial. X b(n,p) 20...2.1,0)75.0()25.0()( 2020

=÷øö

çèæ=Þ - xxxp xx

Donde P=0.25; q=0.75; n=20; x:”N° de CPU infectados en una m.a. de 30”Rx=0,1,2......20

b) P ( ) ( ) 1339.075.025.03)3( 17320=÷

øö

çèæ==xP

Tablas P(x=3)=b(3;20;0.25)=B(3;20;0.25)-B(2;20;0.25)=0.2252-0.0913=0.1339c) ( ) ( ) ( ) ( ) ( ) PxPxPxP 7748.075.025.0375.025.0275.025.0175.0)25.0(01)3(1)(3 173

20182

2019

20200

2020

4

=úû

ùêë

é÷øö

çèæ+÷

øö

çèæ+÷

øö

çèæ+÷

øö

çèæ-=£-==> å

tablas P[x>3]=1-P[x £ 3]=1-B(3;20;0.25)=1-0.2252=0.7748d) 94.175.3)75.0)(25.0(20)(;5)25.0(20)( 2 ========= ssm npqxVnpxE

DISTRIBUCIÓN GEOMÉTRICA

Esta distribución es una de los casos especiales de la Binomial y se utiliza cuandoexiste un proceso Bernoulli y se desea obtener el primer éxito.

DEFINICIÓN

Se dice que la v.a.d.x...G(p): donde p= probabilidad del éxito en cada intentoDonde X:”N° de ensayos Bernouli hasta obtener el 1er éxito “Rx=1,2,3...

FUNCIÓN DE PROBABILIDAD P(x)=P[x=x]=pqx-1 : Rx=1,2,3...

FUNCIÓN DE DISTRUBUCION F(x)=P[x £ x]= 0 si x<1 1-qx si ³1

LA MEDIAp

xxPxE 1)()( === åm

LA VARIANZA 2222 )()(

pqxExV =-== ms

LA DESVIACIÓN TÍPICA 2)(pqxV ==s

LA f.g.m [ ] 2

12)(qeq

pqeqptM tt

x-

=-=-

PROPIEDADES

1. No tiene memoria2. Es decreciente, es decir P[x]<P(x-1) 3,2="x

Ejemplo

1. Si la probabilidad que un postulante para aprobar la tesis en un intento alfinalizar sus estudios académicos es del 75% ¿cuál la probabilidad de que unpostulante apruebe la tesis?

a) En el primer intentob) En el segundo intentoc) En el cuarto intentod) Cual su esperanza matemática

SOLUCIÓN

Como X~G(p)Þ P(x)=0.75(0.25)x-1 Rx =1,2,3...donde p=0.75; q=0.75; “Nº deintentos hasta aprobar la tesis”

a) Primer intento X=1 )Þ P(x=1)=(0.75)(0.25)1-1=0.75=75%b) Segundo intento X=2Þ P(x=2)=(0.75)(0.25)2-1=0.1875 @ 19%c) Tercer intento X=4Þ P(x=4)=(0.75)(0.25)4-1=0.0117@ 2%

Ejemplo

2. Suponga que la probabilidad de obtener línea durante la mayor congestión dellamadas telefónicas de un canal de TV es del 3% en cada intento que se haga.

Calcular la probabilidad de que sean necesarios exactamentea) 6 intentos para tener líneab) A lo más 3 intentos

SOLUCIÓN

X~G(p)ÞP(x)= 0.03(0.97x-1 : Rx= 1,2,3,….

p =0.03 : q =0.97 Þ x: “Nº de intentos hasta obtener línea” Rx= 1,2,3,….

a) x= 6 intentos ÞP(x=6) = 0.03(0.97)6-1 = 0.0258b) x£ 3ÞP(x£ 3)= F(x=3)= 1-qx= 1-0.973= 0.0873

P(x£3)=

0873.002823.00291.003.0)97.0(03.0)97.0(03.0)97.0(03.0)( 2103

1=++=++=å xP

DISTRIBUCION BINOMIAL NEGATIVA O PARCIAL

Es otro caso especial de la Binomial y es una extensión de la Geométrica, que seutiliza cuando los experimentos aleatorios son también un proceso Bernoulli, hastaque ocurra el n-ésimo éxito:

DEFINICIÓN

Se dice que una v.a.d. ).(.~ pvPx donde:

r = Nº de exactos obtenidosp = probabilidad del éxitoX:” Nº de veces o intentos que se realiza el experimento Beunoulli hasta obtener réxitos” tal que r£ x; Sii

FUNCION DE PROBABILIDAD

[ ] ( ) ( )...2:1,:11

)( --=÷÷ø

öççè

æ--

=== - vvvPqpvx

xxPxP xvxv

FUNCION DE DISTRIBUCIÓN F(x)

( )rxSirxSi

qprk

xxP rkr

³<

÷÷ø

öççè

æ--

îíì

=£ -å ::

110

LA MEDIA

pvqp

vx

xxE vxv =÷÷ø

öççè

æ--

== -å 11

)( m

LA VARIANZA

2222 )()(

prxExV

q

=-== ms

Ejemplo 1

Una maquina se utiliza para fabricar ciertos chips en serie se sabe que laprobabilidad de cada chip sea defectuosos es del 10%. Si se controla la calidaddel CHIP producido sabiendo que la máquina se apaga cuando se producen 4chips defectuosos; cual es la probabilidad de que la máquina pare en el 10mochip producido.

p=10q =90v=4x=10

( ) ( ) ( )

[ ]

( ) [ ] ( ) ( ) 0045.0.......0(849.01.014110

10

10:"4º:"

...6,,4:9.01.0141

),(.~

4104

44

==÷÷ø

öççè

æ--

===Þ

==Þ

=÷÷ø

öççè

æ--

==

-

-

xPAP

xAparemaquinalaAsdefectuosocontrolarhastaproducidoschipsdeNx

TRx

xPpvPx xx

Ejemplo 2

La probabilidad que un CPU de cierta marca expuesto a cierto virus se contagie esdel 0.40. cual es la probabilidad de que la 10ma CPU expuesto sea al 3ra encontraerla

SOLUCION

p =0.40q =0.60v =3x =10

( )

[ ] ( ) ( ) 0645.060.040.029

10

310expº:"

,...2,1,::11

),(.~

73 =÷÷ø

öççè

æ==

++÷÷ø

öççè

æ--

== -

xP

contraerlaenlaseahastavirusaluestosCPUsdeNx

vvvxqpvx

xPpvPx

aa

vxv

DISTRIBUCIÓN MULTINOMIAL

Es una generalización de la distribución Binomial, se utiliza cuando se tienenensayos o experimentos aleatorios que tienen más de 2 posibles resultados,donde las probabilidades de los resultados son los mismos en cada ensayo, todoslos ensayos son independientes.

DEFINICIÓN

Sea un experimento aleatorio ε que tiene las siguientes características1) tiene K posibles resultados E1,E2.... Ek que son:

a. Mutuamente excluyentes jiEjE ¹"= f.:I

b. Colectivamente exhaustivos W==

i

k

iE

1U

2) La [ ] å=

=-==k

iiii PquetalresultadoesimoideléxitodeladprobabilidpEP

1

1

Se dice que las vs.as.ds. ( ) kipnlMultinomiax ii ...3,2,1:,.~ =

Donde Xi:”Nº de veces que el evento Ei ocurre en los n ensayos

Rxi=[0,1,2...n];i=1,2,3...k Sii

FUNCIÓN DE PROBABILIDAD P(x1,x2.... xk)= kxk

xx

kppp

xxxn ...

!!...!! 21

2121

MEDIA E(xi)=npi

LA VARIANZA V(xi)= npiqi donde qi=1-pi i=1,2,...k

EjemploLas probabilidades de que una lamparilla de cierto tipo de proyector dediapositivas dura

menos de 40 hrs. de uso continuo es 0.30Entre 40 y 80 hrs. de uso continuo es 0.50Ó de mas de 80 hrs. de uso continuo es 0.20 respectivamente

Calcular la probabilidad de entre 8 lamparillas:2 duran menos de 40 hrs.5 duran menos de 40-80 hrs.1 dura más de 80 hrs.

SOLUCIONSean los eventosE1:”Duran menos de 40 hrs”ÞP[E1] = 0.30E2:”Duran entre 40 y 80 hrs”ÞP[E2] = 0.50E3:”Duran menos de 80 hrs”ÞP[E3] = 0.30

Como å =W===

1)( 1

3

1EPademasUyEjE

ii fI

( )slamparillaentreientoEocurreelevdevecesqueNx

pnlMultinomiax

i

iii

8)3,2,1(º:".~

=Þ

0945.0)20.0()50.0()30.0(!1!5!2

!8)1,5,2(152

152

3

2

1

==Þ===

Pxxx

EjemploLa probabilidades que una declaración de impuestos sea llenado correctamente es del 60%que tenga un error favorable del declarante es del 20%que tenga un error favorable al fisco es del 10%que tenga ambos tipos de errores es del 10%

Se elige al azar 10 de tales declaraciones para una auditoria

Cual es la probabilidad que

5 estén correctas; 3 tengan error favorable al declarante1tenga error que favorece al fisco y1temga ambos tipos de error.

SOLUCIONSean los eventosE1: “Declaración correcta”ÞP[E1] = 0.60E2: “Declaración favorable al declarante”ÞP[E2] = 0.20E3: “Declaración favorable al fisco”ÞP[E3] = 0.10E4: “Declaración error de ambos tipos”ÞP[E4] = 0.10Como 1)( 1 == EPademasEjE i fI

( )ii plMultinomiaxUE ,10.~1ÞW=nesdeclaracioentreiEeventoelocurrequevecesdeNx i 10)4,3,2,1(º:" =

0314.0)10.0()10.0()20.0()60.0(!1!1!3!5

!10)11,3,5( 1135 ==P

DISTRIBUCIÓN HIPERGEOMÈTRICA

Esta distribución se utiliza generalmente cuando se realiza un muestreo sinrepetición de una población finita N conocida que se divide en : 2 clases M éxito yN-M fracasos, donde la probabilidad del éxito ya no es constante porque en cadaextracción es diferente por lo tanto los ensayos ya no son independientes, tienemucha aplicación cuando se efectúa control de calidad.

DEFINICIÓN

Se dice que una v.a.d X ~ H(N,nM)ó h(x:NnM)donde

N =tamaño de la poblaciónX:”Nº exactos en un m.a. de tamaño n sin reposiciónn =tamaño de la m.a. ó Nº de extracciones Rx=[0,1,2..Min (n, M) SiiM =Nº de elementos exitosos


[ ] ( )MnMinR

nN

xnMN

xM

xxPxp c ....2,1,0:)( =

÷÷ø

öççè

æ

÷÷ø

öççè

æ--

÷÷ø

öççè

æ

==

FUNCION DE DISTRIBUCIÓN

[ ]

9,(

00

1

0),(0)(

MnMinxSi

xSii

x

kMnMinx

nN

knMN

kM

xxPxF

³

<

=

<£

÷÷ø

öççè

æ

÷÷ø

öççè

æ--

÷÷ø

öççè

æ

ïïï

î

ïïï

í

ì

=£= å

MEDIA

úûù

êëé=== å N

MnxPxxE )()( m

VARIANZA

úûù

êëé

--

úûù

êëé -úûù

êëé==

11)( 2

NnN

NM

NMnxV s factor de corrección

EjemploComo parte de un estudio sobre la contaminación del aire un Ing. Geológicodecide examinar la emisión de gases tóxicos de 6 de los 24 camiones de una CIAsi 4 de esos camiones, emiten cantidades de gases tóxicos. Cual es laprobabilidad de que:

a) Ninguno de ellosb) Mas de 3 emitan gases

SOLUCION

Como se trata del control de calidad X~H(N,n,M)

N = 24n = 6M =4 éxitosN-M = 20 fracasos

( )

[ ] 0014.0134596

190624

4620

44

)4()4(3)

2880.0596.134760.38

624

0620

04

0)

4,3,2,1,0

6246

204

)(

==÷÷ø

öççè

æ÷÷ø

öççè

æ-÷÷

ø

öççè

æ==³=>

==

÷÷ø

öççè

æ

÷÷ø

öççè

æ-÷÷

ø

öççè

æ

==

=

÷÷ø

öççè

æ

÷÷ø

öççè

æ-÷÷

ø

öççè

æ

=

å PxPxPb

xPa

xxx

xP

EjemploEn el laboratorio de Sistemas hay 20 CPUs donde existen 6 CPUs condesperfecto. Si se elige aleatoriamente 4 CPUs para su reparación.

a) cual es la probabilidad de que al menos 1 CPU deba ser reparadob) cual es el Nº esperado de CPU para ser reparado y su varianza

SOLUCIONComo se trata de control de calidad y se tiene el tamaño de la población

N = 20n = 6M =4N-M = 14

X~H(N,nM)

Donde X: “Nº de CPUs que tienen desperfecto de entre 20”

Rx=0,1,2,3,4

( )

7074.0600.7376.5

1916

2014

2024)(

120420

2061

2064

11)(

2.12064)()

7934.0

420

414

06

1)0(11)

==÷øö

çèæ÷øö

çèæ÷øö

çèæ=

úûù

êëé

--

úûù

êëé -úûù

êëé=úû

ùêëé

--

úûù

êëéúûù

êëé=

=úûù

êëé=úû

ùêëé=

=

÷÷ø

öççè

æ

÷÷ø

öççè

æ÷÷ø

öççè

æ

-=£-=³

xV

NnN

NM

NMnxV

NMnxEb

xPxPa

APROXIMACIÓN DE LA HIPERGEOMETRICA A LA BINOMIAL

Cuando la población N es grande con relación a n es máximo el 10% de N;n£0.1N Þpor lo tanto el muestreo puede ser con o sin reemplazo, por lo tanto laprobabilidad del éxito son casi independienteÞ se puede aproximar a la binomial

con MqnMp -== 1:

)(...2,1,0:1):(),,,( nMMInxNM

NMxnMxbMnNxh

xnxn=÷

øö

çèæ -÷

øö

çèæ÷øö

çèæ@@Þ

-

LA MEDIA

úûù

êëé»==

NMnnpE x m

LA VARIANZA

úûù

êëé -úûù

êëé»==

NM

NMnnpqxV 1)( 2s

EjemploUna importación de 100 computadoras, de las cuales 25 se sabe que tienendesperfecto. Se realiza un control de calidad para ello se toman 10 computadoras,cual es la probabilidad:

a) de que 2 tengan desperfectosb) cual el Nº esperado de CPUs con desperfecto y para ello utiliza la

verdadera distribución y una aproximación si se puede

SOLUCIONComo se trata de control de calidad

La verdadera distribución X ~ H(N.n.M)

÷÷ø

öççè

æ

÷÷ø

öççè

æ--

÷÷ø

öççè

æ

=Þ

nN

xMMN

xM

xp )(

N = 100n = 10M =25N-M =75

X: “Nº de computadores que tienen desperfecto entre 10

( )

( ) 5.21002510)

292.0

10100

875

225

2)

10....2,1,0

=úûù

êëé=

=

÷÷ø

öççè

æ

÷÷ø

öççè

æ÷÷ø

öççè

æ

==

=

xEb

xPa

Rx

Como n=10 £N 10/de 100Þse puede aproximar mediante la binomial

( ) ( ) 2515.075.025.02

10)2()

0751

25.010025

82 =÷÷ø

öççè

æ=-

=-=

===

xpa

NMq

NMp

DISTRIBUCIÓN MULTIVARIADA

Es una extensión de la hipergeométrica y se aplica cuando se realiza control decalidad de una población que se clasifica en k clases de diferentes tipos M1, M2, Mk

Tal que N= i

k

iMU

1=donde se extraen un m.s. de tamaño n sea reposición de una

población tamaño N, donde:a) Cada extracción tiene k posibles resultadosb) Los ensayos no son independientes

DEFINICIÓNSe dice que los vs.as.ds. Xi ~ Multivariante

Donde Xi=”Nº de objetos del i-esimo tipo”

Rxi=0,1,2... Mn(Mi,n) Sii tal que å = nxi

FUNCION DE POBABILIDAD

P(xi,x2... xk: N,n)=÷øö

çèæ

÷÷ø

öççè

æ÷÷ø

öççè

æ÷÷ø

öççè

æ

N

k

k

n

xM

xM

xM

...2

2

1

1

EjemploEn un depósito hay 20 TV de los cuales 10 son de 20’’: 6 de 18’’ ;4 de 15’’, se eligeal azar 10TV. Cual es la probabilidad de que haya 5 de 20’’, 3 de 18’’ y 2 de 15’’.SOLUCION

Como N= M1+ M2+M3=10+6+4=20Þxi ~Multivariado

M1=Nº TV de 20” = 10Þx1 =5 Xi: “Nº de TV del i= esimo tipo” i=1,2,3M2= Nº TV de 18”=6ÞX2=3 Rxi=0,1,2,3,4

M3= Nº TV de 15”=4ÞX3=2 1637.0189.46

560.7

1020

24

36

510

)10:20:2,3,5( ==

÷÷ø

öççè

æ

÷÷ø

öççè

æ÷÷ø

öççè

æ÷÷ø

öççè

æ

=p

DISTRIBUCIÓN DE POISSON

Por su aplicación es una de las mas importantes tanto como Proceso Poisson ocomo aproximación a la Binomial

1) COMO PROCESO POISSON

Se considera como proceso, cuando la v.a.d. X es el Nº de eventos queocurren en un intervalo de tiempo o en una región espacio o volumen.

DEFINICIÓN

Se dice que una v.a.d. x ~ ótp )(l x~ );( txf i ldonde l =Nº promedio de ocurrencias de eventos en una unidad de medida:que pueden ser intervalo de tiempo, región especificad, dichas ocurrenciasson independientes Sii

FUNCIÓN DE PROBABILIDAD

..71828.2...3,2,1,0:)()( ===== - exetxXPxP tx ll

dondel t = Nº promedio de ocurrencias de los eventos en las t unidades demedidacuando t= fijoÞ l t=a

3,2,1,0:!

)()( =-

===-

xx

exxPxPx aa

FUNCIÓN DE DISTRIBUCIÓN

[ ]

ïïï

î

ïïï

í

ì

³=£=

<-

=å 0

!)(

00

0

xkexxPxF

xSikx a

a

a

LA MEDIA alm === txE )(

LA VARIANZA als === txV 2)(

USO DE TABLAS

Para facilitar el calculo se tiene confeccionados tablas en función dedistribución

[ ] ):()( lxFxxPxF =£=

En caso de valores puntuales [ ] ):1();(),( lll --=== xFxFxfxxP

Ejemplo

Supongan Que llegan en forma aleatoria una serie de llamadas a unacentral telefónica con promedio de 3 llamadas por minuto. Calcular laprobabilidad de que ocurran:

a) 4 o más llamadas en el periodo de un minutob) 4 o mas llamadas en el periodo de 2 minutosc) 4 o mas llamadas en el periodo de 20 segundosSOLUCIONComo la ocurrencia de los eventos se da en periodos de tiempo )(.~ tPx l

Donde l = 3 llamadas t=1 minuto ...3,2,1,0!

3)(3

==Þ-

xxexP

x

x:”Nº de llamadas en un minuto

a)

( ) ( ) [ ] ( ) ( ) ( ) ( )[ ]

3520.0627

29

13

131

!33

!23

!13

!031

32101314

03

33323130

4

=úû

ùêë

é+++-=

úû

ùêë

é+++-=

+++-=£-==³

-

----

¥

å

e

eeee

PPPPxPxPxP

b) ( ) ( ) ( ) 849.0151.013131462*3 =-=-=£-=³Þ== FxPxPtlc) ( ) ( ) 019.09801.01)3(131)4(13 3

1 =-=-£-=³Þ== FxPxPtl

2) COMO APROXIMACIÓN A LA BINOMIAL

Cuando la muestra N y la probabilidad del evento es muy pequeño existedistribución binomial, es decir p<0.1 y np£5: p£0.005: n³20: n>30

Entonces se puede utilizar la PISSON como límite o aproximación de labinomial

Donde ctenpxE Þ== l)(

2,1,0!

ˆ!

)( ==÷øö

çèæ»=

--

xxepnxb

xetxP

x

i

tx lll ll

FUNCION DE PROBABILIDAD ctenpxxexP

x

====-

ll l

...3,2,1,0!

)(


[ ]ïî

ïíì

³=£=

<-

=å 0:

!)(

0:0

0

xkexxPxF

xSikx

k

ll

LA MEDIA lm === npxE )(

LA VARIANZA npxV === ls 2)(

Ejemplo

Se sabe que el 5% de la CPUs ensamblados en cierta factoría tieneensamblaje defectuoso. Cual la probabilidad de que 2 de 100 CPUsensamblados estén defectuosos:

a) mediante la verdadera distribuciónb) mediante una aproximación

SOLUCION

n =100p = 0.05q = 0.95

( ) ( )

( ) ( )

0842.02

)(25!2

5)2(

2,1,0:!

5)(5)05.0(100

)

0812.095.005.02)2(

"500º"

100...3,2,1;95.005.0)()05.0;100(.~)

552

5

2102100

10100

====

==Þ===

=÷øö

çèæ==

=

=÷øö

çèæ=Þ

--

-

-

-

eexP

xxexPnp

POISSONlaaónaproximaciunamedianteb

xP

entresensambladamalCPUsNx

xxxpbxa

x

xx

l

PROPIEDAD REPRODUCTIVA

Si 2 o mas variables tienen una misma distribución entonces la resultantede sumar o restar será una nueva variable que tendrá la misma distribuciónde probabilidad que sus sumandos.

Si Xi ~ misma distribución .~1

YxSi i

n

i=å

=

misma distribución i= 1,2...n

Si nPX iii ,...2,1)(.~ ="a

åå =Þ=Þ=

i

n

ii PYxY aa

1(.~

Ejemplo

En una fabrica el Nº de accidentes por semana sigue un proceso dePOISSON con parámetro 2=a .

Determinar:

a) la probabilidad de que haya 4 accidentes en el transcurso de 3 semanasb) la probabilidad que haya 2 accidentes en una semana y otros 2

accidentes en la semana siguiente

c) Es lunes y ya hubo un accidente. La probabilidad que en aquellasemana no haya mas de 3 accidentes

SOLUCION

Definiendo las variables POISSON con parámetro 3,2,1:2 == iiaX= “Nº de accidentes en cualquier semanaX1: “Nº de accidentes en la 1ra semana”X2: “Nº de accidentes en la 2da semana”X3: “Nº de accidentes en la 3ra semana”

Como las 3 v.a son independientes 6222(.~321 =++=++=Þ aPxxxY

( ) [ ]

8348.08647.0

1429.08647.0)1(

)0()3()1(

)31()1(

)1(3(13)

22

0733.0!2

2)2()2()22()

"3º:"1339.0!4

6)4()

21

22

2121

64

=-

=

³£-£

=³³£

=³

³Ù£=³£

==

=÷÷ø

öççè

æ=====Ù=

===

-

-

xPxPxP

xPxP

xPxPxPxxPc

exPxPXxPb

semanasenaccidentesdeNYeYPa

aa

DISTRIBUCIONES CONTINUAS

Los espacios muéstrales continuos y las v.a.c. surgen cuando se trabaja concantidades que se miden en una escala continua (velocidad de una CPU; lacantidad de alcohol en la sangre, la cantidad de nicotina en un cigarrillo, etc.)

Entre las principales distribuciones de probabilidad continua tenemos la uniforme,la experimental, la norma, algunas distribuciones muéstrales como la Chicuadrado, la t estudiante, la Fisher, etc.)

LA DISTRIBUCIÓN UNIFORME X~U [a,b]

DEFINICIÓN

Se dice que una v.a.c. X tiene distribución uniforme o rectangular en el intervalo [a,b] tal que a< b Sii

FUNCION DE PROBABILIDAD O DENSIDAD

ïïî

ïïí

ì

££-

= bxa

eocab

xf ;

;0

1)(ab -

1

a c d bPara cualquier sub. intervalo [c, d] donde

[ ] [ ] [ ]abcdcd

ababdx

abdxcPbdca x d

c

d

c --

=--

=-

=-

=££Þ£££ ò 111

además P(x=x) =0

Se dice distribución uniforme porque la [ ]dxcP ££ es la misma para todos los subintervalos que tienen la misma longitud.

FUNCION DE DISTRIBUCIÓN O ACUMULADA

[ ]

[ ]baxSi

bxaSiaxSi

abaxxxPxF

abaxdx

abdx

abxxPxF

x

a

x

³<£

<

ïî

ïíì

--

=£=

--

=-

=-

=£= òòµ0

1

)(

11)(

a b x’LA MEDIA

21)( badx

abxxE

a

b

+=

-== òm

LA VARIANZA

( ) ( )1212

1)(222

22 baóabx

badxab

xxVb

a

-=

-=÷

øö

çèæ +

--

== òs

Ejemplo 1

Suponga que un punto es elegido al azar en el intervalo (1;4)Calcular la probabilidad de que el punto esté:

a) En la posición 3b) El punto este entre 3/2 y 3

SOLUCION

X ~ U[a, b]donde a =1 ; b =4

F(x)

X: “posición del punto en el intervalo [1,4]”

ïïî

ïïí

ì

ïïî

ïïí

ì

³<£

<

--

££=Þ4

411

1141

0

)(;41;

031)(

; xSixSi

xSixxFxxf

eoc

[ ]

[ ]ò

ò

=úûù

êëé=úû

ùêëé -===úû

ùêëé <<

=====

3 3

33

3

3

23 2

3

21

23

31

233

31

31

313

23)

0)0(31

31

31)3()

xdxxPb

xdxxPa

o también mediante la función distribución acumulada

[ ]

21

63

332

31

32

23)3(

2333

23

21

23

==-=-

-=

÷øö

çèæ-=úû

ùêëé £-<=úû

ùêëé << FFxPxPxP

Ejemplo 2

Suponga que cierta línea de transporte publico pasa por un determinado paraderode control o de espera, a un horario estricto con intervalos de 30 minutos duranteel día. Si un pasajero llega a ese paradero en un instante aleatorio durante el día.Calcular la probabilidad de que tenga que esperar:

a) más de 15 minutosb) Exactamente 7 minutos

SOLUCION

X ~ U[0.30]donde a = 0 ; b =30X = “tiempo de espera en minutos del pasajero”

30300

0

301

0300

0

)(;300;

0301)(

;³<££

ïïî

ïïí

ì

=--

££

ïïî

ïïí

ì

=xSi

xSixSi

xxxFxxf

eoc

[ ][ ] 07)

21

3015

301

301)15() 30

15

30

15

==

====> òxPb

minutoxdxxPa

Ejemplo 3Sea la v.a. X...U[0,6] calcular

( ) ( ) ( ) ( )

31

61

651

151]15[1]51[1]232[1]23[1]23[

326:]2[

=+-=

+-=<-£-=££-=

£-£--=£--=>-

==>-

FFxPxPPxPxPxPxP

doreemplazanquesabemosxP mm

DISTRIBUCIÓN EXPONENCIAL

Es un caso particular de la distribución gamma, que se aplica no solo a laocurrencia del 1er acierto en un proceso POISSON, si no también en los tiemposde espera entre los aciertos; también se aplica en la teoría de la confiabilidad deun sistema, y la teoría de colas.

DEFINICIÓN X ~ EXP ( )lSe dice que una v.a.c. X tiene distribución exponencial con parámetro ( )l

FUNCION DE PROBABILIDAD O DENSIDAD

ïî

ïíì ³

=-

eocxexf

x

;00;)(

ll

donde e = 2.71828...:; ( )l = Cte. >0 0 l

1 x


1

00

10

][)(³<

îíì

-=£=

- xSixSi

exXPxF xl

l1 x

MEDIA

llm l 1)(

0=== -µ

ò dxexxE x

ll 368.0=e

F(x)

F(x)

VARIANZA

2222

0

22 112)(lll

mls l =-=-== -ò dxexxV xx

Ejemplo 1

Si el Nº de automovilistas que corren a cierta velocidad, que un radar detecta porhora en cierta localidad es una v.a. POISSON con l =8.4 hrs. Cual es laprobabilidad de tomar un tiempo de espera menos a 10 minutos entreautomovilistas sucesivos?

SOLUCION

X ~ EXP( l ) donde l =8.4 hrs.

Donde X: “tiempo de espera en minutos”

00

1

0)(;

;00;4.8)( 4.8

4.8

³<

ïî

ïíì

-=

ïî

ïíì ³

=-

-

xSixSi

exF

eocxexf x

x

Como X =10 minutos x horasmin

hora61

601 =

( )

[ ][ ] 7534.012466.0

4.84.861

)0(4.8)(4.80

4.8

4.8

00

4.8

61

61

61

61

=--=úûù

êëé --=-=

--==úûù

êëé £

---

-- òòeee

dxedxexP

x

x

mediante la acumulada [ ] ( ) 7534.01 )(4.861

61 6

1

=-==< -eFxP

Ejemplo 2

El tiempo durante el cual una marca de computadora que opera en forma efectivaantes de su primera reparación, se distribuye exponencialmente con un promediode fallas de 360 días

a) Si una de estas computadoras ha durado al menos 400 días, cual laprobabilidad de que dure al menos 200 días más

b) Si se están usando 5 de tales ordenadores, cual la probabilidad de que almenos 3 de ellos continúan funcionando después de 360 días

SOLUCION

X~EXP( l )Þ X ~ EXP )(3601

Como E(x)=360= 6011 =Þ ll

00

1

0)(;

;00;)(

360

3603601

³<

ïî

ïíì

-=

ïî

ïíì ³=

-

-

xSixSi

exF

eocxexf x

x

X: “ tiempo que opera el ordenador hasta la primera falla

[ ] [ ] [ ][ ]

[ ][ ]

95

360

360

400 3601

600 3601

400600

400400600400600400200200 -

-

-

==³³

=³

³³=³³=³+³

òò e

dxe

dxe

xpxp

xPxxPxxxxP x

x

a

a

I

Ó mediante la acumulada

[ ][ ]

[ ][ ]

5556.095

3620

360400

360600

360400

360600

360400

360600

11

11

)400(1)600(1

40016001

400600 -=-+-

-

-

-

-

====

úûù

êëé --

úûù

êëé --

=--

=<-<-

=³³ -

eeee

e

e

e

FF

xPxP

xPxp e

RELACION ENTRE EL MODELO EXPONENCIAL Y POISSON

La distribución exponencial tiene una relación especial con la PISSON porqueX~P[ l ]donde X: “N° de veces que ocurre un evento en un periodo “t” conpromedio l ”Þ la v.a. T: “tiempo entre la ocurrencia de 2 eventos consecutivos de POISSONÞ T ~ EXP[l ]

TEORIA DE LA CONFIABILIDAD (Rt)

Una de las aplicaciones principales de la distribución exponencial se da en laconfiabilidad del funcionamiento normal de un sistema o componente electrónico.

DEFINICIÓN

La confiabilidad (Rt) de un sistema en determinado medio ambiente, durante unperiodo “t”, se define como la probabilidad de que su tiempo para fallar (T) excedea su tiempo de funcionamiento normal (t)

[ ] [ ] [ ] tt eetTPtTPtR ll -- =--=£=>=Þ 111)(

Ejemplo

La probabilidad de buen funcionamiento de un elemento de cierto equipo desonido se distribuye exponencialmente con:

eocte

tft

:0

0;02.0

)(02.0 >

îíì

= Determinar la confiabilidad del elemento en un periodo de

50 hrs.

SOLUCION

[ ] 3679.0)50(50 1)50(02.0 ====> -- eeRTP

DISTRIBUCIÓN NORMAL

Es la distribución mas importante de la teoría estadística, porque casi todos losfenómenos físicos, científicos sociales psicológicos, tienen un comportamientonormal, además casi todas las distribuciones bajo ciertos requisitos se puedenaproximar mediante la normal.

DEFINICIÓN

Se dice que una v.a.c. X ~ N( 2,sm ) Sii


( )[ ]¥<<-¥

P=

--

xexfx

;2

1)( 2

2/ sm

s

donde71828.2

...1416.3==P

e

CARACTERÍSTICAS

1. Es simétrica respecto aP

=2

1)(s

m xfdonde

2. Es creciente en el intervalo >-¥< m, cuando x< m

3. Es decreciente en el intervalo >¥< ,m cuando x> m

P21

s

F(x)

MoMe ==m


dxxfxxxPxFx

)(][)( ò¥=£= ½

m

LA MEDIA

m== ò¥

¥-dxxfxxE )()(

LA VARIANZA

222 )()( sm =-= ò¥

¥-dxxfxxV

DISTRIBUCIÓN NORMAL ESTANDAR

Estandarizar la Normal significa llevaro trasladar la distribución hasta que 0=m y 12 =s

Mediante la v.a.e.= ( )1.0....; Nzz xsm-=

m =0 z z xUSO DE TABLAS

Cuando la v.a.c. X ~ N( 2,sm ) no esta estandarizada ( 1:0 2 ¹¹ sm ), la misma se la

debe estandarizar consm-

=xz y colocar en acumulada F(z)ó ( )zzPz £=)(f

Ejemplo

Sea X...N(5,4)cual la probabilidad de que x

a) toma valores entre 4 y 7?b) Toma valores mayores que 10?

SOLUCION

a)P[4<x<7]estandarizando mediantesm-

=xz

F(x) - 1

P21

s

F(x)

m

F(z)

donde 2;4;5 2 === ssm

[ ] [ ] [ ] 5328.03085.08413.0)5.0()1(5.0115.02

571

54=-=--=-£-<=<<-=úû

ùêëé -

<-

<- FFzPzpzpxP

sm

[ ] [ ] [ ] 0062.0)5.2(15.215.22

51010) =-=£-=>=úûù

êëé -

>-

=> FzpzPxPxPbsm

Ejemplo

El tiempo T requerido para contagiarse un computadora por cierto virus es una v.a.normal con media 31 segundos y desviación estándar 5 segundos.

a) Cual la probabilidad que un ordenador se contagie con el virus en menos de35 segundos

b) Si un ordenador particular se observa que no está siendo contagiado por elvirus en 30 segundos, cual es la probabilidad de contagiarse antes de los35 segundos

SOLUCION

T ~ N(31,5)T: “tiempo requerido para contagiarse una CPU con el virus en segundos”

[ ] 7881.0)8.0(54

5313535) ==úû

ùêëé <=úû

ùêëé -

<-

=< FzPTPTPasm

[ ] [ ][ ]

[ ][ ]

[ ][ ] 63.0

5793.03674.0

)2.0(1)2.0()8.0(

2.08.02.0

30353030/35)

53130

53135

53130

==--

--=

-><<-

=>

<<=

><<

=><-

--

FFF

zPzP

zPzP

TPTPTTPb


La distribución normal también goza de esta propiedad, es decir:Sean n.v.a. independiente : X1+ X2+...+Xn donde Xi...N ( )2; ii sm si sumamos dichas

variables å=

=n

ii Yx

1~ ( )sm 2; yyN donde åå

==

==n

iiy

n

iiy

1

22

1; ssmm

÷÷ø

öççè

æ=Þ åå

==

n

iiy

n

iiNY

1

22

1

;.~ ssm

Ejemplo

Sea una v.a. 32

2x

xxy i -ú

û

ùêë

é += donde Xi...N ( )2; ii sm ; i =1,2,3

5;11;52525;20

23

22

21

321

======

sssmmm

a) Cual la distribución de probabilidad Y?b) Calcular P[Y>0]

SOLUCION

Como Xi...N ( )2; ii sm =Y...N ( )2; yy sm

donde

[ ]

[ ]

( ) ( ) ( )[ ] ( )

[ ])9;7(.~

39511541

41

2

725162021

)()(21

2)(

2

3213212

321321

-Þ

=Þ=++=

++=÷øö

çèæ -

+==

-=-+=

-+úûù

êëé -

+==

NY

xvxvxvxxxvyv

ExxExExxxEyE

yy

y

y

y

ss

s

m

m

[ ] 0099.09901.01)33.2(137

3)7(00 =-=-=úû

ùêëé >=

úúû

ù

êêë

é -->

-=> FzP

YPYP

y

y

sm

TEOREMA CENTRAL DEL LIMITE

Este es el teorema mas importante de la estadística, porque mediante la mismanos permite aproximar a la distribución normal sumas finitas de v.a.independientes, que pueden tener cualquier distribución de probabilidad conmedia y varianzas conocidas

DEFINICIÓN

Sea una sucesión de n. v. a. i.: X1, X2, ... Xn

Cuyas medias E(Xi)= im y cuyas varianzas V(Xi)= 2is (conocidas y finitas)

Þ Si sumamos los n.v.a.i.: X1+X2+...+ Xn=Yn, con la condición que los Xicontribuyan con una cantidad mínima despreciable a la variación de la suma

Þ La v.a.e. de la variación: 1) )1.0(.~;2

1

2

11 NZY

xZ n

i

in

n

ii

n

ii

n

ii

n

åå

å

åå -=

-

=

=

==

s

m

s

m

CASO ESPECIAL

Cuando Xi....MISMA DISTRIBUCIONÞ La secuencia de las n.v.a.i.: X1,X2,..., Xn

Þ E(Xi)= m y V(Xi)= 2s

Þ Yn=X1+X2+...+ Xn=å 1x

2)n

nx

n

nxxZ

iiin s

m

s

m

s

m ååååå -

=-

=-

=22

ó también dividiendo entre “n”

( ))1.0(.~; NZn

xZ n

n

nn

nnx

n

i

sm

s

m-

=-

=åå

Ejemplo1

Suponiendo que la vida útil de un componente electrónico de uso continuo, tienedistribución exponencial, con un promedio de 100 hrs. Tan pronto como sedeteriora, es reemplazado por otro para que continúe funcionando.

a) calcular la probabilidad de que durante 209,5 días se necesiten mas de 36de estos componente

b) cuantos de estos componentes se necesitan par que duren al menos 4536hrs., con una probabilidad de 0.9901

SOLUCIONComo ÷

øö

çèæl1.~EXPX i donde X: “Duración del i=esima componente” en horas”

I=1,2,......36Donde l

lÞ== 1001)(xE

;100;1001)( 22 === s

lxV Yn: “tiempo total de duración de los n componentes”

n=36

n.u ( )600

3600363610036003610036 -

=-

=-

=Þ= å YYn

nxZ i

ns

m

a) [ ]

[ ] ( ) 9913.038.238.2600

360050285028

36

3636

==<

úûù

êëé -

<Þ=<

FZP

ZPandoestandarizYP

b)

[ ] [ ][ ]

643.64018.8018.8

33.2100

100536.4

0099.0100

100536.4

0099.09901.01536.49901.0536.419901.0536.4

22 »=Þ==Þ=

=-=-

=úû

ùêë

é -£

=-=£=£-Þ=³

nxnX

nXhaciendoecuaciónlaoresolviendn

n

críticovaloreldonden

nZP

adoestandarizYPYPYP

n

n

nn

Ejemplo 2

La longitud que se puede estirar sin ruptura un filamento de nylon es una v.a.exponencial con media de 5000 pies. Cual es la probabilidad aproximadamenteque la longitud media de 100 filamentos este comprendido entre 4750 y 5550 pies.

SOLUCION

úûù

êëé5000

1.~: EXPX

X: “longitud de estiramiento sn ruptura del i-esimo filamento” i=1,2....100

[ ] ( )

[ ] 5558.03085.08643.0)5.0()1(1.15.0100

500010050005550100

50005000457055504750)5000(1)(

)(50001)(

100

1002

2

=-=--=££-=

úû

ùêë

é -££

-=££=÷

øö

çèæ=

-===

FFzP

zxPxV

andoestandariznxZporxE nn

s

rl

sm

l

APROXIMACIONES DE LAS DISTRIBUCIONES DISCRETAS A LA NORMAL

Mediante el teorema central del limite, se pueden aproximar distribucionesdiscretas a la norma, para ello se debe convertir un v.a continuo, mediantefactores de corrección de acuerdo a las siguientes situaciones:

[ ] [ ][ ] [ ][ ] [ ][ ] [ ][ ] [ ][ ] [ ]5.05.0)6

5.0)55.0)4

5.0)35.0)2

5.05.0)1

+££-=££+³=>-³=³

-££=<+££=£

+££-==

bxaPbxaPxxPxxPxxPxxP

xxxPxxPxxxPxxP

xxxPxxP

RESUMEN DE LAS APROXIMACIONES MEDIANTE

)1.0(.~2

NZX

Zi

iiÞ

-=

åå å

s

m

DISTRIBUCION REQUISITO MEDIA VARIANZA V.A ESTANDARCORREGIDA

BINOMIAL

21

2121

;

;5

;10

>>

£>

»>

pnq

pnp

pnnpqxV

np=

=)(

ll

npqnpxZ -±

»5.0

HipergeométricaNn

Nn05.01.0

³³

êëéúûù

êëé -úûù

êëé=

úûù

êëé=

1)(NM

NMnxV

NMnm [ ]

[ ][ ]11

5.0

---

-±»

NnN

NM

NM

NM

n

xZ

POISSON5>¥®

lnn

ls

lm

=

=2 l

ln

nxZ -±»

5.0

Ejemplo 11 si la v.a. X....b(20;0.5) calcular la P[x =7]a) De manera exacta, b)Aproximada

SOLUCION

Sabemos que nxqpxxP xnxn

...2.1.0;)( =÷÷ø

öççè

æ= -

Donde n=20p=0.5q=0.5

a) Exactamente o con la verdadera distribución binomial

( ) ( ) 0739.05.05.07)7( 13720=÷÷

ø

öççè

æ==xP

b) Aproximadamente mediante la Normal

Donde np =10 corrigiendo ]5.075.07[ +££- xP

( )( ) [ ][ ] [ ][ ] [ ]( ) ( ) 0732.057.112.1

57.112.1

5.75.624.25.05.010

24.2105.6

24.2105.7

=---=-£--£=

£-£

££Þ=--

FFZPZP

ZPZP

andoestandarizxPnpq

Ejemplo 2

[ ]5.75.6 ££ xP[ ]5.75.6 ££ xP

Suponga que la probabilidad de que cierta marca de CPU, esta en serviciodespués de 1 año es 0.80. Si la “U” adquiere 35 de tales CPUs. Cual laprobabilidad de que

a) 7,b)al menos 5 de las CPUs adquiridos NO esta en servicio después de 1año?

SOLUCION

X~b(n,p)Þ X~b(35;0.20)n = 35; p =0,20; q =0,80

Como n = 35>10 y p=0.20<0.5 podemos aproximar mediante la Normal con np=7 y3664.26.5 ==npq

a)

[ ] [ ]

[ ] [ ] [ ]

1664.0)21.0()21.0(

21.021.02113.02113.03664.2

75.73664.2

75.6

5.05.75.67

=--=

-£-£=££-=úûù

êëé -

££-

Þ

-±=££==

FF

ZPZPZPZP

npqnpxZdondexPxP

b)[ ] [ ] [ ] [ ]

[ ] 8554.0)06.1(1056.113664.2

75.41

515.45.055

=--=-<-=úûù

êëé -

£-=

<-=³=-³=³

FZPZP

xPxPxPxP

Ejemplo 3

El tiempo que un cajero de un banco emplea para atender a un cliente es una v.a.con media 3.1 minutos y una desviación estándar de 1.7 minutos. Si se observanlos tiempos y corresponden a 64 clientes ¿Cuál la probabilidad de que el tiempopromedio de los mismos sea por menos 3.4 minutos?

SOLUCIÓN

Como X .~ P(x)

647.1

1.31.3

2

==

==

==

ns

ls

lm [ ] [ ]( ) [ ]

0793.09207.01)41.1(1

41.117.1

641.34.31

4.36414.364

=-=-=

<-=úû

ùêë

é -<-

<-=>

F

zPzP

xPxP

UNIDAD II

DISTRIBUCIONES MUESTRALES

Competencia:

-El estudiante debe saber utilizar las diferentes distribuciones muestrales ,es decir lasdiferentes distribuciones de cualquier estadístico estimado a partir de muestras aleatoriaspara realizar eficientemente la Inferencia Estadística

Objetivos.

-Utilizar correctamente el concepto de muestra aleatoria en las diferentes distribucionesmuestrales ,para realizar generalizaciones respecto de una población en base a estadísticos

Descripción general de la unidad:-Esta unidad comprende el desarrollo de los siguientes conceptos:Población-ParámetroMuestra aleatoria-Estadístico; Distribución muestral:de la Media ,Diferencia de Medias,dela Proporción y la diferencia de Proporciones,de la Varianza y razón de Varianzas,con susrespectivas distribuciones especiales como: la “t” student,La Normal,La “Chi Cuadrado” yLa “F” de Fisher.

Lectura:Millar/Freund/Jonson “Probabilidad y Estadística paraIngenieros”Edo.de México 1992 Pgs. 187 al 205 Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e InferenciaEstadística((2ª ed) Perú .Pags.559 al 623

Referencia electrónica:http://www.itcomitan.edu.mx/tutoriales/estadística/contenido/unidad_2_4.html

http://www.itcomitan.edu.mx/tutoriales/estadstica/contenido/unidad_2_4.html

INTRODUCCIÓNSe llama distribución muestral, cuando la variable resulta ser un estadístico o estadígrafo, calculado enbase a los datos de una m.a.Estos estadísticos se utilizan para realizar inferencia estadística para la toma dedecisiones, respecto alguna característica de la población ó respecto a ladistribución de la misma.Para desarrollar las distribuciones muéstrales es necesario recordar algunosconceptos básicos:POBLACION f(x);P(x);X,YEstadísticamente población es el conjunto de todas las observaciones posiblesque puede tomas una v.a. X. Por lo tanto la distribución de la población es ladistribución de la v.a. X. Las poblaciones de acuerdo a su magnitud pueden ser:POBLACIONES FINITAS (N)Son aquellas que están limitadas o acotadas

POBLACIONES INFINITASSon aquellas que no están imitadas, estadísticamente las poblaciones muygrandes se las consideran infinitas.- El proceso para obtener la información de toda la población es el CENSO

PARÁMETROS

Son todas las medidas descriptivas que caracterizan a la población como porejemplo la media = m, la varianza s2 etc. Los parámetros se denotan con las letrasgriegas

MUESTRA ALEATORIA(m.aÞn) una m.a. de tamaño “n” es un subconjunto representativo de lapoblación, el proceso para obtener la información se llama muestreo

ESTADISTICO,Son todas las medidas descriptivas que se obtienen a partir de la información de alm.a. como por ejemplo: la media = x , la varianza= S2 etc. Generalmente se lasdenota con las letras castellanas.

DEFINICIÓN DE m.a.

Dada una población f(x);P(x) ó X con media m y varianza s2

Se llama m.a. De tamaño “n” al conjunto de n.v.a X1, X2,... Xn tal que satisfacen 2requisitos:

1. Xi son independientes donde la distribución conjunta esa) Si X es discreta )()()....()(),....,( 2121 xPXpXPXPXXXP nn P==Þb) Sí X ex continua )()()....()(),....,( 2121 xfXfXfXfXXXf nn P==Þ

2. Xi tienen la misma distribución Xa) f(xi) = f(x)ó P (xi)= P(x); i=1,2…nb) 2)(;)( sm == ii xVxE

Nota. Esta definición es valida cuando:1. La población es infinita con ó sin reposición2. La población es finita, con reposición

EjemploSea una población X~N (m,s2), se toma un m.a. tamaño n X1, X2,... Xn

a) Escribir la función de probabilidad conjunta de la m.a.b) Sí n = 6 ; m=20; s2 =25 Calcular la probabilidad de que b) X1 +X3+ X4

-X6 sea mayor que 52DEFINICIÓN

como X~N (m,s2) sabemos que f(x)=

2

21

21

÷øöç

èæ-

-

P

s

m

s

x

e

a) la función de probabilidad conjunta de la m.a. de tamaño “n” es

f(X1, X2,... Xn)= [ ]

n

niini

x

exfxfxfxfxfúúú

û

ù

êêê

ë

é

P==P=

÷øöç

èæ-

- 2

21

21)()()()...()( 2

sm

s

b) Sí X1 +X3+ X4 -X6 =Y por la propiedad reproductivaÞY~N(mysy2), donde:

my=E(Y)=E(X1 +X3+ X4 -X6)= E(X1)+E(X3)+E( X4 )-E(X6)=20+20+20-20=40

sy2=V(Y)= V(X1 +X3+ X4 -X6)= V(X1)+V(X3)+V( X4 )-V(X6)=25+25+25-25=100

sy=10

Mediante el teorema central del limiteY

YYZsm-

=Þ ;~(0.1)

[ ] [ ] [ ] ( ) 1151.02.112.112.110

405252 =-=£-=>=úûù

êëé -

>=>Þ FZPZPZYP

DISTRIBUCIÓN MUESTRAL DE LA MEDIA

Sea una población X con media m y varianza s2 del cual se toma una m.a. detamaño n: X1, X2,... Xn del cual se obtiene su media muestral x

ÞSe cumple:

a) ;)( m=xE

b)n

xV2

)( s=

c) ( )sm nxZ -

= ; ~N (0.1)

Nota

1) Cuando xn Þ¥® ~ ÷÷ø

öççè

æn

N j

2sm cuando n³ 30, no importa si la población

es discreto o continuo

2) Cuando n³ 2 si X~N(m,s2)Þ x ~ ÷÷ø

öççè

æ

nN

2sm

3) Si el muestreo es sin reemplazo de una población finita de tamaño N

ÞV( x )= ÷øö

çèæ

--

=1

22

NnN

nx s

s factor de corrección

EjemploSuponiendo que una población consta de los siguientes valoresobservados:3,4,7,9,12. Calcular

a) La media y Varianza poblacionalesb) Determinar la distribución muestral de la media de la m.a. de tamaño 2

escogidos con reposiciónc) Se extrae una m.a de tamaño 36 con reposición cual la [ ]85 ££ xP

SOLUCIÓN

Como N=5Þ 75

129743=

++++==å

Nxim

å ===-=-= 2863.3;8.105547

5299)( 2222 sms xPx

b) La distribución muestral de la media se obtiene mediante:

x P( x ) x P( x ) 2x P( x )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )12.12

12.9

12.7

12.4

12.3

9.12

9.9

9.7

9.4

9.3

7.12

7.9

7.7

7.4

7.3

4.12

4.9

4.7

4.4

4.3

3.12

3.9

3.7

3.4

3.3

12

9

7

4

3

12

5.10

5.9

8

5.7

12

5.10

9

8

5.6

6

9

5.9

8

7

5.5

5

8

5.6

5.5

4

5.3

4

5.7

6

5

5.3

3

3 7

x

x

x

x

x

33.5455.566.577.5899.510.512 25

125

225

2

251

254

252

251

252

252

252

252

251

252

251

253

2512

259

25144

TOTAL25

175

( ) ( )

( ) 4.5725

1360)(

725

175

2222 =-=-==

====

å

åms

m

xPxxV

xPxxEx

x

c) Se extrae una m.a. tamaño 36 con reposición

n = 36 sabemos que x ~( )

smsm nxZy

n-

=2

,

7=m

( ) ( )úû

ùêë

é -££

-==

2863.33678

2863.3367512863.32 ZPs

[ ] [ ] [ ]( ) 9664.009664.065.3)83.1(

65.383.183.165.3=-=--=

-£-£=££-ÞFF

ZPZPZP

DISTRIBUCIONES ESPECIALES UTILIZADAS EN PRUEBAS

Cuando las m.a, son pequeñas n<30 no se pueden suponer que la distribuciónmuestral es NORMAL, TAMPOCO SE PUEDE APLICAR EL teorema central dellimite, por lo que se debe recurrir otras distribuciones muéstrales las especialesque estén relacionadas con la NORMAL;entre estas distribuciones tenemos: laCHI-cuadrado, la t-Student y la F de Fisher

DISTRIBUCIÓN CHI CUADRADO 22aXÓX R

Es un caso particular de la distribución gamma, tiene muchas aplicaciones entreellas para la construcción de IC y las pruebas de Hipótesis de la Varianza

DEFINICION

Sean r v.a. independientes: Z1,Z2,…Zr tal que Zi~N (0.1)

Sumando los cuadrados å=

=++r

iir ZZZZ

1

2222

21 ~ 2

rX grados de libertas, Sii

FUNCIÓN DE DENSIDAD

( ) ( )ïî

ïíì

¥<<=-- XeXxf

XV

r rx 0;2

122

22

1

2h

;esc

Donde h = función gammar = grados de libertad o Nº de variables

CARACTERÍSTICAS

1) A medida que aumente los grados de libertad tienden a normalizarse2) LA MEDIA rxE == )( 2m

3) LA VARIANZA rxE 2)( 22 ==s


Sean K v.a. independiente: X1, X2,... Xk tal que Xi ~ X2(ri)

ÞSi sumamos å 2iX ~ 2

1÷÷ø

öççè

æå=

k

iir

X

FUNCIÓN DE DISTRIBUCIÓN

[ ] aa

a ==£= ò dxxfXxPxFx

)()(2

0

2

Cuando [ ] [ ] aaa -=£-=> 11 22 XxPXxP

USO DE TABLAS

Dada la importancia y la complejidad de su calculo, se tiene confeccionado tablas,en base a la función de distribución con 2 entradas, donde:

La 1ra columna representa los grados de libertad “r”La 1ra fila representa el nivel de significancia ó probabilidad 10 ££aLa intersección de fila columna de le valor critico 2

aX

R=1

R=3 R=7 R=10

aa-1

F(x)

Ejemplo 1

X ~ 226X Determinar las siguientes probabilidades

a) [ ]29.17£xPb) [ ]88.38³xPc) [ ]64.4584.13 ££ xPd) [ ]40£xP

SOLUCIÓN

Como v=26

a) [ ] [ ] 10.029.17 210.0 =£=£ XxPxP

b) [ ] [ ] [ ] 05.095.01188.38188.38 295.0 =-=<-=<-=³ XxPxPxP

c)[ ] [ ] [ ] [ ] [ ] 965.0025.099.084.1364.4564.4584.13 2

025.02

99.0 =-=£-£=£-£=££ XxPXxPxPxPxP

d) [ ] [ ] 96.040 296.0 =£=£ XxPxP mediante interpolación

96.0409.41

975.09.3840

95.0

975.0

9.4140

95.0

9.38=Þ

--

=--

¯¯¯ aaa

a

Ejemplo 2

Si X~ 2rX hallar los valores críticos:

a) “a” tal que [ ] 30999.0 ==£ rsiaxPb) “a” y “b” tal que [ ] 1395.0 ==££ rsibxaP ; además ( ) 023.0=> bxPc) “a” tal que ( ) 8015.0 ==£ rsiaxP

a) [ ] [ ] 7.59999.07.5930999.0 =Þ=£Þ==£ axPrsiaxP

b) [ ] ( ) 95.0)(95.0 =£-£Þ=££ axPbxPbxaP

como 7.24975.0025.01025.0)(1025.0)( =Þ=-Þ=£-Þ=> bbxPbxP

c) ( ) 8015.0 ==£ rsiaxP

interpolando

8267.13533.018.2015.001.0

53.018.2

025.001.0025.0015.0

18.265.118.2

01.0

65.1

015.0025.0

18.2

=-=Þ--

=--

--

=--

¯¯¯

a

a

aa

DISTRIBUCIÓN MUESTRAL DE LA VARIANZA

DEFINICIÓN

Sea una v.a. ó una población X~N(m,s2) donde m,y s2 son desconocidos, por lotanto se toma una m.a. de tamaño n para estimar la media x y la varianza S2 talque

a) x y S2.son dos estadísticos independientes donde( )

nxx

S iå -=

22 además la

varianza muestral insesgada es( )

1ˆ

22

-

-=å

nxx

S i

b) El estadístico ( )2

2ˆ1s

Sn - ~X2(n-1) g.d.l. cuando ¥®n

c) ( ) ( )n

nSE2

2 1s-=

d) 2

2

snS ~ X2(n-1) g.d.l.

EjemploSe tiene una población X ~ N(m,s2)del cual se toma una m.a. tamaño 15 y se tieneS2. Calcular:

a) úû

ùêë

é£££ 9427.13107.0 2

2

sSP ;

b)úúû

ù

êêë

é££ 0814.2

ˆ3329.0 2

2

sSP

SOLUCIONa)

( )[ ][ ] [ ] [ ][ ] [ ] 98.001.099.0

6605.41405.291405.296605.4

)15(9427.115.03107.09427.13107.0

201.0

214

299.0

214

214

214

214

2142

2

=-=<-<Þ

£-£=££Þ

££=úû

ùêë

é££

XXPXXPXPXPXP

XPSPs

;

b)

[ ][ ] [ ] [ ]

98.001.0991.06606.491396.291396.26606.4

)14(20814.0)14(3329.00814.2ˆ

3329.0

214

214

214

2142

2

=-=£-£=££Þ

££=úúû

ù

êêë

é££

XPXPXP

XPSPs

DISTRIBUCIÓN t –STUDENT (T)- Es otra distribución relacionada con la NORMAL y la gamma que se usaprincipalmente en las estimaciones y en las pruebas de hipótesis de la mediacuando las m.a. son pequeñas:n<30

DEFINICIÓNSean 2 variables aleatorias independientes:

- Z ~ N(0.1); Y ~ 2RX dividiendo ambas variables

Þ=ÞrY

ZT Se dice que tiene una distribución t-student con v grados de libertad

Sii


( ) ( )( )[ ] ¥<<-¥+

P=

+

tr

tf rt

r

r

:12

2

21

h

h

Esta distribución está completamente determinado solo por el parámetro rGráficamente tienen las siguientes características

1) Es simétrica con respecto t=0=m2) Cuando n o v se hace grande tiende a normalizarse3) Tiene mayor dispersión que la normal

t=0=mESPERANZA MATEMÁTICA

( ) 1;0)()( >==== ò¥

¥-rdttftTExE m

VARIANZA

( ) ò¥

¥->

-=-=-== 2;

20)()()( 22222 v

rrdttftttETV ms

USO DE TABLAS

N(0.1)

r=5

r=3

Dada la importancia en la Estadística Inferencial y la complejidad de su calculo, setiene confeccionado tablas con 2 entradas.

Esta tabla esta confeccionada en función de la acumulada [ ]tTP £ Donde en laprimera fila se tiene los percentiles o probabilidades en la primera columna setiene los grados de libertad n ó r, la intersección de fila columna corresponde a losvalores críticos at Porque [ ] a

a

aa ==£ ò- dttftTPt

)(

Como la distribución es simétrica aa --=Þ itt

Ejemplo

Determinar el valor critico de [ ]90.0tTP £ con v=5 g.d.l.

SOLUCIÓN

[ ] 90.0176.1 =£TP

EJEMPLO 2

Determinar el valor crítico de [ ]10.0tTP £ con v=5 g.d.l.

SOLUCIÓN

[ ] [ ] [ ] 010476.190.010.01 =-£=£=£ - TPtTPtTP

DISTRIBUCIÓN DE ( )S

nx m- ~t(n-1)g.d.l.

LA V. A. O ESTADÍSTICO

Ejemplo

Si x es la media y S2 es la varianza de una m.a. de tamaño 9 seleccionado de unapoblación NORMAL con media 90=m Calcular

f(t)

at

[ ][ ] [ ] [ ]

245.075.0995.07059.03549.33549.37059.0

91183.192353.01183.1902353.0

888

=-=£-£=££

££=úûù

êëé £

-£

TPTPTP

TPs

xP

DISTRIBUCIÓN F O DE FISHER X~ ( )órrF 21 , ~21 ,; rrfa

Esta distribución especial generalmente se utiliza para comparar las varianzas de2 v.a independientemente o de 2 poblaciones normales, mediante los IC y laspruebas de hipótesis sobre sus varianzas mediante la razón de las mismas

DEFINICIÓN

Sean 2 v.a. independientes V~ 22r

x y r~ 22rx

Si se donde2

1

rV

rU

F = ~ ...)( 21 ldgrrF Sii

FUNCIÓN DE DENSIDAD

( ) ( )( ) ( ) ahh

h<<

ïïî

ïïí

ì

=+

Zvv

Zf vv

vv

F

vv

0;

022

21221

212

21

21

Cuya gráfica nos permite determinar sus características

1) A medida que aumentan losgrados de libertad tienen anormalizarse de manera positiva

MEDIA

2;2

)()( 22

2 >-

=== vv

vFEF mm

2) VARIANZA

( )( )

4;4)2(

2)()( 22

221

21222 >

---+

== vvvv

vvZvFVFs

ff(2)F(10.2)

F(10.2)

FUNCIÓN DE DISTRIBUCIÓN O ACUMULADA

( ) [ ] aa =£= fFPxF

Cuando [ ] [ ] aaa -=£-=> 11 fFPFFP

criticovf .=a

USO DE TABLAS

Se tiene 3 entradas:

La 1ra columna representa los g.d.l. del denominado r2La 2da columna representa la probabilidad (p=a )La 1ra fila representa los grados de libertad (g.d.l.) del numerador r1La intersección de filas columnas nos da el valor critico af

Ejemplo 1

Si X ~ )5.4(F hallar probabilidadesa) [ ]39.7£xPb) [ ]4.11>xPc) [ ]8£xPd) [ ]0645.0£xP

SoluciónComo v1= 4: v2=5a) [ ] [ ] 975.039.7 975.0 =£=£ fxPxPb) [ ] [ ] [ ] 01.099.0114.1114.11 99.0 =-=£-=£-=> fxPxPxPc) [ ] [ ] 9773.08 9773.0 =£=£ fxPxP interpolando

Ejemplo 2Si F ~F(6,10) Hallar el valor “c”(valor crítico) tal quea) [ ] 99.0=£ cxPb) [ ] 05.0=³ cxP

SOLUCIÓNa) [ ] [ ] 246.099.0246.099.0 =Þ=£Þ=£ cxPcxP

b) [ ] [ ] ( )[ ] 22.395.022.3

95.005.0105.0===³=

=<==<-Þ=³cxP

cxPcxPcxP

DISTRIBUCIÓN MUESTRAL DE LA PROPORCION

1-aa

F(x)

Sea una población X~b(n.p) Donde se desconoce p, se toma una m.a. tamaño “n”:

X1, X2,... Xn se estima la proporciónnx

np =

+++=

X...XX n21

Donde

1) ( )xEnn

xEpE p1)( =÷

øö

çèæ== m de la distribución binomial E(x)=np

reemplazando pnpn

pE ==1)(

2)( )

npqnpq

n

xVnn

xVpV

==

=÷øö

çèæ=

2

2

1

)(1

de la binomial V(x)= npq

( )n

pPÓnpq

npqpV pp

)1( -==Þ= ss

3) Cuando nnpq

ppZcavla -=Þ¥® ... :Z~N(0.1)

Nota 1 Si la m.a. de tamaño”n” se obtiene de una población finita de tamaño N Sinreemplazo

1--

=ÞN

nNnpq

ps

ZppZN

nNnpq

:1-

-

-=Þ ~N(0.1)

El factor de corrección por continuad en la distribución muestral de proyección es

n21

EjemploSuponiendo que un lote de 50 ordenadores hay 10 defectuososCual la probabilidad de que en una m.a. de tamaño n, ordenadores elegidos alazar

1) Con reposición a)n=5 b)n=60 :i)20%; ii) más de 20% ordenadores seandefectuosos

2) SIN REPOSICION

SOLUCION

1. con reposición :n=5; 80.0:205010

=== qp

a)i) X~b(5;0.20) dondeX:”Nº de PC ordenadores entre 5 con reposición

( ) 5...2,1,0:)80.0(20.0)( 55

=÷øö

çèæ= -

xxx RxxP

x= el 20% de 5=1

[ ] ( )( ) 4096.08.020.01)1(20.0 45=÷

øö

çèæ==Þ=Þ xPpP

[ ] [ ] [ ] 2627.07373.01)20.0;5;1(111120.0) =-=-=£-=>=> BXPXppPii

b)i) con n=60 como n>30 podemos aproximar mediante la normal

[ ] [ ] [ ]5.125.111220.0 ££==== xPocorrigiendxPpP

Estandarizando mediante0984.3

12)80.0)(2.0(60

)20.0(60 -=

- xxZ

( ) [ ]

[ ] [ ] ( ) ( ) ( ) ( )1272.01)16.0(2

16.0116.016.016.016.016.0

16.016.00984.3

125.120984.3

125.1112

=-=+-=--=-£-£

££-=úûù

êëé -

££-

==

FFFFFzPZP

ZPZPxp

Mediante la binomial ( ) ( ) 1278.08.020.012)12( 481260=÷

øö

çèæ==xP

Aplicando la verdadera distribución de la proporción, mediante

npq

ppZ -= donde el factor de corrección es

n21

úû

ùêë

é+££-Þ=

)60(2120.0

)60(2120.0)020( pPpP

[ ]2083.01917.0 ££ pP ; estandarizado

[ ]16.016.020.02083.00201917.0

60)80.0)(20.0(

60)80.0)(20.0(

££-=úú

û

ù

êê

ë

é -££

- ZPZP

[ ] [ ] ( ) ( ) ( ) ( )( ) 1272.01)5636.0(2116.02

16.0116.016.016.016.016.0=-=-=

+--=--=-£-£F

FFFFzPzP

ii) [ ]Þ> 20.0pP Binomialmente

[ ] [ ] =-=£-=> å )(11211212

0

xPxPxP como es demasiado largo recurrimos

mediante la aproximación a la normal, mediante

[ ] [ ]5.1215.01215.0£-=+£-Þ

-±= xPxp

npqnpxZ donde np=(60)(0.2)=12

estandarizando [ ] 4364.05636.01)16.0(116.010984.3

125.121 =-=-=£-=úûù

êëé -£- FzPzP

mediante la distribución de la proporción

=-

=npq

ppZ cuyo factor de corrección es n21

[ ] [ ] úû

ùêë

é+£-=£-=>

)60(2120.0120.0120.0 pPpPpP

[ ]

[ ] ( ) 4364.05636.0116.0116.010516.00083.01

20.02083.01tan2083.0160

)80.0)(20.0(

=-=-=£-=úûù

êëé £-=

úú

û

ù

êê

ë

é -£-Þ=>-

FZPzP

ZPdarizandoespP

UNIDAD IIIUNIDAD III :ESTIMACION PUNTUAL Y POR INTERVALOS

Competencia:

-El estudiante debe saber construir los diferentes Intervalos de Confianza a partir de lasestimaciones puntuales utilizando las diferentes distribuciones de cualquier parámetro ,parapoder realizar Inferencia Estadística

Objetivos.

-Utilizar correctamente el concepto de Estimación Puntual para la construcción eficiente deIntervalos de Confianza de cualquier parámetro sujeto de investigación ,para poder realizargeneralizaciones respecto de la población en estudio y tomar decisiones coherentes


-Esta unidad comprende el desarrollo de los siguientes conceptos:Estimación-Estimador ,Tipos de estimación:Puntual ,las propiedades de un buen estimador puntual y porIntervalos de Confianza,La construción de los Intervalos de confianza de: La media,diferencia de medias,(muestras grandes y pequeñas),la proporción y la diferencia deproporciones,la varianza y la razón de varianzas ,utilizando las respectivas Distribucionesespeciales muestrales.

Lectura:Millar/Freund/Jonson “Probabilidad y Estadística paraIngenieros”Edo.de México 1992 Pgs.208 al 213

Córdova Zamora “Estadística Descriptiva e Inferencial” 2ª ed.Perú 1996Pags,333 al 375 Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e InferenciaEstadística((2ª ed) Perú .Pags.627al 684

Referencia electrónica: http://e-stadistica.bio.ucm.es/mod_intervalos5.html

ESTIMACIÓN PUNTUAL Y por INTERVALOS DE CONFIANZA

INTRODUCCIÓN

La teoría de la inferencia estadística se divide en 3 grandes áreas:

1. La estimación2. Las pruebas de hipótesis3. la teoría de la decisión

ESTIMACIÓN ESTADÍSTICA

Estadísticamente la estimación es el proceso por el cual se aproxima el valor decualquier parámetro desconocido de una población ( rssm ,,, 2 ) mediante losestadísticos ( .,,,, 2 etcvSSX ) etc. obtenidos de una m. a. tomados de la población.

PRUEBA DE HIPÓTESIS

La prueba de hipótesis o docimasia de hipótesis consiste en comprobar, verificarconfirmar o rechazar si algún parámetro j ó alguna función dej es igual algúnvalor preconcebido de j

http://e-stadistica.bio.ucm.es/mod_intervalos5.html

TEORÍA DE LA DECISIÓN

La teoría de la decisión trata sobre las diferentes estrategias y diversos criteriosde decisión, para la toma de decisión frente a la incertidumbre.

MÉTODOS DE ESTIMACIÓN

Para estimar parámetros en base a m.a. y sus estadísticos se tiene 2 métodos deestimación: 1) PUNTUAL 2) POR INTERVALOS DE CONFIANZA

ESTIMACIÓN PUNTUAL

Se dice que una estimación puntual cuando se obtiene un solo valor para cadaestadístico que nos permite aproximarnos al valor del parámetro en cuestion.

ESTADÍGRAFO

Llamado también estadístico, es toda medida descriptiva que se obtiene de la m.a. y que sirve para estimar parámetros. Por lo tanto el estadígrafo esta en funciónde la m.a.

),...,( 2,1 nXXXGY = cuyo valor ( )nxxxgy ,..., 21=

PARÁMETRO jEs toda medida descriptiva que sintetiza alguna característica de la población cuyovalor se obtiene de toda la población

),...,( 21 nXXXf=j cuyo valor ( )nxxxg ,..., 21=jESTIMADOR jSe llama estimador de un parámetro a cualquier estadígrafo: ),...,( 21 nxxxgy = quenos permite aproximar al valor del parámetro.

- Un mismo parámetro puede tener varios estimadores puntuales, se elegiráaquel que se aproxime mas al valor del parámetro j

- Para poder elegir el mejor estimador se debe recurrir a:LAS PROPIEDADES DE UN BUEN ESTIMADORSe dice que un estimador es un buen estimador si cumple minimamente lossiguientes requisitos o propiedades.

1. INSESGABILIDADSea un estimador cualquiera j del parámetro j , entonces se dice que esINSESGADO sii

La [ ] [ ] 0ˆˆ =-= jjjj EóE2. CONSISTENCIA

Se dice que un estimador insesgado es consistente sii

a) Lim [ ]¥®=

nE jj

b) [ ]¥®=

nVlím 0j

3. EFICIENCIAConsiderando todos los posibles estimadores insesgados de unparámetroj , será eficiente aquel que tiene mínima varianza, llamándosetambién estimadores de mínima varianza del parámetro j .Sean dos estimadores insesgados jjj dey 21 ˆˆ

Þsi ( ) ( ) ( )( ) Þ<< 1

ˆˆˆˆ2

121 j

jjj

VVóVV el estimador 1j es mas eficiente que 2j

4. ERROR CUADRÁTICO MEDIO (MSE) jSea un estimador ( )nxxxG ...,ˆ 21=j un jj deˆ

( ) [ ] ( ) ( )[ ]22 ˆˆˆˆ jjjjjj EVarEMSE -+=-=Þcuando el estimador es insesgado ( ) ( )jj ˆˆ VarMSE =Þ

EFICIENCIA RELATIVA Sean dos estimadores 21 ˆˆ jj y con ( )1jMSEÞ y( )2jMSE

Þ la eficiencia relativa de 2j respecto de 1j se define como:( )( ) Þ<1

ˆˆ

2

1 SIMSEMSE

jj

2j es mas eficiente que 1j

Ejemplo

Se tienen 2 v.a o dos poblaciones X1 y X2 distribuidas independientemente

X1 ~ ( ) ( ) ( ) 211

2 ;2,2 sjsj ==Þ XVXEIX2 ~ ( ) ( ) ( ) 2

222 ;4,4 sjsj ==Þ XVXEI

Donde j es el parámetro poblacional en cuestión; para ello se proponen 2estimadores:

510ˆ;

84ˆ 21

221

1XXXX

+=+= jj Cual de los 2 estimadores es el mejor, elija de acuerdo

alas propiedades de un buen estimador

SOLUCIÓN1) INSESGABILIDAD sabemos que ( ) jj =ˆEPara el 1er estimador 1j Para el 2do estimador 2j

( ) ( ) ( ) ( )2121

2121

51

101

510;

81

41

84XEXEXXEXEXEXXE +=úû

ùêëé +=+=úû

ùêëé +=

( ) ( ) ( ) ( ) insesgadoesinsesgadoes 21 ˆ4512

101;ˆ4

812

41 jjjjjjjj Þ=+Þ=+

EFICIENCIA Será eficiente aquel estimador que tenga mínima varianza

( )

( ) ( ) ( )211

211

641

161ˆ

84ˆ

XVXVV

XXVV

+=

÷øö

çèæ +=

j

j ;

( )

( ) ( ) ( )212

212

251

1001ˆ

510ˆ

XVXVV

XXVV

+=

÷øö

çèæ +=

j

j

( ) ( ) 22

2221 100

5ˆ645

641

161ˆ sjsssj ==+= VV

( ) ( )Þ>Þ>= 212

2

ˆˆ15625.1

1005645

jjs

sVVcomo El estimador 2j es mas eficiente que 1j

2) CONSISTENCIA Deben satisfacer 2 requisitos

a) Lim [ ] [ ]¥®¥®==

nnVlímóE 0ˆˆ jjj

[ ] jjj ==¥®¥® nn

límE limˆ1 ; [ ] jjj ==¥®¥® nn

límE limˆ2

[ ] 0limˆ 252645

1 === ¥¥®¥®

ssjnn

límV ; [ ] 0limˆ 252100

52 === ¥

¥®¥®

ssjnn

límV

significa que ambos estimadores son consistentes

MÉTODO DE ESTIMACIÓN PUNTUAL

La estimación puntual se lo puede realizar principalmente por 2 métodos:1) mediante la máxima verosimilitud2) mediante los momentos3)1) METODO DE LA MÁXIMA VEROSIMILITUD (M.V.)

Este método se fundamenta en el principio de elegir el valor del parámetro j aestimarse para el cual );,...,( 21 jnXXXf es la probabilidad conjunta de obtener losvalores muestrales es una función máxima.De acuerdo a este método se obtiene estimadores

a) suficientesb) insesgados y de mínima varianzac)

DEFINICIÓN

Sea una v.a. X cuya función de probabilidad: f(X, j ) depende del parámetro j quese desconoce, para ello se toma una m.a. tamaño nXXXn ,...,: 21 cuyos valores

ÞnXXX ,..., 21 la función verosimilitud de la m.a. se define

( ) ( ) ( ) ( ) ( ) ( )jpjjjjj ,,...,,,,...,12121 XifXfXfXfXXXfV

n

inn=

=== , si X es continuo

( ) ( ) ( ) ( ) ( ) ( )jpjjjjj ,,...,,,,...,12121 XipXpXpXpXXXpV

n

inn=

=== , si X es discreta

El método de M.V. consistente en tomar como valor estimadoj , el valor quemaximice la v (j ) para ello se debe logaritmizar

( ) ( )jj ,lnln xfVL å== luego se debe derivar e igualar a 0

( )0

ln== å

jj

djd

SxfSL i

Nota.- Cuando la distribución de probabilidad tiene varios parámetrosdesconocidos, se obtendrán tantas ecs. Como parámetros estimarAsí si se tiene K parámetros a estimar kjjj ..., 21

0...:0021

===Þk

LLLdjd

djd

djd

EjemploObtener el estimador de M.V. de lal probabilidad de éxitos “p” para una v.a.x~Bernoulli, mediante el método de la M.V.

SOLUCIÓNSabemos que x~B(1,p) dondeP(x)= xx pp -- 1)1( ; x=0.1 donde 0<p<1Sea una m.a. tamaño nXXXn ,...,: 21 cuyos valores nxxx ,..., 21 donde

1) x~B(1,p) ( ) nipppxp xxi

i ,...2,1;)1(, 11 =-=Þ -

2) ( ) ( ) ( ) ( ) ( )åå --

==-===Þ iiii xxxx

n

ii

n

ipppppxppV 11

111,1, pp

3) Þaplicando logaritmos ( ) ( )pXnpxpVLn

iii -úû

ùêë

é-+==Þ åå

=

1lnlnln1

4) Þderivando con respecto a p e igualando a cero ( ) 011

=--

-+= åå

pxn

px

pL ii

dd

5) Resolviendo la ecuación

xpnx

px

np

xn

pxxn

pp

pxn

px

i

i

ii

iii

=Þ=Þ=Þ

-=--

=-

Þ-

-=

åå

ååååå

ˆˆ1

111;11

2) MÉTODO DE LOS MOMENTOSEste método consiste en igualar los primeros momentos muestrales originales conlos primeros momentos poblacionales originales ''

vv M=m

Donde ( ) ( ) kvxpxxxEM kirrr

v ,...2,1:...,, 21' ==== åå jjj

( )nx

xEMvir

vå=='

( )dxxfx kiRx

vv jjjm ...,, 21' ò=

EjemploSea una m.a. tamaño nXXXn ,...,: 21 de una población X con distribución POISSONcon parámetro l Se pide estimar l .mediante el método de los momentos

SOLUCIÓNComo solo se debe estimar un solo parámetrol , solo debemos hallar los primerosmomentos originales poblacionales y muestrales e igualarlos

Sabemos å ===== XnXMXE 1'

1'1 ;)( lmm

Igualando XM =Þ= lm ˆ'1

'1

ESTIMACION POR INTERVALOS DE CONFIANZA

INTRODUCCION

La estimación puntual aunque reúna todas las propiedades de una buenaestimación (insesgamiento, consistencia, eficiencia) adolece de una desventaja yes que no nos proporciona ningún nivel de significación y/o de confianza. Por lotanto es necesario recurrir a otro tipo de estimación que nos permite algún nivel designificación que es la estimación por intervalos de confianza.

INTERVALO ALEATORIO

Es aquel intervalo que tiene por lo menos uno de sus extremos una variablealeatoria.

INTERVALO DE CONFIANZA (IC)

Sea una v.a. o una población X cuya DISTRIBUCIÓN de probabilidad: f(X; j )donde el j se desconoce

Þ Se toma una m. a. de tamaño n: X1, X2 ,....Xn cuyos valores : x1, x2 ,....xn del quese toman 2 estadísticas 1j = G (X1, X2 ,....Xn); 2j = G (X1, X2 ,....Xn) talque 1j < 2j : para los cuales se cumple: [ ] )%1(100%10021 ajjj -==££ vP

donde

v= nivel de confianza Þ 100%a = nivel de significanciaÞ 0%

1j = limite inferior del IC para el parámetro j

2j =limite superior del IC para el parámetro j

NIVEL DE CONFIANZA (r) Y NIVEL DE SIGNIFICACIONa

La elección de los niveles de confianza y/o de significación depende delinvestigador los que generalmente son:

r= 0.90 0.95 0.975 0.98 0.99a = 0.10 0.05 0.025 0.02 0.01

CLASES DE INTERVALOS DE CONFIANZA

De acuerdo al tipo de sus limites se tiene 3 clases de IC. Suponiendo una v.a. ouna población X con DISTRIBUCIÓN de probabilidad ( )j;Xf del que se toma unam.a. tamaño nÞ 1j = G (X1, X2 ,....Xn); 2j = G (X1, X2 ,....Xn) tal que 1j < 2j

Þ tenemos:

1. BILATERAL [ ] [ ]2121; jjjjj ££óP =100v%2. UNILATERAL INFERIOR [ ] [ ]jjj £¥£ 11 óP =100v%3. UNILATERAL SUPERIOR [ ] [ ]22; jjja £- óP =100v%

NOTA.- Para construir un IC para j es necesarioa) Elegir el nivel de confianza rÞ 1: (99%, 95%, 90%) ó

Elegir el nivel de significancia a Þ 0: (1%, 3%, 10%)b) Hallar 2 estadísticos 1j y 2j tal que 21 jj £

INTERVALO DE CONFIANZA PARA LA MEDIA POBLACIONAL ( m ) CUANDOSE CONOCE LA VARIANZA POBLACIONAL ( )2s EN MUESTRAN GRANDES

30³nSea una v.a. o una población X~ ( )2,sm donde se desconoce m, pero se conoce( )2s , se toma una m. a. grande 30³n del que se estima la media X

Þ El IC para m con ( )2s (conocido) 30³n = úû

ùêë

é±

nZ

X 0s

ERROR

donde [ ]2

10

rZZPZ +=£Þ

NOTA1. Cuando no se conoces y la m.a. 30³n Þ se utiliza S2. Cuando X~N ( )2,sm , aun cuando n<30, la definición del IC es valida3. Cuando el muestreo es SIN REPOSICION de una población finita, se debe

corregir el ERROR

Þ El IC=úúû

ù

êêë

é

--

±1

0

NnN

nZ

Xs

4. Cuando se quiere construir el IC para el total ÞÞ [ ] [ ] %100,;, 22 vNTOTALNPóNN =££ jjjj

Ejemplo

Un analista de mercado desea estimar el ingreso per cápita familiar mensuales deuna determinada población. Para ello toma una m.a de tamaño 100 de esapoblación la cual determinó que el promedio del ingreso familiar es de $us. 500.-.Suponiendo que el ingreso familiar mensual sigue una distribución normal condesviación típica igual a $us. 100.-

a) Construya un IC para la media del ingreso familiar de toda esa poblaciónb) Construya un IC para la media del ingreso familiar de toda esa población si es

de 2000c) Construya un IC para el total de ingreso familiar de toda esa población, al nivel

del 95%

SOLUCIÓN

a) Sabemos que el IC para m, con 2s (conocida) cuando 30³n = úû

ùêë

é±

nZ

X 0s

Donde v=0.95 Þ [ ] 96.1975.02

95.01975.000 =Þ=

+=£Þ ZZZPZ

100100500 ==»= nSX s

EL ERROR = 6.19100

)96.1(10000 ===nZs

nZs

6.5196.19500;4.4806.19500 02

01 =+=ú

û

ùêë

é+==-=ú

û

ùêë

é-=

nZS

XnZS

X jj

Þ El IC para m al 95% =[480.4;519.6]ó [ ] 95.06.5194.480 =££ mP

Significa que de 100 m.a que se toma de esa población; 95 m.a arrojaran unpromedio comprendido en el intervalo y solo 10 m.a. no se están comprometidoen el IC.

b) Como se conoce N=2000 Þ IC para m al 95% Þúúû

ù

êêë

é

--

±1

0

NnN

nZ

Xs

Þ ERROR= ( ) 11.1912000

1002000100

96.1100=

--

11.51911.19500;89.48011.19500 21 =+==-= jj

Þ El IC para m al 95% =[480.89; 519.11]ó [ ] 95.011.51989.480 =££ mP

c) El IC para el total al 95%= [ ] [ ] [ ]1038220;961780)2000(11.519);2000(89.480;, 2 ==NN jj

TAMAÑO MUESTRAL PARA ESTIMAR LA MEDIA

Para determinar el tamaño de la m.a cuando se quiere estimar la mediapoblacional mediante el IC, se presenta 2 situaciones

a) Cuando el muestreo se hace con reposición ó cuando no se conoce la

población se toma su errornZ

E 0sÞ del cual se despeja n

20÷÷ø

öççè

æ=

EZ

ns

b) Cuando el muestreo se hace sin reposición, es decir cuando se conoce la

población, se toma su errorúúû

ù

êêë

é

--

Þ1

0

NnN

nZs del cual se despeja n

)1(2220

220

-+=

NEZNZ

ns

s

Ejemplo

Un grupo de 50 animales experimentales reciben una cierta clase de raciones porun lapso de 2 semanas. Sus aumentos de pesos arrojan los valores X =420 grs. yS=60 grs.

a) ¿Que tamaño debe tomarse, si se desea que X difiera de m por menos de 10grs. con 0.95 de probabilidad de ser correcto?

b) Encontrar el IC del 95% para m ?

SOLUCIÓN

a) Como el ERROR=10=2

00÷÷ø

öççè

æ=Þ

EZS

nnZs

además v=0.95 =Z0=1.96

( ) 13830.13810

96.160 2

»=÷øö

çèæ=n

b) Como n=138Þ El IC para m al 95% = ( )138961.160

420±

[ ] [ ]0108.430;99.4090108.104207473.11

6.117420 =±=úûù

êëé ±

O =P( 409.99 ≤ m≤ 430.0108) = 0.95

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS DE 2POBLACIONES CON DESVIACIONES TÍPICAS CONOCIDAS MUESTRALESGRANDES ( )30, ³mn

Sean 2 v.a. independiente ó 2 poblaciones, de las cuales se desconocen susmedia, pero se conocen sus varianzas o desviaciones típicas se quiere estimar,mediante un IC del 100v% la diferencia de sus medias ( )yx mm - ; de las cuales setoman 2 m.a. ;grandes y luego se obtienen sus medias respectivas

Ymtamañoam

Y

Xntamañoam

X yyyx

30..

)(.~

30..

)(.~ 22

³¯

³¯

smsm

El IC para ( )úú

û

ù

êê

ë

é+±-=-

mnZyx yx

valyx

22

0%100ss

mm

Donde Z0 se obtiene mediante la [ ]2

10

vZZP +=£

NOTA

1) Si X~ ( )2xxN sm y Y~ ( )2

yyN sm conocidos 22yx y ss aun cuando las muestras son

pequeñas n. m <30 la definición anterior es válida2) Si no se conoce, 22

yx y ss , pero se tienen muestras grandes

El IC para ( )úú

û

ù

êê

ë

é+±-=-

mS

nS

Zyx yxvalyx

22

0%100mm

Ejemplo

Una m.a. de 200 pilas de la marca “A” para calculadores muestra una vida mediade 140 hrs. y una desviación típica de 10 hrs. Otra m.a. de 120 pilas de la marca“B” de una vida media de 125 hrs. Con una desviación típica de 9 hrs. determinar:

a) Un IC del 95% para la diferencia de la vida media de las poblaciones A y Bb) Un IC del 99% para la diferencia de la vida media de ambas poblaciones

SOLUCIÓN

Como x =140 : Sx=10 con n=200 de la marca “A”y =125 : Sy=9 con m=120 de la marca “B”

a) r=0.95 =Z0=1.96 =El IC para ( )úú

û

ù

êê

ë

é+±-=-

mS

nS

Zyxal yxyx

22

0%95mm

1246.2)08401.1(1961209

2001096.1

2222

0 ==+=+=mS

nS

ZE yx

( ) 15125140 =-=- yx El IC para [ ] [ ]12.1788.121246.215%95 £-£=±=- yxyx al mmmm

b) r=0.99 [ ] 575.2995.0299.1

995.00 =Þ==<Þ ZZZP

Þ E=(2.575(1.0840)=2.7913

Þ El para yx mm - al 99%=[15 ± 2.7913]=[12.2087;17.7913]=[12;18]

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN, MUESTRA GRANDE( )30³n

Sea una v.a ó una población X~b(n,p) donde se desconoce la proporciónpoblacional p, se toma una m.a tamaño grande ( )30³n : X1 ,X2 ,....Xn del cual se

estima la proporciónn

x

nxp

iå==ˆ

Þ El IC para “p” al 100v%=úúû

ù

êêë

é±

nqpZp ˆˆ

ˆ 0 donde [ ]2

100

vZZPZ +=£Þ

NOTA

Cuando el muestreo es SIN REPOSICIÓN de una población finita se debe corregir

el modulo error con1-

-N

nN

Þ El IC para “p” al 100v%=úúû

ù

êêë

é

--

±1

ˆˆˆ 0 N

nNnqpZp

Ejemplo

Se toma una m.a. de 600 estudiantes de una población estudiantil 360 sostuvieronsu preferencia por una determinada marca de CPU

a) Hallar el IC del 95% para la proporción “p” de preferencia de dicha marca deCPU

b) Si la proporción de preferencia se estima en 0.6 determine el error máximo deestimación, si se quiere confianza del 98%

SOLUCIÓNa) Sabemos y n=600 ; x=360 6.0

600360

ˆ ==Þ p

Þ El IC para “p” 30³n =úúû

ù

êêë

é±

nqpZp ˆˆ

ˆ 0 ; v=0.95 Þ Z0=1.96

donde el error ( )( ) 0392.0)02.0(96.1600

4.06.096.1ˆˆ0 ===

úúû

ù

êêë

é

nqpZ

Þ El IC para “p” al 95% =[0.6 ± 0.0392]=[0.5608;0.6392]

también [ ][ ] 95.0%92,63%08,56

95.06392.05608.0=££Þ

=££ÞpP

pP

b) Como p =0.6; v=0.98 [ ] 33.299.0298.1

99.00 =Þ==£ ZZZP

Error máximo ( )( ) ( ) 0466.002.033.2600

4.06.033.2 ===

TAMAÑO MUESTRAL PARA ESTIMAR UNA PROPORCIÓNPara estimar el tamaño de la m.a. cuando se quiere construir un IC para laproporción, se toma su error ya sea con reposición o sin reposición dependiendo sise conoce ó no la población

a) Cuando no se conoce la población

2

20

0

ˆˆˆˆE

qpZnnqpZE =Þ=

b) Cuando no se conoce la población ni la p

2

20

4EZ

n =

c) Cuando se conoce la población

proporciónlaestimarparamedialaestimarparaE

Znó

EZ

dondeNnNn

n

NnN

nqpZE

2

20

02

220

0

0

0

4)1(

1ˆˆ

=-+

=

--

=

s

Ejemplo

Una importación de 2000 focos tiene una desviación típica de la duración de losmismos de 100 hrs. El ingeniero de control de calidad desea determinar el tamañode la m.a. para estimar la duración promedio, con aproximación de ± 20 hrs. Delpromedio real con 95% de confianza.

SOLUCIÓNLos datos son s=100; N=2000; E =20 v=0.95 Þ Z0=1.96Como se conoce la población y no se conoce la proporción muestral

Þ utilizamos( )( ) 9265.91

2095192000

199996200096

»==+

=n

EjemploEl gerente de una agencia bancaria que tiene 1000 cuenta correntistas quieradeterminar la proporción de sus cuenta correntistas a los cuales les paga el sueldomensual, Para ello quiere determinar el tamaño de la m.a. con un error de ± 0.05con un 90% de confianzaSOLUCIÓN

Como N=1000; E=0.05; v=0.90 Þ Z0=1.645( )( ) 21439.213

1270271000

9992711000271

»==+

=Þ n

TAMAÑO DE LA MUESTRA PARA POBLACIONES FINITAS

Cuando el muestreo se realiza sin reposición de una población finita, se debeutilizar el factor de corrección, por lo tanto se debe determinar mediante 2 fases:

1ra fase.- Se debe determinar la muestra inicial

2

20

0E

Zn

s= Cuando se quiere estimar la media

2

20

0ˆˆ

EqpZ

n = Cuando se quiere estimar la proporción cuando se conoce p

2

20

04EZ

n = Cuando se quiere estimar la proporción cuando no se conoce p

2da Fase.- Se determina la muestra final

)1(0

0

-+=

NnNn

n donde N= tamaño de la población conocida

Ejemplo

La desviación típica de la duración de cierto “chips” de una determinada fabrica es100 hrs. Para un embarque de 10.000 chips, el gerente de control de calidad de lafabrica, desea determinar el tamaño de la m.a para estimar la duración media conaproximación de ± 20 hrs. del promedio real con 95%

SOLUCION

s=100: N=10.000 n=? E =20 r=0.95 ÞZ0=1.96

De acuerdo al muestreo sin reposición de una población finita

1ra fase

( ) ( )( )

9604.9620

10096.12

22

2

20

0 »===E

Zn

s

2da fase

)1(0

0

-+=

NnNn

n = ( ) 9510095960000

999.9961000096

»=+

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES

Sean 2 poblaciones X~b(n1p1) : Y~b(n2p2) donde se desconocen las proporcionespoblacionales.

Se toman 2 m.a. tamaños grandes 30, 21 ³nn

nxxxn ...,: 211 nyyyn ...,: 212

Se estiman sus proporciones muestrales

111

1 ˆ1ˆˆ Pqynxp -== 22

22 ˆ1ˆˆ Pqy

nyp -==

Þ El IC para P1-P2 al 100v% con 30, 21 ³nn

( ) [ ]2

1ˆˆˆˆˆˆ 002

22

1

11021

vZZPZdonden

qpn

qpZPP -

=£Þúúû

ù

êêë

é+±-

EjemploUn fabricante afirma que su nuevo producto de consumo popular prefieren mas losvarones que las mujeres. Para verificar tal afirmación se toma una m.a. de 250varones hallándose que 175 prefieren el nuevo producto y otra m.a de 200mujeres, hallándose que 120 prefieren el nuevo producto. Mediante un IC del 95%para la verdadera diferencia de proporciones de preferencias entre hombres ymujeres se puede concluir que el fabricante del nuevo producto tiene razón?

SOLUCIÓN

3.0ˆ

7.0250175

ˆ

175var250

2

1

1

=

==

==

q

p

xonesn

4.0ˆ

6.0200120

ˆ

120200

2

2

2

=

==

==

q

p

ymujeresn

Sabemos ;r=0.95Þ Z0=1.96

donde el ERROR

( )( ) ( )( ) 0882.0200

4.06.0250

3.07.096.1 =úúû

ù

êêë

é+=E

21 ˆˆ pp - =0.7-0.6=0.1

Þ El IC para P1=P2 al 95 %[0.1± 0.0882]=[0.0118;0.1882]

ó también p [ ]1882.00118.0 21 £-£ PP

Como la diferencia de la proporción de varones y mujeres que prefieren el nuevoproducto es positivo, se puede concluir que P1>P2, es decir que el fabricante tienerazón al 5% de significancia.

INTERVALO DE CONFIANZA PARA LA MEDIA CON VARIANZA DESCONOCIDAMUESTRAS PEQUEÑAS

Sea una v.a. o una población X~N( 2,sm ) donde se desconocen 2,sm se toma unam.a tamaño pequeño :n<30: nxxxn ...,: 211 del cual se estima n la media y varianza

con( )

1

22

-

-== åå

nxx

Synx

x ii respectivamente

Þ El IC para m con 2s desconocido n<30=nSt

xnSt

x 00 ; +-

NOTA.-1. Cuando el muestreo es un reemplazo de población finita

El IC para m al 100%=úúû

ù

êêë

é

--

±1

0

NnN

nSt

x

2. Cuando se quiere estimar el total = [ ]NN 21 ˆ;ˆ jj

EJEMPLOLos contenidos de 5 latas de café instantáneo de una determinada marca handado los siguientes pesos netos en grs.: 280, 290, 285, 275, 284

a) Construya un IC para la media de todos los contenidos de latas de caféb) Con qué grado de confianza se estima de tal manera que el contenido

promedio d café tenga los límites : 277,432; 288,168

SOLUCIONSuponiendo que los pesos de las latas tienen distribución Normal:

a) Sabemos que el IC para m al 100v%nSt

x 0±

( )6303.57.31

1:8.282

22 ==

-

-=== åå S

n

xxS

n

xx

ii

El 9898.65

)6303.5(776.2==E

El IC para m al 95% =[275.8102;289.7898]

b) Sabemos quenSt

xnSt

x 02

01 ˆ;ˆ +=-= jj

( ) ( )0

02 6303.5

58.282168.2885

6303.58.282168.288ˆ t

t=

-Þ+==j

[ ] 95.02

11319.21319.20 =+

=£Þ=vTPt

( ) %9090.01295.0 ==-=r

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS CON VARIANZASDESCONOCIDAS, PERO IGUALES, MUESTRAS PEQUEÑAS; n, m<30

Sean 2 v.a. ó 2 poblaciones X~N( 2, xx sm ) : Y~N( 2, yy sm ) donde se desconocer lasmedias, pero que tienen una misma varianza.Se toman 2 m.a tamaño pequeños n<30:m<30 donde se obtienen 22 :;: yX SySx

El estadístico de prueba para ( )yxesyx -- mm

Þ El IC para yx mm - al 100v% = ( )[ ]mncStyx 110 +±-

donde [ ]2

10

vtTP +=£

t0~t(n+m-2)gdl.( )

2)1(1 22

-+

-+-=

mnSmSn

S yxc

EjemploEn 2 m.a. independientes de 10 bolsas de arroz de un kilo de 2 molinera “A” y “B”se encontraron los siguientes porcentajes de grano quebrados por kiloA: 6,5,6,7,4,7,6,4,3,6B: 7,6,7,9,5,8,7,6,10,8Suponiendo que los porcentajes de granos quebrados por kilo en cada molinera sedistribuye normalmente con la misma varianza. Determine un IC del 95% para ladiferencia de las 2 medias de porcentajes de granos quebrados por kilo de arrozde las molineras “A” y “B”

SOLUCIÓN

V=.95 P[t£t0]= 101.218;975.0295.1

=Þ gdlt

“A” n=10; x =5.4 : Sx=1.35“B” m=10: y =7 ; Sy=1.49

E =1.345El IC para la yx mm - al 95%= ( )[ ][ ] [ ]555.0;245.3345.19.1345.13.74.5 --=-- mm

INTERVALO DE CONFIANZA PARA LA VARIANZA

Sea una v.a. ó una población X~N( 2,sm ) con 2,sm desconocidos. Se toma una

m.a de tamaño ( )1

:...,:2

1221 -

-=== åå

n

xxS

n

xxxxxn

in El IC para 2s al 100 r

%= ( )( )

( )( )

úú

û

ù

êê

ë

é--

--- xx nn

SnSn2

1;

2

2

1;1

2

22

1;1

aa

Donde 222 22

; aa XX - son valores críticos que tienen distribución CHI cuadrado con (n-1)

g.d.l., es decir2

1;2

21

222

22

aaaa -=úûù

êëé £=úû

ùêëé £ -XXPXXP

CONSECUENCIA

El IC para s al 100v%= ( ) ( )úú

û

ù

êê

ë

é --

-22

1 22

1;1aa X

nSXnS

Ejemplo

A un laboratorio de ensayo de materiales se lleva una m.a. de 10 cables paraobtener sus cargas de rotura a la tracción, cuyos resultados en kg/cm2son :280,295,308,320,265,350,300,310,285,310; considerando que estas cargasposeen distribución normal. Se pude construir

a) El IC del 90% para la varianzab) El IC del 90% para la desviación

SOLUCION

( )9

10.49861

;3.30210

30232

2 =-

-==== åå

n

xxS

n

xX

ii

S2=554.0111 Þ S=23.5374

a) El IC para la 2s al 90% = ( ) ( )

úúú

û

ù

êêê

ë

é--

---2

)1(

2

2)1(1

2

22

1:1

nn XSn

XSn

aa

Como v =0.90; n=10 S2=554.011 10.0=a

[ ] [ ] 92.169;9;...9; 295.0

295.0

221

2

210.0 =Þ£=£Þ

-XXXPldgXXP

[ ] 325.39;05.09;...9; 205.0

205.0

221

2

210.0 =Þ=£=úû

ùêëé £ - XXXPldgXXP

( ) ( ) [ ]

90.0]5786.14996867.294[

5786.1499;6867.294325.3

011.5549;92.16011.5549

2 =££

=úûù

êëé=

sóP

b) El IC para s al 90%= [ ] [ ]7244.38;1664.175786.1499;6867.294 =[ ] 90.07244.381664.17 =££ sóP

INTERVALO DE CONFIANZA PARA LA RAZON DE VARIANZAS

Sean 2 v.a. o 2 poblaciones

X~N( 2, xx sm ) se desconoce 2xs = se toma una m.a “n”

( )1

:2

2

-

-==Þ åå

n

xxS

n

xx

ix

i

Y~N( 2, yy sm ) se desconoce Þ2ys se toma una m.a “m”

( )1

:2

2

-

-==Þ åå

m

yyS

m

xy

iy

i

El estadístico para2

2

2

2

y

x

y

x

SS

ess

s

Þ El IC para la2

2

y

x

s

s al 100v%=( )( )

( )( )úú

û

ù

êê

ë

é---

---11;12

2

11;12

2

;2

;2

;1nm

y

x

mny

x fSS

fSS

a

a

Þ El IC para lay

x

ss al 100v%=

( )( )( )( ) ú

ú

û

ù

êê

ë

é

------

11;12

2

11;12

2

;2

;2

;1nm

y

x

mny

x fSS

fSS

a

a

donde( )( )

( )( ) 21

21

111:

111:

2

2

a

a

a

a

-=úûù

êëé --£

-=úûù

êëé --£

-

-

nmfFP

mnfFP

EJEMPLO

Suponga que 2 maquinas “A” y “B” producen independientemente el mismo tipo deobjeto y que el tiempo que cada una emplea en producirlos se distribuyenormalmente con respectivas varianzas 22 ; yx ss desconocidos. Se toma 2 m.a unade “A” y otra de “B” obteniéndose los siguientes resultados.

m.a tamaño n=8 Þ”A”: 17,23,21,18,22,20,21,19m.a tamaño m=6 Þ”B”: 13,16,14,12,15,14 Se pide construir

a) Un IC para la razón de varianzas al 95%b) Un IC para la razón de desviaciones al 95%

SOLUCIÓNr=0.95 a=0.05 n=8; m=6; 2

XS =4.13 : 2YS =2

a)[ ]

[ ] 29.57.5:...7.5:

85.65.7:...5.7:

7.5;975.0975.01

5.7;975.0975.01

205.0

205.0

=Þ£=úûù

êëé £

=Þ£=úûù

êëé £

-

-

ffFPldgfFP

ffFPldgfFP

Þ El IC para la2

2

y

x

s

s al 95%= ( ) [ ]9239.10;3015.029.5213.4;

85.61

213.4

=úû

ùêë

é÷øö

çèæ

ó 95.09239.103015.02

2=

úúû

ù

êêë

é££

y

xPs

s

b)Þ El IC para la

y

x

ss al 95%= [ ]3051.3;5491.0

ó 95.03051.35491.0 =úúû

ù

êêë

é££

y

xPss

UNIDAD IV PRUEBAS DE HIPOTESIS

Competencia:

-El estudiante debe utilizar correctamente las diferentes formas del protocolo paraefectuar pruebas de hipótesis ,tanto paramétricas como no paramétricas sobre cualquierparámetro o distribución de una población para la toma de decisiones coherentes.

Objetivos.

-Utilizar correctamente la Docimasia de hipótesis para probar cualquier aspecto de unapoblación que con lleva un grado de incertidumbre para tomar decisiones coherentes.


-Esta unidad comprende el desarrollo de los siguientes conceptos: Hipótesis estadística,clases de hipótesis estadísticas,Tipos de errores; como también la realización de lasdieferentes pruebas de Hipótesis tales como :acerca de la media con varianza poblacionalconocida como desconocida ,acerca de la varianza y de la razón de varianzas, acerca de laproporción como diferencia de proporciones.

Lectura:Millar/Freund/Jonson “Probabilidad y Estadística paraIngenieros”Edo.de México 1992 Pgs.225 al 286 Córdova Zamora “Estadística Descriptiva e Inferencial” 2ª ed.Perú 1996Pags,385 al 440 Bibliografía Básica: Moya y Saravia (1988) “Probabilidad e InferenciaEstadística((2ª ed) Perú .Pags.701al 749

Referencia electrónica: http://descartes.cnice.mecd.es/materiales-didacticos/Muestreo/-Inferencia-Estadística/pruebas-hipotesis.html

PRUEBAS DE HIPOTESIS

INTRODUCCIÓN

En la estadística inferencia el área de las pruebas de hipótesis constituye uno delos aspectos importantes por su utilización.La mayoría de las pruebas de hipótesis estadística se refieren a 2 aspectos:

1) A probar los valores de los parámetros de una variable o población,llamadas pruebas paramétricas.

2) También se refieren al tipo o naturaleza de las diferentes distribuciones delas diferentes variables o poblaciones, llamándose pruebas noparamétricas.

La que generalmente se utiliza con las pruebas paramétricas, la que suponeconocer la naturaleza de la población.Para desarrollar las diferentes pruebas de hipótesis es necesario desarrollaralgunos conceptos básicos como ser:

HIPÓTESIS ESTADÍSTICAUna hipótesis estadística es una afirmación ó conjetura con relación a los valoresde los parámetros ó con relación a las distribuciones de una ó más variablesaleatorias o poblaciones.De acuerdo a su especificación tenemos 2 tipos de hipótesis:

1) HIPÓTESIS ESTADÍSTICA SIMPLESon aquellas hipótesis completamente especificas, es decir están definidossus valores y el tipo de distribución.

2) HIPÓTESIS ESTADÍSTICA COMPUESTA

http://descartes.cnice.mecd.es/materiales-didacticos/Muestreo/-Inferencia-Estadstica/pruebas-hipotesis.html

http://descartes.cnice.mecd.es/materiales-didacticos/Muestreo/-Inferencia-Estadstica/pruebas-hipotesis.html

Son aquellas hipótesis que no están completamente especificadas, es decirpuede no estar bien definido los valores de sus parámetros ó no estarespecificado el tipo de distribución de la variable ó población.

DOCIMACIA DE HIPÓTESISEs el proceso por el cual se efectúa la prueba de hipótesis. Para docimar senecesita 2 tipos de hipótesis:

1) LA HIPÓTESIS NULA H0Es aquella hipótesis completamente especificada es la que se quiere probarcon el fin de rechazarla. Para identificar si una hipótesis es nula debe tenerpor lo menos la igualdad ³=£ ;;

2) HIPÓTESIS ALTERNA H1Es aquella hipótesis contraria a la nula, es decir que no está completamenteespecificada y que se acepta cuando se rechaza la hipótesis nula y quegeneralmente para identificarla no debe tener el signo de la igualdad > ¹ <

TIPOS DE ERRORES

Se toma decisiones en base a las muestras, nos conduce inevitablemente acometer 2 tipo de errores:

1) ERROR TIPO ISe comete este tipo de error cuando se rechaza H0 y se acepta H1 cuandoH0 es verdadera.

2) ERROR TIPO IISe comete este tipo de error cuando se rechaza H0 y se acepta H1 cuandoH0 es falsa.

Estos errores se los resume de la siguiente manera

NATURALEZADECISION H0 :VERDADERO H1: VERDADERO

ACEPTA H0 CORRECTA ERROR TIPO IIACEPTA H1 ERROR TIPO I CORRECTA

NIVEL DE SIGNIFICANCIÓNAl cometer estos tipos de errores, se presentan bajo 2 niveles de significación:

1) NIVELa DE SIGNIFICACIÓNSignifica:P[comete error tipo I]= P[rechazar H0/H0 verdadero]

2) NIVEL b DE SIGNIFICACIÓNSignifica:P[comete error tipo II]= P[aceptar H0/H0 verdadero]

Generalmente el nivel de significación mas utilizado es a =10%, 5%, 1%, paratomar decisiones se deben establecer regiones críticas y /ó regiones deaceptación.

REGION CRÍTICA R.C.Es parte del rango del estimador que de acuerdo a una prueba prescrita nosconduce a rechazar H0 y aceptar H1 a cierto nivel de significación. Esta RC sesugiere determinar o utilizar cuando se presentan pruebas unilaterales.REGION DE ACEPTACIÓN R.A.Es parte del rango del estimador que de acuerdo a una prueba presenta permiteaceptar H0 y rechazar H1. Se sugiere utilizar esta RA cuando se presentanpruebas bilaterales.

TIPOS DE PRUEBADe acuerdo a los planteamientos de los problemas se tiene 3 tipos de pruebas:

1. BILATERAL

Planteamiento

00 : jj =H vs 01 : jj ¹Hdonde j = cualquier parámetro ( ) 0

2 ,,, jsm etc = valor del parámetro

2. UNILATERAL DERECHAPlanteamiento

00 : jj £H vs 01 : jj >H3. UNILATERAL IZQUIERDA

Planteamiento00 : jj ³H vs 01 : jj <H

Nota.- El tipo de prueba lo sugiere generalmente la hipótesis alterna.PROCEDIMIENTO PARA DOCIMAR

1. Plantear las hipótesis00 : jj =H vs 01 : jj ¹H Bilateral

00 : jj £H vs 01 : jj >H Unilateral Derecha

00 : jj ³H vs 01 : jj <H Unilateral Izquierda2. Elegir el nivel de significación a =10%, 5%, 1% si no se conoce a se elige

a = 5%.3. Elegir el estadístico de prueba apropiado, cuya distribución muestral sea

conocido, bajo el supuesto de que H0 es cierto4. Establecer la RC ó la RA (determinando los valores críticos: tablas)5. Determinar o calcular los valores de los estadísticos de prueba6. Comparar estos valores con la RC y /o RA y concluir si:

El valor calculado ÎRCÞ rechazar H0 y aceptar H1El valor calculado ÏRCÞ aceptar H0 y rechazar H1

El valor calculado ÎRCÞ aceptar H0 y rechazar H1Al nivel a de significación.

PRUEBAS RELATIVAS A MEDIAS MUESTRAS GRANDES

El estadístico de prueba es ( ) Znxx ;0

sm-

® ~N(0.1) también se puede utilizar S

en reemplazo de s cuando no se conoce

TIPO DE PRUEBA

BILATERAL R.A (ACEPTAR H0 YRECHAZAR H1)

R.A (RECHAZAR H0 YACEPTAR H1)

00 : mm =H vs 01 : mm ¹H22

; aa ZZ-

UNILATERAL DERECHA00 : mm £H vs 01 : mm >H aa ;1-Z

UNILATERAL IZQUIERDA00 : mm ³H vs 01 : mm <H aa Z®-

EjemploUn banco estudia la posibilidad de abrir una sucursal en la ciudad de “El Alto”,para ello establece el siguiente criterio para tomar la decisión “abrir la sucursal siel ingreso per cápita familiar no es menor a Bs. 500.- en contrario no abrir”. Paraellor toma una m.a. de 100 ingresos familiares, de esa ciudad la que da una mediade Bs. 480.-a) Cuál es la decisión a tomar al nivel del 5% de significación suponiendo que la

desviación típica de esa población es de Bs. 50.-

SOLUCIONPlanteamiento:1) 500:0 ³mH vs 500:1 <mH 100:50:480 === nx s

abrir la sucursal No abrir la sucursal2) a =5% = 0.05

3) El estadístico de prueba es ( ) ;0 nxxsm-

® ~N(0.1)

4) La RC = 645.1;; 05.0 --=- aa Z

5) Calculando ( )4

50100500480

-=-

=CZ

6) Comparando: Como Zc=-4 ÞÎ RC Rechazamos H0 y aceptamos H1, es decirno debe abrir la sucursal al 5% de significación.

PRUEBA RELATIVA A LA MEDIA: MUESTRAS PEQUEÑAS n<30 DE UNA VARIABLE OPOBLACION NORMAL

El estadístico de prueba es ( ) tnxTxsm0-

=® ~(n<1) g.d.l.

TIPO DE PRUEBA R.A (ACEPTAR H0 YRECHAZAR H1)


BILATERAL22

11; aa --

- tt

UNILATERAL DERECHA aa ;1-tUNILATERAL IZQUIERDA

aa t®-

Ejemplo

Se sabe que el ingreso per cápita de un gran número de ciudadanos, se distribuyenormalmente con un promedio de $us. 152.- Un estudio estadístico reciente unam.a de 9 personas de esa población ha dado los siguientes resultados en $us.158,154, 152, 156, 151, 150, 153, 155, 157. Al 5% de significancia. Ha cambiado elingreso per cápita de ésa población?.

SOLUCION

Planteamiento152:0 =mH vs 152:1 ¹mH 7386.2:154 == Sx

abrir la sucursal No abrir la sucursal

a =5% = 0.05

El estadístico de prueba es ( )sm nxTx 0-

=® .

La RA = 306.28;; 975.011205.0

205.0 -=-=-

--gdlttt

306.2:306.2-=RA

Calculando ( )1909.2

7386.29152154=

-=cT

Comparando: Como Tc=2.1909 ÞÎ RA aceptamos H0 y rechazamos H1, es decirel ingreso per cápita ha cambiado al 5% de significación.

PRUEBA DE HIPOTESIS SOBRE DIFERENCIA DE MEDIAS: MUESTRASGRANDES

Sean 2 v.a. ó 2 poblaciones Y~ ( )yxx2sm Y~ ( )2

yysm donde m se desconoce

Se quiere verificar si existe diferencia significativa entre las medias de las 2poblaciones

El estadístico de prueba es ( ) ( )( )nn

yx

yx

yxZyx

22 ss

mm

+

--=®- ~N(0.1)

Se puede utilizar 2S en reemplazo de 2s


R.A (RECHAZARH0 Y ACEPTAR H1)

BILATERAL0:0 =- yxH mm vs 0:1 ¹- yxH mm

2211

; aa --- ZZ |

UNILATERAL DERECHA0:0 £- yxH mm vs 0:1 >- yxH mm aa ;1-Z

UNILATERAL IZQUIERDA0:0 ³- yxH mm vs 0:1 <- yxH mm aa Z®-

Ejemplo

Para probar la afirmación de que la resistencia de un alambre eléctrico puedereducirse en más de 0.050 W (homios), mediante aleación, 32 valores obtenidosde alambre ordinario produjeron: una media= 0.1360 Ω ;y desviacion = 0.004 Ωy32 valores obtenidos con alambre fabricado a base de aleación produjeron unamedia de 0.083 Ω con una desviación tipica de 0.005 Ω Se apoya la afirmación al5%?

050.0:0 £- yxH mm vs 050.0:1 >- yxH mmno se apoya la afirmación Se apoya la afirmación

a=0.05

El estadístico de prueba ( ) ( )( )mn

yx

yx

yxZyx

22 ss

mm

+

--=®- ~N(0.1)

RC= [ ]¥Þ¥>Þ- 645.1:; 95.01 tZZ aa

( )( ) ( )

154.29001131923.0

033.0050.0083.01360.0

32005.0

32004.0 22

==+

--=cZ

Como Zc=29.154 ÎRC ÞRechazar H0 y aceptar H1, es decir se apoya laafirmación que la resistencia de un alambre eléctrico puede reducirse en más de0.050 (homios).

PRUBA DE HIPOTESIS SOBRE LA DIFERENCIA DE MEDIAS: MUESTRASPEQUEÑAS

Sean 2 v.a. ó 2 poblaciones X~N ( )yxx2sm Y~N ( )2

yysm donde m y 2s se desconocepara verificar si existe diferencia significativa entre las medias poblacionalesmediante 2 muestras aleatorias pequeñas n<30 y m<30

El estadístico de prueba es ( ) ( ) ( )( ) ( ) mn

mnnmSmSn

yxTyx

yx

yx

+-+

-+-

---=®-

)2(11 22

mm ~ at :n+m-2 gdl


R.A (RECHAZARH0 Y ACEPTAR H1)

BILATERAL0:0 =- yxH mm vs 0:1 ¹- yxH mm

2211

; aa --- tt |

UNILATERAL DERECHA0:0 £- yxH mm vs 0:1 >- yxH mm aa ;1-t

UNILATERAL IZQUIERDA0:0 ³- yxH mm vs 0:1 <- yxH mm aa t--

Ejemplo

Diez barras de acero fabricadas por un proceso A tienen una fuerza de rupturamedia de 50, con una desviación estándar muestral de 10; muestras que 8fabricadas por un proceso B, tienen una fuerza de ruptura media de 55 con unadesviación estándar muestral de 12. Suponiendo que la población de fuerzas deruptura normal con la misma desviación estándar, ......... con un nivel designificancia del 5% la hipótesis que los 2 procesos producen acero de la mismafuerza en contra de la posibilidad que no es así.

SOLUCION

BAH mm =:0 vs BAH mm ¹:1

a=0.05

El estadístico de prueba ( ) ( )( ) ( ) mn

mnnmSmSn

yxTyx

BA

BA

+-+

-+-

--=®-

)2(11

022

RA 12.212.2:; 975.0975.01 -=-=Þ - ttt aa

Con 965.018

)16(80)12(7)10(9

555022

-==+

-=cT

Como Tc=-0.965 ÎRA Þaceptamos H0 y rechazamos H1, es decir no hay razonpara creer que los 2 procesos producen acero con fuerzas diferentes.

PRUEBA DE HIPOTESIS SOBRE LA VARIANZA

Para realizar la prueba de hipótesis para la varianza poblacional ( )2s se utiliza elestadístico de prueba

( )1

22

--S

=n

xxS i ~( )

20

22 1

sSnX -

= ~X2 (n-1) gdl


R.A (RECHAZAR H0Y ACEPTAR H1)

BILATERAL20

20 : ss =H vs 2

01 : ss ¹H22

122 ; aa -XX |

UNILATERAL DERECHA20

20 : ss £H vs 2

01 : ss >H Si )1(;11

2 --> nXX c aUNILATERAL IZQUIERDA

20

20 : ss ³H vs 2

01 : ss <H Si )1(;21

2 -> nXX c a

Nota.- 20s valor de varianza postulada

Ejemplo

Una m.a. de 10 objetos elegidos al azar entre los producidos en cierta plantaindustrial han mostrado los siguientes pesos en grs. 71, 66, 64, 72, 69, 67, 70, 68,65, 69. Podrá aceptarse la hipótesis de que la varianza de los pesos de losobjetos es igual a 4 grs2 al 5% de significación. Suponiendo que la población delos pesos tiene distribución normal.

SOLUCION

220 4: grsH =s vs 2

1 4: grsH ¹sa=0.05

El estadístico de prueba es ( )20

222 1

sSnXS -

=® ~X2 (n-1) gdl

Media 1.68=x : Desviación S=2.60128

RA=(2.70 : 19.2)

Como ( ) 225.154

60128.29 22 ==cX

Como 2cX =15.225 ÎRA (2.7 ; 19.02) aceptamos H0 y rechazamos H1, es decir la

varianza es de 4 grs2 al 5% de significación.

PRUEBA DE HIPOTESIS RELATIVAS A 2 VARIANZAS

Para realizar la prueba de hipótesis sobre la diferencia de 2 varianzas de 2poblaciones que supuestamente tienen distribución normal, se utiliza el estadísticode prueba, la razón de varianzas muestrales

2

2

y

x

SSF = ~F (n-1)(m-1) gdl


R.A (RECHAZAR H0Y ACEPTAR H1)

BILATERAL22

210 : ss =H vs 2

2211 : ss ¹H )1)(1();1)(1(

221

-----

mnfmnf aa|

UNILATERAL DERECHA22

210 : ss £H vs 2

2211 : ss >H Si F<fa;(n-1)m-1)

UNILATERAL IZQUIERDA22

210 : ss ³H vs 2

2211 : ss <H Si F>fa;(n-1(m-1)

Nota.- generalmente se coloca en el numerador del estadístico la varianza másalta

Ejemplo

2 máquinas A y B producen independientemente el mismo tipo de articulo cuyopeso es de importancia. La varianza de los pesos de A ha sido siempre igual a lavarianza de los pesos de B, frecuentemente se han tomado una m.a. de A y otrade B obteniéndose los siguientes resultados:

muestra de A: 17, 23, 21, 18, 22, 20, 21, 19muestra de B: 13, 16, 14, 12, 15, 14

presentan estos datos suficiente evidencia para concluir que la varianza de lospesos de A y B ya no son iguales? Suponiendo poblaciones normales use a=0.05

Planteamiento22

210 : ss =H vs 2

2211 : ss ¹H

a=0.05

El estadístico de prueba es 2

2

ˆˆ

y

x

SSF = ~Fa(7.5)

RA= 85.6;189.0;5.7;;5.7; 975.0025.01205.0

205.0 ==

-ffff

Fc= 0625.22125.4

=

Como Fc ÎRA = aceptamos H0 y rechazamos H1, es decir que las varianzas de laproducción de A y B son iguales al 5% de significación.

EjemploSe quiere determinar si existe menos variabilidad en el plateado realizado por alCIA A que en el efectuado por la CIA B. Si muestras aleatorias independientes detamaño 12 del trabajo desempeñado por las compañías producen SA=0.062 mil.Pruébese la hipótesis de que 2

221 ss = contra 2

221 ss < con un nivel de significancia

del 5%

SOLUCION

H0: 22

21 ss = vs H1: 2

221 ss <

a=0.05

El estadístico de prueba es 2

2

ˆˆ

y

x

SSF = ~Fa(n-1)(m-1)

La RA= Si Fc<f0.05;11,11 f0.95:11:11 =2.82

Calcular Fc=( )( )

14.3035.0062.0

2

2

=

Como Fc =3.14>F2.82 rechazar H0 y aceptar H1, por lo tanto el plateado realizadopor la CIA A es menor variable que el plateado efectuado por la CIA B al 5% designificación.

PRUEBAS RELATIVAS A PROPORCIONES: MUESTRAS GRANDES

Para efectuar la prueba sobre una proporción en base a muestras grandes que........de poblaciones Binomiales se utiliza el estadístico:

nqp

ppqnp

npxZ00

0

00

0 ˆ -=-

= ~ Z~ N(0,1) dondeMxp =ˆ



BILATERAL

00 : rr =H vs 01 : rr ¹H22

11; aa --

- ZZ

UNILATERAL DERECHA00 : rr £H vs 01 : rr >H aa ;1-Z

UNILATERAL IZQUIERDA00 : rr ³H vs 01 : rr <H aa Z)(--

Nota.- 0r =valor de la proporción postuladaEjemploUn fabricante afirma que el porcentaje de consumidores de su producto es del30%. Con el fin de evaluar ésta afirmación, se tomó una m.a. de 400consumidores y se encontró que 100 prefieren el producto. Es ésta suficienteevidencia para concluir que el porcentaje de preferencia del antiguo producto hacambiado al 1% de significación?

SOLUCION30.0:0 =rH vs 30.0:1 ¹rH

a=0.01 25.0400100

ˆ ==r

El estadístico de pruebanqp

ppZ00

0ˆ -= ~ Z~ N(0,1)

RA= 575.2:575.2;; 995.0995.011201.0

201.0 -=-=-

--ZZZZ

Como 1834.230.025.0

400)70.0)(30.0(

-=-

=cZ

Comparando Zc=-2.1834 RAÞaceptamos H0 y rechazamos H1 ; es decir elporcentaje de preferencia de consumidores para el producto no ha cambiado al1% de significación

Ejemplo

En un estudio diseñado para investigar si ciertos detonadores empleados conexplosivos en una mina de carbón cumplan con los requerimientos de que almenos el 90% encenderá el explosivo al ser detonado se encontró que 174 de 200detonadores funcionan adecuadamente. Probar la hipótesis de que

90.0=r contra 90.0<r al 5% de significación.

SOLUCION

H0: 90.0=r vs H1: 90.0<r

a=0.05 87.0200174

ˆ ==r

RC= 645.1::: 05.0 --=-=- aaa a ZZ

Como 414.1021213203.0

03.090.087.0

200)10.0)(90.0(

-=-

=-

=cZ

Comparando -1.414 Î RCÞaceptamos H0 y rechazamos H1 ; es decir no hayrazón para afirmar que la clase determinada de detonador no cumple con lasnormas especificadas al 5% de significación.

universidad salesiana de boliviavirtual.usalesiana.edu.bo/web/contenido/dossier/22011/640.pdf ·...

Documents