4f inferencia estadistica.pptx
TRANSCRIPT
-
8/10/2019 4f Inferencia Estadistica.pptx
1/40
P R U E B A S D E H I P T E S I S D E D O S M U E S T R A S
4f. Pruebas de hiptesis
-
8/10/2019 4f Inferencia Estadistica.pptx
2/40
Introduccin
Hasta ahora se vieron pruebas de hiptesis parainferir caractersticas (media, varianza o proporcin)de la POBLACIN por medio de UNA MUESTRA.
Se seleccion una sola muestra aleatoria de unapoblacin y se realiz una prueba para ver si erarazonable/correcto el valor propuesto de la
poblacin.
-
8/10/2019 4f Inferencia Estadistica.pptx
3/40
Ahora se ampliar el estudio a casos de pruebas dehiptesis para dos muestras, donde se seleccionanmuestras aleatorias de dos poblaciones distintas paradeterminar si son iguales las medias o las proporciones
de la poblacin. Casos que veremos: Hay alguna diferencia en el nmero medio de defectos
producidos en los turnos matutino y vespertino de GM? Hay un aumento en la tasa de produccin si se toma
msica en el rea de produccin? Hay alguna diferencia en la proporcin de estudiantes de
MBA y de maestra en ingeniera que aprobaron el examende certificacin en el primer intento?
-
8/10/2019 4f Inferencia Estadistica.pptx
4/40
Pruebas de hiptesis para dos muestras: Muestrasindependientes
Si partimos del caso: Suponer que un analista financiero busca saber si la tasa de
recuperacin media para los fondos mutualistas de altorendimiento ES DISTINTA a la tasa de recuperacin media
para los fondos mutualistas globales.
En este caso hay 2 poblaciones independientes:
1. Fondos mutualistas de alto rendimiento2. Fondos mutualistas globales
-
8/10/2019 4f Inferencia Estadistica.pptx
5/40
Entonces, se deben seleccionar una muestra aleatoria deCADA POBLACIN, y se calculara la media de las 2muestras.
Si las dos media muestrales son iguales, es esperara quela diferencia entre las dos medias poblacionales fueraceroPero qu pasara si los resultados, dado que sonmuestrales, produjeran una diferencia distinta de cero?la diferencia se debe a la casualidad o realmente existe
una diferencia entre ambos fondos? Por medio de una prueba de hiptesis para ambas
medias muestrales ayudar a contestar esta pregunta.
-
8/10/2019 4f Inferencia Estadistica.pptx
6/40
Recordando que una distribucin de mediassuele aproximarse a la distribucin normal,entonces se supondr que una distribucin
de las medias de muestras seguir unadistribucin normal, y con esto asumimosque la distribucin de sus diferencias
tambin seguir una distribucin normal.
-
8/10/2019 4f Inferencia Estadistica.pptx
7/40
Sobre la variabilidad de la distribucin de lasdiferencias de medias muestrales, si ambasprovienen de poblaciones independientes, ladistribucin de las diferencias tienen una varianzaigual a la suma de dos varianzas individuales, esdecir:
Varianza de la distribucin de las diferencias en medias
-
8/10/2019 4f Inferencia Estadistica.pptx
8/40
Para considerar esto como error estndar, se sacaraz y para considerar el estadstico de pruebaestandarizado resulta:
-
8/10/2019 4f Inferencia Estadistica.pptx
9/40
Los clientes de Soriana tienen una opcin de pagar porsus compras. Pueden pagar en caja registradora normaloperada por una cajero o bien por internet.
Se seleccionan 2 muestras resultando: el ticket promedio
de 50 clientes que compran fsicamente en tienda es de$1,500 con una desviacin estndar de la poblacin de$300 mientras que el ticket promedio de 100 clientes decompras en lnea es de $1,750 con una desviacinestndar de la poblacin de $150.
Podra afirmarse con un nivel de confianza de 95% quelos clientes de Soriana en general (incluyendo los que vanfsicamente a las tiendas como los compradores en lnea)en promedio compran cantidades similares?
-
8/10/2019 4f Inferencia Estadistica.pptx
10/40
Se establece hiptesis nula y alternativa: Ho : s = u Ha : s u
Dado el nivel de significancia de 0.05 se establecen
las regiones crticas:
Estadstico de prueba:
1-= 0.95 = 0.05
/2= 0.025
-1.96 1.96
Se rechaza HoPor lo que se concluye queexiste una diferencia en el ticketpromedio entre ambos tipos declientes
-
8/10/2019 4f Inferencia Estadistica.pptx
11/40
-
8/10/2019 4f Inferencia Estadistica.pptx
12/40
Prueba de proporciones de dos muestras
Para casos donde se requiere saber si dosproporciones de muestras provenientes depoblaciones iguales.
Ejemplos de casos: El VP de RH desea saber si hay alguna diferencia en la
proporcin de empleados asalariados por hora que faltan msde 5 das de trabajo por ao en las plantas de Atlanta yHouston.
Ford considera un diseo nuevo para su modelo Focus. Eldiseo se muestra a un grupo de compradores potencialesmenores de 30 aos de edad y otro grupo de compradores demayores de 60 aos de edad. La compaa quiere saber si hayalguna diferencia en la proporcin de los dos grupos que lesgusta el diseo nuevo.
-
8/10/2019 4f Inferencia Estadistica.pptx
13/40
-
8/10/2019 4f Inferencia Estadistica.pptx
14/40
Para hacer la prueba de hiptesis se asume que lamuestra es lo bastante grande para que ladistribucin normal sirva como una buenaaproximacin a la distribucin binomial.
Estadstico de prueba:n1 nmero de observaciones en la 1 muestra
n2 nmero de observaciones en la 2 muestra
P1 proporcin de 1 muestra que posee la caracterstica
P2 proporcin de la 2 muestra que posee la caracterstica
Pc proporcin conjunta que posee la caracterstica en las
muestras combinadas, y se calcula:
X1 nmero que posee la
caracterstica en la 1 muestra
X2 nmero que posee la
caracterstica en la 2 muestra
-
8/10/2019 4f Inferencia Estadistica.pptx
15/40
Ejemplo
La compaa de perfumes Manelli desarroll una fragancianueva. Varios estudios de mercado indican que esta nuevafragancia tiene un buen potencial. El depto. De ventas tieneinters en saber si hay alguna diferencia en las proporcionesde mujeres jvenes y mayores que compraran el perfume si
saliera al mercado. Hay dos poblaciones independientes: unade mujeres jvenes y otra de mujeres mayores. A cada una delas mujeres muestreadas se le pedir que huela la fragancianueva e indique si le gusta lo suficiente para comprar elperfume.
Realizar la prueba de hiptesis a un nivel de significancia de
0.05 cuando los resultados fueron: Una muestra aleatoria de 100 mujeres jvenes revel que a 19 les gust
la nueva fragancia lo suficiente para comprar el perfume.P1 Una muestra de 200 mujeres mayores revelo que a 62 les gust la nueva
fragancia lo suficiente para comprarlaP2
-
8/10/2019 4f Inferencia Estadistica.pptx
16/40
Solucin al ejemplo
1. Formular hiptesis nula/alternativa: Ho : 1 = 2 Ha: 1 2
2. Regiones crticas:
3. Proporciones:
1-= 0.95 = 0.05/2= 0.025
-1.96 1.96
-
8/10/2019 4f Inferencia Estadistica.pptx
17/40
Estadstico de prueba:
-1.96 1.96
-2.21
Se rechaza Ho.Se rechaza la hiptesis nula de
que la proporcin de mujeresjvenes que compraran lafragancia es igual a laproporcin de mujeres mayoresque tambin la compraran.
L hi i l l i
-
8/10/2019 4f Inferencia Estadistica.pptx
18/40
Ejercicios en clase La hiptesis nula y alternativa son:
Ho:1 2
Una muestra de 200 observaciones de la 1 poblacin indic que X1 es 170;otra de 150 observaciones de la 2 poblacin revel que X2 es 110. Utilice unnivel de significancia de 0.05 para probar la hiptesis.
La familia Damon posee un viedo grande en el oeste de NY. Probaran 2nuevos insecticidas (Pernod 5 y Action). Para probarlos, se seleccionaron 3hileras y se fumigaron con Pernod 5, y otras 3 con Action. Tiempo despus,
se revisaron 400 vides tratadas con Pernod 5 e igualmente otras 350 serevisaron para verificar el efecto de Action. Los resultados fueron:
Con un nivel de significancia de 0.05 se puede concluir que existe unadiferencia en la proporcin de vides infectadas empleando Pernod 5 encomparacin con las fumigadas con Action?
-
8/10/2019 4f Inferencia Estadistica.pptx
19/40
Comparacin de medias con desviaciones estndaresde la poblacin desconocidas (prueba t conjunta)
En los casos hasta ahora vistos se utiliz la z(distribucin normal estndar) como estadstico deprueba.
Se compararon medias muestrales de 2 poblacionesindependientes con el objetivo de saber si provenan delas mismas poblaciones o de poblaciones iguales(medias poblacionales estadsticamente iguales).
La realidad es que difcilmente conoceremos ladesviacin estndar poblacional () por lo queutilizaremos la desviacin estndar de la muestra (s).
-
8/10/2019 4f Inferencia Estadistica.pptx
20/40
-
8/10/2019 4f Inferencia Estadistica.pptx
21/40
De qu manera se agrupan las desviacionesestndar muestrales? Las 2 desviaciones estndares de las muestras se agrupan para
formar una sola estimacin de la desviacin estndar
desconocida de la poblacin. Esto se calcula mediante una media ponderada de las dos
desviaciones estndares de las 2 muestras.
Las ponderaciones son los grados de libertad de cada muestra.
-
8/10/2019 4f Inferencia Estadistica.pptx
22/40
El estadstico de prueba t se calcula:
-
8/10/2019 4f Inferencia Estadistica.pptx
23/40
Ejemplo
Owens Inc. Analiza dos procedimientos distintospara el montaje del motor al chasis de una podadora.La pregunta es: existe una diferencia en el tiempomedio para montar los motores al chasis?.
El primer procedimiento se consultaron 5mediciones y result un tiempo promedio de 4 mincon una desviacin estndar muestral de 2.91.
El segundo procedimiento se consultaron 6
mediciones y result un tiempo promedio de 5 mincon una desviacin estndar muestral de 2.09. Utilice un nivel de significancia de 0.1
-
8/10/2019 4f Inferencia Estadistica.pptx
24/40
-
8/10/2019 4f Inferencia Estadistica.pptx
25/40
-
8/10/2019 4f Inferencia Estadistica.pptx
26/40
-1.83 +1.83
Rechazo HoRechazo Ho
-0.662
Por lo que NO se rechaza Ho, se acepta Ho como cierta. Se concluye que NO existe diferencia en los tiempos
medios para montar el motor en el chasis con los 2mtodos.
-
8/10/2019 4f Inferencia Estadistica.pptx
27/40
-
8/10/2019 4f Inferencia Estadistica.pptx
28/40
Comparacin de medias poblacionales condesviaciones estndares desiguales
Hasta ahora se vieron los casos donde suponemosque las poblaciones tenan desviaciones estndaresIGUALES.
Importante: NO se conocan los valores peroSUPONAMOS eran iguales.
Qu pasa si las desviaciones estndar de la poblacinsuponemos son DIFERENTES?
Se emplearn nuevamente las desviaciones estndarde las muestras (S1 y S2) en lugar de las de lapoblacin.
-
8/10/2019 4f Inferencia Estadistica.pptx
29/40
Estadstico de prueba para medias sin diferencia,varianzas desiguales:
Grados de libertad para prueba con varianzadesigual:
-
8/10/2019 4f Inferencia Estadistica.pptx
30/40
Ejemplo
Se desea conocer la absorcin de toallas de papel. Secomparan toallas de marcas diferentes de calidad similar.Una primera muestra de la marca 1 se realiz elexperimento con 9 toallas obtenindose una absorcin
media de 6.44ml con una desviacin estndar de 3.32ml.La segunda muestra de la marca 2 se realiz con 12toallas obtenindose una absorcin media de 9.417mlcon una desviacin estndar de 1.621ml.
Utilice un nivel de significancia de 0.1 y pruebe queexiste una diferencia en la cantidad media de lquidoabsorbido.
-
8/10/2019 4f Inferencia Estadistica.pptx
31/40
-
8/10/2019 4f Inferencia Estadistica.pptx
32/40
Se calcula el estadstico de prueba:
Buscando en tablas de la Distribucin t-student connivel de significancia de 0.1 y 10 grados de libertad,consideramos las regiones crticas
-1.812 +1.812
Rechazo HoRechazo Ho
-2.418
Por lo que seRECHAZA H0, seconcluye que la tasade absorcin mediapara las 2 marcasde toallas NO es la
mis.a
P b d hi t i d d t
-
8/10/2019 4f Inferencia Estadistica.pptx
33/40
Prueba de hiptesis de dos muestras:Muestras dependientes
Este mtodo se utiliza cuando las muestras sondependienteso estn relacionadas.
Tambin se les conoce como muestras
apareadas. Bsicamente lo que vamos a utilizar como muestra
ser la distribucin de las medias de las diferenciasde ambas muestras.
Vamos a explicar esto ltimo por medio de unejemplo:
Un ejecutivo de crditos hipotecarios de Bancomer
-
8/10/2019 4f Inferencia Estadistica.pptx
34/40
Un ejecutivo de crditos hipotecarios de Bancomerrecurre a dos empresas dedicadas a Bienes Raices:Century 21 y Kasa; para valuar propiedades que estn
susceptibles de venta. Es importante que ambasempresas tengan valores similares en sus avalos. Pararealizar esto, Bancomer selecciona 10 casas de formaaleatoria y pide a Century 21 y Kasa realicen su avalos.
Entonces, para cada casa, se realizarn 2 avalos, unorealizado por Century 21 y otro por Kasa.
Los avalos dependen o estn relacionados con la casaseleccionada.
Para la prueba de hiptesis el inters es la distribucin
-
8/10/2019 4f Inferencia Estadistica.pptx
35/40
Para la prueba de hiptesis el inters es la distribucinde las diferencias en el valor del avalo de cada casa.
Entonces de aqu solo hay 1 muestra.
Bancomer intenta saber si la media de la distribucinde las diferencias en los avalos es cero, es decir, sindiferencia o si existe alguna diferencia.
La muestra se compone de las diferencias de losavalos de ambas empresas (Century 21 y Kasa).
Si ambas empresas reportan estimados similares,entonces algunas veces los avalos de Century 21 sern
mayores y otras veces sern los de Kasa. A pesar deesto la media de las diferencias ser cero.
-
8/10/2019 4f Inferencia Estadistica.pptx
36/40
Se utilizar dpara indicar la media poblacional dela distribucin de las diferencias, suponiendo que ladistribucin de las diferencias sigue una distribucin
Normal. El estadstico de prueba sigue la distribucin t
student (con n-1 grados de libertad)y secalcula:
d: es la media de las diferencias entre lasobservaciones apareadas o relacionadas.Sd: desviacin estndar de las diferencias entre lasobservaciones apareadas o relacionadas.n: nmero de observaciones apareadas.
-
8/10/2019 4f Inferencia Estadistica.pptx
37/40
Sdse calcula de manera similar al clculo normal dela desviacin estndar, nicamente cambiando x pord, es decir:
-
8/10/2019 4f Inferencia Estadistica.pptx
38/40
1. Formular hiptesis nula y alternativa:
-
8/10/2019 4f Inferencia Estadistica.pptx
39/40
1. Formular hiptesis nula y alternativa:Ho: d= 0 Vs Ha: d 0
2. Hay 10 casas valuadas por ambas empresas, entonces n=10 ygl= 10-1=9. Se tiene una prueba de dos colas a un nivel de
significancia de 0.05 (=0.05). Buscando en tablas t studentpara determinar valores crticos:
-2.262 +2.262
Rechazo HoRechazo Ho
-
8/10/2019 4f Inferencia Estadistica.pptx
40/40
Calculando el estadstico de prueba:
-2.262 +2.262
3.305
Se rechaza Ho,concluyndose que ladistribucin de las
diferencias de la poblacinNO tiene una media de 0,hay una diferencia en losavalos medios de lascasas.