planteamiento de hipótesis para dos poblaciones (word)
Post on 21-Jun-2015
19.155 Views
Preview:
TRANSCRIPT
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
PLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONESPARA LA PROPORCIÓN
Mtra. A Elsa Retureta Álvarez 1
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
APLICACIÓN
Su aplicación determina si razonablemente puede pensarse que las mediciones muéstrales provengan de una población que tenga una normal distribución teórica.
En la prueba se compara la distribución de frecuencia acumulativa de la
distribución teórica con la distribución de frecuencia acumulativa observada. Se
determina el punto en el que estas dos distribuciones muestran la mayor
divergencia. Y a continuación presentamos el desarrollo del estudio acerca del
planteamiento de la hipótesis cuando existen dos poblaciones, y haciendo
mención, en lo referente a la proporción:
1. Estructura de la base de datos
Normalmente la estructura que tiene la base de datos es la de utilizar una
variable para entrar los resultados de la medición y la otra donde se particiona
estos resultados en los dos grupos.
2. Premisas
La única premisa que se necesita es que las mediciones se encuentren
al menos en una escala ordinal. Adicionalmente se necesita que la medición
considerada sea básicamente continua.
3. Potencia-Eficiencia
Comparada ante la alternativa paramétrica de la t de student para dos
muestras independientes (o el modelo de Análisis de Varianza clasificación
simple para dos muestras), cuando las premisas paramétricas se cumplen,
tiene una potencia eficiencia de cerca del 96%, que tiende a decrecer
ligeramente a medida que se aumentan los tamaños de muestra.
4. Hipótesis
Las hipótesis de esta dócima, expresadas en palabras son:
Ho: Las distribuciones poblacionales son iguales.
H1: Las distribuciones poblacionales son distintas.
Mtra. A Elsa Retureta Álvarez 2
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Ahora bien se recomienda en general hacer el enunciado de las hipótesis
de forma tal que indique en un mayor grado la característica que va a ser
docimada.
5. Estadígrafo y distribución muestral.
Designemos por T1 y por T2 las tablas de distribución de frecuencias
relativas acumuladas, particionadas en k categorías. Donde el primer subíndice
corresponde al número de la muestra y el segundo al orden de la clase.
Se analiza entonces en la columna de las diferencias de las frecuencias,
en qué clases se obtiene el valor máximo. Se tendrá entonces en símbolos:
El estadígrafo de esta dócima se designa por χ2 y para tamaños
de muestra suficientemente grandes, está distribuido según chi-cuadrado con
dos grados los de libertad. En símbolos:
Goodman, ha demostrado que si los tamaños
de muestra son pequeños la dócima se
comporta conservadoramente.
6. Salidas de la dócima
Las salidas usuales de una dócima son tres:
Máxima diferencia negativa. Donde se muestra cuál es la mayor diferencia
negativa alcanzada.
Máxima diferencia positiva. Donde se muestra la mayor diferencia positiva
alcanzada.
Valor de la probabilidad para dos colas.
Mtra. A Elsa Retureta Álvarez 3
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
GLOSARIO
CONCEPTO DEFINICIÓN TRADUCCIÓN
Dócima Es un procedimiento que nos permite contrastar 2 hipótesis bajo ciertas consideraciones y tomar una decisión respecto de ellas.
It is a procedure that allows to contrast 2 hypotheses under certain considerations and to make a decision regarding them.
Distribución Muestral
Es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una población. Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al parámetro de la población
It's what results from considering all the possible samples that can be taken of a population. Their study allows calculating the probability that one has, given a single sample, of coming closer to the population's parameter.
Distribución ji-cuadrada Se genera al sumar variables normales independientes (0,1) elevadas al cuadrado. El parámetro que define la distribución se llama grados de libertad y es el número de variables normales que sumas.
It's generated when adding independent normal variables (0,1) high to the square. The parameter that defines the distribution is called grades of freedom and it's the number of normal variables that you add.
Prueba de Kolmogórov-Smirnov
La prueba de Kolmogórov-Smirnov (también prueba K-S) es una prueba no paramétrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de probabilidad entre sí.
The Kolmogorov–Smirnov test (K–S test) is a form of minimum distance estimation used as a nonparametric test used to compare a sample with a reference probability distribution or to compare two samples.
Mtra. A Elsa Retureta Álvarez 4
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Distribución de frecuencia acumulativa
Es la frecuencia total de todas las clases menos que el límite de la clase superior de una clase determinada. Hay dos tipos de distribuciones de frecuencias acumuladas.
Menos de distribución de frecuencias acumuladas y Más de distribución de frecuencias acumuladas
It's the total frequency of all the classes less than the limit of the top class of a certain class. There are two types of distributions of accumulated frequencies:Less distribution of accumulated frequencies and more distribution of accumulated frequencies
Homocedástica La homocedasticidad es una propiedad fundamental del modelo de regresión lineal general y está dentro de sus supuestos clásicos básicos. Se dice que existe homocedasticidad cuando la varianza de los errores estocásticos de la regresión es la misma para cada observación i.
The homocedasticity is a fundamental property of the pattern of general lineal regression and it is inside its basic classic suppositions. It is said that homocedasticity exists when the variance of the stochastic errors of the regression is the same one for each observation i.
Particionada En teoría de números, una partición de un entero positivo n es una forma de descomponer n como suma de enteros positivos. Dos sumas se considerarán iguales si solo difieren en el orden de los sumandos. De modo más riguroso, una partición de un número entero positivo n es una secuencia de enteros positivos.
In theory of numbers, a partition of a positive integer "n" is a form of decomposing "n" like it adds of whole positive. Two sink they will consider same if alone they differ in the order of the adding-up. In a more rigorous way, a partition of a positive whole number n is a sequence of whole positive.
Estadígrafo Es la medida que en Estadística se aplica sobre una muestra. En general se utilizan dos tipos: Los de Tendencia Central y los de Dispersión.
It is the measure that is applied on a sample in Statistic. In general two types are used: Those of Central Tendency and those of Dispersion.
Mtra. A Elsa Retureta Álvarez 5
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
FORMULARIO:
Mtra. A Elsa Retureta Álvarez 6
Planteamiento de Hipótesis
en Dos poblaciones para la
Proporción
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
INTRODUCCIÓN
El uso de la Estadística es de gran importancia en la investigación. Casi
todas las investigaciones aplicadas requieren algún tipo de análisis estadístico
para que sea posible evaluar sus resultados. La elección de uno u otro tipo de
análisis estadístico depende del problema que se plantee en el estudio así
como de la naturaleza de los datos.
Dentro de la estadística se aplican en la investigación los test o décimas
paramétricos y no paramétricos, entre los test no paramétricos que
comúnmente se utilizan para verificar si una distribución se ajusta o no a una
distribución esperada, en particular a la distribución normal se encuentran el
test de Kolmogorov-Smirnov que es bastante potente con muestras grandes.
El nivel de medición de la variable y su distribución son elementos que
intervienen en la selección del test que se utilizará en el procesamiento
posterior. De hecho, si la variable es continua con distribución normal, se
podrán aplicar técnicas paramétricas. Si es una variable discreta o continua no
normal, solo son aplicables técnicas no paramétricas pues aplicar las primeras
arrojaría resultados de dudosa validez.
Mtra. A Elsa Retureta Álvarez 7
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
TEORIA
En algunos diseños de investigación, el plan muestral requiere seleccionar dos muestras independientes, calcular las proporciones muestrales y usar la diferencia de las dos proporciones para estimar o probar una diferencia entre las mismas.
Las aplicaciones son similares a la diferencia de medias, por ejemplo si dos empresas consultoras ofrecen datos de proporciones de personas que van a votar por el PRI y al hacer dos estudios diferentes salen resultados ligeramente diferentes ¿pero qué tanta diferencia se requiere para que sea estadísticamente significativo? De eso se tratan las pruebas estadísticas de diferencias de proporciones.
El estadístico Z para estos casos se calcula de la siguiente manera:
1 ˆp = proporción de la muestra 1.
2 ˆp = proporción de la muestra 2.
1 p = proporción de la población 1.
2 p = proporción de la población 2.
1 n = tamaño de la muestra 1.
2 n = tamaño de la muestra 2.
Contraste bilateral
El contraste bilateral sobre la diferencia de proporciones es
Mtra. A Elsa Retureta Álvarez 8
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Entonces se define
y se rechaza la hipótesis nula si o si
Contrastes unilaterales
En el contraste
se rechazará H0 si . Para el test contrario
se rechaza H0 sí .
Mtra. A Elsa Retureta Álvarez 9
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Mtra. A Elsa Retureta Álvarez 10
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
SUPUESTOS
– La distribución de los datos tiene que ser normal (o cualquier distribución, en el caso de que los tamaños muestrales sean grandes, n>30)
– La distribución de la diferencia entre las dos mediciones realizadas tiene que ser normal (o cualquier distribución, en el caso de que los tamaños muestrales sean grandes, n>30)
– Las distribuciones son normales
– Las muestras se seleccionaron al azar
– Las poblaciones se distribuyen normalmente
– Las muestras han sido seleccionadas al azar
– Todas las observaciones son independientes entre sí
– Tamaño de muestra “grande” para que se cumpla el teorema del límite central
– En variables numéricas, no deben haber valores extremos o sesgos que limiten la representatividad del promedio como medida de tendencia central.
Mtra. A Elsa Retureta Álvarez 11
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
RESTRICCIONES
En el caso concreto de comparar dos o más poblaciones existen cinco restricciones o condiciones que se deben cumplir estrictamente para realizar este tipo de análisis (1-3):
1) Las observaciones deben ser independientes entre si;
2) Las observaciones deben hacerse en poblaciones distribuidas normalmente;
3) Estas poblaciones tienen que tener homocedasticidad (igualdad de varianzas) (o, en casos especiales deben tener una proporción de varianzas conocidas)
4) Las variables correspondientes deben ser cuantitativas continuas y,
5) Cuando existen más de dos poblaciones comparadas, las medias de estas poblaciones normales y homocedásticas deben ser combinaciones lineales de efectos debidos a las columnas y a las filas o a ambos. Cuando estas condiciones se satisfacen, entonces se puede aplicar la prueba "t" o "F", según sea el caso.
GRAFICOS
Mtra. A Elsa Retureta Álvarez 12
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
FORMULA
Para contrastar la Ho se utiliza la siguiente fórmula de (Zc) para calcular el tamaño de cada población de donde proceden las muestras, para comparar dos proporciones poblacionales, con la siguiente fórmula.
UTILIDAD
El concepto de prueba de hipótesis para proporción se puede utilizar para probar hipótesis en relación con datos cualitativos, dado que se desea llegar a conclusiones en cuanto a la proporción de los valores que tienen una característica particular.
…..En muchas ocasiones la toma de decisiones las personas necesitan
determinar si los parámetros de dos poblaciones son iguales o diferentes. En una empresa por ejemplo, puede tener la intención de probar si sus
empleadas reciben un salario medio que el de sus empleados varones, por realizar el mismo trabajo.
Un director de capacitación, puede querer determinar si la proporción de empleados que están listos para ascenso en una dependencia gubernamental es diferente al de la proporción de otra.
Un fabricante de medicina puede tener la necesidad de saber si un nuevo medicamento ocasiona una reacción en grupo de animales para experimentación y otra reacción distinta de otro grupo.
Mtra. A Elsa Retureta Álvarez 13
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
TABLAS
Una tabla de contingencia es una herramienta que nos permite poner a prueba si dos criterios de clasificación de una misma muestra son independientes o no, por ejemplo:
EJEMPLOS DE RESOLUCIÓN
EJEMPLO 1
El tamaño de las muestras seleccionadas de Casos (630, que representó a toda la población) y de Controles (1005) se incrementó en relación al cálculo necesario para el estudio en los ocho hospitales de la ciudad de México, seguramente para obtener una mayor precisión en los resultados esperados.
Para la reconstrucción de cálculo necesario, como un ejercicio docente, se utilizan los siguientes criterios.
o El cálculo del tamaño de la muestra en estudios de dos poblaciones para comparar dos proporciones poblacionales, con el siguiente enfoque:
Mtra. A Elsa Retureta Álvarez 14
Población Criterio 1 Criterio 2
Ingenieros recién egresados
Salario inicial Institución de origen
Estudiantes Nivel Socioeconómico
Promedio académico
Número de fallas en un proceso
Maquinaria utilizada
Turno
Estudiantes Calif. en Materia 1 Calif. en Materia 2
Fallas en un transformador
Tipo de falla Ubicación
Etc...
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Nd1 Grupo de Casos : Mujeres con CACU
Nd2 ----- Grupo de Controles : Mujeres sin CACU
El siguiente planteamiento de Hipótesis Estadística:
H0 = Hipótesis nula (niega) H0 : Õ 1 ≥ Õ 2
H1 = Hipótesis alternativa (afirma) H1 : Õ 1 < Õ 2
"En el grupo de Casos la asociación del CACU (No/Si) tendrá una diferencia estadísticamente significativa mayor con los factores de riesgo reproductivo e historia de vida sexual, que en el Grupo de Controles".
o Dirección de la hipótesis ---------- una sola cola derecha (unilateral).
Donde: za = 1.64 para un error a = 0.05 (5%) (una cola) zb = 0.84 para un error b de 0.20 (0.20) (una cola) p1 = 0.03 (1) p2 = 0.01 (1) q1 = 0.97 (1) q2 = 0.99 (1)
n1 = 600 mujeres para el Grupo de Casos
n2 = 600 mujeres para el Grupo de Controles
Al haberse utilizado 630 casos y 1005 controles, como tamaño muestral en los grupos, se logrará una mayor precisión en la estimación de los resultados esperados.
EJEMPLO 2
El cálculo del tamaño de la muestra en estudio de dos poblaciones para comparar dos proporciones poblacionales, con el siguiente enfoque:
Ns1 ® Grupo de intervención, 125 pares de madres e hijos (n1), con
Mtra. A Elsa Retureta Álvarez 15
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
lactancia materna exclusiva
Nd2 ® Grupo testigo, 125 pares de madres e hijos (n2), con lactancia materna exclusiva
El siguiente planteamiento de Hipótesis Estadística:
Ho = Hipótesis nula (niega) ® Ho : p 1 ≥ p 2
Ha = Hipótesis alternativa (afirma) ® Ha : p 1<p 2
En el grupo de intervención (n1) que recibe orientación sobre la lactancia materna exclusiva (No/Si) tendrá una mayor diferencia estadísticamente significativa porque al momento del egreso el porcentaje de madres que alimenten a sus hijos exclusivamente al pecho, será mayor en comparación con el Grupo Testigo, que sólo recibe educación rutinaria.
Dirección de la hipótesis ® una sola cola derecha (unilateral)
Para contrastar la Ho se utiliza la siguiente fórmula de (n) para calcular el tamaño de cada población de donde proceden las muestras:
Donde:
za = 1.64 para un valor nivel error a = 0.05 (5%)
zb = 0.84 para un valor nivel error b = 0.20 (20%)
p1 = 63% menores de 3 meses que recibieron
Lactancia materna exclusiva (1)
q1 = 37% menores de 3 meses que no recibieron
Lactancia materna exclusiva
p2 = 28% menores de 3 meses que no fueron
Amamantados
Mtra. A Elsa Retureta Álvarez 16
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
q2 = 72% menores de 3 meses que sí fueron
Amamantados
Reemplazando valores en la formula de (n)
n1 = 22 pares de madres e hijos (grupo de Intervención)
n2 = 22 pares de madres e hijos (grupo Testigo o Control)
Al haberse utilizado 125 pares de madres e hijos en cada grupo, como tamaño muestral, se ha logrado una mayor precisión en la estimación de los resultados esperados.
EJEMPLO 3
Se realizó un estudio para comparar los años promedio de servicio de quienes se retiraron en 1979 con los que se retiraron el año anterior en Delong Manufacturing Co. Con un nivel de significancia de .01 ¿podemos concluir que los trabajadores que se retiraron el año pasado trabajaron más años según la siguiente muestra? Nota: sea población #1= año anterior.
Paso 1:
Paso 2: Rechace H0 si z > 2.33Paso 3:
Mtra. A Elsa Retureta Álvarez 17
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
EJEMPLO 4
(Los exámenes de Estado- Pruebas del ICFES)Se desea comparar la preparación de los estudiantes de último año de bachillerato con base en las pruebas de estado (ICFES). Se desea estimar la diferencia de los puntajes medios μ.1 − μ2 para los estudiantes de colegios públicos μ1 y de colegios privados μ2.El puntaje de las pruebas de estado varía en una escala de 0 a 400 puntos.
Para desarrollar estos propósitos, se han tomado muestras al azar entre todos los inscritos, de tal manera que de los estudiantes de colegios públicos se ha tomado una muestra de 100 estudiantes, mientras que de los colegios privados se tomaron 81 estudiantes.
Para cada una de las muestras se calculó el puntaje promedio obtenido y su correspondiente desviación estándar, arrojando los siguientes resultados:
Los datos obtenidos retan la hipótesis de que los colegios privados preparan mejor a sus estudiantes para las pruebas de estado que los colegios públicos?
Bueno, manos a la obra. De acuerdo con el contexto del problema, tenemos un primer problema de estimación de la diferencia de puntajes medios en las dos poblaciones, lo cual puede hacersemediante la construcción de un intervalo de confianza.En segundo lugar está formulada una pregunta (hipótesis), la cual debe ser sometida a una prueba de significancia, es decir debe calcularse el valor P, que mide la compatibilidad entre los datos y la hipótesis planteada.
Mtra. A Elsa Retureta Álvarez 18
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
EJERCICIOS DE RESOLUCIÓN
Ejemplo 5
¿Es más probable que los trabajadores solteros falten más que los trabajadores casados?
Una muestra de 250 trabajadores casados indicó que 22 faltaron más de 5 días el año pasado, mientras que una muestra de 300 trabajadores solteros indicó que 35 faltaron más de 5 días. Utilice .05 de nivel de significancia.
Nota: sea población #1 = trabajadores solteros.
Paso 4: H0 no se rechaza. No existe diferencia entre la proporción de trabajadores casados y solteros que faltan más de 5 días al trabajo.El valor p = P{ z > 1.1} = .1357
Ejemplo 1:
Unos grandes almacenes han instalado unas cajas de cobro automáticas. Durante los primeros meses, tan sólo las han usado un 8% de la clientela, por lo que deciden iniciar una campaña publicitaria a fin de incrementar ese uso en un 10%, y justificar así su instalación. Durante unos días, en horas elegidas aleatoriamente, han efectuado un recuento y han descubierto que de un conjunto de 2340 clientes, tan sólo han usado las cajas 208. Después de desarrollar la campaña, han repetido el estudio, y esta vez, de 1978 clientes, han pasado por las nuevas cajas 395. ¿Justifican estos
Mtra. A Elsa Retureta Álvarez 19
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
resultados, al 95% de nivel de confianza, que se ha logrado el incremento deseado del 10%?
En este caso aplicaremos el estadístico de contraste en el que las proporciones en la población son 8% y 18% respectivamente (si admitimos esto como hipótesis nula) y las de la muestra 208/2340=0,0889 y 395/1978=0,1887.
Como el error es pequeño, se toman aquí como parámetros de la población los mismos valores que en la muestra, y sólo hay que rellenar la diferencia de proporciones supuesta (aquí el 10%)
Suponemos contraste bilateral y fijamos el 95% de nivel de confianza:
El resultado del contraste será que se rechaza la hipótesis de un incremento del 10%. Si rellenas los datos observarás que ha subido un 11,1% de forma significativa.
Ejercicio 2:
Se desea establecer si la exigencia de ser libres de Leucosis Bovina para exportación en ganado lechero determinó un cambio en la prevalencia de esta enfermedad en una región. Para eso se tomaron dos muestras aleatorias de un banco de sueros. La primera correspondió a sueros extraídos entre 1970-1975 A y la segunda entre 1995-2000 B. En la muestra A de 144 sueros se encontraron 50 positivos y en la muestra B de 400 sueros se hallaron 188 positivos.
Mtra. A Elsa Retureta Álvarez 20
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Hay alguna evidencia de que esta política afecto la prevalencia de la enfermedad con un nivel de significación de 0.05.
Ejercicio 3:
De 2.000 empresas muestreadas aleatoriamente en el año 2002, 58 tenían alguna anomalía en sus cuentas auditadas en EE.UU. mientras que en 2000, de otra muestra de 2.500 empresas, 61 tenían algún error en la contabilización de sus cuentas. , ¿La proporción de empresas con algún error en sus cuentas auditadas en 2002, fue significativamente distinta que la proporción de ellas en el año 2000?
Para realizar el contraste, vamos a calcular un intervalo de confianza para la diferencia de proporciones de empresas con algún error en sus cuentas de los dos años para poder comprobar si la diferencia entre los dos años es significativa o no.
El intervalo de confianza para la diferencia de proporciones, a nivel del 95%, está entre 0,0049 y 0,0141. Esto parece apuntar a que el porcentaje de empresas que tiene alguna anomalía en sus cuentas contables no es significativamente diferente en los dos años.
El estadístico de contraste es z = 0,96 cuyo p-valor es 0,339 que al ser menor que el nivel de significación del 5%, el p-valor resulta coherente con la impresión anterior, por lo que no rechazaremos la hipótesis nula.
Ejercicio 4:
En un anuncio publicitario de discos duros para ordenador, el fabricante asegura que sus precios son más económicos y que el porcentaje de sus discos defectuosos es igual al de la competencia. Para contrastar esta última afirmación hemos tomado dos muestras aleatorias, cada una de ellas compuesta por 150 unidades. Los resultados obtenidos se muestran en la tabla siguiente:
Es inmediato comprobar que se cumplen los supuestos para este caso, por lo que pasaremos a calcular un intervalo de confianza del 95% para la diferencia entre proporciones y a realizar el correspondiente test de hipótesis:
El intervalo de confianza para la diferencia de proporciones, a nivel del 95%, tiene por extremos los valores positivos 0,003 y 0,117 (observar que no
Mtra. A Elsa Retureta Álvarez 21
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
contiene el valor 0, aunque por muy poco). Esto parece apuntar a que el porcentaje de defectos en los discos del anunciante es significativamente superior al porcentaje de la competencia. Para un nivel de significación del 0,05, el p-valor resulta coherente con la impresión anterior, por lo que resulta sensato rebatir la afirmación del anunciante (si bien las cosas cambiarían si tomásemos α = 0,01).
Ejercicio 5:
Oficiales escolares comparan el coeficiente intelectual entre niños de dos grupos.
De una muestra de 159 niños del grupo 1 78 califican con más de 100 puntos, de una muestra de 250 niños del grupo 2 123 califican con más de 100 puntos.
Construya un intervalo de confianza para la diferencia entre las dos proporciones del grupo 1 y 2 de los niños con califican con más de 100.
Mtra. A Elsa Retureta Álvarez 22
= - 2,55
50 + 188144 + 400= 0,4375
= 0,470= 0,347= 0,4375
= 0,5625
|Zc |> |Ztab|Rechazo Ho
1,96
Ho: P1=P2 H1: P1 = P2
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
q1 = 50.95%
q2 = 50.8%
P1 – P2=
Se puede concluir que no hay un grupo mejor que el otro en ambos casos
Ejercicio 6:
Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre la promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.
Solución:
Datos:
PH = 0.12PM = 0.10nH = 100nM = 100p(pH-pM 0.03) = ?
Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución binomial y se está utilizando la distribución normal.
Mtra. A Elsa Retureta Álvarez 23
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos 3% mayor que el de mujeres es de 0.4562.
Ejercicio 7:
Una encuesta del Boston College constó de 320 trabajadores de Michigan que fueron despedidos entre 1979 y 1984, encontró que 20% habían estado sin trabajo durante por lo menos dos años. Supóngase que tuviera que seleccionar otra muestra aleatoria de 320 trabajadores de entre todos los empleados despedidos entre 1979 y 1984. ¿Cuál sería la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o más?
Solución:
En este ejercicio se cuenta únicamente con una población, de la cual se están extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los porcentajes en esas dos muestras, por lo que se debe de utilizar la distribución muestral de proporciones con P1= P2, ya que es una misma población.
Otra de las situaciones con la cual nos topamos es que desconocemos la proporción de trabajadores despedidos entre 1979 y 1984 que estuvieron desempleados por un período de por lo menos dos años, sólo se conoce la p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observó esa proporción.
En la fórmula de la distribución muestral de proporciones para el cálculo de probabilidad se necesita saber las proporciones de las poblaciones, las
Mtra. A Elsa Retureta Álvarez 24
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
cuales en este ejercicio las desconocemos, por lo que se utilizará el valor de 0.20 como una estimación puntual de P. En el siguiente tema se abordará el tema de estimación estadística y se comprenderá el porque estamos utilizando de esa manera el dato.
También debe de comprenderse la pregunta que nos hace este problema, ¿cuál sería la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 5% o más?, la palabra difiera quiere decir que puede existir una diferencia a favor de la muestra uno, o a favor de la muestra dos, por lo que se tendrán que calcular dos áreas en la distribución y al final sumarlas.
Datos:
p1 = 0.20n1 = 320 trabajadoresn2 = 320 trabajadoresP1 = P2
Mtra. A Elsa Retureta Álvarez 25
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
La probabilidad de que su proporcion muestral de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de Boston College, en 0.05 o más es de 0.1260.
Ejercicio 8:
Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina:
a. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 2 rebase a la máquina 1 en por lo menos 0.10?
Solución:
Datos:
P1 = 3/6 = 0.5
P2 = 2/5 = 0.4
n1 = 120 objetos
n2 = 120 objetos
a. p(p2-p1 0.10) = ?
Otra manera de hacer este ejercicio es poner P1-P2:
Mtra. A Elsa Retureta Álvarez 26
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 10% a favor de la máquina 2 es de 0.0011.
Ejercicio 9:
Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina:
¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 1 rebase a la máquina 2 en por lo menos 0.15?
a. p(p1-p2
0.15)=?
Mtra. A Elsa Retureta Álvarez 27
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 15% a favor de la máquina 1 es de 0.2357.
Ejercicio 10:
Ejemplo 1. Una muestra de 87 mujeres trabajadoras profesionales mostró que la cantidad promedio que pagan a un fondo de pensión privado el 5% de su sueldo. Una muestra de 76 hombres trabajadores profesionales muestra que la cantidad que paga a un fondo de pensión privado es el 6.1% de su sueldo. Un grupo activista de mujeres desea demostrar que las mujeres no pagan tanto como los hombres en fondos de pensión privados. Si se usa alfa = 0.01 ¿Se confirma lo que el grupo activista de mujeres desea demostrar o no?
Paso 1. Determinar la hipótesis Nula “Ho” y Alternativa “Ha”.
Nótese que este problema es de una cola.
Ho: Lo que pagan las mujeres en el fondo de pensión es igual o mayor
a lo que pagan los hombres (algunos autores solo le colocan igual).
La hipótesis alternativa es lo que las mujeres del grupo activista desea demostrar.
Paso 2. Determinar el nivel de significancia. Definido por el analista,en este caso se desea usar α = 0.01
Gráficamente el nivel de significancia se distribuye en la curva de
Distribución normal tal como se muestra en la figura:
Mtra. A Elsa Retureta Álvarez 28
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Paso 3. Calcular los intervalos que implican ese nivel de significancia.
Para dicho nivel de significancia el valor de Z es: Z=-2.326
Gráficamente queda de la siguiente manera:
Mtra. A Elsa Retureta Álvarez 29
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
EJERCICIO 11:
Llamamos p1 a la incidencia de la osteoporosis en las mujeres de más de 50 años y p2 a la de los hombres. Calculemos un intervalo de confianza para la diferencia (p1 −p2). Si 0 no forma parte de dicho intervalo con una confianza del 95% podemos decir que p1 es diferente a p2 (con tal grado de confianza, por supuesto).
La estimación puntual insesgada que podemos hacer de ambos parámetros a partir de los datos muestrales son:
Es decir, Tenemos una confianza del 95% en la afirmación de que la diferencia entre la incidencia de osteoporosis en mujeres y hombres está entre 0,02 (2 %) y 0,18 (18 %).
Obsérvese que como 0% no es un valor de dicho intervalo puede concluirse con una confianza del 95% que hay diferente incidencia de osteoporosis en hombres que en mujeres para las personas de más de 50 años. Esta conclusión es algo más pobre de lo que hemos obtenido con el intervalo de confianza, pero visto de esta manera, este ejemplo puede considerarse como una introducción a los contrastes de hipótesis.
EJERCICIO 12:
Se considera cierto cambio en un proceso de fabricación de partes componentes. Se toman muestras del procedimiento existente y del nuevo para determinar si éste tiene como resultado una mejoría. Si se encuentra que 75 de 1500 artículos del procedimiento actual son defectuosos y 80 de 2000 artículos del procedimiento nuevo también lo son, encuentre un intervalo de confianza de 90% para la diferencia real en la fracción de defectuosos entre el proceso actual y el nuevo.
Mtra. A Elsa Retureta Álvarez 30
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Solución:
Sean P1 y P2 las proporciones reales de defectuosos para los procesos actual y nuevo, respectivamente. De aquí, p1=75/1500 = 0.05 y p2 = 80/2000 = 0.04. con el uso de la tabla encontramos que z para un nivel de confianza del 90% es de 1.645.
-0.0017<P1-P2<0.0217
Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo procedimiento producirá una disminución significativa en la proporción de artículos defectuosos comparado con el método existente.
EJERCICIO 13:
Un artículo relacionado con la salud, reporta los siguientes datos sobre la incidencia de disfunciones importantes entre recién nacidos con madres fumadoras de marihuana y de madres que no la fumaban:
Usuaria No Usuaria
Tamaño Muestral 1246 11178
Número de disfunciones
42 294
Proporción muestral 0.0337 0.0263
Encuentre el intervalo de confianza del 99% para la diferencia de proporciones.
Mtra. A Elsa Retureta Álvarez 31
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Solución:
Representemos P1 la proporción de nacimientos donde aparecen disfunciones entre todas las madres que fuman marihuana y definamos P2, de manera similar, para las no fumadoras. El valor de z para un 99% de confianza es de 2.58.
-0.0064<P1-P2<0.0212
Este intervalo es bastante angosto, lo cual sugiere que P1-P2 ha sido estimado de manera precisa.
Determinación de Tamaños de Muestra para Estimaciones
Al iniciar cualquier investigación, la primer pregunta que surge es: ¿de qué tamaño debe ser la o las muestras?. La respuesta a esta pregunta la veremos en esta sección, con conceptos que ya se han visto a través de este material.
Mtra. A Elsa Retureta Álvarez 32
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
EJEMPLO 14:
Mtra. A Elsa Retureta Álvarez 33
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
EJEMPLO 15:
En un proceso de producción de botellas de vidrio se tomó una muestra de 400 de las cuales 28 estaban defectuosas, en otro proceso se tomaran 300 muestra de botellas de la cuales 15 estaban defectuosas. Demuestre la hipótesis nula p1= p2 de que los dos procesos generan proporciones iguales de unidades defectuosas, contra la hipótesis alternativa p1 ≠ p2 con un nivel de significancia de 0.05.
Datos:
Pr oporcion . .1 .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . . Proporcion . . 2n1=400. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. ..n2=300
p1=28400
=0 .07 .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . p2=15300
=0 . 05
x1=28. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .x2=15
p=28+15400+300
=43700
=0 .061 , .. . .. .q=1−p=0 .939
El . .valor . .de . .Zα /2 ..al .. 0 . 05 .. . para . .una . .hipotesis . .alternativa ..bilateral . .es . .Zα /2=±1. 96
SOLUCIÓN: Para resolver este problema se plantearán las hipótesis y luego se aplica la formula.
Hipótesis:
H0 : p1=p2
H1 : p1≠p2
Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si
Zc<−Zα /2 ..o . .Zc>Zα /2 ,es decir, Zc<−1 .96 . . .o . . .Zc=1 . 96
.
Aplicando formula se tiene:
Zc=p1−p2
√ pq [ 1n1
+ 1n2
]= 0 . 07−0 . 05
√(0 . 061)(0 . 939 )[ 1400
+1
300 ]= 0 .02
√0 . 003334= 0 . 02
0 .0183→Zc=1. 09
Mtra. A Elsa Retureta Álvarez 34
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Conclusión: Como
Zc es menor que
Zα /2
, es decir,
Zc=1 . 09<1. 96
, se acepta
H0 : p1=p2
con un nivel de significancia de 0.05. Esto se puede observar en la
grafica A en donde
Zc=1 . 09
cae dentro del área de aceptación, por lo tanto, no se puede concluir que exista diferencias reales entre las dos proporciones verdaderas de unidades defectuosas.
EJEMPLO 16:
Un fabricante de productos medicinales esta probando dos nuevos compuestos destinados a reducir los niveles de presión sanguínea los compuestos son suministrados a dos conjuntos diferentes de animales de laboratorio. En el grupo A, 71 de 100 animales probados respondieron al medicamento A con niveles menores de presión arterial. En el grupo B, de 90 animales 58 respondieron al medicamento B con menores niveles de presión sanguínea. El fabricante desea probar a un nivel de significancia de 0.05 si existe una diferencia entre la eficiencia de las dos medicinas. ¿De qué manera se debe proceder en este caso?
SOLUCIÓN: Se plantean las hipótesis, se ordenan los datos y en la tabla
se busca el valor de Zα /2 al 5 % para una hipótesis alternativa bilateral que
según la tabla tienen un valor de Zα /2=±1 . 96
. Se plantean las reglas de decisión y finalmente se aplica la fórmula para el caso.
Datos:
Pr oporcion . . A . .. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . Pr oporcion ..Bn1=100 .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. .n2=90
p1=71100
=0. 71 .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . p2=5890
=0.644
x1=71 . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. x2=58
p=71+58100+90
=129190
=0. 6789 , .. .. . .q=1−p=0 .3211
El . .valor . .de . .Zα /2 ..al .. 0 . 05 .. . para . .una . .hipotesis . .alternativa ..bilateral . .es . .Zα /2=±1. 96 Hipótesis:
Mtra. A Elsa Retureta Álvarez 35
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
H0 : p1=p2
H1 : p1≠p2
Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si
Zc<−Zα /2 ..o . .Zc>Zα /2 ,es decir, Zc<−1 .96 . . .o . . .Zc=1 . 96
.
Aplicando formula se tiene:
Zc=p1−p2
√ pq [ 1n1
+ 1n2
]= 0 . 71−0 . 644
√(0 . 6789(0 . 3211) [ 1100
+1
90 ]= 0 . 066
√0 .0046= 0 . 066
0. 0678→Zc=0 . 973
Conclusión: Como
Zc es menor que
Zα /2
, es decir,
Zc=0 . 973<1 . 96
, se
acepta
H0 : p1=p2
con un nivel de significancia de 0.05. Esto se puede observar en
la grafica A en donde
Zc=0 . 973
cae dentro del área de aceptación, por lo tanto, se puede concluir que no exista diferencias significativas reales entre las dos medicamentos lo que indica que los dos medicamentos producen efecto en la presión sanguínea que son significativamente iguales.
EJEMPLO 17:
En un sondeo de opinión en el IUTJAA, 60 de 200 estudiantes del sexo masculino han expresado su disgusto sobre la forma de dirigir el tren directivo la institución, de la misma forma han opinado 75 de 300 alumnos del sexo femenino. Se quiere saber si existe una diferencia real de opinión entre los alumnos y las alumnas del IUTJAA. Para realizar el contraste de hipótesis de las proporciones utilice un nivel de significancia de 0.10.
SOLUCIÓN: Se plantean las hipótesis, se ordenan los datos y en la tabla se
busca el valor de Zα /2 al 5 % para una hipótesis alternativa bilateral que según
la tabla tienen un valor de Zα /2=±1 . 96
. Se plantean las reglas de decisión y finalmente se aplica la fórmula para el caso.
Mtra. A Elsa Retureta Álvarez 36
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Datos:
Pr oporcion . .1 .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . . Proporcion . . 2n1=200 . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. .n2=300x1=60. . .. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .x2=75
p1=60200
=0 .30 . .. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. p2=75300
=0 .25
p=60+75200+300
=135500
=0 . 27 , .. .. . .q=1−p=0 . 73
El . .valor . .de . .Zα /2 ..al .. 0 . 10. . . para ..una ..hipotesis . .alternativa ..bilateral . .es . .Zα /2=±1. 28
Hipótesis:
H0 : p1=p2
H1 : p1≠p2
Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si
Zc<−Zα /2 ..o . .Zc>Zα /2 ,es decir, Zc<−1 .96 . . .o . . .Zc=1 . 96
.
Aplicando formula se tiene:
Zc=p1−p2
√ pq [ 1n1
+ 1n2
]= 0 .30−0 . 25
√(0 . 27 )(0.73 )[ 1200
+1
300 ]= 0 . 05
√0 . 001636= 0. 05
0.04045→Zc=1 .24 .
Conclusión: Como
Zc es menor que
Zα /2
, es decir,
Zc=1 .24<1 .28
, se acepta
H0 : p1=p2
con un nivel de significancia de 0.10. Esto se puede observar en la
grafica B en donde
Zc=1 .24
cae dentro del área de aceptación, por lo tanto, se
Mtra. A Elsa Retureta Álvarez 37
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
puede concluir que no exista diferencias significativas reales entre las dos opiniones emitidas por los alumnos y alumnas lo que indica que los dos opiniones están en concordancia de que los directivos están dirigiendo mal a la institución.
EJEMPLO 18:
En el Departamento de Agropecuaria del IUTJAA se investiga si cierto tipo de fertilizante es efectivo. Para ello se deja sin fertilizar 100 plantas de tomate y de esas, 52 plantas tienen un crecimiento satisfactorio. De la misma forma se fertilizaron 400 plantas, y se detecto que 275 presentaron un crecimiento satisfactorio. ¿Qué conclusión pueden obtener los investigadores del Departamento de Agropecuaria si para contrastar la hipótesis utilizan un nivel de significancia de 0.05?
SOLUCIÓN: Se plantean las hipótesis la cual tendría como hipótesis
alternativa H1 : p1≠p2 ; luego se ordenan los datos y en la tabla se busca el
valor de Zα /2 al 5 % para una hipótesis alternativa bilateral. Se plantean las
reglas de decisión y finalmente se aplica la formula para el caso.
Datos:
Pr oporcion . .1 .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . . Proporcion . . 2n1=100 .. . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. .n2=400x1=52 . .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. . .. .. . .. .. . .. .. x2=275
p1=52100
=0. 52 .. .. . .. .. . .. .. . .. .. . .. .. .. . .. .. . .. .. p2=275400
=0 . 6875
p=52+275100+400
=327500
=0 .654 , .. .. ..q=1−p=0 . 346
El . .valor . .de . .Zα /2 ..al .. 0 . 05 .. . para . .una . .hipotesis . .alternativa ..bilateral . .es . .Zα /2=±1. 96
Hipótesis:
H0 : p1=p2
H1 : p1≠p2
Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si
Zc<−Zα /2 ..o . .Zc>Zα /2 , es decir, Zc<−1 .96 . . .o . . .Zc>1 . 96
.
Mtra. A Elsa Retureta Álvarez 38
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Aplicando formula se tiene:
Zc=p1−p2
√ pq [ 1n1
+ 1n2
]= 0. 52−0 . 6875
√(0 . 654 )(0 .346 )[ 1100
+1
400 ]=− 0 . 1675
√0 . 0028=− 0. 17
0. 0533→Zc=−3 .19 .
Conclusión: Como
Zc es menor que
Zα /2
, es decir,
Zc=−3 . 19<−1 .96
, se
rechaza
H0 : p1=p2
con un nivel de significancia de 0.05. Esto se puede observar
en la grafica B en donde
Zc=−3 . 19
cae fuera del área de aceptación, por lo tanto,
H1 : p1≠p2
se puede concluir que exista diferencias significativas reales entre el crecimiento de las plantas, por lo que hay razones para creer que el fertilizante sea realmente efectivo.
Ejercicio 19:
En una muestra aleatoria de 85 soportes para el cigüeñal de un motor de automóvil, 10 tienen un terminado que es más rugoso de los que las especificaciones permiten. Supóngase que se hace una modificación al proceso de acabado de la superficie y que, de manera subsecuente, se toma una segunda muestra de 85 ejes. El número de ejes defectuosos en esta segunda muestra es de 8. Obtengase un intervalo de confianza del 95% para la diferencia en la proporción de los soportes defectuosos producidos por ambos procesos y pruebe la hipótesis de que la proporción de soportes defectuosos producidos por ambos procesos es la misma.
Solución.
Mtra. A Elsa Retureta Álvarez 39
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
De lo observado en las muestras se obtiene que y
. El interés es la diferencia en la proporción de los
soportes defectuosos entre :
Un intervalo de confianza del 95% para la diferencia en la resistencia a la tensión promedio es:
Este intervalo de confianza incluye al cero, así que, con base en los datos muestrales, parece poco probable que los cambios hechos en el proceso de acabado de la superficie hayan reducido el número de soportes defectuosos para cigüeñal producidos por el proceso.
Si se utiliza el estadístico presentado en (1), se encuentra:
Rechazandose tambien la hipótesis nula, por lo tanto se concluye que los cambios hechos en el proceso de acabado de la superficie no han reducido el número de soportes defectuosos para cigüeñal producidos por el proceso.
Ejercicio 20:
Mtra. A Elsa Retureta Álvarez 40
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Continuando con la investigación sobre tabaquismo, desea contrastarse si fuman más las chicas que los chicos. Se toma una muestra de 20 chicas y se encuentra que fuman 12. En una muestra de 18 chicos fuman 8.
Realizar el contraste con α=0,01.
1. Hipótesis
H0: π1 ≤ π2
H1: π1 > π2
2. Supuestos
Muestra aleatoria
π1 y π2 constantes en cada extracción
3. Estadístico de contraste
n1 = 20; P1 = 12/20 = 0,60
n2 = 18; P2 = 8/18 = 0,44
Mtra. A Elsa Retureta Álvarez 41
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
4. Zona crítica: Z ≥ 0,99z = 2,33
5. Decisión: Mantener H0. No puede concluirse que las chicas fuman más.
- BIBLIOGRAFIA -
CONTRASTE DE HIPÓTESIS DE DOS POBLACIONES
Autores: Ángel A. Juan (ajuanp@uoc.edu), Máximo Sedano (msedanoh@uoc.edu), Alicia Vila
(avilag@uoc.edu), Anna López (alopezrat@uoc.edu)
EJERCICIOS RESUELTOS DE ESTADÍSTICA IIRESUMEN DE EJERCICIOS DADOS EN CLASES – PARTE II
POR:
EILEEN JOHANA ARAGONES GENEY
UNIVERSIDAD DE CARTAGENA
PROGRAMA DE ADMINISTRACIÓN INDUSTRIAL CARTAGENA
PRIMER SEMESTRE DE 2008
Estadística Inferencial 3.6. Prueba para diferencia de proporcionesElaboró: MC. Marcel Ruiz Martínez
Mtra. A Elsa Retureta Álvarez 42
ESTADISTICA INFERENCIALPLANTEAMIENTO DE HIPOTESIS EN DOS POBLACIONES
PARA LA PROPORCIÓN
Levin, Richard I. Estadística para Administradores, Ed. Prentice Hall, Segunda Edición, México 1987.
www.itescam.edu.mx/principal/sylabus/fpdb/.../r16639.DOC
Mtra. A Elsa Retureta Álvarez 43
top related