estadística administrativa ii 2015-1 usap 1. estadística no paramétrica pruebas de hipótesis no...
Post on 22-Jan-2016
232 Views
Preview:
TRANSCRIPT
1
Estadística Administrativa II
2015-1
USAP
Estadística no paramétrica
2
Estadística no paramétrica
Pruebas de hipótesis no solamente pueden estar distribuidas normalmente o
ser numéricas; también pueden ser nominales sino que su distribución puede
no ser normal.
3
Chi-cuadradaji-cuadrada
-cuadrada
𝜒2=∑ ( 𝑓 𝑜− 𝑓 𝑒 )2
𝑓 𝑒
4
Característicasa) Valores no negativos: Al elevar al cuadrado la
variación entre la frecuencia observada y la frecuencia esperada, el resultado siempre es positivo.
b) Familia de distribuciones: Al contar variables con múltiples tipos de valores, las gráficas resultantes son variadas tanto en la forma como en la altura. Debido a los múltiples valores que puede tomar, se trabaja con k-1 grados de libertad para darle un mejor ajuste a los resultados de la prueba de hipótesis.
c) Sesgada por la derecha: tiene sesgo positivo, porque se puede concluir que los valores están concentrados en los valores menores y dispersos en los mayores.
5
Característica de chi-cuadrada
6
Ejemplo . . .
En una encuesta sobre el comportamiento del consumidor se obtuvieron los siguientes resultados.
Resultados EncuestasMe gusta 10No me gusta 20Sin comentarios 30
Si las respuestas se esperaban de manera uniforme, calcular el valor de chi-cuadrada.
60
7
. . . Ejemplo
Se aplicaron 60 encuestas; por lo que se esperaba que cada respuesta tendría un total uniforme; es decir, 20 por cada característica de la variable.
ResultadosEncuestas
fo
Pronósticofe
Me gusta 10 20No me gusta 20 20Sin comentarios 30 20
60 60
10 - 20 = -1020 - 20 = 030 - 20 = 10
f0 - fe (f0 - fe)2
1000
100
8
. . . Ejemplo
Se aplicaron 60 encuestas; por lo que se esperaba que cada respuesta tendría un total uniforme; es decir, 20 por cada característica de la variable.
ResultadosEncuestas
fo
Pronósticofe
Me gusta 10 20No me gusta 20 20Sin comentarios 30 20
60 60
505
10
� െ�� ଶ
�
𝜒2=10
9
Prueba de bondad de ajuste
En una investigación cualitativas, las variables no son numéricas; pero, las frecuencias si lo son. Se hace el conteo de los resultados obtenidos y se asume que se esperaba que todas las respuestas fueran iguales.
Para determinar si los resultados son similares o no, se recurre a la prueba de hipótesis, para comprobar si existen diferencia o no entre lo observado y lo esperado.
10
Prueba de bondad de ajusteFrecuencia esperadas iguales
Una vez definida la cantidad de encuestas a aplicar, se definen las características de las variables y al
dividir el tamaño de la muestra entre la cantidad esperada se asume que será la cantidad que se espera para
cada una de ellas.
11
Ejemplo . . .
Un supermercado va a levantar una encuesta para determinar preferencia de los clientes con relación a la venta del refresco Coca Cola. Se tomará una muestra de 1000 internautas y las características a evaluar son:• Lata• Botella pequeña• Envase de 1.5 litros• Envase de 2.0 litros• Envase de 3.5 litros
12
Ejemplo . . .• Calcular la frecuencia esperada
NIVEL DE PREFERENCIAFRECUENCIA OBSERVADA
LataBotella pequeñaEnvase de 1.5 litrosEnvase de 2.0 litrosenvase de 3.5 litros
Total … 1,000
FRECUENCIA ESPERADA
200 200 200 200 200
1,000
13
Prueba de hipótesis con
1. Establecer la hipótesis nula y alternativa
2. Seleccionar un nivel de significancia
3. Seleccionar el estadístico de prueba
4. Formular la regla de decisión
5. Tomar una decisión
14
Ejemplo . . .
La gerente de marketing de un fabricante de tarjetas deportivas planea iniciar la venta de una serie de tarjetas deportivas con fotografías y estadística de juego de la liga nacional. Uno delos problemas es la selección de exjugadores. En una exhibición de tarjetas de futbol en el Estadio Morazán el pasado fin de semana se instaló un puesto y ofreció tarjetas de Danilo Toselo, Carlos Pavón, Carlo Costly, Diego Vásquez, Wilmer Velásquez y Rambo de León. Al final del día vendió 120 tarjetas. El número de tarjetas vendidas de cada jugador es la siguiente:
15
. . . Ejemplo
# JugadorTarjetas
Vendidas1 Danilo Toselo 132 Carlos Pavón 333 Carlo Costly 144 Diego Vásquez 75 Wilmer Velásquez 366 Rambo de León 17
Si la importancia de los jugadores es similar, debería haberse vendido la misma cantidad de cada uno de ellos; sin embargo, podría suceder que el muestreo haya generado un sesgo; pero, que la población sí mantenga las mismas preferencias.
¿Se puede determinar que hay diferencia entre las tarjetas vendidas y las esperadas, con un nivel de significancia del 5%?
16
. . . Ejemplo
1. Hipótesis nula y alternativa
2. Nivel de significancia
3. Estadístico de prueba
𝜒2=∑ ( 𝑓 𝑜− 𝑓 𝑒 )2
𝑓 𝑒
17
. . . Ejemplo
4. Regla de decisión
𝜒2=11.070Valor crítico
18
. . . Ejemplo5. Toma de decisión
— Sumar las frecuencias de las tarjetas divididas entre el total de jugadores para obtener la frecuencia esperada para cada uno de ellos y agregar un columna con estos resultados.
# JugadorTarjetas
VendidasPronóstico
1 Danilo Toselo 13 202 Carlos Pavón 33 203 Carlo Costly 14 204 Diego Vásquez 7 205 Wilmer Velásquez 36 206 Rambo de León 17 20
Total tarjetas 120 120
19
. . . Ejemplo— Calcular el cociente entre la
variación cuadrada y la frecuencia esperada.
𝜒2=∑ ( 𝑓 𝑜− 𝑓 𝑒 )2
𝑓 𝑒
# Jugador
Tarjetas Vendidas
fo
Pronósticofe
1 Danilo Toselo 13 20 13 - 20 = -72 Carlos Pavón 33 20 33 - 20 = 133 Carlo Costly 14 20 14 - 20 = -64 Diego Vásquez 7 20 7 - 20 = -135 Wilmer Velásquez 36 20 36 - 20 = 166 Rambo de León 17 20 17 - 20 = -3
Total tarjetas 120 120
f0 - fe (f0 - fe)2
49169
36169256
9
2.458.45
1.88.4512.80.4534.4
� െ�� ଶ
�
𝜒2=34.4La hipótesis nula se rechaza.Se puede concluir que sí hay diferencia entre las tarjetas vendidas y las tarjetas pronosticas.
20
Prueba de bondad de ajusteFrecuencia esperadas desiguales
Una vez definida la cantidad de encuestas a aplicar y teniendo la
ponderación de cada característica, se calcula la frecuencia esperada, multiplicando el total de la muestra
por cada ponderación.
21
Ejemplo . . .Una empresa que renta buses de tamaño mediano para excursiones, ha determinado que el 60% es en escuelas primarias, 30% alumnos de secundaria y el resto para asociaciones de adultos. Se va a tomar una muestra de 250, calcular el valor esperado por cada tipo de cliente.
DESCRIPCIÓNFRECUENCIA OBSERVADA
FRECUENCIA ESPERADA
Escuelas primarias 150 60%Escuelas secundarias 75 30%Asociaciones 25 10%
Total … 250 250 100%
22
Prueba de hipótesis con
1. Establecer la hipótesis nula y alternativa
2. Seleccionar un nivel de significancia
3. Seleccionar el estadístico de prueba
4. Formular la regla de decisión
5. Tomar una decisión
23
Ejemplo . . .Según las políticas de una aseguradora, las atenciones en los hospitales para el ingreso de los adultos mayores en el período de un año, tiene el siguiente comportamiento.
40% no requiere hospitalización
30% es hospitalizado una vez
20% es hospitalizado dos veces
10% es hospitalizado 3 o más veces
Una encuesta de 150 adultos mayores, miembros de la aseguradora reveló que:
55 no requirieron hospitalización
50 fueron admitidos una vez
32 fueron admitidos dos veces
13 fueron admitidos tres o más veces
Con un nivel de significancia de 0.05, probar si es posible que los resultados sean congruentes con las ponderaciones.
24
. . . Ejemplo
1. Hipótesis nula y alternativa
2. Nivel de significancia
3. Estadístico de prueba
𝜒2=∑ ( 𝑓 𝑜− 𝑓 𝑒 )2
𝑓 𝑒
25
. . . Ejemplo
4. Regla de decisión
𝜒2=7.815Valor crítico
26
. . . Ejemplo
5. Toma de decisióna) Construcción de tabla de frecuencias
observadas y la ponderación
27
. . . Ejemplo
5. Toma de decisiónb) Frecuencias esperadas
28
. . . Ejemplo
5. Toma de decisiónc) Calcular chi-cuadrada
𝝌𝟐 = 𝟏.𝟑𝟕𝟐
𝜒2=1.372 La hipótesis nula se acepta.
No hay diferencia entre los que son hospitalizados y los que no.
29
Tablas de contingencia
distribución de frecuencias formada por dos variables cualitativas, también conocidos como datos bivariados o
variables cruzadas.
30
Tabla de contingencia
Una tabla de contingencia provee información variada, puesto que, proporciona datos en forma conjunta y en forma individual para cada variable, todo con una misma muestra.
31
Ejemplo . . .
En una investigación sobre los gustos de las personas en la prueba de un nuevo jugo combinado, se hizo diferencia entre las respuestas de los clientes del sexo femenino con las del masculino. Se encuestaron 100 personas que proporcionaron las siguientes respuestas:
Masculino FemeninoMuy bueno 20 15 35Bueno 15 17 32Regular 18 8 26Indecisto 5 2 7
Totales … 58 42 100
SABOR DEL JUGO
GÉNERO Total
32
. . . Ejemplo
De los 100, a 35 de ellos les pareció muy bueno el sabor y solamente 7 se mostraron indecisos.
Se encuestó a 58 hombres y 42 mujeres de forma aleatoria.
15 de las mujeres opinaron que el sabor es muy bueno.
Masculino FemeninoMuy bueno 20 15 35Bueno 15 17 32Regular 18 8 26Indeciso 5 2 7
Totales … 58 42 100
SABOR DEL JUGO GÉNERO Total
33
Tabla de contingencia y chi-cuadrada
En una investigación con variables cruzadas, se analizan, mínimo, dos variables a las cuales se les
calculará el valor de chi-cuadrada tomando de base una ponderación definida que pueden ser iguales o
diferentes.
34
Tabla de contingencia y chi-cuadrada
fo fe fo fe
Característica 1Característica 2Característica 3
Totales … 100 100 200 200 300
VARIABLE 1VARIABLE 2
Carácterística 1 TotalCaracterística 2
35
Ejemplo . . .En una investigación piloto, con relación a la percepción de los consumidores sobre el sabor de un nuevo jugo que se quiere lanzar al mercado, se esperaba que el 60% contestara uniformemente que lo encontraba muy bueno o bueno, y que el resto lo encontrara regular o estuviera indeciso. Calcular el valor de chi-cuadrada para la distribución obtenida:
Masculino FemeninoMuy bueno 20 15 35Bueno 15 17 32Regular 18 8 26Indecisto 5 2 7
Totales … 58 42 100
SABOR DEL JUGO
GÉNERO Total
36
. . . EjemploA cada dato se le multiplica su respectivo porcentaje para determinar el valor esperado por cada columna.
Muy bueno 35 30%Bueno 32 30%Regular 26 20%Indeciso 7 20%
Totales … 100 100%
SABOR DEL JUGO
Total Porcentajes
SABOR DEL JUGOMasculino
fo fe
Muy bueno 20 17.4Bueno 15 17.4Regular 18 11.6Indeciso 5 11.6
Totales … 58 58.0
SABOR DEL JUGOFemenino
fo fe
Muy bueno 15 12.6Bueno 17 12.6Regular 8 8.4Indeciso 2 8.4
Totales … 42 42.0
37
. . . EjemploCalcular los valores previos a chi-cuadrada para cada uno de los géneros.
SABOR DEL JUGOMasculino
fo fe (fo - fe)2
Muy bueno 20 17.4 6.76 0.3885 Bueno 15 17.4 5.76 0.3310 Regular 18 11.6 40.96 3.5310 Indeciso 5 11.6 43.56 3.7552
Totales … 58 58.0 8.0057
� െ�� ଶ
�
SABOR DEL JUGOFemenino
fo fe (fo - fe)2
Muy bueno 15 12.6 5.76 0.4571 Bueno 17 12.6 19.36 1.5365 Regular 8 8.4 0.16 0.0190 Indeciso 2 8.4 40.96 4.8762
Totales … 42 42.0 6.8889
� െ�� ଶ
�
38
. . . EjemploCalcular chi-cuadrada sumando los valores totales obtenidos por cada característica
𝜒2=14.895
39
Análisis de tablas de contingencia
Es probar la hipótesis utilizando chi-cuadrada como estadístico de prueba.
𝜒2
40
Análisis de tablas de contingencia
• Existen investigaciones en las cuales se desea conocer el comportamiento con poblaciones que trabajan en conjuntos interceptados. Esta clasificación tiene como base la escala nominal debido a que no hay un orden natural para las clasificaciones.
• El estadístico ji cuadrada es útil para probar de manera formal si hay una relación entre dos variables con escala nominal. En otras palabras, ¿es independiente una variable de la otra?
41
Regla de decisión
42
Ejemplo . . .1Una organización no gubernamental que trabaja con proyectos de inserción del privado de la libertad está investigando si los que recuperan su libertad tienen un mejor nivel de readaptación a la vida civil cuando lo hacen en la localidad que vivieron o en otra localidad que no conocen de antemano; es decir, Con una confiabilidad del 99%, ¿Hay una relación entre la adaptación a la vida civil en su localidad conocida o en una desconocida según los datos
obtenidos en el 2013?
En una encuesta realizada por psicólogos a 200 personas, 120 de las cuales residían en su localidad natal y 80 en otra localidad, se obtuvieron se los siguientes resultados:
43
. . . Ejemplo
Tomar como base la ponderación del total según el tipo de residencia.
Sobresaliente Buena Regular InsatisfactoriaLocalidad natal 27 35 33 25 120En otra localidad 13 15 27 25 80Total 40 50 60 50 200
Residencia depués de salir
Adaptación a la vida civil Total
Localidad natal 120 120 / 200 = 0.6 60%En otra localidad 80 80 / 200 = 0.4 40%Total 200 1.0 100%
Residencia depués de salir
Total Ponderación %
44
. . . Ejemplo
1. Hipótesis nula y alternativa
2. Nivel de significancia
3. Estadístico de prueba
𝜒2=∑ ( 𝑓 𝑜− 𝑓 𝑒 )2
𝑓 𝑒
45
. . . Ejemplo
4. Regla de decisión1
𝜒2=11.345Valor crítico
46
. . . Ejemplo
5. Toma de decisióna) Construcción de tabla de frecuencias
observadas y frecuencia esperada para cada columna
47
. . . Ejemplo
5. Toma de decisióna) Construcción de tabla de frecuencias
observadas y frecuencia esperada para cada columna
48
. . . Ejemplo5. Toma de decisión
b) Calcular las variaciones cuadradas de cada columna y sumar los resultados.
49
. . . Ejemplo5. Toma de decisión
b) Calcular las variaciones cuadradas de cada columna y sumar los resultados.
50
. . . Ejemplo5. Toma de decisión
c) Sumar la sumatoria de cada columna para obtener el valor de chi-cuadrada
𝜒2=5.7292La hipótesis nula se acepta.No hay evidencia de una diferencia entre la adaptación después de salir de prisión.
51
Fin de lapresentación
Muchas gracias
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística Aplicada a los Negocios y la Economía. México: McGrawHill
David M. Levine, Timothy C. Krehbiel, Mark L. Berenson. 2006. Estadística para Administración. (4° edición). Naucalpan de Juárez, México.: Pearson Prentice Hall
top related