análisis de varianza prueba de tukey
TRANSCRIPT
![Page 1: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/1.jpg)
Análisis de varianza
Prueba de Tukey
Lic. Carmen Chacón de Isla, MEd.Lic.José Luis Isla Corrales, MSc.
![Page 2: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/2.jpg)
Una factoría de motores tiene 2 proveedores de los cigüeñales que motoriza.
Un tercer proveedor ofrece sus cigüeñales algo más caros, argumentando sus mejores propiedades dinámicas, concretamente que su equilibrado dinámico es menor.
La factoría decide hacer una prueba comparando 10 cigüeñales del nuevo proveedor (código 1) con 10 cigüeñales de cada uno de sus 2 proveedores tradicionales (códigos 2 y 3)
Los resultados obtenidos se recogen en la siguiente tabla:
![Page 3: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/3.jpg)
Factor estudiado (solo uno) PROVEEDOR
Variantes del factor (3) (1) (2) (3)
Resultados obtenidos
(equilibrado dinámico en grs.)
23 35 50
28 36 43
21 29 36
27 40 34
95 43 45
41 49 52
37 51 52
30 28 43
32 50 44
36 52 34
![Page 4: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/4.jpg)
Cuestión clave:
¿Hay evidencia suficiente respecto a la superioridad de los cigüeñales del nuevo proveedor para cambiar a éste, pese al precio ligeramente más elevado?
![Page 5: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/5.jpg)
Diseño experimental
Este ejemplo es un caso particular de diseño experimental en el que se estudia el efecto de un único factor (variable independiente): el proveedor, con 3 variantes (los 3 proveedores a comparar) sobre la media de la variable respuesta (dependiente): el equilibrado dinámico, que debe ser el menor posible.
![Page 6: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/6.jpg)
¿Cómo analizar los datos?
Dado que conocemos una técnica estadística para comparar dos tratamientos (t de Student) ¿no será posible analizar los datos anteriores comparando dos a dos las tres parejas posibles de proveedores?
![Page 7: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/7.jpg)
¿Cómo analizar los datos?
Si en vez de tratarse de 3, hubiera 5 proveedores,
¿Cuántas parejas de tratamientos habría que comparar?
Suponiendo que los 5 proveedores fueran idénticos y si en cada comparación se operase con un riesgo de error de 5% ¿la probabilidad de obtener una conclusión errónea (deducir que al menos dos de los proveedores son distintos) sería del 5%?
![Page 8: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/8.jpg)
¿Cómo analizar los datos?
Analizar los resultados de este tipo de experimento comparando 2 a 2 todas las parejas posibles de tratamientos NO ES RECOMENDABLE porque:
1. Es muy laborioso
2. Se incrementa la probabilidad global de cometer un error estadístico de tipo I (resultado falso positivo: se rechaza Ho siendo ésta verdadera)
![Page 9: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/9.jpg)
¿Cómo analizar los datos?
En casos como éste, la técnica más adecuada es el Análisis de Varianza (ANOVA, en inglés)
![Page 10: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/10.jpg)
ANOVA Se utiliza:
Con variables cuantitativas
Cuando existen más de dos grupos
Para comparar medias mediante el análisis de sus varianzas
Supone que:
existe distribución normal en cada uno de los grupos
existe homogeneidad de varianzas en los grupos
los grupos son totalmente independientes
![Page 11: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/11.jpg)
ANOVA
Se plantean hipótesis:
Ho (nula): las medias de los grupos son iguales
Ha (alterna): No todas las medias de los grupos son iguales. Al menos una de las medias es distinta
![Page 12: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/12.jpg)
ANOVA
La idea de ANOVA es descomponer la VARIABILIDAD TOTAL de los datos en:
La variabilidad debida a la diferencia ENTRE LOS TRATAMIENTOS O GRUPOS y
La variedad residual, debida a la diferencia DENTRO DE LOS TRATAMIENTOS O GRUPOS (también llamada ERROR)
![Page 13: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/13.jpg)
Cuantificación de la variabilidad
Variabilidad TOTAL de los datos
Variabilidad ENTRE los grupos
Variabilidad DENTRO de los grupos (error)
= +
Suma de cuadrados TOTAL (SCT)
Suma de cuadrados ENTRE grupos(SCE)
Suma de cuadrados DENTRO de los grupos(SCD)
![Page 14: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/14.jpg)
PROVEEDOR
(1) (2) (3)
23 35 50
28 36 43
21 29 36
27 40 34
95 43 45
41 49 52
37 51 52
30 28 43
32 50 44
36 52 34
CÁLCULOS TOTALES:∑X = 370 + 413 + 433 = 1216∑x2 = 17778 + 17801 + 19175 = 54754Factor de corrección (C)= (∑x)2/n
C = (1216)2 /30 = 49288,53VARIACIÓN TOTALSCT= ∑x2 – C = 54754 - 49288,53 = 5465,47Grados de Libertad GLT = 30 – 1 = 29
VARIACIÓN ENTRE LOS GRUPOSSCE= (370)2/10 + (413)2/10 + (433)2/10 – 49288,53 =
= 207,27Grados de Libertad GLE = 3 – 1 = 2
VARIACIÓN DENTRO DE LOS GRUPOS (Error)SCD = SCT – SCESCD = 5465,47 – 207,27 = 5258,20Grados de Libertad GLD = GLT – GLE
GLD = 29 – 2 = 27
∑X1 =370 ∑x2=413 ∑x3=433
1 = 37 2 = 41,3 3 = 43,3
![Page 15: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/15.jpg)
Cuadro resumen de ANOVAFUENTE DE VARIACION Suma de
CuadradosGrados
de Libertad
Cuadrados medios
F
Entre los grupos 207,27 2 103,635 0,532
Dentro de los grupos 5258,20 27 194,748
TOTAL 5465,20 29
Valor es críticos para F:Tabla: G.L. para cuadrado medio mayor: 2
G.L para cuadrado medio menor : 275% = 3,351% = 5,49
El valor encontrado para F es mucho menor. Se aprueba Ho. Las diferencias NO son significativasLos cigüeñales del nuevo proveedor no son superiores a los otros
![Page 16: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/16.jpg)
![Page 17: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/17.jpg)
![Page 18: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/18.jpg)
ANOVA en Excel
Se escribe la Tabla de datos en una página ExcelPueden calcularse diferentes parámetros como ∑x, medias, ∑x2, valiéndose de las fórmulas del programa
![Page 19: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/19.jpg)
ANOVA en Excel
Se busca la pestaña DATOS y en ella se abre Análisis de Datos (si no aparece este complemento será necesario instalarlo previamente)Se selecciona el tipo de análisis que se desea; en nuestro caso, Análisis de varianza de un factor.
![Page 20: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/20.jpg)
ANOVA en Excel
Para el Rango de entrada, seleccionar solamente los datos de la TablaAlfa es el nivel de significación escogido (5%)Se puede seleccionar una hoja nueva para el resultado del análisis . Click en Aceptar
![Page 21: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/21.jpg)
ANOVA en Excel: Resultado
![Page 22: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/22.jpg)
ANOVA en Excel: Resultado
El valor de F es mucho menor que el valor crítico registrado en las tablas para el nivel de significación 0,05 (5%)
La probabilidad de que las diferencias entre las medias sean debidas al azar es de 0,5934 (59,34%). Se aprueba la Hipótesis Nula (Ho)
El equilibrado dinámico de los cigüeñales del proveedor (1) no difieren significativamente respecto a los de los proveedores tradicionales
![Page 23: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/23.jpg)
Otro ejemplo de ANOVA
Se tienen las edades de tres grupos de personas
¿Existe diferencia estadísticamente significativa en el promedio de edad entre los tres grupos?
Planteamos las hipótesis:
o Hipótesis nula (Ho): El promedio de edad de los tres grupos es igual, con 95% de probabilidad
o Hipótesis alterna: Al menos en un grupo el promedio de edad es distinto, con un 95% de confiabilidad.
![Page 24: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/24.jpg)
Otro ejemplo de ANOVA
Se trata de un análisis de varianza de un solo factor
Utilizamos el programa EXCEL para realizar el análisis
Procedemos como en el caso anterior, escribiendo la tabla de datos en una hoja de cálculo
Se busca la pestaña DATOS y en ella se abre Análisis de Datos
![Page 25: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/25.jpg)
Otro ejemplo de ANOVASeleccionamos la pestaña Análisis de varianza de un factor
![Page 26: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/26.jpg)
Otro ejemplo de ANOVA
Seleccionamos los datos en el rango de entrada
Escogemos una nueva hoja en las opciones de salida
![Page 27: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/27.jpg)
Otro ejemplo de ANOVA
Este es el resultado:
![Page 28: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/28.jpg)
Otro ejemplo de ANOVA: Resultados
![Page 29: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/29.jpg)
Otro ejemplo de ANOVA:Conclusiones: La prueba nos arroja el resultado de un valor de F que
supera el valor crítico que aparece en las tablas para un nivel de significancia de 0,05 (5%)
Esto significa que la hipótesis nula es falsa: las diferencias entre las medias de los tres grupos no son aleatorias.
Al menos una muestra de las tres tiene un promedio diferente. Pero ¿cómo saber cuál o cuáles son las medias que difieren significativamente entre sí?
Existe una prueba que nos dará respuesta a esta pregunta: PRUEBA DE TUKEY
![Page 30: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/30.jpg)
Prueba de Tukey
En esta prueba se determina las diferencias entre las medias de las muestras y se comparan con una denominada “Diferencia honestamente significativa” (HSD), que se calcula mediante la siguiente fórmula:
Multiplicador: valor obtenido en la Tabla Tukey (Valor Qa)
MSe: Cuadrado medio de error (media cuadrática DENTRO de los grupos)
n: tamaño de la muestra en los grupos.
![Page 31: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/31.jpg)
Prueba de Tukey
El “multiplicador” o valor de alfa (a) se busca en la Tabla Q de rangos studentizados, en la intersección entre la fila de G.L. de la variación DENTRO de los grupos (error) y la columna correspondiente al número de grupos o tratamientos.
En nuestro caso, los G.L. son 72 y el número de grupos, 3. En la Tabla de Q se consigue la fila de 60 G.L. y luego pasa a 120. Cuando el número que se busca no aparece en la Tabla, se selecciona el inmediatamente superior. En este caso, tomamos el valor de la fila de 120 G.L. con la columna 3, obteniendo a = 3,36
![Page 32: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/32.jpg)
Prueba de Tukey
![Page 33: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/33.jpg)
Prueba de TukeyUtilizando los datos obtenidos del análisis de varianza en Excel, calculamos HSD (Diferencia Honestamente Significativa ,también denominada Mínima Diferencia Significativa)
![Page 34: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/34.jpg)
Prueba de Tukey• En la misma Hoja Excel se procede a determinar las diferencia entre las medias de las muestras• La diferencia entre la media de la muestra A y la de la muestra B: 39,92 –28,88 = 11,04• Diferencia entre la media de A y media de C: 39,92 – 29 = 0,92.• Entre las medias de B y C: 28,88 - 39 = -10,12• Si comparamos estas diferencias con HSD, observamos que dos diferencias superan esa diferencia mínima significativa (sin importar el sign0)
![Page 35: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/35.jpg)
ANOVA de dos factores
En esta tabla se expresan las puntuaciones (de 1 a 9) otorgadas por seis jueces en un panel de degustación sensorial a cuatro muestras de salsa picante. Se desea saber si las diferencias registradas entre las muestras es realmente significativa o se deben al azar.Hipótesis nula: Las diferencias observadas entre las muestras son aleatoriasHipótesis alterna: Al menos hay una salsa que es diferente a las otras en su sabor picante.
SABOR PICANTE
Juez Salsa 1 Salsa 2 Salsa 3 Salsa 4
A 9 3 5 1
B 7 6 4 1
C 7 4 3 2
D 9 3 3 2
E 7 7 8 5
F 9 8 3 1
![Page 36: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/36.jpg)
ANOVA de dos factores
Seleccionamos ANOA de dos factores con una sola muestra por grupo
![Page 37: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/37.jpg)
ANOVA de dos factores
![Page 38: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/38.jpg)
ANOVA de dos factores: resultados
Hay dos valores de F: uno compara las varianzas entre los Jueces (filas) y otro entre las Salsas (columnas)
El primer valor de F (1,536) no supera el valor crítico (2,901), lo que significa que la variación entre los jueces no es significativa, sino aleatoria.
El segundo valor (36,819) supera ampliamente el valor crítico (3,287), indicando que existe una diferencia significativa en la variación respecto a las salsas
![Page 39: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/39.jpg)
![Page 40: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/40.jpg)
ANOVA de dos factores: prueba de Tukey
Realizamos la prueba de Tukeypara determinar qué muestras están causando las diferencias que nos establece ANOVA: La mínima diferencia significativa es 2,713. Comparando las medias de las cuatro salsas, encontramos que la puntuación promedio de la salsa 1 supera significativamente a las otras tres. También hay diferencia significativa entre los promedios de las salsas 2 y 4 No hay diferencias significativas entre las salsas 2 y 3 ni entre las salsas 3 y 4
![Page 41: Análisis de varianza Prueba de Tukey](https://reader035.vdocuments.pub/reader035/viewer/2022070914/62c78a737a3e89251e6494c3/html5/thumbnails/41.jpg)