anova
DESCRIPTION
sdafsdTRANSCRIPT
Anlisis de varianza
Anlisis de varianza
Equipo #1
Recordemos
La varianza es la desviacin tpica elevada al cuadrado:
Recordemos
Una varianza grande indica que hay mucha variacin entre los sujetos, que hay mayores diferencias individuales con respecto a la media; una varianza pequea nos indica poca variabilidad entre los sujetos, diferencias menores entre los sujetos. La varianza cuantifica todo lo que hay de diferente entre los sujetos u observaciones.
Qu es el anlisis de varianza?
En estadstica, el anlisis de la varianza (ANOVA, ANalysis Of VAriance, segn terminologa inglesa) es una coleccin de modelos estadsticos y sus procedimientos asociados, en el cual la varianza est particionada en ciertos componentes debidos a diferentes factores (variables).
Cmo surge ANOVA?
Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el estadstico y genetista R. A. Fisher en los aos 1920 y 1930 y es algunas veces conocido como "Anova de Fisher" o "anlisis de varianza de Fisher", debido al uso de la distribucin F de Fisher como parte del contraste de hiptesis.
Para qu hacer un ANOVA?
El anlisis de varianza lo vamos a utilizar para verificar si hay diferencias estadsticamente significativas entre medias cuando tenemos ms de dos muestras o grupos en el mismo planteamiento.
Para qu hacer un ANOVA?
Su verdadero objetivo no es la variabilidad, sino otros contrastes, como la igualdad de medias o el ajuste en un problema de Regresin.
En que consiste la tcnica ANOVA?
La tcnica del ANOVA consiste en descomponer la variabilidad de una poblacin (representada por su varianza) en diversos sumandos segn los factores que intervengan en la creacin de esa variabilidad.
En que consiste la tcnica ANOVA?
La varianza expresa variacin, y si podemos descomponer la varianza, podemos aislar fuentes de variacin. Cuando de los sujetos tenemos varios tipos de informacin, el anlisis de varianza nos va a responder a esta pregunta De dnde vienen las diferencias?
En que consiste la tcnica ANOVA?
Para dos (o ms) muestras, la varianza total (uniendo las dos muestras en una sola) puede descomponerse en dos varianzas:
1) Una varianza que indica la variabilidad dentro de los grupos
2) Otra varianza que expresa la variabilidad (diferencias) entre los grupos (entre las medias).
Cmo hacer un ANOVA?
Primero, se deben satisfacer tres supuestos bsicos antes de utilizar el anlisis de varianza.
1) Las muestras deben ser de tipo aleatorio independiente.
2) Las muestras deben ser obtenidas a partir de poblaciones normales.
3) Las muestras deben tener varianzas iguales
Cmo hacer un ANOVA?
Despus, se calculan las varianzas muestrales (de cada muestra). Cabe aclarar que la suma de cuadrados se debe dividir entre el nmero de elementos de la muestra global menos uno (n - 1) porque es una muestra.
Cmo hacer un ANOVA?
Lo siguiente es calcular la variacin entre muestras, para ello se suman todas las varianzas muestrales y se dividen entre el nmero de muestras (k), esto es una media de varianzas.
Cmo hacer un ANOVA?
Posteriormente, se estima la varianza de interna de los grupos, para lo cual, previamente se estima la varianza de las medias aritmticas, como sigue:
Cmo hacer un ANOVA?
La cual se multiplica por el nmero de elementos totales de cada muestra (n) para obtener la varianza de la distribucin del muestreo.
El estadstico F de Fisher
Para verificar si realmente existen diferencias entre las muestras, no dadas por la variabilidad sino por algn factor, se emplean el estadstico de Fisher (F de Fisher). Este indicador, determina que tanta variabilidad hay entre todas las muestras.
El estadstico F de Fisher
Primero se debe calcular la razn F de prueba (o contraste), dividiendo la variacin interna de las muestras, entre la variacin global de las muestras:
El estadstico F de Fisher
Despus se debe de contrastar con el estadstico F con (k-1) grados de libertad para el numerador y k(n-1) grados de libertad para el denominador. Este estadstico se encuentra en la siguiente tabla:
Existe diferencia por un factor?
Si la razn F de prueba es menor que la F de la tabla, entonces se concluye que no hay diferencia significativa entre las proporciones de cada muestras de acuerdo al factor considerado. En caso contrario, se dice que no todas las proporciones son iguales y que el factor si influye en la diferencias de cada muestra.
Tabla ANOVA
Finalmente, la informacin debe presentarse en una tabla ANOVA
Diseo de experimentos de un factor
23
El cambiar un factor a un tiempo presenta las desventajas siguientes:
Se requieren demasiados experimentos para el estudio
No se puede encontrar la combinacin ptima de vars.
No se puede determinar la interaccin
Se puede llegar a conclusiones errneas
Se puede perder tiempo en analizar las variables equivocadas
Introduccin
23
24
Es una prueba o serie de pruebas donde se inducen cambios deliberados en las variables de entrada de un proceso, para observar su influencia en la variable de salida o respuesta
Es el proceso de planear un experimento para obtener datos apropiados, que pueden ser analizados mediante mtodos estadsticos, con objeto de producir conclusiones vlidas y objetivas.
Xs
Factores
De control
Ys respuestas
Zs factores no controlables
Qu es el diseo de experimentos?
24
25
Cambios deliberados y sistemticos de las variables de entrada (factores) para observar los cambios correspondientes en la salida (respuesta).
Proceso
Entradas
Salidas (Y)
Diseo de
Producto
Entradas
Salidas (Y)
Qu es un experimento diseado?
25
26
Experimentos Diseados
Estrategia de
Gran Impacto
Caracterizacin
Optimizacin
Medir
Analizar
Mejorar
Controlar
Se usa para examinar
una gran cantidad de
variables.
Se usa para identificar
variables de entrada
crticas y cuantificar su
efecto en la salida.
26
27
Obtencin de rplicas: repeticin del experimento (5 probetas en cada medio de templado)
Para determinar el error experimental con objeto de identificar diferencias significativas estadsticamente en los datos observados
Calcular una estimacin ms precisa del efecto de un factor en el experimento si se usa la media de la muestra como estimador de dicho efecto (n = 1, Y1 =145, Y2 = 147)
Principios bsicos
27
28
Aleatorizacin: hacer en forma aleatoria,
Permite confundir el efecto de los factores no controlables
La asignacin de los materiales utilizados en la experimentacin
El orden en que se realizan los experimentos
Ejemplo: asignacin de probetas con diferente grosor asignadas aleatoriamente a dos mtodos de templado (en lugar de las gruesas a un mtodo y las delgadas a otro)
28
29
Anlisis por bloques, para mejorar la precisin del experimento
Un bloque es una porcin del material experimental que es ms homogneo que el total del material experimental.
Se comparan las condiciones de inters dentro de cada bloque
Por ejemplo las condiciones de un da especfico o un turno especfico
29
30
Los factores son los elementos que cambian durante un experimento para observar su impacto sobre la salida. Se designan como A, B, C, etc.
- Los factores pueden ser cuantitativos o cualitativos
- Los niveles se designan como alto / bajo (-1, +1) o (1,2)
Factor Niveles
B. Temp de Moldeo 600 700
E. Tipo de Material Nylon Acetal
Factor cuantitativo, dos niveles
Factor cualitativo, dos niveles
o
o
Factores y niveles
30
Ejemplo: El objetivo del experimento
Un ingeniero de desarrollo tiene inters en investigar la resistencia a la
tensin de una fibra sinttica nueva que se usar para hacer camisas para
caballero.
Por experiencia previa, se conoce que la resistencia a la tensin se afecta
por el peso porcentual del algodn en la mezcla de materiales de la fibra.
Se sospecha que al aumentar el contenido de algodn se incrementar la
resistencia. (Hiptesis)
Se sabe que el contenido de algodn deber variar entre 10 y 40 por ciento
para que el producto final tenga otras caractersticas de calidad que se
desean (como la capacidad de ser sometido a un tratamiento de planchado
permanente). (Condiciones/restricciones de operacin)
El ingeniero decide probar ejemplares en cinco niveles de peso porcentual de algodn: 15, 20, 25, 30 y 35 por ciento.
Se decide que se probarn 5 ejemplares de cada nivel de contenido de algodn.
Este es un experimento con un solo factor (porcentaje de algodn) con a=5 niveles (5 porcentajes diferentes de algodn)
Tambin se decide probar con 5 ejemplares de cada nivel de contenido de algodn.
Justificacin de la aleatoriedad en la secuencia
La secuencia de prueba aleatorizada es necesaria para evitar que los efectos de variables perturbadoras desconocidas (fuera de control durante el experimento) contaminen los resultados.
En el ejemplo podra suceder que si las corridas se hacen en orden ascendente de porcentaje de algodn (primero 5 corridas con 15%, luego 5 corridas con 20%, etc), y si la mquina de pruebas sufriese un calentamiento en la medida que pasan las pruebas, de tal manera que el calentamiento afecta las mediciones, esto destruir la validez del experimento.
Determinacin de la secuencia de las corridas
Las 25 corridas debern realizarse de manera aleatoria.
Suponga que las corridas se numeran de la siguiente manera:
Para ejecutar las corridas se selecciona un nmero aleatorio entre 1 y 25.
Suponga que el nmero aleatorio que sali escogido primero fue el 8 (20% de algodn).
El procedimiento se repite hasta que las 25 observaciones tengan asignada una posicin en la secuencia de la prueba.
Resultados obtenidos
Suponiendo que se sigui el orden aleatorio descrito anteriormente, se muestran las observaciones que se realizaron para la resistencia a la tensin en la siguiente tabla
(
)
-
=
f
x
x
i
2
2
s
(
)
-
=
f
x
mk
i
2
2
s