anova

40
Análisis de varianza Equipo #1

Upload: bucker-cabrera-carrillo

Post on 28-Sep-2015

2 views

Category:

Documents


0 download

DESCRIPTION

sdafsd

TRANSCRIPT

Anlisis de varianza

Anlisis de varianza

Equipo #1

Recordemos

La varianza es la desviacin tpica elevada al cuadrado:

Recordemos

Una varianza grande indica que hay mucha variacin entre los sujetos, que hay mayores diferencias individuales con respecto a la media; una varianza pequea nos indica poca variabilidad entre los sujetos, diferencias menores entre los sujetos. La varianza cuantifica todo lo que hay de diferente entre los sujetos u observaciones.

Qu es el anlisis de varianza?

En estadstica, el anlisis de la varianza (ANOVA, ANalysis Of VAriance, segn terminologa inglesa) es una coleccin de modelos estadsticos y sus procedimientos asociados, en el cual la varianza est particionada en ciertos componentes debidos a diferentes factores (variables).

Cmo surge ANOVA?

Las tcnicas iniciales del anlisis de varianza fueron desarrolladas por el estadstico y genetista R. A. Fisher en los aos 1920 y 1930 y es algunas veces conocido como "Anova de Fisher" o "anlisis de varianza de Fisher", debido al uso de la distribucin F de Fisher como parte del contraste de hiptesis.

Para qu hacer un ANOVA?

El anlisis de varianza lo vamos a utilizar para verificar si hay diferencias estadsticamente significativas entre medias cuando tenemos ms de dos muestras o grupos en el mismo planteamiento.

Para qu hacer un ANOVA?

Su verdadero objetivo no es la variabilidad, sino otros contrastes, como la igualdad de medias o el ajuste en un problema de Regresin.

En que consiste la tcnica ANOVA?

La tcnica del ANOVA consiste en descomponer la variabilidad de una poblacin (representada por su varianza) en diversos sumandos segn los factores que intervengan en la creacin de esa variabilidad.

En que consiste la tcnica ANOVA?

La varianza expresa variacin, y si podemos descomponer la varianza, podemos aislar fuentes de variacin. Cuando de los sujetos tenemos varios tipos de informacin, el anlisis de varianza nos va a responder a esta pregunta De dnde vienen las diferencias?

En que consiste la tcnica ANOVA?

Para dos (o ms) muestras, la varianza total (uniendo las dos muestras en una sola) puede descomponerse en dos varianzas:

1) Una varianza que indica la variabilidad dentro de los grupos

2) Otra varianza que expresa la variabilidad (diferencias) entre los grupos (entre las medias).

Cmo hacer un ANOVA?

Primero, se deben satisfacer tres supuestos bsicos antes de utilizar el anlisis de varianza.

1) Las muestras deben ser de tipo aleatorio independiente.

2) Las muestras deben ser obtenidas a partir de poblaciones normales.

3) Las muestras deben tener varianzas iguales

Cmo hacer un ANOVA?

Despus, se calculan las varianzas muestrales (de cada muestra). Cabe aclarar que la suma de cuadrados se debe dividir entre el nmero de elementos de la muestra global menos uno (n - 1) porque es una muestra.

Cmo hacer un ANOVA?

Lo siguiente es calcular la variacin entre muestras, para ello se suman todas las varianzas muestrales y se dividen entre el nmero de muestras (k), esto es una media de varianzas.

Cmo hacer un ANOVA?

Posteriormente, se estima la varianza de interna de los grupos, para lo cual, previamente se estima la varianza de las medias aritmticas, como sigue:

Cmo hacer un ANOVA?

La cual se multiplica por el nmero de elementos totales de cada muestra (n) para obtener la varianza de la distribucin del muestreo.

El estadstico F de Fisher

Para verificar si realmente existen diferencias entre las muestras, no dadas por la variabilidad sino por algn factor, se emplean el estadstico de Fisher (F de Fisher). Este indicador, determina que tanta variabilidad hay entre todas las muestras.

El estadstico F de Fisher

Primero se debe calcular la razn F de prueba (o contraste), dividiendo la variacin interna de las muestras, entre la variacin global de las muestras:

El estadstico F de Fisher

Despus se debe de contrastar con el estadstico F con (k-1) grados de libertad para el numerador y k(n-1) grados de libertad para el denominador. Este estadstico se encuentra en la siguiente tabla:

Existe diferencia por un factor?

Si la razn F de prueba es menor que la F de la tabla, entonces se concluye que no hay diferencia significativa entre las proporciones de cada muestras de acuerdo al factor considerado. En caso contrario, se dice que no todas las proporciones son iguales y que el factor si influye en la diferencias de cada muestra.

Tabla ANOVA

Finalmente, la informacin debe presentarse en una tabla ANOVA

Diseo de experimentos de un factor

23

El cambiar un factor a un tiempo presenta las desventajas siguientes:

Se requieren demasiados experimentos para el estudio

No se puede encontrar la combinacin ptima de vars.

No se puede determinar la interaccin

Se puede llegar a conclusiones errneas

Se puede perder tiempo en analizar las variables equivocadas

Introduccin

23

24

Es una prueba o serie de pruebas donde se inducen cambios deliberados en las variables de entrada de un proceso, para observar su influencia en la variable de salida o respuesta

Es el proceso de planear un experimento para obtener datos apropiados, que pueden ser analizados mediante mtodos estadsticos, con objeto de producir conclusiones vlidas y objetivas.

Xs

Factores

De control

Ys respuestas

Zs factores no controlables

Qu es el diseo de experimentos?

24

25

Cambios deliberados y sistemticos de las variables de entrada (factores) para observar los cambios correspondientes en la salida (respuesta).

Proceso

Entradas

Salidas (Y)

Diseo de

Producto

Entradas

Salidas (Y)

Qu es un experimento diseado?

25

26

Experimentos Diseados

Estrategia de

Gran Impacto

Caracterizacin

Optimizacin

Medir

Analizar

Mejorar

Controlar

Se usa para examinar

una gran cantidad de

variables.

Se usa para identificar

variables de entrada

crticas y cuantificar su

efecto en la salida.

26

27

Obtencin de rplicas: repeticin del experimento (5 probetas en cada medio de templado)

Para determinar el error experimental con objeto de identificar diferencias significativas estadsticamente en los datos observados

Calcular una estimacin ms precisa del efecto de un factor en el experimento si se usa la media de la muestra como estimador de dicho efecto (n = 1, Y1 =145, Y2 = 147)

Principios bsicos

27

28

Aleatorizacin: hacer en forma aleatoria,

Permite confundir el efecto de los factores no controlables

La asignacin de los materiales utilizados en la experimentacin

El orden en que se realizan los experimentos

Ejemplo: asignacin de probetas con diferente grosor asignadas aleatoriamente a dos mtodos de templado (en lugar de las gruesas a un mtodo y las delgadas a otro)

28

29

Anlisis por bloques, para mejorar la precisin del experimento

Un bloque es una porcin del material experimental que es ms homogneo que el total del material experimental.

Se comparan las condiciones de inters dentro de cada bloque

Por ejemplo las condiciones de un da especfico o un turno especfico

29

30

Los factores son los elementos que cambian durante un experimento para observar su impacto sobre la salida. Se designan como A, B, C, etc.

- Los factores pueden ser cuantitativos o cualitativos

- Los niveles se designan como alto / bajo (-1, +1) o (1,2)

Factor Niveles

B. Temp de Moldeo 600 700

E. Tipo de Material Nylon Acetal

Factor cuantitativo, dos niveles

Factor cualitativo, dos niveles

o

o

Factores y niveles

30

Ejemplo: El objetivo del experimento

Un ingeniero de desarrollo tiene inters en investigar la resistencia a la

tensin de una fibra sinttica nueva que se usar para hacer camisas para

caballero.

Por experiencia previa, se conoce que la resistencia a la tensin se afecta

por el peso porcentual del algodn en la mezcla de materiales de la fibra.

Se sospecha que al aumentar el contenido de algodn se incrementar la

resistencia. (Hiptesis)

Se sabe que el contenido de algodn deber variar entre 10 y 40 por ciento

para que el producto final tenga otras caractersticas de calidad que se

desean (como la capacidad de ser sometido a un tratamiento de planchado

permanente). (Condiciones/restricciones de operacin)

El ingeniero decide probar ejemplares en cinco niveles de peso porcentual de algodn: 15, 20, 25, 30 y 35 por ciento.

Se decide que se probarn 5 ejemplares de cada nivel de contenido de algodn.

Este es un experimento con un solo factor (porcentaje de algodn) con a=5 niveles (5 porcentajes diferentes de algodn)

Tambin se decide probar con 5 ejemplares de cada nivel de contenido de algodn.

Justificacin de la aleatoriedad en la secuencia

La secuencia de prueba aleatorizada es necesaria para evitar que los efectos de variables perturbadoras desconocidas (fuera de control durante el experimento) contaminen los resultados.

En el ejemplo podra suceder que si las corridas se hacen en orden ascendente de porcentaje de algodn (primero 5 corridas con 15%, luego 5 corridas con 20%, etc), y si la mquina de pruebas sufriese un calentamiento en la medida que pasan las pruebas, de tal manera que el calentamiento afecta las mediciones, esto destruir la validez del experimento.

Determinacin de la secuencia de las corridas

Las 25 corridas debern realizarse de manera aleatoria.

Suponga que las corridas se numeran de la siguiente manera:

Para ejecutar las corridas se selecciona un nmero aleatorio entre 1 y 25.

Suponga que el nmero aleatorio que sali escogido primero fue el 8 (20% de algodn).

El procedimiento se repite hasta que las 25 observaciones tengan asignada una posicin en la secuencia de la prueba.

Resultados obtenidos

Suponiendo que se sigui el orden aleatorio descrito anteriormente, se muestran las observaciones que se realizaron para la resistencia a la tensin en la siguiente tabla

(

)

-

=

f

x

x

i

2

2

s

(

)

-

=

f

x

mk

i

2

2

s