diseños factoriales
TRANSCRIPT
-
1
Diseo factorial
Diseo de experimentos Docente: Marlon Angulo
Universidad del Norte Maestra en Estadstica Aplicada
-
2
1. DISEO DE BLOQUES INCOMPLETOS BALANCEADOS
Se entiende por diseo de bloques incompletos aleatorizados a un diseo de bloques aleatorizados en el cual no es posible correr todas las combinaciones de los tratamientos en cada bloque. Cuando adems dos tratamientos cualesquiera aparecen conjuntamente el mismo nmero de veces, recibe el nombre de diseo de bloques incompletos balanceados (BIBD: balanced incomplete block design). Si hay a tratamientos en cada bloque y cada bloque puede tener exactamente k tratamientos (k
-
3
() = 2=1 Donde es el total ajustado del tratamiento i-simo, el cual se calcula como:
= . 1 .=1 i=1, 2,, a Con = 1 si el tratamiento i aparece en el bloque j y = 0 en caso contrario. Los totales de los tratamientos ajustados siempre sumarn cero. () tiene a-1 grados de libertad. La suma de cuadrados del error se calcula por sustraccin como: = () y tiene N-a-b+1 grados de libertad. El estadstico apropiado para probar la igualdad de los efectos de los tratamientos es:
= () Fuente de variacin
Suma de cuadrados
Grados de libertad
Cuadrado medio
Tratamientos (ajustados)
2
a-1 () 1 ()
Bloques 1.2 ..2 b-1 1
Error (por sustraccin)
N-a-b+1 + 1
Total
2 ..2
N-1
Si el factor bajo estudio es fijo, las pruebas para las medias de tratamientos individuales pueden ser de inters. Si se emplean contrastes ortogonales, los contrastes deben hacerse sobre los totales de los tratamientos ajustados, las {} en lugar de las {.}. La suma de cuadrados de los contrastes es:
= ( =1 )2 2=1 Donde {} son los coeficientes de los contrastes. Pueden usarse otros mtodos de comparacin mltiple para comparar todos los pares de efectos de los tratamientos ajustados
los cuales se estiman con = . La desviacin estndar en el error del efecto de un tratamiento ajustado es:
=
En el anlisis que acaba de describirse, se ha hecho la particin de la suma de cuadrados total en una suma de cuadrados de tratamientos ajustados, una suma de cuadrados de los bloques sin ajuste y una suma de cuadrados del error. En ocasiones se tiene inters en evaluar los efectos de los bloques. Para ello se requiere hacer una particin alternativa de , es decir:
= + () + Aqu la suma de cuadrados de los tratamientos est sin ajuste. Si el diseo es simtrico, si a=b puede obtenerse una frmula simple para la (). Los totales de los bloques ajustados son:
= . 1 .=1 j=1,2,,b y
-
4
() = 2=1
Fuente de variacin
Suma de cuadrados
Grados de libertad
Cuadrado medio
Tratamientos (ajustados)
2
=1
a-1 () 1 ()
Tratamientos (sin ajustes)
1.2 ..2
=1
a-1
Bloques (sin ajustes)
1.2 ..2
=1
b-1
Bloques (ajustados)
2
=1
b-1 () 1 ()
Error N-a-b+1 + 1
Total
2 ..2
(N-1)
-
5
2. DISEO FACTORIAL DE TRES FACTORES
El departamento de control de calidad de una planta de acabados textiles estudia el efecto de varios factores sobre el teido de una tela de algodn y fibras sintticas utilizada para fabricar camisas para caballero. Se seleccionaron tres operadores, tres duraciones del ciclo y dos temperaturas y se tieron tres ejemplares pequeos de la tela bajo cada conjunto de condiciones. La tela terminada se compar con un patrn y se le asign una evaluacin numrica. Los datos se presentan enseguida. Analizar los datos y sacar conclusiones. Comentar la adecuacin del modelo.
Duracin del ciclo
Temperatura 300o 350o
Operador Operador 1 2 3 1 2 3
40
23 24 25
27 28 26
31 32 29
24 23 28
38 36 35
34 36 39
50
36 35 36
34 38 39
33 34 35
37 39 35
34 38 36
34 36 31
60
28 24 27
35 35 34
26 27 25
26 29 25
36 37 34
28 26 24
Para los tres factores: A: Duracin del ciclo con los niveles 40, 50 y 60 (a=3) B: Temperatura con los niveles 300o y 350o (b=2) C: Operador con los niveles 1, 2 y 3 (c=3) Y para cada uno de ellos se realizan tres rplicas (n=3) El modelo del anlisis de varianza de los tres factores es:
= + + + + () + () + () + () +
Donde
= 1, 2, , = 1, 2, , = 1, 2, , = 1, 2, ,
-
6
La tabla de anlisis de varianza es: Fuen
de varia
Suma de cuadrados Grados de
libertad
Cuadrado medio Cuadrado medio esperado
Fo
A = 12
=1
.2
a-1
= 1 2 + 2 1 = B
= 1...2 =1
.2
b-1
= 1 2 + 2 1 = C
= 1...2 =1
.2
c-1
= 1 2 + 2 1 = AB = 1
..2
=1
=1
.2
= () (a-1)(b-1)
= ( 1)( 1) 2 + ()2( 1)( 1) = AC = 1
..2
=1
=1
.2
= () (a-1)(c-1)
= ( 1)( 1) 2 + ()2( 1)( 1) = BC = 1
..2
=1
=1
.2
= () (b-1)(c-1)
= ( 1)( 1) 2 + ()2( 1)( 1) = ABC = 1
.2
=1
=1
=1
.2
= ()
(a-1)(b-1)(c-1)
= ( 1)( 1)( 1) 2+ ()2( 1)( 1)( 1) =
Error = () abc(n-1) = ( 1) 2 Total
= 2=1
=1
=1
=1
.2
abcn-1
-
7
Duracin del
ciclo (A)
Temperatura (B) Totales A
300o 350o Operador (C) Operador (C) 1 2 3 1 2 3
40
23 24 72 25
27 28 81 26
31 32 92 29
24 23 75 28
38 36 109 35
34 36 109 39
538
50
36 35 107 36
34 38 111 39
33 34 102 35
37 39 111 35
34 38 108 36
34 36 101 31
640
60
28 24 79 27
35 35 104 34
26 27 78 25
26 29 80 25
36 37 107 34
28 26 78 24
526
Totales BxC .. 258 296 272 266 324 288 . =1704 Totales B ... 826 878
Totales C ... Operador 1: 524 Operador 2: 620 Operador 3: 560
A
Totales AxB: .. B
300o 350o
40 245 293 50 320 320 60 261 265
A Totales AxC: ..
C 1 2 3
40 147 190 201 50 218 219 203 60 159 211 156
= 118[(538)2+(640)2+(526)2] (1704)254 = 436
=127
[(826)2+(878)2] (1704)254 = 50.07
=118
[(524)2+(620)2+(560)2] (1704)254 = 261.33
=19
[(245)2+(293)2+(320)2 + (320)2+(261)2+(265)2] (1704)254 436 50.07 = 78.82
=
16
[(147)2+(190)2+(201)2 + (218)2+(219)2+(203)2+ (159)2+(211)2+(156)2] (1704)254 436 261.33 = 355.67
=
19
[(258)2+(296)2+(272)2 + (266)2+(324)2+(288)2] (1704)254 50.07 261.33 = 11.27
-
8
=
13
[(72)2+(81)2+(92)2 + (75)2+(109)2+(109)2 + (107)2+(111)2+(102)2+ (111)2+(108)2+(101)2 + (79)2+(104)2+(78)2+ (80)2+(107)2+(78)2] (1704)254 436 50.07 261.33 78.82 355.67 11.27 = 46.17
()=13[(72)2+(81)2+(92)2 + (75)2+(109)2+(109)2 +(107)2+(111)2+(102)2 + (111)2+(108)2+(101)2 + (79)2+(104)2+(78)2 +(80)2+(107)2+(78)2] (1704)2
54=1239.33
= [(23)2+(27)2+(31)2 + (24)2+(38)2+(34)2 + (24)2+(28)2+(32)2+ (23)2+(36)2+(36)2 + (25)2+(26)2+(29)2+ (28)2+(35)2+(39)2 + (36)2+(34)2+(33)2+ (37)2+(34)2+(34)2 + (35)2+(38)2+(34)2+ (39)2+(38)2+(36)2 + (36)2+(39)2+(35)2+ (35)2+(36)2+(31)2 + (28)2+(35)2+(26)2+ (26)2+(36)2+(28)2 + (24)2+(35)2+(27)2+ (29)2+(37)2+(26)2 + (27)2+(34)2+(25)2+ (25)2+(34)2+(24)2] (1704)254 = 1357.33
= () = 1357.33 1239.33 = 118 En la siguiente tabla se resume el anlisis de varianza con las hiptesis a probar: Ho: Efecto A=0, Ho: Efecto B=0, Ho: Efecto C=0, Ho: Efecto AB=0, Ho: Efecto AC=0, Ho: Efecto BC=0, Ho: Efecto ABC=0 cada una aparejada con su correspondiente hiptesis alternativa.
Fuente de variacin Suma de cuadrados
Grados de libertad
Cuadrado medio
Fo Valor P
Duracin del ciclo (A) 436 2 218 66.46 8,22594E-13 Temperatura (B) 50.07 1 50.07 15.26 0,000395815
Operador (C) 261.33 2 130.66 39.83 7,51878E-10 AB 78.82 2 39.41 12.01 0,000100953 AC 355.67 4 88.92 27.11 1,99917E-10 BC 11.27 2 5.63 1.72 0,193455331
ABC 46.17 4 11.54 3.52 0,015922463 Error 118 36 3.28 Total 1357.33 53
Se observa que la duracin del ciclo, la temperatura y el operador afectan significativamente el teido de una tela de algodn y fibras sintticas utilizadas en la fabricacin de camisas para caballeros. El coeficiente F de la interaccin temperatura-operador tiene un valor P de 0.1934>0.05 lo cual indica la no significancia de la interaccin entre estos dos factores.
-
9
En las siguientes figuras se grafican las interacciones AB, AC y BC. Para la duracin del ciclo se obtiene un mayor promedio con el valor 50 y el menor con 40 ambos correspondientes a una temperatura de 300, con la temperatura de 350 se presenta una situacin similar aunque hay una diferencia con el ciclo de 40; con el operador se observa una situacin parecida a la anterior en donde el mximo valor de teido de la tela se da con el primer y el segundo operador; en la interaccin temperatura-operador no se cruzan las lneas en el intervalo estudiado y existe un mayor teido con la temperatura de 350 correspondiente al segundo operador.
Grfico de Interacciones
Duracin del ciclo
27
29
31
33
35
37
Tei
do d
e la
tela
40 50 60
temperatura300350
Grfico de Interacciones
Duracin del ciclo
24
27
30
33
36
39
Tei
do d
e la
tela
40 50 60
Operador123
Grfico de Interacciones
temperatura
28
30
32
34
36
Tei
do d
e la
tela
300 350
Operador123
-
10
Para analizar los residuales del experimento se utiliza el STAT GRAPHIC. Se seala en la grfica de probabilidad normal, que los residuos tienden hacia la lnea recta (comprobado tambin con el p-valor de shapiro-wilks= 0.2707>0.05); la grfica de varianza constante muestra un comportamiento donde no cambia de magnitud exceptuando dos datos que parecen atpicos para la duracin del ciclo de 40 y 50; la grfica de independencia no presenta una tendencia en los residuos; por lo tanto se cumplen los supuestos necesarios en la solucin del problema.
Grfico de Probabilidad Normal
-3 -2 -1 0 1 2 3
RESIDUOS
0,1
1
5
20
50
80
95
99
99,9
porc
enta
je
40 50 60
Grfico de Residuos para Teido de la tela
-3
-2
-1
0
1
2
3
resid
uos
Duracin del ciclo
-
11
Adems con la prueba de rangos mltiples se cumple que existe una mayor media correspondiente a la duracin de ciclo de 50 y por lo tanto existe una diferencia significativa.
Mtodo: 95,0 porcentaje Tukey HSD Duracin del ciclo Casos Media LS Sigma LS Grupos Homogneos 60 18 29,2222 0,42673 X 40 18 29,8889 0,42673 X 50 18 35,5556 0,42673 X
Contraste Sig. Diferencia +/- Lmites 40 - 50 * -5,66667 1,47537 40 - 60 0,666667 1,47537 50 - 60 * 6,33333 1,47537
Mtodo: 95,0 porcentaje LSD Duracin del ciclo Casos Media LS Sigma LS Grupos Homogneos 60 18 29,2222 0,42673 X 40 18 29,8889 0,42673 X 50 18 35,5556 0,42673 X
Contraste Sig. Diferencia +/- Lmites 40 - 50 * -5,66667 1,22393 40 - 60 0,666667 1,22393 50 - 60 * 6,33333 1,22393
Con la prueba de rangos mltiples se cumple que existe una diferencia significativa entre los dos grupos de temperaturas.
Mtodo: 95,0 porcentaje Tukey HSD Temperatura Casos Media LS Sigma LS Grupos Homogneos 300 27 30,5926 0,348424 X 350 27 32,5185 0,348424 X
Contraste Sig. Diferencia +/- Lmites 300 - 350 * -1,92593 0,999337
Mtodo: 95,0 porcentaje LSD Temperatura Casos Media LS Sigma LS Grupos Homogneos 300 27 30,5926 0,348424 X 350 27 32,5185 0,348424 X
Contraste Sig. Diferencia +/- Lmites 300 - 350 * -1,92593 0,999337
Grfico de Residuos para Teido de la tela
-3
-2
-1
0
1
2
3
resid
uos
0 10 20 30 40 50 60nmero de fila
-
12
Con la prueba de rangos mltiples se cumple que existe una diferencia significativa entre los tres grupos de operadores.
Mtodo: 95,0 porcentaje Tukey HSD Operador Casos Media LS Sigma LS Grupos Homogneos 1 18 29,1111 0,42673 X 3 18 31,1111 0,42673 X 2 18 34,4444 0,42673 X
Contraste Sig. Diferencia +/- Lmites 1 - 2 * -5,33333 1,47537 1 - 3 * -2,0 1,47537 2 - 3 * 3,33333 1,47537
Mtodo: 95,0 porcentaje LSD Operador Casos Media LS Sigma LS Grupos Homogneos 1 18 29,1111 0,42673 X 3 18 31,1111 0,42673 X 2 18 34,4444 0,42673 X
Contraste Sig. Diferencia +/- Lmites 1 - 2 * -5,33333 1,22393 1 - 3 * -2,0 1,22393 2 - 3 * 3,33333 1,22393
Anlisis de Varianza para Teido de la tela - Suma de Cuadrados Tipo III Fuente Suma de Cuadrados Gl Cuadrado Medio Razn-F Valor-P EFECTOS PRINCIPALES A:Duracin del ciclo 436,0 2 218,0 66,51 0,0000 B:Temperatura 50,0741 1 50,0741 15,28 0,0004 C:Operador 261,333 2 130,667 39,86 0,0000 INTERACCIONES AB 78,8148 2 39,4074 12,02 0,0001 AC 355,667 4 88,9167 27,13 0,0000 BC 11,2593 2 5,62963 1,72 0,1939 ABC 46,1852 4 11,5463 3,52 0,0159 RESIDUOS 118,0 36 3,27778 TOTAL (CORREGIDO) 1357,33 53
Todas las razones-F se basan en el cuadrado medio del error residual
-
13
SnapStat: Anlisis de Una Muestra
Datos/Variable: RESIDUOSRecuento = 54Promedio = -1,66667E-7Desviacin Estndar = 1,49212Coeficiente de Variacin = -8,95271E8%Mnimo = -3,0Mximo = 3,0Rango = 6,0Sesgo Estandarizado = -0,0471838Curtosis Estandarizada = -1,13024
Histograma
-3,3 -1,3 0,7 2,7 4,7RESIDUOS
0
3
6
9
12
15
18
frecu
enci
a
Grfico de Caja y Bigotes
-3 -2 -1 0 1 2 3RESIDUOS
Intervalos de confianza del 95%Media: -1,66667E-7 +/- 0,407271 [-0,407271, 0,40727]Sigma: [1,25431, 1,84204]
DiagnsticosValor-P de Shapiro-Wilks = 0,2707Autocorrelacin en Retraso 1 = -0,269303 +/- 0,266718
0 10 20 30 40 50 60Fila
-3
-2
-1
0
1
2
3
RESI
DUO
S
Grfico Secuencias Cronolgicas Grfico de Probabilidad Normal
-3 -2 -1 0 1 2 3RESIDUOS
0,115
2050809599
99,9
porc
enta
je
-
14
3. FORMACIN DE BLOQUES EN UN DISEO FACTORIAL
Se estudia el rendimiento de un proceso qumico. Los dos factores de inters son la temperatura y la presin. Se seleccionan tres niveles de cada factor; sin embargo, slo es posible hacer nueve corridas en un da. El experimentador corre una rplica completa en cada da. Los datos se muestran en la tabla siguiente. Analizar los datos, suponiendo que los das son bloques.
Temperatura
Da 1 Presin
Da 2 Presin
250 260 270 250 260 270 Baja 86.3 84 85.8 86.1 85.2 87.3
Intermedia 88.5 87.3 89 89.4 89.9 90.3 Alta 89.1 90.2 91.3 91.7 93.2 93.7
Para los dos factores: A: Temperatura con los niveles baja, intermedia y alta (a=3) B: Presin con los niveles 250, 260 y 270 (b=3) Y para cada uno de ellos se realizan dos rplicas (n=2) El modelo del anlisis de varianza de los dos factores con bloques es:
= + + + () + +
Donde
= 1, 2, , = 1, 2, , = 1, 2, ,
es el efecto del k-simo bloque.
-
15
La tabla de anlisis de varianza es:
Fuen de
varia
Suma de cuadrados Grados de
libertad
Cuadrado medio Cuadrado medio esperado
Fo
A = 1..2
=1
...2
a-1
= 1 2 + 2 1 = B
= 1..2 =1
...2
b-1
= 1 2 + 2 1 = AB
= 1.2=1
=1
2
(a-1)(b-1) = ( 1)( 1) 2 + ()2( 1)( 1) =
Bloques = 1..2
=1
2
n-1
= 1 2 + 2 Error Sustraccin (ab-1)(n-
1) = ( 1)( 1) 2 Total
= 2=1
=1
=1
2
abn-1
Los valores del modelo lineal para este experimento son: a=3, b=3, n=2.
Temperatura
Da 1 Presin
Da 2 Presin
250 260 270 250 260 270 .. Baja 86.3 84 85.8 86.1 85.2 87.3 514.7
..23=1 =852120.09 Intermedia 88.5 87.3 89 89.4 89.9 90.3 534.4 Alta 89.1 90.2 91.3 91.7 93.2 93.7 549.2 .. 250 = 531.1 260 = 529.8 270 = 537.4 =1598.3
..2 = 851554.013=1
.. Da 1= 791.5 Da 2= 806.8 ..2 = 1277398.492=1
-
16
2 = 142047.232
=1
3
=1
3
=1
.
Temperatura Da 1+ Da 2
Presin
250 260 270 Baja 172.4 169.2 173.1
Intermedia 177.9 177.2 179.3 Alta 180.8 183.4 185
.2 = 284059.953=1
3
=1
= 16 [852120.09] 1598.3218 =99.85 = 16 [851554.01] 1598.3218 =5.51
= 12 [284059.95] 1598.3218 99.85-5.51=4.45 = 19 [1277398.49] 1598.3218 = 13.00
= [142047.23] 1598.3218 = 127.07 = 127.07 99.85 5.51 4.45 13 = 4.26
En la siguiente tabla se resume el anlisis de varianza con las hiptesis a probar: Ho: Efecto A=0, Ho: Efecto B=0, Ho: Efecto AB=0, cada una aparejada con su correspondiente hiptesis alternativa.
Fuente de variacin Suma de cuadrados
Grados de libertad
Cuadrado medio
Fo Valor P
Temperatura (A) 99.85 2 49.92 94.19 2,75404E-06 Presin (B) 5.51 2 2.75 5.19 0,035890369
AB 4.45 4 1.11 2.09 0,174049506 Bloques 13.00 1 13.00
Error 4.26 8 0.53 Total 127.07 17
-
17
Se observa que la temperatura y la presin afectan significativamente el rendimiento del proceso qumico. El coeficiente F de la interaccin temperatura-presin tiene un valor P =0.1733> 0.05 lo cual indica que la interaccin entre estos dos factores no es significativa al nivel de confianza del 95%. El Statgraphics arroja los siguientes resultados:
Fuente Suma de Cuadrados Gl Cuadrado Medio Razn-F Valor-P EFECTOS PRINCIPALES A:Temperatura 99,8544 2 49,9272 93,98 0,0000 B:Presin 5,50778 2 2,75389 5,18 0,0360 Bloques 13,005 1 13,005 INTERACCIONES AB 4,45222 4 1,11306 2,10 0,1733 RESIDUOS 4,25 8 0,53125 TOTAL (CORREGIDO) 127,069 17
Para analizar los residuales del experimento se utiliza el STAT GRAPHIC. Se seala en la
grfica de probabilidad normal, que los residuos tienden hacia la lnea recta (comprobado tambin con el p-valor de shapiro-wilks= 0.9155>0.05); la grfica de varianza constante muestra un comportamiento donde parece que no cambia de magnitud aunque se observa un poco ms pequea para la temperatura intermedia; la grfica de independencia parece indicar una tendencia en los residuos.
Grfico de Probabilidad Normal
-1 -0,6 -0,2 0,2 0,6 1RESIDUOS
0,1
15
205080
9599
99,9
porc
enta
je
-
18
Alta Baja Intermedia
Grfico de Residuos para Rendimiento
-1
-0,6
-0,2
0,2
0,6
1
resid
uos
Temperatura
Grfico de Residuos para Rendimiento
-1
-0,6
-0,2
0,2
0,6
1
resid
uos
0 3 6 9 12 15 18nmero de fila
-
19
4. DISEO FACTORIAL CON DOS FACTORES
En la planta de secado de la empresa Cemento Gris, hay dos variables que han sido
tradicionalmente ajustadas para lograr una humedad de salida apropiada: el flujo de
combustible (FF) y la frecuencia de los ventiladores (MF). El gerente lo ha contactado como
consultor especialista en anlisis de datos para resolver inquietudes respecto a
condiciones de operacin. Un ingeniero en pasanta dise una prueba, cuyos datos se
encuentran en el siguiente email:
Subject: Proyecto de Secado Date: Wednesday, 23 April 2008 14:52:44 -0500
From: Sergio Mandini To: Consultor Desesperado
CC: 'Mara Cementowski' Apreciado Consultor, Segn lo conversado, adjunto los datos. Sergio
Motor Frequency 25 35 45 55
Fluj
o
40 26.66 25.11 25.75 26.02 25.21 24.76 24.99 25.49 80 23.93 25.15 25.32 25.06 24.50 25.00 24.47 23.84
120 23.78 22.65 23.83 23.80 23.30 23.67 22.76 22.06 160 20.95 21.39 22.26 20.75 21.36 22.24 21.56 21.37 200 20.42 21.12 20.64 20.99 19.64 20.77 20.53 19.02
Consultor(a), con base en lo anterior, estamos interesados en saber:
a) Las variables significativas y sus p-values:
Las variables de este experimento son: frecuencia del motor, flujo de combustible y porcentaje
de humedad, es decir hay 2 factores de diseo y 1 variable respuesta. Con el ANOVA se
obtienen como significativas la frecuencia del motor y el flujo de combustible con p-values de
0,0437 y menor que 0,0001 respectivamente; la interaccin flujo-frecuencia resulta no
significativa con p-value 0,7652 (ver la siguiente tabla).
-
20
Fuente Suma de Cuadrados Gl Cuadrado Medio
Razn-F Valor-P
EFECTOS PRINCIPALES A:Frec 3,5249 3 1,17497 3,24 0,0437 B:Flujo 145,083 4 36,2709 100,13 0,0000 INTERACCIONES AB 2,88365 12 0,240304 0,66 0,7652 RESIDUOS 7,2446 20 0,36223 TOTAL (CORREGIDO) 158,737 39
Para corroborar lo anterior se verifican los supuestos:
1. Independencia: se comprueba analizando la grfica de residuos versus nmero de fila.
No se observa patrn conocido es decir los datos son aleatorios; por lo tanto se
cumple este supuesto.
2. Homocedasticidad: se analiza con la grfica de residuos versus frecuencia y residuos
versus flujo; en ambos casos se aprecia que no hay variaciones extremas con respecto
a los niveles de las variables lo cual conlleva al cumplimiento de la igualdad de
varianzas
Grfico de Residuos para Hum
-0,8
-0,4
0
0,4
0,8
resi
duos
0 10 20 30 40nmero de fila
-
21
3. Normalidad: analizando los residuos de la grfica de distribucin normal se observa
que tienden a la recta; por lo tanto no se rechaza la hiptesis nula de que proviene de
una distribucin normal lo cual se confirma aplicando Shapiro-Wills.
25 35 45 55
Grfico de Residuos para Hum
-0,8
-0,4
0
0,4
0,8
resi
duos
Frec
40 80 120 160 200
Grfico de Residuos para Hum
-0,8
-0,4
0
0,4
0,8
resi
duos
Flujo
Histograma para RESIDUOS
-0,9 -0,6 -0,3 0 0,3 0,6 0,9RESIDUOS
0
2
4
6
8
10
12
frecu
encia
DistribucinNormal
-
22
b) Si estamos operando a 40 gpm, qu tanto debe aumentar el flujo para alcanzar la
menor humedad posible?
Pruebas de Mltiple Rangos para Humedad por Flujo
Mtodo: 95,0 porcentaje LSD Flujo Casos Media LS Sigma LS Grupos
Homogneos 200 8 20,3912 0,212788 X 160 8 21,485 0,212788 X 120 8 23,2313 0,212788 X 80 8 24,6588 0,212788 X 40 8 25,4988 0,212788 X
SnapStat: Anlisis de Una Muestra
Datos/Variable: RESIDUOSRecuento = 40Promedio = 0,0Desviacin Estndar = 0,430998Coeficiente de Variacin = %Mnimo = -0,775Mximo = 0,775Rango = 1,55Sesgo Estandarizado = 0,0Curtosis Estandarizada = -0,954281
Histograma
-0,9 -0,6 -0,3 0 0,3 0,6 0,9RESIDUOS
0
2
4
6
8
10
12
frecu
encia
Grfico de Caja y Bigotes
-0,8 -0,4 0 0,4 0,8RESIDUOS
Intervalos de confianza del 95%Media: 0,0 +/- 0,13784 [-0,13784, 0,13784]Sigma: [0,353056, 0,553416]
DiagnsticosValor-P de Shapiro-Wilks = 0,2928Autocorrelacin en Retraso 1 = -0,358215 +/- 0,309898
0 10 20 30 40Fila
-0,8
-0,4
0
0,4
0,8
RESI
DUOS
Grfico Secuencias Cronolgicas Grfico de Probabilidad Normal
-0,8 -0,4 0 0,4 0,8RESIDUOS
0,115
2050809599
99,9
porc
enta
je
-
23
Como se observa en la tabla de mltiples rangos para humedad por flujo, no hay zonas
homogneas entre grupos y adems la media va disminuyendo a medida que aumenta
el flujo. Por lo tanto, debo aumentar en: 200gpm-40gpm=160 gpm ya que con ste se
alcanza la menor humedad (=20,3912).
c) Si estamos operando a 80 gpm y 35 Hz, vale la pena aumentar la frecuencia
para reducir la humedad?
Con la tabla de medias por mnimos cuadrados para humedad se extraen las medias
para un flujo de 80 y frecuencias de 35, 45, 55:
35 45 55
25,19 24,75 24,155
Calculando el LSD=t/2, gl*RAIZ (2*MSE/n)=t0, 025,20*RAIZ (2*MSE/n)= 2,08596344*RAIZ (2*0,36223/2)= 1,2554485.
El rango correspondiente al LSD es: 25,191,255= (23,935 26,445) lo cual nos
representa igualdad de medias con un flujo de 80 y frecuencias de 35, 45 y 55, es decir
no se observa un cambio significativo; por lo tanto no se recomienda aumentar la
frecuencia.
Tabla de Medias por Mnimos Cuadrados para Humedad con intervalos de confianza del 95,0%
Nivel Casos Media Error Estndar
Lmite Inferior
Lmite Superior
MEDIA GLOBAL
40 23,053
Frecuencia 25 10 23,116 0,190323 22,719 23,513 35 10 23,442 0,190323 23,045 23,839 45 10 23,045 0,190323 22,648 23,442 55 10 22,609 0,190323 22,212 23,006
Flujo 40 8 25,4988 0,212788 25,0549 25,9426 80 8 24,6588 0,212788 24,2149 25,1026 120 8 23,2313 0,212788 22,7874 23,6751 160 8 21,485 0,212788 21,0411 21,9289 200 8 20,3912 0,212788 19,9474 20,8351
Frecuencia por Flujo 25,40 2 25,885 0,425576 24,9973 26,7727 25,80 2 24,54 0,425576 23,6523 25,4277 25,120 2 23,215 0,425576 22,3273 24,1027 25,160 2 21,17 0,425576 20,2823 22,0577
-
24
25,200 2 20,77 0,425576 19,8823 21,6577 35,40 2 25,885 0,425576 24,9973 26,7727 35,80 2 25,19 0,425576 24,3023 26,0777 35,120 2 23,815 0,425576 22,9273 24,7027 35,160 2 21,505 0,425576 20,6173 22,3927 35,200 2 20,815 0,425576 19,9273 21,7027 45,40 2 24,985 0,425576 24,0973 25,8727 45,80 2 24,75 0,425576 23,8623 25,6377 45,120 2 23,485 0,425576 22,5973 24,3727 45,160 2 21,8 0,425576 20,9123 22,6877 45,200 2 20,205 0,425576 19,3173 21,0927 55,40 2 25,24 0,425576 24,3523 26,1277 55,80 2 24,155 0,425576 23,2673 25,0427 55,120 2 22,41 0,425576 21,5223 23,2977 55,160 2 21,465 0,425576 20,5773 22,3527 55,200 2 19,775 0,425576 18,8873 20,6627
d) Si estamos operando a 120 gpm y 25 Hz, hasta qu valor podemos aumentar la frecuencia sin afectar la humedad?
Con un anlisis similar al del tem (c) tomando 120 gpm y variando las frecuencias se
obtiene para las medias:
25 35 45 55
23,215 23,815 23,485 22,41
En este caso el LSD es igual al anterior con un rango correspondiente de: 23,2151,255=
(21,96 24,47) lo cual nos representa igualdad de medias con un flujo de 120 y
frecuencias de 25, 35, 45 y 55, es decir no se observa un cambio significativo; por lo
tanto se recomienda no aumentar la frecuencia.
e) Si cada gpm adicional nos cuesta $250, cada % de reduccin de humedad nos da ingresos por $3,900/hora, y estamos operando a 120 gpm y 45 Hz, cunto ganamos (o perdemos) en un da de produccin si el combustible lo aumentamos a 200 gpm?
Con la tabla de medias para mnimos cuadrados se extrae la informacin
correspondiente a una frecuencia de 45 y flujos de 120 y 200:
-
25
45,120 23,485
45,200 20,205
%Reduccin de humedad=23,485-20,205=3,28
Como 3,28>LSD=1,255 entonces si hay un incremento en el ingreso y por lo tanto se realiza el
siguiente anlisis:
Los costos de operacin (C) por 1 da son:
C=80gal/min*$250/gal*60min/1h*24h/da=$28 800 000/da
Los ingresos (I) obtenidos por un da son:
I=3,28%*$3 900/%h*24h/da=$307 008/da
Entonces la utilidad (U) es:
U=I-C=-$28 492 992/da
Perdemos $28 492 992 por da, por lo tanto no se recomiendan estos cambios.
-
26
5. DISEO FACTORIAL: CONSUMO DE COMBUSTIBLE
1. Se desea analizar el comportamiento del consumo de combustible con el par y la velocidad
de giro de un motor.
Pruebas en Condicin Constante
Par (N.m) N (rpm) m. fuel (Kg/hr)
1,51 2268 0,1546
1,52 2284 0,1472
1,49 2307 0,1506
1,48 2238 0,1493 1,47 2261 0,1542
Diferencia relevante (m. fuel)
D 0,01
Se requiere inicialmente de las siguientes tablas para hallar el nmero de rplicas.
Var 0,0000101320
a 2
b 3 alpha 0,05
Regin de Experimentacin Factor Inf Sup Niveles RPM 2000 2500 2 Par 1 3 3
Se usa la curva de operacin caracterstica para determinar el tamao de la muestra. Empezando con la diferencia de medias de dos renglones en donde 1 es el grado de libertad
de a (a-1=1) y v2 es el grado de libertad del error (v2=ab(n-1))
22
22naD
b
=
n fi2 fi v1 v2 beta N
2 6,580 2,565 1 6 0,180 12
3 9,870 3,142 1 12 0,022 18
-
27
Continuando con la diferencia de medias de dos columnas en donde 1 es el grado de libertad
de b (b-1=2) y v2 es el grado de libertad del error (v2=ab(n-1))
2
222
nbDa
=
n fi2 fi v1 v2 beta N
2 14,805 3,848 2 6 < 0,01 12
3 22,207 4,712 2 12 < 0,01 18 Por ltimo el valor que corresponde a una diferencia entre dos efectos de interaccin en
donde 1 es el grado de libertad de ab ((a-1)(b-1)=2) y v2 es el grado de libertad del error
(v2=ab(n-1))
22
22 [( 1)( 1) 1]nD
a b
=
+
n fi2 fi v1 v2 beta N
2 3,290 1,814 2 6 0,450 12
3 4,935 2,221 2 12 0,180 18
4 6,580 2,565 2 18 0,040 24 Luego de probar las tres ecuaciones para hallar el nmero de rplicas se escoge la tercera
frmula dado que el cociente de los grados de libertad es menor (1/3), esto es, genera un nivel
crtico. Por lo anterior se requieren cuatro rplicas para obtener un
-
28
RPM Par Consumo Temperatura 2000 1 0,214 192 2500 1 0,359 216 2000 2 0,224 224 2500 2 0,289 252 2000 3 0,279 256 2500 3 0,374 284 2000 1 0,194 205 2500 1 0,309 222 2500 2 0,354 248 2000 2 0,279 220 2000 3 0,329 249 2500 3 0,478 282 2000 1 0,12 199 2000 2 0,279 224 2000 3 0,329 248 2500 3 0,388 287 2500 1 0,279 228 2500 2 0,269 253
Llevando a cabo el diseo del experimento nos queda:
a. ANOVA PARA LA VARIABLE RESPUESTA CONSUMO:
Fuente Suma de Cuadrados
Gl Cuadrado Medio
Razn-F Valor-P
EFECTOS PRINCIPALES A:RPM 0,040328 1 0,040328 21,82 0,0005 B:Par 0,043003 2 0,0215015 11,64 0,0016 INTERACCIONES AB 0,00705033 2 0,00352517 1,91 0,1908 RESIDUOS 0,0221747 12 0,00184789 TOTAL (CORREGIDO) 0,112556 17 Todas las razones-F se basan en el cuadrado medio del error residual
-
29
Se observa que son significativos los factores RPM y PAR (P_value0,05). Lo anterior es correcto siempre y cuando se
cumplan los supuestos.
b. PRUEBA DE SUPUESTOS
1. Normalidad de Residuales
SnapStat: Anlisis de Una Muestra
Datos/Variable: Residuos CRecuento = 18Promedio = 1,66667E-9Desviacin Estndar = 0,0361164Coeficiente de Variacin = 2,16698E9%Mnimo = -0,056Mximo = 0,0646667Rango = 0,120667Sesgo Estandarizado = 0,302127Curtosis Estandarizada = -1,04316
Histograma
-0,08 -0,04 0 0,04 0,08Residuos C
0
1
2
3
4
5
6
frecu
enci
a
Grfico de Caja y Bigotes
-0,06 -0,03 0 0,03 0,06 0,09Residuos C
Intervalos de confianza del 95%Media: 1,66667E-9 +/- 0,0179603 [-0,0179603, 0,0179603]Sigma: [0,0271013, 0,0541436]
DiagnsticosValor-P de Shapiro-Wilks = 0,2234Autocorrelacin en Retraso 1 = 0,0453269 +/- 0,461969
0 3 6 9 12 15 18Fila
-0,06
-0,03
0
0,03
0,06
0,09
Resi
duos
C
Grfico Secuencias Cronolgicas Grfico de Probabilidad Normal
-0,06 -0,03 0 0,03 0,06 0,09Residuos C
0,115
2050809599
99,9
porc
enta
je
-
30
Como en la prueba de shapiro-Wills el P_value=0,2234>0,05, se acepta la normalidad en los
residuos.
2. Igualdad de Varianzas
En las grficas se observa una amplitud aproximadamente igual y por lo tanto no existe
evidencia que indique varianza no constante.
2000 2500
Grfico de Residuos para Consumo
-0.07
-0.04
-0.01
0.02
0.05
0.08
resid
uos
RPM
1 2 3
Grfico de Residuos para Consumo
-0.07
-0.04
-0.01
0.02
0.05
0.08
resi
duos
PAR
-
31
3. Independencia de Residuales
Se observa que los residuos se encuentran dispersos. Por lo tanto no hay razn para sospechar
la violacin del supuesto de independencia. Lo anterior conlleva a confirmar los supuestos y la
validez del modelo.
Grfico de Residuos para Consumo
-0.07
-0.04
-0.01
0.02
0.05
0.08
resid
uos
0 3 6 9 12 15 18nmero de fila
-
32
SnapStat: Anlisis de Una Muestra
Datos/Variable: RESIDUOSRecuento = 18Promedio = 0,0Desviacin Estndar = 0,5Coeficiente de Variacin = %Mnimo = -0,95Mximo = 0,95Rango = 1,9Sesgo Estandarizado = 0,0Curtosis Estandarizada = -0,523898
Histograma
-1,1 -0,7 -0,3 0,1 0,5 0,9 1,3RESIDUOS
0
1
2
3
4
5
6
frecu
enci
a
Grfico de Caja y Bigotes
-1 -0,6 -0,2 0,2 0,6 1RESIDUOS
Intervalos de confianza del 95%Media: 0,0 +/- 0,248645 [-0,248645, 0,248645]Sigma: [0,375194, 0,749572]
DiagnsticosValor-P de Shapiro-Wilks = 0,9155Autocorrelacin en Retraso 1 = -0,608824 +/- 0,461969
0 3 6 9 12 15 18Fila
-1
-0,6
-0,2
0,2
0,6
1
RESI
DUO
S
Grfico Secuencias Cronolgicas Grfico de Probabilidad Normal
-1 -0,6 -0,2 0,2 0,6 1RESIDUOS
0,115
2050809599
99,9
porc
enta
je