actividad6_sanchez_campoy_cm_.pdf

36
DISEÑO ESTADÍSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERÍA - MASTER EN ESTADÍSTICA APLICADA - AUTORA: CARMEN MARÍA SÁNCHEZ CAMPOY 1 A A c c t t i i v v i i d d a a d d 6 6 T T e e m m a a 6 6 TRABAJO REALIZADO POR : CARMEN Mª SÁNCHEZ CAMPOY PROFESORES : RAMÓN GUTIÉRREZ SÁNCHEZ MARIA DOLORES RUIZ MEDINA CURSO : DISEÑO ESTADÍSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERÍA - MASTER ESTADÍSTICA APLICADA -

Upload: capulerio

Post on 02-Oct-2015

34 views

Category:

Documents


3 download

TRANSCRIPT

  • AAccttiivviiddaadd 66 TTeemmaa66

    TRABAJO REALIZADO POR: CARMEN M SNCHEZ CAMPOY

    PROFESORES: RAMN GUTIRREZ SNCHEZ MARIA DOLORES RUIZ MEDINA

    CURSO: DISEO ESTADSTICO EXPERIMENTAL Y CONTROL DE CALIDAD. APLICACIONES EN BIOCIENCIAS E INGENIERA

    - MASTER ESTADSTICA APLICADA -

  • A1. CUESTIONES TERICAS Resolver cuatro actividades tericas.

    1.- Deducir el clculo de las cantidades SSAB y SSE en trminos de las cantidades SST , SSA y

    2 2.

    ...

    1 1

    a bij

    subtotalesi j

    y ySSn abn

    = =

    =

    Continuando con los datos facilitados en el tema 6, sabemos que se cumple la siguiente igualdad:

    ( ) ( ) ( ) ( )2 2 2 2. .... .. ... ... . .. . . ...

    1 1 1 1 1 1 1

    a b n a b a b

    ijk ji ij i ji j k i j i j

    y y bn y y an y y n y y y y= = = = = = =

    = + + + +

    ( )2.

    1 1 1

    a b n

    ijk iji j k

    y y= = =

    +

    Puesto que los productos cruzados son cero, se tiene que:

    T A B AB ESS SS SS SS SS= + + +

    Siendo: Suma de cuadrados totales: con abn-1 grados de libertad, su expresin viene dada por:

    22

    ...

    1 1 1

    a b n

    T ijki j k

    ySS yabn

    = = =

    =

    Sumas de cuadrados de los efectos principales, con a-1 y b-1 grados de libertad cada una, sus expresiones vienen dadas por:

    22

    ...

    ..

    1

    1 aA i

    i

    ySS ybn abn

    =

    = 2

    2...

    . .

    1

    1 bB j

    j

    ySS yan abn

    =

    =

    Sumas de cuadrados debida a la interaccin entre A y B, con (a-1)(b-1) grados de libertad, su expresin viene dada por:

    2 2. 2 2

    ...

    .. . .

    1 1 1 1

    1 1a b a bijAB i j

    i j i j

    y ySS y yn bn an abn

    = = = =

    =

    Sumas de cuadrados debida al error, con ab(n-1) grados de libertad, su expresin viene dada por:

    2 2.

    1 1 1 1 1

    1a b n a bE ijk ij

    i j k i jSS y y

    n= = = = =

    =

    Para obtener otra expresin, consideramos la suma de cuadrados entre los totales de las ab celdas, a la que se denomina suma de cuadrados debida a los "subtotales" y cuya frmula viene dada en el enunciado:

    2 2.

    ...

    1 1

    a bij

    subtotalesi j

    y ySSn abn

    = =

    =

  • Entonces: 2 2 2 2. 2 2... ... ...

    .. . .

    1 1 1 1

    1 1a b a bijsubtotales A B i j

    i j i j

    y y y ySS SS SS y yn abn bn abn an abn

    = = = =

    = =

    2 2. 2 2

    ...

    .. . .

    1 1 1 1

    1 1a b a biji j AB

    i j i j

    y yy y SSn bn an abn

    = = = =

    = =

    Luego: AB subtotales A BSS SS SS SS=

    Si hacemos un sistema de ecuaciones con las dos expresiones de las sumas de cuadrados que hemos obtenido, obtenemos que:

    AB subtotales A B

    T A B AB E

    SS SS SS SSSS SS SS SS SS

    =

    = + + +

    Sustituyendo ABSS en la segunda ecuacin:

    T A B subtotales A B E subtotales ESS SS SS SS SS SS SS SS SS= + + + = + Luego: E T subtotalesSS SS SS= As pues: AB subtotales A BSS SS SS SS= E T subtotalesSS SS SS=

    2.- Determinar el tamao muestral en un diseo bifactorial a partir de la curva caracterstica de operacin del anlisis de la varianza en el modelo de efectos fijos. Dicha curva viene dada por:

    22

    22nbD

    a =

    22

    22naD

    b =

    [ ]2

    222 ( 1)( 1) 1

    nDa b

    = +

    donde D denota la diferencia entre dos efectos medios del factor A (ecuacin (1)), entre dos efectos medios del factor B (ecuacin (2)) y entre dos efectos medios del factor de interaccin (ecuacin (3)). La curva operativa se obtiene representando la probabilidad de aceptar la hiptesis nula frente a los diferentes tamaos muestrales, para un error tipo I, 0,05 = en este caso. Considerar diferentes valores de los parmetros a y b que determinan los grados de libertad del numerador y denominador en las ecuaciones anteriores.

    Para determinar el tamao de la muestra (es decir, el nmero de rplicas, n) apropiado en un diseo factorial de dos factores, podemos hacer uso de las curvas de operacin

  • caracterstica. Estas curvas se utilizan del mismo modo que las tablas de las distribuciones. Fijados unos parmetros se busca el valor deseado de la respuesta, en este caso el tamao de la muestra. Las podemos encontrar dibujadas en los apndices de ciertos libros (por ejemplo: apndice V del libro de Douglas C. Montgomery). Esencialmente, para calcular el tamao de la muestra se necesita fijar el nivel de significacin 0,05 = , el tamao del efecto y la potencia deseada. En el caso de las curvas de operacin los parmetros son: el nivel de significacin, los grados de libertad 1 (grados de libertad del numerador) y 2 (grados de libertad del error) y del parmetro 2 . Una forma de emplear estas curvas consiste en encontrar el valor menor de 2 que corresponde a una diferencia especificada entre las medias de dos tratamientos cualesquiera:

    Si la diferencia en las medias de dos renglones cualesquiera es D, entonces el valor mnimo de 2 es:

    22

    22nbD

    a =

    nde D denota la diferencia entre dos efectos medios del factor A

    Si la diferencia en las medias de dos columnas cualesquiera es D, entonces el valor mnimo de 2 es:

    22

    22naD

    b =

    donde D denota la diferencia entre dos efectos medios del factor B

    Si la diferencia corresponde a una diferencia entre dos factores de interaccin cualesquiera, entonces el valor mnimo de 2 es:

    [ ]2

    222 ( 1)( 1) 1

    nDa b

    = +

    donde D denota la diferencia entre dos efectos medios del factor de interaccin

    La curva operativa se obtiene representando la probabilidad de aceptar la hiptesis nula frente a los diferentes tamaos muestrales, para un error tipo I, 0,05 = en este caso.

    En la tabla siguiente se muestra el valor apropiado del parmetro 2 , as como los grados de libertad del numerador y el denominador:

  • FACTOR

    2

    GRADOS DE LIBERTAD DEL NUMERADOR

    GRADOS DE LIBERTAD DEL DENOMINADOR

    A

    2

    12

    a

    ii

    nb

    a

    =

    a-1 ab(n-1)

    B

    2

    12

    b

    jj

    na

    b

    =

    b-1 ab(n-1)

    AB [ ]

    2

    1 12

    ( )

    ( 1)( 1) 1

    a b

    iji j

    n

    a b

    = =

    +

    (a-1)(b-1) ab(n-1)

    En los grficos siguientes ponemos como ejemplo las curvas de operacin caracterstica obtenidas del apndice V del libro de Douglas C. Montgomery, para el caso de grados de libertad del numerador (v1) 1 y 2, y diferentes valores de grados de libertad del denominador, en dicho apndice podemos encontrar ms grficas para los distintos valores de v1.

    Ejemplo: Para ilustrar con un ejemplo, como podemos obtener el tamao muestral mediante el uso de estas curvas podemos poner un ejemplo, para un caso en el que consideramos la expresin (1) de las curvas de operacin caracterstica, una desviacin tpica de 5, un valor de D=8 y en el que los parmetros a y b toman el valor de 3, en tal caso, se tendra que:

    2 22

    2 238 1,28

    2 235nbD n

    na

    = = = 1,28n =

    1 1 2v a= = Grados de libertad del numerador 2 ( 1) 9( 1)v ab n n= = Grados de libertad del denominador

  • Dando distintos valores a n y buscando en el cuadro para 1 2v = se tiene que: -Para n=2: 1,6 =

    1 2v = 2 9( 1) 9v n= =

    Lo que implica una probabilidad de aceptar la hiptesis nula de 0.45 (buscamos que esta probabilidad sea pequea).

    -Para n=3: 1,96 = 1 2v =

    2 9( 1) 18v n= = Lo que implica una probabilidad de aceptar la hiptesis nula de 0.18 (buscamos que esta probabilidad sea an ms pequea).

    -Para n=4: 2,26 = 1 2v =

    2 9( 1) 27v n= = Lo que implica una probabilidad de aceptar la hiptesis nula de 0.06 (podemos aceptar esta probabilidad).

    Podemos concluir que con 4 rplicas se obtiene una sensitividad deseada. Para terminar con el ejercicio terico-prctico, presentamos un cuadro donde consideramos diferentes valores de los parmetros a y b que determinan los grados de libertad del numerador y denominador y que pueden servir para futuros ejemplos como el anterior:

    Para a=2 y b=3: FACTOR

    2

    GRADOS DE LIBERTAD NUMERADOR

    GRADOS DE LIBERTAD DENOMINADOR

    6 (n=2) 12 (n=3) A

    22

    22nbD

    a =

    1 18 (n=4).....

    6 (n=2) 12 (n=3) B

    22

    22naD

    b =

    2 18 (n=4).....

    6 (n=2) 12 (n=3) AB [ ]

    22

    22 ( 1)( 1) 1nD

    a b =

    + 2

    18 (n=4)..... Para a=4 y b=3:

    FACTOR

    2

    GRADOS DE LIBERTAD NUMERADOR

    GRADOS DE LIBERTAD DENOMINADOR

    12 (n=2) 24 (n=3) A

    22

    22nbD

    a =

    3 36 (n=4).....

    12 (n=2) 24 (n=3) B

    22

    22naD

    b =

    2 36 (n=4).....

    12 (n=2) 24 (n=3) AB [ ]

    22

    22 ( 1)( 1) 1nD

    a b =

    + 6

    36 (n=4).....

  • 3.- Desarrollar el anlisis de la varianza en el modelo bifactorial de efectos fijos, cuando se considera una observacin por celda.

    Un experimento de dos factores, tiene por modelo estadstico: ( )ij i j ij ijy = + + + + 1,...,i a= 1,...,j b=

    Con:

    efecto medio general

    i efecto del i-simo nivel del factor A

    j efecto del j-simo nivel del factor B ( )ij efecto de la interaccin entre i y j

    ij componentes de error aleatorio.

    Considerando los efectos fijos, se tiene: 1

    0a

    ii

    =

    = 1

    0b

    jj

    =

    =

    En un experimento de dos factores con una sola rplica, es decir, en los que slo hay una observacin por celda, se tendra este modelo con ab observaciones. Ahora bien, al examinar los cuadrados medios esperados, se observa que la varianza del error 2 no es estimable, es decir, que el efecto de la interaccin de los dos factores ( )ij y el error experimental no pueden separarse de alguna manera obvia. Por este motivo, no se cuenta con pruebas para los efectos principales a menos que el efecto de la interaccin sea cero. Luego entonces, ( ) 0ij = para cualquier valor de i y j. Consecuente con lo anterior, tenemos que un experimento de dos factores, con una sola rplica, es decir, en los que slo hay una observacin por celda, tiene por modelo estadstico plausible:

    ij i j ijy = + + + 1,...,i a= 1,...,j b= Correspondera a un diseo en bloques aleatorizados, en su caso. Es de inters contrastar la igualdad entre los efectos de los tratamientos del factor A, as como la igualdad entre los tratamientos del factor B. Adicionalmente, es importante contrastar si existen interacciones significativas entre los tratamientos de los dos factores. Es decir, ser conveniente realizar aquellos contrastes con hiptesis nulas:

    0 1: 0aH = = =

    0 1: 0bH = = = 0 : ( ) 0ijH = 1,...,i a= 1,...,j b=

    Teniendo en cuenta que para este caso:

    .

    1

    b

    i ijj

    y y=

    = .1

    a

    j iji

    y y=

    = ..1 1

    a b

    iji j

    y y= =

    =

  • Podemos resumir el anlisis de la variancia para un modelo bifactorial con una observacin por celda, en el cuadro siguiente:

    FUENTE DE VARIACIN SUMA DE CUADRADOS

    GRADOS DE LIBERTAD

    CUADRADO MEDIO

    CUADRADO MEDIO ESPERADO

    A 2 2. ..

    1

    ai

    Ai

    y ySSb ab

    =

    = a-1 AMS 2

    2 1

    1

    a

    ii

    b

    a

    =+

    B 2 2.

    ..

    1

    bj

    Bj

    y ySSa ab

    =

    = b-1 BMS

    2

    12

    1

    b

    jj

    a

    b

    =+

    Residual o AB Sustraccin (a-1)(b-1) Re sidualMS

    2

    1 12

    ( )

    ( 1)( 1)

    a b

    iji j

    a b

    = =+

    Total 2

    2..

    1 1

    a b

    T iji j

    ySS yab

    = =

    = ab-1

    Se tiene que:

    ReT A B sidualSS SS SS SS= + + Si el modelo es apropiado, entonces la media de cuadrados residuales es un estimador insesgado de 2 y los efectos principales pueden probarse mediante la comparacin de AMS y de BMS contra Re sidualMS . Una prueba desarrollada por Tukey (1949) resulta til para determinar si existe el efecto de interaccin. Este procedimiento supone que la forma de la interaccin es particularmente simple, es decir:

    ( )ij i j = En donde es una constante desconocida. Si se define la interaccin de esta forma, puede usarse el mtodo de regresin para probar la significancia de ste trmino. La prueba consiste en descomponer la suma de cuadrados residuales en un componente de un solo grado de libertad debido a la no aditividad del modelo (interaccin) y en un componente para el error con: (a 1)(b 1) 1 grados de libertad Matemticamente se tiene:

    22..

    . . ..

    1 1

    a b

    ij i j A Bi j

    NA B

    yy y y y SS SSab

    SSabSS SS

    = =

    + +

    =

    con un grado de libertad, y ReError sidual NSS SS SS=

    Con (a1)(b1)1 grados de libertad. Para probar la presencia de la interaccin debe calcularse:

    [ ]0 / ( 1)( 1) 1N

    Error

    SSFSS a b

    =

    Si 0 ,1,( 1)( 1) 1a bF F > la hiptesis de interaccin nula debe rechazarse.

  • 4.- Extender el anlisis de la varianza bifactorial, desarrollado en el tema 6, al caso de trifactorial.

    Se considera el caso de diseos trifactoriales, donde hay tres factores A, B y C, con a, b y c niveles, respectivamente, que influyen sobre la respuesta. El modelo estadstico viene dado por:

    ( ) ( ) ( ) ( )ijkl i j k ij ik jk ijk ijkly = + + + + + + + + con 1,...,i a= 1,...,j b= 1,...,k c= 1,...,l n=

    Donde:

    efecto medio general

    i efecto del i-simo nivel del factor A

    j efecto del j-simo nivel del factor B k efecto del k-simo nivel del factor A

    ( )ij efecto de la interaccin entre i y j ( )ik efecto de la interaccin entre i y k ( ) jk efecto de la interaccin entre j y k ( )ijk efecto de la interaccin entre i , j y k

    ijkl componentes de error aleatorio. Suponemos el caso en que A, B y C son fijos, cada rplica del experimento contiene todas las posibles combinaciones de tratamientos, es decir, contiene los abc tratamientos posibles, luego se tiene abcn observaciones. Es de inters contrastar la igualdad entre los efectos de los tratamientos del factor A, B y C, adicionalmente, es importante contrastar si existen interacciones significativas entre los tratamientos de dos o de los tres factores. Las hiptesis que normalmente interesan contrastar son: 0 1: 0aH = = =

    0 1: 0bH = = = 0 1: 0cH = = =

    0 : ( ) 0ijH = 1,...,i a= 1,...,j b= 0 : ( ) 0ikH = 1,...,i a= 1,...,k c=

    0 : ( ) 0jkH = 1,...,j b= 1,...,k c= 0 : ( ) 0ijkH = 1,...,i a= 1,...,j b= 1,...,k c=

    frente a: 1 : al menos existe un con 0iH i 1 : al menos existe un j con 0jH 1 : al menos existe un con 0kH k

  • 1 : al menos existe un ( , ) con ( ) 0ijH i j 1 : al menos existe un ( , ) con ( ) 0ikH i k 1 : al menos existe un (j, ) con ( ) 0jkH k 1 : al menos existe un ( , , ) con ( ) 0ijkH i j k ANLISIS ESTADSTICO: En la descomposicin de la variacin global en el modelo trifactorial de efectos fijos, as como en la construccin de los estadsticos para el contraste de las hiptesis anteriores, se considerar la siguiente notacin:

    ...

    1 1 1

    b c n

    i ijklj k l

    y y= = =

    = . ..1 1 1

    a c n

    j ijkli k l

    y y= = =

    = .. .1 1 1

    a b n

    k ijkli j l

    y y= = =

    =

    ..

    1 1

    c n

    ij ijklk l

    y y= =

    = . .1 1

    b n

    i k ijklj l

    y y= =

    = . .1 1

    a n

    jk ijkli l

    y y= =

    =

    .

    1

    n

    ijk ijkll

    y y=

    = ....1 1 1 1

    a b c n

    ijkli j k l

    y y= = = =

    =

    La suma de cuadrados total se obtiene de la forma:2

    2 ....

    1 1 1 1

    a b c n

    T ijkli j k l

    ySS yabcn

    = = = =

    =

    22 ....

    ( ) .1 1 1

    1 a b cSubtotales ABC ijk

    i j k

    ySS yn abcn

    = = =

    =

    Se tiene que:

    T A B C AB AC BC ABC ESS SS SS SS SS SS SS SS SS= + + + + + + +

    ( )Subtotales ABC A B C AB AC BC ABCSS SS SS SS SS SS SS SS= + + + + + +

    Siendo: Sumas de cuadrados de los efectos principales, con a-1, b-1 y c-1 grados de libertad cada una, sus expresiones vienen dadas por:

    22

    ....

    ...

    1

    1 aA i

    i

    ySS ybcn abcn

    =

    = 2

    2....

    . ..

    1

    1 bB j

    j

    ySS yacn abcn

    =

    = 2

    2....

    .. .

    1

    1 cC k

    k

    ySS yabn abcn

    =

    =

    Sumas de cuadrados debida a las interacciones entre AyB, AyC, y ByC, sus expresiones vienen dadas por:

    2 2..

    ....

    ( )1 1

    a bij

    AB A B Subtotales AB A Bi j

    y ySS SS SS SS SS SScn abcn

    = =

    = =

    2 2. . ....

    ( )1 1

    a ci k

    AC A C Subtotales AB A Ci k

    y ySS SS SS SS SS SSbn abcn

    = =

    = =

    2 2. .

    ....

    ( )1 1

    b cjk

    BC B C Subtotales AB B Cj k

    y ySS SS SS SS SS SSan abcn

    = =

    = =

  • Sumas de cuadrados debida a la interaccin entre los tres factores, A, B y C tiene por expresin:

    2 2.

    ....

    1 1 1

    a b cijk

    ABC A B C AB AC BCi j k

    y ySS SS SS SS SS SS SSn abcn

    = = =

    = =

    ( )Subtotales ABC A B C AB AC BCSS SS SS SS SS SS SS= Sumas de cuadrados debida al error, con abc(n-1) grados de libertad, su expresin viene dada por:

    ( )E T Subtotales ABCSS SS SS= La tabla del anlisis de varianza se presenta en el cuadro siguiente, las pruebas F para los efectos principales y las interacciones se siguen directamente de los cuadrados medios esperados:

    FUENTE DE VARIACIN

    SUMA DE CUADRADOS

    GRADOS DE LIBERTAD

    CUADRADO MEDIO 0F

    A ASS 1 1v a= 1A

    ASSMSa

    =

    0A

    E

    MSFMS

    =

    B BSS 1 1v b= 1B

    BSSMSb

    =

    0B

    E

    MSFMS

    =

    C CSS 1 1v c= 1C

    CSSMSc

    =

    0C

    E

    MSFMS

    =

    AB ABSS 1 ( 1)( 1)v a b= ( 1)( 1)AB

    ABSSMS

    a b=

    0AB

    E

    MSFMS

    =

    AC ACSS 1 ( 1)( 1)v a c= ( 1)( 1)AC

    ACSSMS

    a c=

    0AC

    E

    MSFMS

    =

    BC BCSS 1 ( 1)( 1)v b c= ( 1)( 1)BC

    BCSSMS

    b c=

    0BC

    E

    MSFMS

    =

    ABC ABCSS 1 ( 1)( 1)( 1)v a b c= ( 1)( 1)( 1)ABC

    ABCSSMS

    a b c=

    0ABC

    E

    MSFMS

    =

    Error ESS 2 ( 1)v abc n= ( 1)E

    ESSMS

    abc n=

    Total TSS abcn-1

    De los contrastes planteados, se rechaza la hiptesis nula a un nivel de significacin , cuando

    1 20 , ,v vF F> .

  • En el cuadro siguiente tenemos los cuadrados medios esperados:

    FUENTE DE VARIACIN

    CUADRADOS MEDIOS ESPERADOS

    A [ ]

    22

    1 1

    ai

    Ai

    E MS bcna

    =

    = +

    B [ ]

    22

    1 1

    bj

    Bj

    E MS acnb

    =

    = +

    C [ ]

    22

    1 1

    ck

    Ck

    E MS abnc

    =

    = +

    AB [ ]

    22

    1 1

    ( )( 1)( 1)

    a bij

    ABi j

    E MS cna b

    = =

    = +

    AC [ ]

    22

    1 1

    ( )( 1)( 1)

    a cik

    ACi k

    E MS bna c

    = =

    = +

    BC [ ]

    22

    1 1

    ( )( 1)( 1)

    b cjk

    BCj k

    E MS anb c

    = =

    = +

    ABC [ ]

    22

    1 1 1

    ( )( 1)( 1)( 1)

    a b cijk

    ABCi j k

    E MS na b c

    = = =

    = +

    Error [ ] 2EE MS =

    Bajo las hiptesis nulas planteadas, todas estas cantidades coinciden con la varianza 2 de la componente de error. En cambio, cuando dichas hiptesis no se cumplen la

    magnitud de estas cantidades aumenta. De hecho, si se considera el cociente entre cada una de las variabilidades debidas a los factores principales y las interacciones y la media de cuadrados debida al error, se obtiene que dichos cocientes aumentan en magnitud cuando nos alejamos de la hiptesis nula.

  • A2. TRABAJO

    Elaborar un resumen sobre: Ajuste de curvas y superficies de respuesta.

    1.- INTRODUCCIN Resultar til ajustar una curva de respuesta a los niveles de un factor cuantitativo para que el investigador cuente con una ecuacin que relacione la respuesta con el factor. Esta ecuacin podra utilizarse para hacer interpolaciones, es decir, para predecir la respuesta en niveles intermedios entre los factores, respecto de los que se utilizaron realmente en el experimento. Cuando al menos dos de los factores son cuantitativos, puede ajustarse una superficie de respuesta para predecir y con varias combinaciones de los factores del diseo. En general, se usan mtodos de regresin lineal para ajustar estos modelos a los datos experimentales. Se suele utilizar un paquete de software para generar los modelos de regresin, como SPSS, R, etc.

    Cabe destacar la metodologa de superficies de respuesta (RSM), como el enfoque de optimizacin ms exitoso y generalizado. En general, se usan mtodos de regresin lineal para ajustar estos modelos a los datos experimentales. Adems, los efectos de los factores cuantitativos pueden representarse con efectos polinomiales con un solo grado de libertad. De manera similar, es posible hacer la particin de las interacciones de factores cuantitativos en componentes de interaccin con un solo grado de libertad.

    El enfoque usual es utilizar el diseo de experimentos para determinar cules variables estn influenciando la respuesta de inters. Una vez que dichas variables son identificadas, se obtiene un estimado aproximado de la superficie de respuesta por medio de modelos factoriales especiales. Esta superficie de respuesta se usa como gua para variar gradualmente los factores controlables que afectan la respuesta de manera tal que se mejore el valor de la respuesta. Una vez que el cambio de los factores controlables no origine una mejora predecible en la variable de la respuesta, se puede aplicar un mtodo de experimentacin ms sofisticado para encontrar la superficie de respuesta operativa final del proceso de inters.

    2.- AJUSTE DE CURVAS Y SUPERFICIES DE RESPUESTA. MODELOS DE PRIMER Y SEGUNDO ORDEN

    Definicin: La Metodologa para el Ajuste de Curvas y Superficies de Respuesta es un conjunto de tcnicas matemticas y estadsticas utilizadas para modelar y analizar problemas en los que una variable de inters es influenciada por otras.

    El objetivo es optimizar la variable de inters. Esto se logra al determinar las condiciones ptimas de operacin del sistema.

    Definicin: Los factores son las condiciones del proceso que influencian la variable de respuesta. Estospueden ser cuantitativos o cualitativos.

  • Definicin: La Respuesta,es una cantidad medible cuyo valor se ve afectado al cambiar los niveles de los factores. El inters principal es optimizar dicho valor.

    Al decir que un valor de respuesta Y depende de los niveles 1,..., kx x de k factores, 1,..., kA A , estamos diciendo que existe una funcin matemtica de

    1,..., kx x (que llamaremos funcin de respuesta), cuyo valor para una combinacin dada de los niveles de los factores corresponde a Y, es decir: 1( ,..., )kY f x x= La funcin de respuesta se puede representar con una ecuacin polinomial. El xito depende de que la respuesta se pueda ajustar a un polinomio de primer o segundo grado.

    Supongamos que la funcin de respuesta para los niveles de dos factores se puede expresar utilizando un polinomio de primer grado:

    0 1 1 2 2 Y X X = + + donde 0 1 2, y son los coeficientes de regresin a estimar, 1 2 y X X representan los niveles de 1 2 y A A respectivamente. Suponiendo que se recolectan 3N valores

    de respuesta (Y), con los estimadores 0 1 2, y se obtienen 0 1 2, y respectivamente. Al remplazar los coeficientes de regresin por sus estimadores obtenemos:

    0 1 21 2 Y X X = + +

    donde Y denota el valor estimado de Y dado por 1 2 y X X . La relacin 1( ,..., )KY f X X= entre Y y los niveles de los k factores 1,..., kA A representa una superficie. Con k factores la superficie est en k+1 dimensiones. Por ejemplo cuando se tiene 1( )Y f X= la superficie esta en dos dimensiones:

    Si tenemos 1 2( , )Y f X X= la superficie est en tres dimensiones:

  • Nota: La grfica de contornos facilita la visualizacin de la forma de una superficie de respuesta en tres dimensiones. En sta las curvas de los valores iguales de respuesta se grafican en un plano donde los ejes coordenados representan los niveles de los factores. Cada curva representa un valor especfico de la altura de la superficie, es decir un valor especfico de Y .

    La regin experimental especifica la regin de valores para los niveles de los factores. Esto se puede hacer empleando los niveles actuales de operacin para cada factor,si se desea explorar el vecindario se incrementa y disminuye el valor del nivel en una cantidad determinada.

    2.1. - MODELOS DE PRIMER ORDEN

    Generalmente se desconoce la relacin entre la respuesta y las variables independientes, por ello requerimos un modelo que aproxime la relacin funcional entre Y y las variables independientes. Si la respuesta se describe adecuadamente por una funcin lineal de las variables independientes se utiliza el modelo de primer orden (Cornell (1990)):

    0 1 1 k kY X X = + + + + Los parmetros del modelo se estiman mediante el mtodo de mnimos cuadrados. Una vez que se tienen los estimadores se sustituyen en la ecuacin y obtenemos el modelo ajustado (Cornell (1990)):

    0 1 1 k kY X X = + + +

    Este modelo se utiliza cuando queremos estudiar el comportamiento de la variable de respuesta nicamente en la regin y cuando no conocemos la forma de la superficie.

  • Prueba de la significancia de los coeficientes estimados en el modelo ajustado:De acuerdo a Cornell (1990), para estimar los coeficientes se requieren

    1N k + valores de respuesta (Y). Se necesita del siguiente anlisis de varianza: La variacin total, suma de cuadrados total SST, se calcula de la forma:

    2

    1( )

    N

    T ii

    SS Y Y=

    =

    Donde iY es el valor i-simo observado. La suma de cuadrados se compone por la suma de cuadrados debido a la regresin y la suma de cuadrados no tomada en cuenta por el modelo ajustado. La frmula de la suma de cuadrados debido a la regresin es (Cornell (1990)):

    2

    1( )

    N

    iRi

    SS Y Y=

    =

    La suma de cuadrados residual, se calcula de la siguiente forma (Cornell (1990)): 2

    1( )

    N

    iE ii

    SS Y Y=

    =

    En la siguiente tabla, se tiene el anlisis de varianza, en ella a representa el nmero de trminos del modelo ajustado:

    FUENTE GRADOS DE LIBERTAD

    SUMA DE CUADRADOS

    MEDIA DE CUADRADOS

    Regresin a-1 RSS 1RSS

    a

    Residuo N-a ESS ESS

    N a

    Total N-1 TSS

    La prueba de significacin de la ecuacin de regresin ajustada tiene la siguiente hiptesis nula: 0 0 1: 0kH = = = = Contra la alternativa:

    1 : al menos existe un j con 0jH La prueba supone que el error se comporta normalmente, en sta se utiliza el estadstico de prueba F, el cul se calcula de la forma:

    ( )1( 1)

    R

    R

    E E

    SSSS N aaF SS SS a

    N a

    = =

  • Este se compara con una 1,a N aF . Si F calculada excede este valor la hiptesis nula se rechaza con un nivel de confianza . Esto significa que la variacin explicada por el modelo es significativamente mayor que la variacin inexplicable.

    Adems de esta prueba se puede hacer un anlisis del ajuste del modelo con la R2, que es la proporcin total de la variacin de las observaciones con respecto a la media que se puede explicar con la ecuacin de regresin ajustada. Esta se calcula de la siguiente manera:

    2 R

    T

    SSRSS

    =

    Prueba de falta de ajuste: La falta de ajuste se presenta por la no planaridad o la curvatura de la superficie de respuesta. Requiere que el diseo del experimento satisfaga una serie de requisitos:

    1. El nmero de los distintos puntos del diseo, n, debe exceder el nmero de trminos en el modelo ajustado, es decir 1n k> + .2. Al menos 2 rplicas deben encontrarse en uno o ms puntos del diseo para estimar la varianza del error.

    Adems, los valores del error aleatorio, deben asumir una distribucin normal e independiente con una varianza comn 2 . Al cumplirse las condiciones 1 y 2, la suma de cuadrados residual se compone de dos fuentes de variacin. La primera es la falta de ajuste del modelo ajustado (debido a la exclusin de trminos de mayor orden) y la segunda es la variacin del error puro. Paracalcularlas necesitamos la suma de cuadrados calculada de las rplicas que recibe el nombre de error puro de la suma de cuadrados y sustraer de la suma de cuadrados residual ste para obtener la suma de cuadrados de la falta de ajuste. Es decir (Cornell (1990)):

    2

    1 1( )

    lrn

    lEPURO ill i

    SS Y Y= =

    =

    Donde ilY es la i-sima observacin del l-simo punto del diseo, lY es el promedio de las lr observaciones del l-simo punto del diseo. Se tiene:

    _FALTA AJUSTE E EPUROSS SS SS=

    2_

    1( )

    n

    l lFALTA AJUSTE ll

    SS r Y Y=

    =

    lY es el valor predicho de la respuesta en el l-simo punto del diseo. La prueba de adecuacin del modelo ajustado es:

    _

    _

    ( )( )

    FALTA AJUSTE

    FALTA AJUSTE

    EPURO EPURO

    SSSS N nn aF SS SS n a

    N n

    = =

  • La hiptesis de suficiencia de ajuste con un nivel a de significancia se rechaza cuando el valor calculado del estadstico es mayor a

    , ,n a N nF .

    Cuando la F calculada no es mayor el cuadrado medio residual es utilizado para estimar 2 y para probar la significancia del modelo ajustado. Si hiptesis de suficiencia de ajuste se rechaza, se debe de elevar el grado del modelo aumentando trminos de producto cruzado y/o trminos de mayor grado en 1,..., kx x . Si se requieren puntos adicionales para estimar todos los coeficientes stos se aaden. Se colectan los datos y se vuelve a hacer el anlisis. Si no se rechaza la hiptesis podemos inferir que la superficie es plana. Una vez que se tiene la ecuacin y se ha probado el ajuste se buscan niveles que mejoren los valores de respuesta.

    Mtodo de mxima pendiente en ascenso. Frecuentemente la estimacin inicial de las condiciones de operacin ptimas est alejada del ptimo real, en este caso se desea moverse rpidamente a la vecindad del ptimo. El mtodo de mxima pendiente en ascenso es un procedimiento para recorrer secuencialmente la trayectoria de la mxima pendiente, que nos lleva en direccin del mximo aumento de la respuesta. Cuando se desea la minimizacin se habla de mnima pendiente en descenso.

    De acuerdo a Montgomery (1991), la direccin de ascenso mximo es en la que Y aumenta ms rpido, sta es paralela a la normal de la superficie de respuesta ajustada. Los incrementos a lo largo de la trayectoria son proporcionales a los coeficientes de regresin 0 1, , , k . Los experimentos se llevan a cabo hasta que deje de observarse un incremento en la respuesta, entonces se ajusta un nuevo modelo de primer orden con el que se determina una nueva trayectoria y se continua con el procedimiento. Finalmente, se consigue llegar a la cercana del ptimo, esto ocurre cuando existe falta de ajuste del modelo de primer orden.

    2.2. - POLINOMIO DE SEGUNDO ORDEN

    El modelo de segundo orden es el siguiente (Cornell (1990)): 2

    01 1 1

    k k k

    i i ii i ij i ji i j i j

    Y X X X X = = =