metodologia de superfície de resposta marília canabarro zordan sabrina letícia couto da silva mat...
TRANSCRIPT
Metodologia de Superfície de RespostaMetodologia de Superfície de Resposta
Marília Canabarro Zordan
Sabrina Letícia Couto da Silva
MAT 02014 - Planejamento de Experimentos II
MÉTODOS DE SUPERFÍCIE DE RESPOSTA
-Conjunto de técnicas estatísticas usadas para analisar problemas com variáveis independentes contínuas em relação a variável aleatória.
- O objetivo é buscar a combinação dos fatores que otimizam a resposta.
-É usado quando:
• Fixa-se um fator A e varia-se o outro B.
• Fixa-se B onde a resposta é máxima e varia-se A.
• Variando os dois fatores conjuntamente.
- A modelagem é usada para estabelecer a relação entre a variável resposta e a(s) variável (is) independente(s), pois em geral esta não é conhecida e precisa de aproximação.
O procedimento seqüencial na MSR é encontrar os resultados da ANOVA e verificar se:
* São distante do ótimo, com pouca curvatura → Modelo de 1ª ordem
Leva de forma rápida e eficiente até a vizinhança do valor ótimo.
* A região ótima é encontrada → Modelo de 2ª ordem e análise do ótimo
Função e Representação Gráfica
• y é a resposta (variável dependente, p.e, produção de um objeto)
• x1 e x2 são os fatores (p.e, temperatura e pressão)
• y = f(x1,x2) + erro
• E(y) = η → η = f(x1,x2) = Superfície de Resposta
• y = η + erro
Uma possível representação gráfica para a SR seria:
x1 e x2 aparecem no plano
y aparece no eixo perpendicular
Um representação alternativa é o gráfico de contornos.
Desenham-se linhas de igual resposta de um gráfico cujas coordenadas representam os níveis dos fatores:
Para três ou mais fatores é mais comum a representação gráfica da superfície através do gráfico de contornos no espaço bidimensional, fixando um ou mais fatores no nível ótimo.
Exemplo:
Y = produção de uma reação química
A = Tempo de Reação (60,90,120,150,180 min)
B = Temperatura (210,220,230,240,250°C)
Procedimento Clássico
• Fixando B = 225°C → 130 min e 75g
• Fixando A = 130min → 225°C e 75g
E como os fatores se comportam conjuntamente?
É preciso conduzir o experimento variando ambos os fatores simultaneamente e então para representação gráfica usar um gráfico de contornos.
Continuando o exemplo...
A = 65 minutos
B = 225°C
Y = 91g
Conclusão do Exemplo: O procedimento de investigar uma variável independente (fator) de cada vez falha, pois ele assume que o máximo valor produzido por um fator é independente do máximo produzido pelo outro fator, o que nem sempre acontece.
Aproximações
Como nem sempre a relação entre fatores e resposta é conhecida, o primeiro passo em MSR é encontrar uma aproximação adequada para a relação entre eles, dentro de uma faixa limitada do “espaço de fatores”.
Se a resposta é bem modelada por uma função linear das var. independentes:
y = β0 + β1x1 + ... + βkxk + ε
A análise da SR é então feita em termos da SR ajustada.
Modelos de Primeira OrdemMétodo da Máxima Inclinação Ascendente
1 - Delineamentos Exploratórios de Tratamentos
2 – Fatoriais da série 2k
Onde,
K = n° de fatores completos ou fracionados
2 = n° de níveis
3 – Verificar se há acréscimo (decréscimo) na resposta ou não, com a presença dos fatores
• Condições iniciais estão afastadas daquelas que otimizam a resposta → Modelo de 1ª Ordem
• O objetivo é mover o experimento rapidamente para a vizinhança geral do ótimo utilizando um procedimento experimental simples, rápido, econômico e eficiente.
• MMIA procura a MÁXIMA inclinação ascendente
• MMID procura a MÍNIMA inclinação descendente
• O gráfico de contornos da SR de 1ª ordem são uma série de linhas paralelas. A direção da MIA é a direção na qual y estimado cresce mais rapidamente.
X1
X2
Usualmente, toma-se como caminho da MIA a linha a partir do centro da região de interesse e os “passos” ao longo do caminho são determinados pela experiência do pesquisador.
Utiliza-se um conjunto de tratamentos em torno do ponto inicial e estima-se por Mínimos Quadrados as inclinações βi. A partir das magnitudes e sinais destas inclinações, calcula-se a direção da MIA.
• Experimentos são conduzidos ao longo do caminho da MIA até que nenhum incremento na resposta seja observado. E repetir a seqüência novamente.
•Eventualmente chega-se a vizinhança do valor ótimo e isto será indicado pela falta de ajuste do modelo de 1ª ordem.
• A aproximação por um plano se torna insatisfatória pelo fato dos efeitos de ordens mais elevadas, particularmente os de 2ª ordem (quadrático e de interação linear), se tornarem relativamente mais importantes. Nesse caso usa-se Modelo Quadráticos.
EXEMPLO (produção do reagente):
O processo normal é operado com um tempo de 35min e uma temperatura de 155°F, que resulta numa produção de 40%.
Como a região ótima é desconhecida ajusta-se um modelo de 1ª ordem por MMIA.
A região experimental será (30,40) min para o tempo de reação e (150,160)°F para temperatura.
As variáveis independentes podem ser recodificadas para (-1,1) para simplificar os cálculos.
Se ξ1 e ξ2 representam as variáveis naturais para tempo e temperatura respectivamente, os valores são codificados:
5x
5x 1551
2351
1
“Tamanho do Passo”
Média do Intervalo
O delineamento a ser utilizado nesse experimento consiste de um Fatorial 22 aumentado por CINCO PONTOS (Tratamentos) CENTRAIS.
Com a utilização dos pontos centrais é possível estimar o erro experimental e testar a adequabilidade (“lack of fit”) do modelo de 1ª ordem. Além disso, nesse caso, o tratamento central representa as condições de operação normalmente empregadas.
Deve-se ajustar aos dados um modelo de primeira ordem, ou seja, a equação de regressão
2211o xˆxˆˆy
Dados
Variáveis Naturais Variáveis Codificadas Resposta
ξ1 ξ2 x1 x2 y
30 150 -1 -1 39,3
30 160 -1 1 40,0
40 150 1 -1 40,9
40 160 1 1 41,5
35 155 0 0 40,3
35 155 0 0 40,5
35 155 0 0 40,7
35 155 0 0 40,2
35 155 0 0 40,6
A equação de regressão encontrada é:
21 x325,0x775,044,40y
A SQTotal é encontrada da mesma forma de qualquer outra análise, mas é particionada em SQRegressão e SQResíduos. A SQErro com 4GL também é obtida de forma tradicional, porém só com os valores dos pontos centrais.
Assim, o modelo de primeira ordem assume que os fatores possuem um efeito aditivo sobre a resposta.
A interação entre os fatores pode ser obtida adicionando o termo x1x2 e é medida pelo coeficiente β12. A estimativa é obtida (considerando as variáveis codificadas) por:
)yxyxyxyx(tratden
1ˆ4232211112
tratden
)yy(SQInt
2meioextremos
Para o exemplo...
025,055,41*1)9,40*1()40*1(3,39*14
1ˆ12
0025,04
)]5,4040()5,413,39[(SQInt
2
A estatística da falta de ajuste é:
058,0043,0
0025,0
QME
SQIntF F(1,4)=7,71 a 5%
Logo, NS.
1 GL
Outra verificação da adequabilidade do modelo é obtida pela comparação da resposta média dos quatro pontos do fatorial (40,425), com a resposta média do centro do delineamento (40,46).
Se β11 e β22 são os coeficientes dos termos
quadráticos , então a diferença das médias
é uma estimativa de β11+ β22.
22
21 xex
035,046,40425,40yyˆˆ211211
0027,054
)035,0)(5*4(
nn
)yy(nnSQQuad
2
cf
221cf
0663,00430,0
0027,0
QME
coSQQuadrátiF
Efeito quadrático NS a 5% de significância.
Causas da Variação SQ GL QM F
Regressão 2,8250 2 1,4125 47,83*
Resíduo 0,1772 6 0,0295
Interação 0,0025 1 0,0025 0,058
Quadr. Puro 0,0027 1 0,027 0,063
Erro 0,1720 4 0,0430
Total 3,0022 8
* Significante a 1%
Assim, não existe nenhuma razão para questionar o modelo de primeira ordem. Os próximos passos da MIA devem seguir.
Os fatores devem variar nas proporções das estimativas dos Betas, ou seja, para cada 0,775 unidades acrescidas em x1, x2 deve aumentar 0,325 unidades. Destransformando-a, direção da MIA é definida por:
5x0,775 = 3,875 minutos → 5x0,325=1,625°
O caminho principal a partir da origem (0,0) nesta direção pode ser obtido por um incremento conveniente a um dos fatores (p.e, 5 minutos para tempo). As mudanças proporcionais do outro fator:
0,325/0,775=0,42.
Assim, estas quantidades devem ser acrescidas aos níveis base dando origem ao caminho da MIA.
O engenheiro realizou os ensaios de acordo com esse caminho e observou a produção nesses pontos até que um decréscimo na resposta foi notado.
Os resultados estão na tabela a seguir:
i
Variáveis Codificadas Variáveis Naturais Resposta
X1 X2 ξ1 ξ2 y
Nível Base 0 0 35 155
Unidade 5 5
Unidade* 3,875 1,625
Variação do Nível 1,00 0,42 5 2
Ensaio 1 1 0,42 40 157 41,0
Ensaio 2 2 0,84 45 159 42,9
Ensaio 3 3 1,26 50 151 47,1
Ensaio 4 4 1,68 55 163 49,7
Ensaio 5 5 2,10 60 165 53,8
Ensaio 6 6 2,52 65 167 59,9
Ensaio 7 7 2,96 70 169 65,0
Ensaio 8 8 3,36 75 171 70,4
Ensaio 9 9 3,78 80 173 77,6
Ensaio 10 10 4,20 85 175 80,3
Ensaio 11 11 4,62 90 177 76,2
Ensaio 12 12 5,04 95 179 75,1
Incrementos na resposta são observados até o 10° passo; depois há um decréscimo na produção.
Portanto, outro modelo de primeira ordem pode ser ajustado em torno do ponto (85,175). A região de exploração para tempo seria (80,90) e de temperatura (170,180).
Codificam-se os níveis das variáveis tempo e temperatura novamente como (-1,1) e um delineamento fatorial 22 acrescido de 5 pts centrais será utilizado.
Assim repete-se todo o processo e os resultados são analisados a seguir:
Variáveis Naturais
Variáveis Codificadas
Resposta
1 2 X1 X2 y
80 170 -1 -1 76.5
80 180 -1 1 77.0
90 170 1 -1 78.0
90 180 1 1 79.5
85 175 0 0 79.9
85 175 0 0 80.3
85 175 0 0 80.0
85 175 0 0 79.7
85 175 0 0 79.8
Dados para ajuste do segundo modelo de 1ª Ordem:
x e x 21 5
175
5
85 21
O modelo de 1ª Ordem ajustado aos dados codificados é dado por:
Ŷ = 78.97 + 1.00 X1 + 0.50 X2
Causas da Variação SQ GL QM F
Regressão 5,0000 2 2,5000 47,17*
Resíduo 11,1200 6
Interação 0,2500 1 0,2500 4,72
Quadr. Puro 10,6580 1 10,6580 201,09 *
Erro Puro 0,2120 4 0,0530
Total 16,1200 8
* Significativo a 1%
- Pela tabela de ANOVA, o componente do termo quadrático puro foi significativo, isso implica que o modelo de 1ª Ordem não é uma aproximação adequada;
- Essa curvatura na real superfície pode indicar que se está próximo do ótimo. Assim, análises adicionais devem ser feitas para localizar o ótimo com mais precisão.
Algoritmo geral para determinar as coordenadas de um ponto no caminho da máxima inclinação ascendente:
- assumir que o ponto x1=0, x2=0, ...,xk=0 é a base ou origem.
1. Escolha um tamanho para uma das variáveis independentes,
por exemplo, xj. Geralmente, selecionamos a variável que
temos maior conhecimento, ou aquela que tem maior
coeficiente de regressão em módulo .
2. O passo nas demais variáveis é:
|ˆ| j
ji k;1,2,...,i xjj
i
xi /ˆ
ˆ
3. Converter xi das variáveis codificadas para as variáveis naturais.
- Quando o pesquisador está próximo da região de ótimo, um modelo que incorpora o efeito de curvatura é indicado.
O modelo de 2ª Ordem é dado por:
Análise de Modelos de Segunda OrdemAnálise de Modelos de Segunda Ordem
jiij
k
iiii
k
iii xxxxy
1
2
10
• Como encontrar o ponto ótimo (estacionário)?
• Qual a natureza da superfície de reposta?
Localização do ponto estacionário
Desejamos encontrar os níveis de x1, x2, ...,xk, que maximizam a resposta estimada (predita).
Este ponto, se existir, será um conjunto de x1, x2, ...,xk para o qual as derivadas parciais são iguais a zero:
.0/ˆ..../ˆ/ˆ 21 kxyxyxy
Esse ponto, x1.S, x2.S, ...,xk.S é o dito PONTO ESTACIONÁRIOPONTO ESTACIONÁRIO.
Este ponto pode representar um MÁXIMO, MÍNIMO ou PONTO DE SELA.
Ponto de máximo (xS)
x1
x2
•
8070
60
x1
x2
•
6070
80
Ponto de mínimo (xS)
Determinação do ponto estacionário:
Solução matemática geral. O modelo de 2ª Ordem escrito na forma matricial fica:
Bxxbxy 'ˆˆ ' 0
kk
2k22
1k1211
k
2
1
k sim.
..
B
.
.
.b
x
x
x
x
ˆ.
.
.
2/ˆ.ˆ2/ˆ...,2/ˆˆ
ˆ
ˆ
ˆ
.
.
.2
1
Onde: b é um vetor (k x 1) dos coeficientes de regressão de 1ª ordem e B é uma matriz simétrica (k x k) onde na diagonal têm-se os coeficientes de regressão de 2ª ordem e fora da diagonal os coeficientes de interação.
As derivadas parciais dos valores preditos da resposta ( y chapéu) com relação aos elementos de x e colocadas iguais a zero são dadas por:
0Bxbx 2y
O ponto estacionário é a solução da equação anterior, ou seja,
bBx 1 21
s
O valor predito da variável resposta no ponto estacionário é:
bx '21
0ˆˆ ssy
Demonstração:
bx2
1y
bBb2
1y
bIBb4
1bBb
2
1y
bBBBb4
1bBb
2
1y
Bxxbxy
0
10
110
1110
0
'
'
''
''
'
ˆˆ
ˆˆ
ˆˆ
ˆˆ
'ˆˆ
Natureza da superfície de resposta
Desejamos saber se o ponto estacionário é um ponto de máximo, mínimo ou ponto de cela.
-Forma mais direta: gráfico de contorno do modelo de regressão ajustado aos dados.
-Mesmo com poucas variáveis independentes, uma análise mais formal, denominada de Análise Canônica, pode ser útil.
Análise Canônica (Facilita a interpretação dos resultados!!!)
Considere uma translação (novo sistema de coordenadas) da superfície de resposta da origem (x1, x2,...,xk)=(0, 0,...,0) para o ponto estacionário xS e então rotacione os eixos desse sistema até que eles fiquem paralelos aos eixos principais da superfície de resposta ajustada.
Na figura no próximo slide isso pode ser visualizado...
x1
x2
x1,S
x1,S
w2
w1
A função de resposta em termos das novas variáveis w1, w2,...,wk (forma canônica) é dada por:
2222
211 ...ˆˆ kks wwwyy
Onde os wi são as variáveis indep. transformadas e os i são constantes. O ŷs é a resposta estimada no ponto estacionário xS. Os i são os autovalores ou raízes características da matriz B.
FORMA CANÔNICA DO MODELO
Estudo da natureza da Superfície de RespostaEstudo da natureza da Superfície de Resposta
- Este estudo pode ser feito considerando o ponto estacionário e os sinais e magnitudes dos (i).
- Suponha que o ponto estacionário esteja dentro da região na qual foi ajustado o modelo de 2ª ordem.
- Se todos os valores de (i) são positivos, então, xs é um ponto de resposta mínima; se os (i) são todos negativos, então, xs é um ponto de resposta máxima; se os valores de (i) tem sinais positivos e negativos, então, xs é um ponto de sela.
- Além disso, a superfície tem inclinação na direção de wi para o qual o valor de |i| é maior.
- Por exemplo, na figura anterior, xs é um ponto de máximo (todos os (i) são negativos) e |1| > |2|.
Exemplo 2:Exemplo 2: vamos continuar com a análise do processo químico do ex 1 (2ª fase do estudo).
Para ajustar um modelo de 2ª ordem, o pesquisador decide aumentar o delineamento com pontos adicionais (o engenheiro usou 4 OBS adicionais mais ou menos no mesmo tempo em que executou os 9 tratamentos anteriores).
Os 4 tratamentos adicionais foram:
(x1=0; x2=± 1,414)
(x1=± 1,414; x2=0)
Este delineamento denomina-se de DELINEAMENTO CENTRAL COMPOSTO.
Delineamento central compostoVariáveis naturais Variáveis codificadas Respostas
1
2 x1 x2 y1
(produção)y2
(viscosidade)y3
(peso molecular)80 170 -1 -1 76.5 62 294080 180 -1 1 77.0 60 347090 170 1 -1 78.0 66 368090 180 1 1 79.5 59 389085 175 0 0 79.9 72 348085 175 0 0 80.3 69 320085 175 0 0 80.0 68 341085 175 0 0 79.7 70 329085 175 0 0 79.8 71 3500
92,07 175 1,414 0 78.4 68 336077,93 175 -1,414 0 75.6 71 3020
85 182,07 0 1,414 78.5 58 363085 167,93 0 -1,414 77.0 57 3150
VARIÁVEL RESPOSTA
•(0,0)
(-1,1)
(-1,-1)
(1,1)
(1,-1)
x1
x2
•
•
• •
•
•
•
•
(1,414,0)
(0,-1,414)
(0,1,414)
(-1,414,0)
Delineamento Central Composto para o exemplo 1 (processo químico)
Response Surface for Variable PRODUCAO
Response Mean 78.476923 Root MSE 0.266290 R-Square 0.9827 Coef. of Variation 0.3393
Degrees of Type I Sum Regression Freedom of Squares R-Square F-Ratio Prob > F
Linear 2 10.042955 0.3494 70.814 0.0000 Quadratic 2 17.953749 0.6246 126.6 0.0000**
Crossproduct 1 0.250000 0.0087 3.526 0.1025 NS
Total Regress 5 28.246703 0.9827 79.669 0.0000
Degrees of Sum of Residual Freedom Squares Mean Square F-Ratio Prob > F
Lack of Fit 3 0.284373 0.094791 1.789 0.2886 NS
Pure Error 4 0.212000 0.053000 Total Error 7 0.496373 0.070910
Análise no DOE do SAS 8.0:
EfeitoQuadrático
significativo a 1%.O modelo de 2ª
Ordem será ajustado!
Gráfico de ContornoGráfico de Contorno
Pelo gráfico de contornos, observa-se que o processo é mais sensível (levemente) à mudanças no tempo de reação do que para mudanças na temperatura.
Superfície de RespostaSuperfície de Resposta
Observa-se que o ótimo está próximo de 175oF e 85 min e que a resposta neste ponto é um ponto de máximo.
Ponto Ótimo (85 min; 175º F)
Determinação da localização do ponto estacionário (máximo).
Temos que:
001,11250,0
1250,03761
5150
9950 ,
,
,Bb
O ponto estacionário é dado por:X1,s
.306,0
389,0
515,0
995,0
0096,10917,0
0917,07345,021
21
s
-
bBx 1
X2,s
Em termos das variáveis naturais, o ponto estacionário é dado por:
51763060
8795863890
25175
1585
2
1
,,
,,
O valor da resposta estimada no ponto estacionário é:
.21,80515,0
995,0306,0389,0ˆ
ˆˆ '21
0
21
s
s
79.94y
y bxs
ANÁLISE CANÔNICA - Objetivo: caracterizar a superfície de resposta
Vamos expressar o modelo ajustado na forma canônica. 1º precisamos encontrar os autovalores, 1 e 2. Os autovalores são as raízes do determinante da equação:
00013112500
1250037701
0IB
,,
,,
A equação fica: 02 71.362663932.377786As raízes desta equação de segundo grau são: 1=-0,9635 e 2=-1,4143. A forma canônica do modelo ajustado fica:
22
21 w41431w963502180y ,,,ˆ
Ponto de máximoAmbos negativos