Mini Curso # 4:
Estatística para Bioquímica e
Biotecnologia
Ministrado por:
Dr. Marcelo Caldeira Viegas
CONSIDERAÇÕES INICIAIS
A competitividade e o alto custo tornam,
a cada momento, mais difícil pensar em
desenvolvimento de produtos e processos
sem agregar uma metodologia científica de
trabalho.
Estatística para Bioquímica e Biotecnologia
ALIMENTOS
Algumas
áreas de
aplicações
QUíMICA
PETROQUíMICA
FARMACÉUTICA
BIOTECNOLOGIA ...... ENGENHARIA
Estatística para Bioquímica e Biotecnologia
Limitações da Estatística:
1o) Toda a informação está contida nos dados. A conclusão, no
máximo, terá a qualidade dos dados que a geraram. Se os
dados forem iniciados ou coletados inadequadamente,
qualquer conclusão que deles advenham está
comprometida.
“A estatística não serve para corrigir erros grosseiros ou técnica
defeituosa”
2o) A Estatística apenas auxilia o pesquisador, mas não dispensa
o espírito científico crítico e cético, nem o conhecimento
profundo do processo em estudo.
Estatística para Bioquímica e Biotecnologia
Teste de Hipóteses
Estatística para Bioquímica e Biotecnologia
Teste de Hipóteses
Regra de decisão estatística que permite,
com base em informações contidas nos
dados amostrais, concluir sobre
parâmetros da população (Estatística
Inferencial).
.
Estatística para Bioquímica e Biotecnologia
Hipótese Estatística
É uma suposição sobre algum parâmetro
da população, que será posta à prova
através do teste de hipóteses.
Consideram-se, sempre, duas hipóteses:
H0 e H1, denominadas, respectivamente,
hipótese nula e hipótese alternativa.
Estatística para Bioquímica e Biotecnologia
Hipótese Nula (H0)
H0 é a hipótese que está sendo colocada à
prova (exemplo: o pH médio da população
alvo é igual a 5,0).
Estatística para Bioquímica e Biotecnologia
Hipótese Alternativa (H1)
H1 é a hipótese que será aceita, se for
rejeitada no teste. Exemplos:
H1: O pH médio da população alvo é diferente de 5,0 Teste bilateral
H1: μ5,0
H1 : O pH médio da população alvo é menor que 5,0 Teste unilateral à
esquerda
H1: μ<5,0
H1 : O pH médio da população alvo é maior que 5,0 Teste unilateral à
direita
H1: μ>5,0
Teste de Hipóteses
Escolha do Tipo de Distribuição Amostral
Distribuição Normal ou t-Student ?
- Distribuição Normal (Teste Z)
Se n>30
Se n<30 e o desvio padrão populacional () for conhecido
- Distribuição t-Student (Teste t)
Se n<30 e o desvio padrão populacional () for desconhecido
Estatística para Bioquímica e Biotecnologia
Teste de Hipóteses - Valores
Críticos(Tabelados):
Distribuição Normal (Teste Z)
Se o nível de confiança for de 90%, Zcrit=±1,65
Se o nível de confiança for de 95%, Zcrit=±1,96
Se o nível de confiança for de 99%, Zcrit=±2,57
Distribuição t-Student (Teste t)
O valor de tcrit depende do tamanho da amostra (n). Anexo 1
Estatística para Bioquímica e Biotecnologia
Testes de Hipóteses
Mecanismo dos erros
Como o teste de hipóteses é baseado em amostras
aleatórias, há sempre algum risco de erro.
É importante lembrar que uma outra amostra
retirada poderia fornecer valores diferentes daquela
utilizada na realização do teste.
Estatística para Bioquímica e Biotecnologia
Erro do tipo I ou de primeira espécie: rejeitar H0, quando
H0 é verdadeira.
A probabilidade de cometermos um erro do tipo I,
também conhecida como nível de significância do teste, é
denotada por α e escolhida a priori pelo pesquisador.
Em geral, o nível de significância α = 0,05 (5%) é muito
bem aceito pela comunidade científica.
α = P (erro tipo I) = P (rejeitar H0, quando H0 é
verdadeira).
Estatística para Bioquímica e Biotecnologia
O nível de confiança, 1 - α, varia de acordo com o
interesse e a exigência do pesquisador, devendo ser
fixado a priori.
Um valor bem aceito universalmente é 1 - α = 0,95
ou, em termos de porcentagens, (1 - α)% = 95% e
será aqui adotado.
Teste de Hipóteses
Estatística para Bioquímica e Biotecnologia
Erro do tipo II ou de segunda espécie: não rejeitar H0,
quando H0 é falsa.
A probabilidade de cometermos um erro do tipo II é
denotada por β.
β = P (erro tipo II) = P (não rejeitar H0, quando H0 é
falsa).
Estatística para Bioquímica e Biotecnologia
Realidade na
População
Resultado do Teste Estatístico
Aceita H0
Rejeita-se H0
H0 é verdadeira
Resultado correto:
não há erro
Erro do Tipo I
H0 é falsa
Erro do Tipo II
Resultado correto:
não há erro
Mecanismo dos erros num teste estatístico
Estatística para Bioquímica e Biotecnologia
Testes de hipóteses
Regra dos 4 passos
a. Enunciar claramente as hipóteses H0: μ = μ0 e H1: μ μ0;
b. Fixar o nível de significância α e determinar as regiões críticas
do teste: de aceitação (RA) e de rejeição (RR) de H0, definidas
pelo valor tabelado de t(n-1; α/2). Em geral α = 0,05 (5%);
c. Calcular o valor da estatística do teste
d. Decisão Estatística: Comparar o valor calculado (item c) com o
valor que delimita as regiões críticas (item b). Dependendo do
resultado a hipótese nula (H0) será aceita ou rejeitada.
n
s
xtCalc
0
Regiões Críticas
São as regiões de aceitação de H0, que denotaremos RA H0, e de
rejeição de H0, que denotaremos RR H0.
Teste bilateral: Se -t(n-1; α/2) < tCalc < t(n-1; α/2) , aceita H0, ou
equivalentemente, através do p-valor, rejeita-se H0 se p-valor α.
Figura 01: Esboço de um teste bilateral, para a média de uma população
normal, H1: μ μ0
Figura 02: Esboço de um teste unilateral para a média de uma população
normal, H1 : μ > μ0. p-valor > .
Regiões Críticas
Teste Unilateral a Direita: Aceita H0, quando tCalc <
tTab ou, equivalentemente, quando p – valor > α =
0,05 (95% de confiança).
tCalc tTab
0
2
4
-6 -4 -2 0 2 6 0
R A Ho : 1 - alfa = 0,95
R R Ho : alfa = 0,05
p - valor > 0,05
tTab tCalc
0
2
4
-6 -4 -2 0 2 4 6 0
R A Ho : 1 - alfa = 0,95 R R Ho : alfa = 0,05
p - valor < 0,05
Figura 03: Esboço de um teste unilateral a direita para a média de uma
população normal, H1 : μ > μ0. P-valor<
Regiões Críticas
Teste Unilateral a Direita: Rejeita-se H0,
quando tCalc tTab ou, equivalentemente, quando
p – valor α = 0,05 (95% de confiança).
Planejamento Experimental
Design of Experiments (DOE)
e
Otimização de Processos Livro Texto:
“Planejamento de Experimentos e Otimização de Processos”
autores: M. Isabel Rodrigues e Antonio Francisco Iemma,
Campinas, 2ª. edição, 2009
Os Planejamentos Experimentais Fatoriais se
baseiam na Estatística, mas a atividade estatística
mais importante não é a análise dos dados , e sim o
planejamento dos experimentos em que esses
dados devem ser obtidos.
Estatística para Bioquímica e Biotecnologia
NOÇÕES SOBRE EXPERIMENTOS FATORIAIS
ESTATÍSTICA
BOM SENSO
PROCESSO
Estatística para Bioquímica e Biotecnologia
Para se atingir os objetivos desejados utilizando-se esta
ferramenta estatística e necessário uma interação entre:
“Em diversas situações, é imediato estabelecer
conclusões a partir de um experimento bem planejado,
empregando apenas técnicas de análise bastante
elementares. Por outro lado, mesmo a análise
estatística mais sofisticada não pode salvar um
experimento que tenha sido mal planejado”.
(Box, Hunter & Hunter)
Estatística para Bioquímica e Biotecnologia
Porque aprender Planejamento de Experimentos?
Desenvolvimento de um novo produto e/ou processo
Melhorar o produto que já está no mercado
Conhecer o efeito das variáveis do processo
Melhorar metodologias analíticas
Redução de custos
Otimização do processo
Estatística para Bioquímica e Biotecnologia
“O sucesso de um planejamento de experimentos
dependerá em grande parte da forma com que este é
estruturado e como será realizado. Entender
claramente quais são os objetivos de realizar um
experimento é necessário antes de qualquer ação
para executá-lo.”
Montgomery (2009)
Estatística para Bioquímica e Biotecnologia
Vantagens do Planejamento Experimental:
Reduz o número de experimentos, com melhor qualidade de
informação nos resultados;
É possível detectar o erro experimental e avaliá-lo;
A análise multivariável permite verificar e quantificar efeitos
sinérgicos e antagônicos entre as variáveis estudadas;
É possível otimizar mais de uma resposta ao mesmo tempo;
Estatística para Bioquímica e Biotecnologia
Roteiro para elaboração de um planejamento de experimentos:
a) Análise do processo;
b) Escolha dos fatores (variáveis independentes) e dos níveis que
serão avaliados;
c) Seleção das variáveis resposta;
d) Escolha do planejamento experimental mais adequado;
e) Realização dos ensaios conforme indicado pelo delineamento
experimental (item d);
f) Análise dos dados (Modelo Obtido , ANOVA, Superfície de
Respostas e Curvas de Contorno);
g) Conclusões e Recomendações;
Estatística para Bioquímica e Biotecnologia
Variáveis Independentes:
Fatores a serem estudados ou avaliados num processo (que
podem ser controladas)
Ex.: Formulação, temperatura, pH, agitação, aeração, tempo
de residência, vazão de alimentação, pressão, etc...
Variáveis Dependentes:
Respostas desejadas (determinadas experimentalmente)
Ex.: Rendimento, produtividade, índice de expansão,
atributos sensoriais, fator de pureza, atividade
enzimática, etc...
Estatística para Bioquímica e Biotecnologia
R1,2,...j = f (F1, F2, ..... Fk)
Estabelecer uma função matemática que correlacione as
variáveis estudadas em função da(s) resposta(s)
determinada(s).
Estatística para Bioquímica e Biotecnologia
Fatores
Níveis K=2 K=3 K=6 K
2 22=4 23=8 26=64 2k
3 32=9 33=27 36=729 3k
..... ..... ..... ..... .....
N N2 N3 N6 NK
Como pode ser visto pela Tabela 01, o nº. de ensaios cresce
exponencialmente, praticamente inviabilizando a utilização de
delineamentos completos para 6 ou mais fatores com dois níveis e para 4
ou mais fatores com 3 níveis.
Tabela 01: Nº. de ensaios experimentais de alguns delineamentos
fatoriais completos
Estatística para Bioquímica e Biotecnologia
Estatística para Bioquímica e Biotecnologia
Comparação entre o planejamento
fatorial versus estudo de um fator
por vez.
Estudo de caso em bioprocessos
Estatística para Bioquímica e Biotecnologia
AVALIAÇÃO DO EFEITO DO pH e
TEMPERATURA NA ATIVIDADE DE
UMA ENZIMA
Estudo de Caso:
Augusto, A C.S.; Costa, F.A.A. e Rodrigues, M.I.
Laboratório de Engenharia de Bioprocessos
FEA – UNICAMP, 2002
a) Estudo de uma variável por vez (10 ensaios):
Ensaios a 40oC a
diferentes valores de pH
Ensaios a pH 4,0 e diferentes
valores de temperatura
pH
Atividade
(U/mL)
Temperatura
(oC)
Atividade
(U/mL)
3,0
251
30
158
4,0
274
40
292
5,0
236
50
393
6,0
149
60
456
7,0
53
70
215
Estatística para Bioquímica e Biotecnologia
pH
Ati
vid
ad
e (
U/m
L)
50
100
150
200
250
300
2,5 3,5 4,5 5,5 6,5 7,5
Temperatura ( o
C)
Ati
vid
ad
e (
U/m
L)
100
200
300
400
500
25 35 45 55 65 75
Atividade enzimática em
função
(a) pH (temperatura de 40o C)
(b) da temperatura (pH igual a 4,0)
b) Estudo Fatorial (25 ensaios):
T=30oC
T=40oC
T=50oC
T=60oC
T=70oC
pH
Ativ.
(U/mL)
pH
Ativ.
(U/mL)
pH
Ativ.
(U/mL)
pH
Ativ.
(U/mL)
pH
Ativ.
(U/mL)
3
162
3
277
3
295
3
61
3
34
4
158
4
287
4
384
4
504
4
409
5
122
5
267
5
346
5
425
5
361
6
68
6
159
6
218
6
253
6
30
7
25
7
51
7
53
7
26
7
3
Estatística para Bioquímica e Biotecnologia
30
40
50
60
70
pH
Ati
vid
ad
e (
U/m
L)
0
100
200
300
400
500
600
2,5 3,5 4,5 5,5 6,5 7,5
Comportamento da atividade enzimática em diferentes pH e
temperaturas (o C)
Estatística para Bioquímica e Biotecnologia
Delineamento Experimental
Fatorial 2K (dois níveis)
Estatística para Bioquímica e Biotecnologia
Experimentos com Delineamento Fatorial 2K
Os delineamentos com esquema fatorial 2K, ocorrem
quando temos K fatores, todos com dois níveis (-1 e +1).
Delineamentos deste tipo são muito utilizados em
laboratórios e locais onde as fontes externas de variação
são, geralmente muito bem controladas.
Eles apresentam uma vantagem incontestável: fornecem o
maior número possível de graus de liberdade para o
resíduo (erro).
Estatística para Bioquímica e Biotecnologia
a.1) Delineamento Fatorial 2K com repetições (replicatas genuínas) :
Suponha um experimento para estudar a atividade enzimática em função do pH
(fator A) e da temperatura (fator B), ambos avaliados em dois níveis que
denominaremos apenas de baixo (-1) e alto (+1), realizados em triplicata (três
repetições), conforme descrito na Tabela 02.
Tabela 02: Atividades Enzimáticas (U/mL), segundo o pH e a temperatura
Ensaios
Fatores
Tratamentos
Repetições
Totais
Ativ.
Enzim.
(Média) pH (A) Temp. (B) 1 2 3
1 3 (-1) 30 (-1) 1 218 212 170 600 200
2 7 (+1) 30 (-1) a 67 73 76 216 72
3 3 (-1) 70 (+1) b 402 399 411 1212 404
4 7 (+1) 70 (+1) ab 222 258 270 750 250
Estatística para Bioquímica e Biotecnologia
Uma descrição esquemática dos resultados desse experimento pode ser
visualizado na Figura 04.
Figura 04: Representação Esquemática dos Resultados Obtidos
Estatística para Bioquímica e Biotecnologia
a.1.1) Delineamento Fatorial 2K com repetições (Cálculo dos Efeitos
Principais dos Fatores e da Interação sobre as Respostas) -
O efeito principal de um fator ”A” pode ser entendido como a variação
causada na resposta, quando percorremos todos os níveis de ”A”,
independente dos demais fatores.
No exemplo em questão podemos estimar o efeito principal do pH como a
diferença entre as atividades enzimáticas médias no nível alto e o nível
baixo do pH. Considerando a Figura 04, podemos obter:
2
)1(
2
babayyApH pHpH
Figura
00,14100,30200,161 pHpH
Figura yyApH
A passagem do pH do
nível (-1) para (+1), levou
uma diminuição de
141,00 U/mL na média da
atividade enzimática.
Estatística para Bioquímica e Biotecnologia
a.1.1) Delineamento Fatorial 2K com repetições (Cálculo dos Efeitos
Principais dos Fatores e da Interação sobre as Respostas) -
De modo análogo, para o efeito principal da temperatura (fator B):
2
)1(
2ˆ.
aabbyyBTemp TT
Figura
A passagem da Temp.
do nível (-1) para (+1),
levou uma acréscimo de
190,00 U/mL na média
da atividade enzimática.
00,19100,13600,327ˆ. TT
Figura yyBTemp
Estatística para Bioquímica e Biotecnologia
a.1.1) Delineamento Fatorial 2K com repetições (Cálculo dos Efeitos
Principais dos Fatores e da Interação sobre as Respostas) -
Neste modelo simples, temos apenas uma interação de primeira ordem,
isto é, uma interação entre os níveis de dois fatores. A estimativa do efeito
da interação pode ser obtida através da Figura 04 como a diferença entre
as médias determinadas pelas diagonais principal e secundária.
2
1
22
1 abbabaabABpH x Temp. Figura
132
25040472200ˆ
BApH x Temp. Figura
Efeito de Interação
entre os fatores pH e
Temperatura.
Estatística para Bioquímica e Biotecnologia
a.1.2) Ajuste do Modelo
O modelo linear em relação aos parâmetros estudados é
dado pela equação:
jjjjijr xxxxy 211222110 .
Onde: x1 e x2 são as variáveis independentes.
Estatística para Bioquímica e Biotecnologia
a.1.2) Ajuste do Modelo
Os parâmetros 0, 1, 2 e 12 do modelo de regressão, que serão
estimados através do método dos mínimos quadrados.
Para fins práticos, a estimativas de 0 é a média geral das respostas:
50,231
4
1363273021610
y
As estimativas dos demais parâmetros são iguais às metades das
estimativas dos efeitos correspondentes:
50,62
13
2
50,952
191
2
50,702
00,141
2
12
2
1
BA
B
A
Assim, o modelo ajustado é:
.*50,65,9550,7050,231 TemppHTemppHyijr
Estatística para Bioquímica e Biotecnologia
a.1.3) Análise de Variância (Contrastes e Soma dos Quadrados)
As somas dos quadrados podem ser obtidas elevando-se ao quadrado a
estimativa do contraste e, dividindo-se o resultado pelo produto entre a
soma de quadrados dos coeficientes do contraste e o número de
repetições (Tabela 03).
Contrastes Totais Valor dos
Contrastes
Soma dos
Quadrados do
Coeficiente
216+750-600-1212 -846 4
1212+750-600-216 1146 4
750+600-216-1212 -78 4
aabbB )1(
baabBA )1(
babaA )1(
Tabela 03: Atividades Enzimáticas (U/mL), Contrastes Totais
(Considerando Repetições)
Estatística para Bioquímica e Biotecnologia
a.1.4) Análise de Variância (ANOVA)
Assim, com base na Tabela 03, calcula-se diretamente:
00507
34
78
4
0010944334
1146
4
005964334
846
4
22
22
22
,*r
BAmp.)SQ(pH x TeSQ(AB)
,*r
BSQ(Temp)SQ(B)
,*r
ASQ(pH)SQ(A)
A Soma Quadrática (SQ) Total Corrigida e a SQ Resíduo são calculadas
conforme segue:
00,2736Re
00,172329)50,231(*1200,815436 222
ABSQBSQASQSQTsSQ
ynySQT
c
ijr
ijrc
Estatística para Bioquímica e Biotecnologia
a.1.4) Delineamento Fatorial 2K com repetições (Análise de Variância -
ANOVA)
A Tabela 04 apresenta a análise de variância (ANOVA) calculados anteriormente.
Fonte de
Variação
Soma dos
Quadrados
(SQ)
Graus de
Liberdade
Média dos
Quadrados
(MQ)
Fcal Hipóteses
pH (A) 59643,00 1 59643,00 174,39 H0: 1=0
(rejeitada)
Temp. (B) 109443,00 1 109443,00 320,01 H0: 2=0
(rejeitada)
pH x Temp.
(AB)
507,00 1 507,00 1,48 H0: 12=0
(aceita)
Resíduo 2736,00 (n-p) 8 342,00 R2=98,41%
n: nº. total de ensaios; p: nº. de
parâmetros do modelo Total 172329,00 (n-1) 11 -
Ftab(1,8 ; 95%)= 5,32 Tabela 04: ANOVA - Atividades Enzimáticas (U/mL)
%,otalVariação T
elo Modeloxplicada pVariação E*%R 4198
172329
507109443596431001002
Estatística para Bioquímica e Biotecnologia
Anexo 2
a.1.4) Análise de Variância (Interpretação)
Observa-se pela Tabela 04 que o efeito de interação pH x
temperatura não foi significativo (Ftab < Fcal) e que os efeitos
principais de pH e da temperatura foram altamente
significativos. Em outras palavras, se aceita a hipótese H0:
12=0 (aceita).
Se, e apenas se, o efeito de interação não for significativo
poderemos interpretar isoladamente cada efeito principal.
Estatística para Bioquímica e Biotecnologia
a.1.5) Delineamento Fatorial 2K com repetições (Estimativas das
Variâncias e Erro Padrão – Efeitos)
A estimativa das variâncias para as variáveis codificadas é dada pela
equação abaixo:
00,1143
342Re)ˆ(
r
sQMyyVarAVar pHpH
Assim, uma estimativa do erro padrão da estimativa do fator A (pH), é
dado por:
68,1000,114ˆ Aep
Estatística para Bioquímica e Biotecnologia
a.1.5) Delineamento Fatorial 2K com repetições (Estimativas das
Variâncias e Erro Padrão – Efeitos)
De modo análogo podem ser obtidas as estimativas dos erros padrões
das estimativas de B (temperatura) e de AB (interação), conforme valores
apresentados na Tabela 05.
Para a constante (média), temos:
34,550,28
50,2812
00,342Re)(
yep
n
sQMyVar
Estatística para Bioquímica e Biotecnologia
a.1.6) Delineamento Fatorial 2K com repetições (t calculado e
Intervalo de Confiança – Efeitos)
Os valores de tcalc são obtidos pela equação abaixo:
eptcalc
Então, para a média, o pH, a temperatura e a interação temos,
respectivamente:
-1,22
10,68
13,00-
BAep
BA t; 17,89
10,68
191,00
Bep
Bt
-13,2110,68
141,00-
Aep
A t43,36;
5,34
231,50
yep
yt
calccalc
calccalc
Estatística para Bioquímica e Biotecnologia
a.1.6) Delineamento Fatorial 2K com repetições (t calculado e
Intervalo de Confiança – Efeitos)
Para a estimativa do intervalo de confiança, aplica-se a equação abaixo:
6724001368103120013
672400191681031200191
672400141681031200141
33125023134531250231
95
95
95
95
95895
,,,.,,pHxTemp.IC
,,,.,,Temp.IC
,,,.,,pHIC
,,,.,,yIC
θeptθθIC
%
%
%
%
%;%
Estatística para Bioquímica e Biotecnologia
Anexo 1 ttab(8 g.l. ; 95%)= 2,31
a.1.6) t calculado e Intervalo de Confiança – Estimativa dos Efeitos
A Tabela 05 apresenta o erro padrão, tcalc e os limites de confiança dos
efeitos de cada fator calculados anteriormente.
Fatores Efeitos Erro
Padrão
tcalc Limite
Inferior
(95%)
Limite
Superior
(95%)
Média 231,50 5,34 43,36 219,19 243,81
pH -141,00 10,68 -13,21 -165,62 -116,38
Temperatura 191,00 10,68 17,89 166,38 215,62
pH x Temp. -13,00 10,68 -1,22 -37,62 11,62
Tabela 05: Erro padrão e limites de confiança dos Efeitos
ttab(8 g.l. ; 95%)= 2,31
Estatística para Bioquímica e Biotecnologia
Pelos dados da tabela 05 pode-se notar que o único valor de tcalc que
pertence à região de aceitação de H0 é aquele relativo à interação. Tais
resultados podem ser descritos no Diagrama de Pareto.
Os valores absolutos de tcalc, também denominados efeitos
padronizados, fornecem as alturas das barras que por sua vez são
dispostas de modo decrescente.
O valor de ttab (2,31) completa o diagrama fornecendo o valor a partir do
qual os efeitos são significativos, como pode ser visto na Figura 04.
Estatística para Bioquímica e Biotecnologia
a.1.7) Delineamento Fatorial 2K com repetições - Diagrama de Pareto
a.1.7) Delineamento Fatorial 2K com repetições - Diagrama de Pareto
Figura 04: Diagrama de Pareto
Estatística para Bioquímica e Biotecnologia
Pareto Chart of Standardized Effects; Variable: Atividade Enzimática (U/mL)
2**(2-0) design; MS Pure Error=342,
DV: Atividade Enzimática (U/mL)
-1,21756
-13,2059
17,88879
p=,05
Standardized Effect Estimate (Absolute Value)
1by2
(1)pH
(2)Temp. (ºC)
-1,21756
a.1.8) Delineamento Fatorial 2K com repetições (Valores preditos pelo
modelo)
Figura 05: Valores Preditos versus Observados
Estatística para Bioquímica e Biotecnologia
Observed vs. Predicted Values
2**(2-0) design; MS Pure Error=342,
DV: Atividade Enzimática (U/mL)
0 50 100 150 200 250 300 350 400 450
Observed Values
0
50
100
150
200
250
300
350
400
450
Pre
dic
ted
Va
lue
s
a.1.9) Delineamento Fatorial 2K com repetições -
Superfície de Respostas e Curvas de Contorno
A descrição gráfica do modelo ajustado anteriormente é
conhecida como superfície de repostas (Figura 06), bem
como a projeção de seus cortes sobre o plano dos fatores
gerando as curvas de contorno (Figura 07), é muito útil na
interpretação dos resultados e na otimização do processo em
questão.
Estatística para Bioquímica e Biotecnologia
a.1.9) Delineamento Fatorial 2K com repetições - Superfície de
Respostas e Curvas de Contorno
Figura 06: Superfície de Resposta
Experimentos Fatoriais
Fitted Surface; Variable: Atividade Enzimática (U/mL)
2**(2-0) design; MS Pure Error=342,
DV: Atividade Enzimática (U/mL)
> 400
< 340
< 240
< 140
< 40
2,53,0
3,54,0
4,55,0
5,56,0
6,57,0
7,5
pH
2530
3540
4550
5560
6570
75
Temp. (ºC)
0
100
200
300
400
500
Ativid
ad
e E
nzim
átic
a (U
/mL)
z=128;375-27;125*x+5;5875*y-;1625*x*y+0;
Figura 07: Curvas de Contorno
Experimentos Fatoriais
a.1.9) Delineamento Fatorial 2K com repetições - Superfície de
Respostas e Curvas de Contorno Fitted Surface; Variable: Atividade Enzimática (U/mL)
2**(2-0) design; MS Pure Error=342,
DV: Atividade Enzimática (U/mL)
> 400
< 390
< 340
< 290
< 240
< 190
< 140
< 90
< 40
2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5
pH
25
30
35
40
45
50
55
60
65
70
75
Te
mp
. (º
C)
z=128;375-27;125*x+5;5875*y-;1625*x*y+0;
a.1.9) Delineamento Fatorial 2K com repetições - Superfície de
Respostas e Curvas de Contorno
Pelas Figuras 06 e 07 observa-se que nos intervalos estudados, as
maiores atividades enzimáticas ocorreram para níveis baixos de pH e
altos níveis de temperatura.
Condições Otimizadas:
pH: 2,5 ~4,5
Temp.: 50 ~ 75ºC
Estatística para Bioquímica e Biotecnologia
a.2) Delineamento Fatorial 2K sem repetições:
Para apresentar os conceitos que serão expostos neste item, estaremos
supondo que no exemplo anterior o pesquisador tenha feito o experimento
apenas uma única vez, ou registrado apenas as médias das observações.
Neste contexto temos apenas quatro respostas conforme apresentado na
Tabela 06.
Tabela 06: Atividades Enzimáticas (U/mL), segundo o pH e a temperatura
Ensaios
Fatores
Tratamentos Ativ. Enzimática
Média (Totais) pH (A) Temp. (B)
1 3 (-1) 30 (-1) 1 200
2 7 (+1) 30 (-1) a 72
3 3 (-1) 70 (+1) b 404
4 7 (+1) 70 (+1) ab 250
Estatística para Bioquímica e Biotecnologia
a.2.1) Delineamento Fatorial 2K sem repetições (Efeitos e Coeficientes):
É fácil verificar, utilizando os conceitos empregados no item a.1, que as
estimativas dos efeitos e os coeficientes do modelo são idênticas àquelas já
obtidas considerando as repetições (triplicata), como pode ser visto na Tabela 07.
Tabela 07: Atividades Enzimáticas (U/mL), Efeitos e Coeficientes (Sem
Repetições)
Fatores Efeitos Coeficientes do Modelo
Média (Constante) 231,50 231,50
pH -141,00 -70,50
Temperatura 191,00 95,50
pH x Temp. -13,00 -6,50
Estatística para Bioquímica e Biotecnologia
a.2.2) Delineamento Fatorial 2K sem repetições (Contrastes e Soma
dos Quadrados):
O valor dos contrastes e a soma dos quadrados são apresentados na
Tabela 08.
Contrastes Totais Valor dos
Contrastes
Soma dos
Quadrados do
Coeficiente
72+250-200-404 -282 4
404+250-200-72 382 4
250+200-72-404 -26 4
aabbB )1(
baabBA )1(
babaA )1(
Tabela 08: Atividades Enzimáticas (U/mL), Contrastes Totais (sem
repetições)
Estatística para Bioquímica e Biotecnologia
a.2.3) Delineamento Fatorial 2K sem repetições (ANOVA):
Assim, com base na Tabela 08, calcula-se diretamente:
169
14
26
4
3648114
382
4
1988114
282
4
22
22
22
*r
BAmp.)SQ(pH x TeSQ(AB)
*r
BSQ(Temp)SQ(B)
*r
ASQ(pH)SQ(A)
A Soma Quadrática (SQ) Total Corrigida e a SQ Resíduo são calculadas
conforme segue:
zeroABSQBSQASQSQTsSQ
ynySQT
c
ijr
ijrc
Re
56531)50,231(*4270900 222
Estatística para Bioquímica e Biotecnologia
a.2.3) Delineamento Fatorial 2K sem repetições (ANOVA):
A Tabela 09 apresenta a análise de variância (ANOVA), sem considerar as
repetições.
Fonte de
Variação
Soma dos
Quadrados
(SQ)
Graus de
Liberdade
Média dos
Quadrados
(MQ)
Fcal Hipóteses
pH (A) 19881,00 1 19881,00 - -
Temp. (B) 36481,00 1 36481,00 - -
Ph x Temp.
(AB)
169,00 1 169,00 - -
Resíduo 0 (n-p) 0 0 R2=100,00%
n: nº. total de ensaios; p: nº.
de parâmetros do modelo Total 56531,00 (n-1) 3 -
Tabela 09: Tabela ANOVA - Atividades Enzimáticas (U/mL) sem repetições
%otalVariação T
elo Modeloxplicada pVariação E*%R 00,100
56531
16936481198811001002
Estatística para Bioquímica e Biotecnologia
a.2.3) Delineamento Fatorial 2K sem repetições (ANOVA):
A partir dos dados da Tabela 09 podemos observar que não temos graus
de liberdades para o resíduo, indicando é impossível efetuar qualquer
inferência sobre as repostas, evidenciando que apenas a estatística
descritiva é permitido em tal situação. Em outras palavras, se não há
resíduo então não há erro padrão e, portanto, não é possível construir
estimativas por intervalos, testes de hipótese (t e F) ou obter previsões.
Assim sendo, mesmo que possamos apresentar o modelo com os
coeficientes da Tabela 07 e construir as superfícies de respostas e as
curvas de contorno, mas não há qualquer valor científico nisso, além da
descrição da amostra.
Estatística para Bioquímica e Biotecnologia
a.2.4) Delineamento Fatorial 2K sem repetições (Diagrama de Pareto)
Figura 08: Diagrama de Pareto
Estatística para Bioquímica e Biotecnologia
Pareto Chart of Effects; Variable: Atividade Enzimática (U/mL)
2**(2-0) design
DV: Atividade Enzimática (U/mL)
-13,
-141,
191,
-20 0 20 40 60 80 100 120 140 160 180 200 220
Effect Estimate (Absolute Value)
1by2
(1)pH
(2)Temp. (ºC)
a.3) Delineamento Fatorial 2K com adição de ponto central:
Para tornar possível o uso, ao menos aproximada, da inferência
estatística, é usual serem feitos alguns ensaios no ponto central do
espaço experimental. Com tal procedimento estaremos viabilizando o
cálculo dos resíduos, e consequentemente do erro padrão e das
estimativas por intervalo, viabilizando assim os testes de hipóteses (t e F).
Suponhamos que no exemplo anterior sejam feitos três ensaios no ponto
central, conforme indicado na Tabela 10.
Estatística para Bioquímica e Biotecnologia
a.3) Delineamento Fatorial 2K com adição de ponto central:
Ensaios
Fatores
Tratamentos
Atividade
Enzimática
(U/mL) pH (A) Temp. (B)
1 3 (-1) 30 (-1) 1 200
2 7 (+1) 30 (-1) a 72
3 3 (-1) 70 (+1) b 404
4 7 (+1) 70 (+1) ab 250
5 (C) 5 (0) 50 (0) - 150
6 (C) 5 (0) 50 (0) - 140
7 (C) 5 (0) 50 (0) - 160
Média 196,57
Tabela 10: DOE - Adição de Ensaios no Ponto Central
Estatística para Bioquímica e Biotecnologia
a.3.1) Delineamento Fatorial 2K com adição de ponto central (Ajuste
do Modelo):
Observa-se que agora, torna-se possível estimar algum resíduo, embora
de modo rudimentar, pois temos apenas 3 repetições adicionais.
Para estimar os resíduos são mantidos os coeficientes de regressão
obtido anteriormente no item a.1.2, exceto a constante, que é calculada
com a nova média geral das atividades enzimáticas (resposta).
O modelo é dado pela equação abaixo:
.*5,65,9550,7057,196 TemppHTemppHAtividade
Estatística para Bioquímica e Biotecnologia
a.3.2) Delineamento Fatorial 2K com adição de ponto central
(ANOVA):
A Soma Quadrática (SQ) Total Corrigida e a SQ Resíduo são calculadas
conforme visto anteriormente:
711158600169003648100198817168117Re
Re
7168117571967338596222
,,,,,sSQ
ABSQBSQASQSQTsSQ
,,*ynySQT
c
ijr
ijrc
Estatística para Bioquímica e Biotecnologia
a.3.2) Delineamento Fatorial 2K com adição de ponto central (ANOVA
- SS Residual):
Fonte de
Variação
Soma dos
Quadrados
(SQ)
Graus de
Liberdade
Média dos
Quadrados
(MQ)
Fcal Hipóteses
pH (A) 19881,00 1 19881,00 5,14 H0: 1=0
(aceita)
Temp. (B) 36481,00 1 36481,00 9,45 H0: 2=0
(aceita)
pH x Temp.
(AB)
169,00 1 169,00 0,04 H0: 12=0
(aceita)
Resíduo 11586,71 (n-p) 3 3862,24 R2=82,99%
n: nº. total de ensaios; p: nº. de
parâmetros do modelo Total 68117,71 (n-1) 6 -
Ftab(1,3 ; 95%)= 10,13 Tabela 11: ANOVA - Atividades Enzimáticas (U/mL) Ponto Central
%otalVariação T
elo Modeloxplicada pVariação E*%R 99,82
71,68117
16936481198811001002
Estatística para Bioquímica e Biotecnologia
Anexo 2
a.3.3) Delineamento Fatorial 2K com adição de ponto central (Erros):
Os erros padrões, para a constante e para os demais efeitos são
calculados de modo análogo aos já obtidos anteriormente.
Para a constante, temos:
49,237
24,3862Re)(
n
sQMyep
Para os demais efeitos, temos:
15,621
24,3862Re)()()(
r
sQMABepBepAep
Estatística para Bioquímica e Biotecnologia
a.3.3) Delineamento Fatorial 2K com adição de ponto central (Erros):
A Tabela 12 apresenta o erro padrão, tcalc e os limites de confiança dos
efeitos de cada fator calculados anteriormente.
Fatores Efeitos Erro Padrão tcalc
Média 196,57 23,49 8,37*
pH -141,00 62,15 -2,27
Temperatura 191,00 62,15 3,07
pH x Temp. -13,00 62,15 -0,21
Tabela 12: Erro padrão dos Efeitos (delineamento com ponto central)
ttab(3 g.l. ; 95%)= 3,18
* Significativo ao nível de 95%
Estatística para Bioquímica e Biotecnologia
Anexo 1
a.3.4) Delineamento Fatorial 2K com adição de ponto central (Gráfico
de Pareto):
Figura 09: Gráfico de Pareto (SS Residual)
Estatística para Bioquímica e Biotecnologia
Pareto Chart of Standardized Effects; Variable: Atividade Enzimática (U/mL)
2**(2-0) design; MS Residual=3862,238
DV: Atividade Enzimática (U/mL)
-,209182
-2,26882
3,073363
p=,05
Standardized Effect Estimate (Absolute Value)
1by2
(1)pH
(2)Temp. (ºC)
-2,26882
3,073363
a.3.2) Delineamento Fatorial 2K com adição de ponto central (ANOVA
– Erro Puro):
Tabela 13: ANOVA - Atividades Enzimáticas (U/mL) - Ponto Central
Estatística para Bioquímica e Biotecnologia
Anexo 2 F0,95; 1; 2 = 18,51
Fonte de
Variação
Soma dos
Quadrados
(SQ)
Graus de
Liberdade
Média dos
Quadrados
(MQ)
Fcal
pH (A) 19881,00 1 19881,00 198,81
Temp. (B) 36481,00 1 36481,00 364,81
pH x Temp. (AB) 169,00 1 169,00 1,69
Falta de Ajuste 11386,71 (m-p) 1 11386,71 113,87
Erro Puro 200,00 (n-m) 2 100,00 R2=82,99%
Total 68117,71 (n-1) 6
nº. total de ensaios (n=7); nº. de parâmetros do modelo (p=4); nº de níveis distintos (m=5)
a.3.4) Delineamento Fatorial 2K com adição de ponto central (Gráfico
de Pareto):
Figura 10: Gráfico de Pareto (Erro Puro)
Estatística para Bioquímica e Biotecnologia
Pareto Chart of Standardized Effects; Variable: Atividade Enzimática (U/mL)
2**(2-0) design; MS Pure Error=100,
DV: Atividade Enzimática (U/mL)
-1,3
-14,1
19,1
p=,05
Standardized Effect Estimate (Absolute Value)
1by2
(1)pH
(2)Temp. (ºC)
-1,3
DELINEAMENTO
COMPOSTO CENTRAL
ROTACIONAL
Central Composite Design
Estatística para Bioquímica e Biotecnologia
Planejamento Composto Central (Central Composite Design):
Um Delineamento Composto Central que tem pontos axiais definidos é
denominado de Delineamento Composto Central Rotacional (DCCR).
O Planejamento composto central (Central Composite Design) deve ser
utilizado quando se quiser verificar a curvatura de um plano; ou seja;
quando se quiser verificar a existência de termos quadráticos no modelo
de regressão.
De modo geral este tipo de planejamento consiste de uma parte referente
ao planejamento fatorial com 2K ensaios fatorias + 2K ensaios em pontos
axiais ou estrelas (ns) + um número arbitrário de repetições no ponto
central (nc).Onde: K – nº. de fatores
Estatística para Bioquímica e Biotecnologia
Planejamento Composto Central (Central Composite Design)
A rotabilidade () depende do nº. de pontos na porção fatorial do
planejamento, e é dado pela equação abaixo:
41
2K
Tabela 14: Valor de em função do nº. de fatores
Nº. da Fatores (k) Porção Fatorial
2 22 22/4 = 1,414
3 23 23/4 = 1,682
4 24 24/4 = 2,00
5 25 25/4 = 2,378
Estatística para Bioquímica e Biotecnologia
Planejamento Composto Central (Central Composite Design):
A Figura 10 apresenta os pontos do planejamento composto central para
o caso de 2 fatores (variáveis independentes).
Figura 11: Pontos experimentais para o planejamento composto central
Estatística para Bioquímica e Biotecnologia
Estatística para Bioquímica e Biotecnologia
Planejamento Composto Central Rotacional
ESTUDO DE CASO 1 (Atividade Enzimática)
Ensaios pH Temperatura (ºC) Atividade
Enzimática (U/mL)
1 -1,00 (3,6) -1,00 (36) 272
2 -1,00 (3,6) 1,00 (64) 457
3 1,00 (6,4) -1,00 (36) 83
4 1,00 (6,4) 1,00 (64) 16
5 -1,41 (3,0) 0,00 (50) 360
6 1,41 (7,0) 0,00 (50) 83
7 0,00 (5,0) -1,41 (30) 132
8 0,00 (5,0) 1,41 (70) 328
9 (C) 0,00 (5,0) 0,00 (50) 396
10 (C) 0,00 (5,0) 0,00 (50) 412
11 (C) 0,00 (5,0) 0,00 (50) 393
12 (C) 0,00 (5,0) 0,00 (50) 371
Estatística para Bioquímica e Biotecnologia
Planejamento Composto Central Rotacional:
Ajuste do Modelo
O modelo quadrático que correlaciona os
parâmetros estudados é dado pela equação:
TpHTTpHpHAtividade *6319,8640,4944,9072,127393 22
F0,95; 5; 6 = 4,4 e F0,95; 3; 3 = 9,28
Estatística para Bioquímica e Biotecnologia
Planejamento Composto Central Rotacional:
ANOVA
Fonte de
Variação
Soma dos
Quadrados
(SQ)
Graus de
Liberdade
Média dos
Quadrados
(MQ)
Fcal
Regressão 249153,5 (p-1) 5 49830,70 25,29
Resíduo 11820,8 (n-p) 6 1970,13
Falta de Ajuste 10966,8 (m-p) 3 36655,60 129,06
Erro Puro 854 (n-m) 3 284,67 R2=95,47%
Total 260974,3 (n-1) 11
Tabela 15: Tabela ANOVA - Atividades Enzimáticas (U/mL) DCCR
nº. total de ensaios (n=12); nº. de parâmetros do modelo (p=6); nº de níveis distintos (m=9)
Anexo 2
Planejamento Composto Central (Central Composite Design)
Figura 12: Gráfico de Pareto (Central Composite Design)
Estatística para Bioquímica e Biotecnologia
Pareto Chart of Standardized Effects; Variable: Atividade Enzimática (U/mL)
2 factors, 1 Blocks, 12 Runs; MS Residual=1970,132
DV: Atividade Enzimática (U/mL)
-2,83872
3,147812
-4,91232
-5,15455
-8,13854
p=,05
Standardized Effect Estimate (Absolute Value)
1Lby2L
(2)Temperatura (ºC)(L)
Temperatura (ºC)(Q)
pH(Q)
(1)pH(L)
-2,83872
3,147812
-4,91232
-5,15455
Planejamento Composto Central (Central Composite Design)
Figura 13: Valores Preditos versus Observados
Estatística para Bioquímica e Biotecnologia
Observed vs. Predicted Values
2 factors, 1 Blocks, 12 Runs; MS Residual=1970,132
DV: Atividade Enzimática (U/mL)
-50 0 50 100 150 200 250 300 350 400 450 500 550
Observed Values
-50
0
50
100
150
200
250
300
350
400
450
500
Pre
dic
ted
Va
lue
s
Planejamento Composto Central (Central Composite Design)
Figura 14: Superfície de Resposta (Central Composite Design)
Estatística para Bioquímica e Biotecnologia
Fitted Surface; Variable: Atividade Enzimática (U/mL)
2 factors, 1 Blocks, 12 Runs; MS Residual=1970,132
DV: Atividade Enzimática (U/mL)
> 400
< 300
< 100
< -100
< -300
< -500
2,53,0
3,54,0
4,55,0
5,56,0
6,57,0
7,5
pH
2530354045505560657075
Temperatura (ºC)
-600-400-200
0
200
400
600
Ativ
idade E
nzim
átic
a (U
/mL)
Figura 15: Curvas de Contorno (Central Composite Design)
Estatística para Bioquímica e Biotecnologia
Planejamento Composto Central (Central Composite Design)
Fitted Surface; Variable: Atividade Enzimática (U/mL)
2 factors, 1 Blocks, 12 Runs; MS Residual=1970,132
DV: Atividade Enzimática (U/mL)
> 400
< 300
< 100
< -100
< -300
< -500
2,5 3,0 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5
pH
25
30
35
40
45
50
55
60
65
70
75
Te
mp
era
tura
(ºC
)
REFERÊNCIAS:
BARROS NETO, B.; SCARMINIO, I. S.; BRUNS, R.
E. Planejamento e Otimização de Experimentos.
Campinas: Editora da UNICAMP, 1995.
MONTGOMERY, D. C. Introdução ao Controle
Estatístico da Qualidade, 4º edição, Rio de
Janeiro: Editora LTC, 2009.
Rodrigues , M. Isabel e Iemma, A. Francisco.
Planejamento de Experimentos e Otimização de
Processos, Campinas: Editora Casa do Pão, 2ª.
edição, 2009.
ANEXO 1 (Tabela t Student)
Slide 11
Slide 54
Slide 78
ANEXO 2 (Tabela F de Fisher - 95% confiança)
Slide 49
Slide 74
Slide 86
Slide 78