exercÃcio resolvido mcd - wordpress institucional · 2020. 12. 14. · 3 3 0 0 * * $% (ihlwr...
TRANSCRIPT
Análise de dados de classificação simples e dupla
ijiij ey
Modelo de classificação simples: uma variável explanatória
ijkijjiijk ey
Variável resposta
Efeito da variável
explanatória
Efeito das características
estranhas
Modelo de classificação dupla: duas variáveis explanatórias
Variável resposta
Efeito da variável
explanatória A
Efeito das características
estranhas
Efeito da variável
explanatória B
Efeito da interação de
A e B
Modelos de classificação dupla
Os experimentos com dois ou mais fatores de tratamentos são denominados fatoriais e usualmente são assim representados:
Fatorial 2 X 2 experimento com dois fatores, cada um com 2 níveis (mais simples)
Fatorial 2 X 3 experimento com dois fatores, um com 2 e outro com 3 níveis
Fatorial 2 X 3 X 4 experimento com três fatores, um com 2, outro com 3 e outro com 4 níveis
Modelos de classificação dupla são aqueles que exprimem a relação entre uma variável resposta e dois fatores de tratamento.
Por que incluir mais um fator no experimento?- aumentar a amplitude das conclusões- estudar a influência de um fator sobre o outro (interação)
Exemplo resolvido
Programas de computador modernos requerem capacidade de acesso rápido aos dados.Uma pesquisa foi conduzida para estudar o efeito do tamanho do arquivo de dados(Pequeno; Médio e Grande) e do tamanho do buffer (20 kb e 40 kb) sobre o tempo deacesso aos arquivos, medido através do tempo de leitura (em milissegundos).
Tamanho do arquivo
Tamanho do buffer
20 40
Pequeno 2,05; 2,04; 2,21; 2,12 2,32; 2,31; 2,48; 2,42
Médio 2,24; 2,21; 2,23; 2,09 2,52; 2,62; 2,57; 2,61
Grande 2,08; 2,34; 2,33; 2,24 2,71; 2,73; 2,90; 2,72
Experimento com dois fatores
Buffer: área de memória intermediária que serve para acelerar o acesso a dados que estão sendo transferidos entre dispositivos - memória de disco e memória RAM - que operam com velocidades diferentes.
Fatores de tratamento: A - tamanho do arquivo e B - Tamanho de buffer
Variável resposta (y): tempo de leitura (ms)
Tratamentos: 3 x 2 = 6 {P2, P4, M2, M4, G2, G4}
Unidade de pesquisa: computador Total de unidades (n): 24
Número de repetições por tratamento (r): 4
Populações estatísticas
y: variável resposta
Tratamentos distintos geram populações de valores de y distintas?
P2 P4
y
M2 G2 G4
y~N(, )
M4
Modelo de médias
) de difere média uma menos pelo:H
:H
ijT1
G4G2M4M2P4P2T0
Populações estatísticas
y: variável resposta
Se a hipótese de nulidade não é rejeitada, ostratamentos distintos não geram populações de valores de y distintas. Temos apenas umapopulação com média .
Y ~ N(, )
) de difere média uma menos pelo:H
:H
ijT1
G4G2M4M2P4P2T0
Fonte de variação SQ S2 F
Tratamento T= t - 1 ij
2ij yyr
T
T2T
QSs
2
2T
Ts
sf
Resíduo =(r-1) t ijk
2ijijk yy
sRe2 QS
s -
Total n-1 2ijk
ijk yy
ij
2ijTrat yyrSQ
2ijk
ijkTotal yySQ
Modelo de médias
) de difere média uma menos pelo:H
:H
ijT1
G4G2M4M2P4P2T0
Hipóteses estatísticas
Desviototal
Desvio tratamento
Desvioresíduo
Tabela da análise da variância
Tamanho do arquivo
Tamanho do buffer Médias marginais 2 4
P 2,105 2,383 2,244
M 2,193 2,580 2,386
G 2,248 2,765 2,506 Médias
marginais 2,182 2,576 2,379
Tabela de média
Tabela dos dados
Tamanho do arquivo
Tamanho do buffer
20 40
Pequeno 2,05; 2,04; 2,21; 2,12 2,32; 2,31; 2,48; 2,42
Médio 2,24; 2,21; 2,23; 2,09 2,52; 2,62; 2,57; 2,61
Grande 2,08; 2,34; 2,33; 2,24 2,71; 2,73; 2,90; 2,72
Tamanho do arquivo
Tamanho do buffer Médias marginais 2 4
P 2,105 2,383 2,244
M 2,193 2,580 2,386
G 2,248 2,765 2,506 Médias
marginais 2,182 2,576 2,379
Tabela de médias observadas
(por diferença )
Fonte de variação GL SQ S2 F f
Tratamento 5 1,265 0,253 35,63 2,77
Resíduo 18 0,128 0,0071 - -
Total 23 1,393 - - -
Rejeita-se H0
Conclusão: Concluímos ao nível de 5% de significância, que existe efeito das combinações de níveis dos fatores tamanho do buffer e tamanho do arquivo sobre o tempo de acesso ao arquivo.
ijT1
G4G2M4M2P4P2T0
:H
:H
Tabela da análise da variância
Prosseguimento da análise: decomposição da SQTrat
A variação de tratamento pode ser decomposta em três partes:
- efeito do fator A
- efeito do fator B
- efeito da interação A.B
Modelos estatísticos
,ey ijkijijk
ij é a média esperada da combinação de níveis ij (parâmetro) eijk é o erro aleatório da repetição k da combinação de níveis ij
Modelo de médias:
onde:
,ey ijkijjiijk
é a média sem efeito ou efeito constante (parâmetro)i é o efeito do nível i do fator A (parâmetro)j é o efeito do nível j do fator B (parâmetro)ij é o efeito da interação dos níveis i e j (parâmetro)eijk é o erro aleatório da repetição k da combinação de níveis ij
onde:
Modelo de efeitos:ij
jiijij
ii
jj
Efeito da interação dos níveis ij
Efeito do nível j do fator B
Efeito do nível i do fator A
P2 = P2 - P - 2 + P4 = P4 - P - 4 + M2 = M2 - M - 2 + M4 = M4 - M - 4 +
P = P - M = M - G = G -
2 = 2 - 4 = 4 -
G2 = G2 - G - 2 + G4 = G4 - G - 4 +
yyyyˆ jiijij
yyˆ ii Estimador
yyˆ jj
Estimador
Estimador
Fator A: tamanho de arquivo
Fator B: tamanho de buffer
jB1
42B0
:H
:H
iA1
GMPA0
:H
:H
)0 de diferente efeito tem combinação uma menos pelo0:H
0:H
ijAB1
G4G2M4M2P4P2AB0
Hipóteses de interesse
0:H
0:H
iA1
GMPA0
Efeito da interação dos fatores A e B
Efeito principal do fator A
Efeito principal do fator B
0:H
0:H
jB1
42B0
Populações estatísticas
y: variável resposta
Sim A.B: interação significativa?
0:H
0:H
ijAB1
G4G2M4M2P4P2AB0
P2 P4
y
M2 G2 G4M4
Tratamentos distintos geram populaçõesde valores de y distintas?
y: variável resposta Tratamentos distintos geram populaçõesde valores de y distintas?
P G
y
M
Sim A.B : interação não significativaA: efeito principal significativo
Considera-se o fator A
iA1
GMPA0
:H
:H
Populações estatísticas
Estrutura cruzada: populações estatísticas
y: variável resposta
2
y
4
Tratamentos distintos geram populações de valores de y distintas?
Sim A.B : interação não significativaB: efeito principal significativo
42B1
42B0
:H
:H
Considera-se o fator B
Populações estatísticas
y: variável respostaTratamentos distintos geram populações de valores de y distintas?
Não
Y ~ N(, )
A.B: interação não significativaA: efeito principal não significativoB: efeito principal não significativo
jB1
42B0
:H
:H
iA1
GMPA0
:H
:H
Hipóteses estatísticas
Modelo de efeitos A variação de tratamento é decomposta em três partes:- efeito principal do fator A- efeito principal do fator B - efeito da interação A.B
Tabela da análise da variância
Tamanho do arquivo
Tamanho do buffer Médias marginais 2 4
P 2,105 2,383 2,244
M 2,193 2,580 2,386
G 2,248 2,765 2,506 Médias
marginais 2,182 2,576 2,379
Obtenção das somas de quadrados
Tabela de médias
= 8 (2,244 - 2,379)2 + 8 (2,244 - 2,379)2 + 8 (2,244 - 2,379)2 = 0,276
= 12 (2,182 - 2,379)2 + 12 (2,576 - 2,379)2 = 0,932
na = 3
nb = 2
r = 4
BATAB SQSQSQSQ (por diferença )
Fonte de variação GL SQ S2 F f
Tratamento 5 1,265 0,2532 35,63
Arquivo (A) 2 0,276 0,1382 19,46
Buffer (B) 1 0,932 0,932 131,27
Arquivo x Buffer (AB) 2 0,057 0,0285 4,01
Resíduo 18 0,123 0,0071 - -
Total 23 1,393 - - -
BATAB SQSQSQSQ
2j
jaB yyrnSQ
= 0,276
= 0,932
= 1,265 - 0,276 - 0,932 = 0,057 (por diferença )
Tabela da análise da variância
Fonte de variação GL SQ S2 F f
Tratamento 5 1,265 0,2532 35,63
Arquivo (A) 2 0,276 0,1382 19,46
Buffer (B) 1 0,932 0,932 131,27
Arquivo x Buffer (AB) 2 0,057 0,0285 4,01 3,55
Resíduo 18 0,123 0,0071 - -
Total 23 1,393 - - -
0:H
0:H
ijAB1
G4G2M4M2P4P2AB0
Efeito significativo da interação dos fatores A e B
Rejeita-se H0
Conclusão: Concluímos ao nível de 5% de significância, que existe interação entre tamanho do arquivo e tamanho do buffer. Isso significa que a mudança nos níveis de tamanho do arquivo irá modificar a forma como os níveis de tamanho do buffer afetam a variável resposta (e vice-versa).
Se a interação é significativa devemos
desconsiderar os efeitos principais dos
fatores A e B.
Tabela da análise da variância
iA1
n21A0
:H
...:Ha
- Testar o efeito principal do fator A
- Testar o efeito principal do fator B
jB1
n21B0
:H
...:Hb
Se a interação não é significativa, devemos:
0:H
0...:H
j
j
jajj
j
B|iBA|
1
B|nB|2B|1BA|
0
- Testar o efeito simples de A dentro de cada nível de B
0:H
0...:H
i
i
ibii
i
|Aj|AB
1
|An|A2|AB|AB
0
- Testar o efeito simples de B dentro de cada nível de A
Se a interação é significativa, devemos desconsiderar os efeitos principais e:
22|i2|A
1
22|G2|M2|P2|A
0
:H
:H
- Testar o efeito simples de Tamanho de arquivo dentro de cada nível de Tamanho de buffer
4|4i|4A
1
4|4G|4M|4P|4A
0
:H
:H
MM|jM|B
1
MM|4M|2M|B
0
:H
:H
GG|jG|B
1
GG|4G|2G|B
0
:H
:H
No exemplo:
- Testar o efeito simples de Tamanho de buffer dentro de cada nível de Tamanho de arquivo
Tamanho do arquivo
Tamanho do buffer Médias marginais 2 4
P 2,105 2,383 2,244
M 2,193 2,580 2,386
G 2,248 2,765 2,506
Médias marginais 2,182 2,576 2,379
Tabela de médias
Gráficos de médias: podem indicar a presença ou não de interação
Gráficos com linhas paralelas indicam fortemente a ausência de interação entre os fatores.
Gráficos com linhas que se cruzam indicam fortemente a presença de interação entre os fatores.
Gráficos da interação