universidade federal da paraÍba - de/ufpbtarciana/mpie/aula19.pdf · conclusão: pelo teste de...

18
UNIVERSIDADE FEDERAL DA PARAÍBA Modelos de Probabilidade e Inferência Estatística Departamento de Estatística Luiz Medeiros Análise de Variância – Parte 2

Upload: dangkien

Post on 07-Aug-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

UNIVERSIDADE FEDERALDA PARAÍBA

Modelos de Probabilidade e Inferência Estatística

Departamento de EstatísticaLuiz Medeiros

Análise de Variância – Parte 2

Estimação dos parâmetros e diagnóstico do modelo

Estimativas da média geral e dos efeitos dos tratamentos:

..i.i

..

yyτ

−=

=)

yτµ µ =+=

Estimativa pontual de µi: dado µi= µ+ τi, temos:

i.ii yτµ µ =+=

Verificar se as pressuposições básicas do modelo são válidas.

Isso é realizado através de uma análise de resíduos. Define-se

o resíduo da ij-ésima observação como:

ijijij yye −=

modelo. pelo preditos valores yτµy onde i.iij →=+=

TESTES NÃO-PLANEJADOS PARA

COMPARAÇÃO DE MÉDIAS

� Se o teste realizado na ANOVA é significante, a única certezaé a de que existe no mínimo um par de médias diferente, masnão se sabe quantas e, pior ainda, quais.

� Para se determinar qual(is) o(s) par(es) de médias diferentesapós a realização da ANOVA, é realizado o que se denominateste não-planejado, teste a posteriori ou teste pos hoc. Osteste não-planejado, teste a posteriori ou teste pos hoc. Osmais conhecidas são:

• Teste de Scheffé – Para comparações múltiplas• Teste de Bonferroni – Comparar médias duas a duas (Dados balanceados eou

não balanceados)

• Teste de Tukey (HSD) – Comparar médias duas a duas• Teste de Duncan – Comparar médias duas a duas

• Teste de Dunnet – Quando se quer comparar as médias do tratamentoapenas com a média do controle.

TESTE DE TUKEY (HSD)

� É um dos testes de comparação de média mais utilizado, por serbastante rigoroso e de fácil aplicação;

� É um teste exato em que, para a família de todas as comparaçõesduas a duas, a taxa de erro da família dos testes é exatamente α (e ointervalo de confiança é exatamente 1-α). Métodos de comparaçõesmúltiplas exatos são raros;múltiplas exatos são raros;

� Não permite comparar grupos de tratamentos entre si;

� É utilizado para testar toda e qualquer diferença entre duas médiasde tratamento;

� É aplicado quando o teste “F” para tratamentos da ANOVA (análisede variância) for significativo.

TESTE DE TUKEY (HSD)DADOS BALANCEADOS

� O teste de Tukey tem como base a DMS (diferença mínima significativa). Para dados

balanceados é calculado da seguinte forma:

Em que n é o número de réplicas do tratamento (nível), qα

é um valor tabelado

(Tabela do Teste de Tukey) e QMErro é o quadrado médio do erro.

n

QMErrogNgqDMS ),( −= α

(Tabela do Teste de Tukey) e QMErro é o quadrado médio do erro.

� Rejeita-se a igualdade da média de dois tratamentos (i e l) se:

� Um intervalo de confiança de 100(1-α)% para a diferença entre todos os pares de

médias é dado por:

... TSDyy li >−

n

QMErrogNgqyy li ),(.. −±− α

Exemplo - O experimento de absorbância

Tabela da análise de variância dos valores de absorbância.

Causas de

variação

Soma de

quadrados

Graus de

liberdade

Quadrados

médios

Fcalc

Entre

solventes

0,5413 4 0,1353 212,806

(P<0,0001)

Erro 0,0127 20 0,0006 F =4,43

Erro 0,0127 20 0,0006

Total 0,5540 24

F(0,01;4;20)=4,43

Rejeita-se H0, e concluímos que as médias de tratamentos diferem entre si; os

solventes afetam significativamente as médias de absorbância.

Comparações entre Pares de Médias

., os todospara ,µµ:H li0 li=

Número de comparações: g(g-1)/2.

Devem ser realizadas após o teste F da análise de

variância rejeitar a hipótese nula

Teste de Tukey

Exemplo: Dados de absorbância. O valor da Diferença Mínima Significativa é:

0479,05

00064,023,4)20;5(05,0 ===

n

QMErroqDMS

>=−=−

<=−=−

31

21

(0,0479) DMS 0,08970,44960,5393y

(0,0479) DMS 0,02760,56690,5393y

y

y

=−

=−

=−

=−

=−

=−

>=−=−

>=−=−

>=−=−

54

53

43

52

42

32

51

41

31

y

y

y

y

y

y

(0,0479) DMS 0,34250,19680,5393y

(0,0479) DMS 0,06850,60780,5393y

(0,0479) DMS 0,08970,44960,5393y

y

y

y

y

y

y

y

y

y

E70 = 0,6363 A

EAW = 0,5669 A B

E50 = 0,5393 B

MAW = 0,4496 C

M1M = 0,1968 D

Médias seguidas de mesma letra, em uma mesma coluna, nãoMédias seguidas de mesma letra, em uma mesma coluna, não

apresentam diferenças significantes, ao nível de significância de 5%,

pelo teste de Tukey.

Conclusão: pelo teste de Tukey, ao nível de significância de 5%, as médias

dos tratamentos E50 e EAW, assim como as médias dos tratamentos EAW e

E70 não apresentam diferenças significantes. As médias dos tratamentos

E50 e E70 apresentam diferença significante. As médias dos tratamentos

MAW e M1M apresentam diferença significativa de todos os tratamentos.

EXEMPLO: 3 GRUPOS DE CRIANÇAS RECEBERAM DIFERENTES

NÍVIES DE MOTIVAÇÃO PARA A MATEMÁTICA. DEPOIS SE FEZ UM

EXAME. HÁ DIFERENÇAS SIGNIFICATIVAS ENTRE OS 3 NÍVEIS DE

MOTIVAÇÃO (BAIXA, MÉDIA E ALTA)?

Grupo 1 Grupo 2 Grupo 3

4 16 12 144 1 1

5 25 8 64 3 9

4 16 10 100 4 164 16 10 100 4 16

3 9 5 25 6 36

6 36 7 49 8 64

10 100 9 81 5 25

1 1 14 196 3 9

8 64 9 81 2 4

5 25 4 16 2 4

X1 X12 X2 X2

2 X3 X32

Média = 5,11 Média = 8,67 Média = 3,78

Tabela da análise de variância dos níveis de motivação.

Causas de

variação

Soma de

quadrados

Graus de

liberdade

Quadrados

médios

Fcalc

Entre

solventes

114,96 2 57,48 7,82

Erro 176,45 24 7,35

Ftab (g-1; N-g; 1-α) = Ftab (2; 24; 0,05) = 3,403

Concluindo, Fcalc > Ftab , portanto, rejeita-se H0.

Total 291,40 26

� Conclui-se, através do teste, que pelo menos uma médiase difere das demais.

� Em quais tratamentos ocorreram essa diferença?

� Utilize o teste de Tukey (α=0,05) para encontrar as� Utilize o teste de Tukey (α=0,05) para encontrar asdiferenças entre a média dos tratamentos.

EXEMPLO 1

InsectSprays # ver o banco de dados

boxplot(count ~ spray, data = InsectSprays, col = "lightgray") # gerar o boxplotentre count e spray

anava <- aov(count~spray,data=InsectSprays) # gerar a anova

summary(anava) # resultado da anova

ep = as.vector(rstandard(anava)) # resíduo padronizado

shapiro.test(ep) # teste de normalidade

library(lmtest) # biblioteca para utilizar o teste dwtest

dwtest(anava) # teste de independência - Durbin Watson

bartlett.test(count ~ spray, data = InsectSprays) # teste de homocedasticidade

EXEMPLO 2ex2 <- read.csv("banco1.txt",header=T,dec=".",sep="") ## ler o banco

attach(ex2)

names (ex2)

boxplot(nm ~ trat, data = ex2, col = "red") # gerar o boxplot entre count e spray

anava <- aov(nm~trat,data=ex2) # gerar a anova

summary(anava) # resultado da anova

ep = as.vector(rstandard(anava))

shapiro.test(ep) # teste de normalidade

dwtest(anava) # teste de independência - Durbin Watson

bartlett.test(nm ~ trat, data = ex2) # teste de homocedasticidade

Tukey <- TukeyHSD(anava,wich="trat", ordered = F,conf.level = 0.95) # gerar o teste de Tukey

Tukey # resultado do teste

plot(Tukey) # gerar IC das diferenças

EXEMPLO 3x <- rchisq(10, df = 9)

y<- rgamma(10, 10, 2)

z<- rbeta(10, 1, 2)

vr<-c(x,y,z)

tr<-c(rep(1,10),rep(2,10),rep(3,10))

ex3<-cbind(vr,tr)

ex3 # ver o banco de dadosex3 # ver o banco de dados

boxplot(vr ~ tr, col = "red") # gerar o boxplot

anava <- aov(vr~tr) # gerar a anova

summary(anava) # resultado da anova

ep = as.vector(rstandard(anava))

shapiro.test(ep) # teste de normalidade

dwtest(anava) # teste de independência - Durbin Watson

bartlett.test(vr ~ tr) # teste de homocedasticidade

EXEMPLO 4x <- rnorm(20, 5, 1)

y<- rnorm(20, 15, 1)

z<- rnorm(20, 25, 1)

vr<-c(x,y,z)

tr<-c(rep(1,20),rep(2,20),rep(3,20))

ex4<-cbind(vr,tr)

boxplot(vr ~ tr, col = "red") # gerar o boxplot

anava <- aov(vr~tr) # gerar a anova

summary(anava) # resultado da anova

ep = as.vector(rstandard(anava))

shapiro.test(ep) # teste de normalidade

dwtest(anava) # teste de independência - Durbin Watson

bartlett.test(vr ~ tr) # teste de homocedasticidade

Tukey <- TukeyHSD(anava,wich="trat", ordered = F,conf.level = 0.95) # gerar o teste de Tukey

Tukey # resultado do teste

plot(Tukey) # gerar IC das diferenças