testes de hip oteses: duas amostrastestes de hip oteses: duas amostras na aula de hoje veremos como...

Testes de Hipoteses: Duas Amostras

Na aula de hoje veremos como comparar duas

populacoes P1 e P2, baseados em dados forneci-

dos por amostras dessas populacoes.

Grande parte das tecnicas usadas em Estatısti-

ca supoe que as variaveis aleatorias envolvidas

tenham distribuicao normal.

Alguns testes que trataremos envolverao a nor-

mal. Contudo, se a suposicao de normalidade

for violada, exsitem outros testes conhecidos

como testes nao parametricos que poderao ser

usados.

Estudaremos duas situacoes diferentes: o caso

em que temos duas amostras independentes e

o caso em que temos duas amostras pareadas

(relacionadas, emparelhadas).

1

Em ambos os casos, veremos um teste para-

metrico que resulta num teste t e supoe nor-

malidade e, veremos tambem, um teste nao-

parametrico, que nao supoe normalidade.

Uma questao que aparece com frequencia e:

“O metodo A e melhor do que o metodo B?”

Em termos estatısticos, ela equivale a com-

parar dois conjuntos de informacoes, resultan-

tes das medidas obtidas da aplicacao dos dois

metodos a dois conjuntos de objetos ou in-

divıduos.

Mas como caracterizar adequadamente a “igual-

dade” ou “equivalencia” das duas populacoes?

2

No caso da suposicao de normalidade ser valida

e, se tambem for possıvel supor que as varian-

cias das duas populacoes sao iguais, observe

que poderıamos caracterizar a hipotese de equi-

valencia na forma H0 : µ1 = µ2. Porem, no

caso em que nao e adequado supor a normali-

dade, de fato, a hipotese de equivalencia seria

H0 : P1 = P2, que chamaremos hipotese de

homogeneidade das duas populacoes.

O significado de H0 : P1 = P2 dependera muito

do interesse do pesquisador em considerar qual

tipo de igualdade implicara a coincidencia das

duas distribuicoes.

Os testes t e de Wilcoxon-Mann-Whitney, que

serao descritos a seguir sao apropriados para

esse tipo de situacao.

O teste t e aplicavel quando P1 e P2 sao su-

postas normais com variancias iguais.

3

Veremos na proxima aula como realizar um

teste para verificar se, de fato, a suposicao

de variancias iguais e adequada.

O teste de Wilcoxon-Mann-Whitney aplica-se

para P1 e P2 quaisquer.

Comecaremos estudando o caso em que dis-

pomos de duas amostras independentes para

entao apresentar os dois testes.

Em seguida trataremos do caso de amostras

pareadas.

4

Exemplo 1: Suspeita-se que o barulho afeta

a memoria de cuto prazo. Para verificar essa

suspeita, um experimento foi conduzido da se-

guinte forma: 24 pessoas foram aleatoria-

mente distribuıdas em dois grupos de 12.

Cada grupo recebeu uma lista de 20 palavras

para memorizar em 2 minutos. Os partici-

pantes na condicao barulho tentaram memo-

rizar a lista de 20 palavras, enquanto escu-

tavam, com fones de ouvido, um barulho pre-

gravado. Os outros participantes tambem uti-

lizaram fones de ouvido, mas sem o barulho,

enquanto memorizavam as palavras no mesmo

perıodo de tempo.

O numero de palavras memorizadas por cada

pessoa foi registrado e e apresentado na tabela

a seguir.

5

barulho (1) sem barulho (2)5 15

10 96 166 157 163 186 179 135 11

10 1211 13

9 11x1 = 7,3 x2 = 13,8s1 = 2,5 s2 = 2,8

Se µ1 representa o numero medio de palavrasmemorizadas em 2 minutos entre 20 palavrasna condicao barulho e µ2, a mesma media nacondicao sem barulho, para verificar a suspeitaenunciada, poderıamos realizar o teste das se-guintes hipoteses:{

H0 : µ1 = µ2H1 : µ1 < µ2

.

6

Este e um exemplo da situacao em que temosduas amostras independentes, observe que saopessoas diferentes em cada grupo de 12, equeremos comparar as duas medias popula-cionais. Em Dancey e Reidy eles classificamesse experimento como um experimento inter-participantes.

Antes de resolver o problema apresentado, va-mos apresentar um breve resumo teorico doteste usado nesse contexto.

Sejam X1, X2, ..., Xn e Y1, Y2, ..., Ym duas amos-tras independentes sorteadas de duas popula-coes normais N(µ1, σ

2) e N(µ2, σ2).

Observe que as amostras podem ter tamanhosdiferentes n e m, mas estamos supondo que asamostras provem de populacoes normais comvariancias iguais.

O teste a seguir foi construıdo baseando-senessas suposicoes.

7

Testes para verificar a dequacao das suposicoes

de normalidade dos dados e de homogeneidade

das variancias serao apresentados na proxima

aula.

Nesse contexto temos como hipotese nula a

condicao µ1 = µ2 e as hipoteses alternativas

poderao ser µ1 6= µ2 (bilateral), µ1 < µ2 (uni-

lateral a esquerda) e µ1 > µ2 (unilateral a di-

reita).

Da teoria estatıstica e possıvel mostrar que

se as suposicoes sao verdadeiras, entao a es-

tatıstica

T =X1 − X2 − (µ1 − µ2)

S√

1n + 1

m

tem uma distribuicao t com n+m−2 graus de

liberdade.

8

Na expressao da estatıstica T ,

T = X1−X2−(µ1−µ2)

S√

1n+ 1

m

X1 representa a media amostral referente a

amostra 1 e X2 representa a media amostral

referente a amostra 2.

Alem disso S2 e uma estimativa combinada da

variancia populacional σ2 que e suposta ser a

mesma em ambas as populacoes, a saber,

S2 =(n− 1)S2

1 + (m− 1)S22

n+m− 2

em que S21 e a variancia amostral na amostra

1 e S22 e a variancia amostral na amostra 2.

9

Assim, se H0 e verdadeira segue que

T0 =X1 − X2

S√

1n + 1

m

tem uma distribuicao t com n+m−2 graus deliberdade.

Fixado um nıvel de significancia α, basta obtera(s) cauda(s) correspondente(s) a regiao crıticado teste, usando a distribuicao t com n+m−2graus de liberdade.

No problema da memoria de curto prazo, temosque o numero de graus de liberdade da dis-tribuicao amostral t da estatıstica de teste e12 + 12− 2 = 22.

Fixando α em 5%, temos como regiao crıticaT0 < −1,72, pois trata-se de um teste unila-teral a esquerda. (A cauda a esquerda de -1,72 na dis-

tribuicao t com 22 graus de liberdade corresponde a 5% da dis-

tribuicao.)

10

Vimos que

x1 = 7,3, x2 = 13,8, s21 = 2,52 e s2

2 = 2,82.

Alem disso, n = m = 12. Logo,

s2 = 11×2,52+11×2,82

22 ' 7,05 tal que

t0 = 7,3−13,8√7,05/6

' −5,99

Como o valor amostral de T0 esta na regiao

crıtica, segue que H0 deve ser rejeitada.

Portanto, ao nıvel de significancia de 5%, os

dados trazem evidencia a favor da suposicao

de que a memoria de curto prazo e, em media,

menor na condicao barulho do que na condicao

sem barulho.

11

Como fica o p-valor desse teste?

Basta encontrar a area da cauda a esquerda

de t0 = −5,99 na dsitribuicao t com 22 graus

de liberdade.

E possıvel ver que o p-valor e bem menor que

0,0001 indicando fortıssima evidencia contra

H0.

Portanto, usando o p-valor, chegamos a mesma

conclusao obtida via procedimento classico com

nıvel de significancia 5%.

Agora vamos ver como resolver esse problema

usando o Bioestat.

12

Clique na opcao Estatısticas, seguida de Duas

Amostras Independentes, seguida de Teste t:

Resumo amostral

Entre com as informacoes amostrais

13

Depois e so clicar em executar para obter a

saıda

14

Quadro de procedimentos no caso de duas a-

mostras independentes de populacoes normais

com variancias iguais.

Sejam H0 : µ1 = µ2 a hipotese nula,

T0 = X1−X2

S√

1n+ 1

m

a estatıstica de teste e

α o nıvel de significancia do teste.

H1 Regiao crıtica

µ1 6= µ2 |T0| > t(1−α,n+m−2)

µ1 > µ2 T0 > t(1−2α,n+m−2)

µ1 < µ2 T0 < −t(1−2α,n+m−2)

15

Intervalo de Confianca para a diferenca entreas medias µ1 e µ2:

Suposicao: populacoes normais com varianciasiguais.

IC(µ1 − µ2, γ) : X1 − X2 ± t(γ,n+m−2)S√

1n + 1

m

em que

Xi e a media da i-esima amostra. i = 1,2

S2 =(n−1)S2

1+(m−1)S22

n+m−2 e S2i e a variancia da

i-esima amostra, i = 1,2

n e o tamanho da amostra 1 e m e o tamanhoda amostra 2

t(γ,n+m−2) e um quantil da distribuicao t comn+m− 2 graus de liberdade tal que

P(−t(γ,n+m−2) < T < t(γ,n+m−2)

)= γ,

com T ∼ t(n+m−2).

O Bioestat fornece os IC’s da diferenca das duas medias de 95% e99% de confianca.

16

Observe que nao verificamos se e razoavel a

suposicao de normalidade para os dados ob-

servados nesse exemplo. E se a normalidade

nao for razoavel?

Apresentaremos aqui o teste de Wilcoxon, tam-

bem conhecido como teste de Mann-Whitney

e que daqui em diante chamaremos de teste

WMW nessas notas.

Tem-se duas amostras independentes de duas

populacoes P1 e P2. A variavel observada deve

ter uma escala pelo menos ordinal.

Queremos testar H0 : P1 = P2 contra a hipote-

se alternativa de que as distribuicoes diferem

em localizacao: estaremos interessados em sa-

ber se uma populacao tende a ter valores maio-

res que a outra; ou se elas tem a mesma me-

diana ou a mesma media.

17

O teste WMW e baseado nos postos dos va-

lores obtidos combinando-se as duas amostras.

Como isso e feito?

As duas amostras sao combinadas como se fos-

sem uma so e todos os valores observados sao

colocados em ordem crescente.

Atencao: E importante nao perder a informa-

cao da origem de cada valor observado, ou

seja, ao combinar as amostras, e importante

saber qual valor veio da amostra 1 e qual valor

veio da amostra 2.

18

A tabela a seguir mostra as duas amostras

combinadas antes de ordenar.

19

A tabela a seguir mostra as duas amostras

combinadas depois de ordenar e com atribuicao

de postos (posicao no ranking).

20

A estatıstica de teste e a soma dos postos as-

sociados aos valores amostrados de uma po-

pulacao, P1, por exemplo. Se essa soma for

grande, isso e uma indicacao de que os valores

dessa populacao tendem a ser maiores do que

os valores da populacao P2, e, entao rejeita-

mos H0.

Se ha ao todo n+m observacoes, entao a soma

de todos os postos sera (n+m)×(n+m+1)/2.

Nesse exemplo a soma de todos os postos e

300.

Podemos verificar que a soma dos postos asso-

ciados a condicao barulho e 83, enquanto que

esta soma associada a condicao sem barulho

e 217. Logo, temos evidencias amostrais para

rejeitar H0.

21

Como especificar regioes crıticas ou calcular

p-valores no teste WMW?

Para isso trabalha-se com a estatıstica de Mann-

Whitney dada por U1 = W1− 12n(n+1) em que

W1 e a soma dos postos da amostra 1 e n e o

tamanho amostral correspondente.

Existem tabelas de quantis associados a es-

tatıstica U1 sob a hipotese de homogeneidade.

Para tamanhos amostrais grandes, tambem po-

demos usar uma aproximacao para a distribui-

cao normal, padronizando a estatıstica U1 com

uma media dada por µ = n(n + m + 1)/2 e

variancia dada por σ2 = nm(n+m+ 1)/12.

No entanto, nao precisaremos nos preocupar

com estes detalhes tecnicos. Usarmos o Bioe-

stat para realizar o teste MWM .

22

Escolha a opcao Estatısticas, Duas Amostras

independentes, Mann-Whitney (Wilcoxon Rank-

Sum test).

Os dados devem ser digitados nas colunas 1 e

2.

23

Marque as colunas 1 e 2 e depois clique em

executar para obter a seguinte saıda do teste

WMW

Como p-valor e muito pequeno, rejeitamos a

hipotese nula em favor da hipotese de que na

condicao sem barulho tende-se a memorizar

um numero maior de palavras do que na condi-

cao barulho.

24

Observe que aplicamos os dois testes ao mesmo

conjunto de dados e em ambos os casos obtive-

mos a mesma conclusao. Porem, nem sempre

essa concordancia ira ocorrer.

Que teste eu devo escolher?

O teste t e mais poderoso do que os testes nao-

parametricos. Desse modo, se a suposicao de

normalidade for adequada, recomenda-se usar

o teste t. Use o teste WMW somente se a

suposicao de normalidade nao for adequada.

Na proxima aula veremos como verificar a nor-

malidade de um conjunto de dados.

25

Exemplo 2: A professora Yob esta interes-sada em estudar a violencia de massa duranteas partidas de futebol. Ela acha que a violenciado grupo e resultado dos assentos desconfor-taveis do estadio. Assim, Yob modifica doisestadios diferentes na Inglaterra. Em um esta-dio coloca assentos bem apertados e descon-fortaveis. No outro, instala assentos conforta-veis com muito espaco para as pernas e entreos assentos adjacentes.

A professora organiza uma competicao de mo-do que um clube jogue apenas a metade daspartidas em um estadio e a outra metade nooutro estadio.

Ela acompanha um grupo de 12 fas adoles-centes agressivos e grosseiros desse clube eregistra o numero de vezes em que cada um epreso ou expulso do estadio.

Ela preve que o numero medio de prisoes/expul-soes seja maior no estadio menos confortaveldo que no estadio mais confortavel.

26

A tabela a seguir apresenta os resultados obti-

dos no experimento.

adolescente desconfortavel confortavel1 8 32 5 23 4 44 6 65 4 26 8 17 9 68 10 39 7 410 8 111 6 412 7 3

27

Este e um exemplo da situacao em que temos

amostras pareadas, observe que sao as mesmas

pessoas observadas sob diferentes condicoes,

e queremos comparar as medias populacionais

sob as diferentes condicoes. Em Dancey e

Reidy eles classificam esse experimento como

um experimento intraparticipantes.

Observe que nesse caso, faz sentido definir as

diferencas, pois as observacoes em dada linha

da coluna de dados estao relacionadas a uma

mesma pessoa.

28

Antes de resolver o problema apresentado, va-

mos apresentar um breve resumo teorico do

teste usado nesse contexto.

Suponha que (X1, Y1), (X2, Y2), ..., (Xn, Yn) seja

uma amostra aleatoria bivariada de tamanho

n de uma populacao. Por exemplo, medidas

antes e depois de um tratamento, contagens

sob duas condicoes diferentes, etc.

Defina as diferencas Di = Xi−Yi, i = 1,2, ..., n.

Se a populacao das diferencas tiver uma dis-

tribuicao normal, entao e possıvel construir um

teste t para a media das diferencas.

Suponha que a distribuicao de D seja N(µD, σ2D).

29

Como estamos comparando o mesmo grupo

sob diferentes condicoes, aqui a hipotese nula,

sera da forma µD = 0, ou seja, nao ha efeito de

tratamento. As hipoteses alternativas podem

ser µD 6= 0 (bilateral), µD > 0 (unilateral a

direita) ou µD < 0 (unilateral a esquerda).

Em geral o desvio padrao da populacao de

diferencas e desconhecido e tambem devera ser

estimado por SD com

S2D = 1

n−1

n∑i=1

(Di−D)2, com D a media amostral

das diferencas D1, D2, ..., Dn.

De fato, podemos notar que esse caso reduz-

se ao teste t, com H0 : µD = 0 para uma

amostra aleatoria simples de uma populacao

normal dada por

D1, D2, ..., Dn.

30

Observe que a suposicao de normalidade das

populacoes nao e crucial. As diferencas e que

devem ter um comportamento normal.

A estatıstica de teste a ser usada e T0 =D

SD/√n

.

Sob H0, T0 tem uma distribuicao t com n − 1

graus de liberdade.

Fixando α o nıvel de significancia, basta iden-

tificar a(s) cauda(s) da distribuicao t com n−1

graus de liberdade adequada(s) a hipotese al-

ternativa sob consideracao.

Depois e so verificar se o valor amostral da

estatıstica caiu ou nao na regiao crıtica para

concluir o teste.

31

No caso dos dados do exemplo 2 temos o seguinte

teste H0 : µD = 0 versus H1 : µD > 0.

Logo, como o valor amostral caiu na regiao

crıtica devemos rejeitar a hipotese nula de que

nao ha diferenca nos numeros medios de prisoes/

expulsoes em favor da hipotese alternativa de

que no estadio desconfortavel a media e maior

do que no estadio confortavel.

32

Como fica o p-valor desse teste?

Basta encontrar a area da cauda a direita t0 =

4,96 na dsitribuicao t com 11 graus de liber-

dade.

E possıvel ver que o p-valor e aproximada-

mente 0.0002, indicando fortıssima evidencia

contra H0.

Portanto, usando o p-valor, chegamos a mesma

conclusao obtida via procedimento classico com

nıvel de significancia 5%.

Agora vamos ver como resolver esse problema

usando o Bioestat.

33

Clique na opcao Estatısticas, seguida e Duas

Amostras Relacionadas, seguida de Teste t:

Dados Amostrais

Entre com os dados amostrais que estao nas

colunas 2 e 3 e clique em executar para obter

34

Quadro de procedimentos no caso de duas a-

mostras pareadas cujas diferencas sao supostas

normais.

Sejam H0 : µD = 0 a hipotese nula,

T0 = DSD/√n

a estatıstica de teste e

α o nıvel de significancia do teste.

H1 Regiao crıtica

µD 6= 0 |T0| > t(1−α,n−1)

µD > 0 T0 > t(1−2α,n−1)

µD < 0 T0 < −t(1−2α,n−1)

36

Intervalo de Confianca para µD = µ1 − µ2:

Suposicao: as diferencas Di’s sao normalmentedistribuıdas.

IC(µD, γ) : D ± t(γ,n−1)SD√n

em que

D e a media amostral das diferencas

S2D = 1

n−1

n∑i=1

(Di − D)2

n e o tamanho da amostra

t(γ,n−1) e um quantil da distribuicao t com n−1graus de liberdade tal que

P(−t(γ,n−1) < T < t(γ,n−1)

)= γ,

com T ∼ t(n−1).

O Bioestat fornece os IC’s da diferenca das duas medias de 95% e99% de confianca.

37

E se as diferencas nao forem normais? Nesse

caso podemos usar um teste nao parametrico

tambem baseado em postos. Para amostras

emparelhadas, um teste apropriado e o teste

dos postos sinalizados de Wilcoxon.

Para esse teste supomos que a escala das di-

ferencas seja pelo menos intervalar e que os

pares (Xi, Yi) constituam uma amostra aleato-

ria simples da populacao.

Isso implica, em particular, que os Di’s sao in-

dependentes com a mesma mediana. Suponha

ainda que cada Di tenha uma distribuicao si-

metrica. Ou seja, as medias e medianas coin-

cidem.

No exemplo 2, queremos testar

{H0 : µD = 0H1 : µD > 0

.

38

Teste dos postos sinalizados de Wilcoxon

Passo 1: Calcule as diferencas Di, e os respec-

tivos valores absolutos, |Di|, i = 1,2, ..., n

Passo 2: Ordene |D1|, |D2|, ..., |Dn| os valores

absolutos dos Di’s e atribua postos de 1 a n.

Em caso de empate faca o ajuste adequado.

Se houver diferencas nulas, despreze-as e passe

a usar como o numero de observacoes n∗, o

numero de casos em que Di 6= 0.

Passo 3: Para as diferencas cujo sinal foi ne-

gativo, troque o sinal dos postos correspon-

dentes, ou seja atribua um sinal negativo para

eles.

Passo 4: Calcule T+, a soma dos postos com

sinal positivo e T− a soma, em valor absoluto,

dos postos com sinal negativo.

39

Passo 5: Selecione como a estatıstica de teste

T = min{T+, T−}, o menor dos dois. Para

prosseguir com o teste e necessario obter a

distribuicao amostral da estatıstica T sob H0.

Observe que se H0 for verdadeira, espera-se

que qualquer que seja a observacao as proba-

bilidades da diferenca a ela associada receber

um sinal positivo ou um sinal negativo devem

ser iguais e, portanto, espera-se que os valores

de T+ e T− sejam similares.

Observe tambem que se n∗ e o numero total

de diferencas nao-nulas, entao

T+ + T− = n∗(n∗+ 1)/2.

40

Logo, rejeitaremos H0 para algum nıvel de sig-

nificancia α fixado, se o valor de T for muito

pequeno relativamente a sua distribuicao amos-

tral sob H0.

Em alguns textos de estatıstica estao disponı-

veis tabelas da distribuicao amostral da es-

tatıstica T para tamanhos amostrais variados.

Para tamanhos amostrais grandes tambem e

possıvel trabalhar com uma aproximacao nor-

mal da distribuicao de T .

O Bioestat realiza esse teste e produz como

saıda os p-valores no caso do teste ser unila-

teral ou bilateral.

41

No caso dos dados do exemplo 2, temos

Como nao ha diferencas negativas o valor amos-

tral de T sera zero e, o que e um indıcio claro

de que os dados trazem evidencias fortes con-

tra H0, a hipotese de igualdade das duas po-

pulacoes, a saber, violencia sob desconforto e

violencia sob conforto em favor da hipotese al-

ternativa de que a violencia e maior sob condi-

coes de desconforto.

42

Nao iremos nos preocupar com detalhes tecni-cos de atribuicao de postos nesse teste. U-saremos o Bioestat para realizar esse teste e,o programa, nos retornara o p-valor do teste.O importante e saber interpretar a saıda doprograma!

Usando o Bioestat, clique em Estatısticas, se-guida de Duas Amostras Relacionadas, seguidade Wilcoxon (signed-rank test).

Depois de indicar as colunas que contem osdados e clicar em executar, obtem-se

O p-valor indica evidencia muito forte contraH0.

43

Comparacao de proporcoes em duas po-

pulacoes

Existem varias situacoes reais nas quais e im-

portante comparar duas proporcoes populacio-

nais.

Suposicoes

1. Dispoe-se de duas amostras aleatorias sim-

ples que sao independentes, o que significa que

os valores amostrais selecionados de uma po-

pulacao nao estao relacionados ou, de alguma

forma, emparelhados com os valores amostrais

selecionados da outra populacao.

Ou seja, temos n1 observacoes de uma amostra,

resultando em X1 sucessos e numa proporcao

amostral de p1 = X1n1

e n2 observacoes da outra

amostra, resultando em X2 sucessos e numa

proporcao amostral de p2 = X2n2

.

44

2. Para ambas as amostras, deve-se ter nipi ≥5 e ni(1−pi) ≥ 5, tal que haja pelo menos cinco

sucessos e cinco fracassos em cada amostra.

A hipotese nula e a de que H0 : p1 = p2, ou

seja as proporcoes populacionais sao iguais.

Sob H0, faremos uma estimativa combinada

de p1 e p2, supostas iguais, dada por

p = X1+X2n1+n2

= n1p1+n2p2n1+n2

.

Vimos que para tamanhos amostrais grandes

pia∼ N

(pi,

pi(1−pi)ni

), i = 1,2.

Como as amostras sao independentes, vale

p1 − p2a∼ N

(p1 − p2,

p1(1− p1)

n1+p2(1− p2)

n2

)

45

Sob H0, p1 = p2 = p, tal que sob essa hipotese,

p1 − p2a∼ N

(0, p(1− p)

√1n1

+ 1n2

).

Nosso interesse sera testar H0 : p1 = p2 versus

H1 : p1 6= p2 (bilateral) ou H1 : p1 < p2 (unila-

teral a esquerda) ou H1 : p1 > p2 (unilateral a

direita).

A estatıstica de teste sera

Z0 =p1 − p2√

p(1− p)(

1n1

+ 1n2

), com p a estimativa

combinada das proporcoes populacionais p1 e

p2 sob a suposicao de que sao iguais.

Fixado α o nıvel de significancia, basta deter-

minar a regiao crıtica identificando a(s) cau-

da(s) apropriada(s) na distribuicao normal pa-

drao.

46

Se H1 : p1 6= p2, a regiao crıtica sera

|Z0| > z(1−α).

Se H1 : p1 > p2, a regiao crıtica sera

Z0 > z(1−2α).

Se H1 : p1 < p2, a regiao crıtica sera

Z0 < −z(1−2α).

Para calcular o p-valor do teste basta determi-

nar a(s) area(s) da(s) cauda(s) corresponden-

te(s) ao valor amostral da estatıstica Z0.

47

Exemplo 3: Uma pesquisa com 436 traba-

lhadores mostrou que 192 deles disseram

considerar seriamente nao-etico o monitora-

mento dos e-mails dos empregados. Quando

121 chefes do nıvel senior foram pesquisa-

dos, 40 disseram considerar seriamente nao-

etico o monitoramento dos e-mails dos empre-

gados (com base em dados de uma pesquisa

do Gallup).

Use um nıvel de significancia de 5% para testar

a afirmativa de que, para aqueles que disseram

ser seriamente nao etico o monitoramento dos

e-mails dos empregados, a proporcao de em-

pregados e maior do que a proporcao de chefes.

48

Observe que neste exemplo as duas proporcoes

populacionais, p1 e p2 sao, respecitvamente a

proporcao de empregados que consideram seri-

amente nao etico e a proporcao de chefes que

consideram seriamente nao etico o monitora-

mento dos emails dos empregados.

Observaram-se duas amostras independentes:

amostra de empregados: n1 = 436, X1 = 192

e, p1 = 192426 ' 0,44.

amostra de chefes: n2 = 121, X2 = 40 e,

p2 = 40121 ' 0,33.

Nesse problema queremos testar

{H0 : p1 = p2H1 : p1 > p2

,

ao nıvel de significancia α = 0,05.

49

Vimos que se H1 : p1 > p2, a regiao crıtica sera

Z0 > z(1−2α).

Logo, usando uma tabela da distribuicao nor-

mal padrao vemos que z(0,90) ' 1,64 tal que a

regiao crıtica desse teste sera Z0 > 1,64.

Calculemos entao o valor amostral de Z0.

Temos p = 192+40436+121 ' 0,42 tal que

z0 ' 0,44−0,33√0,42(1−0,42)

(1

436+ 1121

) ' 2,17.

Como o valor amostral caiu na regiao crıtica,

ao nıvel de significancia de 5% rejeitamos a

hipotese nula de que tais proporcoes sao iguais

em favor da suposicao de que entre os empre-

gados a proporcao e maior.

50

Qual e o p-valor desse teste?

Como e um teste unilateral a direita, devemos

calcular a area a direita do quantil 2,17 numa

normal padrao.

O p-valor desse teste foi 1,5%, indicando forte

evidencia contra a hipotese nula.

51

Exemplo da Literatura

Desempenho da memoria de pessoas ansiosas e naoansiosas

“Um exemplo de um estudo no qual os pesquisadorespodem ter cometido um erro tipo I e o de Mogg, Math-ews e Weinman (1987). Neste estudo, foi medido odesempenho da memoria para palavras negativas em in-divıduos clinicamente ansiosos (pacientes com transtor-no de ansiedade generalizada (TAG)) e indivıduos naoansiosos. Eles encontraram que pacientes com TAGlembraram menos palavras intimidativas do que nao in-timidativas, que foi o contrario do previsto. Eles con-cluıram, portanto, que essa diferenca nao foi devida aoerro amostral e que era de fato uma diferenca genuınaentre os pacientes com TAG e indivıduos nao ansiosos.Estudos subsequentes dos mesmos autores e de outrostem, contudo, falhado na replicacao dessa descoberta.O consenso geral agora e que nao existe tal tendenciosi-dade de memoria associada ao TAG (veja, por exemplo,Mitte, 2008).”

“Os pesquisadores cometeram um erro tipo I. Eles concluıram quepacientes com TAG tem uma tendencia de se lembrar mais depalavras nao intimidativas comparada com as intimidativas. Pesqui-sas subsequentes contudo falharam na confirmacao disso e agoraparece mais palusıvel concluir que nao existe esse efeito na po-pulacao de pacientes com TAG. Isso nao significa dizer que estafoi uma pesquisa ruim. Pelo contrario, ela foi um estudo excelentee serviu para mostrar que, como nosso julgamento esta baseadoem probabilidades, estamos algumas vezes a merce do acaso.”(Dancey e Reidy, pg 160/161).

52

Voltando ao exemplo apresentado no final da

aula do dia 5 de setembro.

O Dr. Doolittle finalmente desistiu da ideia de

conversar com animais e decidiu tornar-se um

psicologo experimental de animais. Ele esta

particularmente interessado em descobrir se os

gatos sao ou nao mais inteligentes que os ca-

chorros. Para isso ele desenvolveu um teste de

inteligencia especıfico para esse estudo e testa

amostras de gatos e cachorros. Ele foi cuida-

doso para nao introduzir qualquer tipo de vıcio

no teste e acredita que criou um teste que nao

esta associado as especies, ou seja, pode ser u-

sado em qualquer especie. Dr, Dotlittle espera

que exista uma diferenca entre os escores de

gatos e cachorros. No experimento ele traba-

lhou com duas amostras aleatorias de 10 gatos

e 10 cachorros e, os resultados obtidos, estao

na tabela a seguir.

53

gatos cachorros95 116

100 112104 102

78 96130 89111 124

89 131114 117102 107

97 110

Observe que temos uma situacao de duas a-

mostras independentes, gatos e cachorros.

Podemos realizar um teste t bilateral de com-

paracao das medias H0 : µg = µc versus H1 :

µg 6= µc, supondo que os escores de inteligencia

sao normalmente distribuıdos com variancias

iguais nas duas populacoes.

Vejamos como fica a saıda desse teste usando

o Bioestat.54

Depois de ler os dados que estao no arquivo

gatosecachorros.bio, clique em Estatısticas, em

seguida: Duas amostras independentes, e em

seguida: Teste t:dados amostrais. Depois e so

informar que os dados estao nas colunas e 1 e

2 e mandar executar.

55

Como saıda obtemos

Observe que o p-valor do teste bilateral e grandeo suficiente para nao rejeitarmos a hipotesenula de que os escores medios de inteligenciasao iguais entre gatos e cachorros. Ou seja,os dados da pesquisa nao trazem evidencia su-ficiente para a hipotese do Dr. Dootlittle deque os gatos sao mais inteligentes.

56

Se a suposicao de normalidade dos escores de

inteligencia for questionavel, podemos realizar

o teste de Wilcoxon-Mann-Whitney, menos po-

deroso do que o teste t, mas que nao impoe a

condicao de normalidade dos dados.

57

Como saıda obtemos

O p-valor bilateral e maior do que 10%, levando

novamente a nao rejeicao da hipotese nula.

Na proxima aula trataremos de testes de nor-

malidade e de homogeneidade das variancias.

59

Referencias bibliograficas:

(1) Busssab e Morettin - Estatıstica Basica.

Editora Saraiva

(2) Triola. Introducao a Estatıstica. LTC.

(3) Dancey e Reidy - Estatıstica sem Matematica

para Psicologia - Penso

60

testes de hip oteses: duas amostrastestes de hip oteses: duas amostras na aula de hoje veremos como...

Documents