testes de hip oteses: duas amostrastestes de hip oteses: duas amostras na aula de hoje veremos como...
TRANSCRIPT
Testes de Hipoteses: Duas Amostras
Na aula de hoje veremos como comparar duas
populacoes P1 e P2, baseados em dados forneci-
dos por amostras dessas populacoes.
Grande parte das tecnicas usadas em Estatısti-
ca supoe que as variaveis aleatorias envolvidas
tenham distribuicao normal.
Alguns testes que trataremos envolverao a nor-
mal. Contudo, se a suposicao de normalidade
for violada, exsitem outros testes conhecidos
como testes nao parametricos que poderao ser
usados.
Estudaremos duas situacoes diferentes: o caso
em que temos duas amostras independentes e
o caso em que temos duas amostras pareadas
(relacionadas, emparelhadas).
1
Em ambos os casos, veremos um teste para-
metrico que resulta num teste t e supoe nor-
malidade e, veremos tambem, um teste nao-
parametrico, que nao supoe normalidade.
Uma questao que aparece com frequencia e:
“O metodo A e melhor do que o metodo B?”
Em termos estatısticos, ela equivale a com-
parar dois conjuntos de informacoes, resultan-
tes das medidas obtidas da aplicacao dos dois
metodos a dois conjuntos de objetos ou in-
divıduos.
Mas como caracterizar adequadamente a “igual-
dade” ou “equivalencia” das duas populacoes?
2
No caso da suposicao de normalidade ser valida
e, se tambem for possıvel supor que as varian-
cias das duas populacoes sao iguais, observe
que poderıamos caracterizar a hipotese de equi-
valencia na forma H0 : µ1 = µ2. Porem, no
caso em que nao e adequado supor a normali-
dade, de fato, a hipotese de equivalencia seria
H0 : P1 = P2, que chamaremos hipotese de
homogeneidade das duas populacoes.
O significado de H0 : P1 = P2 dependera muito
do interesse do pesquisador em considerar qual
tipo de igualdade implicara a coincidencia das
duas distribuicoes.
Os testes t e de Wilcoxon-Mann-Whitney, que
serao descritos a seguir sao apropriados para
esse tipo de situacao.
O teste t e aplicavel quando P1 e P2 sao su-
postas normais com variancias iguais.
3
Veremos na proxima aula como realizar um
teste para verificar se, de fato, a suposicao
de variancias iguais e adequada.
O teste de Wilcoxon-Mann-Whitney aplica-se
para P1 e P2 quaisquer.
Comecaremos estudando o caso em que dis-
pomos de duas amostras independentes para
entao apresentar os dois testes.
Em seguida trataremos do caso de amostras
pareadas.
4
Exemplo 1: Suspeita-se que o barulho afeta
a memoria de cuto prazo. Para verificar essa
suspeita, um experimento foi conduzido da se-
guinte forma: 24 pessoas foram aleatoria-
mente distribuıdas em dois grupos de 12.
Cada grupo recebeu uma lista de 20 palavras
para memorizar em 2 minutos. Os partici-
pantes na condicao barulho tentaram memo-
rizar a lista de 20 palavras, enquanto escu-
tavam, com fones de ouvido, um barulho pre-
gravado. Os outros participantes tambem uti-
lizaram fones de ouvido, mas sem o barulho,
enquanto memorizavam as palavras no mesmo
perıodo de tempo.
O numero de palavras memorizadas por cada
pessoa foi registrado e e apresentado na tabela
a seguir.
5
barulho (1) sem barulho (2)5 15
10 96 166 157 163 186 179 135 11
10 1211 13
9 11x1 = 7,3 x2 = 13,8s1 = 2,5 s2 = 2,8
Se µ1 representa o numero medio de palavrasmemorizadas em 2 minutos entre 20 palavrasna condicao barulho e µ2, a mesma media nacondicao sem barulho, para verificar a suspeitaenunciada, poderıamos realizar o teste das se-guintes hipoteses:{
H0 : µ1 = µ2H1 : µ1 < µ2
.
6
Este e um exemplo da situacao em que temosduas amostras independentes, observe que saopessoas diferentes em cada grupo de 12, equeremos comparar as duas medias popula-cionais. Em Dancey e Reidy eles classificamesse experimento como um experimento inter-participantes.
Antes de resolver o problema apresentado, va-mos apresentar um breve resumo teorico doteste usado nesse contexto.
Sejam X1, X2, ..., Xn e Y1, Y2, ..., Ym duas amos-tras independentes sorteadas de duas popula-coes normais N(µ1, σ
2) e N(µ2, σ2).
Observe que as amostras podem ter tamanhosdiferentes n e m, mas estamos supondo que asamostras provem de populacoes normais comvariancias iguais.
O teste a seguir foi construıdo baseando-senessas suposicoes.
7
Testes para verificar a dequacao das suposicoes
de normalidade dos dados e de homogeneidade
das variancias serao apresentados na proxima
aula.
Nesse contexto temos como hipotese nula a
condicao µ1 = µ2 e as hipoteses alternativas
poderao ser µ1 6= µ2 (bilateral), µ1 < µ2 (uni-
lateral a esquerda) e µ1 > µ2 (unilateral a di-
reita).
Da teoria estatıstica e possıvel mostrar que
se as suposicoes sao verdadeiras, entao a es-
tatıstica
T =X1 − X2 − (µ1 − µ2)
S√
1n + 1
m
tem uma distribuicao t com n+m−2 graus de
liberdade.
8
Na expressao da estatıstica T ,
T = X1−X2−(µ1−µ2)
S√
1n+ 1
m
X1 representa a media amostral referente a
amostra 1 e X2 representa a media amostral
referente a amostra 2.
Alem disso S2 e uma estimativa combinada da
variancia populacional σ2 que e suposta ser a
mesma em ambas as populacoes, a saber,
S2 =(n− 1)S2
1 + (m− 1)S22
n+m− 2
em que S21 e a variancia amostral na amostra
1 e S22 e a variancia amostral na amostra 2.
9
Assim, se H0 e verdadeira segue que
T0 =X1 − X2
S√
1n + 1
m
tem uma distribuicao t com n+m−2 graus deliberdade.
Fixado um nıvel de significancia α, basta obtera(s) cauda(s) correspondente(s) a regiao crıticado teste, usando a distribuicao t com n+m−2graus de liberdade.
No problema da memoria de curto prazo, temosque o numero de graus de liberdade da dis-tribuicao amostral t da estatıstica de teste e12 + 12− 2 = 22.
Fixando α em 5%, temos como regiao crıticaT0 < −1,72, pois trata-se de um teste unila-teral a esquerda. (A cauda a esquerda de -1,72 na dis-
tribuicao t com 22 graus de liberdade corresponde a 5% da dis-
tribuicao.)
10
Vimos que
x1 = 7,3, x2 = 13,8, s21 = 2,52 e s2
2 = 2,82.
Alem disso, n = m = 12. Logo,
s2 = 11×2,52+11×2,82
22 ' 7,05 tal que
t0 = 7,3−13,8√7,05/6
' −5,99
Como o valor amostral de T0 esta na regiao
crıtica, segue que H0 deve ser rejeitada.
Portanto, ao nıvel de significancia de 5%, os
dados trazem evidencia a favor da suposicao
de que a memoria de curto prazo e, em media,
menor na condicao barulho do que na condicao
sem barulho.
11
Como fica o p-valor desse teste?
Basta encontrar a area da cauda a esquerda
de t0 = −5,99 na dsitribuicao t com 22 graus
de liberdade.
E possıvel ver que o p-valor e bem menor que
0,0001 indicando fortıssima evidencia contra
H0.
Portanto, usando o p-valor, chegamos a mesma
conclusao obtida via procedimento classico com
nıvel de significancia 5%.
Agora vamos ver como resolver esse problema
usando o Bioestat.
12
Clique na opcao Estatısticas, seguida de Duas
Amostras Independentes, seguida de Teste t:
Resumo amostral
Entre com as informacoes amostrais
13
Depois e so clicar em executar para obter a
saıda
14
Quadro de procedimentos no caso de duas a-
mostras independentes de populacoes normais
com variancias iguais.
Sejam H0 : µ1 = µ2 a hipotese nula,
T0 = X1−X2
S√
1n+ 1
m
a estatıstica de teste e
α o nıvel de significancia do teste.
H1 Regiao crıtica
µ1 6= µ2 |T0| > t(1−α,n+m−2)
µ1 > µ2 T0 > t(1−2α,n+m−2)
µ1 < µ2 T0 < −t(1−2α,n+m−2)
15
Intervalo de Confianca para a diferenca entreas medias µ1 e µ2:
Suposicao: populacoes normais com varianciasiguais.
IC(µ1 − µ2, γ) : X1 − X2 ± t(γ,n+m−2)S√
1n + 1
m
em que
Xi e a media da i-esima amostra. i = 1,2
S2 =(n−1)S2
1+(m−1)S22
n+m−2 e S2i e a variancia da
i-esima amostra, i = 1,2
n e o tamanho da amostra 1 e m e o tamanhoda amostra 2
t(γ,n+m−2) e um quantil da distribuicao t comn+m− 2 graus de liberdade tal que
P(−t(γ,n+m−2) < T < t(γ,n+m−2)
)= γ,
com T ∼ t(n+m−2).
O Bioestat fornece os IC’s da diferenca das duas medias de 95% e99% de confianca.
16
Observe que nao verificamos se e razoavel a
suposicao de normalidade para os dados ob-
servados nesse exemplo. E se a normalidade
nao for razoavel?
Apresentaremos aqui o teste de Wilcoxon, tam-
bem conhecido como teste de Mann-Whitney
e que daqui em diante chamaremos de teste
WMW nessas notas.
Tem-se duas amostras independentes de duas
populacoes P1 e P2. A variavel observada deve
ter uma escala pelo menos ordinal.
Queremos testar H0 : P1 = P2 contra a hipote-
se alternativa de que as distribuicoes diferem
em localizacao: estaremos interessados em sa-
ber se uma populacao tende a ter valores maio-
res que a outra; ou se elas tem a mesma me-
diana ou a mesma media.
17
O teste WMW e baseado nos postos dos va-
lores obtidos combinando-se as duas amostras.
Como isso e feito?
As duas amostras sao combinadas como se fos-
sem uma so e todos os valores observados sao
colocados em ordem crescente.
Atencao: E importante nao perder a informa-
cao da origem de cada valor observado, ou
seja, ao combinar as amostras, e importante
saber qual valor veio da amostra 1 e qual valor
veio da amostra 2.
18
A tabela a seguir mostra as duas amostras
combinadas antes de ordenar.
19
A tabela a seguir mostra as duas amostras
combinadas depois de ordenar e com atribuicao
de postos (posicao no ranking).
20
A estatıstica de teste e a soma dos postos as-
sociados aos valores amostrados de uma po-
pulacao, P1, por exemplo. Se essa soma for
grande, isso e uma indicacao de que os valores
dessa populacao tendem a ser maiores do que
os valores da populacao P2, e, entao rejeita-
mos H0.
Se ha ao todo n+m observacoes, entao a soma
de todos os postos sera (n+m)×(n+m+1)/2.
Nesse exemplo a soma de todos os postos e
300.
Podemos verificar que a soma dos postos asso-
ciados a condicao barulho e 83, enquanto que
esta soma associada a condicao sem barulho
e 217. Logo, temos evidencias amostrais para
rejeitar H0.
21
Como especificar regioes crıticas ou calcular
p-valores no teste WMW?
Para isso trabalha-se com a estatıstica de Mann-
Whitney dada por U1 = W1− 12n(n+1) em que
W1 e a soma dos postos da amostra 1 e n e o
tamanho amostral correspondente.
Existem tabelas de quantis associados a es-
tatıstica U1 sob a hipotese de homogeneidade.
Para tamanhos amostrais grandes, tambem po-
demos usar uma aproximacao para a distribui-
cao normal, padronizando a estatıstica U1 com
uma media dada por µ = n(n + m + 1)/2 e
variancia dada por σ2 = nm(n+m+ 1)/12.
No entanto, nao precisaremos nos preocupar
com estes detalhes tecnicos. Usarmos o Bioe-
stat para realizar o teste MWM .
22
Escolha a opcao Estatısticas, Duas Amostras
independentes, Mann-Whitney (Wilcoxon Rank-
Sum test).
Os dados devem ser digitados nas colunas 1 e
2.
23
Marque as colunas 1 e 2 e depois clique em
executar para obter a seguinte saıda do teste
WMW
Como p-valor e muito pequeno, rejeitamos a
hipotese nula em favor da hipotese de que na
condicao sem barulho tende-se a memorizar
um numero maior de palavras do que na condi-
cao barulho.
24
Observe que aplicamos os dois testes ao mesmo
conjunto de dados e em ambos os casos obtive-
mos a mesma conclusao. Porem, nem sempre
essa concordancia ira ocorrer.
Que teste eu devo escolher?
O teste t e mais poderoso do que os testes nao-
parametricos. Desse modo, se a suposicao de
normalidade for adequada, recomenda-se usar
o teste t. Use o teste WMW somente se a
suposicao de normalidade nao for adequada.
Na proxima aula veremos como verificar a nor-
malidade de um conjunto de dados.
25
Exemplo 2: A professora Yob esta interes-sada em estudar a violencia de massa duranteas partidas de futebol. Ela acha que a violenciado grupo e resultado dos assentos desconfor-taveis do estadio. Assim, Yob modifica doisestadios diferentes na Inglaterra. Em um esta-dio coloca assentos bem apertados e descon-fortaveis. No outro, instala assentos conforta-veis com muito espaco para as pernas e entreos assentos adjacentes.
A professora organiza uma competicao de mo-do que um clube jogue apenas a metade daspartidas em um estadio e a outra metade nooutro estadio.
Ela acompanha um grupo de 12 fas adoles-centes agressivos e grosseiros desse clube eregistra o numero de vezes em que cada um epreso ou expulso do estadio.
Ela preve que o numero medio de prisoes/expul-soes seja maior no estadio menos confortaveldo que no estadio mais confortavel.
26
A tabela a seguir apresenta os resultados obti-
dos no experimento.
adolescente desconfortavel confortavel1 8 32 5 23 4 44 6 65 4 26 8 17 9 68 10 39 7 410 8 111 6 412 7 3
27
Este e um exemplo da situacao em que temos
amostras pareadas, observe que sao as mesmas
pessoas observadas sob diferentes condicoes,
e queremos comparar as medias populacionais
sob as diferentes condicoes. Em Dancey e
Reidy eles classificam esse experimento como
um experimento intraparticipantes.
Observe que nesse caso, faz sentido definir as
diferencas, pois as observacoes em dada linha
da coluna de dados estao relacionadas a uma
mesma pessoa.
28
Antes de resolver o problema apresentado, va-
mos apresentar um breve resumo teorico do
teste usado nesse contexto.
Suponha que (X1, Y1), (X2, Y2), ..., (Xn, Yn) seja
uma amostra aleatoria bivariada de tamanho
n de uma populacao. Por exemplo, medidas
antes e depois de um tratamento, contagens
sob duas condicoes diferentes, etc.
Defina as diferencas Di = Xi−Yi, i = 1,2, ..., n.
Se a populacao das diferencas tiver uma dis-
tribuicao normal, entao e possıvel construir um
teste t para a media das diferencas.
Suponha que a distribuicao de D seja N(µD, σ2D).
29
Como estamos comparando o mesmo grupo
sob diferentes condicoes, aqui a hipotese nula,
sera da forma µD = 0, ou seja, nao ha efeito de
tratamento. As hipoteses alternativas podem
ser µD 6= 0 (bilateral), µD > 0 (unilateral a
direita) ou µD < 0 (unilateral a esquerda).
Em geral o desvio padrao da populacao de
diferencas e desconhecido e tambem devera ser
estimado por SD com
S2D = 1
n−1
n∑i=1
(Di−D)2, com D a media amostral
das diferencas D1, D2, ..., Dn.
De fato, podemos notar que esse caso reduz-
se ao teste t, com H0 : µD = 0 para uma
amostra aleatoria simples de uma populacao
normal dada por
D1, D2, ..., Dn.
30
Observe que a suposicao de normalidade das
populacoes nao e crucial. As diferencas e que
devem ter um comportamento normal.
A estatıstica de teste a ser usada e T0 =D
SD/√n
.
Sob H0, T0 tem uma distribuicao t com n − 1
graus de liberdade.
Fixando α o nıvel de significancia, basta iden-
tificar a(s) cauda(s) da distribuicao t com n−1
graus de liberdade adequada(s) a hipotese al-
ternativa sob consideracao.
Depois e so verificar se o valor amostral da
estatıstica caiu ou nao na regiao crıtica para
concluir o teste.
31
No caso dos dados do exemplo 2 temos o seguinte
teste H0 : µD = 0 versus H1 : µD > 0.
Logo, como o valor amostral caiu na regiao
crıtica devemos rejeitar a hipotese nula de que
nao ha diferenca nos numeros medios de prisoes/
expulsoes em favor da hipotese alternativa de
que no estadio desconfortavel a media e maior
do que no estadio confortavel.
32
Como fica o p-valor desse teste?
Basta encontrar a area da cauda a direita t0 =
4,96 na dsitribuicao t com 11 graus de liber-
dade.
E possıvel ver que o p-valor e aproximada-
mente 0.0002, indicando fortıssima evidencia
contra H0.
Portanto, usando o p-valor, chegamos a mesma
conclusao obtida via procedimento classico com
nıvel de significancia 5%.
Agora vamos ver como resolver esse problema
usando o Bioestat.
33
Clique na opcao Estatısticas, seguida e Duas
Amostras Relacionadas, seguida de Teste t:
Dados Amostrais
Entre com os dados amostrais que estao nas
colunas 2 e 3 e clique em executar para obter
34
35
Quadro de procedimentos no caso de duas a-
mostras pareadas cujas diferencas sao supostas
normais.
Sejam H0 : µD = 0 a hipotese nula,
T0 = DSD/√n
a estatıstica de teste e
α o nıvel de significancia do teste.
H1 Regiao crıtica
µD 6= 0 |T0| > t(1−α,n−1)
µD > 0 T0 > t(1−2α,n−1)
µD < 0 T0 < −t(1−2α,n−1)
36
Intervalo de Confianca para µD = µ1 − µ2:
Suposicao: as diferencas Di’s sao normalmentedistribuıdas.
IC(µD, γ) : D ± t(γ,n−1)SD√n
em que
D e a media amostral das diferencas
S2D = 1
n−1
n∑i=1
(Di − D)2
n e o tamanho da amostra
t(γ,n−1) e um quantil da distribuicao t com n−1graus de liberdade tal que
P(−t(γ,n−1) < T < t(γ,n−1)
)= γ,
com T ∼ t(n−1).
O Bioestat fornece os IC’s da diferenca das duas medias de 95% e99% de confianca.
37
E se as diferencas nao forem normais? Nesse
caso podemos usar um teste nao parametrico
tambem baseado em postos. Para amostras
emparelhadas, um teste apropriado e o teste
dos postos sinalizados de Wilcoxon.
Para esse teste supomos que a escala das di-
ferencas seja pelo menos intervalar e que os
pares (Xi, Yi) constituam uma amostra aleato-
ria simples da populacao.
Isso implica, em particular, que os Di’s sao in-
dependentes com a mesma mediana. Suponha
ainda que cada Di tenha uma distribuicao si-
metrica. Ou seja, as medias e medianas coin-
cidem.
No exemplo 2, queremos testar
{H0 : µD = 0H1 : µD > 0
.
38
Teste dos postos sinalizados de Wilcoxon
Passo 1: Calcule as diferencas Di, e os respec-
tivos valores absolutos, |Di|, i = 1,2, ..., n
Passo 2: Ordene |D1|, |D2|, ..., |Dn| os valores
absolutos dos Di’s e atribua postos de 1 a n.
Em caso de empate faca o ajuste adequado.
Se houver diferencas nulas, despreze-as e passe
a usar como o numero de observacoes n∗, o
numero de casos em que Di 6= 0.
Passo 3: Para as diferencas cujo sinal foi ne-
gativo, troque o sinal dos postos correspon-
dentes, ou seja atribua um sinal negativo para
eles.
Passo 4: Calcule T+, a soma dos postos com
sinal positivo e T− a soma, em valor absoluto,
dos postos com sinal negativo.
39
Passo 5: Selecione como a estatıstica de teste
T = min{T+, T−}, o menor dos dois. Para
prosseguir com o teste e necessario obter a
distribuicao amostral da estatıstica T sob H0.
Observe que se H0 for verdadeira, espera-se
que qualquer que seja a observacao as proba-
bilidades da diferenca a ela associada receber
um sinal positivo ou um sinal negativo devem
ser iguais e, portanto, espera-se que os valores
de T+ e T− sejam similares.
Observe tambem que se n∗ e o numero total
de diferencas nao-nulas, entao
T+ + T− = n∗(n∗+ 1)/2.
40
Logo, rejeitaremos H0 para algum nıvel de sig-
nificancia α fixado, se o valor de T for muito
pequeno relativamente a sua distribuicao amos-
tral sob H0.
Em alguns textos de estatıstica estao disponı-
veis tabelas da distribuicao amostral da es-
tatıstica T para tamanhos amostrais variados.
Para tamanhos amostrais grandes tambem e
possıvel trabalhar com uma aproximacao nor-
mal da distribuicao de T .
O Bioestat realiza esse teste e produz como
saıda os p-valores no caso do teste ser unila-
teral ou bilateral.
41
No caso dos dados do exemplo 2, temos
Como nao ha diferencas negativas o valor amos-
tral de T sera zero e, o que e um indıcio claro
de que os dados trazem evidencias fortes con-
tra H0, a hipotese de igualdade das duas po-
pulacoes, a saber, violencia sob desconforto e
violencia sob conforto em favor da hipotese al-
ternativa de que a violencia e maior sob condi-
coes de desconforto.
42
Nao iremos nos preocupar com detalhes tecni-cos de atribuicao de postos nesse teste. U-saremos o Bioestat para realizar esse teste e,o programa, nos retornara o p-valor do teste.O importante e saber interpretar a saıda doprograma!
Usando o Bioestat, clique em Estatısticas, se-guida de Duas Amostras Relacionadas, seguidade Wilcoxon (signed-rank test).
Depois de indicar as colunas que contem osdados e clicar em executar, obtem-se
O p-valor indica evidencia muito forte contraH0.
43
Comparacao de proporcoes em duas po-
pulacoes
Existem varias situacoes reais nas quais e im-
portante comparar duas proporcoes populacio-
nais.
Suposicoes
1. Dispoe-se de duas amostras aleatorias sim-
ples que sao independentes, o que significa que
os valores amostrais selecionados de uma po-
pulacao nao estao relacionados ou, de alguma
forma, emparelhados com os valores amostrais
selecionados da outra populacao.
Ou seja, temos n1 observacoes de uma amostra,
resultando em X1 sucessos e numa proporcao
amostral de p1 = X1n1
e n2 observacoes da outra
amostra, resultando em X2 sucessos e numa
proporcao amostral de p2 = X2n2
.
44
2. Para ambas as amostras, deve-se ter nipi ≥5 e ni(1−pi) ≥ 5, tal que haja pelo menos cinco
sucessos e cinco fracassos em cada amostra.
A hipotese nula e a de que H0 : p1 = p2, ou
seja as proporcoes populacionais sao iguais.
Sob H0, faremos uma estimativa combinada
de p1 e p2, supostas iguais, dada por
p = X1+X2n1+n2
= n1p1+n2p2n1+n2
.
Vimos que para tamanhos amostrais grandes
pia∼ N
(pi,
pi(1−pi)ni
), i = 1,2.
Como as amostras sao independentes, vale
p1 − p2a∼ N
(p1 − p2,
p1(1− p1)
n1+p2(1− p2)
n2
)
45
Sob H0, p1 = p2 = p, tal que sob essa hipotese,
p1 − p2a∼ N
(0, p(1− p)
√1n1
+ 1n2
).
Nosso interesse sera testar H0 : p1 = p2 versus
H1 : p1 6= p2 (bilateral) ou H1 : p1 < p2 (unila-
teral a esquerda) ou H1 : p1 > p2 (unilateral a
direita).
A estatıstica de teste sera
Z0 =p1 − p2√
p(1− p)(
1n1
+ 1n2
), com p a estimativa
combinada das proporcoes populacionais p1 e
p2 sob a suposicao de que sao iguais.
Fixado α o nıvel de significancia, basta deter-
minar a regiao crıtica identificando a(s) cau-
da(s) apropriada(s) na distribuicao normal pa-
drao.
46
Se H1 : p1 6= p2, a regiao crıtica sera
|Z0| > z(1−α).
Se H1 : p1 > p2, a regiao crıtica sera
Z0 > z(1−2α).
Se H1 : p1 < p2, a regiao crıtica sera
Z0 < −z(1−2α).
Para calcular o p-valor do teste basta determi-
nar a(s) area(s) da(s) cauda(s) corresponden-
te(s) ao valor amostral da estatıstica Z0.
47
Exemplo 3: Uma pesquisa com 436 traba-
lhadores mostrou que 192 deles disseram
considerar seriamente nao-etico o monitora-
mento dos e-mails dos empregados. Quando
121 chefes do nıvel senior foram pesquisa-
dos, 40 disseram considerar seriamente nao-
etico o monitoramento dos e-mails dos empre-
gados (com base em dados de uma pesquisa
do Gallup).
Use um nıvel de significancia de 5% para testar
a afirmativa de que, para aqueles que disseram
ser seriamente nao etico o monitoramento dos
e-mails dos empregados, a proporcao de em-
pregados e maior do que a proporcao de chefes.
48
Observe que neste exemplo as duas proporcoes
populacionais, p1 e p2 sao, respecitvamente a
proporcao de empregados que consideram seri-
amente nao etico e a proporcao de chefes que
consideram seriamente nao etico o monitora-
mento dos emails dos empregados.
Observaram-se duas amostras independentes:
amostra de empregados: n1 = 436, X1 = 192
e, p1 = 192426 ' 0,44.
amostra de chefes: n2 = 121, X2 = 40 e,
p2 = 40121 ' 0,33.
Nesse problema queremos testar
{H0 : p1 = p2H1 : p1 > p2
,
ao nıvel de significancia α = 0,05.
49
Vimos que se H1 : p1 > p2, a regiao crıtica sera
Z0 > z(1−2α).
Logo, usando uma tabela da distribuicao nor-
mal padrao vemos que z(0,90) ' 1,64 tal que a
regiao crıtica desse teste sera Z0 > 1,64.
Calculemos entao o valor amostral de Z0.
Temos p = 192+40436+121 ' 0,42 tal que
z0 ' 0,44−0,33√0,42(1−0,42)
(1
436+ 1121
) ' 2,17.
Como o valor amostral caiu na regiao crıtica,
ao nıvel de significancia de 5% rejeitamos a
hipotese nula de que tais proporcoes sao iguais
em favor da suposicao de que entre os empre-
gados a proporcao e maior.
50
Qual e o p-valor desse teste?
Como e um teste unilateral a direita, devemos
calcular a area a direita do quantil 2,17 numa
normal padrao.
O p-valor desse teste foi 1,5%, indicando forte
evidencia contra a hipotese nula.
51
Exemplo da Literatura
Desempenho da memoria de pessoas ansiosas e naoansiosas
“Um exemplo de um estudo no qual os pesquisadorespodem ter cometido um erro tipo I e o de Mogg, Math-ews e Weinman (1987). Neste estudo, foi medido odesempenho da memoria para palavras negativas em in-divıduos clinicamente ansiosos (pacientes com transtor-no de ansiedade generalizada (TAG)) e indivıduos naoansiosos. Eles encontraram que pacientes com TAGlembraram menos palavras intimidativas do que nao in-timidativas, que foi o contrario do previsto. Eles con-cluıram, portanto, que essa diferenca nao foi devida aoerro amostral e que era de fato uma diferenca genuınaentre os pacientes com TAG e indivıduos nao ansiosos.Estudos subsequentes dos mesmos autores e de outrostem, contudo, falhado na replicacao dessa descoberta.O consenso geral agora e que nao existe tal tendenciosi-dade de memoria associada ao TAG (veja, por exemplo,Mitte, 2008).”
“Os pesquisadores cometeram um erro tipo I. Eles concluıram quepacientes com TAG tem uma tendencia de se lembrar mais depalavras nao intimidativas comparada com as intimidativas. Pesqui-sas subsequentes contudo falharam na confirmacao disso e agoraparece mais palusıvel concluir que nao existe esse efeito na po-pulacao de pacientes com TAG. Isso nao significa dizer que estafoi uma pesquisa ruim. Pelo contrario, ela foi um estudo excelentee serviu para mostrar que, como nosso julgamento esta baseadoem probabilidades, estamos algumas vezes a merce do acaso.”(Dancey e Reidy, pg 160/161).
52
Voltando ao exemplo apresentado no final da
aula do dia 5 de setembro.
O Dr. Doolittle finalmente desistiu da ideia de
conversar com animais e decidiu tornar-se um
psicologo experimental de animais. Ele esta
particularmente interessado em descobrir se os
gatos sao ou nao mais inteligentes que os ca-
chorros. Para isso ele desenvolveu um teste de
inteligencia especıfico para esse estudo e testa
amostras de gatos e cachorros. Ele foi cuida-
doso para nao introduzir qualquer tipo de vıcio
no teste e acredita que criou um teste que nao
esta associado as especies, ou seja, pode ser u-
sado em qualquer especie. Dr, Dotlittle espera
que exista uma diferenca entre os escores de
gatos e cachorros. No experimento ele traba-
lhou com duas amostras aleatorias de 10 gatos
e 10 cachorros e, os resultados obtidos, estao
na tabela a seguir.
53
gatos cachorros95 116
100 112104 102
78 96130 89111 124
89 131114 117102 107
97 110
Observe que temos uma situacao de duas a-
mostras independentes, gatos e cachorros.
Podemos realizar um teste t bilateral de com-
paracao das medias H0 : µg = µc versus H1 :
µg 6= µc, supondo que os escores de inteligencia
sao normalmente distribuıdos com variancias
iguais nas duas populacoes.
Vejamos como fica a saıda desse teste usando
o Bioestat.54
Depois de ler os dados que estao no arquivo
gatosecachorros.bio, clique em Estatısticas, em
seguida: Duas amostras independentes, e em
seguida: Teste t:dados amostrais. Depois e so
informar que os dados estao nas colunas e 1 e
2 e mandar executar.
55
Como saıda obtemos
Observe que o p-valor do teste bilateral e grandeo suficiente para nao rejeitarmos a hipotesenula de que os escores medios de inteligenciasao iguais entre gatos e cachorros. Ou seja,os dados da pesquisa nao trazem evidencia su-ficiente para a hipotese do Dr. Dootlittle deque os gatos sao mais inteligentes.
56
Se a suposicao de normalidade dos escores de
inteligencia for questionavel, podemos realizar
o teste de Wilcoxon-Mann-Whitney, menos po-
deroso do que o teste t, mas que nao impoe a
condicao de normalidade dos dados.
57
58
Como saıda obtemos
O p-valor bilateral e maior do que 10%, levando
novamente a nao rejeicao da hipotese nula.
Na proxima aula trataremos de testes de nor-
malidade e de homogeneidade das variancias.
59
Referencias bibliograficas:
(1) Busssab e Morettin - Estatıstica Basica.
Editora Saraiva
(2) Triola. Introducao a Estatıstica. LTC.
(3) Dancey e Reidy - Estatıstica sem Matematica
para Psicologia - Penso
60