bioestatística e epidemiologia ii - wordpress.com · 2020. 11. 19. · teste f se duas amostras de...
TRANSCRIPT
Bioestatística e Epidemiologia II
Gabriel Bádue
19/11/2020
Aula 06 – Testes
EENF
Em estatística, uma hipótese é uma afirmação sobre uma propriedade de uma população
Exemplos
• Pesquisadores médicos afirmam que a temperatura média do corpo humano não é igual a
98,6°F.
• A percentagem de motoristas hospitalizados em consequência de acidentes é menor no caso
de carros equipados com airbag do que no caso de carros sem esse equipamento.
Um teste de hipótese é um procedimento padrão para se testar uma afirmativa sobre uma
propriedade da população.
Testes de Hipóteses
• Vamos supor que para saber se a proporção de crianças do sexo masculino, nascidas em certa
localidade durante os últimos cinco anos, é estatisticamente diferente de 0,5, um pesquisador fez um
levantamento de dados junto ao registro civil da localidade.
• Vamos supor ainda que a amostra casual simples, obtida pelo pesquisador, tem tamanho 𝑛 = 8.
Usando a terminologia utilizada em testes de hipóteses, são estabelecidas as seguintes hipóteses:
i) A hipótese nula, representada por 𝐻0, de que a proporção é 0,5.
𝐻0: 𝑝 = 0,5
ii) A hipótese alternativa, representada por 𝐻1, de que a proporção é diferente de 0,5.
𝐻1: 𝑝 ≠ 0,5
Então, dizemos que o pesquisador pretende testar 𝐻0: 𝑝 = 0,5 contra 𝐻1: 𝑝 ≠ 0,5, com base em uma
amostra casual simples de tamanho n = 8.
Testes de Hipóteses
Testes de Hipóteses
• Seja X o número de meninos dentre as oito crianças da amostra.
• Considerando a hipótese nula em que 𝑝 = 0,5, espera-se que X = 4 ou “próximo” de 4. Nestes casos,
o pesquisador não deve rejeitar 𝐻0.
• Caso X esteja “distante” de 4, a hipótese nula deve ser rejeitada.
Regra de Decisão
i) Rejeitar 𝐻0: 𝑝 = 0,5 se a variável aleatória X assumir valor 0, 1, 7 ou 8. Tais valores constituirão a
“região de rejeição”.
ii) Não rejeitar 𝐻0: 𝑝 = 0,5 se a variável aleatória X assumir valor 2, 3, 4, 5 ou 6. Tais valores constituirão
a “região de aceitação”.
Componentes de um Teste de Hipótese
a) Hipótese Nula 𝐻0 é uma afirmação sobre o valor de um parâmetro, devendo conter uma condição
de igualdade, =,≤ ou ≥.
Testamos a hipótese nula diretamente no sentido de que, supondo-a verdadeira, procuramos chegar a
uma conclusão que nos leve a rejeitar 𝐻0, ou não rejeitar 𝐻0.
b) Hipótese Alternativa 𝐻1 é uma afirmação que deve ser verdadeira se a hipótese nula é falsa. Assim,
ela é o oposto de 𝐻0, comportando um dos seguintes casos: ≠,< ou >.
Exemplo 1
Use as afirmativas dadas para expressar as hipóteses nula e alternativa correspondentes em forma
simbólica.
a) A proporção de trabalhadores que obtêm empregos através de uma rede de amigos é maior do que 0,5.
b) O peso médio de passageiros de aviões com bagagem é, no máximo, 195 lb.
c) O desvio padrão dos escores de QI de atores é igual a 15.
Testes de Hipóteses
a) A proporção de trabalhadores que obtêm empregos através de uma rede de amigos é maior do que 0,5.
𝐻1: 𝑝 > 0,5
𝐻0: 𝑝 ≤ 0,5
b) O peso médio de passageiros de aviões com bagagem é, no máximo, 195 lb.
𝐻0: 𝜇 ≤ 195
𝐻1: 𝜇 > 195
c) O desvio padrão dos escores de QI de atores é igual a 15.
𝐻0: 𝜎 = 15
𝐻1: 𝜎 ≠ 15
Estatística parâmetro
Ƹ𝑝 𝑝 proporção
ҧ𝑥 𝜇 média
𝑠 𝜎 Desvio-padrão
amostra população
Testes de Hipóteses
𝐻0 é verdadeira 𝐻0 é falsa
DecisãoDecidimos rejeitar 𝐻0 Erro tipo I Decisão correta
Não rejeitamos a 𝐻0 Decisão correta Erro tipo II
Como os testes de hipóteses são baseados em dados amostrais, estão associados a erros. Por exemplo,
considerando que a proporção citada no exemplo anterior seja igual a 0,5, mas a seleção das 8 crianças foi
feita de tal modo que X = 7, então a hipótese nula será rejeitada. Assim, estaremos rejeitando uma hipótese
nula que é verdadeira. Chamamos esse erro de tipo 1.
• A probabilidade de rejeitar a hipótese nula quando ela é verdadeira, isto é, cometer o erro do tipo I, é
chamada nível de significância e se denota por 𝛼.
• Ao não rejeitar a hipótese nula quando ela é falsa, cometemos um erro do tipo II, cuja probabilidade é 𝛽.
Testes de Hipóteses
Voltando ao exemplo das crianças, considerando que 𝑝 = 0,5 e X = 0, 1, 7 ou 8. Estaremos rejeitando a hipótese nula,
quando ela é verdadeira. Portanto, estamos cometendo um erro do tipo 1. Qual a probabilidade disso acontecer?
𝑃 𝑋 = 0 =80
0,500,58 = 1 ∙ 1 ∙ 0,0039 = 0,0039
𝑃 𝑋 = 1 =81
0,510,57 = 8 ∙ 0,5 ∙ 0,0078 = 0,0312
𝑃 𝑋 = 7 =87
0,570,51 = 8 ∙ 0,0078 ∙ 0,5 = 0,0312
𝑃 𝑋 = 8 =88
0,580,50 = 1 ∙ 0,0039 ∙ 1 = 0,0039
𝑃 𝑋 = 0 + 𝑃 𝑋 = 1 + 𝑃 𝑋 = 7 + 𝑃 𝑋 = 8 = 0,0702
Portanto, a probabilidade de o pesquisador cometer erro tipo 1 é 7,02%, que é o nível de significância do teste. Já a
probabilidade de ocorrer um erro do tipo 2 é 𝛽.
Testes de Hipóteses
Exemplo 2
O estudo de Ribeiro et all (1978 apud Vieira, 1986) utilizou uma amostra de 210 meninos, residentes em Curitiba,
para estudar o daltonismo. Segundo a literatura, 8% dos indivíduos do sexo masculino são daltônicos. Utilize um
teste de hipóteses para verificar se essa proporção é estatisticamente igual para os meninos que residem em
Curitiba.
• Como cada indivíduo do sexo masculino pode ser daltônico ou não, temos uma distribuição binomial, onde X é o
número de daltônicos na amostra de 210 indivíduos.
• Segundo a literatura, a probabilidade de um indivíduo do sexo masculino ser daltônico é 𝑝 = 0,08. Então, 𝑞 =
0,92.
• Considerando que uma binomial pode ser aproximada à uma normal quando 𝑛𝑝 > 5 e 𝑛𝑞 > 5, temos:
𝑛𝑝 = 210 ∙ 0,08 = 16,8 e 𝑛𝑞 = 210 ∙ 0,92 = 193,20 → binomial ≈ normal
𝝁 = 𝑛𝑝 = 𝟏𝟔, 𝟖 𝑒 𝜎2 = 𝑛𝑝𝑞 = 210 ∙ 0,08 ∙ 0,92 = 15,456 → 𝝈 = 𝟑, 𝟗𝟑
Testes de Hipóteses
Vamos testar a hipótese de que o número médio de daltônicos em 210 meninos de Curitiba, que representaremos
por 𝜇𝐶 , não difere do número médio de daltônicos referido na literatura, que para 210 indivíduos é 𝜇 = 16,8.
𝐻0: 𝜇𝐶 = 16,8
𝐻1: 𝜇𝐶 ≠ 16,8Vamos considerar um nível de significância de 5%
1,96-1,96
Como na amostra do referido estudo foram observados 13
daltônicos, temos
𝑧 =13 − 16,8
3,93= −0,97
-0,97
Portanto, ao nível de significância de 5%, não rejeitamos a
hipótese nula.
Teste FSe duas amostras de tamanhos 𝑛1 e 𝑛2, tomadas de duas
populações, se referem a uma mesma variável aleatória com
distribuição aproximadamente normal e têm médias ҧ𝑥1 e ҧ𝑥2
e variâncias 𝑠12 e 𝑠2
2, o teste F é utilizado para testar a
hipótese de que as variâncias das duas populações são
iguais. Assim, temos
𝐻0: 𝜎12 = 𝜎2
2
𝐻1: 𝜎12 ≠ 𝜎2
2
A estatística de teste será
𝐹 =𝑠12
𝑠22
Rejeitar a 𝐻0 se 𝑝 < 𝛼
Teste F
Condição
Normal Timectomizado
40,3 18,6
40,0 20,3
39,6 23,6
35,2 22,2
32 20,9
Tabela 1 – Pesos em gramas de ratos machos de raça Wistar com 15 dias de idade, segundo a condição normal e timectomizado
(submetidos à extirpação do timo) aos 4 dias de idade
Exemplo 4A variância dos pesos de ratos machos da raça Wistar com 15 dias de idade é igual aos dos ratos demesmas condições timectorizados?
Se as variâncias são iguais dizemos que as populações são homocedásticas e se forem diferentes sãoheterocedásticas.
𝐻0: 𝜎12 = 𝜎2
2
𝐻1: 𝜎12 ≠ 𝜎2
2
p = 0,23
𝛼 = 0,05
p > 0,05, não rejeitamos a H0
Portanto, as variâncias dessas populações são iguais, considerando
um nível de significância de 5%.
Teste tO teste t é utilizado para comparar duas médias. Estes servem para
1. Comparar as médias de duas amostras independentes.
2. Comparar as médias de duas amostras pareadas (mesmos sujeitos em tempos distintos)
3. Comparar a média de uma amostra com a média de sua população.
Para testar se as médias de duas populações são iguais, a partir de suas amostras, temos
𝐻0: 𝜇1 = 𝜇2
𝐻1: 𝜇1 ≠ 𝜇2
𝑡 =ҧ𝑥1 − ҧ𝑥2
1𝑛1
+1𝑛2
𝑠2
𝑠2 =𝑛1 − 1 𝑠1
2 + 𝑛2 − 1 𝑠22
𝑛1 + 𝑛2 − 2
Rejeitar a 𝐻0 se 𝑝 < 𝛼
Teste t
Condição
Normal Timectomizado
40,3 18,6
40,0 20,3
39,6 23,6
35,2 22,2
32 20,9
Tabela 1 – Pesos em gramas de ratos machos de raça Wistar com 15 dias de idade, segundo a condição normal e timectomizado
(submetidos à extirpação do timo) aos 4 dias de idade
Exemplo 5A média dos pesos de ratos machos da raça Wistar com 15 dias de idade é igual a dos ratos de mesmascondições timectorizados?
𝐻0: 𝜇1 = 𝜇2
𝐻1: 𝜇1 ≠ 𝜇2
p = 0,0001
𝛼 = 0,05
p < 0,05, rejeitamos a H0
Portanto, as médias dessas populações são diferentes,
considerando um nível de confiança de 95%.
Nível de confiança é 1 − 𝛼.Nível de significância é 𝛼
Teste t
Tabela 2 – Percentual de gordura antes e depois do tratamento
Exemplo 5
Um nutricionista acompanhou um grupo de pacientes a fim de verificar se uma dieta estava gerando os
resultados esperados. Para tento, ele aferiu o percentual de gordura corporal antes do início da dieta e
após sessenta dias. Os resultados estão apresentados na tabela 02. Com base neste resultado, o
profissional pode afirmar que a dieta proposta é eficiente?
antes 26 27 23 25 25 29 30 31 36 23 32 22
depois 21 28 24 23 23 19 28 20 22 20 26 26
Teste t
Tabela 1 – Percentual de gordura antes e depois do tratamento
Exemplo 6
Suponha que eu queira saber se a altura das discentes da disciplina de Bioestatística e Epidemiologia 2, do
PLE, é maior que a média das alturas das mulheres alagoanas. Vamos supor que a média das alturas das
mulheres brasileiras seja 1,60 m.
antes 26 27 23 25 25 29 30 31 36 23 32 22
depois 21 28 24 23 23 19 28 20 22 20 26 26
Qui-quadradoTabela 3 – Associação entre temperaturas e desfecho clínico de
pacientes com COVID-19, em Alagoas
Não-hospitalizados Hospitalizados
Até 38,5°C 96 78
> 38,5°C 34 36
OR = 1,3 e p = 0,43
𝑝 < 𝛼 → há significância estatística
Tabela 4 – Associação entre falta de ar e desfecho clínico de pacientes com COVID-19, em Alagoas
Não-hospitalizados Hospitalizados
Sem sintoma 95 57
Falta de Ar 40 63
OR = 2,7 e p = 0,0003