bioestatística e epidemiologia ii - wordpress.com · 2020. 11. 19. · teste f se duas amostras de...

Bioestatística e Epidemiologia II

Gabriel Bádue

19/11/2020

Aula 06 – Testes

EENF

Em estatística, uma hipótese é uma afirmação sobre uma propriedade de uma população

Exemplos

• Pesquisadores médicos afirmam que a temperatura média do corpo humano não é igual a

98,6°F.

• A percentagem de motoristas hospitalizados em consequência de acidentes é menor no caso

de carros equipados com airbag do que no caso de carros sem esse equipamento.

Um teste de hipótese é um procedimento padrão para se testar uma afirmativa sobre uma

propriedade da população.

Testes de Hipóteses

• Vamos supor que para saber se a proporção de crianças do sexo masculino, nascidas em certa

localidade durante os últimos cinco anos, é estatisticamente diferente de 0,5, um pesquisador fez um

levantamento de dados junto ao registro civil da localidade.

• Vamos supor ainda que a amostra casual simples, obtida pelo pesquisador, tem tamanho 𝑛 = 8.

Usando a terminologia utilizada em testes de hipóteses, são estabelecidas as seguintes hipóteses:

i) A hipótese nula, representada por 𝐻0, de que a proporção é 0,5.

𝐻0: 𝑝 = 0,5

ii) A hipótese alternativa, representada por 𝐻1, de que a proporção é diferente de 0,5.

𝐻1: 𝑝 ≠ 0,5

Então, dizemos que o pesquisador pretende testar 𝐻0: 𝑝 = 0,5 contra 𝐻1: 𝑝 ≠ 0,5, com base em uma

amostra casual simples de tamanho n = 8.



• Seja X o número de meninos dentre as oito crianças da amostra.

• Considerando a hipótese nula em que 𝑝 = 0,5, espera-se que X = 4 ou “próximo” de 4. Nestes casos,

o pesquisador não deve rejeitar 𝐻0.

• Caso X esteja “distante” de 4, a hipótese nula deve ser rejeitada.

Regra de Decisão

i) Rejeitar 𝐻0: 𝑝 = 0,5 se a variável aleatória X assumir valor 0, 1, 7 ou 8. Tais valores constituirão a

“região de rejeição”.

ii) Não rejeitar 𝐻0: 𝑝 = 0,5 se a variável aleatória X assumir valor 2, 3, 4, 5 ou 6. Tais valores constituirão

a “região de aceitação”.

Componentes de um Teste de Hipótese

a) Hipótese Nula 𝐻0 é uma afirmação sobre o valor de um parâmetro, devendo conter uma condição

de igualdade, =,≤ ou ≥.

Testamos a hipótese nula diretamente no sentido de que, supondo-a verdadeira, procuramos chegar a

uma conclusão que nos leve a rejeitar 𝐻0, ou não rejeitar 𝐻0.

b) Hipótese Alternativa 𝐻1 é uma afirmação que deve ser verdadeira se a hipótese nula é falsa. Assim,

ela é o oposto de 𝐻0, comportando um dos seguintes casos: ≠,< ou >.

Exemplo 1

Use as afirmativas dadas para expressar as hipóteses nula e alternativa correspondentes em forma

simbólica.

a) A proporção de trabalhadores que obtêm empregos através de uma rede de amigos é maior do que 0,5.

b) O peso médio de passageiros de aviões com bagagem é, no máximo, 195 lb.

c) O desvio padrão dos escores de QI de atores é igual a 15.


a) A proporção de trabalhadores que obtêm empregos através de uma rede de amigos é maior do que 0,5.

𝐻1: 𝑝 > 0,5

𝐻0: 𝑝 ≤ 0,5

b) O peso médio de passageiros de aviões com bagagem é, no máximo, 195 lb.

𝐻0: 𝜇 ≤ 195

𝐻1: 𝜇 > 195

c) O desvio padrão dos escores de QI de atores é igual a 15.

𝐻0: 𝜎 = 15

𝐻1: 𝜎 ≠ 15

Estatística parâmetro

Ƹ𝑝 𝑝 proporção

ҧ𝑥 𝜇 média

𝑠 𝜎 Desvio-padrão

amostra população


𝐻0 é verdadeira 𝐻0 é falsa

DecisãoDecidimos rejeitar 𝐻0 Erro tipo I Decisão correta

Não rejeitamos a 𝐻0 Decisão correta Erro tipo II

Como os testes de hipóteses são baseados em dados amostrais, estão associados a erros. Por exemplo,

considerando que a proporção citada no exemplo anterior seja igual a 0,5, mas a seleção das 8 crianças foi

feita de tal modo que X = 7, então a hipótese nula será rejeitada. Assim, estaremos rejeitando uma hipótese

nula que é verdadeira. Chamamos esse erro de tipo 1.

• A probabilidade de rejeitar a hipótese nula quando ela é verdadeira, isto é, cometer o erro do tipo I, é

chamada nível de significância e se denota por 𝛼.

• Ao não rejeitar a hipótese nula quando ela é falsa, cometemos um erro do tipo II, cuja probabilidade é 𝛽.


Voltando ao exemplo das crianças, considerando que 𝑝 = 0,5 e X = 0, 1, 7 ou 8. Estaremos rejeitando a hipótese nula,

quando ela é verdadeira. Portanto, estamos cometendo um erro do tipo 1. Qual a probabilidade disso acontecer?

𝑃 𝑋 = 0 =80

0,500,58 = 1 ∙ 1 ∙ 0,0039 = 0,0039

𝑃 𝑋 = 1 =81

0,510,57 = 8 ∙ 0,5 ∙ 0,0078 = 0,0312

𝑃 𝑋 = 7 =87

0,570,51 = 8 ∙ 0,0078 ∙ 0,5 = 0,0312

𝑃 𝑋 = 8 =88

0,580,50 = 1 ∙ 0,0039 ∙ 1 = 0,0039

𝑃 𝑋 = 0 + 𝑃 𝑋 = 1 + 𝑃 𝑋 = 7 + 𝑃 𝑋 = 8 = 0,0702

Portanto, a probabilidade de o pesquisador cometer erro tipo 1 é 7,02%, que é o nível de significância do teste. Já a

probabilidade de ocorrer um erro do tipo 2 é 𝛽.


Exemplo 2

O estudo de Ribeiro et all (1978 apud Vieira, 1986) utilizou uma amostra de 210 meninos, residentes em Curitiba,

para estudar o daltonismo. Segundo a literatura, 8% dos indivíduos do sexo masculino são daltônicos. Utilize um

teste de hipóteses para verificar se essa proporção é estatisticamente igual para os meninos que residem em

Curitiba.

• Como cada indivíduo do sexo masculino pode ser daltônico ou não, temos uma distribuição binomial, onde X é o

número de daltônicos na amostra de 210 indivíduos.

• Segundo a literatura, a probabilidade de um indivíduo do sexo masculino ser daltônico é 𝑝 = 0,08. Então, 𝑞 =

0,92.

• Considerando que uma binomial pode ser aproximada à uma normal quando 𝑛𝑝 > 5 e 𝑛𝑞 > 5, temos:

𝑛𝑝 = 210 ∙ 0,08 = 16,8 e 𝑛𝑞 = 210 ∙ 0,92 = 193,20 → binomial ≈ normal

𝝁 = 𝑛𝑝 = 𝟏𝟔, 𝟖 𝑒 𝜎2 = 𝑛𝑝𝑞 = 210 ∙ 0,08 ∙ 0,92 = 15,456 → 𝝈 = 𝟑, 𝟗𝟑


Vamos testar a hipótese de que o número médio de daltônicos em 210 meninos de Curitiba, que representaremos

por 𝜇𝐶 , não difere do número médio de daltônicos referido na literatura, que para 210 indivíduos é 𝜇 = 16,8.

𝐻0: 𝜇𝐶 = 16,8

𝐻1: 𝜇𝐶 ≠ 16,8Vamos considerar um nível de significância de 5%

1,96-1,96

Como na amostra do referido estudo foram observados 13

daltônicos, temos

𝑧 =13 − 16,8

3,93= −0,97

-0,97

Portanto, ao nível de significância de 5%, não rejeitamos a

hipótese nula.

Teste FSe duas amostras de tamanhos 𝑛1 e 𝑛2, tomadas de duas

populações, se referem a uma mesma variável aleatória com

distribuição aproximadamente normal e têm médias ҧ𝑥1 e ҧ𝑥2

e variâncias 𝑠12 e 𝑠2

2, o teste F é utilizado para testar a

hipótese de que as variâncias das duas populações são

iguais. Assim, temos

𝐻0: 𝜎12 = 𝜎2

2

𝐻1: 𝜎12 ≠ 𝜎2

2

A estatística de teste será

𝐹 =𝑠12

𝑠22

Rejeitar a 𝐻0 se 𝑝 < 𝛼

Teste F

Condição

Normal Timectomizado

40,3 18,6

40,0 20,3

39,6 23,6

35,2 22,2

32 20,9

Tabela 1 – Pesos em gramas de ratos machos de raça Wistar com 15 dias de idade, segundo a condição normal e timectomizado

(submetidos à extirpação do timo) aos 4 dias de idade

Exemplo 4A variância dos pesos de ratos machos da raça Wistar com 15 dias de idade é igual aos dos ratos demesmas condições timectorizados?

Se as variâncias são iguais dizemos que as populações são homocedásticas e se forem diferentes sãoheterocedásticas.

𝐻0: 𝜎12 = 𝜎2

2

𝐻1: 𝜎12 ≠ 𝜎2

2

p = 0,23

𝛼 = 0,05

p > 0,05, não rejeitamos a H0

Portanto, as variâncias dessas populações são iguais, considerando

um nível de significância de 5%.

Teste tO teste t é utilizado para comparar duas médias. Estes servem para

1. Comparar as médias de duas amostras independentes.

2. Comparar as médias de duas amostras pareadas (mesmos sujeitos em tempos distintos)

3. Comparar a média de uma amostra com a média de sua população.

Para testar se as médias de duas populações são iguais, a partir de suas amostras, temos

𝐻0: 𝜇1 = 𝜇2

𝐻1: 𝜇1 ≠ 𝜇2

𝑡 =ҧ𝑥1 − ҧ𝑥2

1𝑛1

+1𝑛2

𝑠2

𝑠2 =𝑛1 − 1 𝑠1

2 + 𝑛2 − 1 𝑠22

𝑛1 + 𝑛2 − 2

Rejeitar a 𝐻0 se 𝑝 < 𝛼

Teste t

Condição

Normal Timectomizado

40,3 18,6

40,0 20,3

39,6 23,6

35,2 22,2

32 20,9

Tabela 1 – Pesos em gramas de ratos machos de raça Wistar com 15 dias de idade, segundo a condição normal e timectomizado

(submetidos à extirpação do timo) aos 4 dias de idade

Exemplo 5A média dos pesos de ratos machos da raça Wistar com 15 dias de idade é igual a dos ratos de mesmascondições timectorizados?

𝐻0: 𝜇1 = 𝜇2

𝐻1: 𝜇1 ≠ 𝜇2

p = 0,0001

𝛼 = 0,05

p < 0,05, rejeitamos a H0

Portanto, as médias dessas populações são diferentes,

considerando um nível de confiança de 95%.

Nível de confiança é 1 − 𝛼.Nível de significância é 𝛼

Teste t

Tabela 2 – Percentual de gordura antes e depois do tratamento

Exemplo 5

Um nutricionista acompanhou um grupo de pacientes a fim de verificar se uma dieta estava gerando os

resultados esperados. Para tento, ele aferiu o percentual de gordura corporal antes do início da dieta e

após sessenta dias. Os resultados estão apresentados na tabela 02. Com base neste resultado, o

profissional pode afirmar que a dieta proposta é eficiente?

antes 26 27 23 25 25 29 30 31 36 23 32 22

depois 21 28 24 23 23 19 28 20 22 20 26 26

Teste t

Tabela 1 – Percentual de gordura antes e depois do tratamento

Exemplo 6

Suponha que eu queira saber se a altura das discentes da disciplina de Bioestatística e Epidemiologia 2, do

PLE, é maior que a média das alturas das mulheres alagoanas. Vamos supor que a média das alturas das

mulheres brasileiras seja 1,60 m.

antes 26 27 23 25 25 29 30 31 36 23 32 22

depois 21 28 24 23 23 19 28 20 22 20 26 26

Qui-quadradoTabela 3 – Associação entre temperaturas e desfecho clínico de

pacientes com COVID-19, em Alagoas

Não-hospitalizados Hospitalizados

Até 38,5°C 96 78

> 38,5°C 34 36

OR = 1,3 e p = 0,43

𝑝 < 𝛼 → há significância estatística

Tabela 4 – Associação entre falta de ar e desfecho clínico de pacientes com COVID-19, em Alagoas

Não-hospitalizados Hospitalizados

Sem sintoma 95 57

Falta de Ar 40 63

OR = 2,7 e p = 0,0003

bioestatística e epidemiologia ii - wordpress.com · 2020. 11. 19. · teste f se duas amostras de...

Documents