universidade federal do parÁ instituto de ciÊncias da saÚde faculdade de odontologia odontologia...
TRANSCRIPT
UNIVERSIDADE FEDERAL DO PARÁINSTITUTO DE CIÊNCIAS DA SAÚDE
FACULDADE DE ODONTOLOGIAOdontologia em Saúde Coletiva IV
TESTE T DE STUDENTTESTE ANOVA
Prof.ª Dr.ª Ana Daniela Silva da Silveira
REVISAR É PRECISO!
LEMBRAM DOS FEIJÕES?!??
EXISTE DIFERENÇA QUANTO AO TEMPO DE
COZIMENTO?
QUAIS AS HIPÓTESES?
1- NÃO! NÃO EXISTE DIFERENÇA, OU SEJA, OS TEMPOS SÃO IGUAIS...
2- SIM! EXISTE DIFERENÇA...
EXISTE DIFERENÇA QUANTO AO TEMPO DE COZIMENTO?
COMO RESOLVER?
Depois de definirmos as hipóteses, vamos testá-las
para descobrir qual delas eu aceito, H0 ou H1
O meu estudo seguirá esta ordem…
1. Definir as hipóteses
2. Identificar as variáveis
Analisar as variáveis quanto:
Natureza: numérica ou categórica;
Distribuição: normal ou anormal;
Continuidade;
Instabilidade;
3. Adotar o nível de
significância (α)
4. Tomar a decisão quanto
ao tipo de erro que quero
evitar ou minimizar.
5. Escolher o teste que
seja o mais adequado para
minha decisão.
Realizou-se uma pesquisa com o objetivo de se verificar se existe diferença entre o tempo de cozimento do feijão marrom e do tempo de cozimento do feijão preto.
Foram feitas 10 análises para cada um dos grupos... Análises Feijão marrom Feijão preto
1 33 45
2 35 49
3 33.5 46.5
4 40 46
5 37 52
6 38 57
7 41 55
8 34 57
9 34.2 56
10 35 51
MÉDIA (±DP) 36,07(±2,8) 51,45(±4,6)
EXPERIMENTO E
DADOS TOTALMENTE
FICTÍCIOS!!!
36,07 - 2dp + 2dp
30,47 41,66
Distribuição dos valores de tempo de cozimento dos feijões marrons
95%
O que eu entendo ao analisar este
gráfico?
36,07 - 2dp + 2dp
30,47 41,66
Distribuição dos valores de tempo de cozimento dos feijões marrons
95%
Que o tempo de cozimento médio
dos feijões marrons é de 36,07 minutos,
com intervalo de confiança de 30,47
– 41,66
Entendo também que, se eu respeitei os padrões de amostragem, significa que a chance da média de tempo de cozimento da população de feijões ser maior que 30,47 e menor que 41,66 é de 95%
Distribuição dos valores de tempo de cozimento
X36,07(±2,8) 51,45(±4,6)
Feijão marrom Feijão preto
36,07 - 2dp
30,47
41,66
95%
Então, neste caso, vou assumir o
parâmetro de 5%
Zona de rejeição = 2,5%
Zona de rejeição = 2,5%
α=0,05
30,47 36,07 41,66 42,08 51,45 60,81
Onde as duas curvas se encontram?
Qual a probabilidade do valor real da
população de feijões ser igual para os
feijões pretos e marrons?
*Me perdoem os matemáticos e estatísticos, mas esse esquema foi o que eu consegui criar para explicar o próximo slide...
Feijão marrom Feijão preto
O valor de pO valor de p é a probabilidade de dois grupos serem iguais, ou seja, aceitar H0!
Em geral, assume-se um parâmetro de análise para o p, um nível de decisão para se descartar H0 e se dizer, com segurança, que de fato há diferença entre os grupos. Este
nível de decisão é exatamente o valor de α, ou nível de significância.
Geralmente, este nível de decisão é de 5%, ou seja, o valor de p, ou p valor, deve ser menor que 0,05 para que se diga que os grupos são diferentes entre si, rejeitar H0, ou como estamos acostumados a dizer, ter diferença estatisticamente significante.
Como eu faço para descobrir o calor de p?
Eu preciso testar as hipóteses...
E como eu faço isso?
UNIVERSIDADE FEDERAL DO PARÁINSTITUTO DE CIÊNCIAS DA SAÚDE
FACULDADE DE ODONTOLOGIAOdontologia em Saúde Coletiva IV
TESTE T DE STUDENTTESTE ANOVA
Prof.ª Dr.ª Ana Daniela Silva da Silveira
Os testes de hipóteses que eu vou utilizar dependem de algumas características do meu estudo e das minhas variáveis...
Classificação das Variáveis
Fonte: Berquó et al, 1981; Costa, 1998 apud Roncalli, 2008
TIPO CLASSE SUB-CLASSE- EXEMPLOS
CATEGÓRICAS
Nominal Exaustivas Gênero musical preferido
Mutuamente Exclusivas
Sexo, Cor dos Olhos, Etnia
Ordinal Escolaridade
QUANTITATIVAS Contínua Intervalar Temperatura
Racional Idade, Peso, Altura
Discreta Número de Dentes Cariados, Perdidos e Obturado (CPO-D)
A aplicação adequada de um teste estatístico depende de alguns fatores:
1- O tipo de pergunta que se deseja responder
1- A classificação da variável dependente e da independente
Princípio para aplicação de Testes
Retirado da aula do Prof. Dr. Angelo Roncalli (UFRN), 2008
Desse modo, são possíveis várias combinações em função destes fatores:
Variável Dependente
Variável Independente
Pergunta
Quantitativa Contínua/ Discreta
Quantitativa Contínua/ Discreta
As variáveis se correlacionam entre si? Com que magnitude?
Categórica Categórica
Quantitativa Contínua/ Discreta
Categórica
As médias (ou medianas) da variável dependente diferem entre as categorias da variável independente?
Princípio para aplicação de Testes
Retirado da aula do Prof. Dr. Angelo Roncalli (UFRN), 2008
Sim Não Sim Não
2 gruposMais de 2 grupos
Não – TestesNão-Paramétricos
WilcoxonMann-
WhitneyFriedman
Kruskal-Wallis
Pergunta da Pesquisa: As médias da variável dependente diferem entre os grupos
estudados?
Sim Não Sim Não
2 gruposMais de 2 grupos
Sim – TestesParamétricos
Teste “t”Pareado
Teste “t”Análise
VariânciaAnálise
Variância
1a Pergunta: Os dados apresentam distribuição normal?
2a Pergunta: Com quantos grupos ou com quantas categorias da variável estou trabalhando?
3a Pergunta: Existe vinculação entre as categorias da variável?
4a Pergunta: Qual teste devo usar?
Retirado da aula do Prof. Dr. Angelo Roncalli (UFRN), 2008
Não
2 gruposMais de 2 grupos
Categórica
RegressãoLogística
Sim Não Sim Não
2 gruposMais de 2 grupos
Quantitativa
CorrelaçãoPearson
CorrelaçãoSpearman
RegressãoMúltipla
RegressãoMúltipla
1a Pergunta: Qual o tipo de variável?
2a Pergunta: Com quantos grupos ou com quantas categorias da variável estou trabalhando?
3a Pergunta: Os dados apresentam distribuição normal?
4a Pergunta: Qual teste devo usar?
Não
Qui-Quadrado
Exato deFisher
n < 20n > 20
Pergunta da Pesquisa: As variáveis dependente e independente se correlacionam entre si? Qual a
magnitude?
Reti
rado d
a a
ula
do P
rof. D
r. A
ngelo
Ronca
lli (
UFR
N),
2008
Comparando médias de populações com
Distribuição Normal:
Teste “t” de Student
Teste t-StudentO teste t-Student é um teste paramétrico de largo uso. Como ele analisa amostras quantitativas, seu objetivo vai ser comparar os dois grupos... Devemos observar:a) amostras randômicas de cada população investigada;b) as variâncias devem ser homogêneas;c) as variáveis das populações de onde as amostras foram selecionadas devemapresentar distribuição aproximadamente normal.
- As duas médias, relativas à mesma variável quantitativa, se referem a duas populações cujas variâncias, embora desconhecidas, são iguais.
Teste t-Student – situações...
- As duas médias, relativas à mesma variável quantitativa, se referem a duas populações cujas variâncias, embora desconhecidas, são diferentes.
- As duas médias se referem a duas medidas relativas à mesma variável quantitativa, tomadas dos mesmos elementos de uma população, mas em duas situações distintas
TESTE F
22
12
s
sF
- As duas médias, relativas à mesma variável quantitativa, se referem a duas populações cujas variâncias, embora desconhecidas, são iguais (homocedásticas).
Teste t-Student – situações...
2
21
21
11s
nn
xxt
Onde S² é a variância ponderada das duas
amostras...
2
11
21
22
212
12
nn
snsns
Retirado da aula do Prof. Dr. Angelo Roncalli (UFRN), 2008
Teste t-Student – situações...
O valor de t dependerá dos graus de liberdade...
Retirado da aula do Prof. Dr. Angelo Roncalli (UFRN), 2008
2
22
1
12
21
ns
ns
xxt
- As duas médias, relativas à mesma variável quantitativa, se referem a duas populações cujas variâncias, embora desconhecidas, são diferentes (heterocedásticas).
11 2
2
2
22
1
2
1
12
2
2
22
1
12
n
ns
n
ns
ns
ns
g
Exemplo…
Sexo n x S2
Masc 1.442 49,29 5,76
Fem 1.361 48,54 6,30
Tamanho da amostra, média e variância da estatura, em centímetros, de recém-nascidos não-portadores de anomalias congênitas, segundo sexo.
Fonte: Arena, 1976, apud Vieira, 1981
Retirado da aula do Prof. Dr. Angelo Roncalli (UFRN), 2008
Sexo n x S2
Masc 1.442 49,29 5,76
Fem 1.361 48,54 6,30
Na prática…
Duas populações
distintas
Na prática…
Na prática…
Observar o que temos:1- Quantas amostras?2- São relacionadas ou independentes?3- Eu tenho todos os dados?
Na prática…
Observar o que temos:1- Quantas amostras?2- São relacionadas ou independentes?3- Eu tenho todos os dados?
Na prática…
Observar o que temos:1- Quantas amostras?2- São relacionadas ou independentes?3- Eu tenho todos os dados?
Na prática…
Na prática…
Mas o que é o valor de p mesmo?
Mas o que é o valor de p mesmo?
O valor de p é a probabilidade de dois grupos serem iguais, ou seja, aceitar H0!
Em geral, assume-se um parâmetro de análise para o p, um nível de decisão para se descartar H0 e se dizer, com segurança, que de fato há diferença entre os grupos. Este nível de decisão é
exatamente o valor de α, ou nível de significância. Geralmente, este nível de decisão (α ) é de 5%, ou seja, o valor de
p, ou p valor, deve ser menor que 0,05 para que se diga que os grupos são diferentes entre si, rejeitar H0, ou como estamos acostumados a dizer, ter diferença estatisticamente significante.
Na prática…
Teste t-Student – situações...
Onde d é a média das diferenças entre cada par de dados e S² a
variância desta média.
O “t” encontrado está associado a n – 1 graus
de liberdade
Retirado da aula do Prof. Dr. Angelo Roncalli (UFRN), 2008
- As duas médias se referem a duas medidas relativas à mesma variável quantitativa, tomadas dos mesmos elementos de uma população, mas em duas situações distintas
ns
dt
2
Exemplo…
Exemplo 2…
Na prática…Vamos supor que eu quero fazer um estudo e definir o valor de cor (∆E) em dentes de boi em duas situações; antes e depois de aplicar algum produto clareador que eu inventei... (estudo fictício)
Na prática…
Observar o que temos:1- Quantas amostras?2- São relacionadas ou independentes?3- Eu tenho todos os dados?
Na prática…
Na prática…
Na prática…
Na prática…
Comparando médias de populações com
Distribuição Normal: a
Análise de Variância
A Análise de Variância - ANOVA
One-way – quando os elementos foram categorizados de um único modo – tipo de medicamentoTwo-way – Quando os elementos foram categorizados de dois modos – tipo de medicamento e sexo
É o teste estatístico indicado para variáveis com distribuição normal, estabelecendo a comparação entre três ou mais médias.
Pode ser de dois tipos:
Adaptado da aula do Prof. Dr. Angelo Roncalli (UFRN), 2008
A Análise de Variância - ANOVA
Vimos que o teste t serve para a comparação entre duas amostras. Agora, iremos comparar três ou mais...
Ex.: testar 4 drogas diferentes (diuréticos) ao mesmo tempo e
avaliar o efeito de cada droga sobre o débito urinário em 16
voluntários.
teste t: comparar os grupos 2 a 2 (6 testes t separados)
- perda de tempo
- erro tipo I de 30% (5% de erro em 6 análises)
Então, vamos usar o teste ANOVA (comparação de pares):
Ulisses Doria Filho. Introdução a Bioestatística para simples mortais. Rio de Janeiro: Elsevier; 2003. p. 114-20
O uso do ANOVA indicará a
probabilidade de se rejeitar H0... Se, ao
final H0 for rejeitada deve-se proceder
para a comparação 2 a 2
Em uma tabela de dados com determinado número de repetições (indivíduos, p.ex.) e de tratamentos (grupos de estudo, p.ex.), espera-se que a variação entre os grupos seja superior àquela inerente ao modelo (resíduo) dentro de determinados limites.
Princípio básico do Teste ANOVA:
Retirado da aula do Prof. Dr. Angelo Roncalli (UFRN), 2008
A Análise de Variância - ANOVA
A Análise de Variância - ANOVA
Grupo A Grupo B Grupo C Variância
1
2
3
4
5
Variância
Comparação entre as médias de grupos estudados.
Retirado da aula do Prof. Dr. Angelo Roncalli (UFRN), 2008
Grupo A Grupo B Grupo C Variância
1
2
3
4
5
Variância
Comparação entre as médias de grupos estudados.
A Análise de Variância - ANOVA
Retirado da aula do Prof. Dr. Angelo Roncalli (UFRN), 2008
Grupo A Grupo B Grupo C Variância
1
2
3
4
5
Variância Entre os Grupos
Comparação entre as médias de grupos estudados.
A Análise de Variância - ANOVA
Retirado da aula do Prof. Dr. Angelo Roncalli (UFRN), 2008
Grupo A Grupo B Grupo C Variância
1
2
3
4
5
Variância Entre os Grupos
No Modelo (Resíduo)
Comparação entre as médias de grupos estudados.
A Análise de Variância - ANOVA
Retirado da aula do Prof. Dr. Angelo Roncalli (UFRN), 2008
A Análise de Variância - ANOVA
Para se determinar essa variação dos dados, procede-se com o teste F
F =
O teste ANOVA nos informa somente se há diferença entre os grupos. Para saber onde residem as diferenças, usa-se o Pós-Teste de Tukey
O Pós-Teste de Tukey-Kramer
A Análise de Variância - ANOVA
Retirado da aula do Prof. Dr. Angelo Roncalli (UFRN), 2008
EXEMPLO
Foi efetuada uma investigação em três grupos de estudantes: o grupo A estava constituído por seis (6) alunos não-fumantes (NF); o segundo, por seis (6) discentes que fumavam moderadamente em torno de dez (10) a quinze (15) cigarros por dia (FM); e o terceiro, por cinco (5) estudantes que fumavam mais de 40 cigarros por dia (FI). Mediu-se a função pulmonar através do fluxo médio expiratório.
H0: o fumo não influencia a função pulmonar medida pelo fluxo médio expiratório:H1: o fumo influencia a função pulmonar medida pelo fluxo médio expiratório, havendo diferença, pelo menos, entre duas médias.Nível de decisão: alfa = 0.01.
BIOHELP.pdf, 2007
Na prática…Vamos supor que eu quero fazer um estudo e definir o valor de cor (∆E) em dentes de boi em duas situações; imediatamente após, 6 meses depois e um ano depois de aplicar algum produto clareador que eu inventei... (estudo fictício)
Na prática…
Observar o que temos:1- Quantas amostras?2- São relacionadas ou independentes?3- Eu tenho todos os dados?
Na prática…
Na prática…
Na prática…
O uso do ANOVA indicará a
probabilidade de se rejeitar H0... Se, ao
final H0 for rejeitada deve-se proceder
para a comparação 2 a 2
E SE DESSE DIFERENÇA?
Na prática…
Na prática…
No BIOESTAT 5.0 é possível ainda verificar a interferência de mais de uma variável...
Em uma escola do ensino médio efetuou-se levantamento sobre o número de alunos reprovados nas disciplinas Ciências, Matemática e Português (tratamentos), ao mesmo tempo em que se procurou verificar a proporção dos inabilitados nessasmatérias nos turnos da Manhã (linha 1), da Tarde (linha 2) e da Noite (linha 3).
Em cada turno estavam matriculados 800 discentes, de onde foram retiradas as amostras.H0: o tipo de disciplina cursada não afeta os índices de reprovação;H1: pelo menos duas médias são diferentes;H0: o turno cursado pelo estudante não afeta os índices de reprovação;H1: pelo menos duas médias são diferentes;Nível de decisão: alfa = 0.05.
EXEMPLO
Na prática…
Na prática…
Na prática…
Manhã, tarde e noite
Ciências, Matemática, Português
Manhã, tarde e noite
Na prática…
Ciências, Matemática, Português
Então, ‘bora’ estudar...
1- Baixem o arquivo “Aula 9 – Teste t de Student e ANOVA.xlsx” que é um banco de dados tabulado no Microsoft Excel.2- Observem que estes dados são fictícios e o suposto estudo também é...3- Faça a estatística das planilhas ‘Exercício 1’, ‘Exercício 2’ e ‘Exercício 3’...4- Para cada passo, proceda com o “print screen” da sua tela de computador...5- O exercício pode ser feito em dupla, mas a entrega é individual6- Você pode usar qualquer software estatístico que desejar
Então, ‘bora’ estudar...
1- Baixem o arquivo “Aula 9 – Teste t de Student e ANOVA.xlsx” que é um banco de dados tabulado no Microsoft Excel.2- Observem que estes dados são fictícios e o suposto estudo também é...3- Faça a estatística das planilhas ‘Exercício 1’, ‘Exercício 2’ e ‘Exercício 3’...4- Para cada passo, proceda com o “print screen” da sua tela de computador...5- O exercício pode ser em dupla6- Você pode usar qualquer software estatístico que desejar
FIM!
Qualquer dúvida, entrem em contato!
Profª Ana Daniela Silveira: [email protected]
https://www.facebook.com/professora.anadaniela.3
Profª Maria Amélia: [email protected]
CONTATOS: