moq-13 probabilidade e estatÍstica - mec.ita.brrodrigo/disciplinas/moq13/s11.pdf ·...
Post on 10-Dec-2018
236 Views
Preview:
TRANSCRIPT
Professor: Rodrigo A. Scarpel
rodrigo@ita.br
www.mec.ita.br/~rodrigo
MOQ-13 PROBABILIDADE E ESTATÍSTICA
ProgramaPrograma do do cursocurso::
Regressão linear simples e correlação.Aplicações de modelos de regressão linear.15 e 16
Prova14
Feriado (4/6)13
Testes não-paramétricos (associação, independência e de aderência).12
Testes de Hipóteses. Inferência baseada em 2 amostras (entre parâmetros de populações distintas).11
Propriedades dos estimadores. Intervalos de confiança(estimação por intervalo). Tamanho da amostra.10
Amostras aleatórias. Distribuições amostrais. Teoremado limite central. Variáveis aleatórias Qui-quadrado e t-Student.9
Princípios de estatística. Estimadores e estimativas. Estimação pontual de parâmetros (Métodos dos momentos e da máximaverossimilhança). Estatística Descritiva.
8
Prova7
Variáveis aleatórias conjuntas, função distribuição conjunta e marginal. Independência estatística. Covariância e Coeficientede Correlação.6
Feriado (2/4)5
Principais distribuições de probabilidade contínuas (Exponencial negativa e Normal).4
Valor esperado e variância. Momentos de uma variável aleatória. Função geradora de momentos. Principais distribuições de probabilidade discretas (Bernoulli, Binomial e Poisson).3
Teorema da probabilidade total e teorema de Bayes. Variáveis aleatórias. Distribuições de probabilidade. Funções massa, densidade, e distribuição acumulada. Funções de variáveis aleatórias.2
Introdução à probabilidade (eventos, espaço amostral, axiomas, propriedades, probabilidade condicional e independência).1
ConteúdoSemanas
Professor: Rodrigo A. Scarpel
rodrigo@ita.br
www.mec.ita.br/~rodrigo
TESTE DE HIPÓTESES
O processo de inferência:
AMOSTRA
POPULAÇÃO
HIPÓTESES
ESTIMAÇÃO DOS PARÂMETROS
TESTAR ADERÊNCIA
FAZER INFERÊNCIAS EM RELAÇÃO A POPULAÇÃO
�Hipóteses: - iid ⇒⇒⇒⇒ Amostra aleatória
- Distribuições populacional e amostral (TLC)
- Parâmetros conhecidos ou não (σσσσ)
Teste de Hipóteses: Princípios
• O teste de hipóteses é utilizado quando objetiva-se decidir qual de
duas alegações contraditórias, sobre o valor de um parâmetro, está
correta.
• Hipótese estatística (hipótese) é uma afirmação sobre os valores de
parâmetros ou sobre a forma de uma distribuição de probabilidade.
• Em um teste de hipóteses há sempre 2 hipóteses contraditórias sendo
consideradas.
• Ex: Tempo médio de atendimento = 300h ou ≠≠≠≠ 300h
Fatia de mercado ≥≥≥≥ 15% ou <<<< 15%.
OBJETIVO: DEFINIR, A PARTIR DAS INFORMAÇÕES
AMOSTRAIS, QUAL DAS DUAS ESTÁ CORRETA.
• Def: Hipótese nula (H0) é a afirmação assumida
inicialmente como verdadeira e Hipótese alternativa (HA) é
a afirmação que contradiz H0.
• Como H0 é considerada verdadeira, se não houver alguma
evidência forte na amostra que a contradiga, as duas
conclusões possíveis são: Rejeitar H0 ou Não Rejeitar H0.
• Em síntese: utilizaremos dados amostrais para decidir se H0
deve ou não ser rejeitada.
Teste de Hipóteses: Princípios
i. Definir as hipóteses:
ii. Cálculo da estatística do teste;
iii. Verificar as regiões de rejeição (valores para os quais Ho será
rejeitada);
iv. Tomar a decisão (rejeitar ou não H0).
Assim, a hipótese nula será rejeitada se, e somente se, o valor da
estatística do teste cair na região de rejeição.
H0 : θθθθ = θθθθ0
HA : θθθθ ≠≠≠≠ θθθθ0
H0 : θθθθ ≥≥≥≥ θθθθ0
HA : θθθθ <<<< θθθθ0
H0 : θθθθ ≤≤≤≤ θθθθ0
HA : θθθθ >>>> θθθθ0
ou ou
• Se θθθθ representar o parâmetro de interesse:
Teste de Hipóteses: Procedimento
� Os conceitos básicos do teste de hipóteses são introduzidos mais
facilmente enfocando primeiro uma situação simples (CASO A):
� O parâmetro de interesse é a média populacional (µµµµ)
� A distribuição da população é normal
� O valor do desvio-padrão (σσσσ) é conhecido.
� Seja x1, x2, …, xn uma amostra aleatória de uma distribuição normal com E[x] = µµµµ e
Var[X] = σσσσ2. Neste caso, independentemente do tamanho da amostra (n):
nNx
2
,~σµ
nx
x
22 σσ
µµ
=
=
Teste de Hipóteses: Média
( )1,0~/
Zn
x
σµ−
n
xZ
/σµ−=
2,5751%1,965%
1,64510%
Zαααα/2SIGNIFICÂNCIA
2,3281,645
1,285
Zαααα
ou ou
Teste de Hipóteses: CASO A
• Exemplo: Um fabricante de lâmpadas afirma que o tempo médio de vida
de seu produto é normalmente distribuído com média de 800h e desvio-
padrão de 40h. Uma amostra de n=30 lâmpadas foram testadas obtendo-
se um tempo médio de vida de 788h. Esses dados contradizem a
afirmação do fabricante (significância de 1%)?
• Passos: 1. Definir Ho e H1
2. Fixar αααα
3. Determinar as regiões de rejeição
4. Calcular a estatística do teste
5. Conclusão
Teste de Hipóteses: CASO A
�Teorema do Limite Central: Seja x1, x2, …, xn uma amostra aleatória de
uma distribuição qualquer com média µµµµ e com variância σσσσ2. Se n é
suficientemente grande, então:
nNx
2
,~σµ&
nx
x
22 σσ
µµ
=
= ( )2,~ σµ nnNTo &
Obs: qto. maior for o valor de n, melhor será a aproximação (n>30)
CASO B : Se σσσσ2 não é conhecido e n é grande
CASO C: Se σσσσ2 não é conhecido e n é pequeno
(distribuição normal)
Teste de Hipóteses: Média
Zns
x~
/
µ−
ns
xZ
/
µ−=
2,5751%1,965%
1,64510%
Zαααα/2SIGNIFICÂNCIA
2,3281,645
1,285
Zαααα
2,5751%1,965%
1,64510%
Zαααα/2SIGNIFICÂNCIA
2,3281,645
1,285
Zαααα
ou ou
Teste de Hipóteses: CASO B
• Exemplo: um fabricante de pneus afirma que o tempo médio de vida de
seu produto é de 40.000 km. Uma amostra de n=64 pneus foram testados
obtendo-se um tempo médio de vida de 38.000 km com desvio-padrão de
16.000 km. Esses dados contradizem a afirmação do fabricante
(significância de 1%)?
• Passos: 1. Definir Ho e H1
2. Fixar αααα
3. Determinar as regiões de rejeição
4. Calcular a estatística do teste
5. Conclusão
Teste de Hipóteses: CASO B
• Quando n é pequeno e a distribuição é Normal:
n
stx
2
,~ µns
xT
/
µ−= ,se distribui conforme uma t com k = n-1 g.l.
Teste de Hipóteses: CASO C
Teste de Hipóteses: CASO C
• Exemplo: um fabricante de sprinklers afirma que a
temperatura média de ativação de seu produto é de 130o F.
Uma amostra de n=9 produtos foram testados obtendo-se
uma temperatura média de ativação de 131,08o F com desvio-
padrão de 1,5o F. Esses dados contradizem a afirmação do
fabricante (significância de 5%)?
Teste de Hipóteses: CASO C
Distribuição da diferença entre médias:
� Sejam A e B duas populações:
i. normais com parâmetros conhecidos: CASO A
ii. quaisquer com parâmetros conhecidos ou não (n grande) : CASO B
iii. normais com parâmetros não conhecidos e n pequeno: CASO C
( ),,~ 2AAAA nNx σµ ( )BBBB nNx 2,~ σµ
+−−
B
B
A
ABABA nn
Nxx22
,~σσµµ⇒⇒⇒⇒
( ),,~ 2AAAA nNx σµ& ( )BBBB nNx 2,~ σµ&
+−−
B
B
A
ABABA nn
Nxx22
,~σσµµ&⇒⇒⇒⇒
( ) 1~ −−BnBBBB tnsx µ
⇒⇒⇒⇒
( ) ,~ 1−−AnAAAA tnsx µ
( ) ( )( ) ( ) 2
22
~ −++−−−BA nn
B
B
A
ABABA t
n
s
n
sxx µµ
Intervalo de confiança: Diferença entre médias
CASO A: CASO B (OPÇÃO 1):
CASO B (OPÇÃO 2): CASO C:
( ) ( )Z
n
s
n
s
xx
B
B
A
A
BABA ~22
&
+
−−− µµ
( ) ( )Z
nn
xx
B
B
A
A
BABA ~22
&
σσ
µµ
+
−−−( ) ( )Z
nn
xx
B
B
A
A
BABA ~22 σσ
µµ
+
−−−
( ) ( )2
22~ −+
+
−−−BA nn
B
B
A
A
BABA t
n
s
n
s
xx µµ
NOVO: x = (60 * 5 + 180 * 4 + 100 * 3 + 52 * 2 + 8 * 1) / 400 = 3,58
s2 = (60 * (5-3,58)2 + 180 * (4-3,58)2 + ... + 86 * (1-3,58)2) / 399 =0,86
28
11 15
241317
25
40
45
0
20
40
60
80
100
Controle Novo
Com certeza voucomprar (5)
Provavelmente voucomprar
Não sei se vou comprar
Provavelmente não voucomprar
Com certeza não voucomprar (1)
Intenção de Compra
Amostra Total: 400
PadrãoPadrão de de AAççãoãoMMéédiadia Novo > Novo > ControleControle (95%)(95%)
Teste de produto:
85,4
40099,0
40086,0
25,358,3 =+
−=z
como z > zcrítico a intenção de compra do novo produto é maior (95%)
CONTROLE: x = (44 * 5 + 112 * 4 + 160 * 3 + 68 * 2 + 16 * 1) / 400 = 3,25
s2 = (44 * (5-3,25)2 + 112 * (4-3,25)2 + ... + 16 * (1-3,25)2) / 399 =0,99
• Se X~Bin(n,p) em que n é relativamente grande (n≥≥≥≥30) e n.p.(1-p)>5
pode ser aproximada à uma Normal com µµµµ = n.p e σσσσ2 =n.p.(1-p), ou seja,
)1,0(~)1.(.
.N
ppn
pnx
−−
−n
pppNp
)1(,~ ^
^
ou ou
Teste de Hipóteses: Proporção
• Exemplo: Uma pesquisa de mercado com 90 consumidores mostrou que
o market-share de uma empresa é de 45%. É possível afirmar que ela é
líder de mercado (significância de 1%)?
• Passos: 1. Definir Ho e H1
2. Fixar αααα
3. Determinar as regiões de rejeição
4. Calcular a estatística do teste
5. Conclusão
Teste de Hipóteses: Proporção
ou ou
� Seja x1, x2, …, xn uma amostra aleatória de uma distribuição normal com E[x] = µµµµ e
Var[X] = σσσσ2. Para testar se σσσσ2 = σσσσ20 faz-se:
( )20
220
1
σχ sn −=� Estatística do teste:
� Hipóteses e regiões de rejeição:
Teste de Hipóteses: Variância
• Exemplo: Um fabricante de baterias afirma que a vida útil delas tem
distribuição aproximadamente normal com desvio-padrão de 0,9 ano. Se
uma amostra aleatória de 10 dessas baterias tem desvio-padrão de 1,25
anos, você acha que σσσσ > 0,9? (significância de 5%)?
• Passos: 1. Definir Ho e H1
2. Fixar αααα
3. Determinar as regiões de rejeição
4. Calcular a estatística do teste
5. Conclusão
Teste de Hipóteses: Variância
• Def: Um erro tipo I consiste em rejeitar Ho quando ela é
verdadeira e P(erro tipo I) = αααα
• Def: Um erro tipo II consiste em não rejeitar Ho quando ela
é falsa e P(erro tipo II) = ββββ
Proposição: Suponha que um experimento e o tamanho da amostra
sejam fixos. Então, reduzir o tamanho da região de rejeição para
obter um valor menor de αααα resulta em um valor maior de ββββ.
Portanto, não há como tornar, simultâneamente, αααα e ββββ menores.
Erros em testes de hipóteses
OKTipo I)P(Erro
Tipo II)P(ErroOK
α = nível de significância
1 − α β
1 − β = poder do teste
H0 Verdadeira H
0 Falsa
Rejeito H0
Não Rejeito H0
Teste de Hipóteses: Erros Tipo I e II
OKTipo I)P(Erro
Tipo II)P(ErroOK
α
1 − α β
1 − β
Réu inocente Réu culpado
Absolver o réu
Condenar o réu
H0: Réu é inocenteHa: Réu é culpado O réu pode ser:
O juiz pode:
Teste de Hipóteses: Erros tipo I e II
Gerenciamento dos erros tipo I e II
Erro Tipo I:
↓↓↓↓ αααα ⇒⇒⇒⇒ ↓↓↓↓ Erro Tipo I
↑↑↑↑ n ⇒⇒⇒⇒ ↓↓↓↓ Erro Tipo I
Erro Tipo II:
↑↑↑↑ αααα ⇒⇒⇒⇒ ↓↓↓↓ Erro Tipo II
↑↑↑↑ n ⇒⇒⇒⇒ ↓↓↓↓ Erro Tipo II
Escolha do nível de significância:
� Vou substituir um componente de meu produto por outro mais caro se isto o tornar melhor na percepção do consumidor.
� Consequências do Erro Tipo I: Perda do investimento, perda de margem ou de share
� Consequências do Erro Tipo II: perda da oportunidade de ganho competitivo
� Vou substituir um componente de meu produto por outro mais barato se isto não o tornar pior na percepção do consumidor.
� Consequências do Erro Tipo I: perda da oportunidade de aumentar a margem ou ganhar share.
� Consequências do Erro Tipo II: perda de share, de imagem, etc
Para casa:
• Lista de Exercícios 9 (site: www.mec.ita.br/~rodrigo/)
• Leitura: Devore – cap. 8: Testes de hipóteses …
cap. 9: Inferências baseadas em duas amostras
Walpole et al. – cap.10 : Testes de hipóteses .
top related