moq-13 probabilidade e estatÍstica - mec.ita.brrodrigo/disciplinas/moq13/s11.pdf ·...

Professor: Rodrigo A. Scarpel

rodrigo@ita.br

www.mec.ita.br/~rodrigo

MOQ-13 PROBABILIDADE E ESTATÍSTICA

ProgramaPrograma do do cursocurso::

Regressão linear simples e correlação.Aplicações de modelos de regressão linear.15 e 16

Prova14

Feriado (4/6)13

Testes não-paramétricos (associação, independência e de aderência).12

Testes de Hipóteses. Inferência baseada em 2 amostras (entre parâmetros de populações distintas).11

Propriedades dos estimadores. Intervalos de confiança(estimação por intervalo). Tamanho da amostra.10

Amostras aleatórias. Distribuições amostrais. Teoremado limite central. Variáveis aleatórias Qui-quadrado e t-Student.9

Princípios de estatística. Estimadores e estimativas. Estimação pontual de parâmetros (Métodos dos momentos e da máximaverossimilhança). Estatística Descritiva.

Prova7

Variáveis aleatórias conjuntas, função distribuição conjunta e marginal. Independência estatística. Covariância e Coeficientede Correlação.6

Feriado (2/4)5

Principais distribuições de probabilidade contínuas (Exponencial negativa e Normal).4

Valor esperado e variância. Momentos de uma variável aleatória. Função geradora de momentos. Principais distribuições de probabilidade discretas (Bernoulli, Binomial e Poisson).3

Teorema da probabilidade total e teorema de Bayes. Variáveis aleatórias. Distribuições de probabilidade. Funções massa, densidade, e distribuição acumulada. Funções de variáveis aleatórias.2

Introdução à probabilidade (eventos, espaço amostral, axiomas, propriedades, probabilidade condicional e independência).1

ConteúdoSemanas

Professor: Rodrigo A. Scarpel

rodrigo@ita.br

www.mec.ita.br/~rodrigo

TESTE DE HIPÓTESES

O processo de inferência:

AMOSTRA

POPULAÇÃO

HIPÓTESES

ESTIMAÇÃO DOS PARÂMETROS

TESTAR ADERÊNCIA

FAZER INFERÊNCIAS EM RELAÇÃO A POPULAÇÃO

�Hipóteses: - iid ⇒⇒⇒⇒ Amostra aleatória

- Distribuições populacional e amostral (TLC)

- Parâmetros conhecidos ou não (σσσσ)

Teste de Hipóteses: Princípios

• O teste de hipóteses é utilizado quando objetiva-se decidir qual de

duas alegações contraditórias, sobre o valor de um parâmetro, está

correta.

• Hipótese estatística (hipótese) é uma afirmação sobre os valores de

parâmetros ou sobre a forma de uma distribuição de probabilidade.

• Em um teste de hipóteses há sempre 2 hipóteses contraditórias sendo

consideradas.

• Ex: Tempo médio de atendimento = 300h ou ≠≠≠≠ 300h

Fatia de mercado ≥≥≥≥ 15% ou <<<< 15%.

OBJETIVO: DEFINIR, A PARTIR DAS INFORMAÇÕES

AMOSTRAIS, QUAL DAS DUAS ESTÁ CORRETA.

• Def: Hipótese nula (H0) é a afirmação assumida

inicialmente como verdadeira e Hipótese alternativa (HA) é

a afirmação que contradiz H0.

• Como H0 é considerada verdadeira, se não houver alguma

evidência forte na amostra que a contradiga, as duas

conclusões possíveis são: Rejeitar H0 ou Não Rejeitar H0.

• Em síntese: utilizaremos dados amostrais para decidir se H0

deve ou não ser rejeitada.

Teste de Hipóteses: Princípios

i. Definir as hipóteses:

ii. Cálculo da estatística do teste;

iii. Verificar as regiões de rejeição (valores para os quais Ho será

rejeitada);

iv. Tomar a decisão (rejeitar ou não H0).

Assim, a hipótese nula será rejeitada se, e somente se, o valor da

estatística do teste cair na região de rejeição.

H0 : θθθθ = θθθθ0

HA : θθθθ ≠≠≠≠ θθθθ0

H0 : θθθθ ≥≥≥≥ θθθθ0

HA : θθθθ <<<< θθθθ0

H0 : θθθθ ≤≤≤≤ θθθθ0

HA : θθθθ >>>> θθθθ0

• Se θθθθ representar o parâmetro de interesse:

Teste de Hipóteses: Procedimento

� Os conceitos básicos do teste de hipóteses são introduzidos mais

facilmente enfocando primeiro uma situação simples (CASO A):

� O parâmetro de interesse é a média populacional (µµµµ)

� A distribuição da população é normal

� O valor do desvio-padrão (σσσσ) é conhecido.

� Seja x1, x2, …, xn uma amostra aleatória de uma distribuição normal com E[x] = µµµµ e

Var[X] = σσσσ2. Neste caso, independentemente do tamanho da amostra (n):

,~σµ

22 σσ

Teste de Hipóteses: Média

( )1,0~/

σµ−

/σµ−=

2,5751%1,965%

1,64510%

Zαααα/2SIGNIFICÂNCIA

2,3281,645

Zαααα

Teste de Hipóteses: CASO A

• Exemplo: Um fabricante de lâmpadas afirma que o tempo médio de vida

de seu produto é normalmente distribuído com média de 800h e desvio-

padrão de 40h. Uma amostra de n=30 lâmpadas foram testadas obtendo-

se um tempo médio de vida de 788h. Esses dados contradizem a

afirmação do fabricante (significância de 1%)?

• Passos: 1. Definir Ho e H1

2. Fixar αααα

3. Determinar as regiões de rejeição

4. Calcular a estatística do teste

5. Conclusão

Teste de Hipóteses: CASO A

�Teorema do Limite Central: Seja x1, x2, …, xn uma amostra aleatória de

uma distribuição qualquer com média µµµµ e com variância σσσσ2. Se n é

suficientemente grande, então:

,~σµ&

22 σσ

= ( )2,~ σµ nnNTo &

Obs: qto. maior for o valor de n, melhor será a aproximação (n>30)

CASO B : Se σσσσ2 não é conhecido e n é grande

CASO C: Se σσσσ2 não é conhecido e n é pequeno

(distribuição normal)

Teste de Hipóteses: Média

µ−=

2,5751%1,965%

1,64510%

2,3281,645

Zαααα

2,5751%1,965%

1,64510%

2,3281,645

Zαααα

Teste de Hipóteses: CASO B

• Exemplo: um fabricante de pneus afirma que o tempo médio de vida de

seu produto é de 40.000 km. Uma amostra de n=64 pneus foram testados

obtendo-se um tempo médio de vida de 38.000 km com desvio-padrão de

16.000 km. Esses dados contradizem a afirmação do fabricante

(significância de 1%)?

2. Fixar αααα

5. Conclusão

Teste de Hipóteses: CASO B

• Quando n é pequeno e a distribuição é Normal:

,~ µns

µ−= ,se distribui conforme uma t com k = n-1 g.l.

Teste de Hipóteses: CASO C

• Exemplo: um fabricante de sprinklers afirma que a

temperatura média de ativação de seu produto é de 130o F.

Uma amostra de n=9 produtos foram testados obtendo-se

uma temperatura média de ativação de 131,08o F com desvio-

padrão de 1,5o F. Esses dados contradizem a afirmação do

fabricante (significância de 5%)?

Teste de Hipóteses: CASO C

Distribuição da diferença entre médias:

� Sejam A e B duas populações:

i. normais com parâmetros conhecidos: CASO A

ii. quaisquer com parâmetros conhecidos ou não (n grande) : CASO B

iii. normais com parâmetros não conhecidos e n pequeno: CASO C

( ),,~ 2AAAA nNx σµ ( )BBBB nNx 2,~ σµ

+−−

ABABA nn

,~σσµµ⇒⇒⇒⇒

( ),,~ 2AAAA nNx σµ& ( )BBBB nNx 2,~ σµ&

+−−

ABABA nn

,~σσµµ&⇒⇒⇒⇒

( ) 1~ −−BnBBBB tnsx µ

⇒⇒⇒⇒

( ) ,~ 1−−AnAAAA tnsx µ

( ) ( )( ) ( ) 2

~ −++−−−BA nn

ABABA t

sxx µµ

Intervalo de confiança: Diferença entre médias

CASO A: CASO B (OPÇÃO 1):

CASO B (OPÇÃO 2): CASO C:

( ) ( )Z

BABA ~22

−−− µµ

( ) ( )Z

BABA ~22

−−−( ) ( )Z

BABA ~22 σσ

−−−

( ) ( )2

22~ −+

−−−BA nn

BABA t

xx µµ

NOVO: x = (60 * 5 + 180 * 4 + 100 * 3 + 52 * 2 + 8 * 1) / 400 = 3,58

s2 = (60 * (5-3,58)2 + 180 * (4-3,58)2 + ... + 86 * (1-3,58)2) / 399 =0,86

241317

Controle Novo

Com certeza voucomprar (5)

Provavelmente voucomprar

Não sei se vou comprar

Provavelmente não voucomprar

Com certeza não voucomprar (1)

Intenção de Compra

Amostra Total: 400

PadrãoPadrão de de AAççãoãoMMéédiadia Novo > Novo > ControleControle (95%)(95%)

Teste de produto:

40099,0

40086,0

25,358,3 =+

como z > zcrítico a intenção de compra do novo produto é maior (95%)

CONTROLE: x = (44 * 5 + 112 * 4 + 160 * 3 + 68 * 2 + 16 * 1) / 400 = 3,25

s2 = (44 * (5-3,25)2 + 112 * (4-3,25)2 + ... + 16 * (1-3,25)2) / 399 =0,99

• Se X~Bin(n,p) em que n é relativamente grande (n≥≥≥≥30) e n.p.(1-p)>5

pode ser aproximada à uma Normal com µµµµ = n.p e σσσσ2 =n.p.(1-p), ou seja,

)1,0(~)1.(.

−−

)1(,~ ^

Teste de Hipóteses: Proporção

• Exemplo: Uma pesquisa de mercado com 90 consumidores mostrou que

o market-share de uma empresa é de 45%. É possível afirmar que ela é

líder de mercado (significância de 1%)?

2. Fixar αααα

5. Conclusão

Teste de Hipóteses: Proporção

� Seja x1, x2, …, xn uma amostra aleatória de uma distribuição normal com E[x] = µµµµ e

Var[X] = σσσσ2. Para testar se σσσσ2 = σσσσ20 faz-se:

σχ sn −=� Estatística do teste:

� Hipóteses e regiões de rejeição:

Teste de Hipóteses: Variância

• Exemplo: Um fabricante de baterias afirma que a vida útil delas tem

distribuição aproximadamente normal com desvio-padrão de 0,9 ano. Se

uma amostra aleatória de 10 dessas baterias tem desvio-padrão de 1,25

anos, você acha que σσσσ > 0,9? (significância de 5%)?

2. Fixar αααα

5. Conclusão

Teste de Hipóteses: Variância

• Def: Um erro tipo I consiste em rejeitar Ho quando ela é

verdadeira e P(erro tipo I) = αααα

• Def: Um erro tipo II consiste em não rejeitar Ho quando ela

é falsa e P(erro tipo II) = ββββ

Proposição: Suponha que um experimento e o tamanho da amostra

sejam fixos. Então, reduzir o tamanho da região de rejeição para

obter um valor menor de αααα resulta em um valor maior de ββββ.

Portanto, não há como tornar, simultâneamente, αααα e ββββ menores.

Erros em testes de hipóteses

OKTipo I)P(Erro

Tipo II)P(ErroOK

α = nível de significância

1 − α β

1 − β = poder do teste

H0 Verdadeira H

0 Falsa

Rejeito H0

Não Rejeito H0

Teste de Hipóteses: Erros Tipo I e II

OKTipo I)P(Erro

Tipo II)P(ErroOK

1 − α β

1 − β

Réu inocente Réu culpado

Absolver o réu

Condenar o réu

H0: Réu é inocenteHa: Réu é culpado O réu pode ser:

O juiz pode:

Teste de Hipóteses: Erros tipo I e II

Gerenciamento dos erros tipo I e II

Erro Tipo I:

↓↓↓↓ αααα ⇒⇒⇒⇒ ↓↓↓↓ Erro Tipo I

↑↑↑↑ n ⇒⇒⇒⇒ ↓↓↓↓ Erro Tipo I

Erro Tipo II:

↑↑↑↑ αααα ⇒⇒⇒⇒ ↓↓↓↓ Erro Tipo II

↑↑↑↑ n ⇒⇒⇒⇒ ↓↓↓↓ Erro Tipo II

Escolha do nível de significância:

� Vou substituir um componente de meu produto por outro mais caro se isto o tornar melhor na percepção do consumidor.

� Consequências do Erro Tipo I: Perda do investimento, perda de margem ou de share

� Consequências do Erro Tipo II: perda da oportunidade de ganho competitivo

� Vou substituir um componente de meu produto por outro mais barato se isto não o tornar pior na percepção do consumidor.

� Consequências do Erro Tipo I: perda da oportunidade de aumentar a margem ou ganhar share.

� Consequências do Erro Tipo II: perda de share, de imagem, etc

Para casa:

• Lista de Exercícios 9 (site: www.mec.ita.br/~rodrigo/)

• Leitura: Devore – cap. 8: Testes de hipóteses …

cap. 9: Inferências baseadas em duas amostras

Walpole et al. – cap.10 : Testes de hipóteses .

moq-13 probabilidade e estatÍstica - mec.ita.brrodrigo/disciplinas/moq13/s11.pdf ·...

Documents

standardkatalog 2017 - parco-pack · und haken 1'000 2,5 ml...

distribuiçoes amostrais e estimacao de parâmetros

(anredera scandens (l.) moq.) etanol 70% daun binahong

memo designacion moq

moq ueg a p no - portal.mtc.gob.pe

evolução da qualidade da declaração da idade na américa...

distribui˘c~oes amostrais - cefet/rj

pesquisa de satisfação com segurados...erros não...

norma abnt nbr brasileira - ipen.br · subconjunto de uma...

spring | printemps 2014 - arlis moq

distribuições amostrais e estimação pontual de...

probabilidade definição de probabilidade principais...

moq biodiversidad

doc. moq.12

pada tikus jantan galur wistar (anredera scandens (l.) moq.)

moq-14 projeto e anÁlise de experimentos -...

modelos multiníveis em pesquisas amostrais complexas –...

livro analise de dados amostrais complexos

curso ibge - introdução a analise de dados amostrais...

aula 3 - espaços amostrais; eventos e técnicas de contagem