estimação de parâmetros aula 05 prof. christopher freire souza centro de tecnologia universidade...
TRANSCRIPT
Estimação de parâmetrosAula 05
Prof. Christopher Freire SouzaCentro de TecnologiaUniversidade Federal de Alagoaswww.ctec.ufal.br/professor/cfs
Objetivos
•Desenvolver habilidades para estimar valores de parâmetros
•Promover o entendimento do que são intervalos de confiança
•Desenvolver habilidades para estimar tamanhos amostrais
2
Christopher Souza: Estimação de
parâmetros
Relevância do conteúdo• Estimação de
parâmetros serve a dois propósitos:▫ Comparar populações▫ Ajustar modelos de
distribuição de probabilidades a dados amostrais no intuito de permitir interpolações e extrapolações sobre freqüências de ocorrência de valores.
Christopher Souza: Estimação de
parâmetros
3
Conteúdo
•Características dos estimadores•Estimação Pontual•Intervalos de confiança•Margem de Erro•Tamanhos amostrais
4
Christopher Souza: Estimação de
parâmetros
Características dos estimadores• Consistência –
• Ausência de viés –
• Eficiência –
Christopher Souza: Estimação de
parâmetros
5
Estimadores pontuais
•Método gráfico•Método dos momentos•Método dos mínimos quadrados•Método da máxima verossimilhança
Christopher Souza: Estimação de
parâmetros
6
Método gráfico• Papéis de probabilidade e posição de plotagem definida via
estimativa empírica de probabilidade
Christopher Souza: Estimação de
parâmetros
7
0,50
Método gráfico• Ajuste de reta aos dados
dispostos segundo fórmula de posição de plotagem (qi é a probabilidade empírica)
Christopher Souza: Estimação de
parâmetros
8
0,50
Método gráfico• Estimativa de parâmetros
a partir da relação entre equação da reta e variáveis dispostas nos eixos▫ Grigorten:
qi=(i-0,44)/(n+0,12)
▫ Gumbel:▫ Inversa:
Christopher Souza: Estimação de
parâmetros
9
Método gráfico• Grau de linearidade dos
dados dispostos no gráfico serve à avaliação do ajuste ao modelo de distribuição para o qual foi elaborado o papel de probabilidade
• Quantidade de dados pode levar as posições de plotagem de probabilidades a valores que mais aproximem dados à reta▫ Grigorten:
qi=(i-0,44)/(n+0,12)
Christopher Souza: Estimação de
parâmetros
10
Método dos Momentos• Aproxima-se a estimativa de parâmetros
populacionais por meio de estimativas de momentos amostrais.
• Os “m” coeficientes de um modelo de distribuição de probabilidades podem ser aproximados pelas equações dos “m” primeiros momentos amostrais.
Christopher Souza: Estimação de
parâmetros
11
Método dos MomentosAmostra Médi
aMediana
Amp. Var. std Prop. Ímpar
Prob.
1,1 1,0 1,0 0 0,0 0,0 1 1/9
1,2 1,5 1,5 1 0,5 0,707
0,5 1/9
1,5 3,0 3,0 4 8,0 2,828
1 1/9
2,1 1,5 1,5 1 0,5 0,707
0,5 1/9
2,2 2,0 2,0 0 0,0 0,0 0 1/9
2,5 3,5 3,5 3 4,5 2,121
0,5 1/9
5,1 3,0 3,0 4 8,0 2,828
1 1/9
5,2 3,5 3,5 3 4,5 2,121
0,5 1/9
5,5 5,0 5,0 0 0,0 0,0 1 1/9Média amostral 8/3 8/3 16/9 26/9 1,3 2/3Média populacional
8/3 2 4 26/9 1,7 2/3
Sem Viés Sim Não Não Sim Não Sim
Christopher Souza: Estimação de
parâmetros
12
Método dos Mínimos Quadrados• Estimação dos coeficientes de um modelo de
distribuição, e.g., ŷi=a+b.xi, para minimizar os quadrados das diferenças (ei) entre valores de frequências amostrais (yi) e estimadas por meio de funções densidade de probabilidades (ŷi).
• Estimativa de coeficientes a partir de valores de mínimas diferenças a partir de:
Christopher Souza: Estimação de
parâmetros
13
Método da Máxima Verossimilhança• Função de verossimilhança definida como a
probabilidade conjunta de obter coincidentemente/concomitantemente a melhor aproximação da função para a definição do coeficiente
• O valor do coeficiente que resulta nas melhores estimativas é obtido para um valor de máximo da função de verossimilhança, sendo estimado a partir do seu valor para quando a derivada é nula.
• É frequente o emprego do logaritmo
Christopher Souza: Estimação de
parâmetros
14
Método da Máxima Verossimilhança• A solução de funções de máxima verossimilhança
por vezes demanda esforço formidável• Uma alternativa tem sido a aplicação de soluções
iterativas que consistem em adequar a equação para uma expressão do tipo , quando originalmente se apresentava a equação
• A estratégia consiste em adotar valor para x e identificar quando (x) se aproxima de x, alterando o valor de x iterativamente.
Christopher Souza: Estimação de
parâmetros
15
f(x) = (x) – x
(x) = x
Comparação de métodos• Máxima verossimilhança sugere parâmetros
considerados mais eficientes. Para pequenos tamanhos de amostra, a qualidade do estimador é comparável ou inferior ao de outros métodos.
• Métodos dos momentos são mais simples, mas seus parâmetros apresentam qualidade inferior para funções com 3 ou mais parâmetros.
Christopher Souza: Estimação de
parâmetros
16
Caso em estudo: Paraná em Itaipú• Desenvolvido por Gláucia
Nascimento e Christopher Souza
• Séries de vazões naturais para anos hidrológicos de cheias entre 1962 e 2006
• Ajuste do modelo GEV a máximos anuais
• Uso da função “gevfit” para sugestão de valor inicial dos coeficientes
• Modificação dos coeficientes pela soma dos valores apresentados na legenda
1 1.5 2 2.5 3 3.5 4 4.5
x 104
0
10
20
30
40
50
60
70
80
90
100
Vazão
TR
Mudanças no Parâmetro 1
-1000
-500
-100
300
700
1000ppWeibull
GEV
Christopher Souza: Estimação de
parâmetros
17
Caso em estudo: Paraná em Itaipú
Christopher Souza: Estimação de
parâmetros
18
1 1.5 2 2.5 3 3.5 4 4.5
x 104
0
10
20
30
40
50
60
70
80
90
100
Vazão
TR
Mudança no parâmetro 2
-1000
-500
-100
300
700
1000ppWeibull
GEV
1 1.5 2 2.5 3 3.5 4 4.5 5
x 104
0
10
20
30
40
50
60
70
80
90
100
Vazão
TR
Mudança nos parâmetros 1 e
2
0
700
1300
1900
2500
3000ppWeibull
GEV
Intervalos de confiança
Christopher Souza: Estimação de
parâmetros
19
“Estamos 95% confiantes de que o intervalo ± E contém o valor de ”̂
Intervalos de confiança (proporção)• Requisitos:
▫ Amostra aleatória simples.▫ Condições para a
distribuição binomial satisfeitas.
▫ Haver pelo menos 5 sucessos e 5 fracassos, o que permite aproximar pela distribuição normal
• Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de proporção esteja inserido no intervalo construído a partir da proporção amostral
Christopher Souza: Estimação de
parâmetros
20
População Infinita Finita
Margem de Erro
Tamanho da Amostra
Intervalos de confiança(, para conhecido)• Requisitos:
▫ Amostra aleatória simples.
▫ Teorema do limite central (Normal se não houver outlier e histograma ~ forma de sino)
• Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de média esteja inserido no intervalo construído a partir da média amostral
Christopher Souza: Estimação de
parâmetros
21
População Infinita Finita
Margem de Erro
Tamanho da Amostra
Intervalos de confiança(, para desconhecido)• Requisitos:
▫ Amostra aleatória simples.
▫ Teorema do limite central (Normal se não houver outlier e histograma ~ forma de sino)
• Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de média esteja inserido no intervalo construído a partir da média amostral
Christopher Souza: Estimação de
parâmetros
22
• Margem de Erro▫ População infinita
▫ População finita
Intervalos de confiança (²)• Requisitos:
▫ Amostra aleatória simples.▫ Distribuição normal
mesmo para grandes amostras
• Associa-se um grau de confiança, e.g. 95%, de que o valor do parâmetro de variância esteja inserido no intervalo construído a partir da variância amostral
• Estima-se desvio populacional a partir da raiz da estimativa do parâmetro de variância
Christopher Souza: Estimação de
parâmetros
23
Bootstrap• Não tem pré-requisitos• Consiste na obtenção de
estatísticas amostrais de reamostragens de n valores da amostra com repetição
• Estima-se intervalos de confiança a partir do valor de percentis
• Exemplo de dados não-normais
• 2,9 564,2 1,4 4,7 67,6 4,8 51,3 3,6 18,0 3,6
• Exemplo de uma replicação
• 2,9 3,6 1,4 18,0 67,6 4,8 51,3 3,6 18,0 3,6
Christopher Souza: Estimação de
parâmetros
24