estimaÇÃo. o teorema central do limite apresentado anteriormente é muito importante, pois mostra...
TRANSCRIPT
ESTIMAÇÃO
O teorema central do limite apresentado anteriormente é muito importante, pois mostra como utilizar a distribuição normal para realizar inferências da média amostral, seja qual for a forma da distribuição da população.
Mostraremos como estimar a média de uma população a partir de uma única amostra aleatória retirada da população.
Entretanto, se as médias de amostras do mesmo tamanho extraídas de uma população, em geral, não coincidirem entre si nem com a média da população, que precisão devemos esperar de uma única amostra?
Deveremos definir o erro máximo da estimativa e sua probabilidade de ocorrência.
Há dois tipos de estimativas:Estimativa pontual. Estimativa pontual de um parâmetro da população é o
valor obtido por cálculo de uma amostra retirada da população. Por exemplo, a média de uma amostra aleatória retirada de uma população é uma estimativa pontual da média da população.
Estimativa intervalar. A estimativa está incluída num intervalo considerando um
grau de acerto denominado intervalo de confiança que contém a estimativa pontual. Portanto, a média de uma amostra aleatória retirada de uma população é o valor inicial da média dessa população.
CONFIANÇA DA ESTIMATIVA Para facilitar a compreensão do procedimento de estimativa
da média, nesta análise inicial, a média e o desvio padrão da população serão considerados conhecidos.
Se da população for retirada a amostra aleatória X1 com médiaX1, em geral, a média desta amostra não coincidirá com a média da população , como mostra a distribuição normal das médias amostrais.
Para facilitar a compreensão do procedimento de estimativa da média, nesta análise inicial, a média e o desvio padrão da população serão considerados conhecidos.
Se da população for retirada a amostra aleatória X1, em geral, a média desta amostra não coincidirá com a média da população , como mostra a distribuição normal das médias amostrais.
A diferença entre a média e a média amostralX1 é denominada erro de estimativa ou margem de erro que pode ser medida a partir de qualquer um dos dois valores.
A médiaX1 da amostra X1 é uma boa estimativa da média da população , pois é uma amostra aleatória de tamanho n suficientemente grande e, como foi mostrado anteriormente, a média da amostra X1 tem distribuição normal com parâmetros .
)/,( nN
INTERVALO DE CONFIANÇA Devido à variabilidade amostral, as possíveis amostras
aleatórias de mesmo tamanho retiradas da mesma população terão médias diferentes. Como estimar a média de uma população com apenas uma amostra? Qual a confiabilidade de uma estimativa pontual? O intervalo de confiança definirá de forma objetiva a credibilidade da estimativa.
Intervalo de confiança é o intervalo de valores que contém a média da população com uma determinada probabilidade de acerto.
O intervalo de valores é construído de uma amostra aleatória retirada da população.
O erro de estimativa (ou margem de erro) e o intervalo de confiança são funções do tamanho da amostra.
No Exemplo 11.1 foram definidos o intervalo de confiança e o tamanho da amostra, sendo determinado o erro de estimativa.
O Exemplo 11.2 mostrará o erro de estimativa, registrando o limite inferior e o limite superior correspondente, para cinco diferentes valores de intervalos de confiança do Exemplo 11.1.
Analisemos os intervalos das três médias. Se a média da amostra for igual a 50, então a média da
população estará no intervalo =502,056, ou entre os limites 47,944 e 52,056. Neste exemplo, afirmar que a média da população está contida no intervalo 47,944 e 52,056 é verdadeiro, pois a média da população é 50.
Se a média da amostra for igual a 49, a média da população estará no intervalo =492,056, ou entre os limites 46,944 e 51,056. Afirmar que a média da população está contida no intervalo 46,944 e 51,056 também é verdadeiro.
Se a média da amostra for igual a 53, a média da população estará no intervalo =532,056, ou entre os limites 50,944 e 55,056. Neste exemplo, afirmar que a média da população está contida no intervalo 50,944 e 55,056 é falso.
SIMULADOR
A estimativa da média da população é um processo aleatório com os valores verdadeiro e falso associados a uma distribuição de freqüências do verdadeiro valor, incluído o conceito de longo prazo.
O modelo está preparado para extrair da distribuição uniforme ou da distribuição normal 200 amostras aleatórias de três tamanhos diferentes n=10, 20 e 30, que podem ser selecionadas na caixa de opções.
Tente perceber que: Todos os intervalos de variação da média são iguais, duas
vezes o erro de estimativa, ou margem de erro. Entretanto, os limites da estimativa da média da população são aleatórios.
O aumento do tamanho da amostra diminui a diferença entre o IC estabelecido na célula F6 e a probabilidade de intervalos que contém a média da população registrada na célula F7.
Ao mesmo tempo, ao aumentar o número de experimentos, essa diferença se aproximará do seu valor teórico embora , pela lei dos grandes números, a simulação de duzentas amostragens é uma quantidade pequena para imaginar.
Analisando o gráfico, pode-se contar os intervalos que não contêm a média da amostra, que, neste caso, é conhecida.
É possível ter uma visualização melhor aumentando o comprimento do gráfico.
ERRO TOLERADO O intervalo de confiança determina a probabilidade de acerto da
estimativa, por exemplo, se IC=90%, a probabilidade de acerto será 90% e, conseqüentemente, a probabilidade de erro será 10%.
Dessa maneira, o erro no processo de estimativa define o intervalo de confiança IC=(1 ), medindo ambos com valores unitários.
Distribuindo o erro nas duas caudas da distribuição normal, o erro em cada cauda será /2.
O erro é denominado também erro tolerado ou nível de confiança, mudando a forma de construir o intervalo de confiança da média.
A figura seguinte mostra o erro tolerado nas duas caudas e o desvio padrão normalizado identificado como Z /2.
A figura seguinte mostra o erro tolerado nas duas caudas e o desvio padrão normalizado identificado como Z /2.
A estimativa da média com intervalo de confiança (1 )100, sendo conhecido o desvio padrão da população, é registrado na fórmula:
A relação entre o erro tolerado , o intervalo de confiança (1 ) e o desvio padrão normalizado Z /2 está apresentada na tabela seguinte.
Os resultados mostram que quanto maior for o erro tolerado , menor será o desvio padrão normalizado Z /2 e menor será o erro de estimativa.
nZX
2/
DESVIO PADRÃO DESCONHECIDO
Embora nos exemplos anteriores o desvio padrão da população tenha sido considerado como conhecido na maioria dos casos, ele, na verdade, é desconhecido.
Como na amostra aleatória extraída da população pode-se calcular sua média e seu desvio padrão dessa amostra SX, é razoável adotar o desvio padrão da amostra como a melhor estimativa disponível do desvio padrão da população.
Para amostras de tamanho suficientemente grande, em geral n>30, o erro padrão é medido com a expressão:
n
SS XX
Entretanto, como a variabilidade das amostras gera, também, variabilidade no valor do desvio padrão amostral, como garantir que a estimativa do desvio padrão da população atenda ao conceito de intervalo de confiança?
A teoria e simulações realizadas confirmam essa estimativa considerando amostras de tamanho suficientemente grande, em geral, maiores de trinta, independente da forma de distribuição da amostra.
Portanto, a estimativa da média da população será obtida com a expressão:
nZX
2/
É importante observar que: O tamanho da amostra é suficientemente grande, em geral
n>30. Se o desvio padrão da população for conhecido, o erro de
estimativa é constante para qualquer amostra. Entretanto, quando o desvio padrão da população não for
conhecido, o intervalo da estimativa não será constante, podendo variar de amostra para amostra.
Tamanho da Amostra
Vimos que o erro de estimativa, ou margem de erro, e o intervalo de confiança são funções do tamanho da amostra.
No Exemplo 10.1 foi definido o intervalo de confiança e o tamanho da amostra, sendo determinado o erro de estimativa.
Se o intervalo de confiança for definido, quanto maior for o tamanho da amostra, menor será a margem de erro.
Essa relação está definida pela segunda parcela da expressão da fórmula da média da população, o erro de estimativa,
onde foi incluída a letra e para representar o erro de
estimativa e completar a fórmula. Em alguns casos, interessa realizar estimativas com um erro
aceitável, ou erro de estimativa definido.
nZe
2/
Definida a precisão da estimativa, as únicas variáveis livres possíveis de escolher são o tamanho da amostra e o intervalo de confiança, ou erro tolerado , pois o desvio padrão será obtido da própria amostra, ou da população.
Conhecidos o desvio padrão da população e o intervalo de confiança, para um erro de estimativa definido e, o tamanho da amostra n é determinado com:
22/
eZ
n
Se o desvio padrão da população não for conhecido, deverá ser utilizado o desvio padrão da amostra SX com a mesma expressão.
Entretanto, como o tamanho da amostra n pode ser determinado se o desvio padrão da amostra é desconhecido?
Um caminho é determinar o desvio padrão de uma amostra piloto, a mais representativa possível.
Distribuição t
Quando o desvio padrão da população não for conhecido, a estimativa da média da população deverá ser realizada com a distribuição t, pois com a distribuição Z se obtém um resultado aproximado para amostra com n>30.
O procedimento é similar ao apresentado com a distribuição Z. Em alguns casos, não é possível retirar amostras grandes, pois
os dados disponíveis são poucos, o custo unitário da amostragem é alto, o tempo disponível não é suficiente etc.
Como a forma da distribuição das médias de amostras pequenas dependerá da forma da distribuição da população, o desvio padrão da amostra não será uma boa estimativa do desvio padrão da população.
Portanto, para realizar a estimativa da média da população com amostras pequenas, a distribuição da população deverá ser normal. É recomendado verificar a forma da distribuição para
confirmar a premissa de normalidade da amostra, por exemplo, construindo seu histograma.
Se a inclinação da distribuição da população não for acentuada e o tamanho da amostra não for pequeno, poderá ser utilizada a distribuição t com (n-1) graus de liberdade e desvio da população desconhecido.
Nessas condições, a estimativa da média da população será realizada com a distribuição t, conhecida como distribuição de Student.
Características da Distribuição t
Distribuição contínua e simétrica com média igual a zero. Há uma família de distribuições t, em função do grau de
liberdade gl=(n1). A distribuição é mais aberta e as caudas são um pouco mais
altas que as da distribuição Z. Para amostras com gl>30 a distribuição t se aproxima da
distribuição Z.
Estimativa da média com t
Para estimar a média da população considerando as duas caudas da distribuição t e (n-1) graus de liberdade, aplica-se a expressão
ntX
2/
A tabela seguinte compara os valores críticos das distribuições Z e t para n=31 e diversas probabilidades de erro para as duas caudas da distribuição, ou /2 para a cauda superior e o correspondente /2 para a cauda inferior da distribuição t.