estimaÇÃo. o teorema central do limite apresentado anteriormente é muito importante, pois mostra...

ESTIMAÇÃO

O teorema central do limite apresentado anteriormente é muito importante, pois mostra como utilizar a distribuição normal para realizar inferências da média amostral, seja qual for a forma da distribuição da população.

Mostraremos como estimar a média de uma população a partir de uma única amostra aleatória retirada da população.

Entretanto, se as médias de amostras do mesmo tamanho extraídas de uma população, em geral, não coincidirem entre si nem com a média da população, que precisão devemos esperar de uma única amostra?

Deveremos definir o erro máximo da estimativa e sua probabilidade de ocorrência.

Há dois tipos de estimativas:Estimativa pontual. Estimativa pontual de um parâmetro da população é o

valor obtido por cálculo de uma amostra retirada da população. Por exemplo, a média de uma amostra aleatória retirada de uma população é uma estimativa pontual da média da população.

Estimativa intervalar. A estimativa está incluída num intervalo considerando um

grau de acerto denominado intervalo de confiança que contém a estimativa pontual. Portanto, a média de uma amostra aleatória retirada de uma população é o valor inicial da média dessa população.

CONFIANÇA DA ESTIMATIVA Para facilitar a compreensão do procedimento de estimativa

da média, nesta análise inicial, a média e o desvio padrão da população serão considerados conhecidos.

Se da população for retirada a amostra aleatória X1 com médiaX1, em geral, a média desta amostra não coincidirá com a média da população , como mostra a distribuição normal das médias amostrais.

Para facilitar a compreensão do procedimento de estimativa da média, nesta análise inicial, a média e o desvio padrão da população serão considerados conhecidos.

Se da população for retirada a amostra aleatória X1, em geral, a média desta amostra não coincidirá com a média da população , como mostra a distribuição normal das médias amostrais.

A diferença entre a média e a média amostralX1 é denominada erro de estimativa ou margem de erro que pode ser medida a partir de qualquer um dos dois valores.

A médiaX1 da amostra X1 é uma boa estimativa da média da população , pois é uma amostra aleatória de tamanho n suficientemente grande e, como foi mostrado anteriormente, a média da amostra X1 tem distribuição normal com parâmetros .

)/,( nN

INTERVALO DE CONFIANÇA Devido à variabilidade amostral, as possíveis amostras

aleatórias de mesmo tamanho retiradas da mesma população terão médias diferentes. Como estimar a média de uma população com apenas uma amostra? Qual a confiabilidade de uma estimativa pontual? O intervalo de confiança definirá de forma objetiva a credibilidade da estimativa.

Intervalo de confiança é o intervalo de valores que contém a média da população com uma determinada probabilidade de acerto.

O intervalo de valores é construído de uma amostra aleatória retirada da população.

O erro de estimativa (ou margem de erro) e o intervalo de confiança são funções do tamanho da amostra.

No Exemplo 11.1 foram definidos o intervalo de confiança e o tamanho da amostra, sendo determinado o erro de estimativa.

O Exemplo 11.2 mostrará o erro de estimativa, registrando o limite inferior e o limite superior correspondente, para cinco diferentes valores de intervalos de confiança do Exemplo 11.1.

Analisemos os intervalos das três médias. Se a média da amostra for igual a 50, então a média da

população estará no intervalo =502,056, ou entre os limites 47,944 e 52,056. Neste exemplo, afirmar que a média da população está contida no intervalo 47,944 e 52,056 é verdadeiro, pois a média da população é 50.

Se a média da amostra for igual a 49, a média da população estará no intervalo =492,056, ou entre os limites 46,944 e 51,056. Afirmar que a média da população está contida no intervalo 46,944 e 51,056 também é verdadeiro.

Se a média da amostra for igual a 53, a média da população estará no intervalo =532,056, ou entre os limites 50,944 e 55,056. Neste exemplo, afirmar que a média da população está contida no intervalo 50,944 e 55,056 é falso.

SIMULADOR

A estimativa da média da população é um processo aleatório com os valores verdadeiro e falso associados a uma distribuição de freqüências do verdadeiro valor, incluído o conceito de longo prazo.

O modelo está preparado para extrair da distribuição uniforme ou da distribuição normal 200 amostras aleatórias de três tamanhos diferentes n=10, 20 e 30, que podem ser selecionadas na caixa de opções.

Tente perceber que: Todos os intervalos de variação da média são iguais, duas

vezes o erro de estimativa, ou margem de erro. Entretanto, os limites da estimativa da média da população são aleatórios.

O aumento do tamanho da amostra diminui a diferença entre o IC estabelecido na célula F6 e a probabilidade de intervalos que contém a média da população registrada na célula F7.

Ao mesmo tempo, ao aumentar o número de experimentos, essa diferença se aproximará do seu valor teórico embora , pela lei dos grandes números, a simulação de duzentas amostragens é uma quantidade pequena para imaginar.

Analisando o gráfico, pode-se contar os intervalos que não contêm a média da amostra, que, neste caso, é conhecida.

É possível ter uma visualização melhor aumentando o comprimento do gráfico.

ERRO TOLERADO O intervalo de confiança determina a probabilidade de acerto da

estimativa, por exemplo, se IC=90%, a probabilidade de acerto será 90% e, conseqüentemente, a probabilidade de erro será 10%.

Dessa maneira, o erro no processo de estimativa define o intervalo de confiança IC=(1 ), medindo ambos com valores unitários.

Distribuindo o erro nas duas caudas da distribuição normal, o erro em cada cauda será /2.

O erro é denominado também erro tolerado ou nível de confiança, mudando a forma de construir o intervalo de confiança da média.

A figura seguinte mostra o erro tolerado nas duas caudas e o desvio padrão normalizado identificado como Z /2.

A figura seguinte mostra o erro tolerado nas duas caudas e o desvio padrão normalizado identificado como Z /2.

A estimativa da média com intervalo de confiança (1 )100, sendo conhecido o desvio padrão da população, é registrado na fórmula:

A relação entre o erro tolerado , o intervalo de confiança (1 ) e o desvio padrão normalizado Z /2 está apresentada na tabela seguinte.

Os resultados mostram que quanto maior for o erro tolerado , menor será o desvio padrão normalizado Z /2 e menor será o erro de estimativa.

nZX

2/

DESVIO PADRÃO DESCONHECIDO

Embora nos exemplos anteriores o desvio padrão da população tenha sido considerado como conhecido na maioria dos casos, ele, na verdade, é desconhecido.

Como na amostra aleatória extraída da população pode-se calcular sua média e seu desvio padrão dessa amostra SX, é razoável adotar o desvio padrão da amostra como a melhor estimativa disponível do desvio padrão da população.

Para amostras de tamanho suficientemente grande, em geral n>30, o erro padrão é medido com a expressão:

n

SS XX

Entretanto, como a variabilidade das amostras gera, também, variabilidade no valor do desvio padrão amostral, como garantir que a estimativa do desvio padrão da população atenda ao conceito de intervalo de confiança?

A teoria e simulações realizadas confirmam essa estimativa considerando amostras de tamanho suficientemente grande, em geral, maiores de trinta, independente da forma de distribuição da amostra.

Portanto, a estimativa da média da população será obtida com a expressão:

nZX

2/

É importante observar que: O tamanho da amostra é suficientemente grande, em geral

n>30. Se o desvio padrão da população for conhecido, o erro de

estimativa é constante para qualquer amostra. Entretanto, quando o desvio padrão da população não for

conhecido, o intervalo da estimativa não será constante, podendo variar de amostra para amostra.

Tamanho da Amostra

Vimos que o erro de estimativa, ou margem de erro, e o intervalo de confiança são funções do tamanho da amostra.

No Exemplo 10.1 foi definido o intervalo de confiança e o tamanho da amostra, sendo determinado o erro de estimativa.

Se o intervalo de confiança for definido, quanto maior for o tamanho da amostra, menor será a margem de erro.

Essa relação está definida pela segunda parcela da expressão da fórmula da média da população, o erro de estimativa,

onde foi incluída a letra e para representar o erro de

estimativa e completar a fórmula. Em alguns casos, interessa realizar estimativas com um erro

aceitável, ou erro de estimativa definido.

nZe

2/

Definida a precisão da estimativa, as únicas variáveis livres possíveis de escolher são o tamanho da amostra e o intervalo de confiança, ou erro tolerado , pois o desvio padrão será obtido da própria amostra, ou da população.

Conhecidos o desvio padrão da população e o intervalo de confiança, para um erro de estimativa definido e, o tamanho da amostra n é determinado com:

22/

eZ

n

Se o desvio padrão da população não for conhecido, deverá ser utilizado o desvio padrão da amostra SX com a mesma expressão.

Entretanto, como o tamanho da amostra n pode ser determinado se o desvio padrão da amostra é desconhecido?

Um caminho é determinar o desvio padrão de uma amostra piloto, a mais representativa possível.

Distribuição t

Quando o desvio padrão da população não for conhecido, a estimativa da média da população deverá ser realizada com a distribuição t, pois com a distribuição Z se obtém um resultado aproximado para amostra com n>30.

O procedimento é similar ao apresentado com a distribuição Z. Em alguns casos, não é possível retirar amostras grandes, pois

os dados disponíveis são poucos, o custo unitário da amostragem é alto, o tempo disponível não é suficiente etc.

Como a forma da distribuição das médias de amostras pequenas dependerá da forma da distribuição da população, o desvio padrão da amostra não será uma boa estimativa do desvio padrão da população.

Portanto, para realizar a estimativa da média da população com amostras pequenas, a distribuição da população deverá ser normal. É recomendado verificar a forma da distribuição para

confirmar a premissa de normalidade da amostra, por exemplo, construindo seu histograma.

Se a inclinação da distribuição da população não for acentuada e o tamanho da amostra não for pequeno, poderá ser utilizada a distribuição t com (n-1) graus de liberdade e desvio da população desconhecido.

Nessas condições, a estimativa da média da população será realizada com a distribuição t, conhecida como distribuição de Student.

Características da Distribuição t

Distribuição contínua e simétrica com média igual a zero. Há uma família de distribuições t, em função do grau de

liberdade gl=(n1). A distribuição é mais aberta e as caudas são um pouco mais

altas que as da distribuição Z. Para amostras com gl>30 a distribuição t se aproxima da

distribuição Z.

Estimativa da média com t

Para estimar a média da população considerando as duas caudas da distribuição t e (n-1) graus de liberdade, aplica-se a expressão

ntX

2/

A tabela seguinte compara os valores críticos das distribuições Z e t para n=31 e diversas probabilidades de erro para as duas caudas da distribuição, ou /2 para a cauda superior e o correspondente /2 para a cauda inferior da distribuição t.

estimaÇÃo. o teorema central do limite apresentado anteriormente é muito importante, pois mostra...

Documents