amostragem - teoria e exercicios

Upload: carlosxccunha

Post on 03-Apr-2018

229 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/28/2019 Amostragem - teoria e exercicios

    1/20

  • 7/28/2019 Amostragem - teoria e exercicios

    2/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 2

    SUMRIO

    AMOSTRAGEM 3

    1. CONCEITOS BSICOS 3

    2. DISTRIBUIO AMOSTRAL DOS ESTIMADORES 7

    2.1. Distribuio amostral da mdia 72.1.1. Amostragem com reposio 72.1.2. Amostragem sem reposio 8

    2.2. Distribuio amostral da proporo 102.2.1. Amostragem COM reposio 102.2.2. Amostragem SEM reposio 11

    2.3. Distribuio amostral da varincia 122.3.1. Amostragem COM reposio 122.3.2. Amostragem SEM reposio 13

    3. EXERCCIOS 15

    4. RESPOSTAS DOS EXERCCIOS 18

    5. REFERNCIAS 20

  • 7/28/2019 Amostragem - teoria e exercicios

    3/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 3

    AMOSTRAGEM

    1.CONCEITOS BSICOSEstatstica Indutiva. Muitas vezes, apesar dos recursos computacionais e da boa vontade no

    possvel estudar todo um conjunto de dados de interesse. Neste caso estuda-se uma parte do conjunto .O principal motivo para se trabalhar com uma parte do conjunto ao invs do conjunto inteiro o custo.

    O conjunto de todos os elementos que se deseja estudar denominado depopulao. Note-seque o termo populao usado num sentido amplo e no significa, em geral, conjunto de pessoas. Po-de-se definir uma populao como sendo:

    Uma coleo de todos os possveis elementos, objetos ou medidas de interes-se.

    Assim, so exemplos de populaes:

    O conjunto das rendas de todos os habitantes de Porto Alegre;

    O conjunto de todas as notas dos alunos de Estatstica;

    O conjunto das alturas de todos os alunos da Universidade; etc.

    Um levantamento efetuado sobre toda uma populao denominado de levantamento censit-rio ou Censo.

    Fazer levantamentos, estudos, pesquisas, sobre toda uma populao (censo) , em geral, muitodifcil. Isto se deve vrios fatores. O principal o custo. Um censo custa muito caro e demanda umtempo considervel para ser realizado. Assim, normalmente, se trabalha com partes da populao de-nominadas de amostras. Uma amostra pode ser caracterizada como:

    Uma poro ou parte de uma populao de interesse.

    Utilizar amostras para se ter conhecimento sobre populaes realizado intensamente na Agri-cultura, Poltica, Negcios, Marketing, Governo, etc., como se pode ver pelos seguintes exemplos:

    Antes da eleio diversos rgos de pesquisa e imprensa ouvem um conjunto selecionado deeleitores para ter uma idia do desempenho dos vrios candidatos nas futuras eleies.

    Uma empresa metal-mecnica toma uma amostra do produto fabricado em intervalos de

    tempo especificados para verificar se o processo est sob controle e evitar a fabricao de itens defeitu-osos.

    O IBGE faz levantamentos peridicos sobre emprego, desemprego, inflao, etc.

    Redes de rdio e TV se utilizam constantemente dos ndices de popularidade dos programaspara fixar valores da propaganda ou ento modificar ou eliminar programas com audincia insatisfat-ria.

    Bilogos marcam pssaros, peixes, etc. para tentar prever e estudar seus hbitos.

    O processo de escolha de uma amostra da populao denominado de amostragem.

    Riscos da amostragem. O processo deamostragem envolve riscos, pois toma-se decises so-bre toda a populao com base em apenas uma parte dela. A teoria da probabilidade pode ser utiliza-

  • 7/28/2019 Amostragem - teoria e exercicios

    4/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 4

    da para fornecer uma idia do risco envolvido, ou seja, do erro cometido ao utilizar uma amostra ao in-vs de toda a populao, desde que, claro, a amostra seja selecionada atravs de critrios probabilsti-cos, isto , ao acaso.

    Baseado nos conceitos anteriores pode-se definir Estatstica Indutiva ou Inferencial comosendo:

    A coleo de mtodos e tcnicas utilizados para se estudar uma populao baseados em amos-tras probabilsticas desta mesma populao.

    Uma amostra dita probabilstica se todos os elementos da populao tive-rem probabilidade conhecida e no zero de pertencer a amostra.

    Dentre as vrias maneiras de se selecionar uma amostra probabilstica ou aleatria de uma po-pulao a mais simples atribuir a todos os elementos da populao a mesma probabilidade de perten-cer a amostra.

    Uma amostra que satisfaa tal critrio denominada de amostra aleatria simples (aas).

    Uma aas pode ser extrada de uma populao de acordo com os critrios:

    (a) com reposio e (b) sem reposio.

    Se a populao for infinita ento as retiradas com e sem reposio sero equivalentes, isto , sea populao for infinita (ou ento muito grande), o fato de se recolocar o elemento retirado de volta napopulao. no vai afetar em nada a probabilidade de extrao do elemento seguinte.

    Se, no entanto, a populao for finita (e pequena) ser necessrio fazer uma distino entre osdois procedimentos, pois na extrao com reposio as diversas retiradas sero independentes, mas no

    processo sem reposio haver dependncia entre as retiradas, isto , o fato de no recolocar o elemen-to retirado afeta a probabilidade do elemento seguinte ser retirado. A amostragem sem reposio maiseficiente que a amostragem com reposio e reduz a variabilidade uma vez que no possvel retirar e-lementos extremos mais do que uma vez.

    Assim se N representa o tamanho da populao e n < N o tamanho da amostra, ento o nme-ro de amostras possveis de acordo com os critrios com e sem reposio ser:

    (a) Com reposio

    k = nmero de amostras = Nn

    (b) Sem reposio

    k = nmero de amostras =N

    n

    =

    N

    n N n

    !

    !( )!

    Exemplo:

    Considere a populao P = { 1, 3, 5, 6 }. Ento o nmero de amostras possveis de tamanhosn = 2 e n = 3, de acordo com os critrios com e sem reposio ser:

    (a) Sem reposio

    (1) n = 2

    Como N = 4 e n = 2, ento o nmero de amostras possveis ser: Nn

    = 4

    2

    = 4

    2 4 2

    !

    !( )!= 6

  • 7/28/2019 Amostragem - teoria e exercicios

    5/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 5

    Estas amostras sero: (1, 3) (1, 5) (1, 6) (3, 5) (3, 6) (5, 6)

    (2) n = 3

    Como N = 4 e n = 3, ento o nmero de amostras possveis ser:

    N

    n

    =

    4

    3

    =4

    3 4 3

    !

    !( )! = 4

    Estas amostras sero: (1, 3, 5) (1, 3, 6) (1, 5, 6) (3, 5, 6).

    (b) Com reposio

    (1) n = 2

    Como N = 4 e n = 2, ento o nmero de amostras possveis ser Nn = 42 = 16.

    Estas amostras sero: (1, 1) (1, 3) (1, 5) (1, 6) (3, 3) (3, 5) (3, 6) (5, 5)

    (5, 6) (6, 6) (3, 1) (5, 1) (6, 1) ( 5, 3) (6, 3) (6, 5)

    Como pode ser observado neste caso as amostras (a, b) e (b, a) so consideradas diferentes, is-to , na amostragem com reposio as amostras so ordenadas.

    (2) n = 3

    Como N = 4 e n = 3, ento o nmero de amostras possveis ser Nn = 43 = 64

    Algumas destas amostras so:

    (1, 1, 1) (1, 1, 3), (1, 3, 1), (3, 1, 1) (1, 3, 5) (1, 5, 3) ( 5, 3, 1) (5, 1, 3)

    (1, 3, 6) (3, 3, 3), (5, 5, 5) (5, 5, 6) (1, 5, 6) (3, 5, 6) , etc.

    Estimador, estimativas e parmetrosUma caracterstica da populao denominada parmetro.

    Um parmetro uma constante, isto , um nmero que representa uma caracterstica nicada populao.

    Assim se P uma populao, os principais parmetros seriam:

    (i) A mdia de P, anotada por P

    (ii) A varincia de P, anotada por P2

    (iii) O desvio padro de P, anotado por P

    (iv) A proporo de elementos de P que apresentam determinada caracterstica, anotada por:, entre outros.

    Exemplo:

    Para a populao P = { 1, 3, 5, 6 } os parmetros acima seriam:

    (i) P = (1 + 3 + 5 + 6) / 4 = 15 / 4 = 3,75

    (ii) P2

    = (1 + 9 + 25 + 36) / 4 - 3,752 = 71/4 - 3,752 = 17,75 - 14,0625 = 3,6875 = 3,69.

    (iv) P = 1,9203 = 1,92

    (v) = 1 / 4 = 25%, onde o numerador representa o nmero de elementos pares na populao

  • 7/28/2019 Amostragem - teoria e exercicios

    6/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 6

    Estimador

    Um estimador uma caracterstica da amostra.

    Como a amostra aleatria um estimador uma varivel aleatria. Assim tudo o que foi vistoem probabilidade sobre variveis aleatrias, aplica-se aos estimadores. A distribuio de probabilidadede um estimador denominada de distribuio amostral.

    Os principais estimadores so:

    (I) A mdia da amostra, X que um estimador da mdia da populao:

    (ii) A varincia amostral, S2 que um estimador da varincia populacional: 2

    (iii) A proporo amostral, P, que um estimador amostral da proporo populacional .

    Estimativa

    Uma estimativa um valor particular de um estimador

    Assim x = 2 uma estimativa. O estimador a expresso (frmula) enquanto que a estimativa o valor particular que ele assume (nmero).

    Clculo dos principais estimadores.

    Se (X1, X2, ..., Xn) uma amostra aleatria de tamanho n extrada de uma populao, ento:

    (a) X = iX n / uma estimativa da mdia populacional quando a amostra no est agrupada eX =

    iif X n / uma estimativa da mdia da amostra quando a amostra est agrupada em uma distribui-

    o de freqncias (por ponto ou por valores).

    (b) S2 = ( )

    2

    1

    iX X

    n

    = i

    X Xn

    n

    2 2

    1

    uma estimativa da varincia populacional quando a

    amostra no est agrupada e

    S2 = ( )

    2

    1

    i if X Xn

    = i

    if X Xn

    n

    2 2

    1

    uma estimativa da varincia populacional quando a

    amostra est agrupada em uma distribuio de freqncias. Note-se que agora a varincia calculadacomn - 1 no denominador. Isto se deve ao fato de que a varincia for calculada com n no denominador,

    a mdia de sua distribuio amostral no ser igual a varincia populacional o que caracterizaria um es-

    timador tendencioso.

    Embora a varincia seja calculada com n - 1 no denominador com o objetivo de que as esti-mativas variem em torno do parmetro, isto no ir ocorrer se a amostragem for sem reposio de po-pulao finita. Neste caso necessrio utilizar, ainda, uma correo para a varincia que consiste emmultiplic-la pelo valor (N - 1) / N. Evidentemente esta correo s ser necessria se a populao forpequena, caso contrrio o quociente acima ser aproximadamente igual a um e a correo no precisarser feita.

    Assim se a populao for finita (e pequena) e a amostragem for realizada sem reposio a vari-ncia dever ser calculada por:

    $S2 = NN 1S2

  • 7/28/2019 Amostragem - teoria e exercicios

    7/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 7

    (c) P = f / n, onde f = freqncia de elementos na amostra com determinada caracterstica uma estimativa da proporo populacional .

    2.DISTRIBUIES AMOSTRAIS DOS PRINCIPAIS ESTIMADORES

    2.1. DISTRIBUIO AMOSTRAL DA MDIA2.1.1.Amostragem com reposio

    Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 ex-tradas com reposio. Para cada amostra vai-se calcular a mdia. Ter-se- assim um conjunto de 16 va-lores que sero dispostos em uma tabela, com as respectivas probabilidades, e que constituir ento adistribuio amostral da mdia da amostra.

    As possveis amostras com as respectivas mdias so:Amostras (1, 1) (1, 3) (1, 5) (1, 6) (3, 3) (3, 5) (3, 6) (5, 5)

    1 2 3 3,5 3 4 4,5 5Amostras (5, 6) (6, 6) (3, 1) (5, 1) (6, 1) ( 5, 3) (6, 3) (6, 5)

    x 5,5 6 2 3 3,5 4 4,5 5,5

    Colocando estes resultados em uma tabela (distribuio amostral da mdia) vem:

    x f( x ) = P( X = x ) x f( x ) x2 f( x )1,0 1/16 1/16 1,0/16

    2,0 2/16 4/16 8,0/163,0 3/16 9/16 27,0/163,5 2/16 7/16 24,5/164,0 2/16 8/16 32,0/164,5 2/16 9/16 40,5/165,0 1/16 5/16 25,0/165,5 2/16 11/16 60,5/166,0 1/16 6/16 36,0/16 1 60/16 254,5/16

    Pela tabela pode-se verificar que:

    E(X) = x f(x ) = 60/16 = 3,75 = , isto a expectncia (mdia) de todas as mdias amostrais,extradas com reposio da populao P, igual a mdia populacional (parmetro populacional mdia).

    V(X) = 2x f(x ) - X2

    = 254,5/16 - 3,752 = 1,84375 = 2/ 2 = 3,6875/2, isto , a varincia en-tre as mdias amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional.

    O valor X = 1,36 denominado erro padro da mdia. Ele mede a variabilidade entre asmdias amostrais e d uma idia do erro que se comete ao se substituir a mdia da populao pela m-dia da amostra.

    De fato, verificando a tabela acima, pode-se ver que se por exemplo, fosse selecionada a amos-

    tra (1, 1) seramos levados a crer que a mdia da populao seria um, quando de fato ela vale 3,75, co-metendo assim um erro de 2,75 unidades. Felizmente este erro (o maior possvel neste caso) s vai o-

  • 7/28/2019 Amostragem - teoria e exercicios

    8/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 8

    correr com uma probabilidade de 1/16 = 6,25%. Se por exemplo, fosse selecionada a amostra (1, 6) amdia amostral seria 3,5 e o erro cometido (neste caso) seria de 0,25 unidades. Este erro bem menorque o anterior ocorre com uma probabilidade de 2/16 = 12,5%. O que o desvio padro da distribuioamostral da mdia faz determinar o erro mdio, sendo por isso denominado, ento, de erro padro daamostragem.

    2.1.2.Amostragem sem reposioConsidere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 ex-

    tradas sem reposio.

    As possveis amostras com as respectivas mdias so:

    Amostras (1, 3) (1, 5) (1, 6) (3, 5) (3, 6) (5, 6)

    x 2 3 3,5 4 4,5 5,5

    Colocando estes resultados em uma tabela (distribuio amostral da mdia) vem:

    x f(x ) = P(X = x ) x f(x ) 2x f(x )2,0 1 / 6 2,0 / 6 04,00 / 63,0 1 / 6 3,0 / 6 09,00 / 63,5 1 / 6 3,5 / 6 12,25 / 64,0 1 / 6 4,0 / 6 16,00 / 64,5 1 / 6 4,5 / 6 20,25 / 65,5 1 / 6 5,5 / 6 30,25 / 6

    1 22,5 / 6 91,75 / 6Da tabela segue:

    E(X) = x f(x ) = 22,5/6 = 3,75 = , isto a expectncia (mdia) de todas as mdias amos-trais, extradas sem reposio da populao P, tambm igual a mdia populacional (parmetro popula-cional mdia).

    V(X) = 2x f(x ) - X2

    = 91,75/6 - 3,752 = 1,2292 =2

    2 1

    .N nN

    = 1,84375. (2/3), isto , a varin-

    cia entre as mdias amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional mul-tiplicada pelo fator de correo de populao finita. Este fator, pode ser considerado como o fator de

    eficincia da amostragem sem reposio sobre a amostragem com reposio, que neste caso (N = 4 e n=2) vale 2/3. Como na amostragem sem reposio no possvel retirar o mesmo elemento duas vezes,as mdias no podem assumir valores to extremos, como por exemplo, o valor um ou seis que as-sumiram na amostragem com reposio. Isto faz com que a erro padro na amostragem sem reposioseja menor do que na amostragem com reposio.

    O fator de reduo da varincia na amostragem sem reposio : (N - n) / (N -1)

    Pode-se perceber facilmente que quanto maior for a diferena entre o tamanho da populao eo tamanho da amostra mais prximo de um ser este fator. Ento, como regra prtica, pode-se admi-tir como necessria a correo para a varincia das mdias amostrais sempre que o tamanho da amostraexceder a 5% do tamanho da populao. Caso isto no ocorra no necessrio fazer-se a distino en-

    tre os dois procedimentos (com e sem reposio).

  • 7/28/2019 Amostragem - teoria e exercicios

    9/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 9

    Evidentemente as consideraes acima valem para populaes pequenas. Se a populao bas-tante grande ou infinita, no mais ser possvel pensar em construir tabelas para representar a distribui-o das mdias amostrais. Neste caso necessrio procurar por modelos probabilsticos que descrevama distribuio da mdia amostral. Neste caso, tambm, como declarado acima a distino entre amos-tragem com e sem reposio no ser necessrio, pois o fator de correo ser aproximadamente ume no necessitar ser utilizado.

    Os modelos probabilsticos so conhecidos a partir dos dois seguintes resultados:

    (a) Se (X1, X2, ..., Xn) uma amostra aleatria de uma populao com distribuio normal demdia e desvio padro , ento a mdia da amostra (X) ter uma distribuio tambm normal com amesma mdia da populao e com desvio padro (erro padro) raiz de n vezes menor que o desviopadro da populao, isto :

    Se X N(, ) ento X ser N(, n

    )

    (b) Teorema Central do Limite

    Se (X1, X2, ..., Xn) uma amostra aleatria extrada de uma populao com qualquer distribui-o de mdia e desvio padro , ento a mdia da amostra ( X) ter uma distribuio aproximadamen-te normal com a mesma mdia da populao e com desvio padro (erro padro) raiz de n vezes me-nor que o desvio padro da populao medida que o tamanho da amostra aumenta.

    OBS.: Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente boa, pa-ra se poder utilizar este resultado.

    Assim:

    Se X tem qualquer distribuio ento X ter uma distribuio aproximadamente N(, n

    )para n grande (n 30).

    Exemplos:

    (1) Uma populao X tem uma distribuio normal de mdia 100 e desvio padro 10.

    (a) Qual P(95 < X < 105)?

    (b) Se X a mdia de 16 elementos extrada desta populao, qual a P(95 < X < 105) ?

    Soluo:

    (a) Como X uma N(100, 10) vem:P(95 < X < 105) = P(-0,5 < Z < 0,5) = (0,5) - (-0,5) = 0,6915 - 0,3185 = 38,30%.

    Neste caso X uma N(100; 2,5), ento:

    (b) P(95 < X < 105) = P(-2,0 < Z < 2,0) = (2,0) - (-2,0) = 0,9772 - 0,0228 = 95,44%.

    (2) A renda de um conjunto de pessoas de uma certa regio tem mdia 6 s.m. e desvio padrode 2 s.m. Se desta populao for extrada uma amostra de n = 100 pessoas, qual a probabilidade de amdia desta amostra acuse um valor superior a 6,3 s.m?

    Soluo:

    Neste caso, como no foi declarado que a populao normal necessrio aplicar o teoremacentral do limite, uma vez que n = 100 > 30, isto possvel. A mdia da amostra ter uma distribuio

  • 7/28/2019 Amostragem - teoria e exercicios

    10/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 10

    aproximadamente normal com mdia 6 s.m. e desvio padro de: 2 / 10 = 0,20, uma vez que o erro pa-dro da mdia raiz de n vezes menor do que o desvio padro populacional. Ento, a probabilidade pe-dida ser:

    P(X > 6,30) = P(Z > (6,30 - 6)/0,20 ) = P (Z > 1,5) = (-1,5) = 6,68%, isto , apenas 6,68%das mdias de amostras de tamanho n = 100 apresentaro um valor superior a 6,30 s.m.

    2.2. DISTRIBUIO AMOSTRAL DA PROPORO2.2.1.Amostragem COM reposio

    Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 ob-tidas com reposio. Para cada amostra vai-se calcular a proporo P de elementos pares na populao.Ter-se- assim um conjunto de 16 valores que sero dispostos em uma tabela, com as respectivas pro-babilidades, e que formaro ento a distribuio amostral da proporo.

    As possveis amostras com as respectivas propores so:

    Amostras (1, 1) (1, 3) (1, 5) (1, 6) (3, 3) (3, 5) (3, 6) (5, 5)

    p 0 0 0 1/2 0 0 1/2 0Amostras (5, 6) (6, 6) (3, 1) (5, 1) (6, 1) ( 5, 3) (6, 3) (6, 5)

    p 1/2 1 0 0 1/2 0 1/2 1/2

    Colocando estes resultados em uma tabela (distribuio amostral da proporo) vem:

    p f(p) = P(P = p) pf(p) p2f(p)

    0,0 9/16 0/16 0,0/160,5 6/16 3/16 1,5/161,0 1/16 1/16 1,0/16

    1 4/16 2,5/16

    Pode-se ento calcular a expectncia e a varincia:

    E(P) = pf(p) = 4/16 = 0,25 = , isto o valor esperado (mdia) de todas as propores a-mostrais, extradas com reposio da populao P, e igual a proporo populacional (parmetro po-pulacional ). Isto significa, que o estimador P um estimador no tendencioso (ou no viciado) daproporo populacional , quando as amostras so extradas com reposio da populao.

    V(P) = p2f(p) - P2

    = 2,5/16 - 0,252 = 0,09375 = (1 - ) / n, isto , a varincia entre as pro-pores amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional. Isto porquequando se est trabalhando com propores, pode-se mostrar que a varincia populacional igual a(1 - ).

    O valor P = ( )1

    n= 0,09375 denominado erro padro da proporo. Ele mede a va-

    riabilidade entre as propores amostrais e d uma idia do erro que se comete ao se substituir a pro-poro da populao pela proporo da amostra.

  • 7/28/2019 Amostragem - teoria e exercicios

    11/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 11

    2.2.2.Amostragem SEM reposioConsidere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 ex-

    tradas sem reposio.

    As possveis amostras com as respectivas propores so:

    Amostras (1, 3) (1, 5) (1, 6) (3, 5) (3, 6) (5, 6)

    p 0 0 1/2 0 1/2 1/2

    Colocando estes resultados em uma tabela (distribuio amostral da proporo) vem:

    p f(p) = P(P = p) pf(p) p2f(p)0,0 1/2 0,0/2 0,00/20,5 1/2 0,5/2 0,25/2

    1 0,5/2 0,25/2

    Portanto:

    E(P) = pf(p) = 0,5/2 = 0,25 = , isto a expectncia (mdia) de todas as propores amos-trais, extradas sem reposio da populao P, e igual a proporo populacional (parmetro popula-cional ). Isto significa, que o estimador P um estimador no tendencioso (ou no viciado) da propor-o populacional , quando as amostras so retiradas sem reposio.

    V(P) = p2f(p) - P2

    = 0,25/2 - 0,252 = 0,0625 = ( )

    .1

    2 1

    N n

    N, isto , a varincia entre as pro-

    pores amostrais n vezes (neste caso 2 vezes) menor que a varincia populacional multiplicada pe-lo fator de correo de populao finita. Este fator, pode ser considerado como o fator de eficincia daamostragem sem reposio sobre a amostragem com reposio que, neste exemplo, (N = 4 e n = 2) vale2/3.

    Evidentemente as consideraes acima valem para populaes pequenas. Se a populao bas-tante grande ou infinita, no mais ser possvel pensar em construir tabelas para representar a distribui-o das propores amostrais. Nesta situao necessrio procurar por modelos probabilsticos quedescrevam a distribuio da proporo amostral. Neste caso, tambm, como declarado acima a distin-o entre amostragem com e sem reposio no ser necessria, pois o fator de correo ser aproxi-madamente um e no precisar ser utilizado.

    O modelo probabilstico para a proporo amostral dada pelo seguinte resultado:

    (a) Se (X1, X2, ..., Xn) uma amostra aleatria retirada de uma populao com proporo ,ento a distribuio da proporo amostral ser aproximadamente normal com mdia P

    = e desvio

    padro P = ( )1

    n.

    OBS.: Para amostras de 30 ou mais valores, em geral, a aproximao j ser suficiente boa, pa-ra se poder utilizar este resultado. Para amostras pequenas a distribuio da proporo amostral Bi-nomial.

  • 7/28/2019 Amostragem - teoria e exercicios

    12/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 12

    Exemplo:

    A proporo de eleitores do candidato D. M. A. Gogo numa certa regio de 20%. Extra-da uma amostra de 100 eleitores desta regio, qual a probabilidade que ela apresente um nmero de e-

    leitores do candidato(a) Abaixo de 15% (b) Superior a 30%

    Soluo:

    Como n > 30 pode-se usar a distribuio normal com mdia = = 20% e desvio padro

    =n

    )1( =100

    )2,01(2,0 = 0,04 = 4%, Ento:

    (a) P(P < 15%) = P(Z < -1,25) = (-1,25) = 10,56%.

    (b) P(P > 30) = P(Z > 2,5) = (-2,5) = 0,62%.

    2.3. DISTRIBUIO AMOSTRAL DA VARINCIA2.3.1.Amostragem COM reposio

    Considere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 ex-tradas com reposio. Para cada amostra vai-se calcular a varincia. Ter-se- assim um conjunto de 16valores que sero dispostos em uma tabela, com as respectivas probabilidades, e que constituir ento adistribuio amostral da varincia.

    As possveis amostras com as respectivas varincias so:

    Amostras (1, 1) (1, 3) (1, 5) (1, 6) (3, 3) (3, 5) (3, 6) (5, 5)

    x 1 2 3 3,5 3 4 4,5 5s2 0 2 8 12,5 0 2 4,5 0

    Amostras (5, 6) (6, 6) (3, 1) (5, 1) (6, 1) ( 5, 3) (6, 3) (6, 5)

    x 5,5 6 2 3 3,5 4 4,5 5,5s2 0,5 0 2 8 12,5 2 4,5 0,5

    Colocando estes resultados em uma tabela (distribuio amostral da varincia) vem:

    s2 f(s2) = P(S2 = s2) s2f(s2)0,0 4/16 0/160,5 2/16 1/162,0 4/16 8/164,5 2/16 9/168,0 2/16 16/1612,5 2/16 25/16

    1 59/16

    Da tabela segue que:

  • 7/28/2019 Amostragem - teoria e exercicios

    13/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 13

    E(S2) = s2f(s2) = 59/16 = 3,6875 = 2, isto a expectncia (mdia) de todas as varincias dasamostras de tamanho n = 2, extradas com reposio da populao P, igual a varincia populacional(parmetro populacional varincia). Em outras palavras, pode-se dizer que quando a amostragem comreposio a varincia amostral S2 um estimador no tendencioso da varincia populacional 2.

    Desta forma, sempre que se desejar estimar a varincia de uma populao onde as amostras fo-ram retiradas com reposio, pode-se usar a varincia amostral como estimador.

    2.3.2.Amostragem SEM reposioConsidere-se a populao P = { 1, 3, 5, 6 } e todas as amostras possveis de tamanho n = 2 ob-

    tidas sem reposio.

    As possveis amostras com as respectivas varincias so:

    Amostras (1, 3) (1, 5) (1, 6) (3, 5) (3, 6) (5, 6)

    x 2 3 3,5 4 4,5 5,5s2 2 8 12,5 2 4,5 0,5

    Colocando estes resultados em uma tabela (distribuio amostral da varincia) vem:

    s2 f(s2) = P(S2 = s2) s2f(s2)0,5 1/6 0,5/62,0 2/6 4,0/64,5 1/6 4,5/68,0 1/6 8,0/612,5 1/6 12,5/6

    1 29,5/6

    Pela tabela pode-se ver que:

    E(S2) = s2f(s2) = 29,5/6 3,6875 = 2, isto a expectncia (mdia) de todas as varincias dasamostras de tamanho n = 2, extradas sem reposio da populao finita P, no igual a varincia po-pulacional (parmetro populacional varincia). Neste caso, para que se obtenha um estimador no ten-dencioso da varincia populacional necessrio corrigir a varincia amostral atravs do fator (N - 1) /N. Assim se cada varincia acima for multiplicada por este fator, que neste caso ser, (N - 1) / N = 3 / 4

    = 0,75, ento, se ter:2

    $s f( 2$s ) = P( 2$S = 2$s ) 2$s f( 2$s )0,375 1/6 0,375/61,500 2/6 3,000/63,375 1/6 3,375/66,000 1/6 6,000/69,375 1/6 9,375/6

    1 22,125/6

    E( 2$S ) = 2$s f( 2$s ) = 22,125 / 6 = 3,6875 = 2, isto a expectncia (mdia) de todas as varin-cias corrigidas igual ao parmetro populacional 2. Assim quando a populao pequena e amostra-

  • 7/28/2019 Amostragem - teoria e exercicios

    14/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 14

    gem for sem reposio necessrio corrigir a varincia da amostra pelo fator (N - 1) / N, para que elaseja um bom estimador da varincia populacional. claro que esta correo s ser importante parapopulaes pequenas. Se a populao for grande, por exemplo, N = 1000, ento o fator (N - 1) / N =999 / 1000 = 0,999 o que aproximadamente 1. Neste caso, no necessrio usar esta correo e aamostragem sem reposio pode ser considerada equivalente a com reposio para efeitos de estimaoda varincia populacional.

    Evidentemente as consideraes acima valem para populaes pequenas. Se a populao bas-tante grande ou infinita, no mais ser possvel pensar em construir tabelas para representar a distribui-o das varincias amostrais. Neste caso necessrio procurar por modelos probabilsticos (funes)que descrevam a distribuio da varincia amostral. Para a varincia este modelo existe e denominadode distribuio Qui-quadrado (2).

  • 7/28/2019 Amostragem - teoria e exercicios

    15/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 15

    3.EXERCCIOS(01) De uma populao com N = 12 elementos retirada uma amostra aleatria simples, sem reposi-o, de n = 5.

    (01.1) Quantas so as possveis amostras?

    (01.2) Qual a probabilidade de cada uma destas amostras ser selecionada?

    (02) Uma populao composta dos elementos: A, B, C, D e F.

    (02.1) Liste todas as possveis amostras aleatrias simples, sem reposio, com n = 2.

    (02.2) Liste todas as aas, sem reposio, de tamanho n = 3.

    (02.3) Determine a probabilidade de ser sorteada a amostra BC.

    (02.4) Determine a probabilidade de ser sorteada a amostra ACD.

    (03) A tabela, ao lado, a distribuio de freqncias de uma amostra pro-veniente de determinada populao.

    (03.1) Determine o tamanho da amostra.

    (03.2) Determine uma estimativa da mdia da populao.

    (03.3) Determine uma estimativa da varincia da populao.

    (03.4) Determine uma estimativa da proporo de valores pares na populao.

    (04) A tabela ao lado apresenta valores amostrais.(04.1) Qual o tamanho da amostra?(04.2) Determine uma estimativa para a mdia da populao.(04.3) Determine uma estimativa do desvio padro populacional.(04.4) Determine uma estimativa dos valores mpares de X.

    (05) Uma populao formada pelos elementos: A = 3, B = 6, C = 9e D = 12.

    (05.1) Determine os seguintes parmetros:

    (a) mdia,(b) varincia e

    (c) proporo de elementos menores que 8.

    (05.2)(a)Construa a distribuio amostral da mdia da amostra utilizando aas, sem reposio, detamanho n = 2.

    (b) Determine a expectncia e a varincia da distribuio amostral em (a)

    (c) Construa a distribuio amostral da mdia da amostra utilizando aas, sem reposio, detamanho n = 3.

    (d) Determine a expectncia e a varincia da distribuio amostral em (c)

    X f1 402 453 84 7

    Elementos XA 5B 7C 12D 15E 10

  • 7/28/2019 Amostragem - teoria e exercicios

    16/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 16

    (5.3)(a) Construa a distribuio amostral da varincia amostral utilizando aas, sem reposio, detamanho n = 2 e determine a sua expectncia.

    (b) Utilize a correo de populao finita para as varincias obtidas em (a) obtendo a distri-

    buio amostral da varincia corrigida e determine sua expectncia.(c) Construa a distribuio amostral da varincia corrigida utilizando aas, sem reposio, detamanho n = 3 e determine sua expectncia.

    (d) Utilize a correo de populao finita para as varincias obtidas em (c) obtendo a distri-buio amostral da varincia corrigida e determine sua expectncia.

    (5.4)(a)Construa a distribuio amostral para o estimador da proporo de elementos menoresque 8 utilizando aas, sem reposio, de tamanho n = 2.

    (b) Determine a expectncia e a varincia da distribuio em (a).

    (c) Construa a distribuio amostral para o estimador da proporo de elementos menores

    que 8 utilizando aas, sem reposio, de tamanho n = 3.(d) Determine a expectncia e a varincia da distribuio em (c).

    (06) Utilize os valores da amostra tabelada ao lado, extrada aleatoriamente e sem reposio, de umapopulao com N = 2000 elementos, para estimar:

    (06.1) A mdia da populao.

    (06.2) A varincia da populao.

    (06.3) O percentual de elementos menores que 6.

    (06.4) O erro amostral da mdia.

    (07) De uma populao com N = 4000 pessoas de uma regio foi obtida uma a-mostra aleatria, sem reposio, de 400 pessoas que revelou 60 analfabetos. Estime:

    (07.1) A proporo de analfabetos da regio.

    (07.2) O erro amostral do estimador proporo.

    (08) Uma aas de tamanho 900 extrada de uma populao bastante grande apresentou 40% de pessoasdo sexo masculino. Estime o erro amostral do estimador proporo de pessoas do sexo mascu-

    lino.

    (09) Uma populao tem mdia 500 e desvio padro 30.

    (09.1) Determinar a probabilidade que uma aas de 100 elementos apresentar um valor mdio supe-rior a 504,50.

    (09.2) Calcule a probabilidade de que uma aas com n = 64 valores apresentar mdia entre 492,5 e507,5.

    (09.3) Se uma aas de n = 144 for extrada desta populao, qual o percentual de mdias amostraisque estaro entre 495,5 e 504,5?

    (10) Uma populao normalmente distribuda com mdia 800 e desvio padro 60.

    X f0 |-- 2 272 |-- 4 514 |-- 6 496 |-- 8 488 |-- 10 25

  • 7/28/2019 Amostragem - teoria e exercicios

    17/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 17

    (10.1) Determine a probabilidade de que uma aas de tamanho 9 apresentar mdia menor que 780.

    (10.2) Calcule a probabilidade de que uma aas de tamanho n = 16 tenha mdia entre os valores781,4 e 818,6.

    (10.3) Que percentual de mdias amostrais de uma amostra de tamanho n = 25 estaro no intervalo[776; 824]?

    (11) A proporo de eleitores de um candidato 20%.

    (11.1) Qual a probabilidade de uma amostra aleatria simples de 100 eleitores apresentar uma pro-poro amostral superior a 26%?

    (11.2) Qual a probabilidade de uma amostra aleatria simples de 400 eleitores apresentar uma pro-poro de eleitores do candidato entre 17% e 23%?

    (11.3) Se a amostra aleatria for de 625 eleitores, qual a percentual de valores do estimador pro-poro amostral que estaro no intervalo [0,16864; 0,23136]?

    (12) Admitindo que a probabilidade nascer um menino ou uma menina seja iguais, determine a probabi-lidade de que das prximas 400 crianas a nascerem:

    (12.1) Menos de 45% sejam meninas.

    (12.2) Mais de 54% sejam meninos.

  • 7/28/2019 Amostragem - teoria e exercicios

    18/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 18

    4.RESPOSTAS DOS EXERCCIOS(01) (1.1) 792 (1.2) 1/792

    (02) (2.1) AB AC AD AE BC BD BE CD CE DE(2.2) ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE(2.3) 1/10 (2.4) 1/10

    (03)(3.1) 100 (3.2) 1,82 (3.3) 0,73 (3.4) 0,52 = 52%

    (04)(4.1) 5 (4.2) 9,80 (4.3) 3,96 (4.4) 0,60 = 60%

    (05)(5.1)(a) = 7,50 (b) 2 = 11,25 (c) = 0,50

    (5.2)

    (a) x 6 7 8 9f(x ) 1/4 1/4 1/4 1/4

    (b) E(X ) = 7,50 V(X) = 3,75

    (c) x 4,5 6,0 7,5 9,0 10,5

    f(x ) 1/6 1/6 2/6 1/6 1/6

    (d) E(X ) = 7,50 V(X) = 1,25

    (5.3)

    (a) s2 4,5 18,0 40,5f(s2) 3/6 2/6 1/6

    E(S2) = 15 2

    (b) 2$s 3,375 13,500 30,375

    f( 2$s ) 3/6 2/6 1/6

    E( 2$S ) = 11,25 = 2

    (c) s2 9 21f(s2) 1/2 1/2

    E(S2) = 15 2

    (d) 2$s 9 17

    f( 2$s ) 1/2 1/2

    E( 2$S ) = 11,25 = 2

    (5.4)

    (a) p 0 0,5 1f(p) 1/

    64/6

    1/6

    (b) E(P) = 0,50 V(P) = 1/12

  • 7/28/2019 Amostragem - teoria e exercicios

    19/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P r o f . L o r V i a l i , D r . - v i a l i @ m a t . u f r g s . b r - h t t p : / / w w w . m a t . u f r g s . b r / ~ v i a l i / 19

    (c) p 1/3 2/3f(p) 1/2 1/2

    (d) E(P) = 0,50 V(P) = 1/36

    (06)(6.1) x = 4,93 (6.2) s2 = 6,1628 (6.3) p = 63,50% (6.4) 0,1666

    (07) (7.1) 60/400 = 15% (7.2) 1,69%

    (08) 1,63%

    (09)(9.1) 6,68% (9.2) 95,44 (9.3) 92,82%

    (10)(10.1) 15,87% (10.2) 78,50% (10.3) 95,44%

    (11)(11.1) 6,68% (11.2) 86,64% (11.3) 95%(12)(12.1) 2,28% (12.2) 5,48%

  • 7/28/2019 Amostragem - teoria e exercicios

    20/20

    S R I E : E s t a t s t i c a B s i c a

    T e x t o 2 : A M O S T R A G E M

    P f L V i l i D i l i @ f b h / / f b / i l i / 20

    5.REFERNCIASBUSSAB, Wilton O, MORETTIN, Pedro A. Estatstica Bsica. 3. ed. So Paulo, Atual, 1986.

    HOFFMAN, Rodolfo. Estatstica para Economistas. So Paulo. Livraria Pioneira Editora, 1980.

    NETO, Pedro Luiz de Oliveira Costa. Estatstica. So Paulo, Edgard Blcher, 1977.

    NETO, Pedro Luiz de Oliveira Costa, CYMBALISTA, Melvin. Probabilidades: resumos tericos, e-xerccios resolvidos, exerccios propostos. So Paulo, Edgard Blcher, 1974.

    MASON, Robert D., DOUGLAS, Lind A. Statistical Techniques in Business And Economics. IRWIN,Boston, 1990.

    MEYER, Paul L. Probabilidade: aplicaes Estatstica. Traduo do Prof. Ruy C. B. Loureno Fi-lho. Rio de Janeiro, Livros Tcnicos e Cientficos Editora S.A., 1978

    STEVENSON, William J. Estatstica Aplicada Administrao. So Paulo. Editora Harbra, 1981.

    WONNACOTT, Ronald J., WONNACOTT, Thomas. Fundamentos de Estatstica. Rio de Janeiro. Li-vros Tcnicos e Cientficos Editora S. A., 1985.