est at is tic a

Upload: leonardo-cedrim

Post on 09-Jul-2015

220 views

Category:

Documents


0 download

TRANSCRIPT

APO STILA ES TATSTICA

Luis Felipe Dias Lopes, [email protected], [email protected]

D E - UFSM 2003

Sum rio1 Conceitos bsicos 1.1 Populao x Amostra 1.2 Censo x Amostragem 1.3 Dado x Varivel 1.4 Parmetros x estatsticas 1.5 Arredondamento de dados 1.6 Fases do mtodo estatstico 2 Representao tabular 2.1 Representao esquemtica 2.2 Elementos de uma tabela 2.3 Sries estatsticas 2.4 Distribuio de freqncia 3 Representao grfica 3.1 Grficos de Linhas 3.2 Grficos de colunas ou barras 3.3 Grficos circulares ou de Setores (Pie Charts) 3.4 Grfico Pictorial - Pictograma 3.5 Grfico Polar 3.6 Cartograma 3.7 Grficos utilizados para a anlise de uma distribuio de freqncia 4 Medidas descritivas 4.1 Medidas de posio 4.2 Medidas de variabilidade ou disperso 4.3 Medidas de disperso relativas 4.4 Momentos, assimetria e curtose 4.5 Exerccios 5 Probabilidade e variveis aleatrias 5.1 Modelos matemticos 5.2 Conceitos em probabilidade 5.3 Conceitos de probabilidade 5.4 Exerccios 5.5 Teorema de Bayes 5.6 Variveis aleatrias 5.7 Funo de probabilidade

5.8 Exemplos 5.9 Exerccios 6 Distribuies de Probabilidade 6.1 Distribuies discretas de probabilidade 6.2 Exerccios 6.2 Distribuies contnuas de probabilidade 6.4 Exerccios 7 Amostragem 7.1 Conceitos em amostragem 7.2 Planos de amostragem 6.3 Tipos de amostragem 7.4 Amostragem com e sem reposio 7.5 Representao de uma distribuio amostral 7.6 Distribuies amostrais de probabilidade 7.7 Exerccios 7.8 Estatsticas amostrais 7.9 Tamanho da amostra 8 Estimao de parmetros 8.1 Estimao pontual 8.2 Estimao intervalar 8.3 Exerccios 9 Testes de hipteses 9.1 Principais conceitos 8.2 Teste de significncia 9.3 Exerccios 9.4 Testes do Qui-quadrado 9.5 Exerccios 10 Regresso e Correlao 10.1 Introduo 10.2 Definio 10.3 Modelo de Regresso 10.4 Mtodo para estimao dos parmetros e 10.5 Decomposio da varincia Total 10.6 Anlise de Varincia da Regresso 10.7 Coeficiente de Determinao (r) 10.8 Coeficiente de Correlao (r) 10.9 Exerccios 11 Referncias bibliogrficas

1 Conceitos B sicos1.1 Populao x Amostra Populao (N): Conjunto de todos os elementos relativos a um determinado fenmeno que possuem pelo menos uma caracterstica em comum, a populao o conjunto Universo, podendo ser finita ou infinita.Finita - apresenta um nmero limitado de observaes, que passvel de contagem. Infinita - apresenta um nmero ilimitado de observaes que impossvel de contar e geralmente esta associada a processos.

Amostra (n): um subconjunto da populao e dever ser considerada finita, a amostra deve ser selecionada seguindo certas regras e deve ser representativa, de modo que ela represente todas as caractersticas da populao como se fosse uma fotografia desta.

Uma populao pode, mediante processos operacionais, ser considerada infinita, pois a mesma ir dependerdo tamanho da amostra. Se a freqncia relativa entre amostra e populao for menor do que 5% ela considerada infinita, se a freqncia relativa for maior do 5% ela considerada finita.

1.2 Censo x Amostragem Pesquisa Estatstica: qualquer informao retirada de uma populao ou amostra, podendo ser atravs de Censo ou Amostragem. Censo: a coleta exaustiva de informaes das "N" unidades populacionais. Amostragem: o processo de retirada de informaes dos "n" elementos amostrais, no qual deve seguir um mtodo criterioso e adequado (tipos de amostragem).

1.3 Dado x Varivel Dados estatsticos qualquer caracterstica que possa ser observada ou medida de : alguma maneira. As matrias-primas da estatstica so os dados observveis. Varivel: aquilo que se deseja observar para se tirar algum tipo de concluso, geralmente as variveis para estudo so selecionadas por processos de amostragem. Os smbolos utilizados para representar as variveis so as letras maisculas do alfabeto, tais como X, Y, Z, ... que pode assumir qualquer valor de um conjunto de dados. As variveis podem ser classificadas dos seguintes modos:

1

- Qualitativas (ou atributos): So caractersticas de uma populao que no pode ser medidas. Nominal : so utilizados smbolos, ou nmeros, para representar determinado tipo de dados, mostrando, assim, a qual grupo ou categoria eles pertencem. Ordinal ou por postos: quando uma classificao for dividida em categorias ordenadas em graus convencionados, havendo uma relao entre as categorias do tipo maior do que, menor do que, igual a, os dados por postos consistem de valores relativos atribudos para denotar a ordem de primeiro, segundo, terceiro e, assim, sucessivamente. - Quantitativas: So caractersticas populacionais que podem ser quantificadas, sendo classificadas em discretas e contnuas. Discretas: so aquelas variveis que pode assumir somente valores inteiros num conjunto de valores. gerada pelo processo de contagem, como o nmero de veculos que passa em um posto de gasolina, o nmero de estudantes nesta sala de aula. Contnuas: aquelas variveis que podem assumir um valor dentro de um intervalo so de valores. gerada pelo processo de medio Neste caso serve como exemplo o . volume de gua em um reservatrio ou o peso de um pacote de cereal. 1.4 Parmetros x Estatsticas Parmetros: so medidas populacionais quando se investiga a populao em sua totalidade, neste caso impossvel fazer inferncias, pois toda a populao foi investigada. Estatsticas ou Estimadores: medidas obtidas da amostra, torna-se possvel neste so caso utilizarmos as teorias inferncias para que possamos fazer concluses sobre a populao.

2

1.5 Arredondamento de Dados Regras: Portaria 36 de 06/07/1965 - INPM Instituto Nacional de Pesos e Medidas. 1 a) Se o primeiro algarismo aps aquele que formos arredondar for de 0 a 4, conservamos o algarismo a ser arredondado e desprezamos os seguintes.Ex.: 7,34856 (para dcimos) 7,3

2 a) Se o primeiro algarismo aps aquele que formos arredondar for de 6 a 9, acrescenta-se uma unidade no algarismo a ser arredondado e desprezamos os seguintes.Ex.: 1,2734 (para dcimos) 1,3

3 a) Se o primeiro algarismo aps aquele que formos arredondar for 5, seguido apenas de zeros, conservamos o algarismo se ele for par ou aumentamos uma unidade se ele for mpar , desprezando os seguintes.Ex.: 6,2500 (para dcimos) 6,2 12,350 (para dcimos) 12,4

Se o 5 for seguido de outros algarismos dos quais, pelo menos um diferente de zero, aumentamos umaunidade no algarismo e desprezamos os seguintes. Ex.: 8,2502 (para dcimos) 8,3 8,4503 (para dcimos) 8,5

4 a) Quando, arredondarmos uma srie de parcelas, e a soma ficar alterada, devemos fazer um novo arredondamento (por falta ou por excesso), na maior parcela do conjunto, de modo que a soma fique inalterada. Ex.: 17,4% + 18,4% + 12,3% + 29,7% + 22,2% = 100%

arredondando para inteiro: 17% 17% + + 18% 18% + + 12% 12% + + 30% 31% + + 22% 22% = = 99% 100%

3

1.6 Fases do mtodo estatstico O mtodo estatstico abrange as seguintes fases: a) Definio do Problema Consiste na: - formulao correta do problema; - examinar outros levantamentos realizados no mesmo campo (reviso da literatura); - saber exatamente o que se pretende pesquisar definindo o problema corretamente (variveis, populao, hipteses, etc.) b) Planejamento Determinar o procedimento necessrio para resolver o problema: - Como levantar informaes; - Tipos de levantamentos: Por Censo (completo); Por Amostragem (parcial). - Cronograma, Custos, etc. c) Coleta ou levantamento dos dados Consiste na obteno dos dados referentes ao trabalho que desejamos fazer. A coleta pode ser: Direta - diretamente da fonte; Indireta - feita atravs de outras fontes. Os dados podem ser obtidos pela prpria pessoa (primrios) ou se baseia no registro de terceiros (secundrios). d) Apurao dos Dados ou sumarizao Consiste em resumir os dados, atravs de uma contagem e agrupamento. um trabalho de coordenao e de tabulao. Apurao: manual, mecnica, eletrnica e eletromecnica. e) Apresentao dos dados a fase em que vamos mostrar os resultados obtidos na coleta e na organizao. Esta apresentao pode ser: Tabular (apresentao numrica) Grfica (apresentao geomtrica) f) Anlise e interpretao dos dados a fase mais importante e tambm a mais delicada. Tira concluses que auxiliam o pesquisador a resolver seu problema.

4

2 Repre se ntao tab ularConsiste em dispor os dados em linhas e colunas distribudas de modo ordenado. A elaborao de tabelas obedece Resoluo no 886, de 26 de outubro de 1966, do Conselho Nacional de Estatstica. As normas de apresentao so editadas pela Fundao Brasileira de Geografia e Estatstica (IBGE). 2.1 Representao esquemtica Ttulo Cabealho CorpoRodap

2.2 Elementos de uma tabela Ttulo: ttulo deve responder as seguintes questes: O - O que? (Assunto a ser representado (Fato)); - Onde? (O lugar onde ocorreu o fenmeno (local)); - Quando? (A poca em que se verificou o fenmeno (tempo)). Cabealho:parte da tabela na qual designada a natureza do contedo de cada coluna. Corpo: parte da tabela composta por linhas e colunas. Linhas: parte do corpo que contm uma seqncia horizontal de informaes. Colunas: parte do corpo que contm uma seqncia vertical de informaes. Coluna Indicadora: coluna que contm as discriminaes correspondentes aos valores distribudos pelas colunas numricas. Casa ou clula:parte da tabela formada pelo cruzamento de uma linha com uma coluna. Rodap: o espao aproveitado em seguida ao fecho da tabela, onde so colocadas as notas de natureza informativa (fonte, notas e chamadas). Fonte: refere-se entidade que organizou ou forneceu os dados expostos. Notas e Chamds: so esclarecimentos contidos na tabela (nato - conceituao geral; ad m hc - esclarecer mincias em relao a uma clula).

5

2.3 Sries Estatsticas Uma srie estatstica um conjunto de dados ordenados segundo uma caracterstica comum, as quais serviro posteriormente para se fazer anlises e inferncias. Srie Temporal ou Cronolgica: a srie cujos dados esto dispostos em correspondncia com o tempo, ou seja, varia o tempo e permanece constante o fato e o local. Produo de Petrleo Bruto no Brasil de 1976 a 1980 (x 1000 m) Anos 1976 1977 1978 1979 1980 Produo 9 702 9 332 9 304 9 608 10 562

Fonte: Conjuntura Econmica (fev. 1983)

Srie Geogrfica ou Territorial: a srie cujos dados esto dispostos em correspondncia com o local, ou seja, varia o local e permanece constante a poca e o fato. Populao Urbana do Brasil em 1980 (x 1000) Regio Norte Nordeste Sudeste Sul Centro-Oeste Total Populao 3 037 17 568 42 810 11 878 5 115 80 408

Fonte: Anurio Estatstico (1984)

Srie Especfica ou Qualitativa: a srie cujos dados esto dispostos emcorrespondncia com a espcie ou qualidade, ou seja, varia o fato e permanece constante a poca e o local. Populao Urbana e Rural do Brasil em 1980 (x 1000) Localizao Urbana Rural Total Populao 80 408 38 566 118 974

Fonte: Anurio Estatstico (1984)

6

Srie Mista ou Composta: A combinao entre duas ou mais sries constituem novas sries denominadas compostas e apresentadas em tabelas de dupla entrada. O nome da srie mista surge de acordo com a combinao de pelo menos dois elementos. Local + poca = Srie Geogrfica Temporal Populao Urbana do Brasil por Regio de 1940 a 1980 (x 1000) REGIES NE SE S 3 381 7 232 1 591 4 745 10 721 2 313 7 517 17 461 4 361 11 753 28 965 7 303 17 567 42 810 11 878

Anos 1940 1950 1960 1970 1980

N 406 581 958 1 624 3 037

CO 271 424 1 007 2 437 5 115

Fonte: Anurio Estatstico (1984)

2.4 Distribuio de Freqncia o tipo de srie estatstica na qual permanece constante o fato, o local e a poca. Os dados so colocados em classes preestabelecidas, registrando a freqncia de ocorrncia. Uma distribuio de freqncia pode ser classificada em discreta e intervalar. a) Distribuio de Freqncia Discreta ou Pontual: uma srie de dados agrupados na qual o nmero de observaes est relacionado com um ponto real. Notas do Aluno "X" na Disciplina de Estatstica segundo critrios de avaliao do DE da UFSM 1990 Xi 6.3 8.4 5.3 9.5 6.5 fi 2 3 2 3 5 15

Fonte: Departamento de Estatstica (1990)

7

b) Distribuio de Freqncias Intervalar: Na distribuio de freqncia, os intervalos parciais devero ser apresentados de maneira a evitar dvidas quanto classe a que permanece determinado elemento. O tipo de intervalo mais usado do tipo fechado a esquerda e aberto a direita, representado pelo smbolo: |---. Altura em centmetros de 160 alunos do Curso de Administrao da UFSM - 1990 Altura (cm) 150 |--- 158 158 |--- 166 166 |--- 174 174 |--- 182 182 |--- 190 190 |--- 198 Xi 154 162 170 178 186 194 ---fi 18 25 20 52 30 15 160

Fonte: Departamento de Estatstica (1990)

Elementos de uma Distribuio de Freqncias: Classe ou Classe de Freqncia (K): cada subintervalo (linha) na qual dividimos o fenmeno.

Para determinar o nmero de classes a partir dos dados no tabelados, podemos usar a Frmula de Sturges, mas deve-se saber que existem outros mtodos de determina o do nmero de classes em uma tabela de freqncia. O que se deseja fazer apenas comprimir um conjunto de dados em uma tabela, para facilitar a visualizao e interpretao dos mesmos.n(K) = 1 + 3.3 log n , onde n no de informaes.

Alm da Regra de Sturges, existem outras frmulas empricas para resolver o problema para determinaodo nmero de classes [n(k)], h quem prefira n ( k) n . Entretanto, a verdade que essas frmulas no nos levam a uma deciso final; esta vai depender na realidade de um julgamento pessoal, que dever estar ligado a natureza dos dados, procurando, sempre que possvel, evitar classes com freqncias nulas ou freqncias relativas exageradamente grandes.

Limite de Classe (li ou Li): So os valores extremos de cada classe. li = limite inferior da i-sima classe; Li = limite superior da i-sima classe;

8

Amplitude do intervalo de classe (h): a diferena entre dois limites inferiores ou superiores consecutivos. h = l n l n 1 ou h = L n L n 1

A amplitude do intervalo de classe deve ser constante em todo a distribuio de freqncias intervalar. Amplitude total (H): a diferena entre o limite superior da ltima classe e o limite inferior da 1 classe, ou a diferena entre ltimo e o primeiro elemento de um conjunto de dados postos em ordem crescente. H = L n l1

Ponto mdio de classe (X): a mdia aritmtica simples do limite inferior com o limite i superior de uma mesma classe.Xi = li + Li 2

ou a partir do X1 os demais pontos mdios pode ser determinado por: Xn = Xn1 + h

Quando substituirmos os intervalos de classes pelos pontos mdios (Xi), ter-se- uma distribuio defreqncia pontual .

Freqncia absoluta (f i): a quantidade de valores em cada classe

n = f i = f 1 + f 2 + ... + f ni =1

n

Freqncia Acumulada (F i): o somatrio da freqncia absoluta da i-sima classe com a freqncia absoluta das classes anteriores, ou a freqncia acumulada da classe anterior.Fn =

fi =1

n

i

=n

Freqncia Relativa (fr i): o quociente entre a freqncia absoluta da i-sima classe com o somatrio das freqncias.fri = fi

fi =1

n

Obs.:

fri=1

n

i

=1

i

Freqncia Relativa Acumulada (Fr i): o somatrio da freqncia relativa da i-sima classe com as freqncias relativas das classes anteriores.

Frn = fri = 1i =1

n

9

3 Represen ta o gr ficaOs grficos so uma forma de apresentao visual dos dados. Normalmente, contm menos informaes que as tabelas, mas so de mais fcil leitura. O tipo de grfico depende da varivel em questo 3.1 Grficos de Linhas Usado para ilustrar uma srie temporal. Produo de Petrleo Bruto no Brasil de 1976 a 1980 (x 1000 m)11000 10500 10000 Produo 9500 9000 8500 1976

1977

1978 Anos

1979

1980

Fonte: Conjuntura Econmica (Fev. 1983)

3.1.1 Grfico de linhas comparativas Populao Urbana do Brasil por Regio de 1940 a 1980 (x 1000)45000 40000 35000 30000 25000 20000 15000 10000 5000 0 1940 1950 1960 1970 1980 NE N SE S CO

Fonte: Anurio Estatstico (1984)

10

3.2 Grficos de colunas ou barras Representao grfica da distribuio de freqncias. Este grfico utilizado para variveis nominais e ordinais. Caractersticas: - todas as barras devem ter a mesma largura - devem existir espaos entre as barras 3.2.1 Grfico de Colunas Usado para ilustrar qualquer tipo de srie. Populao Urbana do Brasil em 1980 (x 1000)50000 40000 Pop. 30000 20000 10000 0 N NE SE Regies S CO 3037 17568 11878 5115 42810

Fonte: Anurio Estatstico (1984)

As larguras das barras que devero ser todas iguais podendo ser adotado qualquer dimenso, desde que sejaconveniente e desde que no se superponham. O nmero no topo de cada barra pode ou no omitido, se forem conservados, a escala vertical pode ser omitida.

3.2.2.1 Grfico de colunas comparativas a) Colunas Justapostas (grfico comparativo) Populao Urbana do Brasil por Regio de 1940 a 1980 (x 1000)45000 40000 35000 30000 25000 20000 15000 10000 5000 0

N NE SE S CO

1940

1950

1960

1970

1980

Fonte: Anurio Estatstico (1984)

11

b) Colunas Sobrepostas (grfico comparativo) Populao Urbana do Brasil por Regio de 1940 a 1980 (x 1000)100000 80000 60000 40000 20000 0 1940 1950 1960 1970 1980 CO S SE N NE

Fonte: Anurio Estatstico (1984)

3.2.2 Grfico de Barras As regras usadas para o grfico de barras so igua is as usadas para o grfico de colunas. Populao Urbana do Brasil em 1980 (x 1000)CO S Regies SE NE N 0 3037 10000 20000 30000 40000 50000 Populao 17568 5115 11878 42810

Fonte: Anurio Estatstico (1984)

Assim como os grficos de Colunas podem ser construdos grficos de barras comparativas.3.3 Grficos circulares ou de Setores (Pie Charts) Representao grfica da freqncia relativa (percentagem) de cada categoria da varivel. Este grfico utilizado para variveis nominais e ordinais. uma opo ao grfico de barras quando se pretende dar nfase comparao das percentagens de cada categoria. A construo do grfico de setores segue uma regra de 3 simples, onde as freqncias de cada classe correspondem ao ngulo que se deseja representar em relao a freqncia total que representa o total de 360.

12

Caractersticas: - A rea do grfico equivale totalidade de casos (360o = 100%); - Cada fatia representa a percentagem de cada categoria Populao Urbana e Rural do Brasil em 1980 (x 1000)

32% Urbana Rural 68%

Fonte: Anurio Estatstico (1984)

3.4 Grfico Pictorial - Pictograma Tem por objetivo despertar a ateno do pblico em geral, muito desses grficos apresentam grande dose de originalidade e de habilidade na arte de apresentao dos dados. Evoluo da matricula no Ensino Superior no Brasil de 1968 a 1994 (x 1000)1500

1250

1000

750

500

250

0 1968 1974 1980 1986 1990 1994

Fonte: Grandes nmeros da educao brasileira maro de 1996

13

3.4.1 Exemplos de pictogramas Evoluo da frota nacional de carros lcool de 1979 1987

3.631.6471987

2.473.5811985

1.277.1071983

9.6451979

Os mtodos mais eficientes para deixar de fumar segundo 30.000 fumantes entrevistados no Canad

Goma de mascar com nicotina mais sesses de apoio psicolgico Internamento em hospital e uso de drogas relaxantes Acumpuntura Hipnose Injeo de Clonidina, droga que reduz os efeitos da abstinncia

36% 30% 27% 19,5% 18,5%

Devastao Selvagem: extrao de madeiras no Brasil

Pinus6,8%

Eucalipto24,4%

Madeira nativa68,8%

14

3.5 Grfico Polar o tipo de grfico ideal para representar sries temporais cclicas, ou seja, toda a srie que apresenta uma determinada periodicidade. 4.5.1 Como construir um grfico polar 1) Traa-se uma circunferncia de raio arbitrrio (preferencialmente, a um raio de comprimento proporcional a mdia dos valores da srie); 2) Constri-se uma semi-reta (de preferncia horizontal) partindo do ponto 0 (plo) e com uma escala (eixo polar); 3) Divide-se a circunferncia em tantos arcos forem as unidades temporais; 4) Traa -se semi-retas a partir do ponto 0 (plo) passando pelos pontos de diviso; 5) Marca-se os valores correspondentes da varivel, iniciando pela semi-reta horizontal (eixo polar); 6) Ligam-se os pontos encontrados com segmentos de reta; 7) Para fechar o polgono obtido, emprega-se uma linha interrompida.Precipitao pluviomtrica do municpio de Santa Maria RS- 1999 Meses Precipitao (mm) Janeiro 174,8 Fevereiro 36,9 Maro 83,9 Abril 462,7 Maio 418,1 Junho 418,4 Julho 538,7 Agosto 323,8 Setembro 39,7 Outubro 66,1 Novembro 83,3 Dezembro 201,2 Fonte: Base Area de Santa Maria Precipitao pluviomtrica do municpio de Santa Maria RS- 1999

Fonte: Base Area de Santa Maria

Mdia = 237,31 mm

15

3.6 Cartograma a representao de uma carta geogrfica. Este tipo de grfico empregado quando o objetivo o de figurar os dados estatsticos diretamente relacionados com as reas geogrficas ou polticas Dados absolutos (populao) usa-se pontos proporcionais aos dados. Dados relativos (densidade) usa-se hachaduras. Exemplo:Populao da Regio Sul do Brasil - 1990 Estado Paran Santa Catarina Rio Grande do Sul Fonte: IBGE Populao (hab.) 9.137.700 4.461.400 9.163.200 rea (m 2) 199.324 95.318 280.674 Densidade 45,8 46,8 32,6

Populao da Regio Sul do Brasil 1990

Densidade populacional da Regio Sul do Brasil 1990

Fonte: IBGE

Fonte: IBGE

16

3.7 Grficos utilizados para a anlise de uma distribuio de freqncia 3.7.1 HistogramaAltura em centmetros de 160 alunos do Curso de Administrao da UFSM - 1990

Fonte: Departamento de Estatstica (1990)

3.7.2 Polgono de Freqncias Altura em centmetros de 160 alunos do Curso de Administrao da UFSM - 1990

Fonte: Departamento de Estatstica (1990)

17

3.6.3 Ogivas Altura em centmetros de 160 alunos do Curso de Administrao da UFSM 1990Ogiva Crescente Ogiva Decrescente

3.7.4 Grfico em segmentos de reta vertical utilizado para representar uma distribuio de freqncia pontual, onde os segmentos de reta so proporcionais s respectivas freqncias absolutas.Altura em centmetros de 160 alunos do Curso de Administrao da UFSM - 1990

Fonte: Departamento de Estatstica (1990)

3.7.5 Como se interpreta um histograma? A representao grfica da distribuio da varivel, por histogramas. Este grfico utilizado para variveis contnuas. Caractersticas: - Cada barra representa a freqncia do intervalo respectivo; - Os intervalos devem ter a mesma amplitude; - As barras devem estar todas juntas.

18

A simples observao da forma do histograma permite algumas concluses. Veja a figura 4.1. A medida dos dados est no centro do desenho. As freqncias mais altas tambm esto no centro da figura. Nos processos industriais, esta a forma desejvel.

Figura 4.1 Histograma 60 50 40 30 20 10 0

A figura 4.2 apresenta um histograma com assimetria positiva. A mdia dos dados est localizada esquerda do centro da figura e a cauda direita alongada. Esta ocorre quando o limite inferior controlado ou quando no podem ocorrer valores abaixo de determinado limite.

Figura 4.2 Histograma com assimetria positiva 60 50 40 30 20 10 0 Figura 4.3 Histograma com assimetria negativa 60 50 40 30 20 10 0

A figura 4.3 apresenta um histograma com assimetria negativa. A mdia dos dados est localizada direita do centro da figura e a cauda esquerda alongada. Esta forma ocorre quando o limite superior controlado ou quando no podem ocorrer valores acima de certo limite

19

Figura 4.4 Histograma em plateau A figura 4.4 mostra um histograma em plateau, Isto , com exceo das primeiras e das ltimas classes, todas as outras tm freqncias quase iguais. Essa forma ocorre quando se misturam vrias distribuies com diferentes mdias. 60 50 40 30 20 10 0 Figura 4.5 Histograma com dois picos 60 50 40 30 20 10 0

A figura 4.5 mostra um histograma com dois picos, ou duas modas. As freqncias so baixas no centro da figura, mas existem dois picos fora do centro. Esta forma ocorre quando duas distribuies com mdias bem diferentes se misturam. Podem estar misturados, por exemplo, os produtos de dois turnos de trabalho.

Os histogramas tambm mostram o grau de disperso da varivel. Veja a figura 4.6. O histograma esquerda mostra pouca disperso, mas o histograma direita mostra grande disperso. Figura 4.6 Histogramas com disperses diferentes Freqncia 60 50 40 30 20 10 0 Freqncia 60 50 40 30 20 10 0

20

3.7.6 Curva de freqncia curva polida Como, em geral, os dados coletados pertencem a uma amostra extrada de uma populao, pode-se imaginar as amostras tornando-se cada vez mais amplas e a amplitude das classes ficando cada vez menor, o que nos permite concluir que o contorno do polgono de freqncias tende a se transformar numa curva (curva de freqncia), mostrando, de modo mais evidente, a verdadeira natureza da distribuio da populao. Pode-se dizer, ento, que, enquanto que o polgono de freqncia nos d a imagem real do fenmeno estudado, a curva de freqncia nos d a imagem tendenciosa. Assim, aps o traado de um polgono de freqncia, desejvel, muitas vezes, que se faa um polimento, de modo a mostrar o que seria tal polgono com um nmero maior de dados. Esse procedimento claro, no nos dar certeza absoluta que a curva polida seja tal qual a curva resultante de um grande nmero de dados. Porm, pode-se afirmar que ela assemelha-se mais a curva de freqncia que o polgono de freqncia obtido de uma amostra limitada. O polimento, geometricamente, corresponde eliminao dos vrtices da linha poligonal. Consegue-se isso com a seguinte frmula: f ant. + 2f i + f post. fc i = 4 onde: fc i = freqncia calculada da classe considerada; fi = freqncia absoluta da classe i; fant. = freqncia absoluta da classe anterior a i; fpost. = freqncia absoluta da classe posterior a i;

Quando for em fazer o uso da curva polida convm mostrar as freqncias absolutas, por meio deum pequeno circulo, de modo que qualquer interessado possa julgar se esse ponto se o ponto um dado original ou um dado polido.

Altura em centmetros de 40 alunas do Curso de Enfermagem da UFSM - 1996 Altura (cm) |--|--|--|--|--|-- Xi 152 156 160 164 168 172 ---fi 4 9 11 8 5 3 40 fci (0+ 2 x 4 + 9)/4 = 4,25 (4 + 2 x 9 + 11)/4 = 8,25 (9 + 2 x 11 + 8)/4 = 9,75 (11 + 2 x 8 + 5)/4 = 8,00 (8 + 2 x 5 + 3)/4 = 5,25 (5 + 2 x 3 + 0)/4 = 2,75 ---

150 154 158 162 166 170

154 158 162 166 170 174

Fonte: Departamento de Estatstica (1997)

21

Altura em centmetros de 40 alunas do Curso de Enfermagem da UFSM - 1996

Fonte: Departamento de Estatstica (1997)

3.7.7 Curvas em forma de sino As curvas em forma de sino caracterizam-se pelo fato de apresentarem um valor mximo na regio central. Distinguem-se as curvas em forma de sino em: simtricae assimtrica a) Curva simtrica Esta curva caracteriza-se por apresentar o valor mximo no ponto central e os pontos eqidistantes desse ponto terem a mesma freqncia.

31

b) Curvas assimtricas Na prtica, no se encontram distribuies perfeitamente simtricas. As distribuies obtidas de medidas reais so mais ou menos assimtricas, em relao freqncia mxima. Assim, as curvas correspondentes a tais distribuies apresentam a cauda de um lado da ordenada mxima mais longa do que o outro. Se a cauda mais longa fica a direita chamada assimtrica positiva ou enviesada direita, se a cauda se alonga a esquerda, a curva chamada assimtrica negativa ou enviesada esquerda. Assimtrica Positiva Assimtrica Negativa

32

4 Medidas DescritivasTem por objetivo descrever um conjunto de dados de forma organizada e compacta que possibilita a visualizao do conjunto estudado por meio de suas estatsticas, o que no significa que estes clculos e concluses possam ser levados para a populao. Podemos classificar as medidas de posio conforme o esquema abaixo: 4.1 Medidas de Posio Representativas Mdias Mdia Aritmtica Mdia Geomtrica Mdia Harmnica

Separatrizes

Mediana Quartis Decis Centis ou Percentis Moda de Czuber Moda de King Moda de Pearson

Dominantes

4.1.1 Representativas (Mdias) So medidas descritivas que tem por finalidade representar um conjunto de dados. a) Mdia Aritmtica: Amostral ( X ); Populacional () Dados No Tabelados

X=

Xii =1

n

n

ou =

Xi =1

N

i

N

33

Dados Tabelados com Valores Ponderados Mdia Aritmtica Ponderada ( X w ), (onde Wi o peso) Nota do aluno "X" 1 semestre de 1994 - UFSM Notas (Xi) 7.8 8.3 8.2 5.8 Pesos (Wi) 2 3 2 3 10

Xw =

X .Wi =1 i

n

i

Wi=1

n

i

Fonte: Dados Hipotticos

Distribuio de freqncias - Mdia Aritmtica ( X ) Altura em centmetros de 160 alunos do Curso de Administrao da UFSM - 1990 Altura (cm) Xi fi Xi . fi 150 158 166 174 182 190 |--|--|--|--|--|-- 158 166 174 182 190 198 154 162 170 178 186 194 ---18 25 20 52 30 15 160 2763,0 4037,5 3390,0 9230,0 5565,0 2917,55 27903

X=

X .fi i =1

n

i

fi=1

n

i

Fonte: Departamento de Estatstica (1990)

-

Caractersticas da Mdia Aritmtica Simples 1a) A Mdia Aritmtica Simples dever estar entre o menor e o maior valor observado,

Xmin. X Xmax.2 a) A soma algbrica dos desvios calculados entre os valores observados e a mdia aritmtica igual a zero; desvios = d = x i

d = ( x i ) = zeroi =1 i =1

n

n

34

3 a) Somando-se ou subtraindo-se todos os valores (Xi) da srie por uma constante "k" (k 0), a nova mdia aritmtica ser igual a mdia original somada ou subtrada por esta constante "k". xi yi = x i k

X

Y =Xk

4 a) Multiplicando-se ou dividindo-se todos os valores (Xi) da srie por uma constante "k" (k 0), a nova mdia aritmtica ser igual a mdia original multiplicada ou dividida por esta constante "k". xi yi = xi k yi = x i k

X Y = X kb) Mdia Geomtrica: (Xg):

Y = X k

A aplicao da mdia geomtrica deve ser feita, quando os valores do conjunto de dados considerado se comportam segundo uma progresso geomtrica (P.G.)ou dela se aproximam. Dados No Tabelados

Xg = nDados Tabelados

Xi =1

n

i

= n X 1.X 2 . ... .X n

Xg

=n i =1

fi

Xi=1

n

fi

i

=

n i =1

fi

X1 1 .X2 2 . ....Xn n

f

f

f

Usando um artifcio matemtico, pode-se usar para calcular a mdia geomtrica a seguinte frmula:1

fi Xg = 10i=1

n

( f1. log X1+f2 . logX2 +...+f n. logX n )

1n

fi i =1 = 10 i=1

f i .logXi

n

35

c) Mdia Harmnica (Xh) usada para dados inversamente proporcionais. Ex.: Velocidade Mdia, Preo de Custo Mdio 4.1.2 Emprego da mdia 1) Deseja-se obter a medida de posio que possui a maior estabilidade; 2) Houver necessidade de um tratamento algbrico ulterior. Dados No Tabelados

X

h

=

n

n

i =1

1 Xin

=

n 1 1 1 + + ... + X1 X2 Xn

Dados TabeladosXh =

i= 1

i =1 n

fi fi Xi

=

f 1 + f 2 + .. . + f n f1 f f + 2 + . .. + n X1 X2 Xn

Deve-se observar esta propriedade entre as mdias

X X g Xh

4.1.3 Separatrizes (Mediana, Quartis, Decis e Centis ou Percentis) So medidas de posio que divide o conjunto de dados em partes proporcionais, quando os mesmos so ordenados. a) Dados no tabelados Antes de determinarmos as separatrizes devemos em primeiro lugar encontrar a posio da mesma. - Se o nmero de elementos for par ou mpar, as separatrizes seguem a seguinte ordem:Posio = i(n + 1) S

i =1 se for mediana S = 2

1 i 3 se for quartis S=4

36

1 i 9 se for decis S = 10

1 i 99 se for centis S = 100

Dados Tabelados b) Distribuio de freqncias pontual: segue a mesma regra usada para dados no tabelados c) Distribuio de freqncias intervalar i.n Fant .h S + f Si

S i = l Si

onde:

Si = Md i = 1;

S i = Q i 1 i 3; Si = Di 1 i 9 ; Si = C i ou Pi 1 i 99

l Sii.n S

limite inferior da classe que contm a separatriz; posio da separatriz; freqncia acumulada da classe anterior a que contm a separatriz; amplitude do intervalo de classe; freqncia absoluta da classe que contm a separatriz;

Fanth

fSi

4.1.4 Emprego da mediana 1) Quando se deseja obter um ponto que divide a distribuio em partes iguais; 2) H valores extremos que afetam de uma maneira acentuada a mdia; 3) A varivel em estudo salrio.

4.1.5 Dominantes - Moda (Mo) definida como sendo a observao de maior freqncia.

37

a) Dados no tabelados Ex.: 3 5 1 5 5 4 6 1 5 5 4 7 2 6 6 4 8 2 6 6 5 9 3 7 7 5 6 6 7 8 9 Mo = 4 (unimodal) / 10 11 12 13 Mo = (amodal) 3 3 4 5 5 5 Mo1 = 3 Mo 2 = 5 (bimodal) / 7 8 8 Mo = (amodal) 7 8 Mo1 = 5 Mo2 = 6 Mo3 = 7 (multimodal)

Acima de 3 modas usamos o termo multimodal.Dados Tabelados a) Distribuio de freqncias pontual - Moda Bruta (Mo b): o ponto mdio da classe de maior freqncia

Mo b = X ib) Distribuio de freqncias intervalar - Moda de Czuber (Mo c ): O processo para determinar a moda usado por Czuber leva em considerao as freqncias anteriores e posteriores classe modal.

1 Mo c = lMo + + .h 1 2 onde:

1 = f Mo f ant 2 = f Mo f pos

l Mo fMoh

limite inferior da classe modal; freqncia absoluta da classe modal; amplitude do intervalo de classe; freqncia absoluta da classe anterior a classe modal; freqncia absoluta da classe posterior a classe modal;

fantfpos

- Moda de King (Mo k ): O processo proposto por King considera a influncia existente das classes anterior e posterior sobre a classe modal. A inconvenincia deste processo justamente no levar em considerao a freqncia mxima.

f pos Mo k = l Mo + f +f ant pos

.h

38

- Moda de Pearson (Mo p): O processo usado por Pearson pressupe que a distribuio seja aproximadamente simtrica, na qual a mdia aritmtica e a mediana so levadas em considerao.

Mop = 3 Md - 2 X

Um distribuio considerada simtrica quando X Md Mo .4.1.6 Emprego da moda 1) Quando se deseja obter uma medida rpida e aproximada de posio; 2) Quando a medida de posio deve ser o valor mais tpico da distribuio. 4.1.7 Posio relativa da mdia, mediana e moda Quando uma distribuio simtrica, as trs medidas coincidem. Porm, a assimetria torna -as diferentes e essa diferena tanto maior quanto maior a assimetria. Assim, em uma distribuio temos:x = Md = Mo curva simtrica

x < Md < Mo curva assimtrica negativa Mo < Md < x curva assimtrica positiva

x = Md = Mo

M od a

M e d ian a M di aMo Md x

x Md

Mo

39

4.1.8 Exerccios Para os dados abaixo calcule: Md; Q1; Q3 ; D 3; C70 1) 3 4 2) Alturas dos alunos da Turma X no 1o sem. de 1994 - UFSM Alturas fi 63 15 75 25 84 30 91 20 90 Fonte: Dados Hipotticos Alturas dos alunos da Turma Y no 1 o sem. de 1994 UFSM Alturas fi Fi 61 |--65 12 12 65 |--69 23 35 69 |--73 34 69 73 |--77 26 95 77 |--81 15 110 110 110 Fonte: Dados Hipotticos 4.2 Medidas de Variabilidade ou Disperso Visam descrever os dados no sentido de informar o grau de disperso ou afastamento dos valores observados em torno de um valor central representativo chamado mdia. Informa se um conjunto de dados homogneo (pouca variabilidade) ou heterogneo (muita variabilidade). As medidas de disperso podem ser: Absoluta - Desvio extremo - amplitude - Desvio Mdio - Desvio Padro - Desvio quadrtico - Varincia 40 7 6 8 8 10 11 12 13 13 14 15 17 17 18 18 19 21 22 25

3)

Para estudarmos as medidas de variabilidade para dados no tabelados usaremos um exemplo prtico. Supomos que uma empresa esteja querendo contratar um funcionrio, e no final da concorrncia sobraram dois candidatos para uma nica vaga. Ento foi dado 4 tarefas para cada um, onde as mesmas tiveram como registro o tempo (em minutos) de execuo. TAREFAS OPERRIO 1 (TEMPO) OPERRIO 2 (TEMPO - Anlise Grfica 1 55 30 2 45 70 3 52 40 4 48 60

- Medidas de disperso Absoluta: - Desvio Extremo ou Amplitude de Variao (H): a diferena entre o maior e o menor valor de um conjunto de dados

H = Xmax Xmin

- Desvio Mdio d ): Em virtude do (X i X ) = 0 , usamos para calcular o desvio (n i =1

mdio

X X = 0 , assim ficando:i =1 i

n

Para dados no tabelados

d=

Xi =1

n

i

X =

X 1 X + X2 X +... + X n X n

n

Para dados tabelados

41

d =

(fn i =1

i n

Xi Xi

)

fi =1

=

f1 X 1 X + f 2 X 2 X + ... + f n X n X

fi=1

n

i

- Desvio Quadrtico ou Varincia : S 2 (amostra) ou 2 (populao) Para dados no tabelados:

2=

(Xn i =1

i

X)

2

n

=

(X(X

1

X ) + ( X 2 X ) + ... + ( X n X ) n2 2

2

S2 =

(Xn i =1

i

X)

2

n 1

=

1

X ) + (X 2 X ) + ... + (X n X ) n 12 2

2

Para dados tabelados

2 =

f (Xn i =1 i n i =1

i

X)i

2

fn i i

=

f1 ( X 1 X ) + f 2 (X 2 X ) + ... + f n (X n X )2 2

2

fi =1

n

i

S2 =

f (Xi =1

X) 1

2

fi =1

n

=

f1 (X 1 X ) + f 2 ( X 2 X ) + ... + f n ( X n X )2 2

2

i

fi=1

n

i

1

42

- Desvio Padro: S (amostra) ou (populao) Para dados no tabelados:

=

(Xn i =1

i

X)

2

n

=

(X (X

1

X ) + (X 2 X ) + ... + (X n X ) n2 2

2

S=

(Xn i =1

i

X)

2

n 1

=

1

X ) + ( X 2 X ) + ... + ( X n X ) n 12 2

2

Para dados tabelados

=

f (Xn i i =1 n i =1

i

X)i

2

f

=

f 1 (X 1 X ) + f 2 (X 2 X ) + ... + f n ( X n X )2 2

2

fi =1

n

i

S=

f (Xn i =1 i

i

X) 1

2

fi =1

n

=

f1 ( X 1 X ) + f 2 ( X 2 X ) + ... + f n ( X n X )2 2

2

i

fi =1

n

i

1

(n - 1) usado como um fator de correo, onde devemos considerar a varincia amostral como umaestimativa da varincia populacional.

- Propriedades da Varincia1) Somando-se ou subtraindo-se uma constante k a cada valor observado a varincia no ser alterada; 2) Multiplicando-se ou dividindo-se por uma constante k cada valor observado a varincia ficar multiplicada ou dividida pelo quadrado dessa constante.

Outra forma de calcular o desvio padro O desvio padro mede bem a disperso de um conjunto de dados, mas difcil de calcular. Ento, voc pode obter o desvio padro atravs da seguinte relao:

=

R d2

onde R a amplitude e o valor de d2 , que depende do tamanho da amostra, encontrado na tabela a seguir. Este mtodo de calcular o desvio padro fornece boas estimativas para amostras de pequeno tamanho (n=4, 5 ou 6), mas perde a eficincia se n>10. De qualquer

43

forma, essa relao entre a amplitude e o desvio padro de uma amostra que permite fazer grficos de controle X R . TABELA 1: - Fatores para construir um grfico de controlen 2 3 4 5 6 7 8 9 10 d2 1,128 1,693 2,059 2,326 2,534 2,704 2,847 2,970 3,078 n 15 16 17 18 19 20 21 22 234 d2 0,347 3,532 3,532 3,640 3,689 3,735 3,778 3,819 3,858 Fonte: Montgomery, D.C. Statical Quality Control. Nova York, Wyley. 1991. 11 12 3,173 3,258 24 25 3,391 3,391 13 3,336 ----14 3,407 -----

4.3 Medidas de Disperso Relativa

Relativa

- Varincia relativa - Coeficiente de Variao (Pearson)

a medida de variabilidade que em geral expressa em porcentagem, e tem por funo determinar o grau de concentrao dos dados em torno da mdia, geralmente utilizada para se fazer a comparao entre dois conjuntos de dados em termos percentuais, esta comparao revelar o quanto os dados esto prximos ou distantes da mdia do conjunto de dados. - Varincia RelativaV. R .= 2 S2 ou 2 2 X

- Coeficiente de Variao de PearsonC.V. = S ou x 100 X

C.V. 50% a mdia representativa

C.V. 0 a maior representatividade da mdia (S = 0)

4.4 Momentos, assimetria e curtose As medidas de assimetria e curtose complementam as medidas de posio e de disperso no sentido de proporcionar uma descrio e compreenso mais completa das distribuies de freqncias. Estas distribuies no diferem apenas quanto ao valor mdio e variabilidade, mas tambm quanto a sua forma (assimetria e curtose).

44

Para estudar as medidas de assimetria e curtose, necessrio o conhecimento de certas quantidades, conhecidas como momentos. 4.4.1 Momentos So medidas descritivas de carter mais geral e do origem s demais medidas descritivas, como as de tendncia central, disperso, assimetria e curtose. Conforme a potncia considerada tem-se a ordem ou o grau do momento calculado. - Momentos simples ou centrados na origem (mr) O momento simples de ordem r definido como:

mr

X =n

r i

,i

para dados no tabelados;

mronde:

X f = fr i i

,

para dados tabelados.

r um nmero inteiro positivo; m0 = 1; m1 = mdia aritmtica. - Momentos centrados na mdia ( r) M O momento de ordem r centrado na mdia, definido como:

Mr

(X =

i

X)

r

nr i

=

dn

r i

, para dados no-tabeladosr i

Mr

(X X) = fi

fi

=

dn

fi

, para dados tabelados

onde: M0 = 1; M1 = 0; M2 = varincia (s2).

45

- Momentos abstratos (r) So definidos da seguinte forma:

r =onde: s = desvio padro. 4.4.2 Assimetria

Mr sr

Uma distribuio de valores sempre poder ser representada por uma curva (grfico). Essa curva, conforme a distribuio, pode apresentar vrias formas. Se considerarmos o valor da moda da distribuio como ponto de referncia, vemos que esse ponto sempre corresponde ao valor de ordenada mxima, dando-nos o ponto mais alto da curva representativa da distribuio considerada, logo a curva ser analisada quanto sua assimetria. - Distribuio Simtrica: aquela que apresenta a X Mo Md e os quartis Q1 e Q3 eqidistantes do Q2 .

X Mo Md

- Distribuio Assimtrica Assimtrica Positiva Assimtrica Negativa

Mo < Md < X

X < Md < Mo

Podemos medir a assimetria de uma distribuio, calculando os coeficientes de assimetria. Sendo o mais utilizado o Coeficiente de Assimetria de Pearson. X Mo As = S - Se As < 0 a distribuio ser Assimtrica Negativa ; - Se As > 0 a distribuio ser Assimtrica Positiva; - Se As = 0 a distribuio ser Simtrica. 46

Quando no tivermos condies de calcularmos o desvio padro podemos usar a seguinte frmula:As = Q 3 + Q 1 2 Md Q 3 Q1

- Coeficiente momento de assimetria ( 3): o terceiro momento abstrato.

3 =

M3 s3

O campo de variao do coeficiente de assimetria : -1 3 +1 - Intensidade da assimetria: |3 | < 0,2 0,2 < | 3| < 1,0 |3| > 1,0 4.4.3 Curtose J apreciamos as medidas de tendncia central, de disperso e de assimetria. Falta somente examinarmos mais uma das medidas de uso comum em Estatstica, para se positivarem as caracterst icas de uma distribuio de valores: so as chamadas Medidas de Curtose ou de Achatamento, que nos mostra at que ponto a curva representativa de uma distribuio a mais aguda ou a mais achatada do que uma curva normal, de altura mdia. - Curva Mesocrt ica (Normal): considerada a curva padro. - Curva Leptocrtica: uma curva mais alta do que a normal. Apresenta o topo relativamente alto, significando que os valores se acham mais agrupados em torno da moda. - Curva Platicrtica: uma curva mais baixa do que a normal. Apresenta o topo achatado, significando que vrias classes apresentam freqncias quase iguais. simetria; assimetria fraca; assimetria forte.

47

- Coeficiente de CurtoseK= Q 3 Q1 2( P90 P10 )

- Se K > 0.263 a distribuio ser Platicrtica. - Se K = 0.263 a distribuio ser Mesocrtica; - Se K < 0.263 a distribuio ser Leptocrtica; Coeficiente momento de curtose ( 4 ): Corresponde ao momento abstrato de quarta ordem. M 4 = 44 s onde: M4 = momento centrado de quarta ordem. Interpretao: - Se 4 < 3 curva Platicrtica; - Se 4 = 3 curva Mesocrtica; - Se 4 > 3 curva Leptocrtica. 4.5 Exerccios Para os exerccios abaixo construa uma tabela de disperso o suficiente para determinar as medidas de posio (mdia aritmtica, mediana e moda de czuber), disperso (desvio padro e varincia, coeficiente de variao de Pearson), assimetria (coeficiente de assimetria, e coeficiente de curtose). Faa um relatrio referente ao comportamento dos dados em funo dos resultados obtidos. 1) De um exame final de Estatstica, aplicado a 50 alunos da Universidade Luterana,Ano 1999 resultaram as seguintes notas: 4,0 5,3 6,6 8,0 9,3 4,2 5,3 6,7 8,3 9,4 4,3 5,5 6,8 8,5 9,4 4,4 5,7 6,9 8,6 9,5 4,5 5,8 7,0 8,8 9,5 4,5 6,0 7,2 8,9 9,6 4,6 6,1 7,5 9,0 9,7 5,0 6,3 7,6 9,1 9,8 5,1 6,4 7,7 9,2 9,9 5,2 6,5 7,9 9,3 10,0

48

2) Os dados a seguir refere-se a altura em centmetros de 70 alunos da PUCC, turma 6, ano 2000. 153 162 168 172 179 188 193 154 162 168 173 179 188 194 155 163 169 173 180 189 194 156 163 169 174 182 189 195 158 164 170 174 183 190 197 160 164 170 175 184 191 197 160 165 170 175 185 192 199 161 166 171 176 186 192 200 161 167 171 177 186 192 201 161 167 172 178 187 192 205

3) Os dados a seguir referem-se aos salrios anuais pagos em dlares a 60 funcionrios da Empresa PETA S.A. em 1997. 50,00 58,50 66,00 77,00 90,00 100,10 52,50 59,00 66,25 78,00 91,35 100,20 53,50 60,30 67,50 80,00 92,10 101,00 54,00 61,50 68,00 81,50 93,20 102,00 54,20 62,00 68,70 82,50 94,00 103,40 55,50 62,90 69,50 83,50 95,25 104,30 56,30 63,50 70,00 85,00 96,00 105,00 56,50 64,00 72,00 87,30 97,00 107,00 57,00 64,30 75,00 88,00 98,00 108,00 58,10 65,00 76,50 89,10 99,80 109,10

49

5 P roba bilid ad e e Va ri veis Aleatria s5.1 Modelos Matemticos Podem-se destinguir dois tipos de modelos matemticos: 6.1.1 Modelos Determinsticos Refere -se a um modelo que estipule que as condies sob as quais um experimento seja executado determinem o resultado do experimento. O modelo determinstico requer o uso de parmetros pr-determinados em equaes que definem processos precisos. Em outras palavras, um modelo determinstico emprega "Consideraes Fsicas" para prever resultados. 6.1.2 Modelos No Determinsticos ou Probabilsticos So aqueles que informam com que chance ou probabilidade os acontecimentos podem ocorrer. Determina o "grau de credibilidade" dos acontecimentos. (Modelos Estocsticos). Em outras palavras, um modelo probabilstico emprega uma mesma espcie de consideraes para especificar uma distribuio de probabilidade.

5.2 Conceitos em Probabilidade Os conceitos fundamentais em probabilidade so experimentos aleatrios, espao amostral e eventos. 5.2.1 Experimento aleatrio ( ) Qualquer processo aleatrio, capaz de produzir observaes, os resultados surgem ao acaso, podendo admitir repeties no futuro. Um experimento aleatrio apresenta as seguintes caractersticas: a - os resultados podem repetir-se n vezes ( n ) ;

50

S

A

B

FIGURA 6.1 - Evento A unio B 5.2.4.2 A interseo B Smbolo utilizado "I ", o evento que ocorrer se, e somente se, A e B ocorrem simultaneamente.

S

A A B

FIGURA 6.2 - Evento A interseo B 5.2.4.3 Complementar de A Simbologia " A ", o evento que ocorrer se, e somente se A no ocorrer._

S

A

FIGURA 6.3 - Evento complementar de A (A )

_

52

U

B

5.2.5 Tipos de eventos 5.2.5.1 Eventos Mutuamente Excludentes So ditos eventos mutuamente excludentes, quando a ocorrncia de um implica ou no ocorrncia de outro, isto , no pode ocorrer juntos, e conseqentemente, A I B o conjunto vazio ().

FIGURA 6.4 - Eventos mutuamente excludentes 5.2.5.2 Eventos No Excludentes ou Quaisquer So ditos eventos no excludentes quando a ocorrncia de um implica na ocorrncia do outro, isto , so aqueles que ocorrem ao mesmo tempo, A I B .

FIGURA 6.5 - Evento no excludentes 5.2.5.3 Eventos Independentes So aqueles cuja ocorrncia de um evento, no possui efeito algum na probabilidade de ocorrncia do outro.

53

A I B , se A e B forem Quaisquer;

A I B = , se A e B forem Mutuamente Excludentes.logo,

P (A I B) = P( A ) . P(B)Ex.: A e B eventos Quaisquer S = { 1, 2, 3, 4 } A = {1, 2 } B = { 2, 4 }A I B = { 2}

P(A I B ) = P( A ) . P(B)

P (A ) =

2 4

P( B) =

2 4

P(A I B ) =

1 4

5.2.5.4 Eventos Dependentes ou Condicionados Existem varias situaes onde a ocorrncia de um evento pode influenciar fortemente na ocorrncia de outro. Assim, se (A) e (B) so eventos, deseja-se definir uma quantidade denominada probabilidade condicional do evento (A) dado que o evento (B) ocorre, ou sob a forma simblica P A . B Assim, d-se a seguinte definio:

( )

PA

( B) = P(A I B) P(B)( )

onde P(B) > 0. Se P(B) = 0, tem-se que P A B no definida. 5.2.5.5 Eventos Coletivamente Exaustivos So aqueles que ocorrem se nenhum outro ocorrer.

54

AI BICID = FIGURA 6.6 - Evento coletivamente exaustivos

5.3 Conceitos de Probabilidade 5.3.1 Conceito Emprico de Probabilidade O problema fundamental da probabilidade consiste em atribuir um nmero a cada evento (E), o qual avaliar quo possvel ser a ocorrncia de "E", quando o experimento for realizado. Uma possvel maneira de tratar a questo seria determinar a freqncia relativa do evento E (fr(E)),f r ( E) = nmero de ocorrncias do evento (E) . nmero de repeties do experimento ( )

Surgem, no entanto, dois problemas: a - Qual deve ser o nmero de repeties do experimento (); b - A sorte ou habilidade do experimentador poder influir nos resultados, de forma tal que a probabilidade definida como sendo:

P(E) = lim n fr (E) ,onde "n" o nmero de repeties do experimento . 5.3.2 Definio Clssica ou Enfoque "A priori" de Probabilidade Se existe "a" resultados possveis favorveis a ocorrncia de um evento "E" e "b" resultados possveis no favorveis, sendo os mesmos mutuamente excludentes, ento:

55

P(E) =

a , a+b

onde os resultados devem ser verossmeis (possvel e verdadeiro) e permite a observao dos valores da probabilidade antes de ser observado qualquer amostra do evento (E). 5.3.3 Definio Axiomtica Seja () um experimento, seja (S) um espao amostral associado a (). A cada evento (E) associa-se um nmero real representado por P(E) e denominaremos de probabilidade de E, satisfazendo as seguintes propriedades: a - 0 P(E) 1; b - P(S) = 1; c - Se A e B so eventos mutuamente excludentes, ento: P(A U B) = P(A) + P(B). d - Se A1, A 2, ..., An so eventos mutuamente excludentes dois a dois, ento: P(A1 U A 2 U ... U An ) = P(A1) + P(A2) + ... +P(An) ou

P( U A i ) =i=1

n

P(A ) .i i=1

n

As propriedades anteriores so conhecidas como axiomas da teoria da probabilidade. Os axiomas, muitas vezes, se inspiram em resultados experimentais e que, assim, definem a probabilidade de forma que possa ser confirmada experimentalmente. 5.3.4 Teoremas Fundamentais Teorema 1 - Se for evento vazio, ento P() = 0. Prova: Seja um evento A = . Assim, A = A U , como A I = , de acordo com o item (3.2.3.4), A e so mutuamente excludentes, ento: P(A) = P(A U ) P(A) = P(A) + P()

56

P() = P(A) - P(A) P() = 0. Teorema 2 - Se o evento A for o evento complementar de A, ento P(A )=1-P(A). Prova: A U A = S, mas A e A so mutuamente excludentes, ento: P(A U A ) = P(S) P(A U A ) = P(A) + P( A ) P(A) + P( A ) = 1 logo, P(A ) = 1 - P(A). Teorema 3 - Se A e B so eventos quaisquer, ento: P(A U B) = P(A) + P(B) - P(A I B) Prova: Para provar o Teorema 3 devemos transformar A U B em eventos mutuamente excludentes, conforme a FIGURA 6.__ _ _ _ _

_ _

_

FIGURA 6 - Decomposio de eventos quaisquer em mutuamente excludentes Tem-se ento que: (A U B) = A U (B I A ) 57_

e B = (A I B) U (B I A ) logo pela propriedade (c) temos: P(A U B) = P[A U (B I A )] P(A U B) = P(A) + P(B I A ) e P(B) = P[(A I B) U (B I A )] P(B) = P(A I B) + P(B I A ) ou P(B I A ) = P(B) - P(A I B) substituindo-se a equao (- ) na equao (- - ) tem-se: P(A U B) = P(A) + P(B) - P(A I B). Decorrncias do Teorema 3: Sejam A, B e C eventos quaisquer: P(A U B U C) = P[(A U B) U C] P(A U B U C) = P(A U B) + P(C) - P[(A U B) I C] P(A U B U C) = P(A) + P(B) + P(C) - P(A I B) - P[(AI C) U (BI C)] P(A U B U C) = P(A) + P(B) + P(C) - P(AI B) - [P(AI C) + P(BI C) - P(AI B I C)] P(A U B U C) = P(A) + P(B) + P(C) - P(AI B) - P(AI C) - P(BI C) + P(AI B I C) Sejam A1 , A2 , ..., A n eventos quaisquer:_ _ _ _ _

(- )

_

(- - )

58

P(A 1 U A 2 U... U A n ) = P(A i ) i =1

n

i < j =2

P(A i I A j ) +i j

n

i < j< k = 3

P(A I Ai

n

j

IAk ) +

i < j x assim,n! = n.( n 1).( n 2). ... .(n - x + 1) n x (n x)!

logo,P(x) = n x x n x p q . x!

Se p 0 e n >> x logo, q n x q n = (1 p) assim,P (x) = (n. p) x (1 p) n x! x (n.p) n( n 1) 2 P(x) = 1 n.p + 2.1 (p) + ... x! x 2 (n.p) ( n.p) P(x) + ... 1 n.p + x! 2!

n

79

(n. p) x e -n.p x! Substituindo o valor esperado n.p por e considerando-o como sendo o nmero mdio de ocorrncia expresso em unidades de tempo, pode-se dizer que a taxa mdia de falhas (falha / unid. tempo) e t o tempo, logo o nmero mdio de falhas ser t , assim, P(x) = xt . e- x! fornece a probabilidade de x falhas no perodo de tempo t. P( x) =

A probabilidade de zero falhas no tempo t a confiabilidade do componente em funo do tempo. P(0) = R(t) = e t 6.1.3.1 Esperana Matemtica da Distribuio de Poisson

E( X) = xi P(xi )e - x x! x =1 - x e E( X) = , substituindo s = x -1 e x = s + 1 temos: x =1 (x - 1)! e- s+1 E (X) = s! x =1 e - s E(X) = s! x =1 1 24 4 3 E (X) = x1

i =1

E(x) = 6.1.3.2 Varincia da Distribuio de PoissonV(X) = E(X 2 ) E( X)2

ondeE (X 2 ) = x 2 P( xi ) i

E( X 2 ) = x. xx =1

i =1

e - x , substituindo s = x - 1 e x = s + 1 temos: x(x - 1)!80

e - s+1 s! x =1 e - s E(X 2 ) = (s +1) s! x =1 e - s e - s E(X 2 ) = s + x =4 s! 1 x =1 1 24 3 1 2s! 4 4 3 E(X) 1 E (X 2 ) =

(s + 1)

E(X) 2 = 2 + V(X) = 2 + ( ) 2V(X) =

6.2 Exerccios 1) Admitindo-se o nascimento de meninos e meninas sejam iguais, calcular a probabilidade de um casal com 6 filhos ter: a) 4 filhos e 2 filhas b) 3 filhos e 3 filhas 2) Em 320 famlias com 4 crianas cada uma, quantas se esperaria que tivessem: a) nenhuma menina; b) 3 meninos c) 4 meninos 3) Um time X tem 2/3 de probabilidade de vitria sempre que joga. Se X jogar 5 partidas, calcule a probabilidade de: a) X vencer exatamente 3 partidas; b) X vencer ao menos uma partida; c) X vencer mais da metade das partidas; d) X perder todas as partidas; 4) A probabilidade de um atirador acertar um alvo 1/3. Se ele atirar 6 vezes, qual a probabilidade de: a) acertar exatamente 2 tiros; b) no acertar nenhum tiro.

5) Num teste de certo-errado, com 100 perguntas, qual a probabilidade de um aluno, respondendo as questes ao acaso, acertar 70% das perguntas ?

81

6) Se 5% das lmpadas de certa marca so defeituosas, achar a probabilidade de que, numa amostra de 100 lmpadas, escolhidas ao acaso, tenhamos: a) nenhuma defeituosa (use binomial e poisson) b) 3 defeituosas; c) mais do que uma boa; 7) Uma fabrica de pneus verificou que ao testar seus pneus nas pistas, havia em mdia um estouro de pneu a cada 5.000 km. a) qual a probabilidade que num teste de 3.000 km haja no mximo um pneu estourado ? b) Qual a probabilidade de um carro andar 8.000 km sem estourar nenhum pneu ? 8) Certo posto de bombeiros recebe em mdia 3 chamadas por dia. Calcular a probabilidade de: a) receber 4 chamadas num dia; b) receber 3 ou mais chamadas num dia; c) 22 chamadas numa semana. 9) A mdia de chamadas telefnicas em uma hora 3. Qual a probabilidade: a) receber exatamente 3 chamadas numa hora; b) receber 4 ou mais chamadas em 90 minutos; c) 75 chamas num dia; 10) Na pintura de paredes aparecem defeitos em mdia na proporo de 1 defeito por metro quadrado. Qual a probabilidade de aparecerem 3 defeitos numa parede 2 x 2 m? 11) Suponha que haja em mdia 2 suicdios por ano numa populao de 50.000 hab. Em uma cidade de 100.000 habitantes, encontre a probabilidade de que um dado ano tenha havido: a) nenhum suicdio; b) 1 suicdio; c) 2 ou mais suicdios. 12) Suponha 400 erros de impresso distribudos aleatoriamente em um livro de 500 pginas. Encontre a probabilidade de que uma dada pgina contenha: a) nenhum erro; b) 100 erros em 200 pginas.

82

6.3 Distribuies Contnuas de Probabilidade 6.3.1 Distribuio Uniforme uma distribuio de probabilidade usada para variveis aleatrias contnuas, definida num intervalo a, b , e sua funo densidade de probabilidade dada por: 1 f(x) = b a 0 se a x b se x < a ou x > b

.

FIGURA 6.1 - Representao de uma Distribuio Uniforme 6.3.1.1 Esperana Matemtica da Distribui Uniforme o

E(X) = x f(x) dxb

+

E(X) =

a

x

1 dx b-ab

1 x2 E(X) = b - a 2 a b2 a 2 E (X) = 2(b a) ( b - a) (b + a) E(X) = 2(b a)

E( X) =

(b + a) 2

83

6.3.1.2 Varincia da Distribuio Uniforme

V(X) = E(X 2 ) E( X)E(X 2 ) = x 2 f(x) dx +

2

E(X 2 ) = x 2b a

1 dx b-a

1 b 2 x dx b - a a b 1 x3 2 E(X ) = b-a 3 a E(X 2 ) =

b3 a 3 E(X ) = 3( b a) (b - a)(b 2 + ab + a 2 ) E( X 2 ) = 3(b a) 2 b + ab + a 2 2 E( X ) = 3 2 2 b + ab + a 2 b + a V(X) = 3 2 b2 + ab + a 2 b 2 ab + a 2 V(X) = 3 4 2 2 4b + 4ab + 4a 3b 2 6ab 3a 2 V(X) = 12 b2 2ab + a2 V(X) = 122

V(X) =

(b a) 2 12

6.3.2 Distribuio Normal ou Gaussiana um modelo de distribuio contnua de probabilidade, usado tanto para variveis aleatrias discretas como contnuas. Uma varivel aleatria X, que tome todos os valores reais - < x < + tem distribuio normal quando sua funo densidade de probabilidade (f.d.p.) for da forma:1 2 1 x 2 2

f(x) =

e

, < x < +

84

Os parmetros e seguem as seguintes condies:

< < + e > 0 .6.3.2.1 Propriedades da Distribuio Normal a) f uma f.d.p. legtima para f(x)0, logo

fazendo t =

x temos: t + + 1 f(x) d(x) = e 2 dt = I . 2 Para calcular esta integral usaremos um artifcio, ou seja, no lugar de I usaremos I. t s + 1 + 2 2 I = e dt . e 2 ds 2 I =2

+

f(x) d(x) = 1

1 2

-

+

+

-

e

(t 2 +s 2 ) 2

dt ds

introduzindo coordenadas polares para realizar o clculo dessa integral dupla, temos:

s = r cos e t = r senconseqentemente o elemento de rea ds dt se torna r dr d. Como < s < + e < t < + , 0 < r < + e 0 < a < 2 , portanto

1 2 I = 2 02

+

02

re

r2 2

dr d

r 1 2 2 2 I = e d 2 0 0

+

1 2 ( 0 1) d 2 0 1 2 I2 = 0 2 I2 =

85

I2 =I = 1 , logo I = 1 como queramos mostrar.

1 2 = 1 2

b) O aspecto grfico da funo f tem: - Semelhana de um sino, unimodal e simtrico em relao a mdia . - A especificao da mdia e do desvio padro completamente evidenciado. - A rea total da curva equivale a 100%. - A rea total da curva equivale a 100%.

FIGURA 7.2 - Distribuio Normal em funo da e 6.3.2.2 Esperana Matemtica da Distribuio Normal

E(X) = x f(x) dx

+

e dx 2 x x fazendo z = , z = e x = z +, z 1 + E(X) = ( z + ) e 2 dz 2 z z + + 1 1 2 2 E(X) = z e dz + e dz 2 3 2 14 4 2 2 144 44 3zero um

E(X) = x

+

1

1 x 2

2

86

E(X) = 6.3.2.3 Varincia da Distribuio NormalV(X) = E(X 2 ) E( X)2

E(X 2 ) = x 2 f(x) dx

+

e dx 2 x x fazendo z = , z = e x = z +, z + 1 2 2 E(X ) = ( z + ) e 2 dz 2

E(X ) = x2

+

2

1

1 x 2

2

E(X ) =2

+ 1 2 z 2 e 2 dz + 2

z

+ + 1 1 2 z e 2 dz + 2 e 2 dz 14243 2 2 1442443 zero um

z

z

2

)

1 2

z 2

z2 e

2

dz

2

87

6.3.2.4 Distribuio Normal Padronizada Tem como objetivo solucionar a complexidade da f(x) atravs da mudana de varivel. f(z).

FIGURA 7.4 - Complemento da Distribuio Normal Padronizada Fazendo z =

x e z ~ N(0,1) temos que 2 1 + z2 f(z) = e , 2

com E(z) = 0 e VAR(z) = 1. onde: z = nmero de desvios padres a contar da mdia x = valor arbitrrio = mdia da distribuio normal = desvio padro da distribuio normal Estas probabilidades esto tabeladas e este caso particular chamado de Forma Padro da Distribuio Normal.

88

6.3.3 Distribuio t d Student e Trata-se de um modelo de distribuio contnua que se assemelha distribuio normal padro, N ~ (0,1). utilizada para inferncias estatsticas, particularmente, quando se tem amostras com tamanhos inferiores a 30 elementos. A distribuio t tambm possui parmetros denominado "grau de liberdade - ". A mdia da distribuio zero e sua varincia dada por:VAR t = 2 t =

[ ]

( )

2

, para > 2.

A distribuio t simtrica em relao a sua mdia.

6.4 Exerccios 1) As alturas dos alunos de uma determinada escola so normalmente distribudas com mdia 1,60 m e desvio padro 0,30 m. Encontre a probabilidade de um aluno escolhido ao acaso medir: a) entre 1,50 e 1,80 m c) menos que 1,48 m e) menos que 1,70 m b) mais que 1,75 m d) entre 1,54 e 1,58 m f) exatamente 1,83 m

2) A durao de certo componente eletrnico tem mdia 850 dias e desvio padro 45 dias. Qual a probabilidade do componente durar: a) entre 700 e 1000 dias b) menos que 750 dias c) mais que 850 dias d) Qual deve ser o nmero de dias necessrios para que tenhamos de repor 5% dos componentes. (R = 776 dias) 3) Um produto pesa, em mdia, 10 g, com desvio padro de 2 g. embalado em caixas com 50 unidades. Sabe-se que as caixas vazias pesam 500 g, com desviopadro de 25 g. Admitindo-se uma distribuio normal dos pesos e independncia entre as variveis dos pesos do produto e da caixa, calcule a probabilidade de uma caixa cheia pesar mais de 1050 g. Xgeral = 1000, Vgeral = 50Vp + Vc , Sgeral = Vgeral = 28. 73 (R = 0.04093)

89

4) Em uma distribuio normal 28% dos elementos so superiores a 34 e 12% inferiores a 19. Encontrar a mdia e a varincia da distribuio. (R = X = 29. 03, S2 = 73. 44 ) 5) Suponha que a durao de vida de dois equipamentos E1 e E2 tenham respectivamente distribuies N(45 ; 9) e N(40 ; 36). Se o equipamento tiver que ser usado por perodo de 45 horas, qual deles deve ser preferido? (R = E1 ) 6) A precipitao pluviomtrica mdia em certa cidade, no ms de dezembro, de 8,9 cm. Admitindo a distribuio normal com desvio padro de 2,5 cm, determinar a probabilidade de que, no ms de dezembro prximo, a precipitao seja (a) inferior a 1,6 cm, (b) superior a 5 cm mas no superior a 7,5 cm, (c) superior a 12 cm. 7) Em uma grande empresa, o departamento de manuteno tem instrues para substituir as lmpadas antes que se queimem (no esperar que queimem para ento substitu -las). Os registros indicam que a durao das lmpadas tem distribuio N(900 ; 75) (horas). Quando devem ser substitudas as lmpadas de modo que no mximo 10% delas queimem antes de serem trocadas? (R = 889 horas) 8) Os registros indicam que o tempo mdio para se fazer um teste aproximadamente N(80 ; 20) (min.). Determinar: a) a percentagem de candidatos que levam menos de 60 min ? b) se o tempo concedido de 1h, que percentagem no conseguir terminar o teste ? 9) A profundidade dos poos artesianos em um determinado local uma varivel aleatria N(20 ; 3) (metros). Se X a profundidade de determinado poo, determinar (a) P(X < 15), (b) P(18 < X < 23), (c) P (X > 25). 10) Certa mquina de empacotar determinado produto oferece variaes de peso com desvio padro de 20 g. Em quanto deve ser regulado o peso mdio do pacote para que apenas 10% tenham menos que 400 g? Calcule a probabilidade de um pacote sair com mais de 450 g. [R = a) = 425.6 b) 0.11123 )]

90

7 Amo st ra ge m7.1 Conceitos em Amostragem Inferncia Estatstica o processo de obter informaes sobre uma populao a partir de resultados observados ma Amostra. Amostragem: o processo de retirada de informaes dos "n" elementos amostrais, na qual deve seguir um mtodo adequado (tipos de amostragem).

7.2 Plano de Amostragem 1 o ) Definir os Objetivos da Pesquisa 2 o ) Populao a ser Amostrada - Parmetros a ser Estimados (Objetivos) 3 o ) Definio da Unidade Amostral - Seleo dos Elementos que faro parte da amostra 4 o ) Forma de seleo dos elementos da populao

91

Aleatoria Simples Sistematica - Tipo de Amostragem Estratificada por Conglomerados

5 o ) Tamanho da Amostra Ex.: Moradores de uma Cidade (populao alvo)

prpria Objetivo: Tipo de Residncia alugada emprestada Unidade Amostral: Domiclios (residncias)

um piso dois pisos tres ou mais pisos

Elementos da Populao: Famlia por domiclioaleatoria simples Tipo de Amostragem: sistematica estratificada

7.3 Tipos de Amostragem 7.3.1 Amostragem Simples ou Ocasional o processo mais elementar e freqentemente utilizado. Todos os elementos da populao tem igual probabilidade de serem escolhidos. Para uma populao finita o processo deve ser sem reposio. Todos os elementos da populao devem ser numerados. Para realizar o sorteio dos elementos da populao devemos usar a Tabela de Nmeros Aleatrios . 7.3.2 Amostragem Sistemtica Trata-se de uma variao da Amostragem Aleatria Ocasional, conveniente quando a populao est naturalmente ordenada, como fichas em um fichrio, lista telefnica, etc. Ex.: N = 5000 n = 50, ento r =

N = 10, (P.A. de razo 10) n

Sorteia-se usando a Tabela de Nmeros Aleatrios um nmero entre 1 e 10, (x=3), o nmero sorteado refere-se ao 1 o elemento da amostra, logo os elementos da amostra sero:

92

3

13

23

33

43

......

Para determinar qualquer elemento da amostra podemos usar a frmula do termo geral de uma P.A.

a n = a1 + ( n 1). r7.3.3 Amostragem Estratificada um processo de amostragem usado quando nos depararmos com populaes heterogneas, na qual pode-se distinguir subpopulaes mais ou menos homogneas, denominados estratos. Aps a determinao dos estratos, seleciona-se uma amostra aleatria de cada uma subpopulao (estrato). As diversas subamostras retiradas das subpopulaes devem ser proporcionais aos respectivos nmeros de elementos dos estratos, e guardarem a proporcionalidade em relao a variabilidade de cada estrato, obtendo-se uma estratificao tima. Tipos de variveis que podem ser usadas em estratificao: idade, classes sociais, sexo, profisso, salrio, procedncia, etc. 7.3.4 Amostragem por Conglomerados (ou Agrupamentos) Algumas populaes no permitem, ou tornam-se extremamente difcel que se identifiquem seus elementos, mas podemos identificar subgrupos da populao. Em tais casos, uma amostra aleatria simples desses subgrupos (conglomerados) podem ser escolhida, e uma contagem completa deve ser feita no conglomerado sorteado. Agregados tpicos so: quarteires, famlias, organizaes, agncias, edifcios, etc. 7.4 Amostragem "COM" e "SEM" reposio Seja "N" o nmero de elementos de uma populao, e seja "n" o nmero de elementos de uma amostra, ento: Se o processo de retirada dos elementos for COM reposio (pop. infinita (f 5%) ), o nmero de amostra s possveis ser: no de amostras = N n Se o processo de retirada de elementos for SEM reposio (pop. finita (f > 5%) ), o nmero de amostras possveis ser:

93

no de amostras = C N , n = Ex.: Supondo N = 8 e n = 4

N! n! (N - n )!

com reposio: n o de amostras = N n = 8 4 = 4096 sem reposio: no de amostras = C N ,n =N! 8! = C8,4 = = 70 n ! ( N - n )! 4! 4!

Ex.: Processo de Amostragem Aleatria Simples (Distribuio Amostral das Mdias) - (com reposio) N = { 1, 2, 3, 4} n=2 , {11} {2,1} {3,1} {4,1} - (sem reposio) N = { 1, 2, 3, 4} n=2 no de amostras = C 4,2 = no de amostras = N n = 4 2 = 16

{1,2} {2,2} {3,2} {4,2}

{1,3} {2,3} {3,3} {4,3}

{1,4} {2,4} {3,4} {4,4}

4! =6 2! 2!

{1,2} {1,3} {1, 4} {2,3} {2,4} {3, 4}Para ilustrar melhor as estatsticas amostrais usaremos o processo com reposio. , {11} x = 1,0 , {2,1} x = 15 , {31} x = 2,0 {4,1} x = 2,5

{1,2} x = 1,5 {2,2} x = 2,0 {3,2} x = 2,5 {4,2} x = 3,0

{1,3} x = 2,0 {2,3} x = 2,5 {3,3} x = 3,0 {4,3} x = 3,5

{1,4} x = 2,5 {2,4} x = 3,0 {3,4} x = 3,5 {4,4} x = 4,0

94

7.5 Representaes de uma Distribuio Amostral - Tabela

xi1,0 1,5 2,0 2,5 3,0 3,5 4,0 - Grfico

P(X = xi ) 1/16 2/16 3/16 4/16 3/16 2/16 1/16 16/16

7.6 Estatsticas Amostrais - Esperana Matemtica( x ) = E( x) =

xi =1

n

i

P(X = xi ) =

40 = 2,5 16

-Varincia ou VAR( x ) = E x 2 [ E ( x)]2 onde E x 2 =

( )n 2 i

( ) x P( X = x )i i=1

95

7.7 TAMANHO DA AMOSTRA 7.7.1 Introduo Os pesquisadores de todo o mundo, na realizao de pesquisas cientficas, em qualquer setor da atividade humana, utilizam as tcnicas de amostragem no planejamento de seus trabalhos, no s pela impraticabilidade de poderem observar, numericamente, em sua totalidade determinada populao em estudo, como devido ao aspecto econmico dessas investigaes, conduzidos com um menor custo operacional, dentro de um menor tempo, alm de possibilitar maior preciso nos respectivos resultados, ao contrrio, do que ocorre com os trabalhos realizados pelo proceso censitrio (COCHRAN, 1965; CRUZ, 1978). A tcnica da amostragem, a despeito de sua larga utilizao, ainda necessita de alguma didtica mais adequada aos pesquisadores iniciantes. Na teoria da amostragem, so consideradas duas dimenses: 1 a) Dimensionamento da Amostra; 2 a) Composio da Amostra. 7.7.2 Procedimentos para determinar o tamanho da amostra 1 o ) Analisar o questionrio, ou roteiro da entrevista e escolher uma varivel que julgue mais importante para o estudo. Se possvel mais do que uma; 2 o ) Verificar o nvel de mensurao da varivel: nominal, ordinal ou intervalar; 3 o ) Considerar o tamanho da populao: infinita ou finita 4 o ) Se a varavel escolhida for: - intervalar e a populao considerada infinita voc poder determinar o , tamanho da amostra pela frmula:

Z . n= d

2

96

onde: Z = abscissa da curva normal padro, fixado um nvel de confiana (1- ) Z = 1,65 (1 - ) = 90% Z = 1,96 (1 - ) = 95% Z = 2,0 (1 - ) = 95.5% Z = 2,57 (1 - ) = 99% Geralmente usa-se Z = 2 = desvio padro da populao, expresso na unidade varivel, onde poder ser determinado por: Especificaes Tcnicas Resgatar o valor de estudos semelhantes Fazer conjeturas sobre possveis valores d = erro amostral, expresso na unidade da varivel. O erro amostral a mxima diferena que o investigador admite suportar entre e x , isto : x < d . - intervalar e a populao considerada finita, voc poder determinar o tamanho da amostra pela frmula:n= Z 2 . 2 . N d 2 ( N 1) + Z2 . 2

onde: Z = abscissa da normal padro 2 = varincia populacional N = tamanho da populao d = erro amostral - nominal ou ordinal, e a populao considerada infinita, voc poder determinar o tamanho da amostra pela frmula:n= $ $ Z2 . p . q d2

onde: Z = abscissa da normal padro

$ p = estimativa da verdadeira proporo de um dos nveis da varivel escolhida. Por $ exemplo, se a varivel escolhida for parte da empresa, p poder ser a estimativa da97

$ verdadeira proporo de grandes empresas do setor que est sendo estudado. p $ $ ser expresso em decimais ( p = 30% p = 0.30). $ $ q = 1 p

d = erro amostral, expresso em decimais. O erro amostral neste caso ser a mxima $ $ diferena que o investigador admite suportar entre e p , isto : p < d , em que a verdadeira proporo (freqncia relativa do evento a ser calculado a partir da amostra. - nominal ou ordinal, e a populao considerada finita, voc poder determinar o tamanho da amostra pela frmula:

n=onde: Z = abscissa da normal padro N = tamanho da populao$ p = estimativa da proporo $ $ q = 1 p

$ $ Z2 . p . q . N 2 $ $ d ( N 1) + Z2 . p . q

d = erro amostral Estas frmulas so bsicas para qualquer tipo de composio da amostra; todavia, existem frmulas especficas segundo o critrio de composio da amostra. - Se o investigador escolher mais de uma varivel, poder acontecer de ter que aplicar mais de uma frmula, assim dever optar pelo maior valor de "n".$ $ Quando no tivermos condies de prever o possvel valor para p , admita p = 0.50, pois, dessa forma,voc ter o maior tamanho da amostra, admitindo-se constantes os demais elementos.

7.8 Distribuies amostrais de probabilidade 7.8.1 Distribuio amostral das mdias Se a varivel aleatria "x" segue uma distribuio normal:x ~ N (x); 2 (x) , onde z =

(

)

x (x ) ( x)

98

( x ) = (a mdia amostral igual a mdia populacional) e ( x ) =Padro Amostral) 7.8.1.1 Caso COM reposio (pop. infinita)

( x) (Desvio n

2 ( x) x ~ N ( x); n 7.8.1.2 Caso SEM reposio ( op. finita) p

n Quando a amostra for > 5% da populao devemos usar um fator de correo. N

2 ( x) N - n N -n o fator de correo x ~ N ( x); , onde n N -1 N -1 Ex1 .: Uma populao muito grande tem mdia 20,0 e desvio padro 1,4 . Extrai -se uma amostra de 49 observaes. Responda: a) Qual a mdia da distribuio amostral ? b) Qual o desvio padro da distribuio amostral ? c) Qual a porcentagem das possveis mdias que diferiram por mais de 0,2 da mdia populacional ? Ex2 .: Um processo de encher garrafas de coca-cola d em mdia 10% mal cheias com desvio padro de 30%. Extrada uma amostra de 225 garrafas de uma sequncia de produo de 625, qual a probabilidade amostral das garrafas mal cheias estar entre 9% e 12%.O exemplo n o 2 pode ser resolvido usando a distribuio amostral das propores, onde p = proporo populacional, p = mdia da distribuio amostral das propores. Logo temos:

99

7.8.2 Distribuio amostral das proporesp=p e p = p(1 p ) . n N-n , N -1

onde

N -n usado para populao finita. N -1

Ex1: Uma mquina de recobrir cerejas com chocolate regulada para produzir um revestimento de (3% em relao ao volume da cereja). Se o processo segue uma distribuio normal, qual a probabilidade de extrair uma amostra de 25 cerejas de um lote de 169 e encontrar uma mdia amostral superior a 3,4%. R = 0,44828. 7.9 Exerccios 1) Uma fabrica de baterias alega que eu artigo de primeira categoria tem uma vida mdia de 50 meses, e desvio padro de 4 meses. a) Que porcentagem de uma amostra de 36 observaes acusaria vida mdia no intervalo de um ms em torno da mdia ? b) Qual ser a resposta para uma amostra de 64 observaes? c) Qual seria o percentual das mdias amostrais inferior a 49,8 meses com n =100? 2) Um varejista compra copos diretamente da fbrica em grandes lotes. Os copos so embrulhados individualmente. Periodicamente o varejista inspeciona os lotes para determinar a proporo dos quebrados ou lascados. Se um grande lote contm 10% de quebrados (lascados) qual a probabilidade do varejista obter numa a mostra de 100 copos 17% ou mais defeituosos? 3) Deve-se extrair uma amostra de 36 observaes de uma mquina de cunhar moedas comemorativas. A espessura mdia das moedas de 0,2 cm, com desvio padro de 0,01 cm. a) Que percentagem de mdias amostrais estar no intervalo 0,004 em torno da mdia? R = 0.98316 b) Qual a probabilidade de obter uma mdia amostral que se afaste por mais de 0,005 cm da mdia do processo ? R = 0.00164 4) Suponha que uma pesquisa recente tenha revelado que 60% de uma populao de adultos do sexo masculino consistam de no-fumantes. Tomada uma amostra de 10 pessoas de uma populao muito grande, que percentagem esperamos nos intervalos abaixo: a) de 50% a 65% b) maior que 53% c) de 65% a 80% 5) Se a vida mdia de operao de um "flash" 24 horas, com distribuio normal e desvio padro de 3 horas, qual a probabilidade de uma amostra de 10 "flashes" retirados de uma populao de 500 "flashes" apresentar vida mdia que difira por mais de 30 min. da mdia. R = 0.60306 100

8 Estimao de Parme tros um processo de induo, na qual usamos dados extrados de uma amostra para produzir inferncia sobre a populao. Esta inferncia s ser vlida se a amostra for significativa. - Tipos de Estimaes de Par metros i) Estimao Pontual ii) Estimao Intervalar 8.1 Estimao Pontual usada quando a partir da amostra procura-se obter um nico valor de certo parmetro populacional, ou seja, obter estimativas a partir dos valores amostrais. a) Estatsticas Seja (X1, X2, ..., Xn) uma amostra aleatria e (x1 ,x2, ..., xn) os valores tomados pela amostra; ento y = H(x1 ,x2, ..., xn ) uma estatstica. Principais estatsticas: - Mdia Amostral - Proporo Amostral - Varincia Amostral 8.2 Estimao Intervalar Uma outra maneira de se calcular um estimativa de um parmetro desconhecido, construir um intervalo de confiana para esse parmetro com uma probabilidade de 1 (nvel de confiana) de que o intervalo contenha o verdadeiro parmetro. Dessa maneira ser o nvel de significncia, isto , o erro que se estar cometendo ao afirmar que o parmetro est entre o limite inferior e o superior calculado. 8.2.1 Intervalo de confiana para a mdia) com a varincia ( 2 ) conhecida. ( (n > 30 Z) Seja X ~ N , 2

(

)101

Como j vimos anteriormente, x (mdia amostral) tem distribuio normal de mdia e desvio padro ,ou seja: n

2 X ~ N ; nPortanto, z =

X tem distribuio N (0,1) n

Ento,P z 2 z + z 2 = 1

(

)

x P z 2 +z 2 = 1 n

P z 2 X + z 2 X = 1 n n P X z 2 X + z 2 = 1 (Pop. Infinita) n nPara caso de populaes finitas usa-se a seguinte frmula:

P X + Z 2 n

N-n Z2 N -1 n

N-n = 1 (Pop. Finita) N -1

Obs.: Os nveis de confiana mais usados so:1 = 90 % z 2 = 1, 64

1 = 95% z 2 = 1, 96 1 = 99 % z 2 = 2,58

1 = 85% z 2 =

102

Ex.: Seja X a durao da vida de uma pea de equipamento tal que = 5 horas. Admita que 100 peas foram ensaiadas fornecendo uma durao de vida mdia de 500 horas e que se deseja obter um intervalo de 95% para a verdadeira mdia populacional. R = P (499,02 500,98) = 95%. Obs.: Podemos dizer que 95% das vezes, o intervalo acima contm a verdadeira mdia populacional. Isto no o mesmo que afirmar que 95% a probabilidade do parmetro cair dentro do intervalo, o que constituir um erro, pois um parmetro (nmero) e ele est ou no no intervalo. 8.2.2 Intervalo de confiana para a mdia ) com a varincia ( 2 ) ( desconhecida ( n 30) Neste caso precisa-se calcular a estimativa S (desvio padro amostral) a partir dos dados, lembrando que:

S2 =

(xi =1

n

i

x)

2

n 1

onde n -1 = graus de liberdade

2 X ~ N ; n

Portanto, t =

X tem distribuio N (0,1) S n

t=

X z N ( 0,1) . = = S S S S n

Esta distribuio conhecida como distribuio "t" de Student, no caso com ( = n -1) graus de liberdade

103

O grfico da funo densidade da varivel "t" simtrico e tem a forma da normal, porm menos "achatada" sua mdia vale 0 e a varincia em que o grau de liberdade 2 ( > 2)

t , 2 =Ento,

X S n

P t , 2 t + t , 2 = 1

(

)

s s P X t , 2 X + t , 2 = 1 (Pop. Infinita) n nPara caso de populaes finitas usa-se a seguinte frmula: S P X t , / 2 n Nn S X + t , / 2 N 1 n N n N 1 = 1 (Pop. Finita)

Ex.: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extrada de uma populao aproximadamente normal. Construir um intervalo de confiana para com um nvel de 95%.

X=

xii =1

n

n

= 8,7

S2 = = 5%

(xi =1

n

i

x)

2

n 1

4

S 2

= 10 -1 = 9

t , 2 = t 9 , 2.5% = 2,262 R = P( 7,27 10,13) = 95%

Obs.:Quando n>30 e for desconhecido poderemos usar S como uma boa estimativa de . Esta estimao ser melhor quanto maior for o tamanho da amostra. 8.2.3 Intervalo de Confiana para Propores$ $ Sendo p o estimador de , onde p segue uma distribuio normal, logo:

104

$ $ $ p. q $ p ~ N p; n

(pop. infinita)

$ $ p. q N - n $ $ p ~ N p; n N - 1

(pop. finita)

p.q p = $ p n logo Z = onde caracters tica p $ X= p = n nmero de elementos da amostra P ( Z 2 p + Z 2 p ) = 1 (Pop. Infinita) p p

Para caso de populaes finitas usa-se a seguinte frmula: N n N n $ $ P p Z 2 p p + Z 2 p = 1 (Pop. Finita) $ $ N 1 N 1

Ex.: Uma centena de componentes eletrnicos foram ensaiados e 93 deles funcionaram mais que 500 horas. Determine um intervalo de confina de 95% para a verdadeira proporo populacional sabendo que os mesmos foram retirados de uma populao de 1000 componentes. 8.2.4 Intervalo de Confiana para Varincia Como o estimador de 2 S 2 pode-se considerar que - quadrado, ou seja:S2 , 2 logo o intervalo ser: X2 ~ Z n1

( n 1)S22

tem distribuio Qui

105

2 = 2 infAssim temos:

1 ; 2

2 = 2 sup 2

;

( n 1)S2 ( n 1)S2 = 1 2 P 2 X2 Xsup inf Ex.: A seguinte amostra: 9, 8, 12, 7, 9, 6, 11, 6, 10, 9 foi extrada de uma populao aproximadamente normal. Construir um intervalo de confiana para 2 com um nvel de 95%. 8.2.5 Intervalo de Confiana para a diferena Entre duas Mdias: Usualmente comparamos as mdias de duas populaes formando sua diferena:1 2

Uma estimativa pontual desta diferena correspondente:X1 X 2

a) Varincias Conhecidas 1 2 = (X 1 X 2 ) Z .(Erro Padro)2

Erro Padro?VAR (X 1 X 2 ) = (+ 1) VAR X1 + ( 1) VAR X 22 2

=

2 1 2 + 2 n1 n2

106

logo o erro padro =

2 2 1 + 2 n1 n2

2 2 2 1 2 1 P( X1 X2 ) Z 2 + 2 ( 1 2 ) ( X1 X2 ) + Z 2 + 2 = 1 n1 n 2 n1 n 2

Obs.: se 1 e 2 so conhecidas e tem um valor em comum, logo: Erro Padro:

1 1 + n1 n 2

Ex.: Seja duas classes muito grande com desvios padres 1 = 1, 21 e 2 = 2, 13 . Extrada uma amostra de 25 alunos da classe 1 obteve-se uma nota mdia de 7,8, e da classe 2 foi extrada uma amostra de 20 alunos obteve-se uma nota mdia de 6,0. Construir um intervalo de 95% de confiana para a verdadeira diferena das mdias populacionais. R = (LI=0,753; LS=2,847) b) Varincias Desconhecidas Em geral conhecemos duas varincias populacionais ( 2 e 2 ). Se as mesmas so 1 2 desconhecidas o melhor que podemos fazer estim-las por meio de varincias amostrais S2 e S2 . 1 2 Como as amostras sero pequenas, introduziremos uma fonte de erro compensada pela distribuio "t":

S2 S2 S2 S2 P( X1 X2 ) t 2 1 + 2 1 2 ( X1 X 2 ) + t 2 1 + 2 onde = n1 + n2 2 n1 n2 n1 n 2 Obs.: Se as varincias populacionais so desconhecidas mas as estimativas so iguais, poderemos usar para o Erro Padro o seguinte critrio: Erro Padro: SC

1 1 + n1 n2

onde Sc o desvio padro conjunto

SC =

( n1 1)S12 + ( n2 1)S2 2n1 + n2 2

Ex1 .: De uma turma (1) foi extrada uma amostra de 6 alunos com as seguintes alturas: 150, 152, 153, 160, 161, 163. De uma segunda turma foi extrada uma amostra de 8 alunos com as seguintes alturas: 165, 166, 167, 172, 178, 180, 182, 190. Contruir um intervalo de 95% de confiana para a verdadeira diferena entre as mdias populacionais. 107

Ex2 .: De uma mquina foi extrada uma amostra de 8 peas, com os seguintes dimetros: 54, 56, 58, 60, 60, 62, 63, 65. De uma segunda mquina foi extrada uma amostra de 10 peas, com os seguintes dimetros: 75, 75, 76, 77, 78, 78, 79, 80, 80, 82. Construir um intervalo de 99% de confiana para a diferena entre as mdias populacionais, supondo que as mquinas foram construdas pelo mesmo fabricante . 8.2.6 Intervalo de Confiana para a Diferena entre duas Propores $ $ $ $ $ $ $ $ pq pq pq p q $ $ $ $ P (p1 p2 ) Z 2 1 1 + 2 2 1 2 ( p1 p 2 ) + Z 2 1 1 + 2 2 n1 n2 n1 n2 = 1

Ex.: Em uma pesquisa realizada pelo Instituto Gallup constatou que 500 estudantes entrevistados com menos de 18 anos, 50% acreditam na possibilidade de se verificar uma modificao na Amrica, e que dos 100 estudantes com mais de 24 anos, 69% acreditam nessa modificao. Construir um intervalo de confiana para a diferena entre as propores destas subpopulaes usando =5%. R=(LI=0,0893, LS=0,2905) 8.3 Exerccios 1) Ao se realizar uma contagem de eritrcitos em 144 mulheres encontrou-se em mdia 5,35 milhes e desvio padro 0,4413 milhes de glbulos vermelhos. Determine os limites de confiana de 99% para a mdia populacional. 2) Um conjunto de 12 animais de experincia receberam uma dieta especial durante 3 semanas e produziram os seguintes aumentos de peso (g): 30, 22, 32, 26, 24, 40, 34, 36, 32, 33, 28 e 30. Determine um intervalo de 90% de confiana para a mdia. R X =30.58, S = 5.09,LI = 27.942, LS = 33.218 3) Construa um intervalo de 95 % de confiana para um dos seguintes casos: Mdia Amostral 16,0 37,5 2,1 0,6 2,0 3,0 0,5 0,1 Tamanho da Amostra 16 36 25 100

a) b) c) d)

4) Numa tentativa de melhor o esquema de atendimento, um mdico procurou estimar o tempo mdio que gasta com cada paciente. Uma amostra aleatria de 49 pacientes, colhida num perodo de 3 semanas, acusou uma mdia de 30 min., com desvio padro de 7 min. Construa um intervalo de 95% de confiana para o verdadeiro tempo mdio de consulta.

108

5) Solicitou-se a 100 estudantes de um colgio que anotasse suas despesas com alimentao e bebidas no perodo de uma semana. H 500 estudantes no colgio. O resultado foi uma despesa de $40,00 com um desvio padro de $10,00. Construa um intervalo de 95% de confiana para a verdadeira mdia. 6) Uma amostra aleatria de 100 fregueses da parte da manh de um supermercado revelou que apenas 10 no incluem leite em suas compras. a) qual seria a estimativa percentual dos fregueses que compram leite pela parte da manh. ( = 5%). R LI = 84.12%, LS = 95.88% b) construir um intervalo de 90% de confiana para a verdadeira proporo dos fregueses que no compram leite pela manh. R LI = 5.08%, LS = 14.92% 7) Uma amostra aleatria de 40 homens trabalhando num grande projeto de construo revelou que 6 no estavam usando capacetes protetores. Construa um intervalo de 98% de confiana para a verdadeira proporo dos que no esto usando capacetes neste projeto. R P = 0.056, LI = 0.02, LS = 0.28 8) De 48 pessoas escolhidas aleatoriamente de uma longa fila de espera de um cinema, 25% acharam que o filme principal continha demasiada violncia. a) qual deveria ser o tamanho da fila, a partir do qual se pudesse desprezar o fator de correo finita; b) construa um intervalo de 98% de confiana para a verdadeira proporo, se h 100 pessoas na fila; c) construa um intervalo de 98% de confiana para a verdadeira proporo, se h 500 pessoas na fila. 9) Em uma fbrica, colhida uma amostra (n = 30) de certa pea, obtiveram-se as seguintes medidas para os dimetros: 10 13 14 11 13 14 11 13 14 11 13 14 12 13 14 12 13 15 12 13 15 12 13 15 13 13 16 13 13 16

a) estimar a mdia e a varincia; R 13,13 e 2,05 b) construir um intervalo de confiana para a mdia, sendo = 5%. c) construir um intervalo de 95 % de confiana para a mdia, supondo que a amostra tenha sido retirada de uma populao de 100 peas, sendo = 5%. (LI = 12.581 e LS = d) Construir um intervalo de confina para a varincia populacional, sendo = 5%. (LI= 1.3003 e LS = 3.704) 13.579) (LI = 12.536 e LS = 13.664)

10) Supondo populaes normais, contruir um intervalo de confiana para a mdia e para a varincia ao nvel de significncia de 90% para as amostras. a) b) c) 2 12 25 3 12 25 4 15 27 5 15 28 5 16 30 6 16 33 109 6 17 34 7 18 35 8 20 36 8 22 9 22 23 n = 11 n = 12 n=9

11) Sendo X uma populao tal que X ~ N(; 2 ) em que e so desconhecidos. Uma amostra de tamanho 15 forneceu os seguintes valores X i = 8, 7 , e X2i = 27,3 . Determinar um intervalo de confiana de 95% para e , supondo:X=

Xn

i

X X2i n i e S2 = n1

2

12) Dados os seguintes conjuntos de medias, determinar um intervalo de 99% de confiana para a varincia populacional e para a mdia populacional. 0.0105; 0,0193; 0,0152; 0,0229; 0,0244; 0,0190; 0,0208; 0,0253; 0,0276R

X =O.0206, LI = 0.01467, LS = 0.026653;S = 0.0053, LI = 0.00001, LS = 0.000167

13) O tempo de reao a uma injeo intravenosa em mdia de 2.1 min., com desvio padro de 0.1 min., para grupos de 20 pacientes. Construa um intervalo de confiana

110

19) Uma pequena fbrica comprou um lote de 200 pequenas peas eletrnicas de um saldo de estoque de uma grande firma. Para uma amostra aleatria de 50 peas, constatou-se que 5 eram defeituosas. Estimar a proporo de todas as peas que so defeituosas no carregamento utilizando um intervalo de confiana de 99 %. 20) Duas amostras de plantas foram cultivadas com dois fertilizantes diferentes. A primeira amostra oriunda de 200 sementes, acusou altura mdia de 10,9 cm e desvio padro 2,0 cm. A segunda amostra, de 100 sementes, acusou uma altura mdia de 10,5 cm com desvio padro de 5,0 cm. Construir um intervalo de confiana entre as alturas mdias das populaes ao nvel de 95% de confiana. 21) Uma amostra aleatria de 120 trabalhadores de uma grande fbrica leva em mdia 22,0 min. para executar determinado servio, com S2 de 4 min2. Em uma segunda fbrica, para executar a mesma tarefa, uma amostra aleatria de 120 operrios, gasta em mdia 19,0 min com S2 de 10 min2. Construir um intervalo de 99% de confiana entre as mdias das populaes. 22) Extraram-se amostras independentes de adultos brancos e pretos, que acusaram os seguintes tempos (em anos) de escolaridade. B