livro estatistica basica.pdf
Post on 28-Sep-2015
87 Views
Preview:
TRANSCRIPT
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
1
Universidade Estcio de S
Apostila de Noes de Estatstica
Marcelo Abraho de Mattos
2010
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
2
NOES DE ESTATSTICA ................................................................................. 4
1. ESTATSTICA ........................................................................................................................ 4 1.1. CONCEITO ..................................................................................................................... 4 1.2. DIVISO DA ESTATSTICA ........................................................................................... 4 1.3. POPULAO ................................................................................................................. 4 1.4. AMOSTRAGEM .............................................................................................................. 5 1.5. AMOSTRA ...................................................................................................................... 6 1.6. CENSO ........................................................................................................................... 6 1.7. FENMENOS ESTATSTICOS ..................................................................................... 6 1.8. CARACTERSTICAS ...................................................................................................... 7
2. FASES DO TRABALHO ESTATSTICO ............................................................................... 9 2.1. DEFINIO DO PROBLEMA ........................................................................................ 9 2.2. DEFINIO DOS OBJETIVOS (GERAL E ESPECFICO) ............................................ 9 2.3. PLANEJAMENTO ......................................................................................................... 10 2.4. COLETA DOS DADOS................................................................................................. 10 2.5. CRTICA DOS DADOS................................................................................................. 12 2.6. APURAO (ARMAZENAMENTO) DOS DADOS ...................................................... 12 2.7. EXPOSIO OU APRESENTAO DOS DADOS .................................................... 12 2.8. ANLISE E INTERPRETAO DOS DADOS ............................................................ 13
3. NORMAS PARA APRESENTAO TABULAR DOS DADOS ......................................... 13 3.1. INTRODUO ............................................................................................................. 13 3.2. SRIES ESTATSTICAS .............................................................................................. 13 Feijo ....................................................................................................................................... 16
4. REPRESENTAO GRFICA ........................................................................................... 17 4.1. INTRODUO ............................................................................................................. 17 4.2. REQUISITOS FUNDAMENTAIS EM UM GRFICO: .................................................. 17 4.3. GRFICOS QUANTO A FORMA: ................................................................................ 17
5. PRINCIPAIS TIPOS DE GRFICOS ................................................................................... 18 5.1. GRFICOS EM CURVAS OU EM LINHAS ................................................................. 18 5.2. GRFICOS EM COLUNAS .......................................................................................... 19 5.3. GRFICOS EM BARRAS............................................................................................. 20 5.4. GRFICO EM COLUNAS MLTIPLAS (AGRUPADAS) ............................................. 22 5.5. GRFICO EM BARRAS MLTIPLAS (AGRUPADAS) ................................................ 23 5.6. GRFICO EM SETORES............................................................................................. 24
6. DISTRIBUIO DE FREQNCIAS .................................................................................. 25 6.1. INTRODUO ............................................................................................................. 25 6.2. DISTRIBUIO DE FREQNCIA PARA DADOS AGRUPADOS ............................ 25 6.3. REPRESENTAO DOS DADOS (AMOSTRAIS OU POPULACIONAIS) ................. 26
7. ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA .............................................. 28 7.1. DETERMINAO DO NMERO DE CLASSES (K) ................................................... 28
8. TIPOS DE FREQNCIAS ................................................................................................. 30 9. DISTRIBUIES CUMULATIVAS ...................................................................................... 31
9.1. Freqncia absoluta acumulada (Fac) ......................................................................... 31 9.2. Freqncia relativa acumulada (Frac) .......................................................................... 31
10. HISTOGRAMA E POLGONO DE FREQUNCIAS ........................................................ 32 10.1. HISTOGRAMAS ....................................................................................................... 32 10.2. POLGONO DE FREQUNCIAS ............................................................................. 33
11. MEDIDAS DE POSIAO (MEDIDAS DE TENDNCIA CENTRAL) ............................... 33 11.1. Mdia aritmtica ....................................................................................................... 34
(Dados sem classes): Determinar a mdia aritmtica da Tabela 5.4 .................................... 35 (Dados com classes): Determinar a mdia aritmtica da Tabela 5.7 .................................... 35
11.2. Moda (Mo) ................................................................................................................ 37 11.3. Mediana (Md) ........................................................................................................... 40 11.4. Quartis (medidas separatrizes) ................................................................................ 42 11.5. Decis: dividem a srie em 10 partes iguais .............................................................. 43
12. Medidas de disperso (Medidas de variabilidade) ...................................................... 44 12.1. Tipos de medidas de disperso ............................................................................... 44
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
3
PRINCPIO FUNDAMENTAL DA CONTAGEM ................................................... 47 13. Permutaes ................................................................................................................... 49 14. Arranjos ........................................................................................................................... 52 15. Combinao .................................................................................................................... 52 16. Permutaes com elementos repetidos ...................................................................... 52
INTRODUO PROBABILIDADE ................................................................... 54 17. Experimentos probabilsticos ....................................................................................... 54 18. Espao Amostral ............................................................................................................ 55 19. Retirada com e sem reposio ..................................................................................... 56 20. Evento .............................................................................................................................. 56 21. Evento impossvel .......................................................................................................... 56 22. Evento Elementar ........................................................................................................... 56 23. Evento certo .................................................................................................................... 56 24. Combinao de Eventos ................................................................................................ 56 25. Probabilidade de um Evento Elementar ...................................................................... 57
PROBABILIDADE ............................................................................................... 58 26. Conceito .......................................................................................................................... 58 27. Probabilidade da Unio de Eventos (regra da adio) ............................................... 59 28. Probabilidade de No Ocorrer um Evento ................................................................... 60 29. Produto de Probabilidades (regra da multiplicao) .................................................. 61 30. Varivel Aleatria ........................................................................................................... 61 31. Valor esperado de uma varivel aleatria ................................................................... 62 32. Distribuio de probabilidade ....................................................................................... 63 33. Resumo das principais frmulas das probabilidades. ............................................... 65
DISTRIBUIES DISCRETAS ............................................................................ 66 34. Distribuio Binomial .................................................................................................... 66
34.1. Clculo das probabilidades ...................................................................................... 66 34.2. Esperana matemtica ............................................................................................. 66 34.3. Varincia ................................................................................................................... 66 34.4. Desvio padro .......................................................................................................... 67
35. Distribuio de Bernoulli ............................................................................................... 67 35.1. Clculo das probabilidades ...................................................................................... 67 35.2. Esperana matemtica ............................................................................................. 67 35.3. Varincia ................................................................................................................... 67 35.4. Desvio padro .......................................................................................................... 67
36. Distribuio de Poisson ................................................................................................ 67 36.1. Clculo das probabilidades ...................................................................................... 68 36.2. Esperana matemtica ............................................................................................. 68 36.3. Varincia ................................................................................................................... 68 36.4. Desvio padro .......................................................................................................... 68
37. Distribuio Hipergeomtrica ....................................................................................... 68 37.1. Clculo das probabilidades ...................................................................................... 69 37.2. Esperana matemtica ............................................................................................. 69 37.3. Varincia ................................................................................................................... 69 37.4. Desvio padro .......................................................................................................... 69
38. Aproximao da Binomial por Poisson ....................................................................... 69 DISTRIBUIO CONTNUA ................................................................................ 69
39. Distribuio Normal ....................................................................................................... 69 40. Aproximao da Binomial pela Normal........................................................................ 71
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
4
NOES DE ESTATSTICA
1. ESTATSTICA 1.1. CONCEITO
a cincia que se preocupa com a coleta, a organizao, descrio (apresentao), anlise e interpretao de dados experimentais e tem como objetivo fundamental o estudo de uma populao.
Este estudo pode ser feito de duas maneiras:
Investigando todos os elementos da populao.
Por amostragem, ou seja, selecionando alguns elementos da populao.
1.2. DIVISO DA ESTATSTICA
- Estatstica Descritiva: aquela que se preocupa com a coleta,
organizao, classificao, apresentao, interpretao e analise de dados referentes ao fenmeno atravs de grficos e tabelas alm de calcular medidas que permita descrever o fenmeno.
- Estatstica Indutiva (Amostral ou Inferencial): a aquela que partindo
de uma amostra, estabelece hipteses, tira concluses sobre a populao de origem e que formula previses fundamentando-se na teoria das probabilidades. A estatstica indutiva cuida da anlise e interpretao dos dados.
O processo de generalizao do mtodo indutivo est associado a uma
margem de incerteza. Isto se deve ao fato de que a concluso que se pretende obter para o conjunto de todos os indivduos analisados quanto a determinadas caractersticas comuns baseia-se em uma parcela do total de observaes.
1.3. POPULAO
CONCEITO: o conjunto, finito ou infinito, de indivduos ou objetos que
apresentam em comum determinadas caractersticas definidas, cujo comportamento interessa analisar.
A populao estudada em termos de observaes de caractersticas nos
indivduos (animados ou inanimados) que sejam relevantes para o estudo, e no em termos de pessoas ou objetos em si. O objetivo tirar concluses sobre o fenmeno em estudo, a partir dos dados observados.
Como em qualquer estudo estatstico temos em mente estudar uma ou
mais caractersticas dos elementos de uma populao, importante definir bem essas caractersticas de interesse para que sejam delimitados os elementos que pertencem populao e quais os que no pertencem.
Exemplos:
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
5
a) Estudar os filhos tidos, tipo de moradia, condies de trabalho, tipo de sanitrio, nmeros de quartos para dormir, estado civil, uso da terra, tempo de trabalho, local de nascimento, tipo de cultivo etc, dos agricultores do Estado do Par.
Populao: Todos os agricultores (proprietrios de terra ou no)
plantadores das culturas existentes no Estado do Par.
b) Estudar a precipitao pluviomtrica anual (em mm) na cidade de Belm.
Populao: Conjunto das informaes coletadas pela Estao Pluviomtrica, durante o ano.
c) As alturas dos cidados do Par constituem uma populao ou a
populao dos pesos desses cidados.
Diviso da populao - Populao Finita: apresenta um nmero limitado de elementos.
possvel enumerar todos os elementos componentes. Exemplo:
a) Idade dos universitrios do Estado do Par. Populao: Todos os universitrios do Estado do Par. - Populao Infinita: apresenta um nmero ilimitado de elementos. No
possvel enumerar todos os elementos componentes. Entretanto, tal definio existe apenas no campo terico, uma vez que, na prtica, nunca encontraremos populaes com infinitos elementos, mas sim, populaes com grande nmero de componentes; e nessas circunstncias, tais populaes so tratadas como se fossem infinitas.
Exemplos:
a) Tipos de bactrias no corpo humano Populao: Todas as bactrias existentes no corpo humano.
b) Comportamento das formigas de certa rea
Populao: Todas as formigas da rea em estudo.
1.4. AMOSTRAGEM
a coleta das informaes de parte da populao, chamada amostra
(representada por pela letra n), mediante mtodos adequados de seleo destas unidades.
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
6
1.5. AMOSTRA
uma parte (um subconjunto finito) representativa de uma populao selecionada segundo mtodos adequados.
O objetivo fazer inferncias, tirar concluses sobre populaes com
base nos resultados da amostra, para isso necessrio garantir que a amostra seja representativa, ou seja, a amostra deve conter as mesmas caractersticas bsicas da populao, no que diz respeito ao fenmeno que desejamos pesquisar.
O termo induo um processo de raciocnio em que, partindo-se do
conhecimento de uma parte, procura-se tirar concluses sobre a realidade no todo.
Ao induzirmos estamos sujeitos a erros. Entretanto, a Estatstica Indutiva,
que obtm resultados sobre populaes a partir das amostras, diz qual a preciso dos resultados e com que probabilidade se pode confiar nas concluses obtidas.
1.6. CENSO
o exame completo de toda populao. Quanto maior a amostra, mais precisa e confivel devero ser as indues
feitas sobre a populao. Logo, os resultados mais perfeitos so obtidos pelo Censo. Na prtica, esta concluso muitas vezes no acontece, pois o emprego de amostras com certo rigor tcnico, pode levar a resultados mais confiveis ou at mesmo melhores do que os que seriam obtidos atravs de um Censo.
As razes de se recorrer a amostras so: menor custo e tempo para
levantar dados; melhor investigao dos elementos observados.
1.7. FENMENOS ESTATSTICOS
Refere-se a qualquer evento que se pretende analisar cujo estudo seja possvel de aplicao de tcnicas da estatstica.
A Estatstica dedica-se ao estudo dos fenmenos de massa, que so
resultantes do concurso de um grande nmero de causas, total ou parcialmente desconhecida.
Tipos de fenmenos:
a) Fenmenos Coletivos ou de Massa No podem ser definidos por uma simples observao. Exemplos: a natalidade, a mortalidade, a nupcialidade, a idade mdia dos
agricultores do Estado do Par, o sexo dos agricultores.
b) Fenmenos Individuais Compem os fenmenos coletivos.
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
7
Exemplos: cada nascimento, cada pessoa que morre, cada agricultor
investigado.
1.8. CARACTERSTICAS preciso definir qual(is) a(s) caracterstica(s) de interesse que ser(o)
analisada(s). A caracterstica de interesse pode ser de natureza qualitativa ou quantitativa.
1.8.1. ATRIBUTOS: so todas as caractersticas de uma populao que
no podem ser medidas. Os indivduos ou objetos so colocados em categorias ou tipos e conta-se
a freqncia com que ocorrem.
Exemplos: sexo (masculino e feminino); estado civil (solteiro, casado, vivo, etc.); tipo de moradia (madeira, tijolo), situao do aluno (aprovado, reprovado), religio.
CLASSIFICAO DOS ATRIBUTOS
a) Dicotomia: quando a classe em que o atributo considerado admite apenas duas categorias.
Exemplos: Sexo (masc. e fem.); Existncia ou ausncia de certo produto
agrcola (existncia, ausncia), resposta a uma pergunta: (concorda, no concorda), (sim, no).
b) Policotomia: quando a classe em que o atributo considerado
admite mais de duas categorias.
Exemplos: Estado civil (solteiro, casado, vivo), classe social (alta, mdia ou baixa).
1.8.2. VARIVEL: o conjunto de resultados possveis de um fenmeno
(ou observao, ou caracterstica). Para os fenmenos: - sexo - dois resultados possveis: masculino e feminino; (no pode ser
medida: um atributo) - nmero de filhos tidos de um grupo de casais - resultados possveis: 0, 1,
2, 3, 4, 5, ..., n; - peso de pessoas adultas - resultados possveis: 60 kg, 59,3 kg, 75,3 kg,
65,3 kg, ...; pode tomar um infinito nmero de valores num certo intervalo.
TIPOS DE VARIVEIS
a) Varivel Qualitativa: quando seus valores so expressos por atributos ou qualidade.
Exemplos:
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
8
Populao: Estudantes universitrios do Estado do Par. Variveis: sexo, profisso, escolaridade, religio, meio onde vivem (rural,
urbano).
Populao: Populao dos bairros perifricos do municpio de Belm.
Variveis: tipo de casa, existncia de gua encanada (sim, no), bairro de
origem.
Variveis qualitativas que no so ordenveis recebem o nome de nominais.
Exemplo: religio, sexo, raa, cor.
Raa dos Paraenses - 2001
Raa Freqncia
Branca Negra Parda Outra
Total
Fonte: Fictcia
Variveis qualitativas que so ordenveis recebem o nome de ordinais. Exemplo: nvel de instruo, classe social.
Classe social dos Paraenses - 2001
Classe social Freqncia
Classe A Classe B Classe C Classe D
Total
Fonte: Fictcia
b) Varivel Quantitativa: quando seus valores so expressos por nmeros. Esses nmeros podem ser obtidos por um processo de contagem ou medio.
Exemplos:
Populao: Todos os agricultores do Estado do Par.
Variveis: nmero de filhos tidos, extenso da rea plantada, altura, idade.
Populao: Populao dos bairros perifricos do municpio de Belm.
Variveis: nmero de quartos, rea da casa em m2, nmero de moradores
da casa.
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
9
A varivel quantitativa divide-se em:
a) Varivel Discreta: so aquelas que podem assumir apenas
valores inteiros em pontos da reta real. possvel enumerar todos os possveis valores da varivel.
Exemplos:
Populao: Universitrios do Estado do Par. Variveis: nmero de filhos, nmero de quartos da casa, nmero de
moradores, nmero de irmos.
b) Varivel Contnua: so aquelas que podem assumir qualquer valor num certo intervalo (contnuo) da reta real. No possvel enumerar todos os possveis valores. Essas variveis, geralmente, provm de medies.
Populao: Todos os agricultores do Estado do Par.
Variveis: idade, renda familiar, extenso da rea plantada (em m2) , peso e altura das crianas agricultoras.
2. FASES DO TRABALHO ESTATSTICO
2.1. DEFINIO DO PROBLEMA
A primeira fase do trabalho estatstico consiste em uma definio ou formulao correta do problema a ser estudado e a seguir escolher a natureza dos dados. Alm de considerar detidamente o problema objeto de estudo o analista dever examinar outros levantamentos realizados no mesmo campo e anlogos, uma vez que parte da informao de que necessita pode, muitas vezes, ser encontrada nesses ltimos. Saber exatamente aquilo que pretende pesquisar o mesmo que definir de maneira correta o problema.
Por exemplo:
a) os preos dos produtos agrcolas produzidos no Estado do Par so menores do que aqueles originados de outros Estados?
b) qual a natureza e o grau de relao que existe entre a distribuio da pluviosidade e a colheita do produto x?
c) estudar uma populao por sexo: dividi-se os dois grupos em masculino e feminino;
2.2. DEFINIO DOS OBJETIVOS (GERAL E ESPECFICO)
definir com exatido o que ser pesquisado. recomendvel ter em vista um objetivo para o estudo, em lugar de coletar o
material e defini-lo no decorrer do trabalho ou s no fim deste.
OBJETIVOS MAIS COMUNS EM UMA PESQUISA:
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
10
Dados pessoais: grau de instruo, religio, nacionalidade, dados profissionais, familiares, econmicos, etc.
Dados sobre comportamento: como se comportam segundo
certas circunstncias. Ex: possvel remanejamento da rea habitada.
Opinies, expectativas, nveis de informao, angstias,
esperanas, aspiraes sobre certos assuntos.
Dados sobre as condies habitacionais e de saneamento que avalie as condies em que vivem e a qualidade de vida de certo grupo.
2.3. PLANEJAMENTO
O problema est definido. Como resolv-lo? Se atravs de amostra, esta
deve ser significativa para que represente a populao. O planejamento consiste em se determinar o procedimento necessrio
para resolver o problema e, em especial, como levantar informaes sobre o assunto objeto de estudo. Quais dados devero ser coletados? Como se deve obt-los? preciso planejar o trabalho a ser realizado tendo em vista o objetivo que se pretende atingir.
nesta fase que ser escolhido o tipo de levantamento a ser utilizado, que
podem ser: a) levantamento censitrio, quando a contagem for completa, abrangendo
todo o universo; b) levantamento por amostragem, quando a contagem for parcial. Outros elementos importantes que devem ser tratados nessa fase so o
cronograma das atividades, atravs do qual so fixados os prazos para as vrias fases, os custos envolvidos, o exame das informaes disponveis, o delineamento da amostra, a forma como sero coletados os dados, os setores ou reas de investigao, o grau de preciso exigido e outros.
2.4. COLETA DOS DADOS
Refere-se obteno, reunio e registro sistemtico de dados, com o
objetivo determinado. A escolha da fonte de obteno dos dados est diretamente relacionada
ao tipo do problema, objetivos do trabalho, escala de atuao e disponibilidade de tempo e recursos.
a) Fontes primrias: o levantamento direto no campo atravs de
mensuraes diretas ou de entrevistas ou questionrios aplicados a sujeitos de interesse para a pesquisa.
Vantagens: grau de detalhamento com respeito ao interesse dos quesitos
levantados; maior preciso das informaes obtidas.
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
11
b) Fontes secundrias: quando so publicados ou registrados por outra
organizao. A coleta de dados secundrios se realiza atravs de documentos
cartogrficos (mapas, cartas, imagens e fotografias obtidas por sensoriamento remoto ou por fotogrametria e imagens de radar). Estas fontes de informao so de extrema importncia.
Das fotografias areas em escalas reduzidas ou mais detalhadas, das
imagens de radar ou satlite e de cartas obtm-se informaes quanto ao uso do solo, drenagem, estruturas virias e urbanas, povoamento rural, recursos florsticos, minerais e pedolgicos, estrutura fundiria e de servios, dados altimtricos, etc.
Vantagens: inclui um processo de reduo e agregao de informaes. A coleta dos dados pode ser feita de forma direta ou indireta.
COLETA DIRETA A coleta dita direta quando so obtidos diretamente da fonte primria,
como os levantamentos de campo atravs de questionrios.
H trs tipos de coleta direta:
a) a coleta contnua quando os dados so obtidos ininterruptamente, automaticamente e na vigncia de um determinado perodo: um ano, por exemplo. o caso dos registros de casamentos, bitos e nascimentos, escrita comercial, as construes civis.
b) a coleta dos dados peridica quando feita em intervalos constantes de
tempo, como o recenseamento demogrfico a cada dez anos e o censo industrial, anualmente.
c) a coleta dos dados ocasional quando os dados forem colhidos
esporadicamente, atendendo a uma conjuntura qualquer ou a uma emergncia, como por exemplo, um surto epidmico.
COLETA INDIRETA A coleta dita indireta quando inferida a partir dos elementos
conseguidos pela coleta direta, ou atravs do conhecimento de outros fenmenos que, de algum modo, estejam relacionados com o fenmeno em questo.
Um instrumento por meio do qual se faz a coleta das unidades estatsticas
o questionrio. Deve ficar bem claro no questionrio que ele organizado de acordo com dispositivos legais, que h sanses e que o sigilo sobre as informaes individuais ser absoluto.
aconselhvel que um pequeno percentual dos exemplares do
questionrio seja tirado e aplicado a uma parcela de informantes, a fim de testar a aceitao do mesmo, constituindo tal iniciativa, a pesquisa piloto. A boa aceitao
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
12
dos questionrios determinar a tiragem completa dos exemplares ou a sua alterao.
2.5. CRTICA DOS DADOS
A crtica dos dados deve ser feita com cuidado atravs de um trabalho de
reviso e correo, ao qual chamamos de crtica (consistncia), a fim de no de incorrer em erros que possam afetar de maneira sensvel os resultados.
As perguntas dos questionrios uniformemente mal compreendidas, os
enganos evidentes, tais como somas erradas, omisses, trocas de respostas e etc, so fceis de corrigir. necessrio, entretanto, que o crtico no faa a correo pr simples suposio sua, mas sim que tenha chegado a concluso absoluta do engano.
As informaes relativas profisso no devem ser vagas como, pr exemplo:
operrio, mas sim, oleiro, pedreiro, carpinteiro, etc., conforme o caso. O estado civil ser declarado: solteiro, casado, vivo ou desquitado. Em resumo, os dados devem sofrer uma crtica criteriosa com o objetivo de
afastar os erros to comuns nessa natureza de trabalho. As informaes inexatas ou omissas devem ser corrigidas. Os questionrios devem voltar a fonte de origem sempre que se fizerem necessrio sua correo ou complementao.
2.6. APURAO (ARMAZENAMENTO) DOS DADOS
um processo de apurao ou sumarizao que consiste em resumir os
dados atravs de sua contagem ou agrupamento. um trabalho de condensao e de tabulao dos dados, que chegam ao analista de forma desorganizada.
Atravs da apurao, tem-se a oportunidade de condensar os dados, de modo
a obter um conjunto compacto de nmeros, o qual possibilita distinguir melhor o comportamento do fenmeno na sua totalidade.
Os dados de fenmenos geogrficos podem ser organizados em mapas,
tabelas, matrizes, disquetes ou fitas.
2.7. EXPOSIO OU APRESENTAO DOS DADOS
H duas formas de apresentao que no se excluem mutuamente:
Apresentao Tabular uma apresentao numrica dos dados. Consiste em dispor os dados em
linhas e colunas distribudos de modo ordenado, segundo algumas regras prticas adotadas pelo Conselho Nacional de Estatstica. As tabelas tm a vantagem de conseguir expor, sistematicamente em um s local, os resultados sobre determinado assunto, de modo a se obter uma viso global mais rpida daquilo que se pretende analisar.
Apresentao Grfica Constitui uma apresentao geomtrica dos dados. Permite ao analista obter
uma viso to rpida, fcil e clara do fenmeno e sua variao.
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
13
2.8. ANLISE E INTERPRETAO DOS DADOS
Nessa etapa, o interesse maior consiste em tirar concluses que auxiliem o
pesquisador a resolver seu problema. A anlise dos dados estatsticos est ligada essencialmente ao clculo de medidas, cuja finalidade principal descrever o fenmeno. Assim, o conjunto de dados a ser analisado pode ser expresso pr nmero-resumo, as estatsticas, que evidenciam caractersticas particulares desse conjunto.
3. NORMAS PARA APRESENTAO TABULAR DOS DADOS
3.1. INTRODUO
A apresentao tabular uma apresentao numrica dos dados. Consiste em dispor os dados em linhas e colunas distribudos de modo ordenado, segundo algumas regras prticas ditadas pelo Conselho /nacional de Estatstica e pelo IBGE. Tais regras acham-se publicadas e dispem sobre os elementos essenciais e complementares da tabela, a especificao dos dados e dos sinais convencionais, o procedimento correto a ser desenvolvido no preenchimento da tabela e outros dispositivos importantes.
As tabelas tm a vantagem de conseguir expor, sinteticamente e em um s
local, os resultados sobre determinado assunto, de modo a se obter uma viso global mais rpida daquilo que se pretende analisar.
Reunindo, pois os valores em tabelas compactas, consegue-se apresent-los
e descrever-lhes a variao mais eficientemente. Essa condensao de valores permite ainda a utilizao de representao grfica, que normalmente uma forma mais til e elegante de apresentao da caracterstica analisada.
3.2. SRIES ESTATSTICAS
Um dos objetivos da Estatstica sintetizar os valores que uma ou mais
variveis podem assumir, para que se tenha uma viso global dessa ou dessas variveis. Isto possvel apresentando esses valores em tabelas e grficos que fornecero rpidas e seguras informaes a respeito das variveis em estudo, permitindo determinaes mais coerentes.
TABELA um quadro que resume um conjunto de observaes. Como construir uma tabela que fornea informaes de forma precisa e
correta: 1 passo: Comear pelo ttulo, que explica o contedo da tabela. 2 passo: Fazer o corpo da tabela, composto pelos nmeros e informaes
que ela contm. formada por linhas e colunas. Para compor o corpo da tabela, necessrio:
O cabealho, que indica o que a coluna contm. Deve estar entre traos horizontais, para melhor visualizao.
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
14
A coluna indicadora, que diz o que a linha contm. 3 passo: Escrever o total (as tabelas podem apresentar um total ou no).
Aparece entre traos horizontais. 4 passo: Coloque a fonte. Deve entrar no rodap, sendo obrigatria. Uma tabela compe-se de: Tabela 3.1 Produo de Caf Brasil - 1978-1983
Anos Quantidade (1000 ton)
1978 (1) 2535 1979 2666 1980 2122 1981 3760 1982 2007 1983 2500
Fonte: Fictcia Nota: Produo destinada para o consumo interno. (1) Parte exportada para a Argentina.
Rodap: fonte, chamadas e notas.
Notas: usada para conceituao ou esclarecimento em geral.
Chamadas: usada para esclarecer certas mincias em relao a casas, linhas e colunas.
De acordo com a Resoluo 886 da Fundao IBGE, nas casas ou clulas,
devemos colocar:
Um trao horizontal (___) quando o valor zero, no s quanto a natureza das coisas, como quanto ao resultado do inqurito;
Trs pontos (...) quando no temos os dados;
Um ponto de interrogao (?) quando temos dvida quanto a exatido de determinado valor;
Zero (0) quando o valor muito pequeno para ser expresso pela unidade utilizada. Se os valores so expressos em numerais decimais, precisamos acrescentar a parte decimal um nmero correspondente de zeros (0,0; 0,00; 0,00;...).
Denomina-se SRIE ESTATSTICA toda tabela que apresenta a distribuio
de um conjunto de dados estatsticos em funo da POCA, do LOCAL, ou da ESPCIE (fenmeno).
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
15
Numa srie estatstica observa-se a existncia de trs elementos ou fatores: o TEMPO, o ESPAO e a ESPCIE.
Conforme varie um desses elementos, a srie estatstica classifica-se em
TEMPORAL, GEOGRFICA e ESPECFICA.
3.2.1. SRIE TEMPORAL, HISTRICA OU CRONOLGICA.
a srie cujos dados esto em correspondncia com o tempo, ou seja, variam com o tempo.
Tabela 3.2 Produo Brasileira de Trigo 1988-1993
Anos Quantidade (1000 ton)
1988 (1) 2345 1989 2451 1990 2501 1991 2204 1992 2306 1993 2560
Fonte: IBGE Nota: Produo voltada para o consumo interno. (1) Parte da produo exportada.
Elemento varivel: tempo (fator cronolgico) Elemento fixo: local e o fato
3.2.2. SRIE GEOGRFICA, TERRITORIAL OU DE LOCALIDADE.
a srie cujos dados esto em correspondncia com a regio geogrfica, ou
seja, o elemento varivel o fator geogrfico (a regio).
Tabela 3.3 Produo Brasileira de Trigo, por Unidade da Federao - 1994.
Unidades da Federao Quantidade (1000 ton)
So Paulo 670 Santa Catarina 451 Paran 550 Gois 420 Rio de Janeiro 306 Rio Grande do Sul 560
Fonte: Fictcia Elemento varivel: localidade (fator geogrfico) Elemento fixo: tempo e o fato
3.2.3. SRIE ESPECFICA OU CATEGRICA
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
16
a srie cujos dados esto em correspondncia com a espcie, ou seja,
variam com o fenmeno. Tabela 3.4 Rebanhos Brasileiros
Espcie Quantidade
(1000 cabeas)
Bovinos 140 000 Sunos 1 181 Bubalinos 5 491 Coelhos 11 200
Fonte: IBGE
Elemento varivel: fenmeno (espcie) Elemento fixo: local e o tempo
3.2.4. SRIES MISTAS
As combinaes entre as sries anteriores constituem novas sries que so denominadas sries compostas ou mistas e so apresentadas em tabelas de dupla entrada.
Tabela 3.5 Exportao Brasileira de alguns produtos agrcolas - 1990 - 1992
Produto Quantidade (1000 ton)
1990 1991 1992
Feijo 5600 6200 7300 Arroz 8600 9600 10210 Soja 4000 5000 6000
Fonte: Ministrio da Agricultura Nota: Produtos mais exportados no perodo.
Este exemplo se constitui numa Srie Temporal-Especfica Elemento varivel: tempo e a espcie Elemento fixo: local
Obs: uma tabela nem sempre representa uma srie estatstica, pode ser um aglomerado de informaes teis sobre certo assunto.
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
17
Tabela 3.6 Situao dos espetculos cinematogrficos no Brasil - 1967
Especificao Quantidade
Nmero de cinemas 2.488 Lotao dos cinemas 1.722.348 Sesses pr dia 3.933 Filme de longa metragem 131.330.488 Meia entrada 89.581.234
Fonte: Anurio Estatstico do Brasil - IBGE
OBS:
SRIE HOMGRADA
A Srie homgrada aquela em que a varivel descrita apresenta variao discreta ou descontnua. So sries homgradas as sries temporal, a geogrfica e a especfica.
SRIE HETERGRADA A srie hetergrada aquela na qual o fenmeno ou fato apresenta gradaes
ou subdivises. Embora fixo, o fenmeno varia em intensidade. A distribuio de freqncias ou seriao uma srie hetergrada.
4. REPRESENTAO GRFICA
4.1. INTRODUO
A Estatstica Descritiva pode descrever os dados atravs de grficos. A apresentao grfica um complemento importante da apresentao
tabular. A vantagem de um grfico sobre a tabela est em possibilitar uma rpida impresso visual da distribuio dos valores ou das freqncias observadas. Os grficos propiciam uma idia inicial mais satisfatria da concentrao e disperso dos valores, uma vez que atravs deles os dados estatsticos se apresentam em termos de grandezas visualmente interpretveis.
4.2. REQUISITOS FUNDAMENTAIS EM UM GRFICO:
o Simplicidade: possibilitar a anlise rpida do fenmeno observado. Deve
conter apenas o essencial. o Clareza: possibilitar a leitura e interpretaes correta dos valores do
fenmeno. o Veracidade: deve expressar a verdade sobre o fenmeno observado.
4.3. GRFICOS QUANTO A FORMA:
o Diagramas: grficos geomtricos dispostos em duas dimenses. So mais
usados na representao de sries estatsticas. o Cartogramas: a representao sobre uma carta geogrfica, sendo muito
usado na Geografia, Histria e Demografia.
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
18
o Estereogramas: representam volumes e so apresentados em trs dimenses.
o Pictogramas: a representao grfica consta de figuras representativas do
fenmeno. Desperta logo a ateno do pblico.
5. PRINCIPAIS TIPOS DE GRFICOS
5.1. GRFICOS EM CURVAS OU EM LINHAS
So usados para representar sries temporais, principalmente quando a srie cobrir um grande nmero de perodos de tempo.
Considere a srie temporal:
Tabela 4.1 Produo de Arroz do Municpio X - 1984-1994
Anos Quantidade (1000 ton)
1984 816 1985 904 1986 1.203 1987 1.147 1988 1.239 1989 1.565 1990 1.620 1991 1.833 1992 1.910 1993 1.890 1994 1.903
Fonte: Fictcia
Grfico 4.1. Produo de Arroz do Municpio X - 1984-1994
0
500
1000
1500
2000
2500
84 85 86 87 88 89 90 91 92 93 94
(1000 ton)
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
19
5.2. GRFICOS EM COLUNAS
a representao de uma srie estatstica atravs de retngulos, dispostos
em colunas (na vertical) ou em retngulos (na horizontal). Este tipo de grfico representa praticamente qualquer srie estatstica.
As regras para a construo so as mesmas do grfico em curvas. As bases das colunas so iguais e as alturas so proporcionais aos
respectivos dados. Exemplo: Tabela 4.2
Produo de Soja do Municpio X - 1991-1995
Anos Quantidade
(ton.)
1991 117.579 1992 148.550 1993 175.384 1994 220.272 1995 265.626
Fonte: Secretaria Municipal de Agricultura
Para cada ano construda uma coluna, variando a altura (proporcional a cada quantidade). As colunas so separadas uma das outras.
Observao: O espao entre as colunas pode variar de 1/3 a 2/3 do tamanho
da base da coluna.
0
50000
100000
150000
200000
250000
300000
To
ne
lad
as
1991 1992 1993 1994 1995
Grfico 4.2. Produo de Soja do Municpio X - 1991-1995
Uso do grfico em colunas para representar outras sries estatsticas
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
20
Tabela 4.3 reas (Km2) das Regies Fisiogrficas - Brasil - 1966
Regies Fisiogrficas rea (Km2)
Norte 3.581.180 Nordeste 965.652 Sudeste 1.260.057 Sul 825.621 Centro-oeste 1.879.965
Brasil 8.511.965
Fonte: IBGE.
0
500.000
1.000.000
1.500.000
2.000.000
2.500.000
3.000.000
3.500.000
4.000.000Km2
Norte Nordeste Sudeste Sul Centro-Oeste
Grafico 4.3. reas (Km2) das Regies Fisiogrficas - Brasil - 1966.
Obs: Na tabela as regies so apresentadas em ordem geogrficas. No grfico as colunas so ordenadas pela altura, da maior para a menor, da esquerda para a direita.
5.3. GRFICOS EM BARRAS
As alturas dos retngulos so iguais e arbitrrias e os comprimentos so
proporcionais aos respectivos dados. As barras devem ser separadas uma das outras pelo mesmo espao de forma
que as inscries identifiquem as diferentes barras. O espao entre as barras pode ser a metade () ou dois teros(2/3) de suas larguras.
As barras devem ser colocadas em ordem de grandeza de forma decrescente
para facilitar a comparao dos valores. A categoria outros (quando existir) representada na barra inferior, mesmo que o seu comprimento exceda o de alguma outra.
Outra representao grfica da Tabela 4.3:
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
21
0
500.
000
1.00
0.00
0
1.50
0.00
0
2.00
0.00
0
2.50
0.00
0
3.00
0.00
0
3.50
0.00
0
4.00
0.00
0
Km2
Norte
Centro-Oeste
Sudeste
Nordeste
Sul
Grafico 4.4. reas (Km2) das Regies Fisiogrficas - Brasil - 1966.
Tabela 4.4
Matrcula efetiva no Ensino Superior, segundo os ramos de ensino -Brasil 1995
Ramos de ensino Matrculas
Filosofia, Cincias e Letras 44.802 Direito 36.363 Engenharia 26.603 Administrao e Economia 24.027 Medicina 17.152 Odontologia 6.794 Agricultura 4.852 Servio Social 3.121 Arquitetura e Urbanismo 2.774 Farmcia 2.619 Demais ramos 11.002
Total 180.109
Fonte: Fictcia
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
22
050
0010
000
1500
020
000
2500
030
000
3500
040
000
4500
0
Matrculas
Filosofia, Cincias e Letras
Direito
Engenharia
Administrao e Econmia
Medicina
Odontologia
Agricultura
Servio Social
Arquitetura e Urbanismo
Farmcia
Demais ramos
Grafico 4.5. Matrcula efetiva no Ensino Superior, segundo os ramos de ensino - Brasil -
1999.
OBS: Quando a varivel em estudo for qualitativa e os nomes das categorias
for extenso ou as sries forem geogrficas ou especficas prefervel o grfico em barras, devido a dificuldade em se escrever a legenda em baixo da coluna.
5.4. GRFICO EM COLUNAS MLTIPLAS (AGRUPADAS)
um tipo de grfico til para estabelecer comparaes entre as grandezas de
cada categoria dos fenmenos estudados. A modalidade de apresentao das colunas chamada de Grfico de Colunas
Remontadas. Ele proporciona economia de espaos sendo mais indicado quando a srie apresenta um nmero significativo de categorias.
Exemplo: Tabela 4.5
Entrada de migrantes em trs Estados do Brasil - 1992-1994
Nmero de migrantes
Anos
Total Estados
Amap So Paulo Paran
1992 4.526 2.291 1.626 609 1993 4.633 2.456 1.585 592 1994 4.450 2.353 1.389 708
Fonte: Fictcia
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
23
0
500
1000
1500
2000
2500Q
uan
tid
ad
e
1992 1993 1994
Grfico 4.6. Entrada de migrantes em trs Estados do Brasil
1992-1994.
Amap So Paulo Paran
5.5. GRFICO EM BARRAS MLTIPLAS (AGRUPADAS)
til quando a varivel for qualitativa ou os dizeres das categorias a serem escritos so extensos.
Exemplo: Tabela 4.6 Importao Brasileira de vinho e champanhe proveniente de vrias
origens - 1994
Pases
Importao (1.000 dlares)
Vinho Champanhe
Portugal 220 15 Itlia 175 25 Frana 230 90 Argentina 50 5 Chile 75 20 Espanha 110 16
Fonte: Fictcia
0 50 100 150 200 250
1000 dlares
Frana
Portugal
Itlia
Espanha
Chile
Argentina
Grfico 4.7. Importao Brasileira de vinho e champanhe proveniente de vrias origens -
1994.
Vinho Champanhe
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
24
5.6. GRFICO EM SETORES
a representao grfica de uma srie estatstica em um crculo de raio qualquer, pr meio de setores com ngulos centrais proporcionais s ocorrncias.
utilizado quando se pretende comparar cada valor da srie com o total.
O total da srie corresponde a 360 (total de graus de um arco de circunferncia).
O grfico em setores representa valores absolutos ou porcentagens complementares.
As sries geogrficas, especficas e as categorias em nvel nominal so mais representadas em grficos de setores, desde que no apresentem muitas parcelas (no mximo sete).
Cada parcela componente do total ser expressa em graus, calculada atravs de uma regra de trs:
Total - 360
Parte - x
Exemplo:
Tabela 4.7 Produo Agrcola do Estado A - 1995
Produtos Quantidade (t)
Caf 400.000 Acar 200.000 Milho 100.000 Feijo 20.000
Total 720.000
Fonte: Fictcia
Grfico 4.8. Produo Agrcola do Estado A - 1995.
Caf
55%Aucar
28%
Milho
14%
Feijo
3%
Outras maneiras de representar graficamente a Tabela 4.7:
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
25
0
50.000
100.000
150.000
200.000
250.000
300.000
350.000
400.000
Quantidade (t)
Caf Aucar Milho Feijo
Grfico 4.9. Produo Agrcola do Estado A - 1995.
0
50.0
00
100.
000
150.
000
200.
000
250.
000
300.
000
350.
000
400.
000
Quantidade (t)
Caf
Aucar
Milho
Feijo
Grfico 4.10. Produo Agrcola do Estado A - 1995.
6. DISTRIBUIO DE FREQNCIAS
6.1. INTRODUO
As tabelas estatsticas, geralmente, condensam informaes de fenmenos
que necessitam da coleta de grande quantidade de dados numricos. No caso das distribuies de freqncias que um tipo de srie estatstica, os dados referentes ao fenmeno objeto de estudo se repetem na maioria das vezes sugerindo a apresentao em tabela onde apaream valores distintos um dos outros.
6.2. DISTRIBUIO DE FREQNCIA PARA DADOS AGRUPADOS
a srie estatstica que condensa um conjunto de dados conforme as
freqncias ou repeties de seus valores. Os dados encontram-se dispostos em classes ou categorias junto com as freqncias correspondentes. Os elementos poca, local e fenmeno so fixos. O fenmeno apresenta-se atravs de gradaes, ou seja, os dados esto agrupados de acordo com a intensidade ou variao quantitativa gradual do fenmeno.
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
26
6.3. REPRESENTAO DOS DADOS (AMOSTRAIS OU POPULACIONAIS)
o Dados brutos: so aqueles que no foram numericamente organizados, ou seja, esto na forma com que foram coletados.
Tabela 5.1 - Nmero de filhos de um grupo de 50 casais
2 3 0 2 1 1 1 3 2 5 6 1 1 4 0 1 5 6 0 2 1 4 1 3 1 7 6 2 0 1 3 1 3 5 7 1 3 1 1 0 3 0 4 1 2 2 1 2 3 2
o Rol: a organizao dos dados brutos em ordem de grandeza crescente ou decrescente.
Tabela 5.2 - Nmero de filhos de um grupo de 50 casais
o Distribuio de freqncias: a disposio dos valores com as respectivas
freqncias. O nmero de observaes ou repeties de um valor ou de uma modalidade, em um levantamento qualquer, chamado freqncia desse valor ou dessa modalidade. Uma tabela de freqncias uma tabela onde se procura fazer corresponder os valores observados da varivel em estudo e as respectivas freqncias.
a) Distribuio de freqncias para varivel discreta
Os dados no so agrupados em classes.
Tabela 5.3 - Nmero de filhos de um grupo de 50 casais
Nmero de filhos (x i) Contagem ou tabulao
Nmero de casais (f i)
Total ( )
0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 5 5 5 6 6 6 7 7
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
27
Tabela 5.4 - Nmero de filhos de um grupo de 50 casais
Nmero de filhos (x i)
Numero de casais (f i)
Total ( )
Obs: X: representa a varivel Nmero de filhos. xi: representa os valores que a varivel assume. fi: o nmero de vezes que cada valor aparece no conjunto de dados (freqncia simples absoluta).
fi = 50 n: tamanho da amostra (ou n de elementos observados). N: tamanho da populao (ou n de elementos observados).
b) Distribuio de freqncias para varivel contnua Os dados da varivel so agrupados em classe (grupo de valores).
Dados brutos Tabela 5.5 - Taxas municipais de urbanizao (em percentual) no Estado de Alagoas - 1970
8 24 46 13 38 54 44 20 17 14 18 15 30 24 20 8 24 18 9 10 38 79 15 62 23 13 62 18 8 22 11 17 9 35 23 22 37 36 8 13 10 6 92 16 15 23 37 36 8 13 44 17 9 30 26 18 37 43 14 9 28 41 42 35 35 42 71 50 52 17 19 7 28 23 29 29 58 77 72 34 12 40 25 7 32 34 22 7 44 15 9 16 31 30
Rol Tabela 5.6 - Rol das taxas municipais de urbanizao, no Estado de Alagoas (em %) - 1970.
6 6 7 7 7 8 8 8 8 9 9 9 9 9 10 10 11 12 13 13 13 13 14 14 14 15 15 15 15 16 16 17 17 17 17 18 18 18 18 19 20 20 22 22 22 23 23 23 23 24 24 24 25 26 28 28 29 29 30 30 30 31 32 34 34 34 35 35 35 36
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
28
37 37 38 38 40 41 42 42 43 44 44 44 46 50 52 54 58 62 62 71 72 77 79 92
Distribuio de freqncias para dados agrupados em classes Tabela 5.7 - Taxas municipais de urbanizao, no Estado de Alagoas (em %) - 1970.
Taxas (em %)
Nmero de Municpios ( f i )
6 ---| 16 29 16 ---| 26 24 26 ---| 36 16 36 ---| 46 13 46 ---| 56 4 56 ---| 66 3 66 ---| 76 2 76 ---| 86 2 86 ---| 96 1
Total ( ) 94
Obs:
f i: freqncia simples absoluta.
2. f i = n = 94.
Quando a varivel, objeto de estudo for contnua, recomenda-se agrupar os valores observados em classes. Se a varivel for discreta e o nmero de valores observados for muito grande recomenda-se agrupar os dados em classes, evitando-se, com isso, grande extenso da tabela e a no interpretao dos valores de fenmeno.
7. ELEMENTOS DE UMA DISTRIBUIO DE FREQNCIA
o Amplitude total (AT): a diferena entre o maior e o menor valor observado.
o Freqncia simples absoluta (fi): o nmero de vezes que o elemento aparece na amostra, ou o nmero de elementos pertencentes a uma classe (grupo de valores).
o Classe (K): cada um dos grupos de valores do conjunto de valores observados,
ou seja, so os intervalos de variao da varivel.
7.1. DETERMINAO DO NMERO DE CLASSES (K)
importante que a distribuio conte com um nmero adequado de classes. Se o nmero de classes for excessivamente pequeno acarretar perda de detalhe e pouca informao se poder extrair da tabela. Pr outro lado, se forem utilizadas um nmero excessivo de classes, haver alguma classe com freqncia nula ou muito pequena, no atingindo o objetivo de classificao que tornar o conjunto de dados supervisionveis.
Frmula de Sturges:
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
29
K 1 + 3,3. Log n
o Intervalo de classe ou amplitude do intervalo de classe (i): o comprimento da
classe.
i A T/ K Obs: - Convm arredondar o nmero correspondente amplitude do intervalo
de classe para facilitar os clculos (arredondamento arbitrrio). - Intervalo de classe: i = l s - l i
o Limites de classes (limite inferior e limite superior): so os valores extremos de
cada classes.
Seja a classe 6 16 - limite inferior ( l i ) = 6 e limite superior ( l s ) = 16. Os valores 6 e 96, que representam, respectivamente, o limite inferior da 1
classe e o limite superior da ltima classe, so denominados tambm limite inferior e limite superior da distribuio de freqncia.
recomendvel que os limites de classes sejam representados por nmeros
inteiros. Deve-se ter o cuidado para evitar interpretaes ambguas. Por exemplo: 30 _____ 40 40 _____ 50 50 _____ 60 O correto : 30 _____ 39 40 _____ 49 50 _____ 59
Caso os valores estiveram arredondados para inteiro. Entretanto, se os valores originais estiverem com preciso at centavos:
30,00 ____ 39,99 40,00 ____ 49,99 50,00 ____ 59,99 Em virtude de ordem esttica, recomenda-se: 30 ------| 40 40 ------| 50 50 ------| 60
Limites reais Dizemos que os limites indicados em cada linha de uma tabela de distribuio
de freqncias so os limites reais quando o limite superior de cada classe coincide com o limite inferior da classe seguinte.
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
30
Veja o exemplo da Tabela 5.7, os limites so reais, cada limite superior de
uma classe coincide com o limite inferior da classe seguinte. Vale observar que o uso do smbolo ---- s possvel com os limites reais de
classe.
o Ponto mdio das classes ( x i ): o valor representativo da classe para efeito de
clculo de certas medidas. Para qualquer representao tabular basta acrescentar ao seu limite inferior a metade da amplitude do intervalo de classe.
x i = i / 2 + l i
Exemplo: 6 16, i = 10 metade de i = 10/2 = 5 x i = 5 + 6 = 11
Quando o limite superior de uma classe for igual ao inferior da seguinte, o intervalo de classe poder ser calculado atravs da mdia aritmtica dos limites do intervalo.
Exemplo: 6 16 : x i = (6 + 16)/2 = 11
Para obter os pontos mdios das classes seguinte, basta acrescentar ao ponto mdio da classe precedente a amplitude do intervalo de classe (se for constante).
8. TIPOS DE FREQNCIAS
o Freqncia simples absoluta (f i): o nmero de repeties de um valor individual ou de uma classe de valores da varivel.
f i = n
o Freqncia simples relativa (f r): representa a proporo de observaes de um valor individual ou de uma classe em relao ao nmero total de observaes. Para calcular a freqncia relativa basta dividir a freqncia absoluta da classe ou do valor individual pelo nmero total de observaes. um valor importante para comparaes.
f r = f i / n = f i / f i
Para expressar o resultado em termos percentuais, multiplica-se o quociente obtido por 100.
f r = (f i / n). 100
A freqncia relativa o resultado de uma regra de trs simples: n ------- 100% Exemplo: 94 ------ 100% f i ------- x% 29 ------ x% x = 30,9 % Obs:
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
31
- a soma das freqncias simples relativa de uma tabela de freqncia
sempre igual a 1,00: f r = 1,00. - a soma das freqncias relativas percentuais de uma tabela de
freqncia sempre igual a 100%: f r = 100%. 9. DISTRIBUIES CUMULATIVAS
9.1. Freqncia absoluta acumulada (Fac)
a soma da freqncia simples absoluta da classe atual com a(s) da(s) classe(s) anterior(es).
9.2. Freqncia relativa acumulada (Frac)
A freqncia relativa acumulada de uma classe ou do valor individual i igual
a soma da freqncia simples relativa da classe ou do valor individual com as freqncias simples relativas das classes ou dos valores anteriores. As freqncias relativas acumuladas podem ser obtidas de duas formas:
1. Acumulando as freqncias simples relativas de acordo com a definio de
freqncias acumuladas. 2. Calculando as freqncias relativas diretamente a partir das freqncias
absolutas de acordo com a definio de freqncias relativas: F r = F i / n
Exemplos:
1 ) Considere a varivel nmero de filhos do sexo masculino de 34 famlias com 4 filhos cada uma.
0 2 3 4
0 2 3 4
1 2 3 4
1 2 3 4
1 2 3
1 2 3
1 2 3
1 2 3
2 3 3
2 3 3
Distribuio de freqncia sem classes por se tratar de uma Varivel Discreta. Tabela 1- Nmero de filhos do sexo masculino de 34 famlias com 4 filhos cada uma.
Nmero meninos
(x i)
Nmero de
famlia (f i)
fr
Fac
fr %
Frac
Frac%
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
32
0 1 2 3 4
Total ( )
2 ) Considere a estatura (em cm) de 40 alunos do Colgio B.
150 156 161 164
151 156 161 165
152 157 161 166
153 158 161 167
154 158 162 168
155 160 162 168
155 160 163 169
155 160 163 170
155 160 164 172
156 160 164 173
Distribuio de freqncias com classes por se tratar de uma Varivel Continua.
Tabela 2- Estatura (em cm) de 40 alunos do Colgio B.
Estatura (em cm)
Nmero de alunos
(f i)
fr
Fac
fr %
Frac
Frac%
150 |154 154 | 158 158 | 162 162 | 166 166 | 170
170 |174
4 9
11 8 5 3
Total ( ) 40 10. HISTOGRAMA E POLGONO DE FREQUNCIAS
10.1. HISTOGRAMAS
So grficos de superfcies utilizados para representar distribuies de freqncias com dados agrupados em classes.
O histograma composto por retngulos (denominados clulas), cada um deles representando um conjunto de valores prximos (as classes).
A largura da base de cada clula deve ser proporcional amplitude do intervalo da classe que ela representa e a rea de cada clula deve ser proporcional freqncia da mesma classe.
Se todas as classes tiverem igual amplitude, ento as alturas dos retngulos sero proporcionais s freqncias das classes que eles representam.
Considere o histograma obtido a partir da Tabela 2:
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
33
Tabela 2 - Taxas municipais de urbanizao, no Estado de Alagoas (em %) - 1970.
Taxas (em %)
Nmero de Municpios (f i)
Percentual
6 ---| 16 29 30,9 16 ---| 26 24 25,5 26 ---| 36 16 17,0 36 ---| 46 13 13,8 46 ---| 56 4 4,3 56 ---| 66 3 3,2 66 ---| 76 2 2,1 76 ---| 86 2 2,1 86 ---| 96 1 1,1
Total ( ) 94 100,0
10.2. POLGONO DE FREQUNCIAS
O polgono de freqncias o grfico que obtemos unindo pontos dos lados superiores dos retngulos de um histograma por meio de segmentos de reta consecutivos.
Na Tabela 5.7, temos: Tabela 5.7 - Taxas municipais de urbanizao, no Estado de Alagoas (em %) - 1970.
Taxas (em %)
Nmero de Municpios (f i)
Percentual
6 ---| 16 29 30,9
16 ---| 26 24 25,5
26 ---| 36 16 17,0
36 ---| 46 13 13,8
46 ---| 56 4 4,3
56 ---| 66 3 3,2
66 ---| 76 2 2,1
76 ---| 86 2 2,1
86 ---| 96 1 1,1
Total ( ) 94 100,0
11. MEDIDAS DE POSIAO (MEDIDAS DE TENDNCIA CENTRAL)
As distribuies de freqncias para variveis discretas e contnuas descrevem os grupos que uma varivel pode assumir. possvel visualizar a concentrao de valores de uma distribuio de freqncias. Localizam-se no incio, no meio ou no final, ou se distribuem de forma igual.
As medidas de posio so nmeros que resumem e representam caractersticas importantes da distribuio de freqncias e podem apresentar-se de vrias formas, dependendo daquilo que se pretende conhecer a respeito dos dados.
As medidas de posio so chamadas de medidas de tendncia central, devido tendncia de os dados observados se concentrarem em torno desses valores centrais que se localizam em torno do meio ou centro de uma distribuio.
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
34
As medidas (nmero-resumo) mais usadas para representar um conjunto de
dados so a mdia, a moda e a mediana.
11.1. Mdia aritmtica
Para dados no-agrupados (ou dados simples)
Seja X uma varivel que assume os valores x1, x2, x3 ,..., xn. A mdia aritmtica simples de X, representada por x, definida por:
x1 + x2 + x3 + ... + xn xi x = ------------------------------- ou x = ------- n n
xi : so os valores que a varivel X assume n: nmero de elementos da amostra observada
Exemplo: A produo leiteira diria da vaca B, durante uma semana, foi de 10, 15, 14, 13, 16, 19, e 18 litros. Determinar a produo mdia da semana (a mdia aritmtica).
xi 10 + 15 + 14 + 13 + 16 + 19 + 18 x = --------- x = ---------------------------------------------- = 15 litros n 7
Para dados agrupados
Se os valores da varivel forem agrupados em uma distribuio de freqncias ser usada a mdia aritmtica dos valores x1, x2, x3 ,..., xn ponderadas pelas respectivas freqncias absolutas: f1, f2, f3 ,..., fn.
xi . i
x = ------------ , onde: n
xi : valores observados da varivel ou ponto mdio das classes
i: freqncia simples absoluta
i = n : nmero de elementos da amostra observada
A frmula acima ser usada para as distribuies de freqncias sem classes
e com classes.
Mdia aritmtica para dados agrupados sem classes (Mdia aritmtica ponderada)
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
35
(Dados sem classes): Determinar a mdia aritmtica da Tabela 5.4
Tabela 5.4 - Nmero de filhos de um grupo de 50 casais
Nmero de filhos ( xi )
Numero de casais
( fi )
xi . i
0 6 1 16 2 9 3 8 4 3 5 3 6 3 7 2
Total ( ) 50
Mdia aritmtica para dados agrupados com classes intervalares
(Dados com classes): Determinar a mdia aritmtica da Tabela 5.7
Tabela 5.7 - Taxas municipais de urbanizao, no Estado de Alagoas (em %) 1970.
Taxas (em %)
Nmero de Municpios
( fi )
xi
xi . i
6 ---| 16 29 16 ---| 26 24 26 ---| 36 16 36 ---| 46 13 46 ---| 56 4 56 ---| 66 3 66 ---| 76 2 76 ---| 86 2 86 ---| 96 1
Total ( ) 94
xi . i
x = ------------ = ---------- x = n
Propriedades da mdia aritmtica 1 propriedade
A soma algbrica dos desvios em relao mdia zero (nula).
di = (xi - x ) = 0
Onde: di so as distncias ou afastamentos da mdia.
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
36
Em uma distribuio simtrica ser igual a zero e tender a zero se a distribuio for assimtrica.
Idades ( xi ) di = xi - x
2 d1 = 2 6 = -4 4 d2 = 4 6 = -2 6 d3 = 6 6 = 0 8 d4 = 8 6 = +2 10 d5 = 10 6 = +4
0
2 propriedade
Somando-se ou subtraindo-se uma constante (c) a todos os valores de uma varivel, a mdia do conjunto fica aumentada ou diminuda dessa constante.
Somar o valor 2 aos dados da tabela e calcular a nova mdia
Idades ( xi ) xi + 2
2 2 + 2 = 4 4 4 + 2 = 6 6 6 + 2 = 8 8 8 + 2 = 10
10 10 + 2 = 12
40
A nova mdia ser: 40
x = ------ = 8. No caso, a mdia aritmtica anterior ficou aumentada de 2. 5
3 propriedade
Multiplicando-se ou dividindo-se todos os valores de uma varivel por uma constante (c), a mdia do conjunto fica multiplicada ou dividida por essa constante:
Multiplicar o valor 2 aos dados da tabela e calcular a nova mdia
Idades ( xi ) xi x 2
2 2 x 2 = 4 4 4 x 2 = 8 6 6 x 2 = 12 8 8 x 2 = 16
10 10 x 2 = 20
60
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
37
A nova mdia ser: 60
x = ------ = 12. No caso, a mdia aritmtica anterior ficou multiplicada por 2. 5
4 propriedade
A soma dos quadrados dos afastamentos contados a partir da mdia aritmtica um mnimo.
Idades ( xi ) di = (xi x) di2 = (xi x)
2
2 d1 = 2 6 = -4 ( 4)2 = 16
4 d2 = 4 6 = -2 ( 2)2 = 4
6 d3 = 6 6 = 0 ( 0)2 = 0
8 d4 = 8 6 = +2 ( +2)2 = 4
10 d5 = 10 6 = +4 ( +4)2 = 16
0 40
De modo que: (xi x)2 = 40 sendo este valor o menor possvel. Isso significa que, se tomssemos outro valor que no a mdia (x), o resultado dessa operao seria maior que o obtido.
5 propriedade
A mdia aritmtica atrada pelos valores extremos. Considere os valores originais:
xi : 2, 4, 6, 8, 10 x = 6 Se o primeiro valor xi for alterado para 0:
xi : 0, 4, 6, 8, 10 x = 5,6 Se o ltimo valor xi for alterado para 12:
xi : 2, 4, 6, 8, 12 x = 6,4
11.2. Moda (Mo)
Tambm chamada de norma, valor dominante ou valor tpico. Defini-se a moda como o valor que ocorre com maior freqncia em conjunto de dados.
Exemplo: Se o salrio modal dos empregados de uma empresa igual a mil reais, este o salrio recebido pela maioria dos empregados dessa empresa.
A moda utilizada freqentemente quando os dados esto registrados na escala nominal.
Exemplo:
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
38
Sexo dos alunos Turma A Escola Z Sexo Freqncia
Masculino 40 Feminino 60
Total 100
A moda sexo feminino porque tem maior freqncia.
Para dados no agrupados
Primeiramente os dados devem ser ordenados para , em seguida, observar o valor que tem maior freqncia.
Exemplo: Calcular a moda dos seguintes conjuntos de dados:
1. X = (4, 5, 5, 6, 6, 6, 7, 7, 8, 8) Mo = 6 (0 valor mais freqente) Esse conjunto unimodal, pois apresenta apenas uma moda.
2. Y = (1, 2, 2, 2, 3, 4, 4, 4, 5, 5, 6) Mo = 2 e Mo = 4 (valores mais freqentes)
Esse conjunto bimodal, pois apresenta duas modas.
3. Z = (1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5) Mo = 2, Mo = 3 e Mo = 4 (valores mais freqentes)
Esse conjunto plurimodal, pois apresenta mais de duas modas.
4. W = (1, 2, 3, 4, 5, 6) Esse conjunto amodal porque no apresenta um valor predominante.
Para dados agrupados sem classes
Basta observar, na tabela, o valor que apresenta maior freqncia. 1) Clculo da moda pelo ROL
Na Tabela 5.2, o resultado 1 aparece mais vezes Mo =1. Tabela 5.2 - Nmero de filhos de um grupo de 50 casais
0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 4 4 4 5 5 5 6 6 6 7 7
2) Clculo da moda pela distribuio de freqncias sem classes
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
39
Tabela 5.4 - Nmero de filhos de um grupo de 50 casais
Nmero de filhos ( xi )
Numero de casais
( fi )
O valor 1 apresenta a maior freqncia. Mo = 1 Esse resultado indica que casais com um filho foi o resultado mais observado.
0 6
1 16
2 9
3 8
4 3
5 3
6 3
7 2
Total ( ) 50
Para dados agrupados em classes
Tabela 5.7 Taxas municipais de urbanizao (em %) Alagoas, 1970. Taxas (em %)
Nmero de Municpios
( fi )
6 --- 16 29 24 16 13 4 3 2 2 1
16 --- 26 26 --- 36 36 --- 46 46 --- 56 56 --- 66 66 --- 76 76 --- 86 86 --- 96
Total ( ) 94
D1
Frmula de Czuber: Mo = LMo + -------------- x h D1 + D2
Sendo: LMo : limite inferior da classe h: intervalo da classe modal
D1: freqncia simples da classe modal freqncia simples anterior da classe modal
D2: freqncia simples da classe modal freqncia simples posterior da classe modal
Na Tabela 5.7, temos: 29 LMo = 6 Mo = 6 + ------------- x 10 = 14,5% h = 10 29 + 5
D1 = 29 0 = 29
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
40
D2 = 29 24 = 5 A taxa de urbanizao mais freqente ficou em torno de 14,5%.
11.3. Mediana (Md) uma medida de posio cujo nmero divide um conjunto de dados em duas
partes iguais. Por esse motivo, a mediana considerada uma medida separatriz. Portanto, a mediana se localiza no centro de um conjunto de nmeros ordenados segundo uma ordem de grandeza.
Para dados no agrupados
a) O nmero de valores observados impar Exemplo: Considere o conjunto de dados: X = (5, 2, 7, 10, 3, 4, 1) 1) Colocar os valores em ordem crescente ou decrescente: X = (1, 2, 3, 4, 5, 7, 10) 2) Determinar a ordem ou posio (P) da Mediana por n + 1 P = ------- , quando n (n de elementos) for mpar 2 7 + 1 P = ------- = 4 posio. O nmero que se encontra na 2 4 posio o nmero 4. Md = 4
b) O nmero de valores observados par Exemplo: Considere o conjunto de dados: X = (4, 3, 9, 8, 7, 2, 10, 6) 1) Colocar os valores em ordem crescente ou decrescente: X = (2, 3, 4, 6, 7, 8, 9, 10) 2) Determinar a ordem ou posio (P) da Mediana por n n P = ---- e P = ---- + 1 2 2 8 8 P = ---- = 4 posio e P = ---- + 1 = 5 posio 2 2 Os nmeros so 6 (4 posio) e 7 (5 posio). Tira-se a mdia aritmtica entre os dois nmeros. 6 + 7 Md = ----------- = 6,5 2
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
41
Para dados agrupados sem classes
Tabela 5.4 - Nmero de filhos de um grupo de 50 casais
Nmero de filhos ( xi )
Numero de casais
( fi )
Fac
0 6 6 1 16 22 2 9 31 3 8 39 4 3 42 5 3 45 6 3 48 7 2 50
Total ( ) 50
1) Determinar a posio da mediana por: n n P = ---- e P = ---- + 1 , pois n par 2 2 50 50 P = ----- = 25 posio e P = ----- + 1 = 26 posio 2 2 2) Pela Fi (freq. abs. Acum. abaixo de) verifica-se que o 31 contm o 25 e 26 elemento 2 +2 25 corresponde ao n 2 Md = -------- = 2 26 corresponde ao n 2 2 O n 2 deixa 50% dos valores, ou seja, o elemento central.
Para dados agrupados em classes
Tabela 5.7 - Taxas municipais de urbanizao (em %) Alagoas, 1970.
Taxas (em %)
Nmero de Municpios
( fi ) Fac
6 --- 16 29 29 16 --- 26 24 53 26 --- 36 16 69 36 --- 46 13 82 46 --- 56 4 86 56 --- 66 3 89 66 --- 76 2 91 76 --- 86 2 93 86 --- 96 1 94
Total ( ) 94
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
42
n 94 1) Calcular a posio: P = ---- = ---- = 47 posio 2 2 (no importa de n for mpar ou par)
2) Pela Fi identifica-se a classe que contm a Md: O n 47 est dentro de 53. Portanto, a classe da Md a 2: 16 --- 26. 3) Aplica-se a frmula: Md = LMd + (n/2 Fa) fMd x h onde, * LMd = limite inferior da classe da Md = 16
* n = tamanho da amostra ou n de elementos
n/2 = 94/2 = 47 * Fa = frequncia acumulada anterior classe da Md = 29 * h = intervalo da classe da Md = 10 * fMd = frequncia simples da classe da Md = 24
47 29 Md = 16 + ------------- x 10 = 23,5% 24 50% das taxas de urbanizao esto antes taxa 23,5%.
11.4. Quartis (medidas separatrizes)
Dividem um conjunto de dados em quatro partes iguais.
Q1 = 1 quartil, deixa 25% dos elementos. n 1) Calcular a posio: P = ---- (seja n mpar ou par) 4
2) Pela Fi identifica-se a classe que contm o Q1 3) Aplica-se a frmula: n/4 Faca Q1 = LQ1 + -------------- x h f Q1
sendo * LQ1 = limite inferior da classe do Q1 * n = tamanho da amostra ou n de elementos * Faca = frequncia acum. anterior classe do Q1 * h = intervalo da classe do Q1 * f Q1 = frequncia simples da classe do Q1
Q3 = 3 quartil, deixa 75% dos elementos. 3 n 1) Calcular a posio: P = ----- (seja n mpar ou par) 4
2) Pela Fi identifica-se a classe que contm do Q3 3) Aplica-se a frmula:
3n/4 Faca Q3 = LQ3 + -------------- x h f Q3
sendo * LQ3 = limite inferior da classe do Q3 * n = tamanho da amostra ou n de elementos * Faca = frequncia acum. anterior classe do Q3 * h = intervalo da classe do Q3 * f Q3 = frequncia simples da classe do Q3
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
43
Q2 = 2 quartil, igual a mediana, deixa 50% dos elementos
11.5. Decis: dividem a srie em 10 partes iguais in 1) Calcular a posio: P = ---- (seja n mpar ou par), 10 em que i = 1, 2, 3, 4, 5, 6, 7, 8 e 9
2) Pela Fi identifica-se a classe que contm o Di 3) Aplica-se a frmula:
in/10 Faca Di = L Di + ---------------- x h f Di
sendo * LDi = limite inferior da classe Di , i = 1, 2, 3, ..., 9 * n = tamanho da amostra ou n de elementos * Faca = frequncia acum. anterior classe do Di * h = intervalo da classe do Di * f Di = frequncia simples da classe do Di 11.6. Percentis: dividem a srie em 100 partes iguais in 1) Calcular a posio: P = ----- (seja n mpar ou par), 100 em que i = 1, 2, 3, ..., 98, 99
2) Pela Fi identifica-se a classe que contm o Pi 3) Aplica-se a frmula:
in/100 Faca Pi = L Pi + ----------------- x h f Pi
sendo * LPi = limite inferior da classe Pi , i = 1, 2, 3, ..., 99 * n = tamanho da amostra ou n de elementos * Faca = freqncia acum. anterior classe do Pi * h = intervalo da classe do Pi * f Pi = freqncia simples da classe do Pi
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
44
12. Medidas de disperso (Medidas de variabilidade)
So medidas utilizadas para medir o grau de variabilidade, ou disperso dos valores observados em torno da mdia aritmtica. Servem para medir a representatividade da mdia e proporcionam conhecer o nvel de homogeneidade ou heterogeneidade dentro de cada grupo analisado.
Considere a seguinte situao: Um empresrio deseja comparar a performance de dois empregados, com
base na produo diria de determinada pea, durante cinco dias:
Empregado A: 70, 71, 69, 70, 70 x = 70.
Empregado B: 60, 80, 70, 62, 83 x = 71. A performance mdia do empregado A de 70 peas produzidas diariamente,
enquanto que a do empregado B de 71 peas. Com base na mdia aritmtica, verifica-se que a performance de B melhor do que a de A. Porm, observando bem os dados, percebe-se que a produo de A varia apenas de 69 a 71 peas, ao passo que a de B varia de 60 a 83 peas, o que revela que a performance de A bem mais uniforme do que de B.
Qual o melhor empregado?
12.1. Tipos de medidas de disperso
12.1.1. Medidas de disperso absoluta
o Amplitude total (AT): a diferena entre o maior e o menor valor observado.
AT = xmax xmin
Empregado A = 71 69 = 2
Empregado B = 83 60 = 23
o Desvio mdio (DM)
Analisa todos os desvios ou distncias em relao mdia aritmtica. O clculo dos desvios feito por:
di = (xi x) onde, di = desvio ou distncia xi = valores observados x = mdia aritmtica
A soma de todos os desvios em relao mdia aritmtica igual a zero:
di = (xi x) = 0
Clculo dos di: Para eliminar a soma zero, coloca-se os desvios em mdulo:
Empregado A d1 = 70 70 = 0 d2 = 71 70 = +1 d3 = 69 70 = 1 d4 = 70 70 = 0 d5 = 70 70 = 0
di = 0
Empregado B
d1 = 60 71 = 11 d2 = 80 71 = +9 d3 = 70 71 = 1 d4 = 62 71 = 9 d5 = 83 71 = +12
di = 0
Empregado A
d1 = 0 = 0
d2 = +1 = 1
d3 = 1 = 1
d4 = 0 = 0
d5 = 0 = 0
di = 2
Empregado B
d1 = 11 = 11
d2 = +9 = 9
d3 = 1 = 1 d4 = 9 = 9
d5 = +12 = 12
di = 42
Dessa forma, possvel calcular a mdia dos desvios por:
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
45
di xi x DM = ----------- = ---------------- n n
Empregado A
di 2 DM = ----------- = ----- = 0,4 n 5
Empregado B
di 42 DM = ----------- = ----- = 8,4 n 5
Varincia amostral (s2) usada quando o estudo feito por amostragem.
(xi x)2 s2 = ----------------
n 1
Varincia para dados agrupados sem e com classes
Varincia populacional:
(xi x)2 . fi 2 = ---------------------
N
Varincia amostral:
(xi x)2 . fi s2 = ---------------------
n 1 OBS: quando os dados forem uma amostra, usa-se o denominador n 1 na frmula da varincia, pois se obtm uma estimativa melhor do parmetro da populao. Quando a amostra for grande (n > 30) no h diferena entre usar n 1 ou n.
o Desvio-padro a raiz quadrada da varincia. Na frmula original para o clculo da varincia, observa-se que uma soma de quadrados. Por exemplo, se a unidade original for metro (m) o resultado ser metro ao quadrado (m2). Para retornar a unidade de medida original, extrai-se a raiz quadrada da varincia, passando a chamar-se de desvio-padro.
Desvio-padro populacional
= 2
Desvio-padro amostral
s = s2
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
46
12.1.2. Medida de disperso relativa
o Coeficiente de variao (CV)
uma medida relativa de disperso til para a comparao em termos relativos do grau de concentrao em torno da mdia de sries distintas.
Populao
CV = ------ x 100
x
ou
Amostra s
CV = ------ x 100 X
O coeficiente de variao expresso em porcentagem. Duas maneiras de analisar o CV:
Pequena disperso: CV 10%
Mdia disperso: 10% CV 20%
Grande disperso: CV 20%
Baixa disperso: CV 15%
Mdia disperso: 15% CV 30%
Grande disperso: CV 30%
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
47
PRINCPIO FUNDAMENTAL DA CONTAGEM
Uma pessoa mora em Nova Iguau e trabalha em Copacabana. Ela vai trabalhar
todos os dias usando apenas transporte coletivo. Esta pessoa vai Nova Iguau ao Centro do
Rio tomando nibus, van ou trem. Do Centro do Rio, pode ir a Copacabana de nibus, van
ou metr. Levando em conta apenas estas possibilidades, de quantas maneiras ela poder ir
de casa ao trabalho?
Neste caso podemos contar facilmente todas as 9 possibilidades:
{(V,V), (V,O), (V,M), (O,V), (O,O), (O,M), (T,V), (T,O), (T,M)},
onde usamos uma notao em que, por exemplo, (T, M) indica que ela toma o
primeiro percurso e, em seguida, o metr.
Em geral a soluo de problemas deste tipo se baseia no princpio multiplicativo,
tambm chamado de princpio fundamental da contagem.
Suponha que existam N1 maneiras de se realizar uma tarefa T1 e N2 maneiras de se
realizar uma tarefa T2. Ento h N1 x N2 maneiras de se realizar a tarefa T1 seguida da
tarefa T2.
Exemplo 1
Na discusso acima, T1 a tarefa de ir de Nova Iguau ao Centro do Rio e N1 = 3
(h 3 possibilidades de se fazer isto). Da mesma forma, T2 a tarefa de ir do Centro do
Rio a Copacabana, e h N2 = 3 possibilidades de se realizar esta tarefa. No total, h:
N1 x N2 = 3 x 3 = 9 possibilidades
Exemplo 2
-
Universidade Estcio de S
Disciplina: Probabilidade e Estatstica
Marcelo Abraho de Mattos
48
Um aluno se prepara para ingressar no ensino superior. Ele pode escolher entre 10
universidades. Se cada uma delas tiver 15 cursos, qua
top related