capítulo 2 distribuiÇÃo de frequencia. representação tabular dos dados estatísticos...

35
Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA

Upload: internet

Post on 17-Apr-2015

119 views

Category:

Documents


7 download

TRANSCRIPT

Page 1: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Capítulo 2

DISTRIBUIÇÃO DE FREQUENCIA

Page 2: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Representação tabular dos dados estatísticos

• Denomina-se tabela a disposição escrita dos dados estatísticos segundo um ou mais critérios de classificação. A seguir, um exemplo de tabela.

• Tabela. Classe sócio-econômica das famílias do Município X

ANOS CLASSE

1998 1999(1) A............. 721 783 B............. 1 379 1 406 C............. 3 656 3 585 D............. 5 865 5 634

FONTE: Prefeitura do Município XNOTA: Dados referentes ao mês de junho de cada ano(1) Previsão realizada em novembro de 1998

Page 3: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Elementos de uma tabela

• ELEMENTOS ESSENCIAIS:– Título: é uma informação concisa colocada no topo da tabela

que indica a natureza do fato observado, o local e a época em que procedeu-se a observação.

– Corpo: é o conjunto de linhas e colunas que contém uma série de informações em disposição horizontal e vertical, respectivamente.

– Casa ou célula: é o cruzamento de uma linha com uma coluna. Uma casa pode conter somente uma informação.

– Cabeçalho: é a parte superior do corpo da tabela que especifica o conteúdo das colunas.

– Coluna indicadora: é a parte do corpo da tabela que especifica o conteúdo das linhas

Page 4: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Elementos de uma tabela

• ELEMENTOS COMPLEMENTARES:– Fonte: é a informação colocada no rodapé da tabela destinada

a indicar a procedência dos dados.– Notas: são informações destinadas a esclarecer todo o

conteúdo da tabela. No caso de haver duas ou mais notas, estas devem ser numeradas por algarismos romanos.

– Chamadas: são informações destinadas a esclarecer o conteúdo de uma casa, linha ou coluna da tabela. As chamadas são indicadas no corpo da tabela por algarismos arábicos entre parênteses e a numeração deve crescer da esquerda para a direita e de cima para baixo. No corpo da tabela, os números das chamadas devem estar esquerda nas casas e à direita no cabeçalho e na coluna indicadora.

Page 5: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Distribuição de frequência

• É uma tabela constituída de uma coluna indicadora que contem intervalos de dados e outra coluna que contém o número de dados em cada intervalo.

• Os intervalos são denominados classes e o número de dados em cada classe é denominado freqüência absoluta simples ou simplesmente freqüência, geralmente denotada por f.

Page 6: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Tabela- Nota final em Estatística dos alunos da turma X, segundo período de 2008

NOTAS N.º de alunos 10| 28.................... 12 28 | 46.................... 15 46 | 64.................... 10 64 | 82.................... 8 82 | 100.................... 5

Page 7: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Construção de uma tabela de distribuição de frequências

nlog3,31classes de número

Nlog3,31classes de número

classes de numeroobservador menor valo observador maior valo=c -

Um número adequado de classes pode também ser dado pela fórmula de Sturges que é a seguinte:

(amostra) ou

onde n é o número de dados observados e logn é o logaritmo decimal do número de dados. O resultado encontrado pela fórmula acima deve ser arredondado para o inteiro mais próximo.

A amplitude das classes é :

(população)

Page 8: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

• OBS: O limite da primeira classe deve ser igual ou menor ao menor dado observado – Limite superior da última classe é igual ao limite inferior da primeira

somado ao produto do número de classes pela amplitude das mesmas e deve ser superior ao maior dado observado.

• Exemplo. A quantidade de vendas de determinado produto observada em 50 cidades, em julho de 2008 apresentou os seguintes dados: 110 110 112 121 125 128 128 131 131 132 136 141 142 142 145 145 147 147 147 150 150 150 151 153 155 157 159 159 159 163 163 165 165 165 165 165 165 168 171 173 175 175 176 179 184 185 189 193 195 197.

Elabore uma distribuição de freqüências para estes dados.

Page 9: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Distribuição de frequências relativas

• Comparar duas ou mais distribuições de freqüências

100nf

f%=

100Nf

f%=

(amostra)

(população)

Page 10: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Distribuição de frequências acumuladas

• Número de dados até uma determinada classe, incluindo todas as anteriores.

• Para comparar duas ou mais distribuições de freqüências acumuladas, empregam-se as freqüências acumuladas relativas.

100nFF%=

100NFF%=

(amostra)

(população)

Page 11: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Análise de uma distribuição de frequências

• Tendência central: os dados se agrupam em torno de um valor intermediário que tende a se localizar no centro da distribuição.

• Dispersão: variação apresentada pelos dados. Quanto maior for a variação, mais heterogêneos são os dados; quanto menor a dispersão, mais homogêneos sãos os dados.

Page 12: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Análise de uma distribuição de frequências

• Simetria: numa distribuição simétrica os dados estão igualmente distribuído em torno de um valor central.

• Conglomerados: são grupos de dados que tendem a se concentrarem em torno de certos valores formando agrupamentos dentro da distribuição denominados conglomerados.

• Valores discrepantes: são dados que se afastam dos valores típicos.

Page 13: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Capítulo 3

REPRESENTAÇÃO GRÁFICA

Page 14: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

GRÁFICO DE COLUNAS OU DE BARRAS

• É a representação de uma série estatística através de retângulos em posição vertical (gráfico de colunas) ou horizontal (gráfico de barras).

• Mais adequados para a representação de séries geográficas e especificativas.

• Os retângulos devem ter a mesma base e as variações são representadas pelas alturas.

• Quando as legendas são muito extensas, usa-se gráfico de barras, com os retângulo em ordem decrescente.

Tabela 3.1. População brasileira segundo a região, 2000

Região Habitantes % Norte................................ 10 030 556 6,8 Nordeste........................... 42 497 540 28,9 Sudeste............................. 62 740 401 42,7 Sul.................................... 22 129 377 15,1 Centro-Oeste.................... 9 427 601 6,4 BRASIL........................... 146 825 475 100,0

FONTE: IBGE, Censo demográfico de 1991

Page 15: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Figura 3.1. População brasileira segundo a região, 1991

0

10

20

30

40

50

60

70

N NE SE S CORegiões

Hab

itan

tes

(mil

hões

)Gráfico de colunas

Page 16: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Gráfico de barras

Figura 3.2. População brasileira segundo a região, 1991

0 10 20 30 40 50 60 70

Centro-Oeste

Norte

Sul

Nordeste

Sudeste

Reg

iões

Habitantes (milhões)

Page 17: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Colunas Justapostas e Colunas Superpostas

• Se houver mais de um item por categoria a ser representada, as colunas (ou barras) podem ser justapostas ou superpostas.

Tabela 3.2. População brasileira segundo a região e a situação do domicílio (urbana ou rural), 1991

Habitantes Regiões

Urbana Rural Norte........................ 5 922 574 4 107 982 Nordeste................... 25 776 279 16 721 261 Sudeste..................... 55 225 983 7 514 418 Sul............................ 16 403 032 5 726 345 Centro-Oeste............ 7 663 122 1 764 479 BRASIL................... 110 990 990 35 834 485

FONTE: IBGE, censo demográfico de 1991

Page 18: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Gráfico de colunas justapostas

Figura 3.3. População brasileira segundo a região e a situação do domicílio (urbana ou rural), 1991

0

10

20

30

40

50

60

N NE SE S CORegiões

Hab

itant

es (

milh

ões)

Urbana

Rural

Page 19: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Gráfico de colunas superpostas

Figura 3.4. População brasileira segundo a região e a situação do domicílio (urbana ou rural), 1991

0

10

20

30

40

50

60

70

N NE SE S CORegiões

Hab

itant

es (

milh

ões)

Rural

Urbana

Page 20: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Colunas compostas

• Neste caso, as colunas têm a mesma altura e são dividas em áreas proporcionais aos itens de cada categoria. Assim sendo, tem-se que:

• 1.º) Região Norte: população urbana (59,0%); população rural (41%)

• 2.º) Região Nordeste: população urbana (60,7%); população rural (39,3%)

• 3.º) Região Sudeste: população urbana (88,0%); população rural (12,0%)

• 4.º) Região Sul: população urbana (81,3%); população rural (18,7%)

• 5.º) Região Centro-Oeste: população urbana (75,6%); população rural (24,4%)

Page 21: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Colunas compostasFigura 3.5. População brasileira segundo a região e a situação do domicílio (urbana ou rural), 1991

0

10

20

30

40

50

60

70

80

90

100

N NE SE S CORegiões

Hab

itant

es (

milh

ões)

Rural

Urbana

Page 22: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

GRÁFICO DE SETORES

• É a representação de uma série estatística através de um círculo dividido em setores cujas áreas os proporcionais aos valores representados.

• Tem o objetivo de comparar os valores observados numa série geográfica ou especificativa com o total dos mesmos.

Figura 3.6. População brasileira segundo a região, 1991

6%7%

15%

29%

43%

Centro-Oeste

Norte

Sul

Nordeste

Sudeste

Page 23: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

GRÁFICO DE CURVAS OU DE LINHAS

• Utilizado quando uma das variáveis o tempo, sendo este representado sempre no eixo das abscissas.

• Havendo mais de uma variável a ser representada, utiliza-se tracejados diferentes devidamente identificados por meio de legendas.

Ano Precipitação (mm) Temperatura(ºC) Ano Precipitação (mm) Temperatura (ºC)

1991 1544 18,7 1996 1563 18,5

1992 1648 19,8 1997 1405 19,3

1993 1221 19,4 1998 1300 19,4

1994 1730 19,1 1999 1381 18,6

1995 1565 19,4 2000 1366 18,9

Tabela 3.3. Precipitação e temperatura médias anuais em Juiz de Fora, 1991-2000

Page 24: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Gráfico de LinhasFigura 3.7. Precipitação anual em Juiz de Fora, 1991-2000

1200

1300

1400

1500

1600

1700

1800

1991 1992 1993 1994 1995 1996 1997 1998 1999 2000

AnosFONTE: Estação Climatológica de Juiz de Fora

Pre

cipi

taçã

o (m

m)

Page 25: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Gráfico de Linhas

AnosHabitantes

Município A Município B

1934........... 50 362 631 842

1950........... 112 549 1 374 509

1960........... 158 694 2 102 999

1970........... 222 172 3 091 408

1980........... 304 075 4 266 144

1990........... 420 038 5 631 310

2000........... 562 851 7 264 389

Figura 3.8. Populações dos Municípios A e B, 1930-1990

10000

100000

1000000

10000000

1930 1940 1950 1960 1970 1980 1990

Anos

Hab

itant

es

Município A

Município B

Populações dos municípios A e B, 1930-1990

Page 26: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

GRÁFICO DE PONTOS

• Utilizado para representar a distribuição dos dados de uma variável quantitativa quando o número de observações não é muito grande. – Exemplo 3.5. Os dados abaixo referem-se às

medidas da temperatura média(ºC) em 20 postos de observação de determinada localidade em julho de 2001: 19, 22, 18, 24, 16, 25, 18, 21, 20, 25, 19, 25, 18, 21, 20, 16, 19, 21, 14, 23. Represente estes dados por um gráfico de pontos.

Page 27: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Gráfico de Pontos

Figura 3.8. Temperatura média em 20 postos de observação na localidade X, julho de 2001

18 19 20 21 22 23

Temperatura (ºC)

Page 28: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

HISTOGRAMA

• Utilizado para representar uma distribuição de freqüências simples. • É um conjunto de retângulos justapostos de mesma base que

representam as classes sendo que as alturas dos referidos retângulos correspondem às freqüências (absolutas ou relativas) das respectivas classes e os centros das bases representam os pontos médios das respectivas classes.

Tabela 3.3. Velocidade média do vento em 50 postos de observação instalados na localidade X, 2000

Velocidade (km/h) N.º de postos 29 | 43................ 8

43 | 57............... 12 57 | 71............... 15 71 | 85................ 11 85 | 99................ 4

FONTE: Serviço de meteorologia da localidade X

Page 29: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Histograma

Velocidade média do vento observada em 50 postos de observação instalados na localidade X, 2000

0

2

4

6

8

10

12

14

16

36 50 64 78 82Velocidade (km/h)

Núm

ero

de p

osto

s

Page 30: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

POLÍGONO DE FREQUENCIA

• Também utilizado para representar um distribuição de freqüência simples.

• Representando-se os pontos médios das classes nas abscissas e as respectivas freqüências no eixo das ordenadas.

Velocidade média do vento observada em 50 postos de observação instalados na localidade X, 2000

0

2

4

6

8

10

12

14

16

22 36 50 64 78 82 96Velocidade (km/h)

Núm

ero

de p

osto

s

Page 31: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

OGIVA DE GALTON

• Utilizada para representar uma distribuição de freqüências acumuladas.

• Representando-se os limites das classes nas abscissas e as respectivas freqüências acumuladas no eixo das ordenadas

Tabela 3.3. Velocidade média do vento em 50 postos

de observação instalados na localidade X, 2000 Velocidade (km/h) N.º de postos

Abaixo de 29................. 0 Abaixo de 43................. 8 Abaixo de 57................. 20 Abaixo de 71................. 35 Abaixo de 85................. 46 Abaixo de 99................. 50

FONTE: Serviço de meteorologia

Page 32: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Ogiva de Galton

Velocidade média do vento observada em 50 postos de observação instalados na localidade X, 2000

0

5

10

15

20

25

30

35

40

45

50

29 43 57 71 85 99Velocidade (km/h)

Núm

ero

de p

osto

s

Page 33: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

RAMOS E FOLHAS

• O gráfico de ramos e folhas é utilizado para representar a distribuição dos dados de uma variável quantitativa.– Exemplo 3.7. Os dados a seguir representam os valores da

vazão (em m3/s) de 26 rios na localidade X em julho de 2001: 56, 85, 42, 63, 97, 59, 72, 91, 95, 104, 68, 79, 88, 88, 101, 76, 100, 118, 86, 94, 93. Represente a distribuição destes dados por um gráfico de ramos e folhas.

– Solução– Ordenando-se os dados acima, tem-se : 42, 56, 59, 63, 68, 72,

76, 79, 85, 86, 88, 88, 91, 93, 94, 95, 97, 100, 101, 104, 118. – Adotando-se uma escala de 10, os ramos são 4, 5, 6, 7, 8, 9, 10

e 11, enquanto que as folhas são 2 (para o ramo 4), 6 e 9 (para o ramo 5), 3 e 8 (para o ramo 6), 2, 6 e 9 (para o ramo 7), 5, 6, 8 e 8 (para o ramo 8), 1, 3, 4, 5 e 7 (para o ramo 9), 0, 1 e 4 (para o ramo 10) e 18 (para o ramo 11). Com estas considerações, tem-se o gráfico a seguir.

Page 34: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

Ramos e Folhas

4 2 5 6 9 6 3 8 7 2 6 9 8 5 6 8 8 9 1 3 4 5 7

10 0 1 4 11 18

Page 35: Capítulo 2 DISTRIBUIÇÃO DE FREQUENCIA. Representação tabular dos dados estatísticos Denomina-se tabela a disposição escrita dos dados estatísticos segundo

ANÁLISE DE UM GRÁFICO • GRÁFICOS DE COLUNAS (BARRAS) SIMPLES E GRÁFICO DE

SETORES• Nestes gráficos deve-se observar os valores máximo (s) e mínimo

(s). Nos gráficos de colunas justapostas, superpostas e compostas deve-se comparar as variá eis envolvidas.

• GRÁFICO DE CURVAS• Nestes gráficos deve-se observar os valores máximo (s) e mínimo

(s), o (s) período (s) onde ocorre (em) a(s) maior (es) e menor(es) variação (variações) e a tendência das variáveis analisadas.

• No caso de duas ou mais variáveis, deve-se comparar as variações das mesmas.

• HISTOGRAMA, POLÍGONO DE FREQÜÊNCIA, OGIVA DE GALTON, GRÁFICO DE PONTOS E RAMOS-E-FOLHAS

• Nestes gráficos procura obter as seguintes informações: tendência central, dispersão e assimetria, conglomerados e valores discrepantes.