apostila - estatística1
Post on 16-Jan-2016
9 Views
Preview:
DESCRIPTION
TRANSCRIPT
1
MATERIAL DIDÁTICO
ESTATÍSTICA
Profa. Valeria Ap. Martins Ferreira
2
1 Introdução à Estatística
Em muitas ocasiões do nosso cotidiano nos deparamos com situações em que
precisamos trabalhar com grande quantidade de informações. Neste material de apoio
formalizaremos alguns conceitos e técnicas estatísticas que podem ser utilizados na
análise de conjuntos de dados, de forma objetiva e segura.
Para começar nossos estudos vamos definir alguns conceitos importantes:
Estatística: Conjunto de técnicas que permite, de forma sistemática, organizar,
descrever, analisar e interpretar dados (conjunto de valores numéricos ou não)
provenientes de estudos ou experimentos, realizados em qualquer área do
conhecimento.
A Estatística pode ser dividida, basicamente, em três áreas:
Estatística Descritiva
Probabilidade
Inferência Estatística
Estatística Descritiva: Conjunto de técnicas destinadas a descrever e resumir os dados a
fim de que possamos tirar conclusões a respeito da característica de interesse.
Probabilidade: Teoria matemática utilizada para se estudar a incerteza proveniente de
fenômenos de caráter aleatório.
Inferência Estatística: Estudo de técnicas que possibilitam a extrapolação, a um grande
conjunto de dados, das informações e conclusões obtidas a partir de subconjuntos de
valores, usualmente de dimensão muito menor, denominados amostras.
3
Estatística Descritiva
Interpretações Iniciais
Amostra
Inferência Estatística
Estimação de quantidades desconhecidas
Extrapolação dos resultados
Teste de Hipótese
Fonte: Magalhães, Marcos Nascimento e Lima, Antonio Carlos Pedroso. Noções de
Probabilidade e Estatística.
A seleção da amostra pode ser feita de várias maneiras, dependendo, entre outros
fatores, do grau de conhecimento que temos da população, da quantidade de recursos
disponíveis e assim por diante. Devemos ressaltar que a seleção da amostra tenta
fornecer um subconjunto de dados o mais parecido possível com a população que lhe dá
origem. Os dados amostrais devem ser coletados de modo apropriado, tal como através
de um processo de seleção aleatória.
1.1 Definições Elementares de Estatística
População: Conjunto formado por todos os elementos (indivíduos, objetos e outros) que
contém a característica que temos interesse em estudar.
Amostra: Subconjunto formado por elementos da população.
Parâmetro: Medida numérica que descreve alguma característica de uma população.
Estatística: Medida numérica que descreve alguma característica de uma amostra.
Variável: Característica de interesse no estudo.
População
4
As variáveis podem ser classificadas como qualitativas ou quantitativas. As
variáveis numéricas serão denominadas quantitativas, ao passo que as não numéricas,
qualitativas.
A variável é qualitativa quando resultar de uma classificação por atributos e/ou
qualidades. Se existir uma ordenação natural, indicando intensidades crescentes de
realização, então elas são classificadas como qualitativas ordinais. Caso contrário, elas
são classificadas como variáveis qualitativas nominais.
Exemplos de variáveis qualitativas nominais:
Gênero (feminino ou masculino)
Estado Civil (solteiro, casado, viúvo, divorciado)
Exemplos de variáveis qualitativas ordinais:
Classe Social (baixa, média ou alta)
Desempenho de um professor (péssimo, regular ou bom)
A variável será quantitativa quando seus valores forem expressos em números.
As variáveis quantitativas podem ser subdivididas em quantitativas discretas e
quantitativas contínuas. As variáveis quantitativas discretas podem ser vista como
resultantes de contagens, assumindo, em geral, valores inteiros. Já as quantitativas
contínuas assumem valores em intervalos dos números reais e, geralmente, são
provenientes de uma mensuração.
Exemplos de variáveis quantitativas discretas:
Número de dependentes (0,1,2,...)
Número de irmãos (0,1,2,3,...)
Exemplos de variáveis quantitativas contínuas:
Peso
Altura
5
Observações:
1. Podemos discretizar uma variável contínua para obter uma melhor representação
da ocorrência de seus valores no conjunto de dados.
2. Podemos associar códigos numéricos a uma variável qualitativa. Por exemplo,
para a variável gênero podemos associar o valor 1 ao sexo feminino e 2 ao
masculino. Apesar da variável ser representada por valores numéricos, isto não
a torna uma variável quantitativa.
1.2 Coleta de Dados
O objetivo de qualquer estudo estatístico é coletar dados e então usá-los para
uma tomada de decisão. Toda decisão feita usando os resultados de um estudo
estatístico será tão boa quanto foi o processo de obtenção dos dados.
Há várias maneiras de coletar os dados. A seguir são apresentados quatro
métodos de coleta de dados.
Censo: todos os elementos da população são estudados. Apesar de fornecer
informações completas, é frequentemente dispendioso e difícil de ser realizado.
Amostra: subconjunto da população de interesse. As estatísticas calculadas a
partir da amostra são usadas para predizer vários parâmetros populacionais.
Simulação: utilização de um modelo matemático ou físico para reproduzir as
condições de uma situação ou de um processo. As simulações permitem estudar
situações que seria pouco prático ou até mesmo perigoso criar na vida real, além de
frequentemente poupar tempo e dinheiro. Por exemplo, fabricantes de automóveis usam
simulações com bonecos para estudar os efeitos que as colisões têm em seres humanos.
Experimento: ao se realizar um experimento, é aplicado um tratamento a uma
parte da amostra e são observadas as respostas. Uma segunda parte da amostra é, em
geral, usada como um grupo de controle. Esse grupo não recebe tratamento algum ou
então recebe um placebo. Após serem observadas as respostas dos dois grupos, os
resultados são comparados.
6
1.2.1 Técnicas de amostragem
Para coletar dados não tendenciosos, é importante que a amostra seja
representativa da população. Técnicas de amostragem apropriadas devem ser usadas
para garantir que as inferências sobre a população sejam válidas.
“Se os dados amostrais não forem coletados de maneira adequada, eles podem
ser de tal modo inúteis que nenhuma manipulação estatística poderá salvá-los”.
A seguir definiremos os métodos de amostragem mais comuns.
Em uma amostra aleatória, todos os membros da população têm chances iguais
de serem selecionados.
Uma amostra aleatória simples é aquela na qual toda amostra possível de
mesmo tamanho tem a mesma chance de ser selecionada. Por exemplo: para usar uma
amostra aleatória simples na contagem do número de pessoas que vivem nos domicílios
da cidade de Mococa, você pode atribuir um número diferente para cada domicílio, usar
um computador para gerar uma amostra de números aleatórios e depois contar o número
de pessoas que vive em cada domicílio selecionado.
Exemplo 1: Imagine uma sala de aula com 60 alunos arrumados em seis filas de 10
alunos cada. Suponha que o professor selecione uma amostra de 10 alunos jogando um
dado e selecionando a fila correspondente ao resultado da jogada. O resultado é uma
amostra aleatória? É amostra aleatória simples? É amostra probabilística?
Resolução: A amostra é uma amostra aleatória porque cada estudante em si tem a
mesma chance (uma chance em seis) de ser escolhido. No entanto, a amostra não é uma
amostra aleatória simples porque nem todas as amostras de tamanho 10 têm a mesma
chance de serem escolhidas. Por exemplo, esse planejamento amostral, ao usar um dado
para selecionar uma fileira, torna impossível selecionar 10 estudantes que estejam em
filas diferentes (mas há uma chance em seis de que sejam selecionados os 10 estudantes
da primeira fila). A amostra é uma amostra probabilística porque cada estudante tem
uma chance conhecida (uma chance em seis) de ser selecionado.
7
Na escolha dos membros de uma amostra, as pessoas envolvidas no
estudo/pesquisa devem decidir se é aceitável ou não ter o mesmo membro da população
selecionado mais de uma vez. Se for aceitável, diz-se que o processo de amostragem é
feito com reposição. Se não for aceitável, então diz-se que o processo é feito sem
reposição.
Uma amostra sistemática é aquela na qual é atribuído um número a cada
elemento da população. Os elementos da população são então ordenados de alguma
maneira, o número inicial é selecionado aleatoriamente e depois os membros da amostra
são selecionados segundo intervalos regulares que ocorrem a partir do número inicial.
(Por exemplo, cada terceiro, quinto ou centésimo elemento é selecionado). Por
exemplo, para coletar uma amostra sistemática do número de pessoas que vivem nos
domicílios de Mococa, você poderia atribuir um número diferente para cada domicílio,
escolher aleatoriamente um número inicial, selecionar um domicílio a cada cem e contar
então o número de pessoas que vivem em cada um desses domicílios selecionados.
Em uma amostra estratificada, a população é subdividida em, pelo menos, dois
subgrupos (estratos) de modo que os elementos no mesmo subgrupo compartilhem as
mesmas características (tais como gênero ou faixa etária) e em seguida extrai-se uma
amostra de cada subgrupo (ou estrato). O emprego de uma amostra estratificada nos
assegura que cada segmento da população está representado.
Na amostragem por conglomerados, primeiro dividimos a área da população em
seções (ou conglomerados), depois selecionamos aleatoriamente alguns desses
conglomerados e a seguir escolhemos todos os membros desses conglomerados
selecionados. Um exemplo de amostragem por conglomerado pode ser encontrado nas
pesquisas eleitorais, onde selecionamos aleatoriamente 30 zonas eleitorais dentre um
grande número de zonas e, em seguida, entrevistamos todos os eleitores daquelas zonas
selecionadas. Isso é muito mais rápido e muito menos dispendioso do que selecionar
uma pessoa de cada uma das muitas zonas na área populacional.
Na amostragem de conveniência, simplesmente usamos resultados de muito
fácil obtenção. Este tipo de amostragem leva frequentemente a estudos tendenciosos (e
que, portanto, não é recomendável).
8
Mesmo planejando e executando bem o processo de coleta da amostra,
provavelmente haverá algum erro nos resultados. Por exemplo, se selecionarmos
aleatoriamente 500 adultos e perguntarmos se eles completaram o ensino superior,
encontraremos um percentual de respostas “sim”. Agora, se selecionarmos outra
amostra de 500 adultos, é provável que obtenhamos um percentual de respostas “sim”
diferente. Com esta reflexão, chegamos às seguintes definições:
Erro amostral: É a diferença entre o resultado amostral e o verdadeiro resultado da
população; tais erros resultam das flutuações amostrais devidas ao acaso.
Erro não amostral: Ocorre quando os dados amostrais são coletados, registrados ou
analisados incorretamente (tal como a seleção de uma amostra tendenciosa, o registro
incorreto dos dados ou o uso de um instrumento de medida defeituoso).
1.3 Organização dos dados
A partir de agora apresentaremos métodos importantes para organização, resumo
e obtenção de gráficos de um conjunto de dados. A finalidade não é a simples obtenção
de tabelas e gráficos, mas, sim, a compreensão dos dados. Quando exploramos um
conjunto de dados, as seguintes características são, usualmente, de grande importância:
1. Centro: um valor representativo ou médio, que indica onde se localiza o meio
do conjunto de dados.
2. Variação: uma medida de quanto os valores dos dados variam entre eles.
3. Distribuição: a natureza ou forma da distribuição dos dados (tal como em
forma de sino, uniforme ou assimétrica).
4. Outliers ou Valores Discrepantes: valores amostrais que se localizam muito
longe da grande maioria dos outros valores amostrais.
1.3.1 Distribuição de Frequência
Ao estudarmos grandes conjuntos de dados é conveniente organizá-los e resumi-
los, construindo uma tabela de frequências. Esta tabela conterá os valores ou categorias
da variável em estudo e suas respectivas contagens, as quais são denominadas
9
frequências. Para facilitar a compreensão da distribuição e a comparação de diferentes
conjuntos de dados calculamos a frequência relativa (%) definida por:
100sobservaçõe de totalnº
categoria na frequência(%) FR
Exemplo 2: Considere um problema de pesquisa de opinião. Nessa pesquisa, 280
alunos de uma universidade foram consultados a respeito de suas opiniões sobre o
desempenho de um professor de Estatística. Na Tabela 1, temos as frequências
observadas e as frequências relativas para cada categoria de resposta (bom, regular,
péssimo).
Tabela1: Pesquisa de opinião
Desempenho
do professor
Frequência F.R(%)
Bom 152 54,29
Regular 77 27,50
Péssimo 51 18,21
Total 280 100,00
Exemplo 3: Uma determinada empresa resolveu traçar o perfil socioeconômico de seus
empregados. Uma das variáveis estudadas foi o número de filhos, com idade inferior a
18 anos, de cada um dos empregados. A Tabela 2 fornece a frequência e a frequência
relativa (%) para cada valor obtido.
Tabela2: Frequência dos empregados, segundo o número de filhos.
Número de
Filhos
Frequência F.R(%)
0 6 13,33
1 11 24,44
2 13 28,89
3 7 15,56
4 5 11,11
5 1 2,22
6 2 4,44
Total 45 100,00
10
1.3.2 Organização dos dados em classes
Na construção da distribuição de frequências de uma variável contínua
consideramos intervalos de mesmo comprimento para determinarmos suas frequências
relativas. Assim, seguimos o seguinte roteiro:
a – Achar o máximo e o mínimo dos dados
b – Escolher intervalos de mesmo comprimento que cubra a amplitude entre o mínimo e
o máximo. Esses intervalos são chamados de classes.
c – Contar o número de observações que pertencem a cada intervalo de classe. Esses
números são as frequências observadas das classes.
d – Calcular as frequências relativas (%) de cada classe:
sobservaçõe de totalnº
classe de observada frequência(%) FR
e – O número de classes é geralmente calculado por sobservaçõe de número k . O
número de classes deve estar entre 5 e 20, e o número que você escolher deve ser
influenciado pela conveniência de se usar números inteiros. Inclua todas as classes,
mesmo aquelas com frequência zero.
Observações:
1. Há situações em que a variável é por natureza discreta, mas o conjunto de
possíveis valores é muito grande. O caminho adequado, neste caso, é tratar a
variável como se fosse contínua e criar classes para representar seus valores.
2. Pode-se verificar tabelas de frequências com classes de tamanho desiguais.
Exemplo 4: Os dados abaixo representam os tempos de vida (em horas) de 40
componentes eletrônicos submetidos a um experimento num laboratório industrial.
3,20 11,70 13,64 15,60 15,89 28,44 29,07 37,44 41,81 43,35 43,94
49,51 49,82 51,20 51,43 52,47 53,72 53,92 54,03 56,89 63,80 66,40
68,64 70,15 70,98 74,52 76,68 77,84 80,91 84,04 85,70 86,48 88,92
11
89,28 91,36 91,62 98,79 102,39 104,21 124,27
Considerando intervalos de classes de comprimento 25, temos na Tabela 3 a
distribuição de frequências para esses dados.
Tabela 3: Distribuição de frequências da variável tempo de vida de
componentes eletrônicos.
Intervalo de classe Frequência F.R(%)
0|−25 5 12,50
25|−50 8 20,00
50|−75 13 32,50
75|−100 11 27,50
100|−125 3 7,50
Total 40 100,00
1.4 Séries Estatísticas
Série Estatística é toda tabela que apresenta a distribuição de um conjunto de
dados estatísticos em função da época, do local ou da espécie. Portanto, numa série
estatística, observamos a existência de 3 elementos: tempo, espaço e a espécie.
Conforme varie um dos elementos da série, podemos classificá-la em histórica
(ou cronológica) , geográfica(ou localização) e específica (ou categórica).
A série geográfica é feita para apresentar dados de diferentes regiões
geográficas, em determinado instante.
Tabela 4: Percentual de pessoas com 10 anos e mais que
declararam rendimento de até um salário mínimo, segundo as
grandes regiões do país.
Região Percentual
Brasil 25,3
Norte 32,8
Nordeste 48,0
Sudeste 16,0
Sul 18,8
Centro-Oeste 22,3
Fonte: Folha de São Paulo (2002).
12
A série cronológica é feita para apresentar dados observados ao longo do tempo,
em determinado local.
Tabela 5: Frango – preços médios em São Paulo – 2003-2008
Anos Preço Médio (R$)
2003 2,56
2004 2,64
2005 2,67
2006 2,53
2007 3,20
2008 3,64
Fonte: Associação Paulista de Avicultura.
A série categórica é feita para apresentar dados que se distribuem em diferentes
categorias, em determinado tempo e local.
Tabela 6: Rebanhos brasileiros – Efetivo nos
estabelecimentos agropecuários (2006)
Espécies Quantidade
Bovinos 205.886.244
Bubalinos 1.156.870
Aves 821.541.630
Suínos 35.173.824
Ovinos 16.019.170
Caprinos 10.401.449
Fonte: IBGE.
Muitas vezes temos necessidade de apresentar, em uma única tabela, a variação
de valores de mais de uma variável, isto é, fazer uma conjunção de duas ou mais séries.
Conjugando duas séries em uma única tabela, obtemos uma tabela de dupla
entrada. Em uma tabela desse tipo ficam criadas duas ordens de classificação: uma
horizontal (linha) e uma vertical (coluna).
13
Tabela 7: Taxas de analfabetismo de pessoas com 15 anos e
mais, segundo a cor, nos censos demográficos de 1991 e 2000.
Cor Censo 1991 Censo 2000
Brasil 19,4 12,9
Branca 11,9 8,3
Preta 31,5 21,5
Amarela 5,4 4,9
Parda 27,8 18,2
Indígena 50,8 26,1 Sem declaração 18,7 16,1
Fonte: Retrato do Brasil. Folha de São Paulo, São Paulo, 21
dez. 2002.
1.5 Dados absolutos e dados relativos
Dados absolutos: são dados resultantes da coleta direta da fonte, sem outra
manipulação senão a contagem ou medida.
Dados relativos: são o resultado de comparações por quocientes (razões) que se
estabelecem entre dados absolutos e têm por finalidade realçar ou facilitar as
comparações entre quantidades.
Os dados relativos traduzem-se, em geral, por meio de porcentagens, índices e
taxas.
Para exemplificar a importância das porcentagens na interpretação dos dados,
vamos considerar a seguinte série:
Tabela 8: População residente no Brasil, segundo o sexo, de
acordo com o censo demográfico de 2000.
Sexo População
residente
Percentual
Homens 83.576.015 49,22
Mulheres 86.223.155 50,78
Total 169.799.170 100,00
Fonte: IBGE (2003)
Com os valores da coluna do percentual podemos perceber que, de cada 100
brasileiros residentes no Brasil, 49 são do sexo masculino e aproximadamente 51 são do
sexo feminino.
14
O emprego da porcentagem é de grande valia quando o nosso intuito é destacar a
participação da parte no todo.
Agora, vamos analisar a série:
Tabela 9: Matrículas nas escolas das cidades A e B - 2008
Categorias Número de alunos
Cidade A Cidade B Ensino Fundamental 19.286 38.660
Ensino Médio 1.681 3.399 Ensino Superior 234 424
Total 21.201 42.483
Dados Fictícios
De acordo com as informações contidas na tabela, qual das cidades tem,
comparativamente, maior número de alunos em cada nível de ensino?
Como o número total de alunos é diferente nas duas cidades, não é fácil concluir
a respeito usando os dados absolutos. No entanto, usando as porcentagens, tal tarefa
fica bastante facilitada. Assim, acrescentando na tabela anterior as colunas
correspondentes às porcentagens, obtemos:
Tabela 10: Matrículas nas escolas das cidades A e B - 2008
Categorias Cidade A Cidade B
Nº de alunos % Nº de alunos % Ensino Fundamental 19.286 90,97 38.660 91,00
Ensino Médio 1.681 7,93 3.399 8,00 Ensino Superior 234 1,10 424 1,00
Total 21.201 100,00 42.483 100,00
Dados Fictícios
o que nos permite dizer que, comparativamente, as cidades contam, praticamente, com o
mesmo número de alunos em cada nível de ensino.
15
Além das porcentagens, nos deparamos com muitas informações na mídia a
respeito de razões, índices, taxas, pontos percentuais e variações percentuais. Agora,
vamos definir cada um destes conceitos.
1.5.1 Razões
Razão é uma relação entre duas grandezas. Para obter a razão entre a e b, basta
dividir a por b.
b
arazão
Quando comparamos grandezas da mesma espécie, expressamos a razão na
forma de fração irredutível. Quando comparamos grandezas diferentes, em geral,
dividimos e representamos o quociente na forma de número decimal.
Por exemplo, numa sala com 25 meninos e 15 meninas, podemos afirmar que a
razão entre o número de meninos e meninas é 3
5
15
25 , ou seja, para cada 3 meninas, há
5 meninos na sala.
Agora, suponha que um automóvel percorra a distância de São Paulo a Belo
Horizonte em 6,5 horas. Como a distância entre as duas cidades é de 586 km, temos
que a velocidade média é de, aproximadamente, 90,15km/h.
1.5.2 Índices
Os índices são razões entre duas grandezas tais que uma não inclui a outra.
Exemplos de índices:
superfície
população ademográfic Densidade
16
Índices econômicos:
população
bem do consumo Consumo capitaper
população
renda Renda capitaper
1.5.3 Taxas
A taxa também é uma relação entre duas grandezas, mas, neste caso,o
numerador faz parte do denominador, ou seja, o denominador contém o numerador.
Para obter uma taxa, dividimos a por a + b. O resultado pode ser multiplicado por 100,
ou por 1.000 ou 10.000.
São exemplos de taxas:
000.1período e local mesmo do população
período e local dado em óbitos de númeroemortalidad de Taxa
000.1período e local mesmo do população
período e local dado em vivosnascidos de númeronatalidade de Taxa
100matrículas de inicial número
evadidos alunos de númeroescolar evasão de Taxa
1.5.4 Variações percentuais e Pontos percentuais
Se Q1 e Q2 são duas grandezas quaisquer medidas na mesma unidade, tomando
Q1 como base de comparação, temos a seguinte definição para variação percentual:
17
100Q
QQ V
1
12
Ou
1001Q
Q V
1
2
A noção de "pontos percentuais", atualmente, é bastante empregada nos meios
de comunicação de massa e pelos economistas brasileiros. Vamos explicar seu
significado através de alguns exemplos:
Se a inflação subiu de 8% para 10%, podemos tanto dizer que houve um
aumento de 25% na inflação como dizer que a inflação subiu dois pontos
percentuais.
Se determinado imposto subiu de 3% para 5%, é a mesma coisa dizer que o
aumento foi de 40% e dizer que o imposto subiu dois pontos percentuais.
Se a taxa de juros passou de 20% para 50%, esse aumento pode ser descrito
como sendo um aumento de 150% ou como sendo um aumento de trinta pontos
percentuais.
1.6 Gráficos
A organização dos dados em tabelas de frequências proporciona um meio eficaz
de estudo do comportamento das características de interesse. Muitas vezes, as
informações contidas nas tabelas podem ser mais facilmente visualizadas através de
gráficos. Existem vários tipos de representação gráfica, mas vamos abordar aqui os mais
simples para variáveis qualitativas e quantitativas.
Antes de comentarmos especificamente sobre alguns deles, vale ressaltar a
importância de se interpretar corretamente um gráfico. Devemos analisar a informação
18
numérica fornecida no gráfico, de modo a não nos enganarmos por sua forma geral. Por
exemplo, vamos analisar os seguintes gráficos:
Figura 1.1: Gráficos em colunas para a variável PIB municipal
Fonte: http://veja.abril.com.br/noticia/brasil/pesquisa-do-ibge-faz-uma-radiografia-da-
riqueza-dos-municipios
Os dois gráficos retratam os mesmos dados, mas o segundo é feito de modo a
exagerar a diferença entre o PIB no Rio de Janeiro e em Brasília. Pelo fato de não
iniciar o eixo vertical em zero, o segundo gráfico tende a produzir uma impressão
subjetiva enganosa, levando o leitor a acreditar que a diferença seja muito maior do que
realmente é.
154,7
117,5
0
50
100
150
200
Rio de Janeiro Brasília PIB
mu
nic
ipal
de
20
08
(e
m
bilh
õe
s d
e r
eai
s)
Municípios
154,7
117,5
100
120
140
160
Rio de Janeiro Brasília
PIB
mu
nic
ipal
de
20
08
(e
m
bilh
õe
s d
e r
eai
s)
Municípios
19
1.6.1 Gráfico em Linhas
Quando os dados estiverem distribuídos segundo uma variável no tempo (meses,
anos, etc.), podemos representá-los através de um gráfico em linhas. Esse tipo de
gráfico retrata as mudanças nas quantidades com respeito ao tempo (série temporal)
através de uma série de segmentos de reta. É muito eficiente para mostrar possíveis
tendências no conjunto de dados.
Figura 1.2: Gráfico em linha para dados de assinantes de telefones celulares.
1.6.2 Gráfico (ou Diagrama) em Barras (ou Colunas)
Os diagramas em barras (ou colunas) são bastante utilizados quando trabalhamos
com variáveis qualitativas (dados categóricos) ou quantitativas discretas. No eixo
horizontal especificamos os nomes das categorias e no eixo vertical construímos uma
escala com a frequência ou a frequência relativa. As barras terão bases de mesma
largura e alturas iguais à frequência ou à frequência relativa. O gráfico em barras,
quando as barras estão dispostas no sentido vertical, também é chamado de gráfico em
colunas.
1,1 1,3 1,5 1,9 2,4 2,6
3,1
7,4
18,6
21,5
29
0
5
10
15
20
25
30
35
1996 1998 2000 2002 2004 2006 2008
Ass
inan
tes
(em
milh
õe
s)
Anos
20
Figura 1.3: Gráfico em colunas para a variável desempenho do professor
Figura 1.4: Gráfico em barras para a variável desempenho do professor
Figura 1.5: Gráfico em colunas para a variável número de filhos
0
20
40
60
80
100
120
140
160
Bom Regular Péssimo
Fre
qu
ên
cia
Desempenho do professor
0 50 100 150 200
Bom
Regular
Péssimo
Frequência
De
sem
pe
nh
o d
o p
rofe
sso
r
0
2
4
6
8
10
12
14
0 1 2 3 4 5 6
Fre
qu
ên
cia
Número de filhos
21
1.6.3 Diagrama de Pareto
Quando construímos o gráfico de barras para variáveis qualitativas e as barras
são arranjadas em ordem descendente de altura, a partir da esquerda para a direita, com
o atributo que ocorre com maior frequência aparecendo em primeiro lugar,
denominamos este gráfico de barras de Diagrama de Pareto.
A grande utilidade deste diagrama é a de permitir uma fácil visualização e
identificação das causas ou problemas mais importantes, possibilitando a concentração
de esforços sobre os mesmos. O diagrama de Pareto é uma das sete ferramentas da
qualidade.
Exemplo 5: Uma indústria de computador preocupada com vários defeitos que um de
seus produtos vem apresentando, fez um levantamento e constatou os seguintes
problemas:
A : Defeito na cobertura plástica.
B : Defeito no teclado.
C : Defeito na fonte de energia.
D : Soldas soltas.
E : Defeito na placa da unidade de processamento.
F : Defeito no visor.
G : Outros.
As frequências para cada problema estão apresentadas na Tabela 11. Vamos
apresentar as informações da tabela no diagrama de Pareto.
22
Tabela 11: Tipos de problemas numa indústria de
computadores.
Tipo de
problema
Frequência F.R.(%)
D 80 38,65
C 55 26,57
E 32 15,46
B 20 9,66
A 10 4,83
G 7 3,38 F 3 1,45
Total 207 100,00
A Figura 1.6 apresenta o diagrama de Pareto para este conjunto de dados.
Figura 1.6: Diagrama de Pareto.
1.6.3 Gráfico (ou Diagrama) em Setores
O diagrama em setores, também conhecido como gráfico de pizza, é um dos
gráficos mais utilizados para representar variáveis qualitativas (ou categóricas) e é
0
10
20
30
40
50
60
70
80
90
D C E B A G F
Fre
qu
ên
cia
Tipos de Problemas
23
bastante apropriado quando se deseja visualizar a proporção que cada categoria
representa do total.
Figura 1.7: Gráfico circular para a variável desempenho do professor
1.6.4 Histograma e Polígono de Frequência
Quando os dados estiverem agrupados em intervalos de classe, o gráfico que
construímos é o histograma. Os histogramas são representações gráficas das
distribuições de frequências dadas por retângulos. Cada retângulo do histograma tem
largura igual a cada intervalo de classe e altura dada pela frequência absoluta ou
relativa.
Figura 1.8: Histograma para a variável tempo de vida de componentes eletrônicos.
54,29% 27,50%
18,21%
Bom
Regular
Péssimo
0
2
4
6
8
10
12
14
12,5 37,5 62,5 87,5 112,5
Fre
qu
ên
cia
tempo de vida (horas)
24
O polígono de frequência é outro gráfico que ilustra uma distribuição de
freqüência aparentando uma poligonal, que é o resultado da interligação de pontos que
representam as freqüências em cada classe.
Cada classe é representada na linha de base pelo seu ponto médio que é o ponto
central de uma classe.
A preparação de um quadro para o polígono de freqüência obedece a mesma
técnica do histograma, variando apenas quanto à representação das classes pelo ponto
médio.
Histograma e polígono de freqüência salientam um fenômeno de maneira
idêntica, tanto assim é que, construindo ambos em um mesmo sistema de coordenadas,
vamos verificar sua perfeita sobreposição.
Figura 1.9: Histograma para a variável tempo de vida de componentes eletrônicos.
0
5
8
13
11
3
0 0
2
4
6
8
10
12
14
0 12,5 37,5 62,5 87,5 112,5 137,5
Fre
qu
ên
cia
tempo de vida (horas)
top related