conceitos e tratamento informação (hc. 2011)
Post on 26-Jul-2015
93 Views
Preview:
TRANSCRIPT
Tratamento de informação
Tratamento de informação
Helena Carvalho, 2011
Medidas
descritivas de
análise de dados,
quadros e
gráficos
Helena Carvalho
- 2 - Tratamento de informação
20
11
Índice
Estatística: alguns conceitos ……………..…………………..……………………………………………. 3
Classificação de variáveis ……………………………………………………………….………………….. 5
Taxas de Variação ……………………………………………………………………………………………… 11
Medidas de Tendência Central…………………………………………………………………………….. 12
Medidas de Dispersão………………………………………………………………………………………… 12
Observações Outliers…………………………………………………………………………………….……. 14
Assimetria e Curtose……………………………………………………………………………………….….. 16
Glossário de algumas Medidas Descritivas Univariadas……………………………..…………. 18
Apresentação de resultados: Quadros………………………………………………………………… 20
Apresentação de resultados: Gráficos………………….................................................................... 22
Helena Carvalho
- 3 - Tratamento de informação
20
11
ESTATÍSTICA: ALGUNS CONCEITOS
Definição (possível): A Estatística é a ciência que estuda as características
comuns dos indivíduos de um conjunto. Compreende um leque de princípios e
métodos de observação, recolha, análise, interpretação e apresentação de dados
numéricos.
Dois ramos na Estatística: descritiva e indutiva
UTILIDADE DA ESTATÍSTICA DESCRITIVA
Apresentação sintetizada da informação;
Interpretação;
Identificação das relações mais importantes entre variáveis (atributos
ou características)
UTILIDADE DA INFERÊNCIA ESTATÍSTICA
Retirar conclusões sobre um grupo – uma população ou universo – a
partir dos dados recolhidos de uma amostra.
POPULAÇÃO OU UNIVERSO
Todos os elementos que pertencem ao mesmo conjunto.
ex.: toda a população portuguesa = 10 milhões
ex.: todos os alunos que estão a frequentar Cursos no ISCTE
AMOSTRA
Sub-conjunto da população (de menor dimensão que a dimensão da
população).
ex.: recolher um sub-conjunto de alunos de cada Curso.
SONDAGEM
Estudo que envolve um processo de amostragem para conhecer uma
população
ex.: sondagem eleitoral antes do fecho das urnas.
ex.: estudo de opinião sobre os hábitos de leitura dos portugueses
Helena Carvalho
- 4 - Tratamento de informação
20
11
Os INQUÉRITOS POR QUESTIONÁRIO podem ser aplicados
i. Sobre a totalidade do universo (ex.: Censos)
ii. Sobre uma amostra
1. Parciais: se não se pretende inferir para o universo
2. Sondagem: retirar conclusões sobre o universo através de
uma amostra do universo.
AMOSTRA
i. Aleatória: a escolha dos indivíduos é aleatória e através da teoria das
probabilidades é possível determinar a margem de erro cometida. Neste caso
a amostra é representativa do universo, permitindo fazer extrapolações
(inferências);
ii. Não-aleatória: a selecção não é aleatória; a margem de erro pode ser
calculada, mas o seu valor não é fiável
iii. Erro de Amostragem: 2 fontes possíveis
1. O próprio processo de amostragem
2. O processo de escolha e recolha dos dados
PERIODICIDADE DA RECOLHA
1. Contínua, automática, permanente
2. Periódica
3. Ocasional
CRÍTICA DOS DADOS
Tratamento inicial dos dados (primários e/ou secundários), eliminando ou
tratando casos estranhos e corrigindo possíveis erros que podem enviesar as
conclusões. Por ex.: respostas omissas, outliers…
Helena Carvalho
- 5 - Tratamento de informação
20
11
CLASSIFICAÇÃO DE VARIÁVEIS
O Conceito de “Variável”
representa uma característica ou atributo da população ou da amostra.
1. VARIÁVEIS QUALITATIVAS (ou dados não-métricos)
São usadas categorias para a classificação dos dados. As categorias são
exaustivas e mutuamente exclusivas. As variáveis qualitativas podem ser:
a) NOMINAIS
As variáveis são operacionalizadas através de categorias e não é
possível estabelecer nenhuma ordenação entre elas. São apenas nomes.
Exs.: Sexo, Estado Civil, Profissão, Concelho de residência, etc. Não se
pode dizer que solteiro é mais que casado ou vice-versa…
III.3 Profissão Measurement Level: Nominal Value Label 1 Agricultor/ pescador 2 Operário não especializado 3 Operário especializado 4 Empregado serviços 5 Funcionário público 6 Professor
O Professor não é 3 vezes mais que o operário não especializado…
b) ORDINAIS
As variáveis são operacionalizadas através de categorias e é possível
estabelecer uma ordem entre elas, segundo uma relação descritível
mas não quantificável.
Ex.: Habilitações literárias
Grau de escolaridade N %
Básico 34 5,4
Secundário 159 25,3
Profissional/ Médio 109 17,4
Superior 326 51,9
Total 628 100,0
Helena Carvalho
- 6 - Tratamento de informação
20
11
Qualquer escala de Likert é uma variável qualitativa ordinal
Exemplo de escalas de Likert
com 4 níveis
…
1.4. Para cada uma das seguintes frases indique-nos o seu grau de concordância:
Discordo totalment
e
Discordo em parte
Concordo em parte
Concordo totalment
e NS/NR
a) O Estado deve intervir para regular a actividade económica.
1 2 3 4 99
b) A actividade económica deve ser entregue às empresas e ao livre funcionamento do mercado
1 2 3 4 99
com 5 níveis:
14. Quando faz compras quais são normalmente os aspectos que mais influenciam a sua compra? Dê as suas respostas usando a seguinte escala: 1 = não importante 2 = pouco importante 3 = importante 4 = muito importante 5 = extremamente importante
a. Preço f. Imagem da loja
b. Necessidade do produto g. Características do produto
c. Conveniência da localização da loja h. Promoção especial
d. Qualidade do produto i. Imagem da marca
e. Imagem do produto j. Publicidade
2. VARIÁVEIS QUANTITATIVAS (ou dados métricos)
As suas escalas de medida permitem a ordenação e a quantificação. Podem
assumir valores discretos ou contínuos. Podem ser:
DADOS DISCRETOS E DADOS CONTÍNUOS
a) DISCRETOS
Podem tomar um número finito ou infinito numerável de valores. Normalmente
tomam apenas valores inteiros.
Ex.: – “Quantas vezes por mês vai ao cinema?”
– “Vou 2 a 3 vezes por mês”
Dificilmente alguém responderia «vou cerca de 2,48 vezes ao cinema por mês…»
Helena Carvalho
- 7 - Tratamento de informação
20
11
b) CONTÍNUOS
Podem tomar um número infinito não-numerável de valores. Se podem tomar
dois valores possíveis, a e b, teoricamente podem tomar também quaisquer
valores entre a e b.
Ex.: – “Quanto é que tiveste no exame de Estatística I?”
– “Tive 14,6”
VVaarriiáávveeiiss iinnddeeppeennddeenntteess vveerrssuuss vvaarriiáávveeiiss ddeeppeennddeenntteess
Variáveis independentes – as que explicam (X)
Variáveis dependentes – as que são explicadas (Y)
X tem efeito em Y:
X Y
Helena Carvalho
- 8 - Tratamento de informação
20
11
EXERCÍCIO: CLASSIFICAÇÃO DE VARIÁVEIS
P1. Na sua opinião, qual é o número de filhos ideal que uma família deve ter? _____
P2. Quantos irmãos tem (ou teve)? ____
P3. Indique, por favor, o seu estado civil:
(1) Casado (2) Viúvo (3) Divorciado (4) Separado (5) Nunca casou (9) Não responde
P4. Qual é a sua religião? (1) Protestante (2) Católico (3) Judeu (4) Ateu / nenhuma (5) Outra (9) Não responde
P5. Existem várias opiniões sobre o que leva uma pessoa a ser bem sucedida profissionalmente. Das seguintes afirmações indique aquela que mais se aproxima da sua maneira de pensar.
(1) O trabalho arduo e empenho pessoal são os factores mais importantes (2) O trabalho arduo e empenho pessoal, mas também a sorte (3) A sorte é o factor mais importante (9) Outros factores / não responde
1. Sexo
Feminino 1
Masculino 2
2. Idade ___________
3. Tem filhos?
Sim 1 Passe à q4.1
Não 2 Passe à q5
4.1 Se sim quantos? ________
5. Indique, por favor, qual a sua área de licenciatura (nome do curso) _________________
6. Em que ano terminou a licenciatura? _____________
7. Actualmente, com que frequência utiliza a análise quantitativa de dados na sua vida profissional / de investigação?
Nunca utilizo 1
Utilizo raramente 2
Utilizo com alguma frequência 3
Utilizo muito frequentemente 4
Helena Carvalho
- 9 - Tratamento de informação
20
11
B23: EM POLÍTICA É COSTUME FALAR-SE DE ESQUERDA E DIREITA. COMO É QUE SE POSICIONARIA
NESTA ESCALA, EM QUE 0 REPRESENTA A POSIÇÃO MAIS À ESQUERDA E 10 A POSIÇÃO MAIS À
DIREITA?
Esquerda Direita (Recusa) (NS)
00 01 02 03 04 05 06 07 08 09 10 77 88
C2: Com que frequência convive com amigos, familiares ou colegas de trabalho?
Nunca 01
Menos de uma vez por mês 02
Uma vez por mês 03
Várias vezes por mês 04
Uma vez por semana 05
Várias vezes por semana 06
Todos os dias 07
(Recusa) 77
(Não sabe) 88
C7: Com que frequência se preocupa com a possibilidade de a sua casa ser assaltada?
Sempre ou quase sempre 1
Algumas vezes 2 PERGUNTAR A C8
Só às vezes 3
Nunca 4 PASSAR PARA A C9 (Recusa) 7
(Não sabe) 8
… F1: Contando consigo, quantas pessoas – incluindo crianças – vivem habitualmente nesta casa?
ESCREVER O NÚMERO:
(Recusa) 77
(Não sabe) 88
F6: Qual o grau de escolaridade mais elevado que completou?
Nenhum 01 PASSA PARA A F7
1º ciclo do básico (4ª classe) 02
PASSA PARA A F6A 2º ciclo do básico (5º e 6º anos / preparatório) 03
3º ciclo do básico (9º ano / 5º ano dos liceus) 04
Secundário (12º ano / 7º ano dos liceus ou equivalente/Propedêutico / serviço cívico) 05
PASSA PARA A F6A
Superior politécnico 06
Superior universitário (licenciatura) 07
Pós-graduação (pelo menos 1 ano) 08
Mestrado 09
Doutoramento 10
(Recusa) 77
(Não sabe) 88 PASSA PARA A F7
Helena Carvalho
- 10 - Tratamento de informação
20
11
F7: Quantos anos completos de escolaridade terminou? _____________________
F20: Qual é/era o número base de horas contratadas por semana (no seu trabalho principal), sem contar com horas extraordinárias remuneradas ou não remuneradas?
NÚMERO DE HORAS:
(Recusa) 777
(Não sabe) 888
F23: Na sua profissão principal o que é que faz/fazia a maior parte do tempo? DESCREVER DETALHADAMENTE ________________________________________________________________________________________________________________________________________________________
1. Indique o grau de importância que atribui a cada uma das acções a seguir listadas. Utilize a seguinte escala de respostas:
nada importante 1 2 3 4 5 6 7 muito importante
2.1 contribuir para evitar o desperdício
2.2 Desenvolver acções que possam ajudar a modificar a sociedade
2.3 Ter sucesso
2.4 Respeitar as tradições
2.5 Realizar projectos pessoais
2.6 Participar nas decisões públicas
2.7 Ajudar os outros
2.9 Fazer bem uma tarefa de que foi incumbido
2.9 Ajudar a manter a ordem social
2.10 Partilhar recursos
2.11 Ter poder
2. Em igualdade de condições de risco e rendibilidade relativamente a outros Fundos, com que probabilidade optaria por investir num FIF (Assinale com um circulo o valor da sua escolha):
Nada provável 0.......10.......20.......30.......40.......50.......60.......70.......80.......90.......100% De certeza
3. A partir de que valores mínimos de expectativa da rendibilidade (valorização anual líquida) o levariam a investir no FIF?
4-4,99% 5-5,99% 6-6,99% 7-8,99% 9-12% +12%
4. Qual o rendimento mensal líquido do seu agregado familiar (em contos):
Menos de 100 100 a 199 200 a 399 400 a 599 600 ou mais
Helena Carvalho
- 11 - Tratamento de informação
20
11
TAXAS DE VARIAÇÃO
TAXA DE VARIAÇÃO:
1000
01
T
TT
em que inicial momento no valor
final momento no valor
0
1
-T
T
Substituindo
%116%8,115100 1,158481002423
2807100
2423
24235230
%17%9,16100 1694,0100208190
35268100
208190
208190243458
Helena Carvalho
- 12 - Tratamento de informação
20
11
MEDIDAS DE TENDÊNCIA CENTRAL
Média Aritmética ( (população); X (amostra))
Mediana (Me)
Moda (Mo)
Algumas Características mais importantes da Média
O valor da média pode ser enviesado por apenas alguns valores
extremos. Se a distribuição for altamente assimétrica, a média pode
deixar de ser representativa da distribuição;
Pode não corresponder a um valor concreto da variável;
2 Propriedades:
1. a média dos desvios em relação à média é nula;
2. a média do quadrado dos desvios em relação à média é mínima.
É a medida de tendência central mais eficiente para inferir sobre uma
população a partir dos dados de uma amostra;
Algumas Características mais importantes da Mediana
É determinada pelo número de observações e não pelo seu valor, logo,
os valores extremos não afectam a mediana;
Muito utilizada em distribuições fortemente assimétricas (porque não
é afectada por valores extremos);
Para inferência estatística não satisfaz as propriedades de um bom
estimador.
MEDIDAS DE DISPERSÃO
ALGUNS EXEMPLOS:
Intervalo de Variação (Iv);
Intervalo Interquartis (IQ)
Variância ( 2 ; 2S ) e Desvio-Padrão ( ; S ): medidas absolutas de
dispersão:
Coeficiente de Dispersão e Coeficiente de Variação (Cv): medidas
relativas de dispersão:
Helena Carvalho
- 13 - Tratamento de informação
20
11
Intervalo de Variação (Iv)
Corresponde à diferença entre os valores máximo e mínimo observados na
distribuição. A sua maior desvantagem é não ser sensível aos valores
intermédios.
Intervalo Interquartis (IQ)
É a diferença entre o 3º e o 1º quartis e corresponde a um intervalo com 50%
das observações centrais:
13QQIQ
Desvio-Padrão ( ; S )
O desvio-padrão é a raiz quadrada da variância: 2SS ; É a medida de
dispersão mais utilizada.
Coeficiente de Dispersão e Coeficiente de Variação (v
C )
Expressam o peso (absoluto e percentual) do desvio-padrão em relação à
média. Muito usados para comparar distribuições diferentes.
X
S Dispersão de eCoeficient 100 C
v
X
S
Helena Carvalho
- 14 - Tratamento de informação
20
11
OBSERVAÇÕES OUTLIERS
Os outliers são observações extremas que podem existir numa distribuição de
frequências, e classificam-se como severos ou moderados consoante o seu
afastamento em relação às outras observações seja mais ou menos pronunciado.
Outliers Moderados (representados no SPSS por um círculo: o)
Valores entre 1,5 e 3 IQ, abaixo do Q1 ou acima do Q3:
IQQxIQQIQQxIQQii
35,1 seou 5,133311
Outliers Severos (representados no SPSS por um asterisco: *)
Valores superiores a 3 IQ, abaixo do Q1 ou acima do Q3:
IQQxIQQxii
3 seou 331
Diagrama de Extremos e Quartis: “A Caixa de Bigodes” (Boxplot)
22 02N =
Nº de memb. agregado
14
12
10
8
6
4
2
0
22 1420 4719 4413 7312 9011 9690 671 541 9
24 4424 1618 9
20 6918 06
15 36
Valor máximo 6, mas sem os outliers
Valor mínimo.1
Q3=4
Q1=2
Me=3
Outlier severo com resposta no valor 12
Outliers moderados com resposta nos valores 7, 8 e 9
Helena Carvalho
- 15 - Tratamento de informação
20
11
Um exemplo:
Nos diagramas de extremos e quartis os casos marcadamente diferentes dos restantes
são assinalados, como pode ver-se no gráfico acima. Distinguem-se dois níveis de
diferença face à generalidade dos casos:
os OUTLIERS MODERADOS
e os OUTLIERS SEVEROS
que o SPSS identifica por outliers e extremes, respectivamente.
Por defeito, os outliers são marcados com um círculo e os extremos com um asterisco.
Helena Carvalho
- 16 - Tratamento de informação
20
11
ASSIMETRIA E CURTOSE
SKEWNESS – MEDIDA DE ASSIMETRIA UTILIZADA PELO SPSS
Esta medida tem como factor de comparação a simetria da distribuição normal
(ver representação na página seguinte).
É possível quantificar a assimetria efectuando o seguinte rácio:
Medida deassimetria SkewnessErro padrãoda assimetria Standard error of skewness
sr
Se a distribuição é simétrica
Se Distribuição assimétrica e como o coeficiente de assimetria < 0 é uma assimetria negativa
Se a distribuição é assimétrica e como o coeficiente de assimetria > 0 é uma assimetria positiva
KURTOSIS – MEDIDA DE CURTOSE UTILIZADA PELO SPSS
Esta medida tem como factor de comparação a curtose da distribuição normal.
É possível quantificar o grau de achatamento da distribuição a partir do seguinte
rácio:
Medida de curtose KurtosisErro padrãoda curtose Standard error of Kurtosiskr
Se a distribuição é mesocúrtica e a curtose é igual à da distribuição normal);
a distribuição é platicúrtica (curtose inferior à da distribuição normal);
Se a distribuição é leptocúrtica e a curtose é superior à da distribuição normal);
Helena Carvalho
- 17 - Tratamento de informação
20
11
DISTRIBUIÇÃO NORMAL
x x
2
1)x(f
30 40 50 60 70 80 90 100
0.000
0.015
0.030
P eso
De
nsid
ad
e
Helena Carvalho
- 18 - Tratamento de informação
20
11
GLOSSÁRIO DE ALGUMAS MEDIDAS DESCRITIVAS UNIVARIADAS
Median
Mode
Quartiles
Mean
Std. Deviation
Variance
Minimum
Maximum
Range
Helena Carvalho
- 19 - Tratamento de informação
20
11
Skewness
Kurtosis
Std. Error of Skewness
Std. Error of Kurtosis
Interquartle Range (Intervalo interquartil)
Std. Error of Mean
Helena Carvalho
- 20 - Tratamento de informação
20
11
APRESENTAÇÃO DE RESULTADOS
QUADROS
Distribuição de uma variável qualitativa nominal
Quadro 1 Classificação Colarinho Branco/Colarinho Azul dos pais
Classificação Colarinho Branco/Colarinho
Azul dos pais N %
Colarinho branco muito qualificado 1392 28,1
Colarinho branco pouco qualificado 1778 35,9
Colarinho azul muito qualificado 1179 23,8
Colarinho azul pouco qualificado 607 12,2
Total 4956 100,0
Fonte: PISA, 2006
Relação entre duas variáveis qualitativas
Quadro 2 Importância de ter sucesso a Matemática segundo Sexo dos alunos
Importância de ter sucesso
a Matemática
Sexo
Feminino Masculino Total
N % N % N %
Nada importante 51 2,5 61 3,1 112 2,8
Pouco importante 138 6,9 138 6,9 276 6,9
Importante 723 36,1 660 33,1 1383 34,6
Muito importante 1091 54,5 1137 57,0 2228 55,7
Total 2003 100,0 1996 100,0 3999 100,0
Fonte: PISA, 2006
Helena Carvalho
- 21 - Tratamento de informação
20
11
Distribuição de uma variável quantitativa segundo uma variável qualitativa
Quadro 3 Nível socioeconómico dos pais dos alunos segundo o grau de importância de ter sucesso nas diferentes disciplinas
Nada importante Pouco importante Importante Muito importante
Média HISEI Média HISEI Média HISEI Média HISEI
Importância de ter sucesso a Ciências 40,80 38,43 38,97 45,40
Importância de ter sucesso a Matemática 38,23 36,42 39,35 43,69
Importância de ter sucesso a Língua 43,81 46,75 42,40 39,13
Fonte: PISA, 2006
0.0
5.0
10.0
15.0
20.0
25.0
30.0
35.0
40.0
45.0
50.0
Nada importante Pouco importante Importante Muito importante
Mé
dia
HIS
EI
Importância de ter sucesso -
Ciências
Importância de ter sucesso -Matemática
Importância de ter sucesso -
Língua
Helena Carvalho
- 22 - Tratamento de informação
20
11
GRÁFICOS GRÁFICO DE BARRAS
Adequado para variáveis qualitativas – nominais ou ordinais – e quantitativas discretas com um número não excessivamente elevado de valores.
Gráfico 1 Distribuição da taxa de emprego part-time1 por sexo, por país
Fonte: Eurostat, 2005
1 This is a division of the number of employees calculated by reference to the number of hours worked per week for which they are paid; this number of hours is considered in relation to the length of what is considered to be a full-time working week in the Member State or the sector of the unit or the unit itself.
Part-time workers are persons whose usual hours of work are less than the normal working hours. This definition encompasses all forms of part-time work (half-day work, work for one, two or three days a week, etc.). This number may be established at the national, regional, industrial or unit level.
It should be noted that whereas the "full-time employee" category is relatively homogeneous, the same cannot be said of the "part-time employee" category since this can cover anything between 20% or even less and 80% or more of the normal working hours of the employing unit.
http://ec.europa.eu/eurostat/ramon/nomenclatures/index.cfm?TargetUrl=DSP_GLOSSARY_NOM_DTL_VIEW&StrNom=CODED2&StrLanguageCode=EN&IntKey=16538835&RdoSearch=BEGIN&TxtSearch=n&CboTheme=&IntCurrentPage=11
Helena Carvalho
- 23 - Tratamento de informação
20
11
GRÁFICO DE BARRAS EMPILHADAS
Cada uma corresponde a 100%
Gráfico 2 Importância do consumo de tabaco segundo as habilitações literárias
Outro exemplo no qual as unidades estatísticas estão directamente
visíveis (ex: países)
As barras estão na horizontal e cada uma delas corresponde a 100%
Helena Carvalho
- 24 - Tratamento de informação
20
11
Gráfico 3 Taxa de desemprego juvenil segundo os níveis de habilitações
Fonte: Eurostat, 2008
GRÁFICO SECTORIAL
Adequado para variáveis qualitativas. Um nº muito elevado de categorias implicará pouca legibilidade
Gráfico 4 Classificação Colarinho Branco/Colarinho Azul dos pais dos alunos
Fonte: PISA, 2006
0% 20% 40% 60% 80% 100%
UE27
Suécia
Roménia
República Checa
Reino Unido
Portugal
Polónia
Malta
Luxemburgo
Lituânia
Letónia
Itália
Irlanda
Hungria
Holanda
Grécia
França
Finlândia
Estónia
Espanha
Eslovénia
Eslováquia
Dinamarca
Chipre
Bulgária
Bélgica
Áustria
Alemanha
Taxa desemprego dos jovens até 3º ciclo (2008)
Taxa desemprego dos jovens com Ensino Secundário e Pós-secundário (2008)
Taxa desemprego dos jovens com Ensino Superior (2008)
28.1%
35.9%
23.8%
12.2%
Colarinho branco muito qualificadoColarinho branco pouco qualificadoColarinho azul muito qualificadoColarinho azul pouco qualificado
Helena Carvalho
- 25 - Tratamento de informação
20
11
GRÁFICO DE LINHAS
Com médias
Gráfico 5 Distribuição dos scores em ciências, matemática e em leitura segundo o tempo de estudo dos alunos
Fonte: PISA, 2006
Com percentagens
Gráfico 6 Taxa de desemprego por idades na UE27
Fonte: Eurostat, 2008
400.0
420.0
440.0
460.0
480.0
500.0
520.0
540.0
Nenhum < 2 horas semana
2-4 horas semana
4-6 horas semana
> 6 horas semana
Mé
dia
Score a ciências
Score a leitura
Score a matemática
Helena Carvalho
- 26 - Tratamento de informação
20
11
DIAGRAMA DE EXTREMOS E QUARTIS
Só deve ser opção quando a variável cuja distribuição se pretende representar é pelo menos ordinal.
Gráfico 7 Scores em ciências, em matemática e em leitura segundo o sexo dos alunos
Fonte: PISA, 2006
Helena Carvalho
- 27 - Tratamento de informação
20
11
GRÁFICO DE BARRAS E DIAGRAMA DE EXTREMOS E QUARTIS.
Apesar de a variável ser quantitativa o gráfico de barras ainda é adequado
porque a variável não apresenta um nº muito elevado de valores. Caso
contrário seria preferível optar por um histograma construindo classes de
antiguidade.
Gráfico 8 Distribuição da antiguidade da licenciatura
Helena Carvalho
- 28 - Tratamento de informação
20
11
Em igualdade de condições de risco e rentabilidade, com que probabilidade investiria num Fundo Investimento Florestal (FIF)?
N % % Acumulada
0 (Nada provável) 11 1,8 1,8
10 17 2,8 4,6
20 17 2,8 7,4
30 43 7,0 14,4
40 42 6,9 21,2
50 151 24,7 45,9
60 90 14,7 60,6
70 95 15,5 76,1
80 79 12,9 89,1
90 28 4,6 93,6
100 (De certeza) 39 6,4 100,0
Total 612 100,0
Estatísticas
N Respostas válidas 612
Não-respostas 26
Média 58,53
Mediana 60,00
Moda 50
Intervalo variação 100
Mínimo 0
Máximo 100
Percentis 25 50,00
50 60,00
75 70,00
Helena Carvalho
- 29 - Tratamento de informação
20
11
HISTOGRAMA
Adequado para variáveis quantitativas contínuas. Dados classificados em
intervalos.
Neste exemplo apresenta-se em sobreposição a distribuição normal.
Existem situações de análise nas quais é pertinente avaliar o ajustamento
da distribuição empírica à distribuição normal. Poderá ser realizado um
teste de aderência à normalidade.
Gráfico 9 Distribuição dos scores a leitura
Fonte: PISA, 2006
Poder-se-ão construir intervalos em variáveis quantitativas discretas
quando a variabilidade de valores assim o exige para proceder à
representação gráfica. Veja-se o exemplo disponível na página seguinte.
Helena Carvalho
- 30 - Tratamento de informação
20
11
Idade N % % Acumulada
20 17 2,9 2,9 21 19 3,3 6,2 22 24 4,1 10,4 23 28 4,8 15,2 24 25 4,3 19,5 25 20 3,5 23,0 26 32 5,5 28,5 27 17 2,9 31,4 28 16 2,8 34,2 29 20 3,5 37,7
30 13 2,2 39,9 31 15 2,6 42,5 32 13 2,2 44,7 33 10 1,7 46,5 34 10 1,7 48,2
35 6 1,0 49,2 36 10 1,7 50,9 37 14 2,4 53,4 38 12 2,1 55,4 39 10 1,7 57,2
40 14 2,4 59,6 41 10 1,7 61,3 42 20 3,5 64,8 43 10 1,7 66,5 44 9 1,6 68,0 45 12 2,1 70,1 46 19 3,3 73,4 47 10 1,7 75,1 48 9 1,6 76,7 49 7 1,2 77,9
50 11 1,9 79,8 51 12 2,1 81,9 52 13 2,2 84,1 53 8 1,4 85,5 54 10 1,7 87,2
55 7 1,2 88,4 56 4 0,7 89,1 57 8 1,4 90,5 58 2 0,3 90,8 59 1 0,2 91,0
60 6 1,0 92,1 61 6 1,0 93,1 62 4 0,7 93,8 63 3 0,5 94,3 64 3 0,5 94,8 65 1 0,2 95,0 66 5 0,9 95,9 67 4 0,7 96,5 68 2 0,3 96,9 69 2 0,3 97,2
70 2 0,3 97,6 71 1 0,2 97,8 72 1 0,2 97,9 73 2 0,3 98,3 74 2 0,3 98,6
75 4 0,7 99,3 76 1 0,2 99,5 78 2 0,3 99,8 79 1 0,2 100,0
Total 579 100,0
Helena Carvalho
- 31 - Tratamento de informação
20
11
DIAGRAMA DE DISPERSÃO (scatter plot)
Adequado para representar a relação entre duas variáveis quantita-tivas
Gráfico 10 Relação entre Desigualdade na distribuição do rendimento e Risco de Pobreza
Fonte: Eurostat, 2008
top related