24-08 - aula 3 -tabelas e gráficos_variaveis quantitativas
Post on 14-Dec-2015
8 Views
Preview:
DESCRIPTION
TRANSCRIPT
AnAnAnAnAnAnAnAnáááááááálise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de lise Descritiva de DadosDadosDadosDadosDadosDadosDadosDados
Tabelas e Gráficos
Parte II: Organizando e apresentandoos dados de variáveis quantitativas
0
10
20
30
40
50
60
70
80
90
100
Sim Não
Sindicalização
%
20 30 40 50
0
10
20
IdadeMotorista
Por
cent
agem
Relembrando: Planilha de Dados
Variáveis Discretas
Distribuição de Frequências
Variáveis discretas que assumempoucos valores distintos
[ Ellison, 2004 ]
0 1 2 3 4 5
Número de espécies
Fre
quên
cia
Rel
ativ
a (%
)
010
2030
40
Florestas
Variáveis discretas que assumempoucos valores distintos
[ Ellison, 2004 ]
Pântanos
0 1 2 3 4 5
Número de espécies
Fre
quên
cia
Rel
ativ
a (%
)
010
2030
40
0 1 2 3 4 5
Número de espécies
Fre
quên
cia
Rel
ativ
a (%
)
010
2030
40
0 1 2 3 4 5
Número de espécies
Fre
quên
cia
Rel
ativ
a (%
)
010
2030
40
Comparando os dois tipos de habitats
Variável discreta que assume um grandenúmero de valores distintos
[Reis e Reis, 2001]
Solução: agrupar valores em classes
Variáveis Contínuas
Estudando a
Distribuição de Frequências
Variáveis contínuas assumem muitos valoresdistintos
Solução: agrupar valores em classes
Area das folhas, cm2
Fre
quen
cia
Abs
olut
a
5 10 15 20
020
040
060
080
0
Histograma de frequências
Gráfico para a distribuição de frequências de variáveis contínuas
10
.06
44
.89
32
.64
10
.27
1.8
2
0.2
1
0.0
5
0.0
5
Histograma de densidade
Den
sida
de
5 10 15 20
0.00
0.05
0.10
0.15
0.20
Área da barra = frequência relativa da classe
2 x 0.0514 = 0.1027
Soma das áreas de todas as barras = 100%
frequência relativa da classe
tamanho da classeDensidade =
Vantagem do histograma de densidadeD
ensi
dade
5 10 15 20
0.00
0.05
0.10
0.15
0.20 Cálculo da frequência em classes
diferentes daquelas apresentadas no histograma.
Exemplo: qual é a frequência de plantas com área foliar entre 7.0 e 11.0 cm2?
( 1 x 0.2244 ) +
( 2 x 0.1632 ) +
( 1 x 0.0513 ) = 0.6022
Simétrica
50 60 70 80 90 100 110 120 130 140 150
0
1
2
3
4
5
6
Variável
Fre
quên
cia
rela
tiva
(%)
Classificação da Distribuição de Frequências de uma
Variável Contínua quanto a sua Forma
0 10 20 30
0
1
2
3
4
5
6
7
8
9
10
Variável
Fre
quên
cia
rela
tiva
(%)
Assimétrica
92 93 94 95 96 97 98 99 100 101 102
0
1
2
3
4
5
6
Variável
Fre
quên
cia
rela
tiva
(%)
Com concentração à
esquerda
Com concentração à
direita
5 10 15 20
020
4060
8010
0
Área das folhas, cm2
Fre
quen
cia
Rel
ativ
a A
cum
ulad
a
Ogiva: gráfico das frequências acumuladas
O eixo horizontal utiliza os limites superiores das classes
Uma ogivasempre termina
em 100%
5 10 15 20
020
4060
8010
0
Área das folhas, cm2
Fre
quen
cia
Rel
ativ
a A
cum
ulad
a
Uma ogivasempre começa
em 0%
5 10 15 20
020
4060
8010
0
Área das folhas, cm2
Fre
quen
cia
Rel
ativ
a A
cum
ulad
a
Qual é o percentual de plantas quepossuem área foliar abaixo de 11 cm2?
92
11
5 10 15 20
020
4060
8010
0
Área das folhas, cm2
Fre
quen
cia
Rel
ativ
a A
cum
ulad
a
Qual é o valor de área foliar que deixa 50% das plantas abaixo dele?
50
8
Assimétrica(concentração à
direita)ou (cauda à esquerda)
Simétrica
Assimétrica (concentração àesquerda) ou (cauda à direita)
Formas básicas para a distribuição de frequências de uma variável contínua
Comparando duas distribuições de frequências
5 10 15 20
020
4060
8010
0
Área das folhas, cm2
Fre
quen
cia
Rel
ativ
a A
cum
ulad
a
5 10 15 20
020
4060
8010
0
Variedade 1Variedade 2Variedade 1Variedade 2
A distribuição da área foliar das plantas da variedade 2 émais assimétrica
concentrada à esquerda
do que a distribuição da área foliar das plantas da variedade 1.
Visualizando pequenos conjuntos de dados
Diagrama de Pontos
Diagrama de Ramo-e-folhas
Diagrama de Pontos
[Reis e Reis, 2001]
Diagrama de Ramo-e-Folhas
4 4 5 6 6 6 6 6 7 7 7 8 9 9 10 10 12 14 15 16 17 18
Número de espécies de formigas em 22 pontos de coleta em habitats de floresta (valores ordenados)
4 4 5 6 6 6 6 6 7 7 7 8 9 910 10 12 14 15 16 17 18
Separando os dados pelas dezenas, uma em cada linha
Diagrama de Ramo-e-Folhas
4 4 5 6 6 6 6 6 7 7 7 8 9 9
10 10 12 14 15 16 17 18
Separando as unidades de cada dezena em dois grupos: de 0 a 4 e de 5 a 9
0| 4 4 0| 5 6 6 6 6 6 7 7 7 8 9 91| 0 0 2 4 1| 5 6 7 8
Colocando as dezenas em “evidência”
ramosfolhas
Diagrama de Ramo-e-Folhas
Ramo-e-Folhas duplo
Estudando uma variávelao longo do tempo
Gráfico de linha(Séries Temporais)
Séries temporais (ou séries históricas) são um conjunto de observações de uma mesma variável quantitativa (discreta ou contínua) feitas ao longo do tempo.
Os gráficos mais comuns para a representação de uma série temporal são os
gráficos de linha.
22252023282524221415Ovos
10987654321Semana
Número de ovos de Aedes Aegypti emovitrampas ao longo de 10 semanas
Sem
ana
Número de ovos por armadilha
24
68
10
15 20 25 30
Sem
ana
Número de ovos por armadilha
24
68
10
0 10 20 30 40
24
68
10
0 10 20 30 40
24
68
10
0 10 20 30 40
Área 1
Área 2
Área 3
1900 1920 1940 1960 1980
-6-4
-20
24
Ano
Altu
ra e
m r
elaç
ão a
um
pon
to a
rbitr
ário
Nível de água do Rio Negro
(médias mensais das observações diárias, em metros)
Gráfico de linhas para o preço médio do litro de leite “Folha de São Paulo” (set/2001)
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
Maio Junho Julho Agosto
Cuidados ao elaborar um gráfico de linhas : a escala do gráfico
[Reis e Reis, 2001]
0,10
0,15
0,20
0,25
0,30
0,35
0,40
Maio Junho Julho Agosto
0,20
0,25
0,30
0,35
0,40
Maio Junho Julho A gos to0,24
0,26
0,28
0,30
0,32
0,34
0,36
Maio Junho Julho A gos to
Efeitos da mudança no início e/ou final da escala do gráfico de linhas da série temporal
do preço do leite.
[Reis e Reis, 2001]
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
Maio Junho Julho Agosto
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
0,55
0,60
Maio Junho Julho Agosto
Efeitos de alterações na dimensão horizontal do gráfico de linhas da série do preço do leite
Alguns cuidados
• O início do eixo vertical seja o valor mínimo possível para a variável que estásendo representada (para o caso do preço de leite, o valor zero, leite de graça)
• O final do eixo vertical seja tal que a série fica centrada em relação ao eixo vertical
• Os tamanhos dos eixos sejam o mais parecidos possível .
0,10
0,15
0,20
0,25
0,30
0,35
0,40
Maio Junho Julho Agosto
Praticando Estatística
Como fazer
histogramas, ogivas, ramo-e-folhas e
gráficos de linhas
usando o ?
Como fazer usando o R ?
Gráfico de Barras para Dados de Variáveis Discretas
Quando não se conhece as frequências das classes
(dados brutos)
ants <- read.table("ants.txt",header=T)
tabela <- table(ants$Srich[ants$Habitat=="Forest"])
barplot(tabela, ylab="Frequência Absoluta",
main="Riqueza de Espécies de Formigas",
xlab="Número de espécies de formigas",
col="darkred")
Como fazer usando o R ?
Gráfico de Barras para Dados de Variáveis Discretas
Quando já se conhece as frequências das classes
Classes <- c(1, 2, 3, 4, 5, 6) # Classes
Formigas.pantano <- c(4.0,16.0,40.0,24.0,8.0,8.0)
# Frequências Relativas das classes
names(Formigas.pantano) <- Classes #Nomes das classes
barplot(Formigas.pantano, ylab="Frequência Relativa(%)",
main="Riqueza de Espécies de Formigas",
xlab="Número de espécies de formigas",
col="darkblue")
Como fazer usando o R ?
Histograma de Frequências
hist(ciclame$Area,breaks=seq(4,20,by=2),
xlim=c(4,20), xlab="Area das folhas, cm2",
ylab="Frequencia Absoluta", main="",
col="lightgreen")
Histograma de Densidade
hist(ciclame$Area,breaks=seq(4,20,by=2),
xlim=c(4,20), xlab="Area das folhas, cm2",
ylab="Frequencia Absoluta", main="",
col="purple", freq=F)
Como fazer usando o R ?Ogiva
classes<-hist(ciclame$Area,
breaks=seq(4,20,by=2))[[1]]
frequencias<-hist(ciclame$Area,
breaks=seq(4,20,by=2))[[2]]
freq.cum<- round(cumsum(frequencias)/
sum(frequencias),4)*100
plot(classes,c(0,freq.cum),type="l",lwd=2,
xlim=c(4,20), xlab="Área das folhas, cm2",
ylab="Frequencia Relativa Acumulada",
main="",col="red")
Con
stru
indo
as c
lass
es e
fr
equê
ncia
s ac
umul
adas
Des
enha
ndo
a og
iva
Como fazer usando o R ?
Ramo-e-folhas
# Riqueza de Especies em Habitats de Floresta
stem(ants$Srich[ants$Habitat=="Forest"])
# Riqueza de Especies em Habitats de Floresta
stem(ants$Srich[ants$Habitat=="Bog"])
Como fazer usando o R ?
Gráficos de Linhas
rionegro<-read.table("rionegro.txt",header=T)
# Lendo a série temporal mensal de alturas (“height”)
plot(rionegro$Year,rionegro$Height,type="b",
xlab="Ano",
ylab="Altura em relação a um ponto arbitrário")
abline(h=0) # Linha horizontal na altura zero
Fim da terceira aula
Próxima Aula
Análise Descritiva de Dados: Organizando e apresentando Dados de
Variáveis Quantitativas
Análise Descritiva de Dados: Resumindo os Dados de Variáveis
Quantitativas
Referências Bibliográficas
REIS, E.A.; REIS, I.A. (2001) Análise Descritiva de Dados- Tabelas e Gráficos, Relatório Técnico do Departamento de Estatística da UFMG. Disponível em: http://www.est.ufmg.br
ELLISON, A. E (2004). Bayesian inference in ecology. Ecology Letters, 7, 509–520.
top related