software r - introdução - monitoria de econometria avançada
TRANSCRIPT
Software R - introdução
Software R - introduçãoMonitoria de Econometria Avançada
Paloma Vaissman Uribe
Software R - introdução
Como instalar o software R
O R é um software livre para análise estatística que estádisponível para as plataformas UNIX, Windows e MacOS.
No Windows:• Para baixar o R para o Windows entre no site do Rwww.r-project.org• Clique em CRAN (Comprehensive R Archive Network)• Escolha o espelho de sua preferência (CRAN mirrors)• Clique em Windows 95 or later
• Clique em base e salve o arquivo do R para Windows. Depois ésó executar o arquivo.
Software R - introdução
Noções gerais sobre o R
O sinal > (sinal de maior) indica o prompt e quer dizer que o Restá pronto para receber comandos.Em alguns casos um sinal de + aparecerá no lugar do prompt,isso indica que ficou faltando algo na linha de comandosanterior (isso acontece quando houve um erro, ou quando afinalização do comando só ocorrerá nas próximas linhas).Se tiver errado pressione Esc para retornar ao prompt normal esumir com o sinal de +.Os comandos que você digita aparecem em vermelho e ooutput do R aparece em azul.Após digitar os comandos tecle Enter para que eles sejamexecutados!
Software R - introdução
Noções gerais sobre o R
Para usar o R é necessário conhecer e digitar comandos.Alguns usuários acostumados com outros programas notarão deinício a falta de “menus” (opções para clicar).O R é case-sensitive, isto é, ele diferencia letras maiúsculas deminúsculas, portanto A é diferente de a. O separador de casasdecimais é ponto “.”. A vírgula é usada para separarargumentos (informações).Uma boa alternativa para facilitar a ausência de “menus” éinstalar o RStudio, um programa que contém um ambiente dedesenvolvimento integrado ou interface mais amigável para o R(mas ainda assim precisa ter o R instalado na máquina). Paraisso entrar em www.rstudio.com, fazer o download e seguir asinstruções de instalação.
Software R - introdução
Instalação e uso de pacotes no RPara instalar um pacote abra o R e digite na linha de comandosinstall.packages(“nome do pacote”). É preciso estar conectadoà internet. Para o curso de Econometria Avançada, algunspacotes interessantes são:
• astsa (Shumway and Stoffer, 2014)• FinTS (Tsay, 2005)
Como alternativa, o RStudio já possui o menu específico“Packages”, onde pode-se clicar em “Install” e digitar o nomedo pacote.Não basta apenas instalar um pacote. Para usá-lo é necessário“carregar” o pacote sempre que você abrir o R e for usá-lo. Usea função “library” para rodar um pacote.
library(astsa)
No RStudio é possível carregar pacotes simplesmente clicandona aba “Packages” e selecionando o pacote de interesse.
Software R - introdução
Como usar a ajuda do RO R tem diversas funções que podemos usar para fazer oscálculos desejados. O uso básico de uma função é escrever onome da função e colocar os argumentos entre parênteses.Para ver a documentação sobre uma funçao do R podemosdigitar na barra de comandos:
help(plot)
Software R - introdução
Acessando uma base de dados
A forma mais adequada vai depender do tamanho do conjuntode dados, e se os dados já existem em outro formato paraserem importados ou se serão digitados diretamente no R.
Entrando com dados diretamente no R:
Pode-se definir um vetor:
A <- c(2, 5, 8)
Software R - introdução
Acessando uma base de dadosLer um arquivo .txt no R:Exemplo: o arquivo tem 14 colunas e 24 linhas e deve ser “lido”linha a linha.
Software R - introdução
Acessando uma base de dados
Ler um arquivo .txt no R:
Pode-se usar a função scan() junto com a função matrix():
data = matrix(scan("~/Documents/Insper/Archive/presidenteprudente.txt"),
24,14,byrow=TRUE)
Obs: Colocar o caminho adequado.
Software R - introdução
Acessando uma base de dados
Ler um arquivo .txt no R:
Pode-se usar a função read.table():
data = read.table("airline.txt",header=TRUE)
Nesse caso, os dados já estavam arrumados em colunas, eutilizamos a opção header=TRUE para notar que a primeiralinha é de títulos das variáveis.
Software R - introdução
Acessando uma base de dados
Ler um arquivo .csv no R:
Pode-se usar a função scan() junto com a função matrix():
petrobras<-read.csv("~/Documents/Insper/Archive/petrobras.csv")
Obs: Colocar o caminho adequado.Obs2: Pode-se usar o menu do RStudio > Import Dataset > FromText File > escolher arquivo e verificar as delimitações do mesmo.Assim é possível visualizar os dados no Environment. Não funcionacom arquivos do Excel.
Software R - introdução
Como fazer gráficos no R
Para fazer gráficos usamos a função plot(), por exemplo:
plot(petrobras[,4]/1000000,xlab="Day",ylab="Volume (in millions)",type="l",main="Volume Petro")
# input é coluna 4 do arquivo (em milhões)# ylab e xlab definem a legenda dos eixos# type é o tipo de linha# main é o título do gráfico
Software R - introdução
Como fazer gráficos no R
0 500 1000 1500 2000 2500 3000 3500
050
100
150
Volume Petro
Day
Vol
ume
(in m
illio
ns)
Software R - introdução
Como fazer gráficos no ROutro exemplo, agora dois gráficos na mesma figura:
0 50 100 150 200 250
020
040
0
Ano
Indi
ce p
luvi
omet
rico
Presidente Prudente
0 50 100 150 200 250
040
080
012
00
Ano
Indi
ce p
luvi
omet
rico
Ribeirao Preto
Software R - introdução
Como fazer gráficos no RPara esse exemplo usamos:
par(mfrow=c(2,1))
#Usamos par(mfrow=c(nrows,ncols))# para alinhar os gráficos na mesma figura
data = matrix(scan("~/Documents/Insper/Archive/presidenteprudente.txt"),
24,14,byrow=TRUE)y = matrix(t(data[,2:13]),24*12,1)y[y==999] = NAplot(y,type="l",xlab="Ano",
ylab="Indice pluviometrico")title("Presidente Prudente")
Software R - introdução
Como fazer gráficos no R(continuação)
data = matrix(scan("~/Documents/Insper/Archive/ribeiraopreto.txt"),
24,14,byrow=TRUE)y = matrix(t(data[,2:13]),24*12,1)y[y==999] = NAplot(y,type="l",xlab="Ano",
ylab="Indice pluviometrico")title("Ribeirao Preto")
# Utilizamos a função t() para transpor os dados# e corrigimos y==999 como dado faltante
Software R - introdução
Como fazer gráficos no R
data = read.table("airline.txt",header=TRUE)attach(data)year = 1949:1960ind = seq(1,nrow(data),by=12)plot(airline,xlab="Year",ylab="Total passengers (in thousands)",
axes=FALSE,type="l")axis(2);box();axis(1,at=ind,lab=year)
Aqui formamos uma sequencia de números de 1 até n(tamanho dos dados), de 12 em 12, ou seja: 1 13 25 . . .O objetivo deste passo é que a legenda do eixo y só exiba osanos de 12 em 12 meses.
Software R - introdução
Como fazer gráficos no R
## The following objects are masked from data (pos = 3):#### airline, DATA, mes
Year
Tota
l pas
seng
ers
(in th
ousa
nds)
100
300
500
1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960
Software R - introdução
Usando alguns comandos para Séries Temporais
acf(airline)
0 5 10 15 20
−0.
20.
20.
61.
0
Lag
AC
F
Series airline
Software R - introdução
Usando alguns comandos para Séries Temporais
pacf(airline)
5 10 15 20
−0.
50.
00.
51.
0
Lag
Par
tial A
CF
Series airline
Software R - introdução
Usando alguns comandos para Séries Temporaislibrary("astsa")acf2(airline)
5 10 15 20
−0.
50.
51.
0
Series: airline
LAG
AC
F
5 10 15 20
−0.
50.
51.
0
LAG
PAC
F