pengantar r

29
PENGANTAR R Juli, 2012 S Chambers, Becker, Wilks 1984: Bell Labs S-Plus 1988: Statistical Sciences 1993: MathSoft 2001: Insightful 2008: TIBCO R Ihaka & Gentleman 1996 (The R Project) Why R? Free Open source Many packages Large support base Multi- platform

Upload: afdan-rojabi

Post on 16-Aug-2015

84 views

Category:

Education


4 download

TRANSCRIPT

PENGANTAR RJuli, 2012

SChambers, Becker, Wilks

1984: Bell Labs

SChambers, Becker, Wilks

1984: Bell Labs

S-Plus1988: Statistical Sciences

1993: MathSoft2001: Insightful2008: TIBCO

S-Plus1988: Statistical Sciences

1993: MathSoft2001: Insightful2008: TIBCO

RIhaka & Gentleman

1996(The R Project)

RIhaka & Gentleman

1996(The R Project)

Why R?• Free

• Open source• Many packages

• Large support base

• Multi-platform

PENGANTAR RJuli, 2012

R E

V I E

W

POPULASI adalah seluruh obyek yang mungkin terpilih atau keseluruhan ciri yang dipelajari. Ukuran populasi dapat terhingga (countable) atau tak terhingga (uncountable).

Sampel adalah sebagian dari populasi. Artinya tidak akan ada sampel jika tidak ada populasi.

POPULASI

SAMPEL

sam

plin

g

infe

ren

si

Nilai sebenarnya dari sifat populasi disebut dengan parameter populasi, yang biasanya dilambangkan dengan huruf Yunani seperti (mu), (sigma), (pi), (rho), dan (theta).

PENGANTAR RJuli, 2012

D A T A = DATASETKumpulan nilai yang diperoleh dari hasil pengukuran atau penghitungan suatu variabel.

Ob

jek

varia

te/n

ilai

VARIABEL

Sebagai konsep, kualitas, karakteristik, atribut, atau sifat-sifat dari suatu objek (orang, benda, tempat, dll) yang nilainya berbeda-beda antara satu objek dengan objek lainnya dan sudah ditetapkan oleh peneliti untuk dipelajari dan ditarik kesimpulannya

Variabel

R E

V I E

W

Observasi = Percobaan (eksperiment) dimaknai sebagai proses membangkitkan sekumpulan data atau tiap proses yang menghasilkan data mentah.

PENGANTAR RNOTASI PENCATATAN DATA

Ob

jek

varia

te/n

ilai

Variabel

R E

V I E

W

Statistika bermanfaat untuk mempelajari populasi, menganalisis populasi.

Dalam mempelajari populasi, kita memfokuskan pada satu atau lebih karakteristik dari unit-unit populasi. Karakteristik ini dinamakan VARIABEL.

Contoh : Kita mungkin tertarik dengan variabel umur, konsumsi pulsa, penghasilan, tingkat pendidikan dsb.

Karena keterbatasan waktu dan biaya untuk meneliti suatu populasi, umumnya diambil sejumlah sampel.

Hasil pengukuran variabel terhadap objek-objek pengamatan (anggota sampel / populasi) dinamakan data atau dataset.(jamak dari datum atau variate atau nilai).

PENGANTAR RNOTASI PENCATATAN DATA

R E

V I E

W

resp Sex Umur Jml Anak Berat Badan Tinggi Badan

1 0 57 1 65 158

2 1 70 3 100 175

3 0 45 0 71 162

4 0 38 2 58 164

5 0 25 1 81 170

...

n 1 1 4 85 172

PENGANTAR RNOTASI PENCATATAN DATA

A = (0 57 1 65 1551 70 3 100 1750 45 0 71 100 53 2 55 1640 25 1 51 179... ... ... ... ...1 1 4 55 172

)Masing-masing baris merepresentasikan satu pengamatan = RecordNilai-nalia hasil pengematan terhadap anggota sampel (Individu) dicatat dalam satu baris.

Setiap KOLOM merepresentasikan nilai satu VARIABEL = Field

PENGANTAR RNOTASI PENCATATAN DATA

Variabel 1 Variabel 2 ... Variabel k ... Variabel p

Item 1 x11

x12

... x1k

... x1p

Item 2 x21

x22

... x2k

... x2p

......

......

......

Item j xj1

xj2

... xjk

... xjp

......

......

......

Item n xn1

xn2

... xnk

... xnp

PENGANTAR RNOTASI PENCATATAN DATA

A = (x11 x 12 ... x1k ... x 1p

x 21 x 22 ... x 2k ... x 2p

... ... ... ... ... ...x j1 x j2 ... x jk ... x jp... ... ... ... ... ...x n1 x n2 ... x nk ... x np

)X̄ k = 1

n ∑j=1

n

x jk s12 1n∑j=1

n

(x j1− X̄ 1)2 sk

2 1n∑j=1

n

( x jk − X̄ k)2 dimana k=1,2,. .. , p

PENGANTAR RNOTASI PENCATATAN DATA

Contoh : Observasi dilakukan terhadap Toko Buku Gramedikau untuk melihat hubungan antara harga buku dengan banyaknya buku yang terjual. Pengamatan diperoleh sebagai berikut :

Penjualan Harga Buku

5 80

12 40

8 60

2 110

Tuliskan hasil pengamatan tersebut dalam matriks !

A = ( 5 8012 408 602 110

)

PENGANTAR RManajemen Data

DATA OBJEKOBJEK

Type Data

Mode Data

Vektor Matriks List

Data Frame Array Factor

Function

Numerik Komplex

Logical Character

PENGANTAR RManajemen Data

Mode Contoh di console

Numerik >23>c(23,14,15,16)>data.bulan<-c(1,2,3,4,5,6,7,8,9,10,11,12)

Complex >2+5i>sqrt(as.complec(-5))

Logical >c(T,F,F,T,F,T,F,F)>data.tahun > 1967

Character >c(“Amir”,”Muis”,”oke”)>c(“F”,”T”,”F”,”34”)

c() adalah fungsi untuk membuat vektor.

<- adalah tanda asignment untuk memberi nama suatu objek

PENGANTAR RManajemen Data

Nama Objek “Case Sensitive” – membedakan huruf besar dan huruf kecil.

Nama Objek harus dimulai dengan HURUF dan ditambah dengan kombinasi dari huruf besar, angka, huruf kecil dan titik.

dataqxydataku.12.juli

1dataqx-yDataku=12.juli

Assignment atau pemberian nama suatu objek digunakan operator “<-” atau “=”

PENGANTAR RJenis Jenis Data Objek === VEKTOR

> 4+6[1] 10

R melakukan penghitungan skalar aritmetik yang menhasilkan nilai skalar 10. Oleh R dianggap sebagai vektor dengan panjang 1[1] menunjukkan elemen pertama dari vektor

Vektor merupakan suatu array atau himpunan bilangan, character atau string, logikal value dan merupakan objek yang paling dasar dalam R.

Pada data vektor harus digunakan mode tunggal, sehingga gabungan dua data atau lebih yang berbeda mode tidak dapat dilakukan ke dalam satu objek vektor.

Jika ini dilakukan maka R akan mengubah data ke dalam mode yang lebih umum.

PENGANTAR RJenis Jenis Data Objek === VEKTOR

> c(T,1:10) [1] 1 1 2 3 4 5 6 7 8 9 10

> c("F",F,T)[1] "F" "FALSE" "TRUE"

> c("A",2,4,F,T)[1] "A" "2" "4" "FALSE" "TRUE"

c() adalah fungsi untuk membuat vektor. Bisa dikatakan sebagai combine

PENGANTAR R

PENGANTAR RPemberian NAMA OBJEK

=== Assignment >x<-12 .6

>x

[1] 12.6

>s<-”a adalah string” >s

[1] "a adalah string"

>t<-TRUE>t

[1] TRUE

>t<-true Error: object 'true' not found

PENGANTAR R

PENGANTAR RPemberian NAMA OBJEK

=== Assignment VARIABEL

PENGANTAR R

=== Assignment

>x<letters 1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j" "k" "l" "m" "n" "o" "p" "q" "r" "s"[20] "t" "u" "v" "w" "x" "y" "z"

>length(lettters) > length(letters)[1] 26

PENGANTAR RJenis Jenis Data Objek === VEKTOR

> 6[1] 6

> x<-6> x[1] 6

> y<-4> z<x+yError: object 'z' not found

> z<-x+y> z[1] 10

> ls()[1] "x" "y" "z"

Fungsi ls() untuk me list objek yang telah dibuat

PENGANTAR RJenis Jenis Data Objek === VEKTOR

> z<-c(5,9,1,0)> z[1] 5 9 1 0

Fungsi c() untuk membuat vektor atau meng combine vector.

> x<-c(5,9)> y<-c(1,0)> z<-c(x,y)> z[1] 5 9 1 0

PENGANTAR RJenis Jenis Data Objek === VEKTOR

> x<-c(10,5,3,6)> x[1] 10 5 3 6> y<-c(x,0.555,x,x)

> y [1] 10.000 5.000 3.000 6.000 0.555 10.000 5.000 3.000 6.000 10.000[11] 5.000 3.000 6.000

> round(y,1) [1] 10.0 5.0 3.0 6.0 0.6 10.0 5.0 3.0 6.0 10.0 5.0 3.0 6.0

> z<-x*x> z[1] 100 25 9 36

PENGANTAR RJenis Jenis Data Objek === VEKTOR

> b<-c(10,5,14,12,8,11,9,10,16,20)> b [1] 10 5 14 12 8 11 9 10 16 20

> b[2][1] 5

> b[c(1,3,5)][1] 10 14 8

> b[-c(1,10)][1] 5 14 12 8 11 9 10 16

> b[b>10][1] 14 12 11 16 20

> r<-b[b>10]> r[1] 14 12 11 16 20

PENGANTAR RJenis Jenis Data Objek === VEKTOR

> x<-1:10> x [1] 1 2 3 4 5 6 7 8 9 10

Fungsi seq() untuk membuat vektor dengan nilai yang berurutan

> seq(1,9,by=2)[1] 1 3 5 7 9

> seq(8,20,length=6)[1] 8.0 10.4 12.8 15.2 17.6 20.0

> rep(1:4,4) [1] 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4

> rep(1:4,rep(4,4)) [1] 1 1 1 1 2 2 2 2 3 3 3 3 4 4 4 4

Fungsi rep() untuk membuat vektor dengan nilai pengulangan

PENGANTAR RJenis Jenis Data Objek === VEKTOR

> rep(0,100) [1] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 [38] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 [75] 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

> rep(1:3,6) [1] 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3 1 2 3

> rep(1:3,c(6,4,2)) [1] 1 1 1 1 1 1 2 2 2 2 3 3

PENGANTAR RJenis Jenis Data Objek === VEKTOR

> x<-c(6,8,9)> y<-c(1,2,4)

> z<-x*y> t<-x+y

> x+2[1] 8 10 11

> z[1] 6 16 36

> t[1] 7 10 13

> x<-c(10,5,3,6)

> length(x)[1] 4

> sum(x)[1] 24

> prod(x)[1] 900

> max(x)[1] 10

> min(x)[1] 3

PENGANTAR RManipulasi Data

Diberikan data observasi tinggi badan Mahasiswa Informatika 49 sbb : 155, 160, 171, 182, 162, 153, 190, 167, 168, 165, 191

> tinggi.mahasiswa<-c(155,160,171,182,162,153,190,167,168,165,191)

> sort(tinggi.mahasiswa) [1] 153 155 160 162 165 167 168 171 182 190 191

> median(tinggi.mahasiswa)[1] 167

> mean(tinggi.mahasiswa)[1] 169.4545

> round(mean(tinggi.mahasiswa),1)[1] 169.5

> var(tinggi.mahasiswa)[1] 169.8727

> sd(tinggi.mahasiswa)[1] 13.03352

> quantile(tinggi.mahasiswa,0.25)25% 161

> quantile(tinggi.mahasiswa,0.50)50% 167

> quantile(tinggi.mahasiswa,0.75) 75% 176.5

PENGANTAR RManipulasi Data

> datas<-c(1,3,5,2,9)> mean(datas)[1] 4

> datas<-c(1,3,5,2,9,0,7,10)> mean(datas)[1] 4.625

> datas<-c(1,3,5,2,9,NA,7,10)> mean(datas)[1] NA

> mean(datas,na.rm=T)[1] 5.285714

PENGANTAR RMatriks dan Array

> x<-1:8> dim(x)<-c(2,4)> x [,1] [,2] [,3] [,4][1,] 1 3 5 7[2,] 2 4 6 8

> x<-matrix(1:8,2,4,byrow=F)> x [,1] [,2] [,3] [,4][1,] 1 3 5 7[2,] 2 4 6 8

> x<-matrix(1:8,2,4,byrow=T)> x [,1] [,2] [,3] [,4][1,] 1 2 3 4[2,] 5 6 7 8

PENGANTAR RMatriks dan Array

> cbind(c(1,2),c(3,4)) [,1] [,2][1,] 1 3[2,] 2 4

> x<-c(5,7,9)> y<-c(6,3,4)> z<-cbind(x,y)> z x y[1,] 5 6[2,] 7 3[3,] 9 4

> dim(z)[1] 3 2

> d<-rbind(x,y)> d [,1] [,2] [,3]x 5 7 9y 6 3 4

> dim(d)[1] 2 3

> rbind(z,z) x y[1,] 5 6[2,] 7 3[3,] 9 4[4,] 5 6[5,] 7 3[6,] 9 4

> cbind(z,z) x y x y[1,] 5 6 5 6[2,] 7 3 7 3[3,] 9 4 9 4

PENGANTAR RMatriks dan Array

> z<-c(5,7,9,6,3,4)> z1<-matrix(z,nrow=3)> z1 [,1] [,2][1,] 5 6[2,] 7 3[3,] 9 4

> z2<-matrix(z,ncol=3)> z2 [,1] [,2] [,3][1,] 5 9 3[2,] 7 6 4

> z3<-matrix(z,ncol=2)> z3 [,1] [,2][1,] 5 6[2,] 7 3[3,] 9 4

PENGANTAR RMatriks dan Array

A = (3 21 −1) A = (1 4 0

0 1 −1)