tipe data dan eksplorasi data menggunakan weka dan r
Post on 14-Apr-2017
288 Views
Preview:
TRANSCRIPT
TIPE DATA DAN EKSPLORASI DATA MENGGUNAKAN WEKA DAN RPraktikum 3 Data Mining – 23 Februari 2016
1Eksplorasi data
Eksplorasi data merupakan langkah untuk memahami data sebelum dilakukan praproses.
Dalam eksplorasi data, hal yang harus diperhatikan yaitu tipe data
Tipe data terdiri dari nominal, ordinal, interval, rasio
2Eksplorasi data
2Eksplorasi data
3Eksplorasi data dengan Weka
Weka hanya dapat mengenali tipe data nominal dan numerik. Gunakan data weather.arff yang telah tersedia di weka
Gambar 3 Statistika ringkasan dari atribut outlook
4Eksplorasi data dengan Weka
Gambar 4 Statistika ringkasan dari atribut temperature
5Eksplorasi data dengan Weka
Gambar 5 Histogram atribut temperature terhadap kelas play
[Dekatkan kursor ke grafik]
6Eksplorasi data dengan Weka
Gambar 6 Histogram atribut windy terhadap kelas play
7Eksplorasi data dengan Weka
Gambar 7 Scatter plot humidty terhadap temperature
8Eksplorasi data dengan Weka
Gambar 8 instance info [double klik tanda kross pada scatter plot]
9Eksplorasi data dengan Weka
Latihan :coba jelaskan hasil dari statistika ringkasan dan visualisasi data dengan menggunakan data labor.arff yang terdapat di weka
10Eksplorasi data dengan R
Eksplorasi pada R tidak jauh berbeda dengan weka, hanya saja di R memiliki tipe data dan visualisasi data yang lebih lengkap dibandingkan weka.
Untuk lebih jelasnya kita import data insurance.csv [Tersedia di http://bit.ly/insurance_csv] dan simpan pada variabel data .
Untuk melihat tipe data tiap atribut ketikkan perintah :
11Eksplorasi data dengan R
Jika dibandingkan dengan Weka, R memiliki tipe data yang lebih lengkap seperti int, Factor, num.
Untuk melihat statistika ringkasan (misal pada atribut age dan sex) ketikkan perintah :
Jika dibandingkan dengan Weka, R memiliki hasil statistika ringkasan lebih lengkap yaitu Min, Q1, Median, Mean, Q3, dan Max.
12Eksplorasi data dengan R
Beberapa visualisasi yang tersedia pada R yaitu histogram, pie chart, line chart, boxplot, scatter plot.
Untuk membuat boxplot ketiikan perintah :
13Eksplorasi data dengan R
Untuk membuat histogram ketikkan perintah :
14Eksplorasi data dengan R
Untuk membuat scatter plot ketikkan perintah :
15Eksplorasi data dengan R
Latihan : coba jelaskan hasil dari statistika ringkasan dan visualisasi data dengan menggunakan data usedcars.csv [Tersedia di
http://bit.ly/1SZ0FPW] dengan menggunakan R
16Eksplorasi data
Terdapat tiga jenis analisa yang dapat dilakukan dengan menggunakan scatter plot:
1 Scatter plot dapat menunjukkan hubungan (korelasi) antara dua variabel/atribut dan juga dapat digunakan untuk mendeteksi hubungan non linier antar dua variabel/atribut.
2 Ketika label dari kelas tersedia scatter plot dapat digunakan untuk menyelidiki derajat kedua atribut dalam memisahkan kelas
3 Menganalisa pencilan/outlier.
17Eksplorasi data
Berikut perbedaan secara general terkait eksplorasi data dengan menggunakan Weka dan R
R WekaStatistika Ringkasan
Min, Max, Q1,Median,Q3,Mean
Min, Max, StdDev, Mean
Visualisasi Data Histogram, Scatter plot, pie chart, line chart, box plot
Scatter plot, Histogram
9
[Tugas LKP Tersedia di LMS]
top related