mengenal sebagian tipe slowly changing dimensions...
Post on 31-Mar-2019
259 Views
Preview:
TRANSCRIPT
Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org
Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),
dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak
diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org
Mengenal Sebagian Tipe Slowly Changing Dimensions DWH
Fadil Nur Syeha
fadil.syeha@raharja.info
Abstrak
Dalam pengelolaan data, teknologi bernama data warehouse memiliki peran penting
untuk mengelola data dalam volume besar sesuai dengan kebutuhan sebuah Organisasi
atau Perusahaan. Data data yang tersimpan tesebut dapat mengalami perubahan, hal ini
merefleksikan aspek dinamis dari data warehouse sehingga memerlukan updating
beberapa dimensi table dimensi memiliki peran yang sangat penting dalam setiap Data
Warehouse. Peran utama table dimensi adalah untuk mendukung catatan table fakta
dengan deskripsi dan informasi lain tentang entitas yang terlibat pada catatan ini. Untuk
mendukung pembentukan dimensi yang dinamis dalam sebuah data warehouse
diimplementasikan sebuat kriteria dimensional yaitu Slowly Changing Dimensions (SCD)
sehingga setiap perubahan data dapat terpelihara dengan baik. Pengertian singkat SCD
sendiri adalah teknik menyimpan dimensi pada data warehouse dalam hubungannya
terhadap perubahan dimensi dan atribut data. Terdapat banyak pendekatan mengenai tipe-
tipe dari SCD, namun yang paling populer pendekatan dari SCD ada 6 yaitu, retain
original (tipe 0), overwrite (tipe 1), add new row (tipe 2), add new attribute (tipe 3), add
history table (tipe 4) dan Combine Approach (tipe 6).
Kata Kunci: Data Watehouse, Slowly Change Dimension, Tipe SCD
Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org
Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),
dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak
diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org
Pendahuluan
Informasi dan data yang dikelola atau dimiliki oleh suatu organisasi atau perusahaan kini
telah berubah menjadi aset berharga untuk menentukan keputusan dalam perencanaan dan
pengembangan strategi dalam rangka memajukan organisasi atau perusahaan itu sendiri.
Selain itu memutuskan kebijakan yang cepat dan tepat, data dan informasi tersebut perlu
dipelihara untuk kemudahan akses sewaktu-waktu dibutuhkan misalnya untuk keperluan
analisis seperti data penjualan suatu barang dan lain-lain. Kemudahan akses data
operasional yanh bersifat historical dapat dikembangkan menjadi informasi guna
kebutuhan perencanaan atau kebutuhan strategis ke pedan dengan tujuan memperoleh
informasi yang relevan bagi kebutuhan organisasi yang dipakai untuk pengambilan
keputusan.
Untuk mendukung pengelolaan data yang baik, khususnya bagi organisasi atau
perusahaan yang memilik data dengan volume besar dan tersebar ke dalam database
terpisah, di era saat ini telah ada teknologi Data Warehouse yang dapat menggabungkan
data dari berbagai sumber data operasional dan sikronisasi datanya dapat dilakukan secara
periodik maupun real-time, disesuai dengan kebutuhan yang ada. “A Data Warehouse is
a Subject Oriented, Integrated, Non-Volatile, and Time-variant collection of data in
support of management’s decisions” Penerapan Data Warehouse yang baik dan sesuai
dengan kebutuhan secara otomatis memudahkan pengelolaan data dan proses
pengambilan informasi dari sumber data.
Contoh, data penjualan dari masing-masing toko mengentrikan data penjualan yang
disimpan kedalam database terpusat di suatu perusahaan retail besar dapat diambil dengan
mudah rangkuman datanya ketika digudangkan dalam suatu basis data besar (Data
Warehouse) terlebih dahulu. Data yang telah disimpan dapat mengalami perubahan, hal
ini menunjukkan aspek dinamis dari Data Warehouse sehingga memerlukan updating
beberapa dimensi. Perubahan-perubahan dalam catatan dimensi dapat menyebabkan
situasi tidak teratur jika tidak diperlakukan dengan baik. Untuk mendukung pembentukan
dimensi yang dinamis dalam sebuah Data Warehouse diimplementasikan sebuah kriteria
Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org
Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),
dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak
diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org
Dimensional yaitu Slowly Changing Dimensions (SCD) sehingga data histori dapat
tersimpan dan diakses sewaktu-waktu.
Hasil dari sebuah Data Warehouse dapat dimanfaatkan untuk kepentingan OLAP (Online
Analytical Processing) yang memungkinkan dilakukan query dengan cepat dan
menghasilkan informasi secara multidimensi.
Pembahasan
Dmensi yang berubah perlahan dari waktu ke waktu, dimensi ini menyimpan nilai atau
data lama dari atribut sebuah dimensi. Dimensi adalah struktur yang mengkategorikan
kumpulan informasi sehingga. Dimensi dalam manajemen data dan data warehouse
(gudang data) berisi data yang relatif statis. Namun data dari dimensi dapat berubah
secara perlahan dari waktu ke waktu dan pada interval yang tidak dapat diprediksi. Jenis
data dari dimensi dapat dinamakan dengan Slowly Changing Dimension (SCD). Nilai
yang lama tersebut dapat disimpan untuk sebagai sebuah “sejarah perubahan nilai” dari
atribut sebuah dimensi yang berubah tersebut. Penyimpanan nilai yang lama ini
dapat dilakukan dengan cara membuat sebuah kolom yang khusus untuk menyimpan
nilai yang lama tersebut.
Pada pembahasan kali ini akan dijelaskan 4 tipe metodologi dari SCD, yaitu:
1. Type 0: retain original
2. Type 1: overwrite
3. Type 2: add new row
4. Type 3: add new attribute
Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org
Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),
dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak
diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org
1. Type 0 : Retain Original
Dapat disebut dengan “metode pasif”. Metodologi ini tidak ada tindakan khusus yang
dilakukan jika terjadi perubahan dalam suatu dimensi. Beberapa data dari dimensi
menjadi tetap sama seperti pertama kali dimasukkan.
Contoh: BirthOfDay.
2. Type 1 : Overwrite
Dapat disebut dengan “mengganti nilai lama”. Dalam metodologi ini tidak ada
riwayat dari perubahan dimensi yang disimpan dalam database. Nilai dimensi dari
data yang lama hanya diganti dengan yang baru. Jenis metode ini mudah dipelihara
(maintain) dan sering digunakan untuk data yang perubahannya disebabkan oleh
proses dari koreksi data, misalnya seperti penghapusan karakter khusus atau
memperbaiki ejaan data.
Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org
Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),
dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak
diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org
Contoh dari metode ini ditunjukkan pada tabel 1. Terdapat tabel yang memiliki data
Corporate dari kolom CustType, kemudia terdapat perubahan pada tabel 2. Kolom
CustType menjadi Retail. Perubahan tersebut dapat berubaha sesuai kedaan kondisi
data yang dibutuhkan saat ini.
Sebelum perubahan:
CustD CustName CustType
1 Cust_1 Corporate
Table 1: Sebelum perubahan CustType
Setelah perubahan:
CustD CustName CustType
1 Cust_1 Retail
Table 2: Setelah perubahan CustType
3. Type 2 : Add New Row
Dapat disebut dengan “membuat tambahan baris baru”. Dalam metodologi ini
melacak data historis dengan membuat beberapa records sebuah natural key diberikan
dalam tabel dimensi dengan surrogate key terpisah dan/atau nomor versi yang
berbeda. Riwayat tak terbatas dipertahankan untuk setiap masukan (insert).
Kondisi sebelum perubahan:
CustD CustName CustType
1 Cust_1 Corporate
Table 3: Sebelum perubahan CustType
Ada beberapa sub metode dalam type 2 ini, yaitu:
1) Menggunakan version number
Setelah perubahan:
CustD CustName CustType Version
Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org
Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),
dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak
diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org
1 Cust_1 Corporate 0
2 Cust_1 Retail 1
Table 4: Setelah perubahan CustType
Catatan: jika CustType mengalami perubahan, maka Version akan meningikat
secara berurutan.
2) Menambahkan kolom ‘Effective Date’
Sesudah perubahan:
CustD CustName CustType StartDate EndDate
1 Cust_1 Corporate 01-01-2018 \s\31-01-2018
2 Cust_1 Retail 01-02-2018 NULL
Table 5: Setelah perubahan CustType
Catatan: NULL pada EndDate di baris kedua menunjukan versi tupple saat ini.
3) Menambahkan kolom ‘Effetive Date’ dan ‘Current Flag’
Sesudah perubahan:
CustD CustName CustType EffectiveDate CurrentFlag
1 Cust_1 Corporate 01-01-2018 \N
2 Cust_1 Retail 01-02-2018 Y
Table 6: Setelah perubahan CustType
Catatan: nilai 'Y' dari CurrentFlag menunjukkan versi tupel saat ini.
4. Type 3 : Add New Attribute
Dapat disebut dengan “Menambahkan Kolom Baru”. Dalam tipe ini biasanya hanya
nilai dimensi saat ini dan sebelumnya disimpan di database. Nilai baru dimuat dalam
kolom ‘Sekarang/Baru’ (Current Type) dan kolom lama dimuat dalam kolom lama
yang diberi nama ‘Lama/Sebelumnya’ (Previous Type). SCD tipe 3 menggunakan
Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org
Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),
dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak
diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org
kolom untuk menyimpan datalama setelah perubahan terjadi, yang
menyebabkannya tidak terlalu fleksibel untuk Metode ini ideal digunakan pada
situasi dimana tidak terlalu banyak data peruabahan yang ingin disimpan, atau
jumlah perubahan yang ingindisimpan diketahui secara pasti.Metode ini juga sesuai
apabila perubahan data pada atribut tersebut akan mempengaruhi banyakbaris data
lainnya, atau nilai atribut ini diubah oleh banyak baris data lain secara bersamaan.
Sebelum perubahan:
CustD CustName CurrentType PreviousType
1 Cust_1 Corporate Corporate
Table 7: Sebelum perubahan kolom CurrentType
Setelah perubahan:
CustD CustName CurrentType PreviousType
1 Cust_1 Retail Corporate
Table 7: Setelah perubahan kolom CurrentType
Itulah sebagian Metodologi yang ada pada Slowly Changing Dimensions.
Penutup
Kesimpulan:
Dari data yang telah dipaparkan diatas maka penulis dapat menyimpulkan bawha setiap
Type pada Slowly Changing Dimension memiliki kelebihan dan kekurangan masing
masing, semua dapat diterapkan sesuai dengan kebutuhan dan kepentingan Organisasi
atau Perusahaan itu sendiri.
Saran:
Meskipun penulis menginginkan kesempurnaan dalam penulisan artikel ini akan tetapi
pada kenyataannya masih banyak kekurangan yang perlu penulis perbaiki. Hal ini
dikarenakan masih minimnya pengetahuan penulis. Oleh karena itu kritik dan saran yang
Lisensi Dokumen: Copyright © 2008-2019 ilmuti.org
Seluruh dokumen di ilmuti.org dapat digunakan, dimodifikasi dan disebarkan secara bebas untuk tujuan bukan komersial (nonprofit),
dengan syarat tidak menghapus atau merubah atribut penulis dan pernyataan copyright yang disertakan dalam setiap dokumen. Tidak
diperbolehkan melakukan penulisan ulang, kecuali mendapatkan ijin terlebih dahulu dari ilmuti.org
membangun dari para pembaca sangat penulis harapkan sebagai bahan evaluasi untuk
kedepannya.
Referensi
Sumber:
en.wikipedia.org/wiki/Slowly_changing_dimension
mti.binus.ac.id/2018/05/21/slowly-changing-dimension-pada-data-warehouse/
henryeka.wordpress.com/2013/02/12/scd-slowly-changing-dimension/
media.neliti.com/media/publications/88455-ID-penerapan-slowly-changing-
dimensions-unt.pdf
asriyar.wordpress.com/2012/10/17/slowly-changing-dimension-scd/
R. Kimball,J.Caserta.,"The data warehouse ETL toolkit : practical techniques for
extracting, cleaning, conforming, and delivering data",Wiley, 2004.
Biografi
Nama saya Fadil Nur Syeha, saya mahasiswa semester 6 jurusan Sistem Informasi di STMIK
Raharja, konsentrasi yang saya ambil adalah Sistem Informasi Manajemen. Saya sangat
tertarik dengan dunia IT dan wirausaha. Hobi saya berolahraga, membaca, menjelajah
internet, bermain game dan traveling.
FOTO
top related