6
BAB 2
LANDASAN TEORI
2.1 Teori-Teori Umum
2.1.1 Pengertian Sistem
Menurut O'Brien dan Marakas (2010, p. 26) sistem adalah sebuah set
komponen yang saling berhubungan, dengan batas-batas yang jelas, saling
bekerja sama untuk mencapai tujuan umum dengan cara menerima input dan
menghasilkan output di dalam sebuah proses transformasi yang teroganisir.
Diperkuat oleh teori diatas sistem merupakan kumpulan komponen
yang saling berintegrasi dan salling bekerja sama dengan target mencapai
tujuan organisasi melalui tahap menerima input, memproses, dan
menghasilkan output di dalam sebuah transformasi yang terorganisir.
2.1.2 Pengertian Informasi
Menurut O'Brien dan Marakas (2010, p. 34) informasi adalah data
yang telah dikonversi yang memiliki arti dan berguna untuk pengguna akhir.
Diperkuat oleh teori diatas informasi merupakan data mentah yang
telah diolah sedemikian rupa sehingga menghasilkan sesuatu yang berguna
untuk pengguna akhir. Informasi dapat diolah dan dikembangkan lagi ke
tahap selanjutnya sehingga menjadi knowledge yang lebih penting untuk
mendukung dalam pengambilan keputusan oleh pihak eksekutif.
7
2.1.3 Pengertian Sistem Informasi
Menurut O'Brien dan Marakas (2010, p. 4) sistem informasi dapat
berupa kombinasi yang terorganisir dari orang, hardware, software, jaringan
komunikasi, sumber data, kebijakan, dan prosedur yang tersimpan, diterima,
ditransform, dan menyebarkan informasi dalam sebuah organisasi.
Diperkuat oleh teori diatas sistem informasi merupakan kumpulan
objek yang terintegrasi dengan baik yang terdiri dari orang, hardware,
software, jaringan, sumber data, dan lain-lain yang diterima, disimpan,
ditransform, dan untuk menyebarkan informasi kepada pihak-pihak yang
membutuhkan di dalam sebuah perusahaan.
2.1.4 Komponen-komponen Sistem Informasi
Menurut O'Brien dan Marakas (2010, p. 32) komponen-komponen
sistem informasi terdiri dari sumber daya manusia, sumber daya hardware,
sumber daya software, dan jaringan.
2.1.4.1 Sumber Daya Manusia
Menurut O'Brien dan Marakas (2010, p. 32) manusia
memegang peran untuk kesuksesan operasi dari semua sistem
informasi. Sumber daya manusia meliputi pengguna akhir dan pakar
SI.
a. Pengguna akhir
Adalah orang-orang yang menggunakan sistem informasi atau
yang menghasilkan informasi itu sendiri.
8
b. Pakar SI
Adalah orang-orang mengembangkan dan mengoperasikan sistem
informasi.
2.1.4.2 Sumber Daya Hardware
Menurut O'Brien dan Marakas (2010, p. 32) konsep dari
sumber daya hardware meliputi semua alat dan material keras yang
digunakan untuk memproses informasi.
2.1.4.3 Sumber Daya Software
Menurut O'Brien dan Marakas (2010, p. 33) konsep sumber
daya software meliputi serangkaian instruksi pemroses informasi.
Konsep umum software tidak hanya terdiri dari serangkaian instruksi
operasi yang disebut program, yang diarahkan dan dikontrol oleh
hardware computer, tapi juga serangkaian instruksi proses informasi
yang disebut prosedur yang diperlukan manusia.
2.1.4.4 Sumber Daya Data
Menurut O'Brien dan Marakas (2010, p. 33) data tidak hanya
sekedar bahan mentah dari sistem informasi. Konsep sumber daya
data telah diperluas oleh menejer dan para sistem informasi
professional. Data dapat berupa banyak bentuk, termasuk data
alfanumerik tradisional, yang tersusun dari angka, hufur, dan karakter
lain yang mendeskripsikan transaksi bisnis dan entitas lainnya; data
teks terdiri dari kalimat dan paragraf yang digunakan dalam menulis
komunikasi; gambar data terdiri dari bentuk grafik dan angka atau
9
fotografi dan gambar video; dan data suara terdiri dari suara manusia
dan suara lain.
2.1.5 Pengertian Data
Menurut O'Brien dan Marakas (2010, p. 34) kata data merupakan
bentuk jamak dari datum, meskipun data secara umum merepresentasikan
bentuk tunggal dan jamak. Data merupakan fakta mentah atau pengamatan
baku mengenai fenomena fisik atau transaksi bisnis.
Diperkuat oleh teori diatas data adalah fakta mentah dari suatu
pengamatan yang dilakukan terhadap objek tertentu yang dapat berupa
fenomena fisik atau transaksi bisnis dari suatu organisasi.
2.1.6 Pengertian Data Mart
Menurut Connolly dan Begg (2010, p. 1214) data mart adalah sebuah
subset dari data warehouse yang mendukung persyaratan departemen tertentu
atau fungsi bisnis atau memberikan dukungan kepada pengguna yang
membagikan persyaratan yang sama untuk analisis proses bisnis tertentu.
Diperkuat oleh teori diatas data mart merupakan bagian-bagian yang
terdapat di dalam data warehouse yang dibuat untuk mendukung persyaratan
departemen-departemen tertentu atau fungsi bisnis yang memberikan
dukungan kepada pengguna untuk dapat menganalisis bagian proses bisnis
dari departemen tersebut.
10
2.1.7 Database
Menurut O'Brien dan Marakas (2010, p. 173) database merupakan
kumpulan logika yang berhubungan dengan elemen-elemen data yang
terintegrasi. Database mengkonsolidasikan records yang sebelumnya
tersimpan didalam file-file yang terpisah didalam kelompok umum elemen
data yang menyediakan data untuk berbagai aplikasi.
Menurut Connolly dan Begg (2010, p65) database merupakan
kumpulan relasi logikal dari data, dan merupakan deskripsi dari data, yang
didesain untuk mempertemukan informasi yang dibutuhkan oleh sebuah
perusahaan.
Dapat disimpulkan database merupakan kumpulan logika dari data
yang berhubungan dengan elemen-elemen data yang terintegrasi, yang
kemudian digunakan untuk memperoleh informasi yang berguna bagi
perusahaan.
2.1.8 Database Management System (DBMS)
Menurut Connolly dan Begg (2010, p. 66) DBMS adalah sebuah
sistem perangkat lunak yang memungkinkan pengguna untuk menetapkan,
membuat, menjaga, dan mengontrol akses ke dalam database.
Menurut Frost, Day, dan Slyke (2006, p. 6) DBMS merupakan
sekumpulan program yang membantu menyimpan, mengatur, dan digunakan
untuk mengumpulkan data, tanpa memperhatikan bentuk.
11
Dapat disimpulkan DBMS adalah sebuah sistem yang membantu
pengguna untuk membuat, mengumpulkan data, menyimpan data, mengatur,
menjaga, dan mengontrol akses ke dalam database.
2.1.9 Backup Database
Menurut Connolly dan Begg (2005, p550) backup adalah proses
secara periodik mengambil salinan dari database dan log file kedalam media
penyimpanan offline.
Diperkuat oleh teori diatas backup dilakukan secara periodik dalam
waktu tertentu untuk mengambil salinan dari database dan menyimpan log
file dari database tersebut ke dalam media penyimpanan lain yang dapat
digunakan kembali sewaktu-waktu apabila terjadi masalah ataupun
keerusakan terhadap data yang ada di dalam database.
2.1.10 Key
Menurut Kendall dan Kendall (2005, p. 450) Key merupakan satu dari
item data pada record yang digunakan untuk mengidentifikasi record. Ketika
key secara unik mengidentifikasi sebuah record, maka itu disebut primary
key. Key disebut secondary key jika record yg diidentifikasi itu tidak unik.
Diperkuat oleh teori diatas key adalah indikasi untuk mengidentifikasi
sebuah data pada record apakah secara unik yang biasa disebut primary key,
atau secara tidak unik yang biasa disebut secondary key.
12
2.1.11 Entity
Menurut Connolly dan Begg (2010, p. 65) entity adalah sebuah objek
nyata (orang, tempat, benda, konsep, dan kejadian) dalam sebuah organisasi
yang akan direpresentasikan ke dalam database.
Diperkuat oleh teori diatas entity adalah objek nyata yang diteliti
dalam sebuah organisasi yang nantinya akan dimasukkan kedalam database.
2.1.12 Attribute
Menurut Connolly dan Begg (2010, p. 65) attribute adalah sebuah
sifat yang menggambarkan beberapa aspek dari objek yang ingin kira record.
Diperkuat oleh teori diatas attribute menggambarkan dan
mendeskripsikan apa saja yang dimiliki oleh sebuah entity yang akan
disimpan dalam record pada database.
2.1.13 Relationship
Menurut Connolly dan Begg (2010, p. 65) relationship adalah sebuah
asosiasi antara entitas-entitas.
Diperkuat oleh teori diatas relationship merupakan hubungan yang
digambarkan oleh entitas-entitas yang ada.
2.1.14 Tipe entitas
Menurut Connolly dan Begg (2010, p. 372) tipe entitas merupakan
sebuah kelompok dari objek dengan property yang sama, dimana
diidentifikasi oleh perusahaan sebagai keberadaan yang berdiri sendiri.
13
Diperkuat oleh teori diatas tipe entitas merupakan kumpulan entitas
yang berbagi atribut yang dimiliki beserta tipe dari atribut itu sendiri seperti
char, varchar, date, dan lain-lain.
2.1.15 ER Modeling
Menurut Connolly dan Begg (2010, p. 371) ER Modeling merupakan
pendekatan top-down pada desain database yang dimulai dengan identifikasi
data penting yang disebut entities dan relationships di antara data yang harus
direpresentasikan ke dalam model.
Diperkuat oleh teori diatas ER Modeling merupakan analisis dalam
bentuk model yang digunakan untuk menggambarkan data dalam bentuk
entitas, atribut, dan relationship antar entitas-entitas tersebut.
2.1.16 User Interface
Menurut O'Brien dan Marakas (2010, p. 140) user interface
merupakan bagian dari sistem operasi yang memungkinkan manusia
berkomunikasi dengan sistem tersebut sehingga manusia dapat memuat
program, mengakses file, dan menyelesaikan tugas lain.
Diperkuat oleh teori diatas User Interface merupkan tampilan dari
sistem operasi yang digunakan oleh pengguna untuk dapat membaca dan
berkomunikasi dengan sistem sehingga dapat melakukan input data, melihat
output data, mengakses file-file tertentu, dan melakukan beberapa tugas lain.
14
2.1.17 Relationship Type
Menurut Connolly dan Begg (2005, p346) relationship type
merupakan kumpulan asosiasi antara satu atau lebih tipe entitas yang
berpartisipasi. Setiap tipe relasional diberi nama yang menjelaskan fungsinya.
Diperkuat oleh teori diatas relationship type adalah kumpulan dari
hubungan-hubungan antar entitas yang tergabung dalam satu model yang
memiliki nama dan fungsi tersendiri.
2.1.18 Multiplicity
Menurut Connolly dan Begg (2010, p. 358) multiplicity adalah angka
dari kejadian yang mungkin terjadi dari sebuah tipe entitas yang berhubungan
dengan sebuah kejadian dari sebuah asosiasi entitas melalui sebuah hubungan
particular. Ada 3 tipe hubungan relationship :
• One-to-One (1:1) Relationships
Gambar 2.1 One-to-One(1:1) Relationships
(Connolly dan Begg, 2010, p. 358)
15
Sebuah diagram ER dari ManagesBranchrelationship Staf ditunjukkan pada
Gambar 2.1 untuk menyatakan bahwa anggota staf dapat mengatur nol atau
satu cabang, kita menempatkan sebuah 0 .. 1 'di samping entitas branch
tersebut. Untuk menyatakan bahwa cabang selalu memiliki seorang manajer,
kami menempatkan '1 .. 1 ' samping entitas staff tersebut. (Perhatikan bahwa
untuk hubungan 1:1, kita dapat memilih nama hubungan yang masuk akal di
kedua arah.)
• One-to-Many (1:*) Relationships
Gambar 2.2 One-to-Many (1:*) Relationships
(Connolly dan Begg, 2010, p. 359)
Sebuah diagram ER dari OverseesPropertyForRentrelationship Staf
ditunjukkan pada Gambar 2.2.untuk menyatakan bahwa anggota staf dapat
mengawasi nol atau lebih properti untuk disewakan, kami menempatkan '0 ..
* 'di sebelah entitas PropertyForRent. Untuk menyatakan bahwa setiap
properti untuk sewa adalah diawasi oleh nol atau satu anggota staf, kami
menempatkan '0 .. 1 'di samping entitas staff tersebut. (Catatan bahwa dengan
1: * hubungan, kita memilih nama hubungan yang masuk akal dalam 1: *
arah.)
16
Jika kita mengetahui minimum yang sebenarnya dan nilai-nilai maksimum
untuk multiplisitas, kita bisa menampilkan ini sebagai gantinya. Misalnya,
jika seorang anggota staf mengawasi minimal nol dan maksimum 100
properti untuk sewa, kita dapat mengganti '0 .. * 'dengan '0 .. 100'.
• Many-to-Many (*:*) Relationships
Gambar 2.3 Many-to-Many (*:*) Relationships
(Connolly dan Begg, 2010, p. 360)
Sebuah diagram ER dari koran mengiklankan hubungan PropertyForRent
ditunjukkan pada Gambar 2.3 untuk menyatakan bahwa surat kabar masing-
masing dapat mengiklankan satu atau banyak property untuk disewa, kami
menempatkan '1 .. * 'di sebelah jenis entitas PropertyForRent. Untuk
menyatakan bahwa setiap hak milik untuk sewa dapat diiklankan oleh nol
atau lebih newspaper, kami menempatkan '0 .. * 'di sebelah entitas
newspaper. (Perhatikan bahwa untuk *: * hubungan, kita dapat memilih nama
hubungan yang masuk akal di kedua arah.)
17
2.1.19 OLTP
Menurut Connolly dan Begg (2005, p. 1149) OLTP adalah sistem
yang didesain untuk mengatasi seluruh transaksi yang banyak, dengan
transaksi-transaksi yang khusus membuat perubahan kecil pada data
operasional perusahaan, yang mana data yang dibutuhkan perusahaan dapat
mengatasi operasional harian.
Menurut Kimball (2002, p. 408) OLTP merupakan deskripsi asli
untuk semua aktifitas dan sistem yang terasosiasi dengan masukan data yang
andal kedalam database. Sering digunakan dengan referensi ke relasional
database, walaupun OLTP bisa digunakan secara umum untuk
mendeskripsikan lingkungan dalam transaction-processing.
Dapat disimpulkan OLTP merupakan sistem yang terasosiasi dengan
database, yang didesain untuk mengatasi transaksi harian yang terjadi pada
perusahaan.
2.1.20 OLAP
Menurut Connolly dan Begg (2010, p. 1250) OLAP adalah perpaduan
dinamis, analisis, dan konsolidasi dari volume yang besar pada
multidimensional data.
Menurut Kimball (2002, p. 408) OLAP adalah definisi bebas yang
disusun berdasarkan prinsip-prinsip yang menyediakan dimensi framework
untuk membantu pengambilan keputusan. Istilah OLAP juga digunakan untuk
mendefinisikan konfederasi dari vendor yang menawarkan nonrelational,
18
produk database multidimensi yang bertujuan untuk membantu pengambilan
keputusan.
Menurut Mannino (2004, p. 609) OLAP terbagi kedalam tiga jenis,
yaitu MOLAP, ROLAP, dan HOLAP.
• MOLAP (Multidimensional OLAP)
Adalah mesin penyimpanan yang secara langsung menyimpan dan
memanipulasi data cubes. MOLAP biasanya memberikan performa
query terbaik, tetapi memiliki batasan terhadap kapasitas dari data
cubes.
• ROLAP (Relational OLAP)
Relasional DBMS tambahan yang mendukung multidimensional data.
ROLAP mendukung berbagai macam penyimpanan dan teknik
optimasi untuk mendapat ringkasan data.
• HOLAP
Merupakan mesin penyimpanan untuk data warehouse yang
menggabungkan ROLAP dan MOLAP. HOLAP meliputi
penyimpanan relasional dan multidimensional data sama baiknya
dengan menggabungkan data dari sumber relasional dan
multidimensional data untuk operasi data cubes.
Dapat disimpulkan OLAP adalah teknologi yang menggunakan
pendekatan secara multidimensional dari keseluruhan data yang menyediakan
proses yang cepat untuk strategi informasi yang berguna untuk analisis lebih
lanjut.
19
2.1.21 Data Warehouse
Menurut Inmon (2005, p. 29) data warehouse adalah subject-oriented,
integrated, nonvolatile, dan time-variant yang merupakan kumpulan data
yang bertujuan untuk membantu pengambilan keputusan.
Menurut Silberschatz, Korth, dan Sudarshan (2002, p. 843) data
warehouse adalah sebuah repositori (atau arsip) informasi yang terkumpul
dari berbagai sumber, tersimpan didalam sebuah sebuah skema yang teratur,
pada satu site. Ketika terkumpul, data yang tersimpan dalam jangka waktu
yang panjang memberikan ijin akses pada data historis. Data warehouse ini
memungkinkan pengguna terkonsolidasi langsung dengan data, membuat
decision-support query lebih mudah untuk ditulis.
Menurut Kimball dan Ross (2002, p. 397) data warehouse adalah
percampuran dari staging data warehouse sebuah organisasi dan area
presentasi, dimana operasional data secara spesifik terstruktur untuk query
dan performa analisis dan gampang digunakan.
Dari definisi-definisi tersebut Dapat disimpulkan bahwa data
warehouse adalah tempat penyimpanan data terkumpul secara lengkap dan
konsisten yang berorientasi subjek, terintegrasi, nonvolatile, dan time-variant
yang dapat digunakan untuk membantu pengambilan keputusan oleh
manager.
2.1.21.1 Anatomi Data Warehouse
Menurut Ibrahim, Setyabudhi, Astuti, dan Prabowo (2006, p.
19) konsep data warehouse sebenarnya secara umum lebih cenderung
20
kesebuah lingkungan mainframe yang terpusat kemudia dengan
adanya keunggulan teknologi client/server, memungkinkan data
warehouse diterapkan dalam berbagai macam cara untuk menampung
kebutuhan pemakai sistem secara lebih proporsional. Tiga jenis dasar
sistem data warehouse adalah sebagai berikut :
• Data warehouse fungsional, mempergunakan pendekatan
kebutuhan dari tiap bagian fungsi bisnis, misalnya departemen,
divisi, dan sebagainya, untuk mendefinisikan jenis data yang akan
ditampung di dalam sistem. Setiap unit fungsi dapat mempunyai
gambaran datanya masing-masing. Penerapan jenis sistem
pengumpulan data seperti itu beresiko kehilangan konsistensi data
di luar lingkungan fungsi bisnis yang bersangkutan. Jika kemudian
dilakukan pendekatan lingkupnya diperbesar dari lungkungan
fungsional menjadi lingkup perusahaan, konsistensi data
perusahaan tidak lagi dapat terjamin. Pendekatan itu biasanya
dilakukan dengan tujuan mempermudah pembangunan suatu data
warehouse dengan biaya yang relatif rendah.
• Data warehouse terpusat, adalah data diambil dari seluruh sistem
operasional dan disimpan di dalam pusat penyimpanan data.
Pemakai kemudian bekerja dengan data yang telah terkumpul
tersebut untuk membangun data warehouse fungsional pada
masing-masing fungsi kebutuhan. Sistem ini paling banyak
digunakan karena kebiasaan pemakai dengan lingkungan
mainframe yang terpusat. Keuntungan sistem ini adalah adanya
data yang benar-benar terpadu.
21
• Data warehouse terdistribusi, dikembangkan dengan konsep data
yang memungkinkan pemakai untuk langsung berhubungan
dengan sumber data maupun dengan pusat pengumpulan data lain.
Konsep itu sering disebut juga konsep data gateway. Pendekatan
itu mengandalkan keunggulan teknologi client/server untuk
mengambil data dari berbagai sumber. Konsep itu memungkinkan
tiap departemen atau divisi untuk membangun pengumpul data
fungsionalnya masing-masing, atau bahkan sistem operasionalnya,
dan memadukan bagian tersebut dengan teknologi client/server.
Konsep ini memerlukan biaya yang sangat besar karena setiap
sistem pengumpulan data fungsional dan sistem operasinya
dikelola secara terpisah. Memerlukan sinkronisasi data yang tinggi
dalam memelihara keterpaduan data.
2.1.21.2 Karakteristik Data Warehouse
Menurut Inmon (2005, p. 29) data warehouse memiliki
beberapa karakteristik yaitu :
• Subject-oriented
Sistem operasi yang terorganisir dalam aplikasi fungsional pada
perusahaan. Misalkan perusahaan asuransi, aplikasi operasional terdiri
dari auto, life, health, dan casualty. Mayoritas dari area subjek dari
perusahaan asuransi bisa terdiri dari customer, policy, premium, dan
claim. Seperti dapat dilihat pada gambar 2.4
22
Gambar 2.4 Karakteristik Data Warehouse : Subject Oriented
(Inmon, 2005, p. 30)
• Integrated
Semua aspek dari data warehouse, integrasi merupakan hal yang
paling penting. Data diisi dari banyak bagian, berbeda-beda
sumbernya didalam data warehouse. Sumber yang terintegrasi harus
dibuat konsisten untuk menampilkan pandangan terintegrasi dari data
kepada pengguna.
• Nonvolatile
Operasional data secara umum diakses dan dimanipulasi kedalam satu
record pada suatu waktu. Data diperbaharui didalam lingkungan
operasional secara teratur. Data yang baru selalu diperbaharui sebagai
tambahan bukan sebagai penggati.
23
• Time Variant
Membuktikan bahwa setiap unit data warehouse tersebut akurat
dalam interval waktu tertentu.
2.1.21.3 Arsitektur Data Warehouse
Menurut Kimball dan Ross (2010, p. 516) jika anggota tim
data warehouse menginginkan versi single master dari masing-masing
dimensi, kita harus membangun itu sendiri. Kita menggunakan proses
extract, transform, dan load (ETL) untuk menarik data dari berbagai
sumber, membersihkan, menyelaraskan, standarisasi, dan
mengintegrasikannya dalam rangka menciptakan apa yang kita sebut
enterprise conformed dimension, seperti diperlihatkan pada gambar
2.5
Gambar 2.5 Arsitektur Data Warehouse
(Kimball dan Ross, 2010, p. 517)
Master dari dimensi yang disesuaikan berisi atribut yang
umum pada seluruh sistem transaksi, seperti nama pelanggan, dan
24
atribut yang unik untuk sistem individu, seperti alamat pengiriman.
Master dari dimensi yang disesuaikan memetakan kunci sumber
sistem kepada single master surrogate key untuk setiap entri dalam
entitas. Pemetaan ini mengikat data dari satu sistem sumber yang lain.
Setelah dimensi master di tempatkan. Perubahan dan
penambahan atribut bersama dari sistem sumber yang berbeda harus
dimasukkan ke dalam dimensi. Juga, sistem manajemen dimensi
biasanya dipanggil untuk mengidentifikasi versi terbaik dari atribut
bersama dari semua kemungkinan versi yang ada. Ini adalah sebuah
penetapan, yang dikenal sebagai kelangsungan hidup, melibatkan
aturan bisnis yang kompleks dan perbandingan selama aliran ETL
berlangsung.
2.1.21.4 Aliran Data dalam Data Warehouse
Menurut Connolly dan Begg (2005, p. 1161) aliran data terdiri
dari 5 jenis:
• Inflow
Proses yang berasosiasi dengan extraction, cleansing, dan loading
pada data dari sumber sistem kedalam data warehouse.
• Upflow
Proses yang berasosiasi dengan penambahan nilai untuk data di
dalam data warehouse melalui summarizing, packaging, dan
distribution dari data.
25
• Downflow
Proses yang berasosiasi dengan pengarsipan dan melakukan back-
up dalam data warehouse.
• Outflow
Proses yang berasosiasi dengan pembuatan data agar tersedia
untuk pengguna akhir.
• Metaflow
Proses yang berasosiasi dengan menejemen dengan metadata.
2.1.21.5 Keuntungan Data Warehouse
Menurut Poolet (2009, p. 31) Data warehouse adalah strategic
tool. Kita dapat menggunakannya untuk memberikan organisasi
sebuah keuntungan dalam menghadapi persaingan. Para manajer
pemasaran dapat menggunakannya untuk lebih memahami kebiasaan
membeli dari pelanggan mereka dan mendorong bisnis ke garis depan
sektornya. Data warehouse juga dapat mengekspos kelemahan yang
perlu mendapat perhatian dalam sebuah organisasi.
2.1.22 Granularity
Menurut Connolly dan Begg (2005, p. 602) granularity adalah ukuran
data-data yang dipilih sebagai unit proteksi dari kontrol protokol konkurensi.
Menurut Inmon (2005, p. 498) granularity adalah tingkatan rincian
yang terkandung pada suatu unit data. Semakin detail/rinci sebuah data,
semakin rendah tingkatan granularity. Semakin rendah detail/rinci sebuah
data, semakin tinggi tingkat granularity.
26
Dapat disimpulkan granularity adalah tingkat kerincian dan
kedetailan sebuah unit data. Semakin tinggi tingkat granularity semakin rinci
data tersebut. Semakin rendah tingkat granularity semakin detail data
tersebut.
2.1.23 Nine Step Methodology
Menurut Connolly dan Begg (2005, p. 1187) nine step methodology
terdiri dari :
1. Memilih Proses
Proses (fungsi) mengacu pada hal subjek dari data mart tertentu.
Awal dari pembangunan data mart harus menjadi prioritas dalam
penyampaian tepat waktu, sesaui budget dan menjawab semua
pertanyaan bisnis secara komersil. Pilihan terbaik untuk data mart
pertama biasanya berhubungan dengan penjualan. Sumber data
tersebut biasanya dapat diakses dan memiliki kualitas yang tinggi.
2. Memilih Grain
Memilih grain berarti menentukan secara tepat apa yang
merepresentasikan record pada tabel fakta. Setelah grain untuk tabel
fakta dipilih, maka kita dapat mengindentifikasi dimensi pada tabel
fakta. Keputusan dalam pemilihan grain untuk tabel fakta ikut
menentukan grain pada masing-masing tabel dimensi.
3. Mendefinisikan dan Menyesuaikan Dimensi
Dimensi mengatur konteks untuk mempertanyakan mengenai fakta di
dalam tabel fakta. Suatu dimensi yang dibangun dengan baik
membuat data mart mudah dimengerti dan digunakan. Kita
27
mengidentifikasi dimensi dalam detail yang jelas untuk menjelaskan
sesuatu seperti klien dan properti dalam grain yang benar. Dimensi
yang ditampilkan secara buruk maupun tidak lengkap akan
mengurangi manfaat data mart bagi perusahaan. Jika sebuah dimensi
digunakan lebih dari satu data mart, maka dimensi harus sama persis
dengan yang lainnya. Hanya dengan cara ini dua data mart dapat
berbagi satu atau lebih dimensi. Saat dimensi digunakan lebih dari
satu data mart dimensi tersebut harus mengarah sebagai conformed.
4. Memilih Fakta
Grain dari tabel fakta menentukan fakta mana yang bisa digunakan di
dalam data mart. Semua fakta harus menunjukkan tingkat grain yang
sama. Dengan kata lain, jika grain pada tabel fakta adalah sebuah
penjualan secara individual, maka semua fakta numerik harus
mengarah pada penjualan tertentu. Fakta harus berupa numeric dan
additive. Jika sebuah tabel fakta berisi fakta non-numeric dan non-
additive maka tabel fakta tersebut tidak berguna.
5. Menyimpan Pre-kalkulasi
Ketika fakta yang sudah dipilih harus diperiksa ulang untuk
menentukan apakah ada kesempatan untuk melakukan prakalkulasi.
Contohnya, kebutuhan untuk menyimpan prakalkulasi muncul pada
saat tabel fakta membandingkan keuntungan dan kerugian. Kondisi ini
sering muncul saat table fakta berdasarkan penjualan maupun invoice.
6. Melengkapi Tabel Dimensi
Pada langkah ini, kita mengembalikan dimensi tabel dan
menambahkan deskripsi teks pada tabel dimensi sebanyak mungkin.
28
Teks deskripsi harus bersifat intuisi dan dapat dimengerti oleh
pengguna sebaik mungkin. Kegunaan dari data mart ditentukan dari
cakupan dan lingkungan dari atribut tabel dimensi.
7. Memilih Durasi dari Database
Durasi mengukur sejauh mana tabel fakta bisa melihat ke beberapa
waktu ke belakang. Pada banyak perusahaan, ada kebutuhan untuk
melihat pada periode waktu satu atau dua tahun yang lalu. Untuk
perusahaan lainnya, seperti perusahaan asuransi, mereka ingin
melihat data hingga lima tahun ke belakang. Tabel fakta yang sangat
besar dapat menimbulkan dua masalah yang signifikan pada desain
data warehouse. Yang pertama sulit untuk mencari sumber data yang
lama. Data yang sudah lama susah untuk dibaca dan diinterpretasikan.
Yang kedua, versi lama dari dimensi yang akan digunakan tidak
sesuai dengan versi saat ini.
8. Melacak Perubahan dari Dimensi secara Perlahan
Perubahan dimensi secara perlahan maksudnya adalah, sebagai
contoh, deskripsi yang benar dari klien lama dan cabang lama harus
digunakan dengan transaksi yang lama. Ada 3 tipe dasar dari
perubahan dimensi secara perlahan. Tipe pertama, ketika dimensi
berubah, atributnya ditimpa (overwritten). Tipe kedua, ketika atribut
dimensi berubah menyebabkan record dimensi baru harus dibuat.
Tipe ketiga, ketika atribut dimensi berubah menyebabkan sebuah
atribut alternatif harus dibuat jadi nilai lama dan baru dari atribut
secara langsung dapat di akses pada record dimensi yang sama.
29
9. Menentukan Prioritas dan Mode Query
Pada langkah ini kita menentukan masalah desain fisik. Masalah
desain fisik yang paling penting mempengaruhi persepsi pengguna
akhir pada data mart adalah menentukan urutan fisik dari tabel fakta
pada penyimpanan dan adanya penggunaan agregasi. Selain itu,
terdapat masalah dalam desain fisik yang mempengaruhi administrasi,
backup, indexing performance, dan keamanan.
2.1.24 Star Schema
Menurut Connolly dan Begg (2010, p. 1227) star schema merupakan
struktur logikal yang mana memiliki sebuah table fakta yang berisi data
factual sebagai pusat, dikelilingi oleh tabel dimensi yang berisi data referensi
(dimana bisa di denormalisasi).
Menurut Mannino (2004, p. 591) star schema adalah sebuah
representasi data modeling untuk multidimensional database. Di dalam
database, sebuah star schema mempunyai sebuah tabel fakta yang berada
dipusat yang berhubungan dengan banyak tabel dimensi.
Dapat disimpulkan star schema merupakan skema yang terdiri dari
satu tabel fakta sebagai pusat dan dikelilingi oleh banyak tabel dimensi.
2.1.25 Keuntungan Star Schema
Menurut Sepsugiarto (2011) keuntungan menggunakan skema bintang
adalah :
1. Membangun suatu rancangan database yang memiliki respon time
yang cepat;
30
2. Menyediakan suatu rancangan yang dapat dengan mudah dimodifikasi
atau ditambah jika data warehouse yang telah dirancang tersebut
mengalami perkembangan;
3. Paralel, maksudnya adalah di dalam rancangan database dapat
dibentuk sesuai dengan kemauan pemakai terhadap data;
4. Mudah mengerti dan menggunakan metadata, baik untuk
pembangunan maupun bagi pemakai,
5. Banyak tools yang dapat dipilih agar dapat mengakses data yang ada.
2.1.26 ETL
Menurut Kimball dan Ross (2002, p. 401) ETL adalah kumpulan
beberapa proses yang mana operasional sumber datanya telah disiapkan untuk
data warehouse.
Proses ETL ini terdiri dari extracting, transforming, loading yang
dilakukan sebelum masuk kedalam data warehouse. Jadi ETL merupakan
proses persiapan data yang termasuk pencarian data, pengintegrasian data,
dan pengalokasian data dari sumber operasional ke dalam data warehouse.
Tahapannya adalah :
• Extraction
Menurut Kimball dan Ross (2002, p. 8) extraction adalah langkah
pertama dari sebuah proses memasukan data kedalam data
warehouse. Extraction maksudnya membaca dan memahami
sumber data dan mengkopi data yang dibutuhkan untuk data
warehouse kedalam staging area untuk manipulasi kedepannya.
31
• Transformation
Menurut Kimball dan Ross (2002, p. 8) setelah data diekstrak
kedalam staging area ada beberapa potensi untuk melakukan
transformation, seperti cleasing data (memperbaiki kesalahan
pengejaan, menyelesaikan masalah data asal, mengatasi elemen
yang hilang, atau mengubah kedalam format yang standard),
mengkombinasikan data dari berbagai sumber, mencegah
duplikasi data, dan menetapkan warehouse key.
• Loading
Menurut Kimball dan Ross (2002, p. 8) setelah melakukan proses
transformation maka data dapat dimuat dalam data warehouse.
Proses akhir dalam ETL ini harus berupa data yang sudah
dinormalisasi. Data dari staging area akan dipindahkan ke dalam
data warehouse atau data mart.
Menurut Farhan, Marie, El-Fangary, dan Helmy (2011, p. 48) data
dari sistem operasional biasanya ditentukan dalam skema yang berbeda dan
harus diekstrak dan diubah untuk mengumpulkan mereka ke dalam repositori
DW umum, dalam proses ETL, data yang diambil dari sebuah sistem sumber
melewati urutan transformasi sebelum mereka dimuat ke DW. Desain proses
ETL biasanya terdiri dari tujuh tugas :
• Filter
Mekanisme Filter menyaring data yang tidak diinginkan dan
memverifikasi kebenaran data berdasarkan batasan.
32
• Join
Mekanisme Gabung digunakan untuk menggabungkan dua
sumber data yang berhubungan satu sama lain dengan beberapa
atribut. (didefinisikan dengan menggunakan kondisi restriktif)
• Loader
Mekanisme loader yang memuat data ke target dari proses ETL
seperti dimensi atau fakta dalam data warehouse. Setiap proses
ETL harus memiliki setidaknya satu mekanisme loader.
• Incorrect
Mekanisme incorrect digunakan untuk mengubah rute yang buruk
atau yang dibuang pada record dan memberikan pengecualian
untuk target yang terpisah. Dengan cara ini, desainer data
warehouse dapat melacak kesalahan yang berbeda. Mekanisme ini
hanya dapat digunakan dengan Filter, Loader, dan Wrapper,
karena mekanisme membatasi data yang mereka proses.
• Merge
Mekanisme Merge mengintegrasikan dua atau lebih sumber data
dengan atribut yang kompatibel. Dua sumber data dapat dikatakan
kompatibel asalkan keduanya mengandung subset dari atribut
yang didefinisikan dalam target, atribut yang digunakan dalam
integrasi harus memiliki nama yang sama di semua sumber data.
• Wrapper
Mekanisme Wrapper memungkinkan kita untuk menentukan
transformasi yang diperlukan dari sumber data asli menjadi
catatan sumber data yang berdasarkan record.
33
• Surrogate
Mekanisme surrogate menghasilkan surrogate key yang unik.
Tugas surrogate key adalah proses umum dalam data warehouse,
dipekerjakan untuk menggantikan original key dari sumber data
dengan uniform key.
2.1.27 Intranet
Menurut O'Brien dan Marakas (2010, p. 219) intranet merupakan
sebuah jaringan didalam sebuah organisasi yang menggunakan teknologi
internet untuk menyediakan sebuah lingkungan internet meliputi perusahaan
untuk berbagi informasi, komunikasi, kolaborasi, dan mendukung proses
bisnis.
Dapat disimpulkan intranet adalah sebuah teknologi jaringan pada
sebuah perusahaan untuk berbagi informasi, komunikasi, kolaborasi, dan
yang mendukung proses bisnis.
2.2 Teori Khusus
2.2.1 Servis
Menurut Romney dan Stembart (2006, p. 10) servis merupakan
aktivitas yang menyediakan pelayanan setelah penjualan kepada pelanggan.
Contohnya jasa perbaikan dan pemeliharaan.
Diperkuat oleh teori diatas servis merupakan aktivitas yang menjual
pelayanan kepada pelanggan setelah pelanggan membeli sebuah produk.
34
2.2.2 Sales
Menurut Romney dan Stembart (2006, p. 10) sales adalah aktivitas
yang membantu pelanggan untuk membeli barang atau jasa dari suatu
perusahaan.
Diperkuat oleh teori diatas sales merupakan kegiatan yang membantu
pelanggan untuk membeli produk dan jasa pada sebuah perusahaan.
2.2.3 Persediaan
Menurut Alfredson (2007, p. 342 ) persediaan adalah aset yang
tersedia untuk dijual dalam proses bisnis biasa atau aset yang ada dalam
proses produksi seperti untuk dijual atau aset dalam bentuk material atau
supplier atau digunakan dalam proses produksi atau dalam memberikan
pelayanan.
Menurut Warren, Reeve, dan Fees (2005, p. 440) persediaan adalah
barang dagang yang disimpan untuk dijual dalam operasi bisnis perusahaan,
dan bahan yang digunakan dalam proses produksi atau disimpan untuk tujuan
tersebut. Persediaan yang diperoleh perusahaan langsung dijual kembali tanpa
mengalami proses produksi selanjutnya disebut persediaan barang dagang.
Dapat disimpulkan persediaan merupakan aset perusahaan yang
disimpan dan akan digunakan untuk dijual dalam operasi bisnis ataupun
digunakan dalam proses produksi yang disediakan untuk memenuhi
permintaan pelanggan.
35
2.3 Kerangka Pikir
Gambar 2.6 Kerangka Pikir
Latar Belakang :
- PT. Toyota Astra Motor sebagai perusahaan yang bergerak di bidang penjualan, pengimport dan pendistribusian mobil dan suku cadang memiliki jumlah data transaksi yang terus bertambah setiap tahunnya.
- Sebagai perusahaaan yang bergerak di bidang automotif, dibutuhkan tempat pengolahan data dan untuk mengintegrasikan data kepada divisi yang bersangkutan.
Tinjauan teori :
- Anatomi Data Warehouse
- Karakteristik Data Warehouse.
- Arsitektur Data Warehouse
Tinjauan teori :
- Teori Extract, Transform, Load (ETL)
- Aliran data dalam Data Warehouse
- Keuntungan Data Warehouse
Identifikasi Masalah:
- Data yang masih kotor dan belum berkualitas untuk pengambilan keputusan.
- Laporan yang belum tersaji secara lengkap yang susah untuk dipahami.
Rumusan Masalah 1 : Bagaimana kondisi data?
Rumusan Masalah 2 : Bagaimana kualitas laporan yang dihasilkan?
Rumusan Masalah 3 : Bagaimana meningkatkan kualitas laporan dengan kualitas data yang sudah baik?
Simpulan dan Saran