6
BAB II
TINJAUAN PUSTAKA
2.1 Penelitian Sebelumnya
Penelitian tentang MARS telah banyak dilakukan. Salah satunya yaitu
penelitian yang berjudul Penerapan Metode Multivariate Adaptive Regression Splines
(MARS) untuk Mengidentifikasi Komponen Yang Berpengaruh Terhadap Peringkat
Akreditasi Sekolah pada SMA/MA di Provinsi Sumatra Barat oleh Febriyanti (2013).
Pada penelitian tersebut, peringkat akreditasi yang didapatkan oleh sekolah dapat
dikelompokan menjadi dua kelompok dengan kelompok 1 adalah sekolah yang
terakreditasi A atau B, dan kelompok 2 adalah sekolah yang terakreditasi C atau tidak
terakreditasi. Hasil pendugaan pengelompokan sekolah dengan metode MARS
menghasilkan beberapa variabel yang berpengaruh secara signifikan, antara lain :
komponen standar sarana dan prasarana (X5), komponen standar kompetensi lulusan
(X3), komponen standar penilaian (X8), komponen standar isi (X1), komponen standar
pembiyaan (X7), komponen standar proses(X2), dan komponen standar pengelolaan
(X6).
Selain itu, ada juga penelitian yang berjudul Pemodelan Kemiskinan di
Provinsi Jawa Timur dengan Pendekatan Multivariate Adaptive oleh Pintowati
(2012). Pada penelitian tersebut variabel respon yang digunakan adalah 3 indikator
kemiskinan meliputi persentase penduduk miskin, indeks kedalaman kemiskinan, dan
indeks keparahan kemiskinan. Sedangkan variabel prediktor yang digunakan ada 10
7
variabel dari segi ekonomi, kesehatan, pendidikan dan lingkungan. Hasilnya
diperoleh tiga model yaitu untuk variabel respon persentase penduduk miskin model
MARS terbaiknya adalah model dengan BF=20, MI=2 dan MO=2, untuk variabel
respon indeks kedalaman kemiskinan model MARS terbaiknya adalah model MARS
dengan BF=20, MI= 2 dan MO=0, dan untuk variabel respon indeks keparahan
kemiskinan model MARS terbaiknya adalah model dengan BF=20, MI=1 dan
MO=3. Penelitian-penelitian tersebut menjadi acuan bagi penulis dalam penelitian
ini. Pada penelitian tersebut, MARS digunakan untuk permasalahan yang berdimensi
tinggi dan untuk data yang tidak diketahui bentuk kurva regresinya. Berdasarkan
penelitian yang telah dilakukan mengenai MARS, akan dijadikan teori untuk
mendukung penelitian yang akan dilakukan.
2.2 Landasan Teori
2.2.1 Multivariate Adaptive Regression Splines (MARS)
Multivariate Adaptive Regression Splines (MARS) merupakan pendekatan
untuk regresi multivariat nonparametrik yang menghasilkan pemodelan regresi yang
fleksibel. Metode ini diperkenalkan oleh Jerome H. Friedman pada tahun 1990.
Model MARS difokuskan untuk mengatasi permasalahan berdimensi tinggi, memiliki
variable prediktor 3<k<20 , ukuran sampel 50<N<1000. MARS mampu mengatasi
diskontinuitas pada data. MARS merupakan pengembangan dari pendekatan
Recursive Partition Regression (RPR) yang dikombinasikan dengan metode spline
sehingga model yang dihasilkan kontinu pada knot (Friedman, 1991).
a. Recursive Partition Regression (RPR)
8
Misal Y adalah peubah respon tunggal yang dipengaruhi oleh peubah predictor
X sebanyak p, dimana ),...,,( 21 PXXXX , maka Y dapat dinyatakan dalam model
regresi sebagai berikut :
),...,,( 21 PXXXfY (2.1)
Dengan domain D merupakan subset dari ruang berdimensi p. Sisaan diasumsikan
memiliki rataan nol dan ragam .2
Dari persamaan (2.1), misalkan terdapat sampel
sebanyak N untuk Y dan ),...,,( 21 PXXXX dinyatakan sebagai N
ipiiii xxxy121 ,...,,,
.
Ambil S
jjR1yang merupakan subset yang saling lepas dari domain D, sehingga
S
j jRD1
.RPR menduga fungsi )(xf yang tidak diketahui dengan
S
j
jj xBxCxf1
^
)()()( (2.2)
Dengan jj RxIxB )( , I adalah fungsi indikator yang bernilai 1 jika benar dan
bernilai 0 jika salah. dan Cj (x) adalah koefisien subregion. Setiap fungsi indikator
merupakan perkalian dari fungsi univariat yang menggambarkan setiap subregion jR .
Secara umum, RPR mempunyai dua tahap yaitu tahap forward dan backward.
Dimulai dari subregion pertama R1=D, tahap forward memilah domain D secara
iteratif menjadi himpunan bagian (subregion) yang saling lepas M
jjR2, untuk
.SM Dengan M ditentukan sebarang. Selanjutnya, tahap backward berlawanan
dengan tahap forward yaitu menghilangkan atau memangkas subregion dari model
dengan dua kriteria yaitu evaluasi dugaan model dan jumlah subregion dalam model.
9
Tahap forward dan backward ini menghasilkan sekumpulan subregion yang tidak
saling tumpang tindih, sehingga )(^
xf mendekati )(xf untuk setiap subregion daerah
asal. RPR merupakan metode yang mampu mengatasi kesulitan dalam menentukan
knot karena knot ditentukan oleh data. Namun RPR masih memiliki kekurangan
dalam pemodelan regresi. Kekurangan RPR yaitu belum cukup mampu menduga
)(xf linier atau aditif dan model RPR menghasilkan subregion yang tidak kontinu
pada knot (Friedman, 1991).
b. Modifikasi Recursive Partition Regression (RPR)
Untuk mengatasi kekurangan dari RPR, Jerome H. Friedman melakukan
modifikasi. Untuk menduga fungsi linier atau aditif, Friedman melakukan inovasi
dengan cara tidak menghapus induk atau parent region selama pemilahan subregion
dilakukan. Sehingga pada iterasi selanjutnya parent dan pilahan subregion dapat
dipilah lebih lanjut, hal ini akan menghasilkan subregion yang saling tumpang tindih.
Selain itu, modifikasi ini juga menghasilkan model linier dengan pemilahan berulang
pada peubah prediktor yang berbeda serta menghasilkan model yang fleksibel
(Friedman, 1991).
Modifikasi tersebut belum dapat mengatasi diskontinuitas pada titik knot yang
disebabkan oleh adanya perkalian fungsi univariat. Oleh karena itu Friedman
mengganti perkalian fungsi univariat dengan regresi linier spline ordo satu. Pada
regresi splines ini sisi kiri (-) dan sisi kanan (+) truncated spline sebagai berikut :
10
js
i
jikjikijj xxSxB1
*
),(),( ))(()( (2.3)
Dengan jS jumlah pilihan subregion ke-j dari domain D, *
),( jikx merupakan
knot dari peubah prediktor ),( jikx dan ijS nilainya 1 atau -1 jika knot ada di kanan atau
di kiri subregion.
Beberapa hal yang perlu diperhatikan dalam membuat model MARS adalah
(Friedman, 1991) :
a. Knot merupakan nilai variabel prediktor ketika slope suatu garis regresi
mengalami perubahan yang dapat didefinisikan sebagai akhir dari sebuah garis
regresi (region) dan awal dari sebuah garis regresi (region) yang lain. Pada
setiap titik knot, diharapkan adanya kontinuitas dari fungsi basis antar satu
region dengan region lainnya. Minimum jarak antara knot atau minimum
observasi (MO) antara knot adalah 0,1,2, dan 3 observasi.
b. Fungsi Basis (BF) yaitu suatu fungsi parametrik yang didefinisikan pada tiap
region yang digunakan untuk menjelaskan hubungan antara variable respon dan
variable prediktornya. Fungsi basis ini berupa selang antar knot yang berurutan.
Pada umumnya fungsi basis yang dipilih berbentuk polynomial dengan turunan
yang kontinu pada setiap titik knot. Maksimum fungsi basis yang diizinkan
adalah 2-4 kali jumlah variable prediktornya.
c. Interaction (interaksi ) merupakan hasil perkalian silang antar variable yang
saling berkorelasi. Jumlah maksimum interaksi (MI) yang diperbolehkan adalah
11
1,2, dan 3. Jika MI > 3 akan dihasilkan model yang semakin kompleks dan
model akan sulit untuk diinterpretasi.
Knot pada metode MARS ditentukan secara otomatis oleh data dan
menghasilkan model yang kontinu pada knot. Penentuan knot pada MARS
menggunakan algoritma forward dan backward (lampiran 3). Algoritma forward
digunakan untuk mendapatkan jumlah fungsi basis maksimum. dengan kriteria
pemilihan fungsi basis adalah dengan meminimumkan Mean Squared Error (MSE).
MSE dapat dihitung dengan rumus sebagai berikut :
2
1
)(1
n
i
iMi xfyn
MSE
dengan :
ix
: variabel prediktor
iy
: variabel respon
n : banyaknya pengamatan
)( iM xf
: dugaan fungsi )(xf dengan metode Recursive Partition Regression
Pada tahap backward dipilih satu fungsi basis dan mengeluarkan basis
tersebut jika kontribusinya terhadap model kecil. Hal ini dilakukan untuk memenuhi
konsep parsimoni (model yang sederhana). Proses backward akan terus dilanjutkan
hingga tidak ada lagi fungsi basis yang dapat dikeluarkan atau dengan kata lain fungsi
basis yang tersisa pada model adalah fungsi basis yang berpengaruh signifikan
terhadap model. Ukuran kontribusi pada tahap backward dilakukan berdasarkan
12
kriteria validasi silang atau GCV (Generalized Cross Validation). Caranya adalah
dengan meminimumkan nilai GCV. Pada MARS, kriteria pemilihan model terbaik
adalah jika nilai GCV pada model tersebut mempunyai nilai yang paling rendah
(minimum) diantara model-model lain (Friedman, 1991).
Fungsi GCV minimum didefinisikan sebagai berikut :
(2.4)
Dengan
MSE : Mean Squared Error/Kuadrat tengah eror
ix :variabel prediktor
iy : variabel respon
)(MC : Trace [B(BTB)
-1B
T]+1
B : matrik berukuran nM
M : jumlah fungsi basis
n : banyaknya pengamatan
)(~
MC : C(M)+dM
d : nilai ketika setiap fungsi basis mencapai optimasi 42 d
Algoritma MARS tahap forward dan backward menghasilkan model MARS
sebagai berikut :
2~
2
1
2~
)(1
)(1
)(1
)(
n
MC
xfyn
n
MC
MSEMGCV
n
i
iMi
13
M
m
km
k
kmmkvkmm tXSaaxf1 1
),(0 )()( (2.5)
Dengan :
0a : fungsi basis induk atau konstanta regresi dari fungsi basis
ma : koefisien dari fungsi basis ke-m, m=1,2,…,M
M : maksimum fungsi basis (nonconstant basis function)
km : derajat interaksi
Skm : tanda pada titik knot. Bernilai +1 jika knot berada disebelah kanan
subregion dan bernilai -1 jika knot berada disebelah kiri subregion
Xv(k,m) : variabel prediktor
tkm : nilai knot dari variabel prediktor Xv(k,m)
2.2.2 Pengujian Signifikansi Model MARS
Uji signifikansi dilakukan untuk mengetahui signifikansi parameter dan
mengevaluasi kecocokan model. Uji signifikansi yang dilakukan meliputi pengujian
fungsi basis secara keseluruhan atau uji simultan dan pengujian masing-masing
fungsi basis atau uji parsial.
a. Pengujian Koefisien Regresi Simultan
Uji signifikansi yang dilakukan secara bersamaan untuk semua fungsi basis yang
terdapat pada model MARS.
1. Hipotesis : H0 : αm = 0 (model tidak signifikan)
H1 : minimal terdapat satu αm ≠ 0 (model signifikan)
14
dengan m=1,2,3,…,M
2. Taraf signifikansi : α
3. Statistik uji : 𝐹ℎ𝑖𝑡𝑢𝑛𝑔 = 𝑦𝑖 −𝑦 2/𝑀𝑛
𝑖=1
𝑦𝑖−𝑦𝑖 2/𝑁−𝑀−1𝑛𝑖=1
4. Daerah kritis : Tolak H0 jika nilai Fhitung > Fα(M;N-M-1 ) atau P-value < α
dimana M= banyaknya fungsi basis dan N= banyaknya data
b. Pengujian Koefisien Regresi Parsial
Uji signifikansi secara individual untuk masing-masing fungsi basis yang terdapat
dalam model MARS.
1. Hipotesis : H0 : αm = 0 (koefisien αm tidak berpengaruh terhadap model)
H1 : αm ≠ 0 untuk setiap m (koefisien αm berpengaruh signifikan
terhadap model) dengan m=1,2,3,…,M
2. Taraf signifikansi : α
3. Statistik uji : 𝑡ℎ𝑖𝑡𝑢𝑛𝑔 =𝑎 𝑚
𝑆𝑒 𝑎 𝑚 𝑆𝑒 𝑎 𝑚 = 𝑣𝑎𝑟 𝑎 𝑚
4. Daerah kritis : Tolak H0 jika nilai thitung > t(α/2;N-M ) atau P-value < α
dimana M= banyaknya fungsi basis dan N= banyaknya data
2.2.3 Derajat Kesehatan
A. Definisi-definisi
Menurut WHO dalam Nona (2013), sehat adalah keadaan sejahtera secara
fisik, mental dan sosial yang merupakan satu kesatuan, bukan hanya terbebas dari
penyakit maupun cacat. Menurut Undang-Undang Kesehatan No. 36 Tahun 2009,
sehat adalah keadaan sejahtera dari badan, jiwa, dan sosial, sehingga memungkinkan
15
setiap orang dapat hidup produktif secara sosial dan ekonomi. Menurut KBBI, sehat
adalah keadaan seluruh badan serta bagian-bagiannya terbebas dari sakit
Derajat kesehatan adalah sesuatu yang ingin dicapai dalam bidang kesehatan.
Merupakan gambaran profil kesehatan individu atau kelompok individu (masyarakat)
di suatu daerah. Atau menyatakan tingkat/taraf kesehatan atau status kesehatan.
Dengan adanya derajat kesehatan akan tergambarkan masalah kesehatan yang sedang
dihadapi (Kementerian Kesehatan RI, 2014).
B. Indikator Derajat Kesehatan
Dalam menilai derajat kesehatan, beberapa indikator yang dapat digunakan
yaitu : indikator-indikator mortalitas, indikator-indikator morbiditas, dan indikator-
indikator status gizi (Kementerian Kesehatan RI, 2014)
1. Mortalitas adalah angka kematian yang diakibatkan oleh keadaan tertentu, dapat
disebabkan oleh penyakit ataupun sebab lainnya yang terjadi pada kurun waktu
tertentu dan tempat tertentu (Kementerian Kesehatan RI, 2014). Indikator-
indikatornya yaitu :
a. Angka Kematian Ibu (AKI) adalah jumlah perempuan yang meninggal pada
saat hamil, melahirkan, dan selama 42 hari setelah melahirkan (masa nifas)
yang disebabkan oleh gangguan kehamilan atau penanganannya selama
kehamilan dan bukan karena sebab-sebab lain, tanpa memandang lama
kehamilan dan tempat persalinan per 100.000 kelahiran hidup.
16
b. Angka Kematian Bayi (AKB) adalah jumlah bayi yang meninggal sebelum
mencapai usia satu tahun yang dinyatakan dalam 1.000 kelahiran hidup pada
tahun yang sama.
c. Angka Kematian Balita (AKABA) adalah jumlah anak yang meninggal
sebelum mencapai usia 5 tahun yang dinyatakan dalam per 1.000 kelahiran
hidup. Angka Kematian Balita mempresentasikan peluang terjadinya
kematian pada fase antara kelahiran dan sebelum umur 5 tahun.
d. Angka Harapan Hidup (AHH) adalah rata-rata tahun hidup yang masih akan
dijalani oleh seseorang yang telah berhasil mencapai umur x, pada suatu
tahun tertentu dalam situasi mortalitas yang berlaku di lingkungan
masyarakatnya
2. Morbiditas adalah angka kesakitan, baik disebabkan oleh kecelakaan maupun
prevalen dari suatu penyakit (Kementerian Kesehatan RI, 2014). Morbiditas
dapat digunakan sebagai gambaran kejadian penyakit dalam suatu populasi pada
kurun waktu tertentu. Morbiditas dapat diukur dengan indikator-indikator : angka
kesakitan Tuberkulosis Paru (TB. Paru), angka kesakitan Demam Berdarah
Dengue (DBD), dan kesakitan terkena penyakit lainnya.
3. Status Gizi adalah hasil keseimbangan antara zat-zat gizi yang masuk (asupan
gizi) dalam tubuh manusia dan jumlah yang dibutuhkan dalam penggunaannya
untuk berbagai fungsi biologis termasuk pertumbuhan fisik, perkembangan,
aktivitas dan pemeliharaan kesehatan (Kementerian Kesehatan RI, 2014). Status
17
gizi diukur berdasarkan berat badan (BB), tinggi badan (TB), dan umur.
Indikatornya dapat berupa cukup gizi, gizi buruk dan gizi kurang.
C. Faktor-Faktor yang Mempengaruhi Derajat Kesehatan
Menurut Hendrik L. Blum dalam (Nona, 2013), derajat kesehatan dipengaruhi
oleh empat faktor yaitu : faktor perilaku, faktor lingkungan, faktor pelayanan
kesehatan, dan faktor genetik. Sedangkan menurut Kementerian Kesehatan RI (2014),
derajat kesehatan dipengaruhi oleh banyak faktor. Faktor-faktor tersebut berasal dari
sektor kesehatan seperti pelayanan kesehatan serta ketersediaan sarana dan prasarana
kesehatan. Selain itu juga dipengaruhi oleh faktor yang berasal dari luar kesehatan
seperti faktor ekonomi, pendidikan, lingkungan sosial, keturunan dan perilaku.
1. Perilaku
Perilaku yang dimaksud adalah perilaku hidup bersih dan sehat (PHBS).
PHBS adalah semua perilaku yang dilakukan atas kesadaran sehingga setiap anggota
keluarga dapat menolong dirinya sendiri dibidang kesehatan dan berperan aktif dalam
kegiatan-kegiatan kesehatan masyarakat. PHBS di rumah tangga adalah upaya untuk
memberdayakan anggota rumah tangga agar tahu, mau dan mampu mempraktikkan
perilaku hidup bersih dan sehat serta berperan aktif dalam gerakan kesehatan di
masyarakat. Indikator perilaku sehat adalah (Kementerian Kesehatan RI, 2014) :
a. Persentase rumah tangga yang berperilaku hidup bersih dan sehat (PHBS)
b. Persentase bayi yang diberi ASI eksklusif
c. Persentase posyandu yang aktif
d. Kunjungan ibu hamil (K4)
18
e. Persentase peserta KB aktif
f. Persentase kunjungan neonatus 3 kali
2. Lingkungan
Menurut Kementerian Kesehatan RI (2014), lingkungan merupakan salah satu
variabel yang mendapatkan perhatian khusus dalam menilai kesehatan masyarakat.
Indikator-indikator sebagai berikut :
a. Persentase rumah sehat
b. Persentase keluarga yang memiliki jamban sehat
c. Persentase keluarga dengan sumber air minum terlindung
3. Pelayanan kesehatan dapat dilihat dengan indikator-indikator sebagai berikut
(Kementerian Kesehatan RI, 2014) :
a. Persentase pelayanan ibu nifas
b. Persentase persalinan yang ditolong oleh tenaga kesehatan
c. Persentase ibu hamil mendapat tablet Fe3
d. Persentase pelayanan balita
4. Genetik
Genetik atau keturunan berpengaruh terhadap derajat kesehatan, karena ada
beberapa penyakit yang diturunkan lewat gen seperti albino, leukemia, diabetes,
hemofilia. Kondisi ini terjadi ketika individu lahir dari dua individu sehat pembawa
kelainan satu atau lebih gen, dan dapat juga terjadi ketika kelainan satu atau lebih
gen merupakan gen yang dominan. Faktor ini sulit untuk diatasi karena merupakan
bawaan seseorang sejak lahir (Kementerian Kesehatan RI, 2014).
19
5. Ekonomi
Menurut Dinas Kesehatan Provinsi Bali (2014), tingkat ekonomi masyarakat
berpengaruh terhadap derajat kesehatan masyarakat. Indikatornya yaitu :
a. Jumlah penduduk yang bekerja di sektor pertanian
b. Jumlah masyarakat miskin
6. Pendidikan
Menurut Dinas Kesehatan Provinsi Bali (2014), tingkat pendidikan
masyarakat berpengaruh terhadap derajat kesehatan masyarakat. Indikatornya yaitu :
a. Jumlah murid SD dan SMP
b. Jumlah penduduk menurut tingkat pendidikan tertinggi yang ditamatkan
(sarjana)