anreg stepwise
DESCRIPTION
Offering GG 2008 - Matematika - Universitas Negeri MalangTRANSCRIPT
PENYELESAIAN MULTIKOLINEARITAS DENGAN METODE STEPWISE REGRESSION
PADA DATA PENJUALAN
KAOS DISTRO “PLANET GAYA”
MAKALAH
Untuk memenuhi tugas matakuliah
Analisis Regresi
yang dibina oleh Ir. Hendro Permadi, M.Si
Oleh:
Kelompok I
Wida Rekno A
Siti Muyasaroh 409312417668
Rizqi Tri R 409312417669
Anisak Heritin 409312417683
Krisna Trenggalih
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI MALANG
November 2011
BAB I
PENDAHULUAN
1.1 LATAR BELAKANG
Seiring dengan perkembangan zaman permasalahan yang dihadapi manusia semakin
kompleks. Begitu juga dengan suatu perusahaan yang terus ingin berkembang dalam
meningkatkan kualitas produksi, pelayanan, dan tentunya pendapatan perusahaan.
Perusahaan yang ingin maju harus bisa mengambil langkah-langkah yang tepat dan tanggap
dalam membaca peluang pasar. Seperti meningkatkan promosi-promosi ke berbagai daerah
dalam mempublikasikan hasil produksi, pembukaan outlet-outlet baru, analisis pasar dan
pesaing yang baik, analisis pendapatan penduduk di sekitar daerah promosi, dan masih
banyak lagi langkah-langkah yang bisa diambil. Untuk itulah diperlukan kajian yang
membahas tentang analisis variabel-variabel yang mungkin berpengaruh dalam penjualan
hasil produksi seperti yang akan dibahas nanti, yaitu kasus yang terjadi pada Distro “Planet
Gaya”.Distro “Planet Gaya”dalam beberapa bulan gencar mempromosikan sejumlah kaos
dengan membuka outlet-outlet di 15 daerah di Lamongan. Mereka ingin mengetahui besar
hubungan atau seberapa jauh biaya promosi, luas outlet, laju pertambahan penduduk,
kompetitor atau pesaing, dan income penduduk berpengaruh terhadap penjualan Distro
“Planet Gaya”. Oleh karena itu diperlukan uji regresi berganda, yang dalam hal ini
melibatkan lebih dari dua variabel bebas, dengan variabel dependen adalah penjualan dan
variabel independen adalah biaya promosi, luas outlet, laju pertambahan penduduk,
kompetitor atau pesaing, dan income penduduk. Dalam hal ini akan digunakan Stepwise
Regression untuk mengetahui variabel mana saja yang paling berpengaruh.
1.2 PERUMUSAN MASALAH
Berdasarkan latar belakang masalah, maka dapat diambil rumusan masalah sebagai
berikut:
1. Bagaimana cara mengidentifikasi adanya multikolinearitas?
2. Bagaimana cara mengatasi multikolinearitas dengan metode Stepwise Regression?
3. Bagaimana model terbaik dari data yang telah dianalisis?
1.3 TUJUAN PENULISAN
Berdasarkan rumusan masalah tersebut, maka tujuan penulisan makalah adalah sebagai
berikut:
1. Mengetahui cara mengidentifikasi adanya multikolinearitas.
2. Mengetahui cara mengatasi multokolinearitas dengan metode Stepwise Regression.
3. Mengetahui model terbaik dari data yang dianalisis.
1.4 MANFAAT
Dengan ditulisnya makalah ini Distro “Planet Gaya” setidaknya mendapatkan masukan
dalam mempertimbangkan langkah-langkah yang mungkin bisa diambil dalam melakukan
penjualan ke 15 daerah di Lamongan. Selain itu kita sebagai pembaca mungkin bisa
mendapatkan pengetahuan tentang bagaimana penggunaan Stepwise Regression dalam
analisis regresi berganda, terutama untuk regresi yang melibatkan lebih dari dua variabel
bebas.
BAB II
KAJIAN TEORI
Metode Stepwise adalah salah satu metode yang sering dipakai dalam analisis regresi.
Metode ini hampir sama dengan Forward, hanya di sini variabel yang telah dimasukkan dalam
model regresi bisa dikeluarkan lagi dari model. Metode ini dimulai dengan memasukkan variabel
bebas yang mempunyai korelasi paling kuat dengan variabel dependen. Kemudian setiap kali
pemasukan variabel bebas yang lain, dilakukan pengujian untuk tetap memasukkan variabel
bebas atau mengeluarkannya. Salah satu program komputer yang bisa digunakan adalah SPSS
dan Minitab. Dalam hal ini SPSS dan Minitab menyediakan berbagai metode perhitungan
persamaan regresi berganda dengan banyak variabel, seperti Backward Elimination, Forward
Elimination, dan Stepwise Method. Ketiga metode itu pada akhirnya akan menghasilkan output
model yang sama, hanya prosesnya saja yang berbeda.
2.1 Analisis Regresi Linear Berganda
Analisis regresi linier berganda merupakan bentuk umum, sedangkan regresi linier
sederhana merupakan bentuk khusus dari regresi linier berganda yaitu regresi yang
melibatkan satu peubah bebas. Dengan regresi linier berganda persamaan dalam X
memberikan prediksi yang terbaik terhadap Y.
Model regresi linier berbentuk
Y=β0+ β1X1+ β2X2+…+βkXk+ ε
Dengan Xi, i = 1,2,…,k merupakan peubah bebas dan βi, i=1,2,…,k parameter regresi, dan ε
sebagai error. Dan sebarang model yang tidak berbentuk seperti persamaan di atas disebut
model tak linier. Jika pada suatu model regresi tersebut terdapat satu peubah bebas , maka
model itu disebut regresi linier sederhana. Sedangkan jika terdapat lebih dari satu peubah
bebas, maka model itu disebut regresi linier berganda.
Dalam melakukan analisis harus diperhatikan beberapa asumsi yang mendasarinya:
1. Nilai harapan bersyarat galat yang disebabkan oleh peubah bebas X yang harus sama
dengan nol.
2. Setiap galat yang disebabkan peubah bebas mempunyai varian yang sama.
3. Tidak ada multikolinieritas yang berarti tidak ada hubungan linier antara peubah bebas.
Drapper n Smith (1992), menyatakan beberapa kriteria yang digunakan untuk melihat
tepat tidaknya model regresi yang diperoleh, salah satunya yaitu dengan melihat koefisien
determinasi berganda (Rk2).
Sebuah masalah penting dalam penerapan analisis regresi linier berganda adalah
pemilihan peubah – peubah bebas yang dapat digunakan dalam model agar diperoleh persamaan
regresi “terbaik “ yang mengandung sebagian atau seluruh peubah bebas.
2.2 Multikolinearitas
Multikolinearitas ditemukan oleh Ragner Frisch yang berarti adanya hubungan linier
yang sempurna atau pasti diantara beberapa atau semua variabel yang menjelaskan (X1,
X2,…,Xk) dari model regresi.
Akibat terjadinya multikolinearitas antara lain:
1) Nilai koefisien regresi berganda biasa.
2) Terjadi perubahan tanda pada koefisien regresi berganda seharusnya positif menjadi
negatif.
Untuk mendeteksi adanya multikolinearitas digunakan beberapa metode yaitu:
1) Koefisien korelasi antara peubah bebas. Adanya multikolinearitas seringkali diduga
apabila nilai R2 cukup besar .
2) Dengan melihat elemen matrik korelasi. Jika korelasi antarvariabel independen lebih
besar daripada korelasi antara variabel independen dan variabel dependennya
menandakan adanya multikolinearitas pada variabel independennya.
3) VIF (Variance Inflation Factor )
Jika nilai VIF lebih dari 10 menandakan adanya multikolinearitas pada variabel bebas.
BAB III
PEMBAHASAN
3.1 KASUS
Distro “Planet Gaya” dalam beberapa bulan gencar mempromosikan sejumlah kaos
dengan membuka outlet-outlet di berbagai daerah di Lamongan. Distro tersebut ingin
mengetahui besar hubungan atau seberapa jauh biaya promosi, luas outlet, laju pertambahan
penduduk, kompetitor atau pesaing, dan income penduduk berpengaruh terhadap penjualan
Distro “Planet Gaya”. Oleh karena akan dilakukan uji regresi dengan keterangan sebagai
berikut.
1. Variabel bergantung/dependen (Y) : penjualan.
2. Variabel bebas/independen:
a) X1: Biaya Promosi (dalam juta Rupiah)
b) X2: Luas Outlet (dalam m2)
c) X3: Laju Pertambahan Penduduk
d) X4: Kompetitor atau Pesaing
e) X5: Income Penduduk
3.2 DATA YANG DIGUNAKAN
Daerah Penjual
an
(Y)
Promosi
(X1)
Luas
Outlet
(X2)
Laju
Penduduk
(X3)
Pesaing
(X4)
Income
(X5)
LAMONGAN 200 21 154 1.50 10 4.96
MADURAN 201 23 159 1.00 11 1.93
MANTUP 249 30 193 1.25 14 2.06
BABAT 241 26 179 1.14 12 3.05
SUKODADI 196 16 145 2.15 6 3.85
SUGIO 286 44 203 0.95 19 3.15
PACIRAN 229 25 179 1.17 11 2.94
SEKARAN 204 25 149 2.24 5 2.05
TIKUNG 199 19 144 0.85 9 4.29
KARANGGENENG 211 26 170 1.63 9 2.03
KARANGBINAGUN 240 27 187 2.14 6 2.25
DEKET 281 42 196 1.13 14 2.03
PUCUK 307 49 243 2.03 16 3.01
KEMBANGBAHU 259 35 161 2.04 13 2.31
TURI 317 37 282 1.03 13 2.51
3.3 MENGANALISIS ADANYA MULTIKOLINEARITAS
Persamaan regresi yang diperoleh dengan memasukkan seluruh variable independen adalah
y = 64.7 + 2.03 x1 + 0.552 x2 + 2.44 x3 + 0.91 x4 + 0.61 x5
Perhatikan hasil dari Minitab berikut:
Correlations: y, x1, x2, x3, x4, x5
y x1 x2 x3 x4
x1 0.916
0.000
x2 0.903 0.735
0.000 0.002
x3 -0.145 -0.062 -0.199
0.605 0.827 0.477
x4 0.744 0.796 0.574 -0.495
0.001 0.000 0.025 0.060
x5 -0.287 -0.339 -0.252 -0.111 -0.073
0.300 0.217 0.366 0.694 0.795
Cell Contents: Pearson correlation
P-Value
Dari hasil tersebut dapat kita lihat bahwa terdapat perbedaan tanda antara koefisien x3 dan x5
pada persamaan regresi dengan hasil perhitungan korelasi Pearson. Oleh karena itu dapat
kita simpulkan bahwa terdapat multikolinearitas di antara beberapa variabel independen,
baik dengan sesama variabel independen maupun dengan variable dependen.
3.4 MENGATASI MULTIKOLINEARITAS DENGAN MENGGUNAKAN STEPWISE
REGRESSION
Metode Stepwise dimulai dengan memasukkan variabel bebas yang mempunyai
korelasi paling kuat dengan variabel dependen. Kemudian setiap kali pemasukan variabel
bebas yang lain, dilakukan pengujian untuk tetap memasukkan variabel bebas atau
mengeluarkannya. Dari hasil analisis korelasi kita tahu bahwa variabel bebas yang
mempunyai korelasi paling kuat dengan variabel dependen adalah variabel Promosi, Outlet,
dan Pesaing karena nilai korelasi dengan variabel dependen masing-masing variabel tersebut
di atas 0,5.
1) Stepwise Regression (Memasukkan x1)
Stepwise Regression: y versus x1
Alpha-to-Enter: 0.15 Alpha-to-Remove: 0.15
Response is y on 1 predictors, with N = 15
Step 1
Constant 126.0
x1 3.89
T-Value 8.21
P-Value 0.000
S 17.1
R-Sq 83.84
R-Sq(adj) 82.60
Mallows C-p 2.0
Regression Analysis
The regression equation is
y = 126 + 3.89 x1
Predictor Coef SE Coef T P
Constant 126.03 14.72 8.56 0.000
x1 3.8866 0.4733 8.21 0.000
S = 17.1385 R-Sq = 83.8% R-Sq(adj) = 82.6%
Analysis of Variance
Source DF SS MS F P
Regression 1 19809 19809 67.44 0.000
Residual Error 13 3818 294
Total 14 23627
ANALISIS:
F hitung >F tabel= 4.66719
; artinya tolak H0. Dapat disimpulkan bahwa model regresi berarti
T hitung>T tabel= 1.77093
;artinya tolak H0. Dapat disimpulkan bahwa variabel Promosi berpengaruh terhadap Penjualan.
Stepwise Regression (Memasukkan x2)
Stepwise Regression: y versus x1, x2
Alpha-to-Enter: 0.15 Alpha-to-Remove: 0.15
Response is y on 2 predictors, with N = 15
Step 1 2
Constant 126.03 73.69
x1 3.89 2.33
T-Value 8.21 5.94
P-Value 0.000 0.000
x2 0.539
T-Value 5.42
P-Value 0.000
S 17.1 9.61
R-Sq 83.84 95.31
R-Sq(adj) 82.60 94.53
Mallows C-p 30.4 3.0
Regression Analysis: y versus x1, x2
The regression equation is
y = 73.7 + 2.33 x1 + 0.539 x2
Predictor Coef SE Coef T P
Constant 73.69 12.70 5.80 0.000
x1 2.3266 0.3914 5.94 0.000
x2 0.53911 0.09946 5.42 0.000
S = 9.60631 R-Sq = 95.3% R-Sq(adj) = 94.5%
Analysis of Variance
Source DF SS MS F P
Regression 2 22520 11260 122.02 0.000
Residual Error 12 1107 92
Total 14 23627
Source DF Seq SS
x1 1 19809
x2 1 2711
ANALISIS:
F hitung >F tabel= 4.66719; artinya tolak H0. Dapat disimpulkan bahwa model regresi berarti
T hitung>T tabel= 1.77093;artinya tolak H0. Dapat disimpulkan bahwa variabel Promosi dan
Outlet berpengaruh secara serentak terhadap Penjualan.
Stepwise Regression(Memasukkan x4)
Stepwise Regression: y versus x1, x2, x4
Alpha-to-Enter: 0.15 Alpha-to-Remove: 0.15
Response is y on 3 predictors, with N = 15
Step 1 2
Constant 126.03 73.69
x1 3.89 2.33
T-Value 8.21 5.94
P-Value 0.000 0.000
x2 0.539
T-Value 5.42
P-Value 0.000
S 17.1 9.61
R-Sq 83.84 95.31
R-Sq(adj) 82.60 94.53
Mallows C-p 27.9 2.3
Regression Analysis: y versus x1, x2, x4
The regression equation is
y = 72.5 + 2.13 x1 + 0.541 x2 + 0.60 x4
Predictor Coef SE Coef T P
Constant 72.51 13.29 5.45 0.000
x1 2.1321 0.5462 3.90 0.002
x2 0.5406 0.1026 5.27 0.000
x4 0.597 1.128 0.53 0.608
S = 9.90837 R-Sq = 95.4% R-Sq(adj) = 94.2%
Analysis of Variance
Source DF SS MS F P
Regression 3 22547.4 7515.8 76.55 0.000
Residual Error 11 1079.9 98.2
Total 14 23627.3
Source DF Seq SS
x1 1 19808.9
x2 1 2711.1
x4 1 27.4
ANALISIS:
F hitung >F tabel= 4.66719; artinya tolak H0. Dapat disimpulkan bahwa model regresi berarti.
Akan tetapi T hitung<T tabel=1,77093 di variabel Pesaing;artinya menerima H0. Dapat
disimpulkan bahwa variabel Pesaing kurang berpengaruh terhadap Penjualan, sehingga kita perlu
untuk membuang variabel Pesaing.
Menurut keterangan Collinearity Statistics dari SPSS, yaitu dengan
memperhatikan kolom TOLERANCE atau toleransi.
Coefficientsa
126.030 14.721 8.561 .000
3.887 .473 .916 8.212 .000 1.000 1.000
(Constant)
X1
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardi
zed
Coef f icien
ts
t Sig. Tolerance VIF
Collinearity Statistics
Dependent Variable: Ya.
Sebagai contoh pada model ke 2 untuk variabel X1(Promosi), didapat besar toleransi adalah
0,459. Hal ini berarti R2 adalah 1 – 0,459 atau 0,541. Hal ini berarti hanya 54,1 % variabilitas
promosi bisa dijelaskan oleh prediktor (variabel bebas) yang lain. Default bagi SPSS bagi angka
toleransi adalah 0,0001. Semua variabel yang akan dimasukkan dalam perhitungan model regresi
harus mempunyai toleransi di atas 0,0001. Terlihat bahwa semua variabel telah memenuhi
persyaratan ambang toleransi.
Perhatikan kolom VIF !Sebagai contoh, pada model ke 2 untuk variabel X1(promosi),
didapat besar toleransi 0,459. Maka besar VIF adalah:
VIF = 1 / 0,459 = 2,177
Pada umumnya, jika VIF lebih dari 10, maka variabel tersebut
mempunyai persoalan multikolinieritas dengan variabel bebas yang lainnya. Jika dilihat
pada tabel diatas, maka variabel bebas Outlet(X2) dan Promosi(X1)
mempunyai VIF kurang dari 10, sehingga bisa diduga tidak ada persoalan
multikolinieritas yang serius.
Ada tidaknya multikolinearitas di antara sesama variabel bebas dapat dilihat sebagai
berikut.
Coefficientsa
73.690 12.702 5.802 .000
2.327 .391 .548 5.944 .000 .459 2.177
.539 .099 .500 5.420 .000 .459 2.177
(Constant)
X1
X2
Model
1
B Std. Error
Unstandardized
Coef f icients
Beta
Standardi
zed
Coef f icien
ts
t Sig. Tolerance VIF
Collinearity Statistics
Dependent Variable: Ya.
Collinearity Diagnosticsa
1.954 1.000 .02 .02
4.625E-02 6.500 .98 .98
Dimension
1
2
Model
1
Eigenvalue
Condit ion
Index (Constant) X1
Variance Proportions
Dependent Variable: Ya.
Bagian ini membahas ada tidaknya multikolinearitas atau terjadinya korelasi di antara
sesama variabel bebas. Model regresi yang baik tentunya tidak ada multikolinier atau
adanya korelasi diantara variabel bebas. Promosi dan Outlet (kode 2 dan 3) mempunyai
nilai Eugen yang mendekati 0. Sedangkan indeks variabel Outlet melebihi angka 15. Hal
ini berarti ada dugaan terjadi problem multikolinieritas, yaitu adanya korelasi diantara
variabel Promosi dan Outlet. Hal ini mengindikasikan bahwa Stepwise Regression tidak
menjamin untuk bisa menyelesaikan persoalan multikolinearitas.
Collinearity Diagnosticsa
2.942 1.000 .00 .00 .00
4.628E-02 7.973 .40 .46 .00
1.185E-02 15.754 .60 .53 1.00
Dimension
1
2
3
Model
1
Eigenvalue
Condition
Index (Constant) X1 X2
Variance Proportions
Dependent Variable: Ya.
BAB IV
KESIMPULAN
Hanya ada dua variabel bebas yang dimasukkan dalam model regresi, yaitu Promosi dan
Outlet. Sedangkan persamaan regresi yang didapat adalah:
y = 73.7 + 2.33 x1 + 0.539 x2
Dimana:
Y = Penjualan, sedang X1= Biaya Promosi, dan X2 = Luas Outlet.
DAFTAR PUSTAKA
Anonim, Apa Itu Regresi Stepwise. http. analisis regresi/anreg/Apa itu Regresi Stepwise «
Professional Data Analyst.htm.Diakses pada tanggal 20-11-2011
Anonim,Kolineritas Berganda. Http. Kolinearitas Ganda (multicollinearity) « Excellent88's
Blog.htm.Diakses pada tanggal 21-11-2011