perkiraan interval dan pengujian hipotesis dalam regresi sederhana
DESCRIPTION
PERKIRAAN INTERVAL DAN PENGUJIAN HIPOTESIS DALAM REGRESI SEDERHANATRANSCRIPT
4.1 beberapa ide tentang perkiraan interval
Bagian yang penting dalam ilmu statistik adalah statistik induktif atau
statistical inference. Statistic induktif mencakup dua hal pokok, yakni teori
estimasi dan pengujian hipotesis. Teori perkiraan terdirir dari dua hal penting.
Yaitu perkiraan tunggal dan perkiraan interval.
Perkiraan tunggal mengenai koefisien regresi, koefisien korelasi dan
varian sudah dibahas panjang lebar dengan menggunakan metode kuadrat terkecil
sederhana (OLS) dan juga disinggung sedikit mengenai metode maximum
likelihood (ML). Dalam bab ini akan dibahas mengenai perkiraan interval dan
pengujian hipotesis , baik mengenai koefisien-koefisien, individu dan nilai
harapan Y, maupun varian kesalahan pengganggu.
Untuk membahas ide dasar perkiraan interval, perkiraan koefisien regresi ,
ini artinya kalau upah karyawan naik 1 unit, maka konsumsi karyawan naik
0,8556 kali. Jadi seandainya upah karyawan naik Rp 1.000,00 maka diperkirakan
konsumsi karyawan akan naik Rp 855,60. Menurut Keynes, kenaikan konsumsi
selalu lebih kecil dari kenaikan pendapatan (karena upah merupakan satu-satunya
pendapatan), hal itu dinyatakan dalam konsep MPC (marginal propensity to
consume).
Nilai b= 0,8556 ini merupakan perkiraan tunggal parameter B, yaitu
koefisien regresi sebenarnya (Yi = A + BXi + ε i) . khusus dalam hal ini, kalau
X=pendapatan dan Y= konsumsi, koefisien regresi merupakan MPC. Pertanyaan
yang timbul : seberapa juga perkiraan b ini dapat dipercaya ?
Karena adanya fluktuasi sampling, perkiraan tunggal ini akan berbeda
dengan nilai sebenarnya (B), walaupun dalam sampling yang diulang, nilai rata-
rata b akan sama dengan nilai B sebab b pemerkira tidak bias. Dalam statistika,
tingkat kepercayaan (reliability) pemerkira tunggal diukur oleh standar eror atau
variannya. Maka, daripada percaya pada perkiraan tunggal saja, kita mungkin
lebih baik kalau memberikan pernyataan probabilitas, bahwa pemerkira tunggal
tersebut terletak dalam suatu interval disekitar nilai parameternya (b akan terletak
disekitar B), sejauh 1,2 atau 3 standard erornya. Jadi, perkiraan interval bebarti
kita mengharapkan bahwa nilai B yang sebernarnya itu akan terletak dalam suatu
interval (dengan nilai batas bawah dan batas atas) dengan tingkat keyakinan
1
tertentu, katakanlah 95% Inilah yang merupakan ide dasar di belakang perkiraan
interval tersebut.
Untuk lebih jelasnya, anggap bahwa kita akan mencari kenyataan betapa
dekatnya nilai b tersebut dengan B. untuk maksud ini, kita mencoba mencari dua
nilai positif, katakan d dan α (alpha), dimana nilai alpha terletak diantara 0 dan 1,
sedemikian rupa sehingga probabilitas bahwa interval (b-d, b+d) mencakup nilai
sebenarnya (B) sebesar (1-α)
Dengan symbol dapat ditulis :
P(b-d ≤ B ≤ b+d = 1-α
b – d b + d (4.1)
confidence interval
batas bawah interval batas atas
1-α disebut koefisisen keyakinan/ tingkat keyakinan. α disebut tingkat nyata/
berarti (level of significance). Di dalam pengujian hipotesis, αdisebut kesalahan
tipe pertama, yaitu kesalahan yang terjadi karena kita menolak hipotesis nol,
padahal hipotesis tersebut benar (keputusan yang benar, hipoteisis tersebut harus
kita termia). Alpha juga dapat diartikan sebagai besarnya kesalahan yang kita
torerir di dalam membuat suatu keputusan. Kalau 1-α= 0,95; α = 1-0,95 = 0,05;
ini berarti kita mentorerir kesalahan sebesar 5%. Salah dalam hal ini, berarti
interval tidak memuat B lebih kecil dari (b – d) atau lebih besar dari (b+d).
kesalahan ini menimbulkan resiko dalam pembuatan keputusan, maka dari itu
untuk memperkecil resiko, kesalahan harus dibuat sekecil mungkin. Titik akhir
pada interval disebut batas keyakinan (confidende limit) atau nilai kritis (critical
value)
b – d = batas keyakinan bawah atau nilai batas bawah
b + d = batas keyakinan atas atau nilai batas atas
dalam praktiknya, α dan (1 – α ¿bukan dinyatakan sebagai proporsi, tetapi sebagai
presentase, yaitu 100% dan 100(1-α ¿% .
Persamaan (4.1) menunjukkan bahwa suatu pemerkira interval merupakan
suatu interval yang dibuat sedemikian rupa sehingga interval tersebut mempunyai
2
nilai probabilitas sebesar (1-α ¿ akan memuat nilai parameter B. misalnya kalau α
= 0,05 (5%), maka persamaan (4.1) harus dibaca : probabilitas bahwa interval
antara ( b – d ) dan ( b + d ) akan memuat nilai B sebesar 0,95 atau 95%.
Perkiraan interval memberikan berbagai nilai dalam suatu interval, diharapkan
nilai B akan terletak di dalamnya. Kemungkinan tidak memuat ( B terletak di
luarnya, B < b-d atau B > b + d ) sebesar 5%
Perlu diperhatikan beberapa aspek penting tenatang perkiraan interval ini,
yaitu sebagai berikut:
(1) Persamaan (4.1) tidak berarti bahwa probabilitas parameter B terletak dalam
interval yang dibatasi nilai batas bawah dan atas tersebut sebesar (1-α ¿,
katakana 90% atau 95 %. Sebab parameter B, walaupun tidak diketahui
nilainya, dianggap mempunyai nilai tetap/konstan (tidak berubah-ubah) bisa
terletak dalam interval dan bisa juga tidak.
Arti persamaan (4.1) yang sebenarnya ialah bahwa dengan menggunakan
metode yang dijelaskan, probabilitas untuk meperoleh suatu interval yang
memuat B sebesar (1-α ¿ .
Penjelasan lebih lanjut : kalau seluruh sample dari suatu populasi sebanyak k
kita hitung perkiraan intervalnya, akan kita peroleh k interval. Apabilak kita
tentukan (1-α ¿ = 0,95 misalnya, maka setelah kita teliti hasil hitungan kita,
akan diperoleh kurang lebih 95 % dari k interval tersebut memuat parameter
B, selebihnya / sisanya sebanyak ±5% tidak memuat B. oleh karena di dalam
praktiknya, kita hanya mengambil sampel secara random satu kali saja dari
populasi yang bersangkutan, maka kita harapkan dengan tingkat keyakinan
sebesar 95%, sampel tersebut akan memuat parameter B.
Perhatikan gambar berikut ini :
Setiap titik menunjukkan interval yang dibuat berdasarkan sampel
3
Ada k interval,
karena ada k sampel
Bagian yang diarsir terdiri dari interval
yang tidak memuat B
Bagian yang tidak diarsir terdiri dari interval yang memuat parameter B
Berdasarkan gambar di atas, maka probabilitas untuk memperoleh
interval yang memuat B merupakan hasil bagi daerah yang memuat B
(tidak diarsir) dengan seluruh daerah : 0,95
1 X 100% = 95% atatu 100(1-
α ¿%= 95% disebut tingkat keyakinan (confidence level).
(2) Interval (4.1) adalah interval acak (random interval) , yang berarti akan
berubah dari sampel ke sampel, sebab nilainya tergantung pada b yang
berbeda dari sampel satu ke sampel yang lainnya.
Perhatikan gambar berikut :
4
. . . . . . . . .
Memuat parameter B
. . . . . . . . .
. ..
Sampel 1, interval 1 = I1 memuat B
memuat B
Sampel 2, interval 2 = I2 tak memuat B
memuat B
Sampel 3, interval 3 = I3 memuat B
tak memuat B
Sampel i, interval i = Ii memuat B
memuat B
Sampel k, interval k = Ik memuat B
tak memuat B
Keterangan : interval yang memotong garis tegak lurus memuat B,
sedangkan yang tidak memotong tidak memuat B. Garis tegak lurus
tempat letaknya B. ada beberapa interval.
(3) Oleh karena confidence interval merupakan acak (random), pernyataan
probabilitas yang menyangkut dirinya harus dimengerti, bahwa
mempunyai pengertian jangka panjang (in the long sense), yaitu yang
berlaku dalam sampling yang berulang-ulang (repeated sampling).
Secara khusus persamaan (4.1) berarti : apabila dalam sampling yang
berulang-ulang confidence interval semacam itu dibuat, lihat gambar dari
keterangan (2), maka dengan probabilitas sebesar (1-α ¿, kita harapkan
dalam jangka panjang, secara rata-rata, interval seperti (4.1), kurang lebih
100(1-α ¿%, katakanlah 90% atau 95%, akan memuat nilai parameter B.
(4) Seperti diterangkan dalam (2), interval (4.1) sifatnya acak selama nilai b
tidak diketahui. Akan tetapi, begitu kita mengambil satu sampel dan
menghitung nilai b dan membuat interval, maka kita memperoleh satu
interval saja, yang mungkin memuat B atau tidak memuat B, dalam hal ini
interval (4.1) tidak lagi random, tetapi sudah merupakan nilai yang
tetap/konstan, misalnya antara 0,50-0,75 atau antara 0,60-0,80. Dalam hal
ini kita tidak boleh membuat pernyataan probabilitas mengenai persamaan
5
(4.1), artinya kita tidak dapat menyatakan probabbilitas sebesar (1-α ¿,
bahwa suatu interval yang nilainya tetap tersebut memuat parameter B.
dalam situasi semacam ini hanya ada dua kemungkinan untuk B, yaitu B
berada dalam interval itu atau tidak. Jadi, probabilitasnya hanya ada dua
kemungkinan nilai, yaitu 1 atau 0. Probabilitas 1 kalau B berada dalam
interval dan 0 kalau B berada di luar interval.
Kemudian bagaimana caranya interval keyakinan (confidence interval)
tersebut dibuat? Kalau distribusi sampling atau distribusi probabilitas dari
pemerkira diketahui, maka kita dapat membuat pernyataan interval keyakinan
seperti persamaan (4.1). kita ketahui bahwa dengan asumsi kenormalan tentang
kesalahan pengganggu ε I, pemerkira hasil metode kuadrat terkecil biasa (OLS),
pemerkira a dan b juga mengikuti distribusi normal, dan bahwa pemerkira se2 akan
mengikuti distribusi khai-kuadrat(chi-square) = x2. Sebelum kita membuat
interval keyakinan tentang koefisien A dan B dalam regresi, terlebih dahulu akan
disinggung beberapa jenis distribusi yang erat sekali hubungannya dengan
distribusi normal. Beberapa teori yang diungkapkan disini.
4.1.1 Beberapa teori tentang beberapa jenis distribusi yang erat sekali
hubungannya dengan distribusi normal.
Berikut ini akan diuraikan beberapa teori yang erat hubungannya dengan
teori normal. Teori yang dikemukakan tanpa bukti ini sangat berguna dalam
pemabahasan, baik teori perkiraan maupun pengujian hipotesis, antara lain fungsi
t, χ2, dan F.
Teori 4.1. kalau Z1, Z2,…. Zn merupakan variable bebas dan normal, masing-
masing dengan rata-rata μi dan variance σ i2, yaitu Zi N (μi,
σ i2), maka Z = ∑ k iZi, dimana k i konstan dan semuanya nol, juga
mempunyai distribusi normal dengan rata-rata μ= ∑ k i μ i dan variance
σ 2= ∑ k i σ2 , yaitu Z N (M,σ 2 ) = N (∑ k i μ i , ∑ k i σ
2¿.
6
Teori 4.2. kalau Z1, Z2,…. Zn merupakan variabel bebas dan normal, masing-
masing dengan rata-rata nol dan variance 1, yaitu Zi N
(0,1) merupakan normal yang baku (standar normal), maka Z = ∑ Z i2
mengikuti distribusi χ2 dengan derajat kebesar sebesar n, dinyatakan
dengan symbol Z χn2
.
Teori 4.3. kalau Z1, Z2,…. Zn merupakan variable acak yang bebas dan normal,
masing-masing mempunyai distribusi dengan derajat kebebasan
sebesar k, kemudian Z = ∑ Z i akan mengikuti distribusi χ2 dengan
derajat kebebasan sebesar k, dimana k = ∑ k i, dinyatakan dengan
symbol Z χk2
.
Teori 4.4. kalau Z1 merupakan variable normal standard, yaitu Zi N
(0,1) dan Z2 mengikuti distribusi χ2 dengan derajat kebebasan sebesar
k, dimana Z2 bebas terhadap Z1, maka variabel t yang kita definisikan
sebagai berikut :
t = Z1
√Z2/√k = Z i√k
√Z2
(4.2)
mengikuti distribusi t dari student dengan derajat kebebasan k.
Teori 4.5. kalau Z1, dan Z2 masing-masing merupakan variabel bebas yang
mengikuti distribusi χ2 dengan derajat kebebasan k1 dan k2 , yaitu Z1
χk 12
dan Z2 χk 22
maka variabel F kita definisikan
sebagai berikut.
F = Z1/k1
Z2/k2
(4.3)
7
Mempunyai distribusi F dengan derajat kebebasan k1 dan k2
Baik distribusi t, χ2, dan F sudah dibuat tabelnya. Untuk keperluan
pembuatan perkiraan interval dan pengujian hipotesis tabel – tabel
tersebut sangat penting artinya.
4.2 Perkiraan Interval untuk Koefisien dan Kesalahan Pengganggu
Bahwa dengan asumsi kenormalan tentang ε i, pemerkira hasil OLS a dan b
juga mengikuti distribusi normal dengan rata-rata dan varian masing-masing.
Dengan demikian, maka variabel Z yang kita definisikan adalah sebagai berikut.
Z=b−Bσb
Z=(b−B)√∑ x i
2
σ(4 . 4)
Merupakan variabel normal yang standar, yaitu Z N (0,1). Berdasarkan
hal ini, kita bisa menggunakan distribusi normal untuk membuat pernyataan
probabilitas tentang b dengan syarat bahwa varian kesalahan pengganggu ¿σ 2
diketahui.. Apabila σ 2 diketahui, suatu sifat penting yang memiliki variabel
dengan distribusi normal dengan kata-kata μ dan varian σ 2 ialah bahwa daerah di
bawah kurva normal antara μ+σ (berjarak satu deviasi standar dari rata-rata),
kurang lebih sebanyak 68%; antara μ+2 σ (berjarak dua standar deviasi dari rata-
rata), kurang lebih sebanyak 95%; dan antara μ+3 σ (berjarak tiga deviasi standar
dari rata-rata), kurang lebih sebanyak 99,7%
Perhatikan gambar berikut!
8
μ+3 s μ+2 σ μ+1 σ μ μ+1 σ μ+2 σ μ+3 σ
± 68 % ± 95 % ± 99,7 %
Dalam praktiknya, σ 2 jarang sekali diketahui, sehingga harus diperkirakan dengan
perkiraan tidak bias se2, di mana
se2= 1
n−2∑ e i2
Dengan jalan mengganti σ dengan se dalam persamaan (4.4), maka kita peroleh
persamaan sebagai berikut.
t=b−BSb
, Sb perkiraanσ b
t=(b−B)√∑ x i
2
Se
(4 .5)
Dapat ditunjukan bahwa t mengikuti distribusi t dengan derajat kebebasan
sebesar (n-2). Persamaan (4.4) menggunakan σ b mengikuti ditribusi normal,
sedangkan persamaan (4.5) menggunakan sb mengikuti ditribusi t. Uraian lebih
lanjut tentang persamaan (4.5) adalah sebagai berikut.
Misalkan :
Z1=b−B
σb
, σ b
¿ σ
√∑ x i2
¿(b−B)√ x i
2
σ
9
Dan Z2=(n−2)Se
2
σ2
Apabila σ 2 diketahui, Z akan mengikuti distribusi normal yang baku
(standar normal), yaitu Z1 N (0,1), artinya mempunyai rata-rata nol dan varian
satu. Sedangkan Z2 mengikuti distribusi khai-kuadrat dengan derajat kebebasan
(n-2), berdasarkan teori 4.4, variabel t berikut.
t=Z1 √n−2
√Z2
Akan mengikuti distribusi t dengan derajat kebebasan (n-2). Apabila Z1dan Z2 di
atas kita masukan, akan kita peroleh hasil berikut.
t=(b−B)√ x i
2√n−2
σ.. X √σ 2
√n−2√ Se2
t=(b−B)√∑ x i
2
Se
sama dengan persamaan(4.5)
Oleh karenanya, untuk membuat perkiraan interval B, kita akan menggunakan
distribusi t sebagai pengganti normal berikut.
P(−t a2
≤ t ≤ t a2)=1−a(4 .6)
Di mana t seperti dalam persamaan (4.5), t a2 diperoleh dari tabel t dengan derajat
kebebasan sebesar (n-2). Dengan mengganti t seperti dalam persamaan (4.5),
maka kita peroleh pernyataan probabilitas sebagai berikut.
P(−t a2
≤b−B
Sb
≤ t a2)=1−a(4 .7)
Sekarang perhatikan gambar berikut!
−t a2
≤b−B
Sb
≤t a2
10
I
II
I. −t a2
≤b−B
Sb menjadi −t a
2
Sb≤ b−B menjadi B ≤b+ t a2
Sb
II. b−B
Sb
≤t a2 menjadi b−B≤ t a
2
Sb menjadi b — t a2
Sb ≤ B
Kemudian I dan II digabung dan kita peroleh bentuk pernyataan probabilitas
sebagai berikut.
P(b−t a2
Sb ≤ B ≤ b+t a2
Sb)=1−a(4.8)
Rumus perkiraan interval B menjadi :
b−t a2
Sb ≤ B ≤ b+t a2
Sb
b−t a2
Se
√∑ xi2
≤ B ≤b+t a2
Se
√∑ x i2(4 .7)
Di mana
Se=√ 1n−2
∑ e12=√ 1
n−2(∑ y1
2−b2∑ x i2 )
Contoh soal 4.1 :
Buat perkiraan interval untuk B, kalau tingkat keyakinan sebesar 95%, apabila
diketahui :
b = 0,5446
Se = √Se2
= √2,050303333
= 1,4318880898403
∑ Xi2=113,9655
1-a = 0,95 Tingkat keyakinan 95%
a = 0,5 Kesalahan yang diterima
a/2 = 0,25
Jawaban :
11
Sb = √Se2
√∑ Xi2
Sb = √1,4318880898403
√113,9655
Sb = 1,196615238846810,675462519254
Sb = 0,1120902477704
Dari tabel t, t a2
(n−2 )=t 0,0025 (3 )=3,182
b−t a2
Sb ≤ B ≤ b+t a2
Sb
0,5446- 3,182 (0,1120902477704 )≤ B ≤ 0,5446+3,182 (0,1120902477704 )
0,5446– 0.3566711684054 ≤ B ≤ 0,5446+ 0.3566711684054
0,1879288315946 ≤ B ≤ 0,9012711684054
0,1879 ≤ B ≤ 0,9013
Kalau upah naik Rp50.000,00 maka interval antara Rp1.879 sampai Rp9.013
diharapkan akan memuat nilai B sebenarnya dengan tingkat keyakinan 95%
Contoh soal 4.2 :
Buat perkiraan interval untuk B, kalau tingkat keyakinan sebesar 95%, apabila
diketahui :
b = 0,653102123
Sb=0,031062468
n = 5
(1-a) = 0,95
a = 0,05
Dari tabel t, t a2
(n−2 )=t 0,0025 (3 )=3,182
Jawaban :
12
b−t a2
Sb ≤ B ≤ b+t a2
Sb
0,653102123- 3,182 (0,031062468 ) ≤ B ≤ 0,653102123+3,182 (0,031062468 )
0,653102123– 0.098840773 ≤ B ≤ 0,653102123+ 0.098840773
0,55426135 ≤ B ≤ 0,751942896
0,5543 ≤ B ≤ 0,7519
Dengan tingkat keyakinan sebesar 95%, dalam jangka panjang kita
harapkan bahwa interval seperti (0,55426135 - 0,751942896) akan memuat nilai
parameter yang sebenarnya.
Kita tidak dapat mengatakan bahwa dengan probabilitas sebesar 95%,
interval khusus 0,55426135 sampai 0,751942896 akan memuat nilai parameter B
yang sebenarnya. Oleh karena interval ini konstan, bukan acak (random) lagi,
maka nilai parameter B sebenarnya bisa di dalam interval atau tidak. Probabilitas
bahwa suatu interval khusus yang konstan memuat B ialah 1 dan 0.
Soal 4.3
Berdasarkan data dari Biro Pusat Satistik, dimana
X = PDRB dalam milliar
Y = Konsumsi dalam milliar
TAHUN X Y
2006 29.473,644 9.824,3
2007 31.907,546 10.568,85
2008 34.595,450 9.230,04
2009 37.570,568 8.298,59
2010 40.545,686 8.851,38
13
Buat perkiraan interval koefisien regresi dengan tingkat keyakinan sebesar 95%!
Jawab :
Tahun X Y X2 Y2 XY2006 29.473,64400 9.824,30000 868.695.690,63874 96.516.870,49000 289.557.920,749202007 31.907,54600 10.586,85000 1.018.091.491,74212 112.081.392,92250 337.800.403,370102008 34.595,45000 9.230,04000 1.196.845.160,70250 85.193.638,40160 319.317.387,318002009 37.570,56800 8.298,59000 1.411.547.579,84262 68.866.595,98810 311.782.739,899122010 40.545,68600 8.851,38000 1.643.952.653,21060 78.346.927,90440 358.885.274,14668Total 174.092,89400 46.791,16000 6.139.132.576,13657 441.005.425,70660 1.617.343.725,48310
Belanja statistic :
N=5
X = 34.818,5788
Y = 9.358,232
∑ xy=∑ XY−(∑ X ) (∑Y )
n
= 1.617 .343 .725,4813−(174.092,894 ) ( 46.791,16 )
5 = -11.857.966,1203077
∑ x2=∑ X 2−(∑ X )2
n
= 6.139 .132.576,13657−(174.092,894 )2
5= 77.465.427,8775263
∑ y2=∑Y 2−(∑Y )2
n
= 441.005 .425,70660−(46.791,16000 )2
5
14
= 3.122.894,87748
b = ∑ xy
∑ x2
= −11.857.966,120307777.465 .427,8775263
= -0,1530743
∑ b xi2 = (−0 , 1530743 )2 (77 . 465 . 427 , 8775263 )
= 1.815.149,8592724
Se2 =
∑ y2−b2 x i2
n−2
= 3.122.894,87748−1.815 .149,8592724
5−2
= 435.915,0060692
Var(b)= Se
2
x i2
= 435.915,006069
77 . 465 . 427 ,8775263
= 0,0056272
Sb = √var (b)
= √0,0056272
= 0,0750147
α=0,05
ta/2 = 0,025
pembuatan interval keyakinan
= b – tα2
Sb ≤ B ≤ b + tα2
Sb
= -0,1530743 – 3,182(0,0750147) ≤ B ≤ 0,1530743 + 3,182(0,0750147)= -0,1530743 – 0,2386968 ≤ B ≤ -0,1530743 + 0,2386968
15
= -0,3917711 ≤ B ≤ 0,0856225
Dengan tingkat keyakinan sebesar 95%, diharapkan dalam jangka panjang,
interval seperti -0,3917711 sampai 0,0856225 akan memuat B.
Contoh soal 4.4 :
Buat perkiraan interval σ 2 dengan tingkat keyakinan 95% apabila diketahui :
Se2 = 2,050303333
Df = n-2
= 5-2
= 3
Jawaban :
x20,025( 3)=9,3484
x20,975 ( 3)=0,2158
df (Se2)x2
0,025 (3)
≤ σ2 ≤df (Se2)x2
0,975 (3 )
3(2,050303333)9,3484
≤ σ2 ≤3(2,050303333)
0,2158
0,6579639295494 ≤ σ 2≤ 28,502826686747
0,6580 ≤ σ2 ≤28,5028
Artinya dengan probabilitas 95%, dalam jangka panjang kita harapkan bahwa
interval antara 0,6580 sampai 28,5028 akan memuat σ 2
Contoh soal 4.5
Buat perkiraan interval σ 2 dengan tingkat keyakinan 95% apabila diketahui :
Se2 = 80,88625987
Df = n-2
= 5-2
= 3
x20,025( 3)=9,3484
16
x20,975 ( 3)=0,2158
Jawaban :
(n−2)(Se2)x2
a/2
≤ σ2 ≤(n−2)(Se2)x2
1−a /2
380,88625987
9,3484≤ σ2 ≤3
80,886259870,2158
3 (8,6524175120876 )≤ σ2 ≤3 (374,8204813253 )
25,957252536263 ≤ σ2 ≤1124,4614439759
25,96 ≤ σ2 ≤1124,46
Dengan tingkat keyakinan 95%, diharapkan dalam jangka panjang internal seperti
25,96 sampai 1124,46
4.3 Pengujian Hipotesis Koefisien Regresi
Pengujian hipotesis statistik (statistical testing hypothesis) sifatnya
kuantitatif, jadi setiap hipotesis yang kita maksudkan harus dinyatakan dengan
angka-angka. Persoalan pengujian hipotesis secara statistika mungkin bisa
dinyatakan secara sederhana sebagai berikut:
Apakah data observasi / empiris dari hasil penelitian sampel cukup erat
hubungannya dengan hipotesis yang dinyatakan / disebutkan, atau tidak ?
sehingga kita bisa sampai kepada keputusan untuk menolak atau menerima
hipotesis yang telah dinyatakan.
Jadi, apabila beberapa teori atau pengalaman yang telah lalu membuat kita
mempercayai bahwa koefisien arah B dari regresi konsumsi mingguan terhadap
upah mingguan, dalam contoh soal diketahui tingkat keyakinan sebesar 0,90,
apakah hasil hitungan b = 0,5446 yang diperoleh dari sampel akan konsisten
dengan hipotesis yang sudah dinyatakan sebelumnya? Kalau memang ya, kita
dapat menerima hipotesis, tetapi kalau tidak kita harus menolak hipotesis tersebut.
Dengan menggunakan bahasa statistik, hipotesis yang telah dinyatakan
dikenal dengan hipotesis nol (null hypothesis) dan diberi simbol H o. Hipotesis nol
ini diuji melawan hipotesis alternative (alternative hypothesis) dengan symbol H a ,
yang menyatakan misalnya, bahwa koefisien arah atau koefisien regresi tidak
17
sama dengan 0,90. Hipotesis alternative bisa sederhana (simple) atau komposit
(composite). Misalnya, H o : B = 0,90, ini sederhana, sedangkan kalau H a : B ≠
0,90, ini komposit.
Teori pengujian hipotesis berkenaan dengan pengembangan aturan-aturan
atau prosedur untuk memutuskan apakah kita harus menerima atau menolak
hipotesis nol. Sebetulnya, menolak H o berarti menerima H a, sebaliknya, kalau
menerima H o berarti menolak H a. Biasanya kita berkenaan dengan H o, keputusan
menerima H a hanya merupakan kosekuensi logis saja. Sebetulnya, ada dua
pendekatan yang saling berkomplementer, untuk menentukan aturan-aturan yang
dimkasud, yaitu interval keyakinan (confidence intervals) dan uji signifikan (test
of significant). Kedua pendekatan tersebut menyebutkan bahwa pengujian
hipotesis meliputi pembuatan pernyataan tentang nilai-nilai parameter dari
distribusi tersebut.
Sebagai contoh, kita tahu bahwa dengan asumsi kenormalan, b juga
mengikuti fungsi normal dengan rata-rata = E(b) dan var(b) = σ 2 / ∑ X i2 . Kalau
kita membuat hipotesis bahwa B = 0,90, kita telah membuat pernyataan tentang
salah satu parameter dari distibusi normal, yaitu mengenai rata-ratanya. Sebagian
besar dari pengujian hipotesis yang dibahas akan mempunyai semacam ini, yaitu
membuat pernyataan tentang satu atau beberapa nilai parameter dari beberapa
distribusi probabilitas, seperti normal, t, F, dan khai kuadrat.
4.3.1 Pengujian Hipotesis dengan Pendekatan Interval Keyakinan
Untuk membahas pendekatan interval keyakinan, misalnya kita mempunyai
hipotesis sebagai berikut:
H o : B = 0,90
H a : B ≠ 0,90
Perhatikan bahwa pengujian hipotesis nol merupakan hipotesis sederhana,
sedangkan hipotesis alternatifnya komposit. Apakah perkiraan b = 0,5446cukup
dekat dengan H o ?
Apabila diketahui :
0,1879 ≤ B ≤ 0,9013
18
Kita mengetahui bahwa dalam jangka panjang interval keyakinan tersebut
akan memuat nilai B sebenarnya, dengan probabilitas (tingkat keyakinan) sebesar
0,95 atau 95%. Konsekuensinya, dalam jangka panjang (sampel yang di ulang-
ulang), interval yang demikian itu akan merupakan suatu jarak (range) di mana di
dalamnya akan terletak nilai B dengan tingkat/koefisien keyakinan sebesar 95%.
Dengan demikian, interval keyakinan merupakan suatu himpunan dari
hipotesis nol yang dapat diterima. Oleh karena itu, kalau ternyata nilai B sesuai
dengan hipotesis nol, dalam hal ini H o : B =0,90, ternyata tercakup di dalam
interval keyakinan dengan koefisien/tingkat keyakinan sebesar 95%, maka H o
diputuskan untuk diterima, kalau ternyata tidak tercakup (terletak di luarnya),
harus ditolak H o tersebut.
Pengujian hipotesis dengan pendekatan interval keyakinan terdiri dari
langkah-langkah berikut:
Pertama: Menghitung perkiraan interval dengan tingkat keyakinan yang sudah
ditentukan, dalam hal ini 95%. Perkiraan interval yang diperoleh adalah 0,70995 ≤
B ≤ 1,00125.
Kedua: Kita cek, apakah nilai B sesuai dengan nilai hipotesis nol, dalam hal ini,
H o : B = 0,90, terletak dalam interval tersebut atau tidak? Kalau ya, H o kita
terima, kalau tidak, H o kita tolak. Dalam soal yang kita hadapi, H o : B = 0,90
ternyata terletak dalam interval, jadi H o kita terima.
Contoh Soal 4.6
X = Pendapatan per bulan dalam ribuan Rp
Y = Konsumsi per bulan dalam ribuan Rp
X 100 90 80 125 150 200
Y 80 70 60 85 100 150
Uji pendapatan bahwa koefisien regresi sebesar 0,80 dengan alternative tidak
sama dengan itu. Penggunaan tingkat signifikan sebesar 0,10 dengan
menggunakan pendekatan interval keyakinan.
Pemecahan
H o : B = 0,80
H a: B ≠ 0,80
19
α= 0,10,
Jadi 1 – α =
1 – 0,10 = 0,90
b−t α2
Sb ≤ B ≤ b+t a2
Sb
b−t 0,05 Sb ≤ B ≤ b+t 0,05 Sb
X Y X2 Y 2 XY
100 80 10000 6400 8000
90 70 8100 4900 6300
80 60 6400 3600 4800
125 85 15625 7225 10625
150 100 22500 10000 15000
200 150 40000 22500 30000
∑ X ∑Y ∑ X2 ∑Y 2 ∑ XY
20
745 545 102.625 54.625 74.725
∑ X i2 = ∑ X i
2−( X i )2/n
¿102.625−7452/6
¿102.625−92.504,17
¿10.120,83
∑ yi2=∑ Y i
2−(∑Y i )2/n
¿54.625−5452/6
¿54.625−¿ 49.504,17
¿5.120,83
∑ x i y i=∑ X iY i−∑ X i∑Y i /n
¿74.725− (745 ) (545 )/6
¿74.725−67.670,83
¿7.054,17
b=∑ xi y i
∑ x i2
¿ 7.054,1710.120,83
¿ 0,6970
∑ ei2=∑ y i
2−b2∑ x i2
¿5.120,83− (0,6970 )2 (10.120,83 )
¿5.120,83−4.916,79
¿204,04
Se2=∑ e i
2
n−2
¿204,04
4
¿51,01
21
Sb=√ Se2
∑ X i2
¿√ 5,0110.120,83
¿0,071
Dari tabel t, t 0,05 (4 ) ¿ 2,132, derajat kebebasan = df = 4
Perkiraan interval B sebagai berikut:
0,6970−2,132 (0,071 )≤ B≤ 0,6970+2,132 (0,071 )
0,6970−0,1514 ≤ B ≤ 0,6970+0,1514
0,5456 ≤ B ≤ 0,8484
Oleh karena interval keyakinan antara 0,5456 dan 0,8484 memuat nilai B = 0,80,
maka H o kita terima dengan tingkat kepercayaan sebesar 0,90 atau 90%. Dengan
perkataan lain, pendapat yang menyatakan bahwa B = 0,80 dapat diterima.
Contoh Soal 4.7Dengan menggunakan contoh soal 3.2, misalnya kita menganggap bahwa
besarnya MPC (Marginal propensity to consume) yang dinyatakan dalam
parameter B sebesar 0,4 dengan alternative tidak sama. Pergunakan tingkat
signifikan sebesar 0,05 dengan pendekatan perkiraan interval.
Pemecahan
H 0 :B=0,4
H a :B ≤ 0,4
Berdasarkan contoh soal 4.2, sudah kita hitung bahwa dengan tingkat keyakinan
sebesar 95%, dalam jangka panjang, interval 0,55426135 sampai dengan
0,751942896 akan memuat nilai parameter B. Interval keyakinan 0,55426135 < B
< 0,751942896 ternyata tidak memuat nilao hipotesis nol B = 0,4 ditolak.
Jadi, hipotesis atau pendapat bahwa MPC = B = 0,4 ditolak.
Probabilitas untuk mendapatkan nilai B = 0,4 (sebelah kiri nilai batas bawah)
sebesar 0,025 (2,5%).
2,5% 2.5%
0,55426135 0,751942896
22
95%
nilai batas bawah nilai batas atas
Pengujian hipotesis dengan pendekatan perkiraan interval terdiri dari dua tahap
yang harus diperhatikan,
Pertama : Dihitung perkiraan interval dari parameter yang bersangkutan, dengan
tingkat keyakinan tertentu, yaitu (1−α). Nilai α=0,01 atau 0,05.
Kedua : Kemudian dicek, apakah nilai parameter berdasarkan hipotesis nol
terletak di dalam interval atau tidak. Kalau ya, H 0 diterima, kalau tidak, H 0
ditolak.
4.3.2 Pengujian Hipotesis dengan Pendekatan Uji Signifikan (Nyata)
Pendekatan lainnya yang sifatnya komplementer terhadap metode interval
keyakinan dalam pengujian hipotesis secara statistik ialah pendekatan uji-
signifikan yang dikembangkan oleh R.A. Fisher secara independen dan bersama-
sama oleh Neyman dan Pearson.
Secara umum, dapat dikatakan bahwa suatu uji-signifikan adalah suatu
prosuder untuk suatu hasil perhitungan berdasarkan sampel, untuk memeriksa
benar tidaknya suatu hipotesis nol. Ide pokok yang mendasari uji-signifikan ialah
suatu pemerkira (estimator) dan distribusi sampling dari pemerkira yang demikian
itu di bawah hipotesis nol. Keputusan untuk menerima atau menolak H o dibuat
atas dasar nilai pemerkira yang diperoleh dari data empiris / hasil observasi dari
sampel. Maksudnya, untuk menguji benar tidaknya nilai parameter yang
dinyatakan dalam H o, akan dipergunakan suatu criteria uji (btest criteria) yang
dihitung berdasarkan sampel yang diteliti. Untuk ilustrasi, ingat bahwa dengan
asumsi kenormalan, variable t berikut ini:
t=b−BSb
t=(b−B )√∑ X i
2
Se
23
akan mengikuti t dengan kebebasan sebesar (n - 2). Apabila nilai B sudah jelas
dinyatakan dalam H o, maka nilai t dari t=(b−B )√∑ X i
2
Se
langsung dapat dihitung
dari sampel yang bersangkutan, sehingga dapat dipergunakan sebagai criteria uji,
sebagai dasar untuk memutuskan menerima atau menolak H o. Oleh karena uji
criteria ini mengikuti distribusi t, maka pernyataan interval keyakinan seperti
berikut ini dapat dibuat.
P(−t α /2 ≤b−Bo
Sb
≤ tα /2)=1−α
di mana Bo ialah nilai B sesuai dengan H o.
Nilai −t α /2, t α /2 dapat diperoleh dari tabel t dengan derajat kebebasan sebesar
(n - 2).
Perhatikan uraian berikut :
−t α /2≤b−Bo
Sb
≤t α /2
−t α /2 Sb ≤ b−Bo≤ t α /2 Sb
I. −t α /2 Sb ≤ b−Bo akan menjadi Bo−t α /2 Sb ≤ b
II. b−Bo ≤t α /2 Sb akan menjadi b ≤
Setelah I dan II digabung, kita peroleh hasil berikut.
P (Bo−tα /2 Sb ≤b≤ Bo+t α /2 Sb )=1−α
yang merupakan interval di mana b akan tercakup (terletak di dalamnya) dengan
probalitas sebesar (1 −α) dan H o : B=Bo.
Dengan menggunakan bahasa pengujian hipotesis, 100(1 −α )% interval
keyakinan di kenal dengan daerah penerimaan (accepted region) dari pengujian
hipotesis, sedangkan daerah di luar interval keyakinan tersebut dinamakan daerah
penolakan (rejected region) dan sering disebut daerah kritis (critical region).
Betapa eratnya hubungan antara pendekatan interval keyakinandan uji
hipotesis dapat dilihat dengan jalan membandingkan persamaan
P (b−t α /2 Sb ≤ B ≤ b+t α /2 Sb )=1−α dengan persamaan
P (Bo−tα /2 Sb ≤b≤ Bo+t α /2 Sb )=1−α.
Di dalam prosedur interval keyakinan, kita mencoba membuat suatu batas (limit) berupa interval yang dihitung berdasarkan sampel, di mana dalam jangka panjang
24
(sampel yang diulang-ulang), dengan tingkat keyakinan tertentu, kita harapkan nilai parameter B yang tidak diketahui akan terletak; sedangkan dalam pendekatan uji-signifikan, kita membuat hipotesis atau anggapan mengenai nilai parameter B yang sebenarnya dan mencoba melihat apakah perkiraan b untuk parameter B yang dihitung berdasarkan sampel akan terletak dalam batas-batas yang pantas, sekitar nilai hipotesis tadi.
Contoh Soal 4.8
Dengan menggunakan contoh soal 3.2, coba dicek apakah H 0 :B=0,4
dapat diterima atau ditolak, dengan tingkat signifikan α=0,05.
Pemecahan
Hasil perhitungan dari sampel menunjukkan bahwa nilai b = 0,653102123,
Sb=0,031062468, df = 3.
Dengan α=0,05 dari tabel t kita peroleh
t α2
=t 0,025
= 3,182 (dengan df = 3)
H 0 :B=0,4 B0=0,4
H a :B ≠ 0,4
Bo−t α2
Sb≤ b ≤ Bo+t α2
Sb
0,4−3,182 (0,031062468 ) ≤ b ≤0,4+3,182 (0,031062468 )
0,4+0,098840773 ≤ b ≤0,4+0,098840773
0,301159227 ≤ b ≤ 0,498840773
Ternyata, nilai b = 0,653102123 terletak di luar interval keyakinan
0,301159227 sampai dengan 0,498840773, maka dari itu, keputusan yang harus
kita ambil adalah menolak anggapan/hipotesis bahwa MPC = B = 0,4.
Dalam praktiknya, kita tidak perlu menghitung interval keyakinan seperti
dalam persamaan (4.16) secara eksplisit, kita hanya perlu menghitung nilai t
berdasarkan rumus berikut
t=b−BSb
Kemudian kita lihat apakah nilai t ini terletak dalam interval antara −t α2
dan t α2, kalau ya, H 0 diterima, kalau tidak, H 0 ditolak.
25
GAMBAR 4.2
Jelasnya sebagai berikut.
Kalau −t α2
≤ t ≤ t α2, H 0 diterima.
Kalau t < −t α2 atau t > t α
2, H 0 ditolak.
Dalam contoh ini,
t=0,653102123−0,4
0,031062468
¿8,148165271
Oleh karena t > t α2, makaH 0 ditolak.
Untuk lebih jelasnya lihat gambar 4.3.
Oleh karena menggunakan distribusi t, maka prosedur pengujian hipotesis
di atas disebut uji t (t-test). Di dalam bahasa uji signifikan, dalam ilmu statistika,
suatu nilai perkiraan (statistic, tanpa s) dikatakan signifikan secara statistik
apabila uji statistik berada dalam daerah kritis, yaitu daerah yang diarsir. Daerah
ini disebut juga daerah penolakan. Dalam hal ini, H 0 ditolak (dengan sendirinya
H a diterima).
26
GAMBAR 4.3
Dengan argumentasi yang sama, suatu uji dikatakan signifikan secara
statistik apabila nilai uji berada di dalam daerah penerimaan. Dalam hal ini,
hipotesis nol (H 0) diterima. Dalam contoh ini, uji t (t test) ternyata signifikan,
hipotesis nol (H 0) harus ditolak. Jadi, pendapat (hipotesis) yang menyatakan
bahwa B = MPC = 0,4 tidak dapat diterima.
Contoh pengujian hipotesis yang kita bahas di atas dikenal dengan nama
uji dua arah atau two-sided atau two-tail test, karena kita berhubungan dengan dua
ekor distribusi probabilitas (normal test, t test) yang merupakan daerah kritis
(daerah penolakan) dan tolak H 0 kalau nilai t yang dihitung berdasarkan data hasil
observasi jatuh/berada dalam daerah penolakan tersebut.
Perhatikan gambar berikut.
Kalau −t α2
≤ t ≤ t α2, H 0 diterima.
Kalau t < −t α2 atau t > t α
2, H 0 ditolak.
Disebut dua arah, karena hipotesis alternative H a merupakan hipotesis komposit
dua arah, yaitu H a :B ≠ 0,4, yang berarti B bisa lebih besar atau lebih kecil dari
27
0,4. Misalkan pengalaman sebelumnya membuat kita mempunyai
H a : MPC=B>0,4 (lebih besar dari 0,4).
Dalam hal ini,
H 0 :B=0,4
H a :B>0,4
Walaupun H a masih merupakan hipotesis komposit, tetapi sekarang hanya satu
arah saja. Dalam hal ini, kita berhubungan dengan uji satu arah (one-tail test).
GAMBAR 4.4
Uji Signifikan Satu Arah
Prosedur pengujian sama saja, kecuali bahwa nilai kritis atau batas keyakinan atas
menjadi t a=t 0,05, yaitu sebesar 5%, bukan 2,5% seperti sebelumnya (lihat gambar
4.4)
28
Ada dua cara uji satu arah, yaitu sebagai berikut.
Contoh Soal 4.9
Juga dari contoh soal 3.2, uji pendapatbahwa MPC = B sebesar 0,4 dengan
alternative lebih besar dari itu, dengan tingkat signifikan sebesar 0,05.
Pemecahan
H 0 :B=0,4
H a :B>0,4
t=b−B
Sb
t=b−0,4
Sb
t=0,653102123−0,4
0,031062468
¿8,148165271
29
Contoh Soal 4.10
Dengan menggunakan contoh soal 3.2, uji pendapat bahwa σ 2 = 75 dengan
alternatif tidak sama dengan 75, dengan menggunakan α = 5%.
Pemecahan :
H 0 :σ2=75
H a :σ2 ≠ 75
x2=(n−2 )Se
2
σ 2
¿ (5−2 ) 80,8862598775
¿380,88625987
75
= 3,235450395
Karena α=0,05 , x20,025( 3)=9,348 dan x2
0,975 (3 )=0,216
Oleh karena x2= 3,235450395 terletk dalam interval 0,216 dan 9,348, maka H o
dapat diterima. Jadi, pendapat bahwa σ 2=75 dapat dibenarkan. Uji semacam ini
disebut uji signifikan khai-kuadrat (the chi-square test of significance).
4.4 Analisis Varian dalam Regresi
Dalam subbab 4.4 ini akan dipelajari analisis regresi dari sudut pandangan
analisis varian dan mengenalkan kepada pembaca terhadap suatu cara yang
komplementer dan jelas dalam melihat persoalan-persoalan statistic induktif atau
statistical inference.
30
Telah kita tunjukan suatu persamaan sebagai berikut.
∑ yi2=∑ y i
2+∑ e i2=b2∑ x i
2+∑ e i2
Kalau
∑ yi2= TSS (=total sum of square)
∑ yi2= ESS (=explained sum of square)
∑ ei2 = RSS (=residual sum of square)
maka
∑ yi2=∑ y i
2+∑ e i2 menjadi
TSS = ESS + RSS, yang menunjukkan pemecahan / penguraian TSS
menjadi dua komponen/bagian, yaitu ESS dan RSS
TSS diperguanakan untuk menunjukkan jumlah variasi Y yang terdiri dari
dua sumber variasi, yaitu ESS berasal dari regresi, merupakan sumbangan/
penguraian TSS menjadi dua komponen/bagian, yaitu ESS dan RSS
TSS dipergunakan untuk menunjukkan jumlah variasi Y yang terdiri dari
dua sumber variasi, yaitu ESS berasal dari regresi, merupakan sumbangan yang
disebabkan oloeh variable bebas X, dan RSS berasal dari kesalahan pengganggu.
Studi mengenai komponen-komponen TSS disebut analisis vari9an (anavar), yang
berarti analisis sumber-sumber variasi yang diukur dengan varian.
∑ yi2 disebut explained sum of square atau jumlah kuadrat yang bisa
diterangkan, maksudnya ialah bahwa sumbernya itu jelas, yaitu pengaruh linear (
linear effect ) dari X. Sedangkan ∑ ei2 diksebut unexplained sum of square atau
jumlah kuadrat yang tidak bisa diterangkan , oleh karena sumber variasi memang
tidak begitu jelas, sebab kesalahan pengganggu e meliputi variabel-variabel atau
factor-faktor yang mempengaruhi Y, tetapi tidak dimasukkan kedalam persamaan
regresi linear.
Pada dasarnya, besarnya nilai derajat kebebasan merupakan selisih antara
banyaknya observasi atau elemen sampel dengan banyaknya perkiraan yang akan
dibuat. Jadi, kalau ada k perkiraan yang akan dibuat untuk memperkirakan k
parameter, maka derajat kebebasan (df) sebesar ( n-k ). Untuk menghitung satu
perkiraan, kita mempunyai df = ( n-1 ), sebab kehilangan 1 kebebasan.
31
Contoh :
Tentukan 5 nilai variabel Y, sehingga rata-ratanya 5. Dalam hal ini, df =
( n -1)= 5-1 = 4, maksudnya kita bebas menentukan nilai dari 4 variabel yang
pertama (4 kebebasan), sedangkan nilai variabel yang kelima tidak bebas lagi
(kehilangan 1 kebebasan), sebab jumlah harus 25.
Y 1=? Misalnya, Y 1=6 (bebas) atau , Y 1=10 (bebas)
Y 2=? Y 2=7 (bebas) Y 2=1 (bebas )
Y 3=? Y 3=4 (bebas) Y 3=4 (bebas)
Y 4=? Y 4=5 (bebas) Y 4=2 (bebas)
Y 5=? Y 5=3 (bebas) Y 5=8 (bebas)
∑Y i = 25 ∑Y i = 25 ∑Y i = 25
Y = 5 Y = 5 Y = 5
Satu perkiraan yang dibuat, satu kebebasan hilang.
Tabel Anavar
Untuk Model Regresi Sederhana
Sumber
Varian
Jumlah
Kuadrat (SS)
d
df
Rata– rata 11)
Kuadrat (MS)
Dari Regresi (ESS)
Dari kesalahan
Pengganggu (RSS)
∑ yi2=b2∑ x i
2
∑ ei2
1
(n-2)
ESS/df = b2∑ x i2
RSS/df=∑ ei2/(n-2) = Se
2
32
Total jumlah
Kuadrat (TSS) ∑ yi2 (n-1)
Dengan menganggap bahwa kesalahan pengganggu i mempunyai
distribusi normal dan H0 : B = ), da[at ditunjukkan bahwa variabel F sebagai
berikut.
F= rata−rata kuadrat regres irata−rata kuadrat kesalahan pengganggu
F= ESS/dfRSS /df =
b2∑ xi2
∑ e i2/(n−2)
mengikuti fungsi F dengan derajat kebebasan 1 dan (n-2)
Contoh Soal 4.11
Berdasarkan contoh soal 3.2, uji pendekatan bahwa B = MPC = 0 dengan
alternatif tidak sama dengan itu. Pergunakan analisis varian (anavar).
Pemecahan :
Diketahui
b = 0,653102123
∑ x12 = 83.830,6875
∑Y 12 = 4.360.500
∑Y 1 = 4.650
n = 5
Tabel Anavar
Sumber
Variasi
Jumlah Kuadrat
(SS)f
Rata-Rata
Kuadrat (MS)F
Dari regresi (ESS) 35.757,34122 1 35.757,34122 442,0694098
33
Dari Kesalahan
Pengganggu (RSS)
242, 65878 3
3
80,88626
Total jumlah
Kuadrat (TSS)36.000,00000 4
F= rata-rata kuadrat regresi Rata-rata kesalahan pengganggu
F= ESS RSS
= 35.757,34122 80, 88626
= 442,0694098 (**)
Tabel F F0,05 (1)(3) = 10,13
F0.01(1)(3) = 34,12
Untuk α = 0,05 (5%). Oleh karena F > F0,05(1)(3) , maka H0 ditolak. Pendapat /
hipotesis bahwa MPC=0 ditolak. Tidak benar B= 0.
Untuk α = 0,01 (1%). Oleh karena F > F0,05(1)(3) , maka H0 ditolak. Pendapat bahwa
B=0 Tidak benar .
Soal 4.12
Uji anggapan PDRB mempunyai konsumsi nasional dengan alternatif tidak ada
pengaruhnya. Pergunakan analisis varian dengan α=5% dan1 %. Data dari BPS
adalah sebagai berikut :
TAHUN X Y
34
2006 29.473,644 9.824,3
2007 31.907,546 10.568,85
2008 34.595,450 9.230,04
2009 37.570,568 8.298,59
2010 40.545,686 8.851,38
Jawab:
b= -0,5130743
∑ b2x i2 = (−0 , 1530743 )2 (77 . 465 . 427 , 8775263 )
= 1.815.149,8592724
∑ y2=∑Y 2−(∑Y )2
n
= 441.005 .425,70660−(46.791,16000 )2
5= 3.122.894,87748
∑e i2 = ∑ y2- ∑ b2x i
2
= 3.122.894,87748 - 1.815.149,8592724 = 1.307.745,0182077
Sumber variasi
Jumlah kuadrat (ss)
df Rata-rata kuadrat
(MS)
F
35
Dari regresi (ESS)
Dari kesalahan
pengganggu (RSS)
1.815.149,8592724
1.307.745,0182077
1
3
1.815.149,8592724
435.915,0060692
4,16399482
Total jumlah kuadrat (TSS)
3.122.894,8774800 4
F = ESSRSS
= 1.815.149,8592724435.915,0060692
= 4,16399482Dari table F0,05(1)(3) = 10,13
F 0,01(1)(3) = 34,12
Oleh karena F< F0,05(1)(3), maka H0 diterima yang artinya memang ada pengaruh
PDRB terhadap konsumsi daerah Kalimantan selatan.
4.5 Ramalan dengan Menggunakan Garis Regresi Linear Sederhana
Berdasarkan contoh soal 3.2, kita peroleh regresi sampel dengan persamaan sebagai berikut.Ŷ i=24,4545+0,5091 X i (4.21)
di mana Ŷ i merupakan pemeriksaan E(Y i) dengan nilai variabel bebas X tertentu. Persamaan regresi linear sederhana ini dapat dipergunakan untuk meramalkan (to forecast or to predict) besarnya konsumsi (Y) untuk waktu yang akan datang apabila besarnya pendapatan (X) sudah diketahui.X diketahui, artinya sebagai berikut.a) Sudah terjadi, misalnya merupakan pendapatan waktu yang lalu. Dalam hal
ini, X disebut variabel beda kala (lagged variabel) dengan simbol X t−1.
b) Hasil ramalan, misalnya pendapatan tahun depan,dengan simbol X t+1.
c) Pendapatan sekarang,dalam waktu yang bersangkutan, dengan simbol X t .Untuk meramalkan Y, nilai variabel X harus diketahui terlebih dahulu. Itulah sebabnya X disebut variabel bebas (independent variable) dan sering disebut explanatory variable, artinya variabel yang menerangkan. Sedangkan, Y disebut
36
variabel tidak bebas (dependent variable), karena memang nilainya tergantung pada nilai X.Y = nilai hasil observasi, hasil pencatatan.Ŷ = nilai perhitungan berdasarkan persamaan garis regresi, sering disebut nilai regresi atau nilai teoretis. Y merupakan perkiraan atau ramalan Y.
Ramalan pada dasarnya merupakan perkiraan terjadinya suatu kejadian (peristiwa) untuk waktu yang akan datang. Ada perkiraan jangka pendek, ada juga ramalan jangka panjang (short term and long term forecasting) . Ramalan (produksi, penjualan, ekspor, penerimaan negara, pendapatan nasional, konsumsi, dan variabel ekonomi lainnya) sangat diperlukan untuk dasar perencanaan.
Ada dua macam ramalan untuk variable tidak bebas Y, yaitu ramalan untuk rata-rata Y dan individu Y nilai X tertentu, katakan X=X o. Untuk selanjutnya, kita sebut ramalan rata-rata Y atau ramalAn E(Y) dan ramalan individu Y. E(Y)=expected (Y) merupakan rata-rata. Dalam praktiknya, meramalkan E(Y) juah lebih mudah dari pada meramalkan individu Y, sebab rata-rata Y kurang bervariasi dibandingkan dengan Y, sebabnya ialah E(Y) = A+BX terletak tepat pada garis regresi populasi, sedangkan Y terletak di sekitar garis regresi populasi. Lihat gambar berikut!
E(Y), lengkapnya ditulis E(Y /X o), dibaca rata-rata Y atau nilai harapan
(expected value) Y, untuk X=X o .Titik-titik pada gambar menunjukkan nilai
individu Y, untuk X tertentu, yaitu merupakan titik-titik koordinat: (X1 , Y 1), (X2 , Y 2), ...,(X n , Y n ¿. Ramalan E(Y/X o) disebut ramalan bersyarat (coditional
forecast) , maksudnya hasil ramalan sangat tergantung pada nilai X=X o.Misalnya, kalau X=biaya advertensi dan Y= hasil penjualan, maka
ramalan hasil penjualan untuk waktu yang akan datang sangat tergantung kepada biaya advertensi. Juga misalnya, kalau X = pendapatan nasional atau investasi
37
nasional dan Y = konsumsi nasional atau PDB, maka ramalan konsumsi nasional atau ramalan PDB yang akan datang sangat tergantung kepada tinggi rendahnya pendapatan nasional atau investasi nasional yang kita beri simbol X=X o.
Untuk membedakan nilai ramalan atau bukan, maka untuk nilai ramalan rata-rata Y kita beri simbol E(Y 0 , X0), kita baca ramalan rata-rata Y kalau X = X o
dan ramalan individu Y diberi simbol (Y 0 , X0), dibaca untuk meramalkan rata-rata Y = E(Y) maupun individu Y, nilai X harus diketahui terlebih dahulu.
Perlu dibedakan nilai ramalan tunggal (point forecast) , yaitu ramalan yang terdiri dari satu nilai saja, dan ramalan interval, di mana kita harapkan bahwa nilai yang kita ramalkan tersebut akan terletak dalam interval yang kita buat berdasarkan data sampel dengan menggunakn tingkat atau koefisien keyakinan tertentu, katakan 90% atau 95%
4.5.1 Ramalan Rata-Rata Y atau E(Y)Dengan menggunakan persamaan garis regresi yang sudah di buat
berdasarkan data sampel berikut:Ŷ = a + bX, maka kalau X = X o , maka Y nol topi menjadi Ŷ o= a + b X o , di mana
a = 24,4545 dan b = 0,5091. Sekarang, misalnya sudah diketahui X = X o = 100,
kita ingin meramalkan nilai rata-rata Y, yaitu E(Y 0 , X0), maka perkiraan tunggal
dari rata-rata Y dapat diperoleh dengan jalan memasukkan X = X o = 100 ke dalam persamaan garis regresi:
Ŷ o= a + b X o = 24,4545 + 0,5091(100)= 24,4545 + 50,91= 75,3645
Di mana Ŷ operkiraan E(Y 0 , X0). Dapat ditunjukkan bahwa Ŷ o merupakan
perkiraan linear tunggal E(Y 0 , X0) yang tidak bias dan varian yang minimum atau BLUE (best linear unbiased estimators) .
Oleh karena Ŷ o (Y nol topi) merupakan suatu pemerkira (estimator) E(Y 0 , X0), maka nilainya sebagai perkiraan akan berbeda-beda, dari sampel ke
sampel akan bervariasi. Perbedaan antara nilai Y o dengan E(Y 0 , X0) akan memberikan gambaran mengenai kesalahan tersebut, kita perlu mengetahui distribusi sampling Y o. Hal ini dapat ditunjukkan oleh karena Y o merupakan fungsi kesalahan pengganggu yang berdasarkan asumsi mempunyai distribusi normal dengan rata-rata nol dan varian Ŷ o , maka Y o juga mempunyai distribusi
normal dengan rata-rata E(Y o) = (A + B Xo) dan
var(Ŷ o) = σ 2 [ 1n
+¿¿¿ (4.22)
38
Dengan jalan mengganti σ 2 dengan Se2, perkiraannya kita peroleh variabel t
sebagai berikut.
t = Ŷ o−E (Y 0/ X0)
SŶ o
(4.23)
Di mana SŶ o = √SŶ o
2 (perkiraan standard error Y o), SŶ o
2 = perkiraan var(Y o ¿, maka
t mengikuti distribusi dengan derajat kebebasan (n – 2). Dengan demikian, maka t ini dapat digunakan untuk membuat perkiraan interval atau menguji hipotesis mengenai E(Y 0/ X0).
E(Y 0/ X0) = A + BX o
t = Ŷ o−E (Y 0/ X0)
SŶ o
P(-t α /2≤ t ¿ t α /2) = 1 – α
-t α /2 ≤ Ŷ o−E (Y 0/ X0)
SŶ o
≤ t α /2
-t α /2 SŶ o ≤ Ŷ o−E ¿) ≤ t α /2 SŶ o
I II
I. -t α /2 SŶ o ≤ Ŷ o−E ¿)
E(Y 0/ X0) ≤ Ŷ o + t α /2 SŶ o
II. Ŷ o −E ¿) ≤ t α /2 SŶ o
Ŷ o −¿ t α /2 SŶ o ≤ E ¿)
I dan II digabung akan memperoleh perkiraan interval untuk E ¿) dengan tingkat keyakinan sebesar (1 – α) sebagai berikut.
Ŷ o −¿ t α /2 SŶ o ≤ E ¿) ≤ Ŷ o + t α /2 SŶ o
(4.24)
di mana Ŷ o = a + bX o
39
SŶ o = Se √ 1
n+(X o−X )2
∑ X12
t α /2 SŶ o diperoleh dari tabel t dengan derajat kebebasan (n – 2)
Contoh Soal 4.13Dengan menggunakan data contoh soal 3.2, buat perkiraan/ramalan
interval E(Y) kalau X = X 0 = 100! Pergunakan tingkat keyakinan 95%.Pemecahan
var(Ŷ o) = Se2 [
1n +¿¿¿
= 80,88625987 [15+(100−1.040,85)2
83.830,6875 ]
= 80,88625987 [0,2885.198,722583.830,6875 ]
= 80,88625987 ( 10,75936375 ) = 870,2846921
SŶ o = √var (Ŷ o) = 29,500588
Ŷ o = a + bX o
= 250,218655 + 0,653102123(100)= 250,218655 + 65,3102123= 315,5288673
Ŷ o −¿ t α /2 SŶ o ≤ E ¿) ≤ Ŷ o + t α /2 SŶ o
315,5288673 – 3,182(29,500588) ≤ E ¿) ≤ 315,5288673 + 3,182(29,500588)315,5288673 – 93,870871 ≤ E ¿) ≤ 315,5288673 + 93,870871221,6579963 ≤ E ¿) ≤ 409,3997383Kalau X = 100, dengan tingkat keyakinan 95%, dalam jangka panjang
interval 221,6579963 sampai 409,3997383 akan memuat E(Y) = rata-rata Y. Perkiraan tunggal untukE(Y), yaitu Y o = 315,5288673
SOAL 4.14Dengan menggunakan data berikut, buat ramalan interval rata-rata Y kalau
X=1000 dengan tingkat keyakinan 95%.
40
Dimana X = pendapatan rata-rata per bulan dalam jutaan rupiah
Y = tabungan rata-rata perbulan dalam jutaan rupiah
TAHUN X Y
2006 72.445,766 40.854,481
2007 83.312,633 51.095,756
2008 95.809,466 71.434,944
2009 110.180,883 82.408,203
2010 126.708,025 99.318,846
Jawab :
X Y X2 Y2 XY
72.445,7660000 40.854,4810000 5.248.389.011,326760 1.669.088.617,77936 2.959.734.170,57745
83.312,6330000 51.095,7560000 6.940.994.817,392690 2.610.776.281,21154 4.256.921.967,48555
95.809,4660000 71.434,9440000 9.179.453.775,205160 5.102.951.224,28314 6.844.143.838,37990110.180,883000
0 82.408,2030000 12.139.826.978,659700 6.791.111.921,68921 9.079.808.572,98325126.708,025000
0 99.318,8460000 16.054.923.599,400600 9.864.233.170,77172 12.584.494.821,93910488.456,773000
0345.112,230000
049.563.588.181,984900
026.038.161.215,735000
035.725.103.371,365300
0
N=5
∑ X=488.456,773
∑Y =345.112,23
∑ X2= 49.563.588.181,9849
41
∑Y 2= 26.038.161.215,735
∑ XY=35.725 .103 .371,3653
∑ xy=∑ XY−(∑ X ) (∑Y )
n
= 35.725 .103 .371,3653−(488.456,773 ) (345.112,23 )
5 = 2.010.622.133,63854
∑ x2=∑ X 2−(∑ X )2
n
= 49.563 .588 .181,9849−( 488.456,773 )2
5= 1.845.364,07019
∑ y2=∑Y 2−(∑Y )2
n
=26.038 .161.215,735−(345.112,23)2
5= 2.217.670.956,62038
b = ∑ xy
∑ x2
= 2.010.622 .133,63854
1.845.364,07019= 1,0894230
a= Y−b X = 69.022,446 - 1,0894230(97.691,354) = -37.404,7667830
Untuk X = 100.000
Y 0 = a +b X
= -37.404,7667830 + (1,0894230)(97.691,354) = 71.537,5374964
b2∑ x i2 = (1,0894230 )2 (1.845.364,07019 )
= 2.190.418.082,737640
Se2 =
∑ y2−b 2 x i2
n−2
42
= 2.217 .670.956,62038−2190818.082,737640
5−2
= 9.084.291,2942476
Se = 3.014,015808
sY 0 = Se√ 1
n+¿¿¿¿¿
= 3.014,015808√ 15+(100.000−97.691,354)2
1.845 .364,07019
= 3.014,015808√0,2+ 5.329.864,8221.845 .364,07019
= 3.014,015808 √3,0882457= 3.014,015808 ( 1,7573405)= 5.296,652104
t α /2 (n−2)= t 0,025(3)= 3,182
Ŷ o −¿ t α /2 SŶ o ≤ E ¿) ≤ Ŷ o + t α /2 SŶ o
71.537,5374964 – 3,182(5.296,652104) ≤ E ¿) ≤ 71.537,5374964 +3,182(5.296,652104)
71.537,5374964 – 16.853,94699 ≤ E ¿) ≤ 71.537,5374964 + 16.853,94699
54.683,59050 ≤ E ¿) ≤ 88.391,48448Kalau X = 100.000, dengan tingkat keyakinan 95%, dalam jangka panjang
interval 54.683,59050 sampai 88.391,48448 akan memuat E(Y) = rata-rata Y. Jadi, kalau pendapatan Rp100.000.000, dengan tingkat keyakinan 95%, dalam jangka panjang, interval antara Rp5.469.359.050.000,00 sampai Rp8.839.148.448.000,00 akan memuat rata-rata tabungan sebenarnya.
95%
2,5 % 2,5 %
Rp5.469.359.050.000,00 Rp8.839.148.448.000,00
Rata-rata tabungan yang sebenarnya dalam interval
4.5.2. Ramalan Individu Y
43
Apabila kita ingin meramalkan individu Y, yaitu Ŷ o untuk nilai X = X 0,
dapat ditunjukkan bahwa pemerkira Ŷ o = a + bX o selain untuk memperkirakan
rata-rata Y, yaituE ¿), juga dapat untuk memperkirakan individu Y, yaitu Ŷ o.
Artinya, baik perkiraan untuk E(Y 0/ X0) maupun untuk Y o sama, yaitu Ŷ o (Y nol
topi), tetapi var (Y o) sebagai berikut.
var(Ŷ o) = o2 [1 + 1n
+ ¿¿¿ ] (4.25)
Kalau o2 diganti Se2, maka
SŶ o = Se √1+ 1
n+(Xo−X )2
∑ X12
SŶ o = perkiraan standard error Ŷ o
t = Ŷ o−Y 0/ X0
SŶ o
, (Y 0/ X 0 di baca Y 0 dengan syarat X = X 0
akan mengikuti fungsi t dengan derajat kebebasan sebesar (n – 2).
P(-t α /2≤ t ≤ t α /2) = 1 – α
-t α /2 ≤ Ŷ o−Y 0/ X0
SŶ o
≤ t α /2
-t α /2 SŶ o ≤ Ŷ o−Y 0/ X0 ≤ t α /2 SŶ o
I II
I. -t α /2 SŶ o ≤ Ŷ o−Y 0/ X0
Y 0/ X 0 ≤ Ŷ o + t α /2 SŶ o
II. Ŷ o −Y 0/ X 0 ≤ t α /2 SŶ o
Ŷ o −¿ t α /2 SŶ o ≤ Y 0/ X 0
I dan II digabung, diperoleh rumus perkiraan interval individu Y dengan tingkat keyakinan sebesar (1 – α) sebagai berikut.
Ŷ o −¿ t α /2 SŶ o ≤ Y 0/ X 0 ≤ Ŷ o + t α /2 SŶ o
(4.26)
44
di mana
Ŷ o = a + bX o
SŶ o = Se √1+ 1
n+(Xo−X )2
∑ X12
t α /2 dari tabel t dengan derajat kebebasan (n – 2).
Contoh Soal 4.15
Dengan menggunakan contoh soal 3.2, buat ramalan interval individu Y,
dengan tingkat keyakinan 95%, kalau X = 100!
Pemecahan
Ŷ o −¿ t α /2 SŶ o ≤ Y 0 ≤ Ŷ o + t α /2 SŶ o
di mana
SŶ o = Se √1+ 1
n+(Xo−X )2
∑ xe2
Ŷ o = 250,218655 + 0,653102123X o X = 100
= 250,218655 + 0,653102123(100)
= 250,218655+ 65,3102123
= 315,5288673
Se2 = 80,88625987 Se=¿8,993678884
SŶ o = 8,993678884√1+0,2+
(100−1.040,85)2
83.830,6875
= 8,993678884 √1,2885.195,722583830,6875
= 8,993678884 √11,75936375
= 8,993678884 (3,429192871)
= 30,84105951
t 0,05(3) = 3,183
315,5288673 – 3,182(30,84105951) ≤ Y o ≤ 315,5288673 + 3,182(30,84105951)
45
315,5288673 – 98,13625136 ≤ Y o ≤ 315,5288673 + 98,13625136
217,3926159 ≤ Y o ≤ 413,6651187
Kalau X = 100, dengan tingkat keyakinan 95%, interval antara 217,3926159
sampai 413,6651187 , dalam jangka panjang akan memuat nilai individu Y.
4.5.3 Cara Melaporkan Hasil Analisis RegresiBanyak hasil penelitiaan ekonomi secara kuantitatif yang hasilnya sukar di
mengerti, khususnya hasil analisis ekonometri dengan disertai berbagai macam angka atau simbol-simbol yang sering kali kurang dimengerti oleh penbaca. Dalam hal ini, untuk melaporkan analisis regresi, perlu diperhatikan hal-hal berikut.
Pertama : Persamaan garis regresi yang dihitung dari sampel, lengkap dengan segala koefisiennya Ŷ = a + bX.
Kedua : Diikutsertakan standard error bagi setiap koefisiennya, Ŷ = a + bX (Sa)(Sb ¿
Sa = standard error (a), diletakkan di bawah aSb = standard error (b), diletakkan di bawah b
Ketiga : Diikutsertakan nilai t yang masing0masing berdasarkan sampel langsung di bawah Sa dan Sb.
t di bawah Sa dan Sb, masing-masing berdasarkan sampel rumus berikut.
t a = a−A
Sa dan t b =
b−BSb
Y = a + bX
(Sa)(Sb)
(t a)(t b)
Keempat :Diikutsertakan nilai koefisien determinasi (r2) dan standard error
regresi atau standard error kesalahan pengganggu (Se)
Ŷ = a + bX r2
(Sa) (Sb) Se
(t a) (t b) df = n – 2
Kegunaan masing-masing di dalam penyajian hasil analisis regresi adalah sebagai berikut.Pertama : persamaan regresi Ŷ = a + bX digunakan untuk meramalkan E ¿) atau
¿) setelah X=X o diketahui. Ŷ o = a + bX o selain merupakan ramalan untuk E ¿) juga merupakan ramalan ¿).
Kedua : Standard error Sa dan Sb untuk mengukur tingkat ketelitian pemerkira a dan b. Makin kecil standard error suatu pemerkira, makin
46
teliti pemerkira tersebut, maksudnya makin dekat dengan nilai parameter yang akan diperkirakan. Jadi, makin kecil Sa dan Sb , makin dekat a dengan A dan b dengan B.Sa 0, berarti a A, kalau Sa = 0 , a = ASb 0, berarti b B, kalau Sb = 0, b = B
(Dalam praktiknya, standard error tidak pernah nol).Ketiga : Nilai t, dan t a dan t b dapat untuk menguji hipotesis tentang parameter
A dan B.
Keempat : Koefisien determinasi (r2) untuk mengukur tepat / cocoknya persamaan
regresi untuk meramalkan. Makin besar r2, makin tepat garis untuk meramalkan Y, sebab makin besar persentase sumbangan X, terhadap varian (naik turunnya) Y digunakan standard error regresi atau standard error kesalahan pengganggu Se untuk mengukur betapa dekatnya nilai-nilai individu Y hasil garis regresi Ŷ = a + bX.
Makin kecil Se, berarti makin dekat nilai-nilai individu Y terhadap garis regresi, sehingga makin tepat / cocok garis regresi tersebut untuk meramalkan Y kalau X sudah diketahui
Perhatikan gambar berikut.
(Titik-titik menunjukkan letak individu Y, jauh dari garis regresi)
(Titik-titik menunjukkan letak individu Y, jauh dari garis regresi)
47
Jadi, untuk mengukur kecocokan / ketepatan suatu garis regresi untuk meramalkan ( goodness of fit), dapat dipergunakan nilai r2 yang makin besar, makin baik atau Seyang makin kecil baik.
48
DAFTAR PUSTAKASupranto, J. 2005. Ekonometri. Jakarta. Ghalia IndonesiaBadan Pusat Statistika. Kalimantan Selatan dalam angka.
49