perkiraan interval dan pengujian hipotesis dalam regresi sederhana

4.1 beberapa ide tentang perkiraan interval

Bagian yang penting dalam ilmu statistik adalah statistik induktif atau

statistical inference. Statistic induktif mencakup dua hal pokok, yakni teori

estimasi dan pengujian hipotesis. Teori perkiraan terdirir dari dua hal penting.

Yaitu perkiraan tunggal dan perkiraan interval.

Perkiraan tunggal mengenai koefisien regresi, koefisien korelasi dan

varian sudah dibahas panjang lebar dengan menggunakan metode kuadrat terkecil

sederhana (OLS) dan juga disinggung sedikit mengenai metode maximum

likelihood (ML). Dalam bab ini akan dibahas mengenai perkiraan interval dan

pengujian hipotesis , baik mengenai koefisien-koefisien, individu dan nilai

harapan Y, maupun varian kesalahan pengganggu.

Untuk membahas ide dasar perkiraan interval, perkiraan koefisien regresi ,

ini artinya kalau upah karyawan naik 1 unit, maka konsumsi karyawan naik

0,8556 kali. Jadi seandainya upah karyawan naik Rp 1.000,00 maka diperkirakan

konsumsi karyawan akan naik Rp 855,60. Menurut Keynes, kenaikan konsumsi

selalu lebih kecil dari kenaikan pendapatan (karena upah merupakan satu-satunya

pendapatan), hal itu dinyatakan dalam konsep MPC (marginal propensity to

consume).

Nilai b= 0,8556 ini merupakan perkiraan tunggal parameter B, yaitu

koefisien regresi sebenarnya (Yi = A + BXi + ε i) . khusus dalam hal ini, kalau

X=pendapatan dan Y= konsumsi, koefisien regresi merupakan MPC. Pertanyaan

yang timbul : seberapa juga perkiraan b ini dapat dipercaya ?

Karena adanya fluktuasi sampling, perkiraan tunggal ini akan berbeda

dengan nilai sebenarnya (B), walaupun dalam sampling yang diulang, nilai rata-

rata b akan sama dengan nilai B sebab b pemerkira tidak bias. Dalam statistika,

tingkat kepercayaan (reliability) pemerkira tunggal diukur oleh standar eror atau

variannya. Maka, daripada percaya pada perkiraan tunggal saja, kita mungkin

lebih baik kalau memberikan pernyataan probabilitas, bahwa pemerkira tunggal

tersebut terletak dalam suatu interval disekitar nilai parameternya (b akan terletak

disekitar B), sejauh 1,2 atau 3 standard erornya. Jadi, perkiraan interval bebarti

kita mengharapkan bahwa nilai B yang sebernarnya itu akan terletak dalam suatu

interval (dengan nilai batas bawah dan batas atas) dengan tingkat keyakinan

1

tertentu, katakanlah 95% Inilah yang merupakan ide dasar di belakang perkiraan

interval tersebut.

Untuk lebih jelasnya, anggap bahwa kita akan mencari kenyataan betapa

dekatnya nilai b tersebut dengan B. untuk maksud ini, kita mencoba mencari dua

nilai positif, katakan d dan α (alpha), dimana nilai alpha terletak diantara 0 dan 1,

sedemikian rupa sehingga probabilitas bahwa interval (b-d, b+d) mencakup nilai

sebenarnya (B) sebesar (1-α)

Dengan symbol dapat ditulis :

P(b-d ≤ B ≤ b+d = 1-α

b – d b + d (4.1)

confidence interval

batas bawah interval batas atas

1-α disebut koefisisen keyakinan/ tingkat keyakinan. α disebut tingkat nyata/

berarti (level of significance). Di dalam pengujian hipotesis, αdisebut kesalahan

tipe pertama, yaitu kesalahan yang terjadi karena kita menolak hipotesis nol,

padahal hipotesis tersebut benar (keputusan yang benar, hipoteisis tersebut harus

kita termia). Alpha juga dapat diartikan sebagai besarnya kesalahan yang kita

torerir di dalam membuat suatu keputusan. Kalau 1-α= 0,95; α = 1-0,95 = 0,05;

ini berarti kita mentorerir kesalahan sebesar 5%. Salah dalam hal ini, berarti

interval tidak memuat B lebih kecil dari (b – d) atau lebih besar dari (b+d).

kesalahan ini menimbulkan resiko dalam pembuatan keputusan, maka dari itu

untuk memperkecil resiko, kesalahan harus dibuat sekecil mungkin. Titik akhir

pada interval disebut batas keyakinan (confidende limit) atau nilai kritis (critical

value)

b – d = batas keyakinan bawah atau nilai batas bawah

b + d = batas keyakinan atas atau nilai batas atas

dalam praktiknya, α dan (1 – α ¿bukan dinyatakan sebagai proporsi, tetapi sebagai

presentase, yaitu 100% dan 100(1-α ¿% .

Persamaan (4.1) menunjukkan bahwa suatu pemerkira interval merupakan

suatu interval yang dibuat sedemikian rupa sehingga interval tersebut mempunyai

2

nilai probabilitas sebesar (1-α ¿ akan memuat nilai parameter B. misalnya kalau α

= 0,05 (5%), maka persamaan (4.1) harus dibaca : probabilitas bahwa interval

antara ( b – d ) dan ( b + d ) akan memuat nilai B sebesar 0,95 atau 95%.

Perkiraan interval memberikan berbagai nilai dalam suatu interval, diharapkan

nilai B akan terletak di dalamnya. Kemungkinan tidak memuat ( B terletak di

luarnya, B < b-d atau B > b + d ) sebesar 5%

Perlu diperhatikan beberapa aspek penting tenatang perkiraan interval ini,

yaitu sebagai berikut:

(1) Persamaan (4.1) tidak berarti bahwa probabilitas parameter B terletak dalam

interval yang dibatasi nilai batas bawah dan atas tersebut sebesar (1-α ¿,

katakana 90% atau 95 %. Sebab parameter B, walaupun tidak diketahui

nilainya, dianggap mempunyai nilai tetap/konstan (tidak berubah-ubah) bisa

terletak dalam interval dan bisa juga tidak.

Arti persamaan (4.1) yang sebenarnya ialah bahwa dengan menggunakan

metode yang dijelaskan, probabilitas untuk meperoleh suatu interval yang

memuat B sebesar (1-α ¿ .

Penjelasan lebih lanjut : kalau seluruh sample dari suatu populasi sebanyak k

kita hitung perkiraan intervalnya, akan kita peroleh k interval. Apabilak kita

tentukan (1-α ¿ = 0,95 misalnya, maka setelah kita teliti hasil hitungan kita,

akan diperoleh kurang lebih 95 % dari k interval tersebut memuat parameter

B, selebihnya / sisanya sebanyak ±5% tidak memuat B. oleh karena di dalam

praktiknya, kita hanya mengambil sampel secara random satu kali saja dari

populasi yang bersangkutan, maka kita harapkan dengan tingkat keyakinan

sebesar 95%, sampel tersebut akan memuat parameter B.

Perhatikan gambar berikut ini :

Setiap titik menunjukkan interval yang dibuat berdasarkan sampel

3

Ada k interval,

karena ada k sampel

Bagian yang diarsir terdiri dari interval

yang tidak memuat B

Bagian yang tidak diarsir terdiri dari interval yang memuat parameter B

Berdasarkan gambar di atas, maka probabilitas untuk memperoleh

interval yang memuat B merupakan hasil bagi daerah yang memuat B

(tidak diarsir) dengan seluruh daerah : 0,95

1 X 100% = 95% atatu 100(1-

α ¿%= 95% disebut tingkat keyakinan (confidence level).

(2) Interval (4.1) adalah interval acak (random interval) , yang berarti akan

berubah dari sampel ke sampel, sebab nilainya tergantung pada b yang

berbeda dari sampel satu ke sampel yang lainnya.

Perhatikan gambar berikut :

4

. . . . . . . . .

Memuat parameter B

. . . . . . . . .

. ..

Sampel 1, interval 1 = I1 memuat B

memuat B

Sampel 2, interval 2 = I2 tak memuat B

memuat B

Sampel 3, interval 3 = I3 memuat B

tak memuat B

Sampel i, interval i = Ii memuat B

memuat B

Sampel k, interval k = Ik memuat B

tak memuat B

Keterangan : interval yang memotong garis tegak lurus memuat B,

sedangkan yang tidak memotong tidak memuat B. Garis tegak lurus

tempat letaknya B. ada beberapa interval.

(3) Oleh karena confidence interval merupakan acak (random), pernyataan

probabilitas yang menyangkut dirinya harus dimengerti, bahwa

mempunyai pengertian jangka panjang (in the long sense), yaitu yang

berlaku dalam sampling yang berulang-ulang (repeated sampling).

Secara khusus persamaan (4.1) berarti : apabila dalam sampling yang

berulang-ulang confidence interval semacam itu dibuat, lihat gambar dari

keterangan (2), maka dengan probabilitas sebesar (1-α ¿, kita harapkan

dalam jangka panjang, secara rata-rata, interval seperti (4.1), kurang lebih

100(1-α ¿%, katakanlah 90% atau 95%, akan memuat nilai parameter B.

(4) Seperti diterangkan dalam (2), interval (4.1) sifatnya acak selama nilai b

tidak diketahui. Akan tetapi, begitu kita mengambil satu sampel dan

menghitung nilai b dan membuat interval, maka kita memperoleh satu

interval saja, yang mungkin memuat B atau tidak memuat B, dalam hal ini

interval (4.1) tidak lagi random, tetapi sudah merupakan nilai yang

tetap/konstan, misalnya antara 0,50-0,75 atau antara 0,60-0,80. Dalam hal

ini kita tidak boleh membuat pernyataan probabilitas mengenai persamaan

5

(4.1), artinya kita tidak dapat menyatakan probabbilitas sebesar (1-α ¿,

bahwa suatu interval yang nilainya tetap tersebut memuat parameter B.

dalam situasi semacam ini hanya ada dua kemungkinan untuk B, yaitu B

berada dalam interval itu atau tidak. Jadi, probabilitasnya hanya ada dua

kemungkinan nilai, yaitu 1 atau 0. Probabilitas 1 kalau B berada dalam

interval dan 0 kalau B berada di luar interval.

Kemudian bagaimana caranya interval keyakinan (confidence interval)

tersebut dibuat? Kalau distribusi sampling atau distribusi probabilitas dari

pemerkira diketahui, maka kita dapat membuat pernyataan interval keyakinan

seperti persamaan (4.1). kita ketahui bahwa dengan asumsi kenormalan tentang

kesalahan pengganggu ε I, pemerkira hasil metode kuadrat terkecil biasa (OLS),

pemerkira a dan b juga mengikuti distribusi normal, dan bahwa pemerkira se2 akan

mengikuti distribusi khai-kuadrat(chi-square) = x2. Sebelum kita membuat

interval keyakinan tentang koefisien A dan B dalam regresi, terlebih dahulu akan

disinggung beberapa jenis distribusi yang erat sekali hubungannya dengan

distribusi normal. Beberapa teori yang diungkapkan disini.

4.1.1 Beberapa teori tentang beberapa jenis distribusi yang erat sekali

hubungannya dengan distribusi normal.

Berikut ini akan diuraikan beberapa teori yang erat hubungannya dengan

teori normal. Teori yang dikemukakan tanpa bukti ini sangat berguna dalam

pemabahasan, baik teori perkiraan maupun pengujian hipotesis, antara lain fungsi

t, χ2, dan F.

Teori 4.1. kalau Z1, Z2,…. Zn merupakan variable bebas dan normal, masing-

masing dengan rata-rata μi dan variance σ i2, yaitu Zi N (μi,

σ i2), maka Z = ∑ k iZi, dimana k i konstan dan semuanya nol, juga

mempunyai distribusi normal dengan rata-rata μ= ∑ k i μ i dan variance

σ 2= ∑ k i σ2 , yaitu Z N (M,σ 2 ) = N (∑ k i μ i , ∑ k i σ

2¿.

6

Teori 4.2. kalau Z1, Z2,…. Zn merupakan variabel bebas dan normal, masing-

masing dengan rata-rata nol dan variance 1, yaitu Zi N

(0,1) merupakan normal yang baku (standar normal), maka Z = ∑ Z i2

mengikuti distribusi χ2 dengan derajat kebesar sebesar n, dinyatakan

dengan symbol Z χn2

.

Teori 4.3. kalau Z1, Z2,…. Zn merupakan variable acak yang bebas dan normal,

masing-masing mempunyai distribusi dengan derajat kebebasan

sebesar k, kemudian Z = ∑ Z i akan mengikuti distribusi χ2 dengan

derajat kebebasan sebesar k, dimana k = ∑ k i, dinyatakan dengan

symbol Z χk2

.

Teori 4.4. kalau Z1 merupakan variable normal standard, yaitu Zi N

(0,1) dan Z2 mengikuti distribusi χ2 dengan derajat kebebasan sebesar

k, dimana Z2 bebas terhadap Z1, maka variabel t yang kita definisikan

sebagai berikut :

t = Z1

√Z2/√k = Z i√k

√Z2

(4.2)

mengikuti distribusi t dari student dengan derajat kebebasan k.

Teori 4.5. kalau Z1, dan Z2 masing-masing merupakan variabel bebas yang

mengikuti distribusi χ2 dengan derajat kebebasan k1 dan k2 , yaitu Z1

χk 12

dan Z2 χk 22

maka variabel F kita definisikan

sebagai berikut.

F = Z1/k1

Z2/k2

(4.3)

7

Mempunyai distribusi F dengan derajat kebebasan k1 dan k2

Baik distribusi t, χ2, dan F sudah dibuat tabelnya. Untuk keperluan

pembuatan perkiraan interval dan pengujian hipotesis tabel – tabel

tersebut sangat penting artinya.

4.2 Perkiraan Interval untuk Koefisien dan Kesalahan Pengganggu

Bahwa dengan asumsi kenormalan tentang ε i, pemerkira hasil OLS a dan b

juga mengikuti distribusi normal dengan rata-rata dan varian masing-masing.

Dengan demikian, maka variabel Z yang kita definisikan adalah sebagai berikut.

Z=b−Bσb

Z=(b−B)√∑ x i

2

σ(4 . 4)

Merupakan variabel normal yang standar, yaitu Z N (0,1). Berdasarkan

hal ini, kita bisa menggunakan distribusi normal untuk membuat pernyataan

probabilitas tentang b dengan syarat bahwa varian kesalahan pengganggu ¿σ 2

diketahui.. Apabila σ 2 diketahui, suatu sifat penting yang memiliki variabel

dengan distribusi normal dengan kata-kata μ dan varian σ 2 ialah bahwa daerah di

bawah kurva normal antara μ+σ (berjarak satu deviasi standar dari rata-rata),

kurang lebih sebanyak 68%; antara μ+2 σ (berjarak dua standar deviasi dari rata-

rata), kurang lebih sebanyak 95%; dan antara μ+3 σ (berjarak tiga deviasi standar

dari rata-rata), kurang lebih sebanyak 99,7%

Perhatikan gambar berikut!

8

μ+3 s μ+2 σ μ+1 σ μ μ+1 σ μ+2 σ μ+3 σ

± 68 % ± 95 % ± 99,7 %

Dalam praktiknya, σ 2 jarang sekali diketahui, sehingga harus diperkirakan dengan

perkiraan tidak bias se2, di mana

se2= 1

n−2∑ e i2

Dengan jalan mengganti σ dengan se dalam persamaan (4.4), maka kita peroleh

persamaan sebagai berikut.

t=b−BSb

, Sb perkiraanσ b

t=(b−B)√∑ x i

2

Se

(4 .5)

Dapat ditunjukan bahwa t mengikuti distribusi t dengan derajat kebebasan

sebesar (n-2). Persamaan (4.4) menggunakan σ b mengikuti ditribusi normal,

sedangkan persamaan (4.5) menggunakan sb mengikuti ditribusi t. Uraian lebih

lanjut tentang persamaan (4.5) adalah sebagai berikut.

Misalkan :

Z1=b−B

σb

, σ b

¿ σ

√∑ x i2

¿(b−B)√ x i

2

σ

9

Dan Z2=(n−2)Se

2

σ2

Apabila σ 2 diketahui, Z akan mengikuti distribusi normal yang baku

(standar normal), yaitu Z1 N (0,1), artinya mempunyai rata-rata nol dan varian

satu. Sedangkan Z2 mengikuti distribusi khai-kuadrat dengan derajat kebebasan

(n-2), berdasarkan teori 4.4, variabel t berikut.

t=Z1 √n−2

√Z2

Akan mengikuti distribusi t dengan derajat kebebasan (n-2). Apabila Z1dan Z2 di

atas kita masukan, akan kita peroleh hasil berikut.

t=(b−B)√ x i

2√n−2

σ.. X √σ 2

√n−2√ Se2

t=(b−B)√∑ x i

2

Se

sama dengan persamaan(4.5)

Oleh karenanya, untuk membuat perkiraan interval B, kita akan menggunakan

distribusi t sebagai pengganti normal berikut.

P(−t a2

≤ t ≤ t a2)=1−a(4 .6)

Di mana t seperti dalam persamaan (4.5), t a2 diperoleh dari tabel t dengan derajat

kebebasan sebesar (n-2). Dengan mengganti t seperti dalam persamaan (4.5),

maka kita peroleh pernyataan probabilitas sebagai berikut.

P(−t a2

≤b−B

Sb

≤ t a2)=1−a(4 .7)

Sekarang perhatikan gambar berikut!

−t a2

≤b−B

Sb

≤t a2

10

I

II

I. −t a2

≤b−B

Sb menjadi −t a

2

Sb≤ b−B menjadi B ≤b+ t a2

Sb

II. b−B

Sb

≤t a2 menjadi b−B≤ t a

2

Sb menjadi b — t a2

Sb ≤ B

Kemudian I dan II digabung dan kita peroleh bentuk pernyataan probabilitas

sebagai berikut.

P(b−t a2

Sb ≤ B ≤ b+t a2

Sb)=1−a(4.8)

Rumus perkiraan interval B menjadi :

b−t a2

Sb ≤ B ≤ b+t a2

Sb

b−t a2

Se

√∑ xi2

≤ B ≤b+t a2

Se

√∑ x i2(4 .7)

Di mana

Se=√ 1n−2

∑ e12=√ 1

n−2(∑ y1

2−b2∑ x i2 )

Contoh soal 4.1 :

Buat perkiraan interval untuk B, kalau tingkat keyakinan sebesar 95%, apabila

diketahui :

b = 0,5446

Se = √Se2

= √2,050303333

= 1,4318880898403

∑ Xi2=113,9655

1-a = 0,95 Tingkat keyakinan 95%

a = 0,5 Kesalahan yang diterima

a/2 = 0,25

Jawaban :

11

Sb = √Se2

√∑ Xi2

Sb = √1,4318880898403

√113,9655

Sb = 1,196615238846810,675462519254

Sb = 0,1120902477704

Dari tabel t, t a2

(n−2 )=t 0,0025 (3 )=3,182

b−t a2

Sb ≤ B ≤ b+t a2

Sb

0,5446- 3,182 (0,1120902477704 )≤ B ≤ 0,5446+3,182 (0,1120902477704 )

0,5446– 0.3566711684054 ≤ B ≤ 0,5446+ 0.3566711684054

0,1879288315946 ≤ B ≤ 0,9012711684054

0,1879 ≤ B ≤ 0,9013

Kalau upah naik Rp50.000,00 maka interval antara Rp1.879 sampai Rp9.013

diharapkan akan memuat nilai B sebenarnya dengan tingkat keyakinan 95%

Contoh soal 4.2 :

Buat perkiraan interval untuk B, kalau tingkat keyakinan sebesar 95%, apabila

diketahui :

b = 0,653102123

Sb=0,031062468

n = 5

(1-a) = 0,95

a = 0,05

Dari tabel t, t a2

(n−2 )=t 0,0025 (3 )=3,182

Jawaban :

12

b−t a2

Sb ≤ B ≤ b+t a2

Sb

0,653102123- 3,182 (0,031062468 ) ≤ B ≤ 0,653102123+3,182 (0,031062468 )

0,653102123– 0.098840773 ≤ B ≤ 0,653102123+ 0.098840773

0,55426135 ≤ B ≤ 0,751942896

0,5543 ≤ B ≤ 0,7519

Dengan tingkat keyakinan sebesar 95%, dalam jangka panjang kita

harapkan bahwa interval seperti (0,55426135 - 0,751942896) akan memuat nilai

parameter yang sebenarnya.

Kita tidak dapat mengatakan bahwa dengan probabilitas sebesar 95%,

interval khusus 0,55426135 sampai 0,751942896 akan memuat nilai parameter B

yang sebenarnya. Oleh karena interval ini konstan, bukan acak (random) lagi,

maka nilai parameter B sebenarnya bisa di dalam interval atau tidak. Probabilitas

bahwa suatu interval khusus yang konstan memuat B ialah 1 dan 0.

Soal 4.3

Berdasarkan data dari Biro Pusat Satistik, dimana

X = PDRB dalam milliar

Y = Konsumsi dalam milliar

TAHUN X Y

2006 29.473,644 9.824,3

2007 31.907,546 10.568,85

2008 34.595,450 9.230,04

2009 37.570,568 8.298,59

2010 40.545,686 8.851,38

13

Buat perkiraan interval koefisien regresi dengan tingkat keyakinan sebesar 95%!

Jawab :

Tahun X Y X2 Y2 XY2006 29.473,64400 9.824,30000 868.695.690,63874 96.516.870,49000 289.557.920,749202007 31.907,54600 10.586,85000 1.018.091.491,74212 112.081.392,92250 337.800.403,370102008 34.595,45000 9.230,04000 1.196.845.160,70250 85.193.638,40160 319.317.387,318002009 37.570,56800 8.298,59000 1.411.547.579,84262 68.866.595,98810 311.782.739,899122010 40.545,68600 8.851,38000 1.643.952.653,21060 78.346.927,90440 358.885.274,14668Total 174.092,89400 46.791,16000 6.139.132.576,13657 441.005.425,70660 1.617.343.725,48310

Belanja statistic :

N=5

X = 34.818,5788

Y = 9.358,232

∑ xy=∑ XY−(∑ X ) (∑Y )

n

= 1.617 .343 .725,4813−(174.092,894 ) ( 46.791,16 )

5 = -11.857.966,1203077

∑ x2=∑ X 2−(∑ X )2

n

= 6.139 .132.576,13657−(174.092,894 )2

5= 77.465.427,8775263

∑ y2=∑Y 2−(∑Y )2

n

= 441.005 .425,70660−(46.791,16000 )2

5

14

= 3.122.894,87748

b = ∑ xy

∑ x2

= −11.857.966,120307777.465 .427,8775263

= -0,1530743

∑ b xi2 = (−0 , 1530743 )2 (77 . 465 . 427 , 8775263 )

= 1.815.149,8592724

Se2 =

∑ y2−b2 x i2

n−2

= 3.122.894,87748−1.815 .149,8592724

5−2

= 435.915,0060692

Var(b)= Se

2

x i2

= 435.915,006069

77 . 465 . 427 ,8775263

= 0,0056272

Sb = √var (b)

= √0,0056272

= 0,0750147

α=0,05

ta/2 = 0,025

pembuatan interval keyakinan

= b – tα2

Sb ≤ B ≤ b + tα2

Sb

= -0,1530743 – 3,182(0,0750147) ≤ B ≤ 0,1530743 + 3,182(0,0750147)= -0,1530743 – 0,2386968 ≤ B ≤ -0,1530743 + 0,2386968

15

= -0,3917711 ≤ B ≤ 0,0856225

Dengan tingkat keyakinan sebesar 95%, diharapkan dalam jangka panjang,

interval seperti -0,3917711 sampai 0,0856225 akan memuat B.

Contoh soal 4.4 :

Buat perkiraan interval σ 2 dengan tingkat keyakinan 95% apabila diketahui :

Se2 = 2,050303333

Df = n-2

= 5-2

= 3

Jawaban :

x20,025( 3)=9,3484

x20,975 ( 3)=0,2158

df (Se2)x2

0,025 (3)

≤ σ2 ≤df (Se2)x2

0,975 (3 )

3(2,050303333)9,3484

≤ σ2 ≤3(2,050303333)

0,2158

0,6579639295494 ≤ σ 2≤ 28,502826686747

0,6580 ≤ σ2 ≤28,5028

Artinya dengan probabilitas 95%, dalam jangka panjang kita harapkan bahwa

interval antara 0,6580 sampai 28,5028 akan memuat σ 2

Contoh soal 4.5

Buat perkiraan interval σ 2 dengan tingkat keyakinan 95% apabila diketahui :

Se2 = 80,88625987

Df = n-2

= 5-2

= 3

x20,025( 3)=9,3484

16

x20,975 ( 3)=0,2158

Jawaban :

(n−2)(Se2)x2

a/2

≤ σ2 ≤(n−2)(Se2)x2

1−a /2

380,88625987

9,3484≤ σ2 ≤3

80,886259870,2158

3 (8,6524175120876 )≤ σ2 ≤3 (374,8204813253 )

25,957252536263 ≤ σ2 ≤1124,4614439759

25,96 ≤ σ2 ≤1124,46

Dengan tingkat keyakinan 95%, diharapkan dalam jangka panjang internal seperti

25,96 sampai 1124,46

4.3 Pengujian Hipotesis Koefisien Regresi

Pengujian hipotesis statistik (statistical testing hypothesis) sifatnya

kuantitatif, jadi setiap hipotesis yang kita maksudkan harus dinyatakan dengan

angka-angka. Persoalan pengujian hipotesis secara statistika mungkin bisa

dinyatakan secara sederhana sebagai berikut:

Apakah data observasi / empiris dari hasil penelitian sampel cukup erat

hubungannya dengan hipotesis yang dinyatakan / disebutkan, atau tidak ?

sehingga kita bisa sampai kepada keputusan untuk menolak atau menerima

hipotesis yang telah dinyatakan.

Jadi, apabila beberapa teori atau pengalaman yang telah lalu membuat kita

mempercayai bahwa koefisien arah B dari regresi konsumsi mingguan terhadap

upah mingguan, dalam contoh soal diketahui tingkat keyakinan sebesar 0,90,

apakah hasil hitungan b = 0,5446 yang diperoleh dari sampel akan konsisten

dengan hipotesis yang sudah dinyatakan sebelumnya? Kalau memang ya, kita

dapat menerima hipotesis, tetapi kalau tidak kita harus menolak hipotesis tersebut.

Dengan menggunakan bahasa statistik, hipotesis yang telah dinyatakan

dikenal dengan hipotesis nol (null hypothesis) dan diberi simbol H o. Hipotesis nol

ini diuji melawan hipotesis alternative (alternative hypothesis) dengan symbol H a ,

yang menyatakan misalnya, bahwa koefisien arah atau koefisien regresi tidak

17

sama dengan 0,90. Hipotesis alternative bisa sederhana (simple) atau komposit

(composite). Misalnya, H o : B = 0,90, ini sederhana, sedangkan kalau H a : B ≠

0,90, ini komposit.

Teori pengujian hipotesis berkenaan dengan pengembangan aturan-aturan

atau prosedur untuk memutuskan apakah kita harus menerima atau menolak

hipotesis nol. Sebetulnya, menolak H o berarti menerima H a, sebaliknya, kalau

menerima H o berarti menolak H a. Biasanya kita berkenaan dengan H o, keputusan

menerima H a hanya merupakan kosekuensi logis saja. Sebetulnya, ada dua

pendekatan yang saling berkomplementer, untuk menentukan aturan-aturan yang

dimkasud, yaitu interval keyakinan (confidence intervals) dan uji signifikan (test

of significant). Kedua pendekatan tersebut menyebutkan bahwa pengujian

hipotesis meliputi pembuatan pernyataan tentang nilai-nilai parameter dari

distribusi tersebut.

Sebagai contoh, kita tahu bahwa dengan asumsi kenormalan, b juga

mengikuti fungsi normal dengan rata-rata = E(b) dan var(b) = σ 2 / ∑ X i2 . Kalau

kita membuat hipotesis bahwa B = 0,90, kita telah membuat pernyataan tentang

salah satu parameter dari distibusi normal, yaitu mengenai rata-ratanya. Sebagian

besar dari pengujian hipotesis yang dibahas akan mempunyai semacam ini, yaitu

membuat pernyataan tentang satu atau beberapa nilai parameter dari beberapa

distribusi probabilitas, seperti normal, t, F, dan khai kuadrat.

4.3.1 Pengujian Hipotesis dengan Pendekatan Interval Keyakinan

Untuk membahas pendekatan interval keyakinan, misalnya kita mempunyai

hipotesis sebagai berikut:

H o : B = 0,90

H a : B ≠ 0,90

Perhatikan bahwa pengujian hipotesis nol merupakan hipotesis sederhana,

sedangkan hipotesis alternatifnya komposit. Apakah perkiraan b = 0,5446cukup

dekat dengan H o ?

Apabila diketahui :

0,1879 ≤ B ≤ 0,9013

18

Kita mengetahui bahwa dalam jangka panjang interval keyakinan tersebut

akan memuat nilai B sebenarnya, dengan probabilitas (tingkat keyakinan) sebesar

0,95 atau 95%. Konsekuensinya, dalam jangka panjang (sampel yang di ulang-

ulang), interval yang demikian itu akan merupakan suatu jarak (range) di mana di

dalamnya akan terletak nilai B dengan tingkat/koefisien keyakinan sebesar 95%.

Dengan demikian, interval keyakinan merupakan suatu himpunan dari

hipotesis nol yang dapat diterima. Oleh karena itu, kalau ternyata nilai B sesuai

dengan hipotesis nol, dalam hal ini H o : B =0,90, ternyata tercakup di dalam

interval keyakinan dengan koefisien/tingkat keyakinan sebesar 95%, maka H o

diputuskan untuk diterima, kalau ternyata tidak tercakup (terletak di luarnya),

harus ditolak H o tersebut.

Pengujian hipotesis dengan pendekatan interval keyakinan terdiri dari

langkah-langkah berikut:

Pertama: Menghitung perkiraan interval dengan tingkat keyakinan yang sudah

ditentukan, dalam hal ini 95%. Perkiraan interval yang diperoleh adalah 0,70995 ≤

B ≤ 1,00125.

Kedua: Kita cek, apakah nilai B sesuai dengan nilai hipotesis nol, dalam hal ini,

H o : B = 0,90, terletak dalam interval tersebut atau tidak? Kalau ya, H o kita

terima, kalau tidak, H o kita tolak. Dalam soal yang kita hadapi, H o : B = 0,90

ternyata terletak dalam interval, jadi H o kita terima.

Contoh Soal 4.6

X = Pendapatan per bulan dalam ribuan Rp

Y = Konsumsi per bulan dalam ribuan Rp

X 100 90 80 125 150 200

Y 80 70 60 85 100 150

Uji pendapatan bahwa koefisien regresi sebesar 0,80 dengan alternative tidak

sama dengan itu. Penggunaan tingkat signifikan sebesar 0,10 dengan

menggunakan pendekatan interval keyakinan.

Pemecahan

H o : B = 0,80

H a: B ≠ 0,80

19

α= 0,10,

Jadi 1 – α =

1 – 0,10 = 0,90

b−t α2

Sb ≤ B ≤ b+t a2

Sb

b−t 0,05 Sb ≤ B ≤ b+t 0,05 Sb

X Y X2 Y 2 XY

100 80 10000 6400 8000

90 70 8100 4900 6300

80 60 6400 3600 4800

125 85 15625 7225 10625

150 100 22500 10000 15000

200 150 40000 22500 30000

∑ X ∑Y ∑ X2 ∑Y 2 ∑ XY

20

745 545 102.625 54.625 74.725

∑ X i2 = ∑ X i

2−( X i )2/n

¿102.625−7452/6

¿102.625−92.504,17

¿10.120,83

∑ yi2=∑ Y i

2−(∑Y i )2/n

¿54.625−5452/6

¿54.625−¿ 49.504,17

¿5.120,83

∑ x i y i=∑ X iY i−∑ X i∑Y i /n

¿74.725− (745 ) (545 )/6

¿74.725−67.670,83

¿7.054,17

b=∑ xi y i

∑ x i2

¿ 7.054,1710.120,83

¿ 0,6970

∑ ei2=∑ y i

2−b2∑ x i2

¿5.120,83− (0,6970 )2 (10.120,83 )

¿5.120,83−4.916,79

¿204,04

Se2=∑ e i

2

n−2

¿204,04

4

¿51,01

21

Sb=√ Se2

∑ X i2

¿√ 5,0110.120,83

¿0,071

Dari tabel t, t 0,05 (4 ) ¿ 2,132, derajat kebebasan = df = 4

Perkiraan interval B sebagai berikut:

0,6970−2,132 (0,071 )≤ B≤ 0,6970+2,132 (0,071 )

0,6970−0,1514 ≤ B ≤ 0,6970+0,1514

0,5456 ≤ B ≤ 0,8484

Oleh karena interval keyakinan antara 0,5456 dan 0,8484 memuat nilai B = 0,80,

maka H o kita terima dengan tingkat kepercayaan sebesar 0,90 atau 90%. Dengan

perkataan lain, pendapat yang menyatakan bahwa B = 0,80 dapat diterima.

Contoh Soal 4.7Dengan menggunakan contoh soal 3.2, misalnya kita menganggap bahwa

besarnya MPC (Marginal propensity to consume) yang dinyatakan dalam

parameter B sebesar 0,4 dengan alternative tidak sama. Pergunakan tingkat

signifikan sebesar 0,05 dengan pendekatan perkiraan interval.

Pemecahan

H 0 :B=0,4

H a :B ≤ 0,4

Berdasarkan contoh soal 4.2, sudah kita hitung bahwa dengan tingkat keyakinan

sebesar 95%, dalam jangka panjang, interval 0,55426135 sampai dengan

0,751942896 akan memuat nilai parameter B. Interval keyakinan 0,55426135 < B

< 0,751942896 ternyata tidak memuat nilao hipotesis nol B = 0,4 ditolak.

Jadi, hipotesis atau pendapat bahwa MPC = B = 0,4 ditolak.

Probabilitas untuk mendapatkan nilai B = 0,4 (sebelah kiri nilai batas bawah)

sebesar 0,025 (2,5%).

2,5% 2.5%

0,55426135 0,751942896

22

95%

nilai batas bawah nilai batas atas

Pengujian hipotesis dengan pendekatan perkiraan interval terdiri dari dua tahap

yang harus diperhatikan,

Pertama : Dihitung perkiraan interval dari parameter yang bersangkutan, dengan

tingkat keyakinan tertentu, yaitu (1−α). Nilai α=0,01 atau 0,05.

Kedua : Kemudian dicek, apakah nilai parameter berdasarkan hipotesis nol

terletak di dalam interval atau tidak. Kalau ya, H 0 diterima, kalau tidak, H 0

ditolak.

4.3.2 Pengujian Hipotesis dengan Pendekatan Uji Signifikan (Nyata)

Pendekatan lainnya yang sifatnya komplementer terhadap metode interval

keyakinan dalam pengujian hipotesis secara statistik ialah pendekatan uji-

signifikan yang dikembangkan oleh R.A. Fisher secara independen dan bersama-

sama oleh Neyman dan Pearson.

Secara umum, dapat dikatakan bahwa suatu uji-signifikan adalah suatu

prosuder untuk suatu hasil perhitungan berdasarkan sampel, untuk memeriksa

benar tidaknya suatu hipotesis nol. Ide pokok yang mendasari uji-signifikan ialah

suatu pemerkira (estimator) dan distribusi sampling dari pemerkira yang demikian

itu di bawah hipotesis nol. Keputusan untuk menerima atau menolak H o dibuat

atas dasar nilai pemerkira yang diperoleh dari data empiris / hasil observasi dari

sampel. Maksudnya, untuk menguji benar tidaknya nilai parameter yang

dinyatakan dalam H o, akan dipergunakan suatu criteria uji (btest criteria) yang

dihitung berdasarkan sampel yang diteliti. Untuk ilustrasi, ingat bahwa dengan

asumsi kenormalan, variable t berikut ini:

t=b−BSb

t=(b−B )√∑ X i

2

Se

23

akan mengikuti t dengan kebebasan sebesar (n - 2). Apabila nilai B sudah jelas

dinyatakan dalam H o, maka nilai t dari t=(b−B )√∑ X i

2

Se

langsung dapat dihitung

dari sampel yang bersangkutan, sehingga dapat dipergunakan sebagai criteria uji,

sebagai dasar untuk memutuskan menerima atau menolak H o. Oleh karena uji

criteria ini mengikuti distribusi t, maka pernyataan interval keyakinan seperti

berikut ini dapat dibuat.

P(−t α /2 ≤b−Bo

Sb

≤ tα /2)=1−α

di mana Bo ialah nilai B sesuai dengan H o.

Nilai −t α /2, t α /2 dapat diperoleh dari tabel t dengan derajat kebebasan sebesar

(n - 2).

Perhatikan uraian berikut :

−t α /2≤b−Bo

Sb

≤t α /2

−t α /2 Sb ≤ b−Bo≤ t α /2 Sb

I. −t α /2 Sb ≤ b−Bo akan menjadi Bo−t α /2 Sb ≤ b

II. b−Bo ≤t α /2 Sb akan menjadi b ≤

Setelah I dan II digabung, kita peroleh hasil berikut.

P (Bo−tα /2 Sb ≤b≤ Bo+t α /2 Sb )=1−α

yang merupakan interval di mana b akan tercakup (terletak di dalamnya) dengan

probalitas sebesar (1 −α) dan H o : B=Bo.

Dengan menggunakan bahasa pengujian hipotesis, 100(1 −α )% interval

keyakinan di kenal dengan daerah penerimaan (accepted region) dari pengujian

hipotesis, sedangkan daerah di luar interval keyakinan tersebut dinamakan daerah

penolakan (rejected region) dan sering disebut daerah kritis (critical region).

Betapa eratnya hubungan antara pendekatan interval keyakinandan uji

hipotesis dapat dilihat dengan jalan membandingkan persamaan

P (b−t α /2 Sb ≤ B ≤ b+t α /2 Sb )=1−α dengan persamaan

P (Bo−tα /2 Sb ≤b≤ Bo+t α /2 Sb )=1−α.

Di dalam prosedur interval keyakinan, kita mencoba membuat suatu batas (limit) berupa interval yang dihitung berdasarkan sampel, di mana dalam jangka panjang

24

(sampel yang diulang-ulang), dengan tingkat keyakinan tertentu, kita harapkan nilai parameter B yang tidak diketahui akan terletak; sedangkan dalam pendekatan uji-signifikan, kita membuat hipotesis atau anggapan mengenai nilai parameter B yang sebenarnya dan mencoba melihat apakah perkiraan b untuk parameter B yang dihitung berdasarkan sampel akan terletak dalam batas-batas yang pantas, sekitar nilai hipotesis tadi.

Contoh Soal 4.8

Dengan menggunakan contoh soal 3.2, coba dicek apakah H 0 :B=0,4

dapat diterima atau ditolak, dengan tingkat signifikan α=0,05.

Pemecahan

Hasil perhitungan dari sampel menunjukkan bahwa nilai b = 0,653102123,

Sb=0,031062468, df = 3.

Dengan α=0,05 dari tabel t kita peroleh

t α2

=t 0,025

= 3,182 (dengan df = 3)

H 0 :B=0,4 B0=0,4

H a :B ≠ 0,4

Bo−t α2

Sb≤ b ≤ Bo+t α2

Sb

0,4−3,182 (0,031062468 ) ≤ b ≤0,4+3,182 (0,031062468 )

0,4+0,098840773 ≤ b ≤0,4+0,098840773

0,301159227 ≤ b ≤ 0,498840773

Ternyata, nilai b = 0,653102123 terletak di luar interval keyakinan

0,301159227 sampai dengan 0,498840773, maka dari itu, keputusan yang harus

kita ambil adalah menolak anggapan/hipotesis bahwa MPC = B = 0,4.

Dalam praktiknya, kita tidak perlu menghitung interval keyakinan seperti

dalam persamaan (4.16) secara eksplisit, kita hanya perlu menghitung nilai t

berdasarkan rumus berikut

t=b−BSb

Kemudian kita lihat apakah nilai t ini terletak dalam interval antara −t α2

dan t α2, kalau ya, H 0 diterima, kalau tidak, H 0 ditolak.

25

GAMBAR 4.2

Jelasnya sebagai berikut.

Kalau −t α2

≤ t ≤ t α2, H 0 diterima.

Kalau t < −t α2 atau t > t α

2, H 0 ditolak.

Dalam contoh ini,

t=0,653102123−0,4

0,031062468

¿8,148165271

Oleh karena t > t α2, makaH 0 ditolak.

Untuk lebih jelasnya lihat gambar 4.3.

Oleh karena menggunakan distribusi t, maka prosedur pengujian hipotesis

di atas disebut uji t (t-test). Di dalam bahasa uji signifikan, dalam ilmu statistika,

suatu nilai perkiraan (statistic, tanpa s) dikatakan signifikan secara statistik

apabila uji statistik berada dalam daerah kritis, yaitu daerah yang diarsir. Daerah

ini disebut juga daerah penolakan. Dalam hal ini, H 0 ditolak (dengan sendirinya

H a diterima).

26

GAMBAR 4.3

Dengan argumentasi yang sama, suatu uji dikatakan signifikan secara

statistik apabila nilai uji berada di dalam daerah penerimaan. Dalam hal ini,

hipotesis nol (H 0) diterima. Dalam contoh ini, uji t (t test) ternyata signifikan,

hipotesis nol (H 0) harus ditolak. Jadi, pendapat (hipotesis) yang menyatakan

bahwa B = MPC = 0,4 tidak dapat diterima.

Contoh pengujian hipotesis yang kita bahas di atas dikenal dengan nama

uji dua arah atau two-sided atau two-tail test, karena kita berhubungan dengan dua

ekor distribusi probabilitas (normal test, t test) yang merupakan daerah kritis

(daerah penolakan) dan tolak H 0 kalau nilai t yang dihitung berdasarkan data hasil

observasi jatuh/berada dalam daerah penolakan tersebut.

Perhatikan gambar berikut.

Kalau −t α2

≤ t ≤ t α2, H 0 diterima.

Kalau t < −t α2 atau t > t α

2, H 0 ditolak.

Disebut dua arah, karena hipotesis alternative H a merupakan hipotesis komposit

dua arah, yaitu H a :B ≠ 0,4, yang berarti B bisa lebih besar atau lebih kecil dari

27

0,4. Misalkan pengalaman sebelumnya membuat kita mempunyai

H a : MPC=B>0,4 (lebih besar dari 0,4).

Dalam hal ini,

H 0 :B=0,4

H a :B>0,4

Walaupun H a masih merupakan hipotesis komposit, tetapi sekarang hanya satu

arah saja. Dalam hal ini, kita berhubungan dengan uji satu arah (one-tail test).

GAMBAR 4.4

Uji Signifikan Satu Arah

Prosedur pengujian sama saja, kecuali bahwa nilai kritis atau batas keyakinan atas

menjadi t a=t 0,05, yaitu sebesar 5%, bukan 2,5% seperti sebelumnya (lihat gambar

4.4)

28

Ada dua cara uji satu arah, yaitu sebagai berikut.

Contoh Soal 4.9

Juga dari contoh soal 3.2, uji pendapatbahwa MPC = B sebesar 0,4 dengan

alternative lebih besar dari itu, dengan tingkat signifikan sebesar 0,05.

Pemecahan

H 0 :B=0,4

H a :B>0,4

t=b−B

Sb

t=b−0,4

Sb

t=0,653102123−0,4

0,031062468

¿8,148165271

29

Contoh Soal 4.10

Dengan menggunakan contoh soal 3.2, uji pendapat bahwa σ 2 = 75 dengan

alternatif tidak sama dengan 75, dengan menggunakan α = 5%.

Pemecahan :

H 0 :σ2=75

H a :σ2 ≠ 75

x2=(n−2 )Se

2

σ 2

¿ (5−2 ) 80,8862598775

¿380,88625987

75

= 3,235450395

Karena α=0,05 , x20,025( 3)=9,348 dan x2

0,975 (3 )=0,216

Oleh karena x2= 3,235450395 terletk dalam interval 0,216 dan 9,348, maka H o

dapat diterima. Jadi, pendapat bahwa σ 2=75 dapat dibenarkan. Uji semacam ini

disebut uji signifikan khai-kuadrat (the chi-square test of significance).

4.4 Analisis Varian dalam Regresi

Dalam subbab 4.4 ini akan dipelajari analisis regresi dari sudut pandangan

analisis varian dan mengenalkan kepada pembaca terhadap suatu cara yang

komplementer dan jelas dalam melihat persoalan-persoalan statistic induktif atau

statistical inference.

30

Telah kita tunjukan suatu persamaan sebagai berikut.

∑ yi2=∑ y i

2+∑ e i2=b2∑ x i

2+∑ e i2

Kalau

∑ yi2= TSS (=total sum of square)

∑ yi2= ESS (=explained sum of square)

∑ ei2 = RSS (=residual sum of square)

maka

∑ yi2=∑ y i

2+∑ e i2 menjadi

TSS = ESS + RSS, yang menunjukkan pemecahan / penguraian TSS

menjadi dua komponen/bagian, yaitu ESS dan RSS

TSS diperguanakan untuk menunjukkan jumlah variasi Y yang terdiri dari

dua sumber variasi, yaitu ESS berasal dari regresi, merupakan sumbangan/

penguraian TSS menjadi dua komponen/bagian, yaitu ESS dan RSS

TSS dipergunakan untuk menunjukkan jumlah variasi Y yang terdiri dari

dua sumber variasi, yaitu ESS berasal dari regresi, merupakan sumbangan yang

disebabkan oloeh variable bebas X, dan RSS berasal dari kesalahan pengganggu.

Studi mengenai komponen-komponen TSS disebut analisis vari9an (anavar), yang

berarti analisis sumber-sumber variasi yang diukur dengan varian.

∑ yi2 disebut explained sum of square atau jumlah kuadrat yang bisa

diterangkan, maksudnya ialah bahwa sumbernya itu jelas, yaitu pengaruh linear (

linear effect ) dari X. Sedangkan ∑ ei2 diksebut unexplained sum of square atau

jumlah kuadrat yang tidak bisa diterangkan , oleh karena sumber variasi memang

tidak begitu jelas, sebab kesalahan pengganggu e meliputi variabel-variabel atau

factor-faktor yang mempengaruhi Y, tetapi tidak dimasukkan kedalam persamaan

regresi linear.

Pada dasarnya, besarnya nilai derajat kebebasan merupakan selisih antara

banyaknya observasi atau elemen sampel dengan banyaknya perkiraan yang akan

dibuat. Jadi, kalau ada k perkiraan yang akan dibuat untuk memperkirakan k

parameter, maka derajat kebebasan (df) sebesar ( n-k ). Untuk menghitung satu

perkiraan, kita mempunyai df = ( n-1 ), sebab kehilangan 1 kebebasan.

31

Contoh :

Tentukan 5 nilai variabel Y, sehingga rata-ratanya 5. Dalam hal ini, df =

( n -1)= 5-1 = 4, maksudnya kita bebas menentukan nilai dari 4 variabel yang

pertama (4 kebebasan), sedangkan nilai variabel yang kelima tidak bebas lagi

(kehilangan 1 kebebasan), sebab jumlah harus 25.

Y 1=? Misalnya, Y 1=6 (bebas) atau , Y 1=10 (bebas)

Y 2=? Y 2=7 (bebas) Y 2=1 (bebas )

Y 3=? Y 3=4 (bebas) Y 3=4 (bebas)

Y 4=? Y 4=5 (bebas) Y 4=2 (bebas)

Y 5=? Y 5=3 (bebas) Y 5=8 (bebas)

∑Y i = 25 ∑Y i = 25 ∑Y i = 25

Y = 5 Y = 5 Y = 5

Satu perkiraan yang dibuat, satu kebebasan hilang.

Tabel Anavar

Untuk Model Regresi Sederhana

Sumber

Varian

Jumlah

Kuadrat (SS)

d

df

Rata– rata 11)

Kuadrat (MS)

Dari Regresi (ESS)

Dari kesalahan

Pengganggu (RSS)

∑ yi2=b2∑ x i

2

∑ ei2

1

(n-2)

ESS/df = b2∑ x i2

RSS/df=∑ ei2/(n-2) = Se

2

32

Total jumlah

Kuadrat (TSS) ∑ yi2 (n-1)

Dengan menganggap bahwa kesalahan pengganggu i mempunyai

distribusi normal dan H0 : B = ), da[at ditunjukkan bahwa variabel F sebagai

berikut.

F= rata−rata kuadrat regres irata−rata kuadrat kesalahan pengganggu

F= ESS/dfRSS /df =

b2∑ xi2

∑ e i2/(n−2)

mengikuti fungsi F dengan derajat kebebasan 1 dan (n-2)

Contoh Soal 4.11

Berdasarkan contoh soal 3.2, uji pendekatan bahwa B = MPC = 0 dengan

alternatif tidak sama dengan itu. Pergunakan analisis varian (anavar).

Pemecahan :

Diketahui

b = 0,653102123

∑ x12 = 83.830,6875

∑Y 12 = 4.360.500

∑Y 1 = 4.650

n = 5

Tabel Anavar

Sumber

Variasi

Jumlah Kuadrat

(SS)f

Rata-Rata

Kuadrat (MS)F

Dari regresi (ESS) 35.757,34122 1 35.757,34122 442,0694098

33

Dari Kesalahan

Pengganggu (RSS)

242, 65878 3

3

80,88626

Total jumlah

Kuadrat (TSS)36.000,00000 4

F= rata-rata kuadrat regresi Rata-rata kesalahan pengganggu

F= ESS RSS

= 35.757,34122 80, 88626

= 442,0694098 (**)

Tabel F F0,05 (1)(3) = 10,13

F0.01(1)(3) = 34,12

Untuk α = 0,05 (5%). Oleh karena F > F0,05(1)(3) , maka H0 ditolak. Pendapat /

hipotesis bahwa MPC=0 ditolak. Tidak benar B= 0.

Untuk α = 0,01 (1%). Oleh karena F > F0,05(1)(3) , maka H0 ditolak. Pendapat bahwa

B=0 Tidak benar .

Soal 4.12

Uji anggapan PDRB mempunyai konsumsi nasional dengan alternatif tidak ada

pengaruhnya. Pergunakan analisis varian dengan α=5% dan1 %. Data dari BPS

adalah sebagai berikut :

TAHUN X Y

34

2006 29.473,644 9.824,3

2007 31.907,546 10.568,85

2008 34.595,450 9.230,04

2009 37.570,568 8.298,59

2010 40.545,686 8.851,38

Jawab:

b= -0,5130743

∑ b2x i2 = (−0 , 1530743 )2 (77 . 465 . 427 , 8775263 )

= 1.815.149,8592724

∑ y2=∑Y 2−(∑Y )2

n

= 441.005 .425,70660−(46.791,16000 )2

5= 3.122.894,87748

∑e i2 = ∑ y2- ∑ b2x i

2

= 3.122.894,87748 - 1.815.149,8592724 = 1.307.745,0182077

Sumber variasi

Jumlah kuadrat (ss)

df Rata-rata kuadrat

(MS)

F

35

Dari regresi (ESS)

Dari kesalahan

pengganggu (RSS)

1.815.149,8592724

1.307.745,0182077

1

3

1.815.149,8592724

435.915,0060692

4,16399482

Total jumlah kuadrat (TSS)

3.122.894,8774800 4

F = ESSRSS

= 1.815.149,8592724435.915,0060692

= 4,16399482Dari table F0,05(1)(3) = 10,13

F 0,01(1)(3) = 34,12

Oleh karena F< F0,05(1)(3), maka H0 diterima yang artinya memang ada pengaruh

PDRB terhadap konsumsi daerah Kalimantan selatan.

4.5 Ramalan dengan Menggunakan Garis Regresi Linear Sederhana

Berdasarkan contoh soal 3.2, kita peroleh regresi sampel dengan persamaan sebagai berikut.Ŷ i=24,4545+0,5091 X i (4.21)

di mana Ŷ i merupakan pemeriksaan E(Y i) dengan nilai variabel bebas X tertentu. Persamaan regresi linear sederhana ini dapat dipergunakan untuk meramalkan (to forecast or to predict) besarnya konsumsi (Y) untuk waktu yang akan datang apabila besarnya pendapatan (X) sudah diketahui.X diketahui, artinya sebagai berikut.a) Sudah terjadi, misalnya merupakan pendapatan waktu yang lalu. Dalam hal

ini, X disebut variabel beda kala (lagged variabel) dengan simbol X t−1.

b) Hasil ramalan, misalnya pendapatan tahun depan,dengan simbol X t+1.

c) Pendapatan sekarang,dalam waktu yang bersangkutan, dengan simbol X t .Untuk meramalkan Y, nilai variabel X harus diketahui terlebih dahulu. Itulah sebabnya X disebut variabel bebas (independent variable) dan sering disebut explanatory variable, artinya variabel yang menerangkan. Sedangkan, Y disebut

36

variabel tidak bebas (dependent variable), karena memang nilainya tergantung pada nilai X.Y = nilai hasil observasi, hasil pencatatan.Ŷ = nilai perhitungan berdasarkan persamaan garis regresi, sering disebut nilai regresi atau nilai teoretis. Y merupakan perkiraan atau ramalan Y.

Ramalan pada dasarnya merupakan perkiraan terjadinya suatu kejadian (peristiwa) untuk waktu yang akan datang. Ada perkiraan jangka pendek, ada juga ramalan jangka panjang (short term and long term forecasting) . Ramalan (produksi, penjualan, ekspor, penerimaan negara, pendapatan nasional, konsumsi, dan variabel ekonomi lainnya) sangat diperlukan untuk dasar perencanaan.

Ada dua macam ramalan untuk variable tidak bebas Y, yaitu ramalan untuk rata-rata Y dan individu Y nilai X tertentu, katakan X=X o. Untuk selanjutnya, kita sebut ramalan rata-rata Y atau ramalAn E(Y) dan ramalan individu Y. E(Y)=expected (Y) merupakan rata-rata. Dalam praktiknya, meramalkan E(Y) juah lebih mudah dari pada meramalkan individu Y, sebab rata-rata Y kurang bervariasi dibandingkan dengan Y, sebabnya ialah E(Y) = A+BX terletak tepat pada garis regresi populasi, sedangkan Y terletak di sekitar garis regresi populasi. Lihat gambar berikut!

E(Y), lengkapnya ditulis E(Y /X o), dibaca rata-rata Y atau nilai harapan

(expected value) Y, untuk X=X o .Titik-titik pada gambar menunjukkan nilai

individu Y, untuk X tertentu, yaitu merupakan titik-titik koordinat: (X1 , Y 1), (X2 , Y 2), ...,(X n , Y n ¿. Ramalan E(Y/X o) disebut ramalan bersyarat (coditional

forecast) , maksudnya hasil ramalan sangat tergantung pada nilai X=X o.Misalnya, kalau X=biaya advertensi dan Y= hasil penjualan, maka

ramalan hasil penjualan untuk waktu yang akan datang sangat tergantung kepada biaya advertensi. Juga misalnya, kalau X = pendapatan nasional atau investasi

37

nasional dan Y = konsumsi nasional atau PDB, maka ramalan konsumsi nasional atau ramalan PDB yang akan datang sangat tergantung kepada tinggi rendahnya pendapatan nasional atau investasi nasional yang kita beri simbol X=X o.

Untuk membedakan nilai ramalan atau bukan, maka untuk nilai ramalan rata-rata Y kita beri simbol E(Y 0 , X0), kita baca ramalan rata-rata Y kalau X = X o

dan ramalan individu Y diberi simbol (Y 0 , X0), dibaca untuk meramalkan rata-rata Y = E(Y) maupun individu Y, nilai X harus diketahui terlebih dahulu.

Perlu dibedakan nilai ramalan tunggal (point forecast) , yaitu ramalan yang terdiri dari satu nilai saja, dan ramalan interval, di mana kita harapkan bahwa nilai yang kita ramalkan tersebut akan terletak dalam interval yang kita buat berdasarkan data sampel dengan menggunakn tingkat atau koefisien keyakinan tertentu, katakan 90% atau 95%

4.5.1 Ramalan Rata-Rata Y atau E(Y)Dengan menggunakan persamaan garis regresi yang sudah di buat

berdasarkan data sampel berikut:Ŷ = a + bX, maka kalau X = X o , maka Y nol topi menjadi Ŷ o= a + b X o , di mana

a = 24,4545 dan b = 0,5091. Sekarang, misalnya sudah diketahui X = X o = 100,

kita ingin meramalkan nilai rata-rata Y, yaitu E(Y 0 , X0), maka perkiraan tunggal

dari rata-rata Y dapat diperoleh dengan jalan memasukkan X = X o = 100 ke dalam persamaan garis regresi:

Ŷ o= a + b X o = 24,4545 + 0,5091(100)= 24,4545 + 50,91= 75,3645

Di mana Ŷ operkiraan E(Y 0 , X0). Dapat ditunjukkan bahwa Ŷ o merupakan

perkiraan linear tunggal E(Y 0 , X0) yang tidak bias dan varian yang minimum atau BLUE (best linear unbiased estimators) .

Oleh karena Ŷ o (Y nol topi) merupakan suatu pemerkira (estimator) E(Y 0 , X0), maka nilainya sebagai perkiraan akan berbeda-beda, dari sampel ke

sampel akan bervariasi. Perbedaan antara nilai Y o dengan E(Y 0 , X0) akan memberikan gambaran mengenai kesalahan tersebut, kita perlu mengetahui distribusi sampling Y o. Hal ini dapat ditunjukkan oleh karena Y o merupakan fungsi kesalahan pengganggu yang berdasarkan asumsi mempunyai distribusi normal dengan rata-rata nol dan varian Ŷ o , maka Y o juga mempunyai distribusi

normal dengan rata-rata E(Y o) = (A + B Xo) dan

var(Ŷ o) = σ 2 [ 1n

+¿¿¿ (4.22)

38

Dengan jalan mengganti σ 2 dengan Se2, perkiraannya kita peroleh variabel t

sebagai berikut.

t = Ŷ o−E (Y 0/ X0)

SŶ o

(4.23)

Di mana SŶ o = √SŶ o

2 (perkiraan standard error Y o), SŶ o

2 = perkiraan var(Y o ¿, maka

t mengikuti distribusi dengan derajat kebebasan (n – 2). Dengan demikian, maka t ini dapat digunakan untuk membuat perkiraan interval atau menguji hipotesis mengenai E(Y 0/ X0).

E(Y 0/ X0) = A + BX o

t = Ŷ o−E (Y 0/ X0)

SŶ o

P(-t α /2≤ t ¿ t α /2) = 1 – α

-t α /2 ≤ Ŷ o−E (Y 0/ X0)

SŶ o

≤ t α /2

-t α /2 SŶ o ≤ Ŷ o−E ¿) ≤ t α /2 SŶ o

I II

I. -t α /2 SŶ o ≤ Ŷ o−E ¿)

E(Y 0/ X0) ≤ Ŷ o + t α /2 SŶ o

II. Ŷ o −E ¿) ≤ t α /2 SŶ o

Ŷ o −¿ t α /2 SŶ o ≤ E ¿)

I dan II digabung akan memperoleh perkiraan interval untuk E ¿) dengan tingkat keyakinan sebesar (1 – α) sebagai berikut.

Ŷ o −¿ t α /2 SŶ o ≤ E ¿) ≤ Ŷ o + t α /2 SŶ o

(4.24)

di mana Ŷ o = a + bX o

39

SŶ o = Se √ 1

n+(X o−X )2

∑ X12

t α /2 SŶ o diperoleh dari tabel t dengan derajat kebebasan (n – 2)

Contoh Soal 4.13Dengan menggunakan data contoh soal 3.2, buat perkiraan/ramalan

interval E(Y) kalau X = X 0 = 100! Pergunakan tingkat keyakinan 95%.Pemecahan

var(Ŷ o) = Se2 [

1n +¿¿¿

= 80,88625987 [15+(100−1.040,85)2

83.830,6875 ]

= 80,88625987 [0,2885.198,722583.830,6875 ]

= 80,88625987 ( 10,75936375 ) = 870,2846921

SŶ o = √var (Ŷ o) = 29,500588

Ŷ o = a + bX o

= 250,218655 + 0,653102123(100)= 250,218655 + 65,3102123= 315,5288673


315,5288673 – 3,182(29,500588) ≤ E ¿) ≤ 315,5288673 + 3,182(29,500588)315,5288673 – 93,870871 ≤ E ¿) ≤ 315,5288673 + 93,870871221,6579963 ≤ E ¿) ≤ 409,3997383Kalau X = 100, dengan tingkat keyakinan 95%, dalam jangka panjang

interval 221,6579963 sampai 409,3997383 akan memuat E(Y) = rata-rata Y. Perkiraan tunggal untukE(Y), yaitu Y o = 315,5288673

SOAL 4.14Dengan menggunakan data berikut, buat ramalan interval rata-rata Y kalau

X=1000 dengan tingkat keyakinan 95%.

40

Dimana X = pendapatan rata-rata per bulan dalam jutaan rupiah

Y = tabungan rata-rata perbulan dalam jutaan rupiah

TAHUN X Y

2006 72.445,766 40.854,481

2007 83.312,633 51.095,756

2008 95.809,466 71.434,944

2009 110.180,883 82.408,203

2010 126.708,025 99.318,846

Jawab :

X Y X2 Y2 XY

72.445,7660000 40.854,4810000 5.248.389.011,326760 1.669.088.617,77936 2.959.734.170,57745

83.312,6330000 51.095,7560000 6.940.994.817,392690 2.610.776.281,21154 4.256.921.967,48555

95.809,4660000 71.434,9440000 9.179.453.775,205160 5.102.951.224,28314 6.844.143.838,37990110.180,883000

0 82.408,2030000 12.139.826.978,659700 6.791.111.921,68921 9.079.808.572,98325126.708,025000

0 99.318,8460000 16.054.923.599,400600 9.864.233.170,77172 12.584.494.821,93910488.456,773000

0345.112,230000

049.563.588.181,984900

026.038.161.215,735000

035.725.103.371,365300

0

N=5

∑ X=488.456,773

∑Y =345.112,23

∑ X2= 49.563.588.181,9849

41

∑Y 2= 26.038.161.215,735

∑ XY=35.725 .103 .371,3653

∑ xy=∑ XY−(∑ X ) (∑Y )

n

= 35.725 .103 .371,3653−(488.456,773 ) (345.112,23 )

5 = 2.010.622.133,63854

∑ x2=∑ X 2−(∑ X )2

n

= 49.563 .588 .181,9849−( 488.456,773 )2

5= 1.845.364,07019

∑ y2=∑Y 2−(∑Y )2

n

=26.038 .161.215,735−(345.112,23)2

5= 2.217.670.956,62038

b = ∑ xy

∑ x2

= 2.010.622 .133,63854

1.845.364,07019= 1,0894230

a= Y−b X = 69.022,446 - 1,0894230(97.691,354) = -37.404,7667830

Untuk X = 100.000

Y 0 = a +b X

= -37.404,7667830 + (1,0894230)(97.691,354) = 71.537,5374964

b2∑ x i2 = (1,0894230 )2 (1.845.364,07019 )

= 2.190.418.082,737640

Se2 =

∑ y2−b 2 x i2

n−2

42

= 2.217 .670.956,62038−2190818.082,737640

5−2

= 9.084.291,2942476

Se = 3.014,015808

sY 0 = Se√ 1

n+¿¿¿¿¿

= 3.014,015808√ 15+(100.000−97.691,354)2

1.845 .364,07019

= 3.014,015808√0,2+ 5.329.864,8221.845 .364,07019

= 3.014,015808 √3,0882457= 3.014,015808 ( 1,7573405)= 5.296,652104

t α /2 (n−2)= t 0,025(3)= 3,182


71.537,5374964 – 3,182(5.296,652104) ≤ E ¿) ≤ 71.537,5374964 +3,182(5.296,652104)

71.537,5374964 – 16.853,94699 ≤ E ¿) ≤ 71.537,5374964 + 16.853,94699

54.683,59050 ≤ E ¿) ≤ 88.391,48448Kalau X = 100.000, dengan tingkat keyakinan 95%, dalam jangka panjang

interval 54.683,59050 sampai 88.391,48448 akan memuat E(Y) = rata-rata Y. Jadi, kalau pendapatan Rp100.000.000, dengan tingkat keyakinan 95%, dalam jangka panjang, interval antara Rp5.469.359.050.000,00 sampai Rp8.839.148.448.000,00 akan memuat rata-rata tabungan sebenarnya.

95%

2,5 % 2,5 %

Rp5.469.359.050.000,00 Rp8.839.148.448.000,00

Rata-rata tabungan yang sebenarnya dalam interval

4.5.2. Ramalan Individu Y

43

Apabila kita ingin meramalkan individu Y, yaitu Ŷ o untuk nilai X = X 0,

dapat ditunjukkan bahwa pemerkira Ŷ o = a + bX o selain untuk memperkirakan

rata-rata Y, yaituE ¿), juga dapat untuk memperkirakan individu Y, yaitu Ŷ o.

Artinya, baik perkiraan untuk E(Y 0/ X0) maupun untuk Y o sama, yaitu Ŷ o (Y nol

topi), tetapi var (Y o) sebagai berikut.

var(Ŷ o) = o2 [1 + 1n

+ ¿¿¿ ] (4.25)

Kalau o2 diganti Se2, maka

SŶ o = Se √1+ 1

n+(Xo−X )2

∑ X12

SŶ o = perkiraan standard error Ŷ o

t = Ŷ o−Y 0/ X0

SŶ o

, (Y 0/ X 0 di baca Y 0 dengan syarat X = X 0

akan mengikuti fungsi t dengan derajat kebebasan sebesar (n – 2).

P(-t α /2≤ t ≤ t α /2) = 1 – α

-t α /2 ≤ Ŷ o−Y 0/ X0

SŶ o

≤ t α /2

-t α /2 SŶ o ≤ Ŷ o−Y 0/ X0 ≤ t α /2 SŶ o

I II

I. -t α /2 SŶ o ≤ Ŷ o−Y 0/ X0

Y 0/ X 0 ≤ Ŷ o + t α /2 SŶ o

II. Ŷ o −Y 0/ X 0 ≤ t α /2 SŶ o

Ŷ o −¿ t α /2 SŶ o ≤ Y 0/ X 0

I dan II digabung, diperoleh rumus perkiraan interval individu Y dengan tingkat keyakinan sebesar (1 – α) sebagai berikut.

Ŷ o −¿ t α /2 SŶ o ≤ Y 0/ X 0 ≤ Ŷ o + t α /2 SŶ o

(4.26)

44

di mana

Ŷ o = a + bX o

SŶ o = Se √1+ 1

n+(Xo−X )2

∑ X12

t α /2 dari tabel t dengan derajat kebebasan (n – 2).

Contoh Soal 4.15

Dengan menggunakan contoh soal 3.2, buat ramalan interval individu Y,

dengan tingkat keyakinan 95%, kalau X = 100!

Pemecahan

Ŷ o −¿ t α /2 SŶ o ≤ Y 0 ≤ Ŷ o + t α /2 SŶ o

di mana

SŶ o = Se √1+ 1

n+(Xo−X )2

∑ xe2

Ŷ o = 250,218655 + 0,653102123X o X = 100

= 250,218655 + 0,653102123(100)

= 250,218655+ 65,3102123

= 315,5288673

Se2 = 80,88625987 Se=¿8,993678884

SŶ o = 8,993678884√1+0,2+

(100−1.040,85)2

83.830,6875

= 8,993678884 √1,2885.195,722583830,6875

= 8,993678884 √11,75936375

= 8,993678884 (3,429192871)

= 30,84105951

t 0,05(3) = 3,183

315,5288673 – 3,182(30,84105951) ≤ Y o ≤ 315,5288673 + 3,182(30,84105951)

45

315,5288673 – 98,13625136 ≤ Y o ≤ 315,5288673 + 98,13625136

217,3926159 ≤ Y o ≤ 413,6651187

Kalau X = 100, dengan tingkat keyakinan 95%, interval antara 217,3926159

sampai 413,6651187 , dalam jangka panjang akan memuat nilai individu Y.

4.5.3 Cara Melaporkan Hasil Analisis RegresiBanyak hasil penelitiaan ekonomi secara kuantitatif yang hasilnya sukar di

mengerti, khususnya hasil analisis ekonometri dengan disertai berbagai macam angka atau simbol-simbol yang sering kali kurang dimengerti oleh penbaca. Dalam hal ini, untuk melaporkan analisis regresi, perlu diperhatikan hal-hal berikut.

Pertama : Persamaan garis regresi yang dihitung dari sampel, lengkap dengan segala koefisiennya Ŷ = a + bX.

Kedua : Diikutsertakan standard error bagi setiap koefisiennya, Ŷ = a + bX (Sa)(Sb ¿

Sa = standard error (a), diletakkan di bawah aSb = standard error (b), diletakkan di bawah b

Ketiga : Diikutsertakan nilai t yang masing0masing berdasarkan sampel langsung di bawah Sa dan Sb.

t di bawah Sa dan Sb, masing-masing berdasarkan sampel rumus berikut.

t a = a−A

Sa dan t b =

b−BSb

Y = a + bX

(Sa)(Sb)

(t a)(t b)

Keempat :Diikutsertakan nilai koefisien determinasi (r2) dan standard error

regresi atau standard error kesalahan pengganggu (Se)

Ŷ = a + bX r2

(Sa) (Sb) Se

(t a) (t b) df = n – 2

Kegunaan masing-masing di dalam penyajian hasil analisis regresi adalah sebagai berikut.Pertama : persamaan regresi Ŷ = a + bX digunakan untuk meramalkan E ¿) atau

¿) setelah X=X o diketahui. Ŷ o = a + bX o selain merupakan ramalan untuk E ¿) juga merupakan ramalan ¿).

Kedua : Standard error Sa dan Sb untuk mengukur tingkat ketelitian pemerkira a dan b. Makin kecil standard error suatu pemerkira, makin

46

teliti pemerkira tersebut, maksudnya makin dekat dengan nilai parameter yang akan diperkirakan. Jadi, makin kecil Sa dan Sb , makin dekat a dengan A dan b dengan B.Sa 0, berarti a A, kalau Sa = 0 , a = ASb 0, berarti b B, kalau Sb = 0, b = B

(Dalam praktiknya, standard error tidak pernah nol).Ketiga : Nilai t, dan t a dan t b dapat untuk menguji hipotesis tentang parameter

A dan B.

Keempat : Koefisien determinasi (r2) untuk mengukur tepat / cocoknya persamaan

regresi untuk meramalkan. Makin besar r2, makin tepat garis untuk meramalkan Y, sebab makin besar persentase sumbangan X, terhadap varian (naik turunnya) Y digunakan standard error regresi atau standard error kesalahan pengganggu Se untuk mengukur betapa dekatnya nilai-nilai individu Y hasil garis regresi Ŷ = a + bX.

Makin kecil Se, berarti makin dekat nilai-nilai individu Y terhadap garis regresi, sehingga makin tepat / cocok garis regresi tersebut untuk meramalkan Y kalau X sudah diketahui

Perhatikan gambar berikut.

(Titik-titik menunjukkan letak individu Y, jauh dari garis regresi)

(Titik-titik menunjukkan letak individu Y, jauh dari garis regresi)

47

Jadi, untuk mengukur kecocokan / ketepatan suatu garis regresi untuk meramalkan ( goodness of fit), dapat dipergunakan nilai r2 yang makin besar, makin baik atau Seyang makin kecil baik.

48

DAFTAR PUSTAKASupranto, J. 2005. Ekonometri. Jakarta. Ghalia IndonesiaBadan Pusat Statistika. Kalimantan Selatan dalam angka.

49

perkiraan interval dan pengujian hipotesis dalam regresi sederhana

Documents