Download - ANALISIS PENAKSIRAN REGRESI LINIER PADA …digilib.unimus.ac.id/files/disk1/129/jtptunimus-gdl-iswahyudij... · meningkatkan ketelitian penaksiran dengan memanfaatkan hubungan antara

ANALISIS PENAKSIRAN REGRESI LINIER

PADA SAMPLING KELOMPOK

ARTIKEL

Oleh

ISWAHYUDI JOKO S, S.Si, M.Pd

PROGRAM STUDI PENDIDIKAN MATEMATIKA

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN

UNIVERSITAS MUHAMMADIYANEGERI SEMARANG

2012

2

ANALISIS PENAKSIRAN REGRESI LINIERPADA SAMPLING KELOMPOK

Iswahyudi Joko Suprayitno

Abstrak

Analisis penaksiran regresi linier merupakan salah satu cara estimasi untuk meningkatkan ketelitian penaksiran dengan memanfaatkan hubungan antara variabel x dan y agar kedua variabel tersebut mendekati linier. Dalam skripsi ini akan dibicarakan analisis penaksiran regresi linier pada sampling kelompok.

Permasalahan dalam penelitian ini adalah:1. Berapakah besarnya variansi minimum dari penaksir regresi linier pada

sampling kelompok?2. Berapakah besarnya bias dari penaksir regresi linier sederhana?

3. Apakah regresi linier sederhana lebih efisien bila dibandingkan dengan sampling kelompok ( cluster sampling )?Tujuan penelitian ini adalah untuk mengetahui besarnya variansi minimum dari penaksir regresi linier pada sampling kelompok, mengetahui besarnya bias dari penaksir regresi linier sederhana dan menunjukkan secara teoritis bahwa penaksir regresi linier sederhana sebagai penaksir yang efisien pada kondisi tertentu.

Penelitian ini meliputi ruang lingkup yaitu regresi linier sederhana dan sampling kelompok. Objek penelitiannya adalah perbedaan antara penaksiran regresi linier sederhana dengan penaksiran pada sampling kelompok. Variabel/fokus pembicaraan dari penelitian ini yaitu penaksiran variabel dependen pada regresi linier sederhana, penaksiran variabel dependen pada rata-rata sampel, penaksiran bias pada regresi linier, penaksiran varians pada sampling kelompok dan penaksiran varians pada regresi linier sederhana. Teknik dan olah data dengan menggunakan studi pustaka, perumusan masalah, pengumpulan data dan penyelesaian masalah.

Simpulan dari penelitian ini yaitu besarnya variansi minimum dari penaksir regresi linier pada sampling kelompok . Besarnya bias dari penaksir regresi linier pada sampling kelompok adalah , bias ini akan menjadi kecil jika hubungan antara xi dan yi

mendekati linier. Penaksir regresi linier lebih efisien dibandingkan penaksir pada sampling kelompok karena kecuali .

Kata kunci: Pembelajaran matematika realistik, turnamen belajar, LKS, ekspositori, dan ketuntasan belajar siswa.

PENDAHULUAN

Sampel adalah sebagian anggota dari populasi yang dipilih dengan

menggunakan prosedur tertentu sehingga diharapkan dapat mewakili populasinya.

Banyak anggota sutau sampel disebut ukuran sampel, sedangkan suatu nilai yang

menggambarkan ciri sampel disebut statistik. Selain itu statistik juga berarti data

yang berupa angka hasil pencatatan atas suatu kejadian.

−−= )1(1)ˆ( 22

min ρylr Sn

fyV 2

)(1

x

ii

SXxeE

nf −− 222 )()1()( yylr S

NnnNyVS

NnnNyV −=⟨−−= ρ 0=ρ

3

Dalam mengolah data peneliti akan selalu berkepentingan untuk

menentukan hubungan antara dua atau lebih peubah. Hubungan tersebut mungkin

renggang atau mungkin pula erat. Pada satu pihak, dua peubah mungkin bebas satu

sama lain. Dalam keadaan seperti itu, korelasinya nol. Pada ekstrim yang lain, kedua

peubah bergantung sepenuhnya pada yang lain. Bila kedua peubah tersebut linier

keduanya disebut kolinear, maka harga mutlak korelasinya satu.

Dalam suatu keadaan model dapat menolong peneliti dalam menentukan

hubungan kausal antara dua atau lebih peubah. Hubungan kausal tentu saja

merupakan perhatian yang besar bagi tiap peneliti. Ada tidaknya hubungan kausal

antara peubah tidak dapat diputuskan dengan hanya menggunakan data statistik.

Secara umum, model merupakan penyederhanaan dan abstraksi dari keadaan

alam yang sesungguhnya. Keadaan alam yang ingin diteliti biasanya amat rumit dan

kemampuan menelitinya secara keseluruhan amat terbatas, karena itu kita perlu

menyederhanakannya, sesuai dengan kemampuan akal kita menghadapinya. Dari

pengalaman dimasa lalu atau dari dugaan mengenai hubungan antara peubah dalam

sistem yang diteliti, dirumuskan perkiraan kelakuan sistem tersebut dalam berbagai

situasi. Peneliti mengharapkan bahwa model tersebut merupakan teori tentang cara

kerja sistem yang dia teliti. Rumusan hubungan tersebut yang selanjutnya

dinyatakan dalam bentuk hipotesis seterusnya diuji berdasarkan data statistik yang

kemudian dikumpulkan. Pendekatan seperti ini sering disebut bersifat induksi,

sebagai lawan dari yang bersifat aksioma (deduksi).

Model yang dibicarakan disini akan selalu berbentuk fungsi dan regresi

merupakan alat yang ampuh dalam pembentukannya. Data yang dipakai mungkin

berasal dari percobaan dalam laboratorium (ada kontrol) ataupun dari lapangan

(survei). Kedua jenis data karena tidak lagi menggambarkan keadaan yang alamiah

tapi dimanipulasikan sesuai dengan tujuan pencoba. Peubah yang mengganggu

dibuat tidak berubah sehingga tidak berpengaruh. Jadi pengaruh peubah yang ingin

diselidiki lebih bersih dapat dipisahkan. Data survei menggambarkan keadaan yang

alamiah dan mengandung pengaruh banyak peubah yang bekerjasama secara amat

rumit. Kesimpulan yang dapat diperoleh daripadanya sering bersifat sementara,

sampai ada petunjuk lain yang lebih meyakinkan.

4

Teori statistika inferensi dapat didefinisikan sebagai metode untuk menarik

inferensi atau keputusan mengenai populasi. Salah satu masalah penting statistika

inferensi yang sering dijumpai dalam pengolahan data dari suatu percobaan atau

penelitian adalah penaksiran parameter populasinya. Pada umumnya parameter

populasi ini tidak diketahui. Penaksiran parameter bertujuan untuk memberikan

taksiran dari parameter yang didasarkan pada sampel. Sebagai contoh, sebuah

penelitian yang ingin mengetahui rata-rata berat badan anak-anak balita di

Indonesia, maka untuk menjawab dengan tepat hal di atas harus dilakukan

penimbangan berat badan terhadap seluruh anak-anak balita di Indonesia. Cara

seperti ini dinamakan sensus. Dengan cara sensus memang dapat diperoleh data

statistik yang tepat, tetapi biasanya sulit untuk dilakukan. Hal ini dikarenakan biaya

yang terlalu mahal, waktu yang relatif lama dan memerlukan tenaga yang banyak,

sehingga cara ini dianggap kurang ekonomis.

Berdasarkan hal di atas, maka dalam praktek sering digunakan sampel. Hasil

perhitungan sampel disebut statistik. Dari statistik ini diharapkan dapat memberikan

penaksiran yang baik dari parameternya, artinya nilai statistiknya tidak jauh

menyimpang dari parameternya. Dalam pengambilan sampel terdapat beberapa

metode antara lain; Sampling acak sederhana, sampling acak berlapis, sampling

kelompok dan lain-lain. Pada penulisan skripsi ini akan dibahas tentang penaksiran,

khususnya metode penaksiran regresi linier sederhana. Dalam pembahasannya

dibatasi pada sampling kelompok.

Alasan menggunakan metode penaksiran regresi linier ini karena metode ini

akan memberikan ketelitian penaksiran yang lebih baik dibandingkan dengan

menggunakan rata-rata sampel pada sampling kelompok. Penaksiran regresi linier

dapat dibuat untuk meningkatkan ketelitian dengan menggunakan variabel tambahan

xi yang berhubungan dengan yi, sedangkan lambang atau simbol yang digunakan

pada penulisan ini adalah huruf kapital untuk karakteristik populasi dan huruf kecil

untuk sampel. Notasi “ ^ ” ( topi ) adalah notasi taksiran karakteristik populasi yang

diperoleh dari sampel dan “” ( bar ) adalah notasi untuk rata-rata.

5

Dengan berdasarkan pada latar belakang di atas, maka perumusan masalah

yang diambil sebagai berikut;

1. Berapakah besarnya variansi minimum dari penaksir regresi linier pada

sampling kelompok?

2. Berapakah besarnya bias dari penaksir regresi linier sederhana?

3. Apakah penaksir regresi linier sederhana lebih efisien bila dibandingkan dengan

sampling kelompok ( cluster sampling )?

Tujuan yang ingin dicapai dalam penelitian ini adalah sebagai berikut.

1. Mengetahui besarnya variansi minimum dari penaksir regresi linier pada

sampling kelompok.

2. Mengetahui besarnya bias dari penaksir regresi linier sederhana.

3. Menunjukkan secara teoritis bahwa penaksir regresi linier sebagai penaksir yang

efisien pada kondisi tertentu.

Teori – teori pembelajaran yang terkait dengan perangkat pembelajaran yang

dikembangkan dalam penelitian ini.

Teori Penaksiran

Pengambilan sampel dari suatu populasi digunakan untuk menaksir parameter

yang tidak diketahui. Penaksir tersebut antara lain: rata-rata populasi, variansi

populasi, rasio populasi, dan total populasi, tetapi nilai statistik dari sampel tidaklah

tepat sama dengan parameternya. Meskipun demikian diharapkan bahwa statistik ini

dapat memberikan penaksiran terhadap parameter tersebut secara baik, artinya nilai

taksirannya tidak terlalu jauh menyimpang dari parameter yang sebenarnya. Statistik

yang digunakan untuk mendapat taksiran disebut sebagai penaksir. Jadi tidak dapat

diharapkan suatu penaksir akan menaksir parameter populasi tanpa kesalahan.

Tidak beralasan mengharapkan rata-rata sampel dapat menaksir rata-rata

populasi dengan tepat, tetapi tentunya diharapkan bahwa taksiran itu tidak terlalu

jauh menyimpang. Untuk suatu sampel tertentu, mungkin saja diperoleh taksiran

rata-rata populasi lebih dekat dengan mengambil median sampel sebagai penaksir.

Sebagai contoh, sampel yang terdiri atas nilai 2, 7, dan 9 yang diambil dari suatu

xµµ̂x~µObj110Obj111Obj112Obj113Obj114Obj115Obj116

6

populasi. Dimisalkan rata-ratanya tidak diketahui. Rata-rata populasi akan ditaksir

dengan = 6 bila menggunakan rata-rata sampel sebagai penaksir, atau bila

menggunakan median sampel sebagai penaksir. Dalam hal ini median sampel

menghasilkan taksiran yang lebih dekat ke parameter sesungguhnya daripada rata-

rata sampel . Sebaliknya bila sampel acaknya terdiri atas nilai 3, 6, dan 9, maka = 6

dan = 6, sehingga rata-rata samplesekarang menjadi penaksir yang lebih baik.

Penaksir berarti penduga suatu parameter dari populasi yang tidak diketahui.

Pada umumnya suatu penaksir dikatakan baik apabila memenuhi kriteria seperti: tak

bias, efisien dan konsisten.

a) Ketakbiasan

Misalkan suatu parameter dari populasi akan ditaksir dengan statistik .

Tentunya diinginkan distribusi sampel mempunyai ekspektasi yang sama

dengan yang ditaksir. Penaksir yang mempunyai sifat ini disebut penaksir tak

bias. Menurut definisi: Statistik dikatakan penaksir tak bias dari parameter yang

tidak diketahui bila E()=, sebaliknya statistik dikatakan bias dari parameter bila

E(). Selanjutnya E()= menyatakan besarnya bias. Statistik dikatakan bias positif

bila E() > dan bias negatif bila E() <.

Contoh :

a.1 Misalkan Y adalah suatu variabel random dengan rata-rata dan variansi 2.

Misalkan Y1, Y2, …, Yn adalah variabel random yang besarnya n dari Y, maka

rata-rata sampel adalah penaksir yang tak bias dari . Hal ini karena:

Karena , untuk semua i =1, 2, 3, …, n

Obj117Obj118Obj119Obj120Obj121Obj122Obj123Obj124Obj125Obj126Obj127Obj128Obj129Obj130Obj131Obj132Obj133Obj134

Obj135Obj136Obj137Obj138

Obj139

Obj140

7

Maka

a.2 Andaikan X1 , X2 , … , Xn variable random bebas, masing-masing

berdistribusi keduanya tidak diketahui. Carilah penaksir takbias untuk !

Penyelesaian: untuk.. Karena itu suatu penaksir takbias untuk .

b) Keefisienan

Sifat tak bias saja belum cukup selama variansi sebagai ukuran

penyebaran dari suatu penaksir tidak diketahui. Ini berarti diperlukan sifat

penaksir dengan variansi terkecil yang dinamakan sifat penaksir efisien.

Menurut definisi: Misalkan 1 dan 2 dua penaksir tak bias dari parameter

populasi yang sama. Bila variansi dari 1 lebih kecil daripada variansi 2 maka

dikatakan bahwa 1 penaksir yang lebih efisien daripada2.

Contoh :

Misalkan Y1, Y2, …, Yn adalah variabel random yang saling bebas dan

masing-masing mempunyai distribusi normal . Penaksir tak bias dari adalah

yaitu rata-rata dari sampel. Penaksir tak bias lainnya adalah yi untuk suatu

indeks i, yaitu sebuah observasi tunggal dari sampel tersebut. Tetapi adalah

penaksir dari yang lebih efisien daripada yi , karena:

.

c) Kekonsistenan

Obj141

Obj142Obj143

Obj144Obj145Obj146Obj147Obj148

Obj149Obj150Obj151Obj152Obj153Obj154Obj155


Obj161

8

Pada umumnya taksiran dari parameter yang dihitung dari sampel akan

berbeda dengan nilai parameter sebenarnya, akan tetapi diharapkan perbedaan

itu sangat kecil bila ukuran sampel diperbesar menjadi tak terbatas, dimana nilai

peluang dari penaksir akan menuju kesatu.

Menurut Definisi: Misalkan suatu penaksir dari populasi dikatakan

penaksir konsisten apabila: ( Walpole, R.E )

Biasanya sukar untuk membuktikan bahwa sebuah penaksir adalah

konsisten dengan menggunakan definisi diatas. Tetapi jika suatu penaksir adalah

tak bias dan mempunyai variansi yang cenderung menuju nol dengan sampel

yang besarnya mendekati tak terbatas adalah konsisten.

Contoh:

Misalkan Y1, Y2,…,, Yn adalah variabel random dimana saling bebas dan

masing-masing berdistribusi normal, makasebuah penaksir yang konsisten pada

rata-rata sebuah distribusi normal, karena adalah tak bias, maka

Untuk menaksir suatu parameter populasi yang tidak diketahui dapat

dilakukan dengan dua cara, yaitu:

1. Menaksir parameter populasi dengan satu nilai tertentu, ini disebut sebagai

penaksiran titik dan hasil penaksirannya dinamakan dengan taksiran titik.

2. Menaksir parameter dengan suatu interval tertentu, ini disebut dengan

penaksiran interval dan hasil penaksirannya disebut dengan taksiran interval.

Taksiran selang (Interval) suatu parameter populasi adalah suatu interval

yang berbentuk 1 < < 2 ,dengan 1 dan 2 tergantung pada nilai statistik . sebagai

contoh: untuk parameter akan terlihat bahwa 1 = dan 2 = , k ditentukan dari distribusi

Obj162Obj163

Obj164Obj165Obj166


Obj171Obj172Obj173Obj174Obj175Obj176Obj177Obj178Obj179Obj180Obj181Obj182Obj183Obj184Obj185Obj186Obj187Obj188Obj189Obj190Obj191Obj192Obj193Obj194Obj195Obj196Obj197Obj198Obj199Obj200Obj201Obj202Obj203Obj204

9

sampel . Jadi . Misalkan dari distribusi sampel dapat ditentukan 1 dan 2 dengan 1 < 2

sedemikian hingga P(1 < < 2 ) sama dengan nilai yang di inginkan. Misalkan 1 dan 2

dicari sehingga memenuhi P(1 < < 2 ) = 0,95. Artinya bahwa dengan peluang 0,95

sampel random yang diambil akan menghasilkan suatu interval yang mengandung .

Ini disebut interval kepercayaan 95%, artinya bahwa 95% interval mengandung

parameter yang sesungguhnya dari populasi. Pada umumnya distribusi

memungkinkan menghitung k sehingga: P( - k < < + k ) = 1 - dengan 0 < < 1.

Interval yang dihitung dari suatu sampel tetentu disebut interval kepercayaan

(1 - ) = 100%. Jadi bila = 0,05 diperoleh interval kepercayaan 95% dan bila = 0,01

diperoleh interval kepercayaan 99%. Pecahan 1 - disebut koefisien kepercayaan dan

- k dan + k disebut batas kepercayaan.

Sampling Kelompok (Cluster Sampling)

Sampel kelompok (Cluster sampling) ialah sampel acak sederhana dimana

setiap sampling unit terdiri dari kumpulan atau kelompok elemen, seperti misalnya

rumah tangga terdiri dari beberapa anggota rumah tangga, blok toko di pasar baru

Jakarta terdiri dari toko-toko, rayon sekolah terdiri dari beberapa sekolah, segmen

pasar terdiri dari banyak pembeli, bidang tanah terdiri dari ssbeberapa plot terdiri

dari beberapa pohon dan lain sebagainya.

Pengambilan sampel secara blok/kelompok mempunyai beberapa

keuntungan, antara lain: Tidak perlu disusun kerangka sampling di seluruh populasi

yang ingin diteliti cukup dibuat blok-blok yang ada dan biaya pendataan lebih

murah karena sampel yang terambil akan terletak pada jarak yang relatif berdekatan.

Sifat-sifat Penaksir

Ketelitian atau sering dinamakan dengan presisi dari suatu penaksir yang

dibuat berdasarkan sampel, tergantung pada metode penaksiran dan rencana

penarikan sampel. Sifat-sifat penaksir untuk sampling kelompok diberikan dalam

teorema berikut ini:

Teorema 1

Obj205Obj206Obj207Obj208Obj209Obj210

Obj211Obj212Obj213

10

Misalkanadalah rata-rata sampel yang dipilih n unit dari populasi berukuran

N, maka adalah penaksir tak bias dari yaitu rata-rata dari populasi

Bukti :

a) Tanpa Pengembalian

Dari definisi ekspektasi ( nilai harapan ) bahwa:

, untuk suatu i.

Dengan: Yj adalah nilai-nilai yi yang mungkin ( peubah acak diskrit )

Pj adalah peluang dari Yj (unsur ke-j dari populasi) terpilih sebagai sampel,

j = 1,2,3,…,N

Perhatikan bahwa suku pertama persamaan diatas menunjukkan peluang

Yj tidak terpilih sebagai sample pada pengambilan pertama, suku kedua

menunjukkan peluang bahwa Yj tidak terpilih sebagai sampel pada pengambilan

sampel berikutnya dan suku terakhir menunjukkan peluang bahwa Yj terpilih

sebagai sampel dari N–I+1, sisa elemen pada pengambilan sampel ke-i.

Dari E(), E dan Pj didapatkan:

b) Dengan Pengembalian

Obj214

Obj215

Obj216

Obj217Obj218

Obj219

Obj220Obj221

11

Ini berarti bahwa setiap unit akan muncul dalam jumlah sampel yang sama yaitu

Akibat dari Teorema 1

Misalkan adalah rata-rata sampel yang dipilih n unit dari populasi berukuran

N, maka adalah penaksir tak bias sari total populasi Y.

Bukti :

E() = E(N) = N E() = N = Y.

Variansi dari Penaksir

Dari teori sampling dikenal dua definisi variansi dari yi yaitu:

(1)

(2)

Definisi (1) diatas digunakan untuk menurunkan hasil teoritis sedangkan

definisi (2) banyak berkaitan dengan analisis variansi utamanya sifat ketakbiasan.

Teorema 2

Misalkan adalah rata-rata sampel berukuran n yang diambil dari populasi

berukuran N pada sampling kelompok, maka variansi dari adalah sebagi berikut:

a) Tanpa Pengembalian

Obj222

Obj223Obj224


Obj229Obj230

Obj231

Obj232Obj233

Obj234

12

Dimana f = n / N adalah fraksi penarikan sampel.

b) Dengan Pengembalian

Sedangkan Variansi dari penaksir total populasi adalah:

Untuk sampel berukuran n dari suatu populasi tak hingga, variansi rata-rata

sampel adalah . Hasil ini akan berubah jika populasi terbatas yaitu dengan

menambahkan yang disebut sebagai faktor koreksi populasi hingga (fpc). Untuk

populasi hingga fraksi sampling sangat kecil, maka . Jadi ukuran populasinya tidak

mempunyai pengaruh secara langsung terhadap kesalahan baku dari rata-rata sampel.

Dalam praktek fpc dapat diabaikan apabila

Teorema 3

Jika (yi, xi) adalah pasangan variabel yang didefinisikan pada setiap unit

populasi dan , adalah rata-rata sampling kelompok berukuran n, maka kovarian

darididefinisikan sebagai:

Dengan:

Penaksir Variansi

Rumus simpangan baku dari penaksir rata-rata populasi dan total populasi

digunakan terutama untuk tiga tujuan:

Obj235

Obj236Obj237


Obj243Obj244Obj245

Obj246

Obj247

13

1) Membandingkan presisi (ketelitian) yang diperoleh dari sampling kelompok

dengan metode sampling lainnya.

2) Untuk memperkirakan ukuran sampel yang dibutuhkan dalam suatu survei yang

telah direncanakan.

3) Untuk memperkirakan ketelitian sebenarnya yang didapat dalam suatu survei

yang telah dilaksanakan.

Pada umumnya dalam praktek S2 adalah variansi populasi tidak diketahui,

tetapi dapat ditaksir dari data sampel.

Teorema 4

Untuk sampling kelompok adalah penaksir tak bias dari

Akibat Teorema 4

Penaksir tak bias dari variansi adalah:

Sehingga penaksir tak bias dari variansi adalah:

Penaksir tak bias dari simpangan baku adalah:

Obj248

Obj249

Obj250

Obj251

Obj252

Obj253

Obj254

14

Penaksir tak bias dari simpangan bakuadalah:

Interval Kepercayaan

Taksiran selang (interval) suatu parameter populasi adalah suatu interval

yang berbentuk dengan dan tergantung pada nilai statistik. Bila sampel berasal

dari populasi normal atau bila tidak n cukup besar, selang kepercayaan untuk

dapat dibuat dengan menggunakan distribusi sampel. Dari teorema limit pusat

dikatakan jika sebuah populasi mempunyai rata-rata dan simpangan bakuyang

besarnya berhingga, maka untuk ukuran sampel random n cukup besar

berdistribusi rata-rata sampel mendekati distribusi normal dengan rata-rata dan

simpangan baku . Menurut teorema ini, distribusi sampel dapat diharapkan secara

hampiran berdistribusi normal dengan rataan dan simpangan baku . Dari teorema

limit pusat diketahui bahwa:, dengan Z merupakan distribusi normal dengan

rataan nol dan variansi satu.

Rata-rata sampel diperoleh dari sampel berukuran n. Dari tabel normal

diperoleh bahwa:

Obj255

Obj256Obj257

Obj258Obj259Obj260Obj261Obj262Obj263Obj264Obj265Obj266Obj267Obj268Obj269Obj270Obj271Obj272

Obj273

Obj274

Obj275

15

Suatu sampel random ukuran n diambil dari populasi dengan variansi yang

diketahui dan rataan yang dihitung sehingga menghasilkan selang kepercayaan

diberikan oleh: . Pada umumnya dalam praktek variansi populasi tidak diketahui,

sehingga ditaksir dari data sampel. Taksiran dari adalah . Selang kepercayaan untuk

rata-rata populasi pada sampling kelompok adalah:

, sebagai pendekatan dapat diambil: , dengan batas bawah kepercayaan untuk rata-

rata populasi dan merupakan batas atas kepercayaan untuk rata-rata populasi.

Selang kepercayaanuntuk total populasi Y pada sampling kelompok adalah:

Sebagai pendekatan dapat diambil:

Dari persamaan: batas bawah kepercayaan untuk total populasi dan

batas atas kepercayaan untuk total populasi. Dalam penyelesaian soal yang

diberikan pada skripsi ini menggunakan software Microsoft excel sebagai

pendukung untuk mempercepat perhitungan.

METODE PENELITIAN

Obj276Obj277Obj278Obj279Obj280Obj281Obj282Obj283


Obj288

Obj289

Obj290

Obj291

Obj292

16

Ruang Lingkupnya adalah regresi linier sederhana dan sampling acak

kelompok, Objek penelitian adalah perbedaan antara penaksiran regresi linier

dengan penaksiran pada sampling kelompok, Variabel/Fokus pembicaraan pada

skripsi ini mengenai penaksiran variable dependen pada regresi linier sederhana dan

berdasar rata-rata sampel kelompok. Kemudian penaksiran bias regresi linier,

penaksiran varians pada sampling kelompok dan penaksiran varians pada regresi

linier sederhana.

Taksiran berdasar regresi linier sederhana: , sedangkan berdasar rata-rata

sample kelompok: . Penaksiran bias dari regresi linier sederhana .

Untuk sampling kelompok variansi adalah penaksir takbias dari sehingga

penaksir variansi rata-rata sampel pada sampling kelompok adalah , sedangkan

variansi penaksir variansi regresi linier sederhana adalah .

Teknik dan Olah data

Metode yang dipakai dalam penulisan skripsi adalah studi pustaka,

merumuskan masalah, pengumpulan data, dan penyelesaian masalah.

HASIL DAN PEMBAHASAN

Regresi Linier Sederhana

Sering dalam praktek orang diminta untuk memecahkan persoalan yang

menyangkut sekelompok variabel bila diketahui bahwa diantara variabel tersebut

terdapat suatu hubungan yang tidak terpisahkan. Variabel-variabel tersebut

dinamakan variabel bebas dan variabel terikat atau respon. Hubungan antara

variabel bebas dan respon yang dicocokkan pada data suatu percobaan, ditandai

dengan persamaan prediksi yang disebut persamaan regresi. Bila y dan x masing-

masing tunggal, persoalannya menjadi regresi y pada x. Rataan berkaitan linier

Obj293Obj294Obj295



17

dengan x dalam bentuk persamaan linier populasi: , dengan dan merupakan dua

parameter yang akan ditaksir dari data sampel. Bila taksiran untuk kedua parameter

itu masing-masing dinyatakan dengan a dan b, maka bentuk persamaan garis regresi

berdasarkan sampel adalah:.

Bila hanya terdapat satu x dan satu y maka data berbentuk pasangan

pengamatan {(xi, yi) ; i= 1, 2, …, n}. Bila nilai x diatur, maka proses percobaan

menetapkan atau memilih nilai-nilai xi terlebih dahulu dan kemudian mengamati

nilai padananya yi . Bila dimisalkan bahwa semua rataan terletak pada satu garis

lurus, tiap Yi dapat ditulis sebagai model regresi linier sederhana yaitu: , dengan Ei

merupakan variabel random yang mempunyai rataan nol. Setiap pasangan

pengamatan (xi, yi) dalam sampel dengan distribusi normal, memenuhi hubungan:

dengan: nilai yang dicapai Ei bila Yi berharga yi . Jika menggunakan persamaan

regresi, estimasi dari y adalah , sehingga tiap pasangan pengamatan memenuhi: yi =

a + bxi + ei , dengan yang disebut sisa.

Untuk memperkirakan a dan b digunakan metode kuadrat terkecil sehingga

jumlah kuadrat dari simpangan antara observasi-observasi dan garis regresi menjadi

minimum. Dengan menggunakan metode kuadrat terkecil maka sifat dari penaksir

yang diperoleh adalah tak bias dan mempunyai variansi minimum: . Persamaan yi =

a + bxi + ei dapat juga ditulis sebagai berikut: , dengan . Dan jumlah sisanya menjadi

. Bila L diturunkan terhadap ai dan b, maka diperoleh: dan Penyederhanaan kedua

persamaan tersebut di atas menghasilkan: dan , karena , maka dari dua persamaan

di atas diperoleh: , sehingga Dan, sehingga .

Penaksir Regresi Linier Sederhana

Penaksir terhadap karakteristik dari suatu populasi dapat dilakukan dengan

menggunakan rata-rata sampel. Setelah suatu sampel dipilih dengan salah satu


Obj312Obj313Obj314Obj315Obj316Obj317Obj318Obj319Obj320Obj321Obj322Obj323Obj324Obj325

Obj326Obj327

18

metode sampling, kemudian dihitung rata-rata sampel yang digunakan untuk

menaksir rata-rata populasi .

Pada bab pendahuluan telah disinggung salah satu alasan mengapa

menggunakan metode penaksiran regresi linier, karena metode penaksiran regresi

linier akan memberikan ketelitian yang lebih baik dibandingkan penaksiran dengan

menggunakan rata-rata sampel . Hal ini akan dijelaskan pada sub bab 4.7 tentang

efisiensi metode penaksiran regresi linier, dan akan diberikan contoh yang

memperlihatkan bahwa penaksiran regresi linier memberikan ketelitian yang lebih

baik dibandingkan penaksiran dengan menggunakan rata-rata sampel .

Misalkan populasi terdiri dari N unit dengan harga (xi , yi), dimana xi >0,

untuk . Dimisalkan bahwa xi dan yi masing-masing diperoleh untuk setiap unit

dalam sampel dan rata-rata populasi dari xi diketahui. Penaksir regresi linier , rata-

rata populasi yi , didefinisikan sebagai: , dengan menyatakan regresi linier

danpenaksir perubahan y bila x bertambah. Penaksir jumlah populasi Y,

didefinisikan sebagai .

Penaksir regresi linier dapat membantu menyelesaikan masalah penaksiran

suatu parameter.

Contoh 1:

Tabel berikut ini menunjukkan jumlah penduduk (dalam ribuan) untuk

setiap sample random dari 49 kota yang diambil dari populasi 196 kota. Misalkan xi

menyatakan banyaknya penduduk pada tahun 1920 dan yi menyatakan banyaknya

penduduk pada tahun 1930. Apabila jumlah penduduk tahun 1920. X diketahui

yakni 22.919 jiwa. Berapakah perkiraan jumlah penduduk dari 196 kota tersebut

pada tahun 1930? Jumlah seluruh penduduk yang sebenarnya pada tahun 1930 untuk

196 kota adalah 29.351 jiwa.

xi Yi xi Yi Xi yi Xi yi76 80 2 50 243 291 138 143507 634 87 105 67 67 179 26030 111 29 50 121 113 71 79

Obj328Obj329

Obj330Obj331Obj332Obj333Obj334Obj335Obj336

19

381 464 50 64 256 288 23 4844 58 43 61 37 63 77 8925 57 120 115 64 63 94 8561 69 64 77 43 50 387 45956 142 298 317 93 104 40 6036 46 172 183 40 64 161 23278 106 38 52 74 93 66 86136 139 45 53 60 57 116 13036 54 46 65 46 53 50 5848 75

Dari data tersebut diatas diperoleh:

x = 5.054 y = 6.262 =103,1 = 127,8

n = 49 N = 196 X = 22.919 = 1,16

Penaksir regresi liniernya:

= 127,1 + 1,16(116,9 – 103,1) = 144 jiwa.

Taksiran total jumlah penduduk pada tahun 1930 untuk seluruh kota adalah:

= (196)(144) = 28.224 jiwa

Taksiran berdasarkan atas rata-rata sampel adalah:

= (196)(127,8) = 25.048 jiwa

Contoh 2:

Sensus penduduk propinsi Jawa Tengah tahun 1980 versus tahun 1990.

Misalkan xi menyatakan jumlah penduduk hasil sensus tahun 1980 dan yi

menyatakan jumlah penduduk hasil sensus tahun 1980 yang diambil dari 15

kabupaten (dalam ribuan). Apabila jumlah penduduk hasil sensus tahun 1980, X

Obj337Obj338

Obj339

Obj340

Obj341

Obj342

20

diketahui yakni 25.373 jiwa. Berapakah perkiraan jumlah penduduk hasil sensus

tahun 1990? Jumlah seluruh penduduk yang sebenarnya pada tahun 1990 untuk 35

Kabupaten adalah 28.522 jiwa.

Xi Yi Xi Yi xi yi1013 1148 674 823 706 786536 631 697 701 556 617123 123 1100 1239 700 8281027 1251 652 700 600 666976 1064 1225 1349 935 1016

Dari data tersebut diatas diperoleh:

x = 11.520 = 768 y = 12.942 = 862,8

n = 15 N = 35 = 1,13 X = 25.373

Penaksir regresi liniernya:

= 862,8 + 1,13(724,9 – 763) = 814 jiwa.

Taksiran total jumlah penduduk pada tahun 1990 untuk seluruh kabupaten adalah:

= (35)(814) = 28.490 jiwa.

Taksiran berdasarkan atas rata-rata sampel adalah:

= N = (35)(862,8) = 30.198 jiwa

Dari contoh diatas terlihat bahwa penaksir regresi linier memberikan ketelitian yang

lebih baik bila dibandingkan dengan menggunakan rata-rata sampel.

Penkasiran Regresi Linier dengan telah ditentukan lebih dahulu

Obj343Obj344

Obj345

Obj346

Obj347

Obj348Obj349

Obj350

21

Meskipun dalam aplikasi, dihitung dari sampel, kadang-kadang bisa juga

untuk memilih lebih dahulu. Dalam sampling berulang, perhitungan sebelumnya

dapat memperkirakan bahwa nilai hampir konstan.

Teorema 4.3.1

Pada sampling kelompok, dimana bo adalah konstan yang ditentukan lebih dahulu,

penaksir regresi liniernya adalah: adalah tak bias, dengan variansinya adalah:

Bukti:

Setelah diketahui persamaan regresi liniernya dan b0 konstan pada penarikan sampel

berulang maka diperoleh:

Jadi menurut teorema 1 pada bahasan tentang sifat-sifat penaksir yang

mengatakan bahwa jika tanpa pengembalian dan dengan pengembalian . Ini berarti

adalah penaksir tak bias dari.

Dengan dan , sehingga menurut teorema 2 diperoleh:

Obj351Obj352Obj353

Obj354

Obj355

Obj356


Obj361Obj362

Obj363

22

Salah satu tujuan dari penaksiran adalah untuk meningkatkan ketelitian atau

meminimumkan variansi. Nilai minimum bila:

,

b0 disebut sebagai koefisien regresi linier dari y pada x dalam populasi terbatas. Nilai

variansi minimumnya adalah: , dengan adalah koefisien korelasi antara y dan x.

Dari teorema 4.3.2 terlihat bahwa variansi dari penaksir regresi linier akan minimum

jika . Dari persamaan , jika = 0, maka tidak terdapat hubungan linier antara variabel

x dan y dan variansi dari penaksir regresi linier sama dengan penaksir pada

sampling acak kelompok, tetapi jika = 1, maka terdapat hubungan linier sempurna

antara variabel x dan y, dan variansi dari penaksir regresi linier besarnya nol. Ini

berarti titik-titik sampel (xi, yi) terletak pada garis lurus yang menghubungkan

antara variabel x dan y.

Obj364

Obj365

Obj366

Obj367

Obj368

Obj369Obj370


Obj375

23

Penaksiran regresi linier jika dihitung dari sampel

Dari teori regresi linier diketahui bahwa penaksir sampel yang efektif adalah

dengan metode kuadrat terkecil dari B, yaitu:

Dengan: xi = x1 , x2 , …, xn dan yi = y1 , y2 , …, yn adalah nilai sampel.

Teorema 4.3.3

Jika adalah penaksir kuadrat terkecil dari B dan pada sampling acak kelompok

berukuran n, dengan n besar, maka:

dengan adalah koefisien korelasi antara y dan x.

Taksiran Variansi dari Sampel

Rumus di atas dihitung berdasarkan pada nilai-nilai dari populasi. Sekarang

akan dicari taksiran dari yang dihitung berdasarkan atas nilai-nilai dari sampel. Di

atas diketahui bahwa rumus variansi regresi linier yang dihitung berdasarkan pada

nilai-nilai dari populasi adalah:

taksiran dari dinotasikan dengan, sehingga:

Obj376

Obj377Obj378Obj379

Obj380

Obj381Obj382

Obj383

Obj384Obj385

Obj386

24

Bias Dari Penaksir Regresi Linier

Pada umumnya penaksir regresi linier adalah suatu penaksir yang bias dari .

Berikut ini akan dibahas bias dari penaksir regresi linier. Dari persamaan regresi

linier diperoleh:

sehingga bias dari adalah

Misalkan variabel ei didefinisikan sebagai:

dari persamaan diatas substitusikan ke persamaan , diperoleh:

Obj387

Obj388Obj389Obj390

Obj391

Obj392

Obj393Obj394

Obj395

Obj396

Obj397

Obj398

25

sehingga

ruas kanan persamaan diatas dimanipulasi didapatkan:

dan

setelah itu kita masukkan ke kovariannya

karena , maka dari persamaan diatas diperoleh:

misalkan maka diperoleh:

Obj399

Obj400

Obj401Obj402

Obj403

Obj404

Obj405

Obj406

Obj407

Obj408

Obj409

26

dari teorema 2.2.3 diperoleh:

Suku ini merupakan komponen kuadaratik dari regresi linier yi pada xi . Jadi jika

diplot yi dan xi mendekati linier, maka bias dari menjadi kecil.

Efisiensi Metode Penaksiran Regresi Linier

Efisiensi suatu penaksir hanya dapat dilakukan dengan

membandingkan variansinya. Suatu penaksir dikatakan lebih efisien bilamana

variansinya lebih kecil. Dalam hal ini akan dilihat efisiensi dari metode penaksiran

regresi linier bila dibandingkan dengan penaksiran pada sampling kelompok, yaitu

pada rata-rata populasinya. Dan juga akan dilihat persyaratan apakah suatu penaksir

regresi linier memberikan ketelitian yang lebih baik. Untuk perbandingan ini ukuran

sample n harus cukup besar sehingga pendekatan rumus untuk variansi regresi

berlaku.

Dari teorema 2.2.1 dan teorema 2.2.2 diperoleh bahwa adalah penaksir tak

bias dari rata-rata populasi dan variansi dari didefinisikan sebagai:

. Sedangkan dari teorema 4.3.3 diperoleh bahwa variansi dari adalah:

Obj410

Obj411

Obj412

Obj413Obj414Obj415

Obj416Obj417Obj418


27

Penaksir regresi linier dikatakan lebih baik (efisien) dibandingkan penaksir

pada sampling kelompok apabila Dari dua persamaan diatas diperoleh bahwa: .

Dari persamaan ini terlihat bahwa: kedua variansi ini sama. Ini ekuivalen dengan

mengatakan bahwa lebih efisien dibandingkan , kecuali . Jadi penaksir regresi linier

lebih efisien dibandingkan penaksir pada sampling kelompok. Apabila tidak ada

hubungan linier antara variabel y dan x maka penaksir regresi linier sama dengan

penaksir pada sampling kelompok.

Contoh 1.

Seorang pemilik perkebunan kopi membuat taksiran dengan melihat (tanpa

ditimbang) berat kopi yang dihasilkan xi pada setiap pohon kopi dari N = 200. Dia

memperoleh berat total X = 11.600. Dari suatu sampel acak yang terdiri atas 10

pohon kopi diperoleh hasil sebagai berikut:

Nomor Pohon 1 2 3 4 5 6 7 8 9 10 TotalBerat sebenarnya yi 61 42 50 58 67 45 39 57 71 53 543Berat taksiran xi 59 47 52 60 67 48 44 58 76 58 569

Data dasar yang dipunyai adalah sebagai berikut:

Dari data tersebut diatas maka diperoleh:

1. Penaksir varians regresi linier

2. Penaksir varians rata-rata sampel

Contoh 2:

Data berikut menyatakan banyaknya penduduk dari suatu sampel acak

terdiri dari 7 kota yang dipilih dari 28 kota. Misalkan xi menyatakan banyaknya

penduduk pada tahun 1970 dan yi menyatakan banyaknya penduduk pada tahun

Obj425Obj426

Obj427

Obj428

28

1980 (dalam ribuan). Bila diketahui total penduduk tahun 1970 yakni sebesar X =

3.273

1 2 3 4 5 6 7xi (1970) 76 138 67 29 381 23 37yi (1980) 80 143 67 50 464 48 63

Data dasar yang dipunyai adalah sebagai berikut:

Dari data diatas diperoleh:

1. Penaksir varians regresi linier

2. Penaksir varians rata-rata sampel

Dari contoh diatas terlihat bahwa variansi penaksir regresi linier lebih kecil

dibandingkan penaksir rata-rata sampel.

Interval kepercayaan Penaksir Regresi Linier

Taksiran selang (Interval) suatu parameter populasi adalah suatu interval yang

berbentuk dengan dan tergantung pada nilai statistik. Pada bab teori pendukung

telah disinggung tentang interval kepercayaan dari sampling kelompok. Sekarang

akan dibahas tentang interval kepercayaan dari penaksir regresi linier.

Dengan dasar bahwa interval kepercayaan untuk rata-rata populasi pada

sampling kelompok adalah:. Dari teorema 4.3.3 diketahui bahwa variansi dari

Obj429

Obj430

Obj431



29

penaksir regresi linier untuk sampel berukuran n dengan n besar adalah: , selang

kepercayaan 100 % untuk rata-rata populasi dari penaksir regresi linier adalah:

Sebagai pendekatan yang diambil:

batas bawah kepercayaan untuk rata-rata populasi dari penaksir regresi linier dan

batas atas kepercayaan untuk rata-rata populasi dari penaksir regresi linier.

SIMPULAN DAN SARAN

Simpulan

Dari hasil pembahasan diatas diperoleh kesimpulan sebagai berikut:

1. Jika adalah penaksir kuadrat terkecil dari B, maka besarnya variansi dari

penaksir regresi linier pada sampling kelompok dengan sampel berukuran besar

adalah , ini merupakan variansi minimum dari penaksir regresi linier.

2. Besarnya bias dari penaksir regresi linier pada sampling kelompok adalah , bias

ini akan menjadi kecil jika hubungan antara xi dan yi mendekati linier.

3. Penaksir regresi linier lebih efisien dibandingkan penaksir pada sampling

kelompok karena kecuali .

Saran

Obj441

Obj442

Obj443Obj444

Obj445Obj446

Obj447

Obj448Obj449

30

1. Pada penulisan skripsi ini secara teoritis hanya ditunjukkan hubungan mengenai

xi dan yi sedangkan bagaimana garis yang menghubungkan antara xi dan yi perlu

penelitian lebih lanjut.

2. Pada penulisan skripsi ditunjukkan secara teoritis dan sofware Microsoft excel

bahwa penaksir regresi linier lebih efisien dibandingkan penaksir pada sampling

kelompok dan ini perlu penelitian lebih lanjut tentang studi empiris dengan

menggunakan sofware komputer yang lain. Hal ini dimaksudkan untuk lebih

mendalami dan menghayati tentang hasil-hasil yang diperoleh secara lebih baik.

DAFTAR PUSTAKA

Cochran, W.G. 1991. Sampling Tecniques. ( Terjemahan Rusdiansyah ). Jakarta: UI.

Darwis, Sutawanir. 1986. Buku Materi Pokok Survei Sampel 1-10. Jakarta: Karunika.

Djarwanto. 1993. Statistik Induktif. Yogyakarta: BPFE.

Hines, W.W. and Montgomery, D.C. 1990. Probability and Statistics in Engineering

and Management Science ( Terjemahans Rusdiansyah ). Jakarta: UI.

Sembiring, R.K. 1995. Analisis Regresi. Bandung: ITB.

Supranto, J. 1986. Pengantar Probabilitas dan Statistik Induktif. Jakarta: Erlangga.

Walpole, R.E. and Myers R.H. 1972 Probability and Statistics for Engineering and

Scientists. ( Terj. Sembiring ). Bandung: ITB.

Sugiarto, Dergibson Siagan, Lasmono Tri Sunaryanto dan Oetomo, Denny S.2001.

Teknik Sampling, Jakarta: PT Gramedia Pustaka Utama.

Sudjana. 1996. Metode Statistika. Bandung: Tarsito.

Sukatmi, Pandurang V and Balkrishna.1970. Sampling Theory of Surveys with

Applications, USA: Lowa State University Press.

Supranto, J. 2001. Statistik Teori dan Aplikasi. Jakarta: Erlangga.

Supranto, J.2000. Teknik Sampling Untuk Survey dan Eksperimen, Jakarta: PT Rineka

Cipta.

Download - ANALISIS PENAKSIRAN REGRESI LINIER PADA …digilib.unimus.ac.id/files/disk1/129/jtptunimus-gdl-iswahyudij... · meningkatkan ketelitian penaksiran dengan memanfaatkan hubungan antara

Top Related