ANALISIS PENAKSIRAN REGRESI LINIER
PADA SAMPLING KELOMPOK
ARTIKEL
Oleh
ISWAHYUDI JOKO S, S.Si, M.Pd
PROGRAM STUDI PENDIDIKAN MATEMATIKA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS MUHAMMADIYANEGERI SEMARANG
2012
2
ANALISIS PENAKSIRAN REGRESI LINIERPADA SAMPLING KELOMPOK
Iswahyudi Joko Suprayitno
Abstrak
Analisis penaksiran regresi linier merupakan salah satu cara estimasi untuk meningkatkan ketelitian penaksiran dengan memanfaatkan hubungan antara variabel x dan y agar kedua variabel tersebut mendekati linier. Dalam skripsi ini akan dibicarakan analisis penaksiran regresi linier pada sampling kelompok.
Permasalahan dalam penelitian ini adalah:1. Berapakah besarnya variansi minimum dari penaksir regresi linier pada
sampling kelompok?2. Berapakah besarnya bias dari penaksir regresi linier sederhana?
3. Apakah regresi linier sederhana lebih efisien bila dibandingkan dengan sampling kelompok ( cluster sampling )?Tujuan penelitian ini adalah untuk mengetahui besarnya variansi minimum dari penaksir regresi linier pada sampling kelompok, mengetahui besarnya bias dari penaksir regresi linier sederhana dan menunjukkan secara teoritis bahwa penaksir regresi linier sederhana sebagai penaksir yang efisien pada kondisi tertentu.
Penelitian ini meliputi ruang lingkup yaitu regresi linier sederhana dan sampling kelompok. Objek penelitiannya adalah perbedaan antara penaksiran regresi linier sederhana dengan penaksiran pada sampling kelompok. Variabel/fokus pembicaraan dari penelitian ini yaitu penaksiran variabel dependen pada regresi linier sederhana, penaksiran variabel dependen pada rata-rata sampel, penaksiran bias pada regresi linier, penaksiran varians pada sampling kelompok dan penaksiran varians pada regresi linier sederhana. Teknik dan olah data dengan menggunakan studi pustaka, perumusan masalah, pengumpulan data dan penyelesaian masalah.
Simpulan dari penelitian ini yaitu besarnya variansi minimum dari penaksir regresi linier pada sampling kelompok . Besarnya bias dari penaksir regresi linier pada sampling kelompok adalah , bias ini akan menjadi kecil jika hubungan antara xi dan yi
mendekati linier. Penaksir regresi linier lebih efisien dibandingkan penaksir pada sampling kelompok karena kecuali .
Kata kunci: Pembelajaran matematika realistik, turnamen belajar, LKS, ekspositori, dan ketuntasan belajar siswa.
PENDAHULUAN
Sampel adalah sebagian anggota dari populasi yang dipilih dengan
menggunakan prosedur tertentu sehingga diharapkan dapat mewakili populasinya.
Banyak anggota sutau sampel disebut ukuran sampel, sedangkan suatu nilai yang
menggambarkan ciri sampel disebut statistik. Selain itu statistik juga berarti data
yang berupa angka hasil pencatatan atas suatu kejadian.
−−= )1(1)ˆ( 22
min ρylr Sn
fyV 2
)(1
x
ii
SXxeE
nf −− 222 )()1()( yylr S
NnnNyVS
NnnNyV −=⟨−−= ρ 0=ρ
3
Dalam mengolah data peneliti akan selalu berkepentingan untuk
menentukan hubungan antara dua atau lebih peubah. Hubungan tersebut mungkin
renggang atau mungkin pula erat. Pada satu pihak, dua peubah mungkin bebas satu
sama lain. Dalam keadaan seperti itu, korelasinya nol. Pada ekstrim yang lain, kedua
peubah bergantung sepenuhnya pada yang lain. Bila kedua peubah tersebut linier
keduanya disebut kolinear, maka harga mutlak korelasinya satu.
Dalam suatu keadaan model dapat menolong peneliti dalam menentukan
hubungan kausal antara dua atau lebih peubah. Hubungan kausal tentu saja
merupakan perhatian yang besar bagi tiap peneliti. Ada tidaknya hubungan kausal
antara peubah tidak dapat diputuskan dengan hanya menggunakan data statistik.
Secara umum, model merupakan penyederhanaan dan abstraksi dari keadaan
alam yang sesungguhnya. Keadaan alam yang ingin diteliti biasanya amat rumit dan
kemampuan menelitinya secara keseluruhan amat terbatas, karena itu kita perlu
menyederhanakannya, sesuai dengan kemampuan akal kita menghadapinya. Dari
pengalaman dimasa lalu atau dari dugaan mengenai hubungan antara peubah dalam
sistem yang diteliti, dirumuskan perkiraan kelakuan sistem tersebut dalam berbagai
situasi. Peneliti mengharapkan bahwa model tersebut merupakan teori tentang cara
kerja sistem yang dia teliti. Rumusan hubungan tersebut yang selanjutnya
dinyatakan dalam bentuk hipotesis seterusnya diuji berdasarkan data statistik yang
kemudian dikumpulkan. Pendekatan seperti ini sering disebut bersifat induksi,
sebagai lawan dari yang bersifat aksioma (deduksi).
Model yang dibicarakan disini akan selalu berbentuk fungsi dan regresi
merupakan alat yang ampuh dalam pembentukannya. Data yang dipakai mungkin
berasal dari percobaan dalam laboratorium (ada kontrol) ataupun dari lapangan
(survei). Kedua jenis data karena tidak lagi menggambarkan keadaan yang alamiah
tapi dimanipulasikan sesuai dengan tujuan pencoba. Peubah yang mengganggu
dibuat tidak berubah sehingga tidak berpengaruh. Jadi pengaruh peubah yang ingin
diselidiki lebih bersih dapat dipisahkan. Data survei menggambarkan keadaan yang
alamiah dan mengandung pengaruh banyak peubah yang bekerjasama secara amat
rumit. Kesimpulan yang dapat diperoleh daripadanya sering bersifat sementara,
sampai ada petunjuk lain yang lebih meyakinkan.
4
Teori statistika inferensi dapat didefinisikan sebagai metode untuk menarik
inferensi atau keputusan mengenai populasi. Salah satu masalah penting statistika
inferensi yang sering dijumpai dalam pengolahan data dari suatu percobaan atau
penelitian adalah penaksiran parameter populasinya. Pada umumnya parameter
populasi ini tidak diketahui. Penaksiran parameter bertujuan untuk memberikan
taksiran dari parameter yang didasarkan pada sampel. Sebagai contoh, sebuah
penelitian yang ingin mengetahui rata-rata berat badan anak-anak balita di
Indonesia, maka untuk menjawab dengan tepat hal di atas harus dilakukan
penimbangan berat badan terhadap seluruh anak-anak balita di Indonesia. Cara
seperti ini dinamakan sensus. Dengan cara sensus memang dapat diperoleh data
statistik yang tepat, tetapi biasanya sulit untuk dilakukan. Hal ini dikarenakan biaya
yang terlalu mahal, waktu yang relatif lama dan memerlukan tenaga yang banyak,
sehingga cara ini dianggap kurang ekonomis.
Berdasarkan hal di atas, maka dalam praktek sering digunakan sampel. Hasil
perhitungan sampel disebut statistik. Dari statistik ini diharapkan dapat memberikan
penaksiran yang baik dari parameternya, artinya nilai statistiknya tidak jauh
menyimpang dari parameternya. Dalam pengambilan sampel terdapat beberapa
metode antara lain; Sampling acak sederhana, sampling acak berlapis, sampling
kelompok dan lain-lain. Pada penulisan skripsi ini akan dibahas tentang penaksiran,
khususnya metode penaksiran regresi linier sederhana. Dalam pembahasannya
dibatasi pada sampling kelompok.
Alasan menggunakan metode penaksiran regresi linier ini karena metode ini
akan memberikan ketelitian penaksiran yang lebih baik dibandingkan dengan
menggunakan rata-rata sampel pada sampling kelompok. Penaksiran regresi linier
dapat dibuat untuk meningkatkan ketelitian dengan menggunakan variabel tambahan
xi yang berhubungan dengan yi, sedangkan lambang atau simbol yang digunakan
pada penulisan ini adalah huruf kapital untuk karakteristik populasi dan huruf kecil
untuk sampel. Notasi “ ^ ” ( topi ) adalah notasi taksiran karakteristik populasi yang
diperoleh dari sampel dan “” ( bar ) adalah notasi untuk rata-rata.
5
Dengan berdasarkan pada latar belakang di atas, maka perumusan masalah
yang diambil sebagai berikut;
1. Berapakah besarnya variansi minimum dari penaksir regresi linier pada
sampling kelompok?
2. Berapakah besarnya bias dari penaksir regresi linier sederhana?
3. Apakah penaksir regresi linier sederhana lebih efisien bila dibandingkan dengan
sampling kelompok ( cluster sampling )?
Tujuan yang ingin dicapai dalam penelitian ini adalah sebagai berikut.
1. Mengetahui besarnya variansi minimum dari penaksir regresi linier pada
sampling kelompok.
2. Mengetahui besarnya bias dari penaksir regresi linier sederhana.
3. Menunjukkan secara teoritis bahwa penaksir regresi linier sebagai penaksir yang
efisien pada kondisi tertentu.
Teori – teori pembelajaran yang terkait dengan perangkat pembelajaran yang
dikembangkan dalam penelitian ini.
Teori Penaksiran
Pengambilan sampel dari suatu populasi digunakan untuk menaksir parameter
yang tidak diketahui. Penaksir tersebut antara lain: rata-rata populasi, variansi
populasi, rasio populasi, dan total populasi, tetapi nilai statistik dari sampel tidaklah
tepat sama dengan parameternya. Meskipun demikian diharapkan bahwa statistik ini
dapat memberikan penaksiran terhadap parameter tersebut secara baik, artinya nilai
taksirannya tidak terlalu jauh menyimpang dari parameter yang sebenarnya. Statistik
yang digunakan untuk mendapat taksiran disebut sebagai penaksir. Jadi tidak dapat
diharapkan suatu penaksir akan menaksir parameter populasi tanpa kesalahan.
Tidak beralasan mengharapkan rata-rata sampel dapat menaksir rata-rata
populasi dengan tepat, tetapi tentunya diharapkan bahwa taksiran itu tidak terlalu
jauh menyimpang. Untuk suatu sampel tertentu, mungkin saja diperoleh taksiran
rata-rata populasi lebih dekat dengan mengambil median sampel sebagai penaksir.
Sebagai contoh, sampel yang terdiri atas nilai 2, 7, dan 9 yang diambil dari suatu
xµµ̂x~µObj110Obj111Obj112Obj113Obj114Obj115Obj116
6
populasi. Dimisalkan rata-ratanya tidak diketahui. Rata-rata populasi akan ditaksir
dengan = 6 bila menggunakan rata-rata sampel sebagai penaksir, atau bila
menggunakan median sampel sebagai penaksir. Dalam hal ini median sampel
menghasilkan taksiran yang lebih dekat ke parameter sesungguhnya daripada rata-
rata sampel . Sebaliknya bila sampel acaknya terdiri atas nilai 3, 6, dan 9, maka = 6
dan = 6, sehingga rata-rata samplesekarang menjadi penaksir yang lebih baik.
Penaksir berarti penduga suatu parameter dari populasi yang tidak diketahui.
Pada umumnya suatu penaksir dikatakan baik apabila memenuhi kriteria seperti: tak
bias, efisien dan konsisten.
a) Ketakbiasan
Misalkan suatu parameter dari populasi akan ditaksir dengan statistik .
Tentunya diinginkan distribusi sampel mempunyai ekspektasi yang sama
dengan yang ditaksir. Penaksir yang mempunyai sifat ini disebut penaksir tak
bias. Menurut definisi: Statistik dikatakan penaksir tak bias dari parameter yang
tidak diketahui bila E()=, sebaliknya statistik dikatakan bias dari parameter bila
E(). Selanjutnya E()= menyatakan besarnya bias. Statistik dikatakan bias positif
bila E() > dan bias negatif bila E() <.
Contoh :
a.1 Misalkan Y adalah suatu variabel random dengan rata-rata dan variansi 2.
Misalkan Y1, Y2, …, Yn adalah variabel random yang besarnya n dari Y, maka
rata-rata sampel adalah penaksir yang tak bias dari . Hal ini karena:
Karena , untuk semua i =1, 2, 3, …, n
Obj117Obj118Obj119Obj120Obj121Obj122Obj123Obj124Obj125Obj126Obj127Obj128Obj129Obj130Obj131Obj132Obj133Obj134
Obj135Obj136Obj137Obj138
Obj139
Obj140
7
Maka
a.2 Andaikan X1 , X2 , … , Xn variable random bebas, masing-masing
berdistribusi keduanya tidak diketahui. Carilah penaksir takbias untuk !
Penyelesaian: untuk.. Karena itu suatu penaksir takbias untuk .
b) Keefisienan
Sifat tak bias saja belum cukup selama variansi sebagai ukuran
penyebaran dari suatu penaksir tidak diketahui. Ini berarti diperlukan sifat
penaksir dengan variansi terkecil yang dinamakan sifat penaksir efisien.
Menurut definisi: Misalkan 1 dan 2 dua penaksir tak bias dari parameter
populasi yang sama. Bila variansi dari 1 lebih kecil daripada variansi 2 maka
dikatakan bahwa 1 penaksir yang lebih efisien daripada2.
Contoh :
Misalkan Y1, Y2, …, Yn adalah variabel random yang saling bebas dan
masing-masing mempunyai distribusi normal . Penaksir tak bias dari adalah
yaitu rata-rata dari sampel. Penaksir tak bias lainnya adalah yi untuk suatu
indeks i, yaitu sebuah observasi tunggal dari sampel tersebut. Tetapi adalah
penaksir dari yang lebih efisien daripada yi , karena:
.
c) Kekonsistenan
Obj141
Obj142Obj143
Obj144Obj145Obj146Obj147Obj148
Obj149Obj150Obj151Obj152Obj153Obj154Obj155
Obj156Obj157Obj158Obj159Obj160
Obj161
8
Pada umumnya taksiran dari parameter yang dihitung dari sampel akan
berbeda dengan nilai parameter sebenarnya, akan tetapi diharapkan perbedaan
itu sangat kecil bila ukuran sampel diperbesar menjadi tak terbatas, dimana nilai
peluang dari penaksir akan menuju kesatu.
Menurut Definisi: Misalkan suatu penaksir dari populasi dikatakan
penaksir konsisten apabila: ( Walpole, R.E )
Biasanya sukar untuk membuktikan bahwa sebuah penaksir adalah
konsisten dengan menggunakan definisi diatas. Tetapi jika suatu penaksir adalah
tak bias dan mempunyai variansi yang cenderung menuju nol dengan sampel
yang besarnya mendekati tak terbatas adalah konsisten.
Contoh:
Misalkan Y1, Y2,…,, Yn adalah variabel random dimana saling bebas dan
masing-masing berdistribusi normal, makasebuah penaksir yang konsisten pada
rata-rata sebuah distribusi normal, karena adalah tak bias, maka
Untuk menaksir suatu parameter populasi yang tidak diketahui dapat
dilakukan dengan dua cara, yaitu:
1. Menaksir parameter populasi dengan satu nilai tertentu, ini disebut sebagai
penaksiran titik dan hasil penaksirannya dinamakan dengan taksiran titik.
2. Menaksir parameter dengan suatu interval tertentu, ini disebut dengan
penaksiran interval dan hasil penaksirannya disebut dengan taksiran interval.
Taksiran selang (Interval) suatu parameter populasi adalah suatu interval
yang berbentuk 1 < < 2 ,dengan 1 dan 2 tergantung pada nilai statistik . sebagai
contoh: untuk parameter akan terlihat bahwa 1 = dan 2 = , k ditentukan dari distribusi
Obj162Obj163
Obj164Obj165Obj166
Obj167Obj168Obj169Obj170
Obj171Obj172Obj173Obj174Obj175Obj176Obj177Obj178Obj179Obj180Obj181Obj182Obj183Obj184Obj185Obj186Obj187Obj188Obj189Obj190Obj191Obj192Obj193Obj194Obj195Obj196Obj197Obj198Obj199Obj200Obj201Obj202Obj203Obj204
9
sampel . Jadi . Misalkan dari distribusi sampel dapat ditentukan 1 dan 2 dengan 1 < 2
sedemikian hingga P(1 < < 2 ) sama dengan nilai yang di inginkan. Misalkan 1 dan 2
dicari sehingga memenuhi P(1 < < 2 ) = 0,95. Artinya bahwa dengan peluang 0,95
sampel random yang diambil akan menghasilkan suatu interval yang mengandung .
Ini disebut interval kepercayaan 95%, artinya bahwa 95% interval mengandung
parameter yang sesungguhnya dari populasi. Pada umumnya distribusi
memungkinkan menghitung k sehingga: P( - k < < + k ) = 1 - dengan 0 < < 1.
Interval yang dihitung dari suatu sampel tetentu disebut interval kepercayaan
(1 - ) = 100%. Jadi bila = 0,05 diperoleh interval kepercayaan 95% dan bila = 0,01
diperoleh interval kepercayaan 99%. Pecahan 1 - disebut koefisien kepercayaan dan
- k dan + k disebut batas kepercayaan.
Sampling Kelompok (Cluster Sampling)
Sampel kelompok (Cluster sampling) ialah sampel acak sederhana dimana
setiap sampling unit terdiri dari kumpulan atau kelompok elemen, seperti misalnya
rumah tangga terdiri dari beberapa anggota rumah tangga, blok toko di pasar baru
Jakarta terdiri dari toko-toko, rayon sekolah terdiri dari beberapa sekolah, segmen
pasar terdiri dari banyak pembeli, bidang tanah terdiri dari ssbeberapa plot terdiri
dari beberapa pohon dan lain sebagainya.
Pengambilan sampel secara blok/kelompok mempunyai beberapa
keuntungan, antara lain: Tidak perlu disusun kerangka sampling di seluruh populasi
yang ingin diteliti cukup dibuat blok-blok yang ada dan biaya pendataan lebih
murah karena sampel yang terambil akan terletak pada jarak yang relatif berdekatan.
Sifat-sifat Penaksir
Ketelitian atau sering dinamakan dengan presisi dari suatu penaksir yang
dibuat berdasarkan sampel, tergantung pada metode penaksiran dan rencana
penarikan sampel. Sifat-sifat penaksir untuk sampling kelompok diberikan dalam
teorema berikut ini:
Teorema 1
Obj205Obj206Obj207Obj208Obj209Obj210
Obj211Obj212Obj213
10
Misalkanadalah rata-rata sampel yang dipilih n unit dari populasi berukuran
N, maka adalah penaksir tak bias dari yaitu rata-rata dari populasi
Bukti :
a) Tanpa Pengembalian
Dari definisi ekspektasi ( nilai harapan ) bahwa:
, untuk suatu i.
Dengan: Yj adalah nilai-nilai yi yang mungkin ( peubah acak diskrit )
Pj adalah peluang dari Yj (unsur ke-j dari populasi) terpilih sebagai sampel,
j = 1,2,3,…,N
Perhatikan bahwa suku pertama persamaan diatas menunjukkan peluang
Yj tidak terpilih sebagai sample pada pengambilan pertama, suku kedua
menunjukkan peluang bahwa Yj tidak terpilih sebagai sampel pada pengambilan
sampel berikutnya dan suku terakhir menunjukkan peluang bahwa Yj terpilih
sebagai sampel dari N–I+1, sisa elemen pada pengambilan sampel ke-i.
Dari E(), E dan Pj didapatkan:
b) Dengan Pengembalian
Obj214
Obj215
Obj216
Obj217Obj218
Obj219
Obj220Obj221
11
Ini berarti bahwa setiap unit akan muncul dalam jumlah sampel yang sama yaitu
Akibat dari Teorema 1
Misalkan adalah rata-rata sampel yang dipilih n unit dari populasi berukuran
N, maka adalah penaksir tak bias sari total populasi Y.
Bukti :
E() = E(N) = N E() = N = Y.
Variansi dari Penaksir
Dari teori sampling dikenal dua definisi variansi dari yi yaitu:
(1)
(2)
Definisi (1) diatas digunakan untuk menurunkan hasil teoritis sedangkan
definisi (2) banyak berkaitan dengan analisis variansi utamanya sifat ketakbiasan.
Teorema 2
Misalkan adalah rata-rata sampel berukuran n yang diambil dari populasi
berukuran N pada sampling kelompok, maka variansi dari adalah sebagi berikut:
a) Tanpa Pengembalian
Obj222
Obj223Obj224
Obj225Obj226Obj227Obj228
Obj229Obj230
Obj231
Obj232Obj233
Obj234
12
Dimana f = n / N adalah fraksi penarikan sampel.
b) Dengan Pengembalian
Sedangkan Variansi dari penaksir total populasi adalah:
Untuk sampel berukuran n dari suatu populasi tak hingga, variansi rata-rata
sampel adalah . Hasil ini akan berubah jika populasi terbatas yaitu dengan
menambahkan yang disebut sebagai faktor koreksi populasi hingga (fpc). Untuk
populasi hingga fraksi sampling sangat kecil, maka . Jadi ukuran populasinya tidak
mempunyai pengaruh secara langsung terhadap kesalahan baku dari rata-rata sampel.
Dalam praktek fpc dapat diabaikan apabila
Teorema 3
Jika (yi, xi) adalah pasangan variabel yang didefinisikan pada setiap unit
populasi dan , adalah rata-rata sampling kelompok berukuran n, maka kovarian
darididefinisikan sebagai:
Dengan:
Penaksir Variansi
Rumus simpangan baku dari penaksir rata-rata populasi dan total populasi
digunakan terutama untuk tiga tujuan:
Obj235
Obj236Obj237
Obj238Obj239Obj240Obj241Obj242
Obj243Obj244Obj245
Obj246
Obj247
13
1) Membandingkan presisi (ketelitian) yang diperoleh dari sampling kelompok
dengan metode sampling lainnya.
2) Untuk memperkirakan ukuran sampel yang dibutuhkan dalam suatu survei yang
telah direncanakan.
3) Untuk memperkirakan ketelitian sebenarnya yang didapat dalam suatu survei
yang telah dilaksanakan.
Pada umumnya dalam praktek S2 adalah variansi populasi tidak diketahui,
tetapi dapat ditaksir dari data sampel.
Teorema 4
Untuk sampling kelompok adalah penaksir tak bias dari
Akibat Teorema 4
Penaksir tak bias dari variansi adalah:
Sehingga penaksir tak bias dari variansi adalah:
Penaksir tak bias dari simpangan baku adalah:
Obj248
Obj249
Obj250
Obj251
Obj252
Obj253
Obj254
14
Penaksir tak bias dari simpangan bakuadalah:
Interval Kepercayaan
Taksiran selang (interval) suatu parameter populasi adalah suatu interval
yang berbentuk dengan dan tergantung pada nilai statistik. Bila sampel berasal
dari populasi normal atau bila tidak n cukup besar, selang kepercayaan untuk
dapat dibuat dengan menggunakan distribusi sampel. Dari teorema limit pusat
dikatakan jika sebuah populasi mempunyai rata-rata dan simpangan bakuyang
besarnya berhingga, maka untuk ukuran sampel random n cukup besar
berdistribusi rata-rata sampel mendekati distribusi normal dengan rata-rata dan
simpangan baku . Menurut teorema ini, distribusi sampel dapat diharapkan secara
hampiran berdistribusi normal dengan rataan dan simpangan baku . Dari teorema
limit pusat diketahui bahwa:, dengan Z merupakan distribusi normal dengan
rataan nol dan variansi satu.
Rata-rata sampel diperoleh dari sampel berukuran n. Dari tabel normal
diperoleh bahwa:
Obj255
Obj256Obj257
Obj258Obj259Obj260Obj261Obj262Obj263Obj264Obj265Obj266Obj267Obj268Obj269Obj270Obj271Obj272
Obj273
Obj274
Obj275
15
Suatu sampel random ukuran n diambil dari populasi dengan variansi yang
diketahui dan rataan yang dihitung sehingga menghasilkan selang kepercayaan
diberikan oleh: . Pada umumnya dalam praktek variansi populasi tidak diketahui,
sehingga ditaksir dari data sampel. Taksiran dari adalah . Selang kepercayaan untuk
rata-rata populasi pada sampling kelompok adalah:
, sebagai pendekatan dapat diambil: , dengan batas bawah kepercayaan untuk rata-
rata populasi dan merupakan batas atas kepercayaan untuk rata-rata populasi.
Selang kepercayaanuntuk total populasi Y pada sampling kelompok adalah:
Sebagai pendekatan dapat diambil:
Dari persamaan: batas bawah kepercayaan untuk total populasi dan
batas atas kepercayaan untuk total populasi. Dalam penyelesaian soal yang
diberikan pada skripsi ini menggunakan software Microsoft excel sebagai
pendukung untuk mempercepat perhitungan.
METODE PENELITIAN
Obj276Obj277Obj278Obj279Obj280Obj281Obj282Obj283
Obj284Obj285Obj286Obj287
Obj288
Obj289
Obj290
Obj291
Obj292
16
Ruang Lingkupnya adalah regresi linier sederhana dan sampling acak
kelompok, Objek penelitian adalah perbedaan antara penaksiran regresi linier
dengan penaksiran pada sampling kelompok, Variabel/Fokus pembicaraan pada
skripsi ini mengenai penaksiran variable dependen pada regresi linier sederhana dan
berdasar rata-rata sampel kelompok. Kemudian penaksiran bias regresi linier,
penaksiran varians pada sampling kelompok dan penaksiran varians pada regresi
linier sederhana.
Taksiran berdasar regresi linier sederhana: , sedangkan berdasar rata-rata
sample kelompok: . Penaksiran bias dari regresi linier sederhana .
Untuk sampling kelompok variansi adalah penaksir takbias dari sehingga
penaksir variansi rata-rata sampel pada sampling kelompok adalah , sedangkan
variansi penaksir variansi regresi linier sederhana adalah .
Teknik dan Olah data
Metode yang dipakai dalam penulisan skripsi adalah studi pustaka,
merumuskan masalah, pengumpulan data, dan penyelesaian masalah.
HASIL DAN PEMBAHASAN
Regresi Linier Sederhana
Sering dalam praktek orang diminta untuk memecahkan persoalan yang
menyangkut sekelompok variabel bila diketahui bahwa diantara variabel tersebut
terdapat suatu hubungan yang tidak terpisahkan. Variabel-variabel tersebut
dinamakan variabel bebas dan variabel terikat atau respon. Hubungan antara
variabel bebas dan respon yang dicocokkan pada data suatu percobaan, ditandai
dengan persamaan prediksi yang disebut persamaan regresi. Bila y dan x masing-
masing tunggal, persoalannya menjadi regresi y pada x. Rataan berkaitan linier
Obj293Obj294Obj295
Obj296Obj297Obj298Obj299Obj300
Obj301Obj302Obj303Obj304Obj305
17
dengan x dalam bentuk persamaan linier populasi: , dengan dan merupakan dua
parameter yang akan ditaksir dari data sampel. Bila taksiran untuk kedua parameter
itu masing-masing dinyatakan dengan a dan b, maka bentuk persamaan garis regresi
berdasarkan sampel adalah:.
Bila hanya terdapat satu x dan satu y maka data berbentuk pasangan
pengamatan {(xi, yi) ; i= 1, 2, …, n}. Bila nilai x diatur, maka proses percobaan
menetapkan atau memilih nilai-nilai xi terlebih dahulu dan kemudian mengamati
nilai padananya yi . Bila dimisalkan bahwa semua rataan terletak pada satu garis
lurus, tiap Yi dapat ditulis sebagai model regresi linier sederhana yaitu: , dengan Ei
merupakan variabel random yang mempunyai rataan nol. Setiap pasangan
pengamatan (xi, yi) dalam sampel dengan distribusi normal, memenuhi hubungan:
dengan: nilai yang dicapai Ei bila Yi berharga yi . Jika menggunakan persamaan
regresi, estimasi dari y adalah , sehingga tiap pasangan pengamatan memenuhi: yi =
a + bxi + ei , dengan yang disebut sisa.
Untuk memperkirakan a dan b digunakan metode kuadrat terkecil sehingga
jumlah kuadrat dari simpangan antara observasi-observasi dan garis regresi menjadi
minimum. Dengan menggunakan metode kuadrat terkecil maka sifat dari penaksir
yang diperoleh adalah tak bias dan mempunyai variansi minimum: . Persamaan yi =
a + bxi + ei dapat juga ditulis sebagai berikut: , dengan . Dan jumlah sisanya menjadi
. Bila L diturunkan terhadap ai dan b, maka diperoleh: dan Penyederhanaan kedua
persamaan tersebut di atas menghasilkan: dan , karena , maka dari dua persamaan
di atas diperoleh: , sehingga Dan, sehingga .
Penaksir Regresi Linier Sederhana
Penaksir terhadap karakteristik dari suatu populasi dapat dilakukan dengan
menggunakan rata-rata sampel. Setelah suatu sampel dipilih dengan salah satu
Obj306Obj307Obj308Obj309Obj310Obj311
Obj312Obj313Obj314Obj315Obj316Obj317Obj318Obj319Obj320Obj321Obj322Obj323Obj324Obj325
Obj326Obj327
18
metode sampling, kemudian dihitung rata-rata sampel yang digunakan untuk
menaksir rata-rata populasi .
Pada bab pendahuluan telah disinggung salah satu alasan mengapa
menggunakan metode penaksiran regresi linier, karena metode penaksiran regresi
linier akan memberikan ketelitian yang lebih baik dibandingkan penaksiran dengan
menggunakan rata-rata sampel . Hal ini akan dijelaskan pada sub bab 4.7 tentang
efisiensi metode penaksiran regresi linier, dan akan diberikan contoh yang
memperlihatkan bahwa penaksiran regresi linier memberikan ketelitian yang lebih
baik dibandingkan penaksiran dengan menggunakan rata-rata sampel .
Misalkan populasi terdiri dari N unit dengan harga (xi , yi), dimana xi >0,
untuk . Dimisalkan bahwa xi dan yi masing-masing diperoleh untuk setiap unit
dalam sampel dan rata-rata populasi dari xi diketahui. Penaksir regresi linier , rata-
rata populasi yi , didefinisikan sebagai: , dengan menyatakan regresi linier
danpenaksir perubahan y bila x bertambah. Penaksir jumlah populasi Y,
didefinisikan sebagai .
Penaksir regresi linier dapat membantu menyelesaikan masalah penaksiran
suatu parameter.
Contoh 1:
Tabel berikut ini menunjukkan jumlah penduduk (dalam ribuan) untuk
setiap sample random dari 49 kota yang diambil dari populasi 196 kota. Misalkan xi
menyatakan banyaknya penduduk pada tahun 1920 dan yi menyatakan banyaknya
penduduk pada tahun 1930. Apabila jumlah penduduk tahun 1920. X diketahui
yakni 22.919 jiwa. Berapakah perkiraan jumlah penduduk dari 196 kota tersebut
pada tahun 1930? Jumlah seluruh penduduk yang sebenarnya pada tahun 1930 untuk
196 kota adalah 29.351 jiwa.
xi Yi xi Yi Xi yi Xi yi76 80 2 50 243 291 138 143507 634 87 105 67 67 179 26030 111 29 50 121 113 71 79
Obj328Obj329
Obj330Obj331Obj332Obj333Obj334Obj335Obj336
19
381 464 50 64 256 288 23 4844 58 43 61 37 63 77 8925 57 120 115 64 63 94 8561 69 64 77 43 50 387 45956 142 298 317 93 104 40 6036 46 172 183 40 64 161 23278 106 38 52 74 93 66 86136 139 45 53 60 57 116 13036 54 46 65 46 53 50 5848 75
Dari data tersebut diatas diperoleh:
x = 5.054 y = 6.262 =103,1 = 127,8
n = 49 N = 196 X = 22.919 = 1,16
Penaksir regresi liniernya:
= 127,1 + 1,16(116,9 – 103,1) = 144 jiwa.
Taksiran total jumlah penduduk pada tahun 1930 untuk seluruh kota adalah:
= (196)(144) = 28.224 jiwa
Taksiran berdasarkan atas rata-rata sampel adalah:
= (196)(127,8) = 25.048 jiwa
Contoh 2:
Sensus penduduk propinsi Jawa Tengah tahun 1980 versus tahun 1990.
Misalkan xi menyatakan jumlah penduduk hasil sensus tahun 1980 dan yi
menyatakan jumlah penduduk hasil sensus tahun 1980 yang diambil dari 15
kabupaten (dalam ribuan). Apabila jumlah penduduk hasil sensus tahun 1980, X
Obj337Obj338
Obj339
Obj340
Obj341
Obj342
20
diketahui yakni 25.373 jiwa. Berapakah perkiraan jumlah penduduk hasil sensus
tahun 1990? Jumlah seluruh penduduk yang sebenarnya pada tahun 1990 untuk 35
Kabupaten adalah 28.522 jiwa.
Xi Yi Xi Yi xi yi1013 1148 674 823 706 786536 631 697 701 556 617123 123 1100 1239 700 8281027 1251 652 700 600 666976 1064 1225 1349 935 1016
Dari data tersebut diatas diperoleh:
x = 11.520 = 768 y = 12.942 = 862,8
n = 15 N = 35 = 1,13 X = 25.373
Penaksir regresi liniernya:
= 862,8 + 1,13(724,9 – 763) = 814 jiwa.
Taksiran total jumlah penduduk pada tahun 1990 untuk seluruh kabupaten adalah:
= (35)(814) = 28.490 jiwa.
Taksiran berdasarkan atas rata-rata sampel adalah:
= N = (35)(862,8) = 30.198 jiwa
Dari contoh diatas terlihat bahwa penaksir regresi linier memberikan ketelitian yang
lebih baik bila dibandingkan dengan menggunakan rata-rata sampel.
Penkasiran Regresi Linier dengan telah ditentukan lebih dahulu
Obj343Obj344
Obj345
Obj346
Obj347
Obj348Obj349
Obj350
21
Meskipun dalam aplikasi, dihitung dari sampel, kadang-kadang bisa juga
untuk memilih lebih dahulu. Dalam sampling berulang, perhitungan sebelumnya
dapat memperkirakan bahwa nilai hampir konstan.
Teorema 4.3.1
Pada sampling kelompok, dimana bo adalah konstan yang ditentukan lebih dahulu,
penaksir regresi liniernya adalah: adalah tak bias, dengan variansinya adalah:
Bukti:
Setelah diketahui persamaan regresi liniernya dan b0 konstan pada penarikan sampel
berulang maka diperoleh:
Jadi menurut teorema 1 pada bahasan tentang sifat-sifat penaksir yang
mengatakan bahwa jika tanpa pengembalian dan dengan pengembalian . Ini berarti
adalah penaksir tak bias dari.
Dengan dan , sehingga menurut teorema 2 diperoleh:
Obj351Obj352Obj353
Obj354
Obj355
Obj356
Obj357Obj358Obj359Obj360
Obj361Obj362
Obj363
22
Salah satu tujuan dari penaksiran adalah untuk meningkatkan ketelitian atau
meminimumkan variansi. Nilai minimum bila:
,
b0 disebut sebagai koefisien regresi linier dari y pada x dalam populasi terbatas. Nilai
variansi minimumnya adalah: , dengan adalah koefisien korelasi antara y dan x.
Dari teorema 4.3.2 terlihat bahwa variansi dari penaksir regresi linier akan minimum
jika . Dari persamaan , jika = 0, maka tidak terdapat hubungan linier antara variabel
x dan y dan variansi dari penaksir regresi linier sama dengan penaksir pada
sampling acak kelompok, tetapi jika = 1, maka terdapat hubungan linier sempurna
antara variabel x dan y, dan variansi dari penaksir regresi linier besarnya nol. Ini
berarti titik-titik sampel (xi, yi) terletak pada garis lurus yang menghubungkan
antara variabel x dan y.
Obj364
Obj365
Obj366
Obj367
Obj368
Obj369Obj370
Obj371Obj372Obj373Obj374
Obj375
23
Penaksiran regresi linier jika dihitung dari sampel
Dari teori regresi linier diketahui bahwa penaksir sampel yang efektif adalah
dengan metode kuadrat terkecil dari B, yaitu:
Dengan: xi = x1 , x2 , …, xn dan yi = y1 , y2 , …, yn adalah nilai sampel.
Teorema 4.3.3
Jika adalah penaksir kuadrat terkecil dari B dan pada sampling acak kelompok
berukuran n, dengan n besar, maka:
dengan adalah koefisien korelasi antara y dan x.
Taksiran Variansi dari Sampel
Rumus di atas dihitung berdasarkan pada nilai-nilai dari populasi. Sekarang
akan dicari taksiran dari yang dihitung berdasarkan atas nilai-nilai dari sampel. Di
atas diketahui bahwa rumus variansi regresi linier yang dihitung berdasarkan pada
nilai-nilai dari populasi adalah:
taksiran dari dinotasikan dengan, sehingga:
Obj376
Obj377Obj378Obj379
Obj380
Obj381Obj382
Obj383
Obj384Obj385
Obj386
24
Bias Dari Penaksir Regresi Linier
Pada umumnya penaksir regresi linier adalah suatu penaksir yang bias dari .
Berikut ini akan dibahas bias dari penaksir regresi linier. Dari persamaan regresi
linier diperoleh:
sehingga bias dari adalah
Misalkan variabel ei didefinisikan sebagai:
dari persamaan diatas substitusikan ke persamaan , diperoleh:
Obj387
Obj388Obj389Obj390
Obj391
Obj392
Obj393Obj394
Obj395
Obj396
Obj397
Obj398
25
sehingga
ruas kanan persamaan diatas dimanipulasi didapatkan:
dan
setelah itu kita masukkan ke kovariannya
karena , maka dari persamaan diatas diperoleh:
misalkan maka diperoleh:
Obj399
Obj400
Obj401Obj402
Obj403
Obj404
Obj405
Obj406
Obj407
Obj408
Obj409
26
dari teorema 2.2.3 diperoleh:
Suku ini merupakan komponen kuadaratik dari regresi linier yi pada xi . Jadi jika
diplot yi dan xi mendekati linier, maka bias dari menjadi kecil.
Efisiensi Metode Penaksiran Regresi Linier
Efisiensi suatu penaksir hanya dapat dilakukan dengan
membandingkan variansinya. Suatu penaksir dikatakan lebih efisien bilamana
variansinya lebih kecil. Dalam hal ini akan dilihat efisiensi dari metode penaksiran
regresi linier bila dibandingkan dengan penaksiran pada sampling kelompok, yaitu
pada rata-rata populasinya. Dan juga akan dilihat persyaratan apakah suatu penaksir
regresi linier memberikan ketelitian yang lebih baik. Untuk perbandingan ini ukuran
sample n harus cukup besar sehingga pendekatan rumus untuk variansi regresi
berlaku.
Dari teorema 2.2.1 dan teorema 2.2.2 diperoleh bahwa adalah penaksir tak
bias dari rata-rata populasi dan variansi dari didefinisikan sebagai:
. Sedangkan dari teorema 4.3.3 diperoleh bahwa variansi dari adalah:
Obj410
Obj411
Obj412
Obj413Obj414Obj415
Obj416Obj417Obj418
Obj419Obj420Obj421Obj422Obj423Obj424
27
Penaksir regresi linier dikatakan lebih baik (efisien) dibandingkan penaksir
pada sampling kelompok apabila Dari dua persamaan diatas diperoleh bahwa: .
Dari persamaan ini terlihat bahwa: kedua variansi ini sama. Ini ekuivalen dengan
mengatakan bahwa lebih efisien dibandingkan , kecuali . Jadi penaksir regresi linier
lebih efisien dibandingkan penaksir pada sampling kelompok. Apabila tidak ada
hubungan linier antara variabel y dan x maka penaksir regresi linier sama dengan
penaksir pada sampling kelompok.
Contoh 1.
Seorang pemilik perkebunan kopi membuat taksiran dengan melihat (tanpa
ditimbang) berat kopi yang dihasilkan xi pada setiap pohon kopi dari N = 200. Dia
memperoleh berat total X = 11.600. Dari suatu sampel acak yang terdiri atas 10
pohon kopi diperoleh hasil sebagai berikut:
Nomor Pohon 1 2 3 4 5 6 7 8 9 10 TotalBerat sebenarnya yi 61 42 50 58 67 45 39 57 71 53 543Berat taksiran xi 59 47 52 60 67 48 44 58 76 58 569
Data dasar yang dipunyai adalah sebagai berikut:
Dari data tersebut diatas maka diperoleh:
1. Penaksir varians regresi linier
2. Penaksir varians rata-rata sampel
Contoh 2:
Data berikut menyatakan banyaknya penduduk dari suatu sampel acak
terdiri dari 7 kota yang dipilih dari 28 kota. Misalkan xi menyatakan banyaknya
penduduk pada tahun 1970 dan yi menyatakan banyaknya penduduk pada tahun
Obj425Obj426
Obj427
Obj428
28
1980 (dalam ribuan). Bila diketahui total penduduk tahun 1970 yakni sebesar X =
3.273
1 2 3 4 5 6 7xi (1970) 76 138 67 29 381 23 37yi (1980) 80 143 67 50 464 48 63
Data dasar yang dipunyai adalah sebagai berikut:
Dari data diatas diperoleh:
1. Penaksir varians regresi linier
2. Penaksir varians rata-rata sampel
Dari contoh diatas terlihat bahwa variansi penaksir regresi linier lebih kecil
dibandingkan penaksir rata-rata sampel.
Interval kepercayaan Penaksir Regresi Linier
Taksiran selang (Interval) suatu parameter populasi adalah suatu interval yang
berbentuk dengan dan tergantung pada nilai statistik. Pada bab teori pendukung
telah disinggung tentang interval kepercayaan dari sampling kelompok. Sekarang
akan dibahas tentang interval kepercayaan dari penaksir regresi linier.
Dengan dasar bahwa interval kepercayaan untuk rata-rata populasi pada
sampling kelompok adalah:. Dari teorema 4.3.3 diketahui bahwa variansi dari
Obj429
Obj430
Obj431
Obj432Obj433Obj434Obj435Obj436
Obj437Obj438Obj439Obj440
29
penaksir regresi linier untuk sampel berukuran n dengan n besar adalah: , selang
kepercayaan 100 % untuk rata-rata populasi dari penaksir regresi linier adalah:
Sebagai pendekatan yang diambil:
batas bawah kepercayaan untuk rata-rata populasi dari penaksir regresi linier dan
batas atas kepercayaan untuk rata-rata populasi dari penaksir regresi linier.
SIMPULAN DAN SARAN
Simpulan
Dari hasil pembahasan diatas diperoleh kesimpulan sebagai berikut:
1. Jika adalah penaksir kuadrat terkecil dari B, maka besarnya variansi dari
penaksir regresi linier pada sampling kelompok dengan sampel berukuran besar
adalah , ini merupakan variansi minimum dari penaksir regresi linier.
2. Besarnya bias dari penaksir regresi linier pada sampling kelompok adalah , bias
ini akan menjadi kecil jika hubungan antara xi dan yi mendekati linier.
3. Penaksir regresi linier lebih efisien dibandingkan penaksir pada sampling
kelompok karena kecuali .
Saran
Obj441
Obj442
Obj443Obj444
Obj445Obj446
Obj447
Obj448Obj449
30
1. Pada penulisan skripsi ini secara teoritis hanya ditunjukkan hubungan mengenai
xi dan yi sedangkan bagaimana garis yang menghubungkan antara xi dan yi perlu
penelitian lebih lanjut.
2. Pada penulisan skripsi ditunjukkan secara teoritis dan sofware Microsoft excel
bahwa penaksir regresi linier lebih efisien dibandingkan penaksir pada sampling
kelompok dan ini perlu penelitian lebih lanjut tentang studi empiris dengan
menggunakan sofware komputer yang lain. Hal ini dimaksudkan untuk lebih
mendalami dan menghayati tentang hasil-hasil yang diperoleh secara lebih baik.
DAFTAR PUSTAKA
Cochran, W.G. 1991. Sampling Tecniques. ( Terjemahan Rusdiansyah ). Jakarta: UI.
Darwis, Sutawanir. 1986. Buku Materi Pokok Survei Sampel 1-10. Jakarta: Karunika.
Djarwanto. 1993. Statistik Induktif. Yogyakarta: BPFE.
Hines, W.W. and Montgomery, D.C. 1990. Probability and Statistics in Engineering
and Management Science ( Terjemahans Rusdiansyah ). Jakarta: UI.
Sembiring, R.K. 1995. Analisis Regresi. Bandung: ITB.
Supranto, J. 1986. Pengantar Probabilitas dan Statistik Induktif. Jakarta: Erlangga.
Walpole, R.E. and Myers R.H. 1972 Probability and Statistics for Engineering and
Scientists. ( Terj. Sembiring ). Bandung: ITB.
Sugiarto, Dergibson Siagan, Lasmono Tri Sunaryanto dan Oetomo, Denny S.2001.
Teknik Sampling, Jakarta: PT Gramedia Pustaka Utama.
Sudjana. 1996. Metode Statistika. Bandung: Tarsito.
Sukatmi, Pandurang V and Balkrishna.1970. Sampling Theory of Surveys with
Applications, USA: Lowa State University Press.
Supranto, J. 2001. Statistik Teori dan Aplikasi. Jakarta: Erlangga.
Supranto, J.2000. Teknik Sampling Untuk Survey dan Eksperimen, Jakarta: PT Rineka
Cipta.