Download - PENDUGA REGRESI (REGRESSION ESTIMATOR)
by nofita i s t iananofita@bps .go. id
PENDUGA REGRESI(REGRESSION ESTIMATOR)
Tujuan: mendapatkan estimator yang presisinya lebih baik dg menggunakan variabel lain yang berkorelasi dg variabel yg diduga
• walaupun mempunyai hubungan linear, persamaan garisnya tidak melalui titik (0,0)
Bandingkan : penduga ratio melalui (0,0)
dengan penduga regresi tidak melalui (0,0)
penduga perubahan untuk penambahan satu unit.
Nilai dan diperoleh dari setiap unit dalam sampel ; nilai dan diketahui.
Penduga total populasi :
Xxyyr
xXbyylr
b y x
lrlr yNY
ix iy ix X
Penduga regresi
Penduga regresi :
Untuk:
yylr0b
xXyyb lr1
xyb
rlr YXxyxX
xyyy
(penduga ratio)
xXbyylr
lry xyX
xbyXbxXbyylr (penduga beda)
YyXxNn lr
(penduga beda)
1. Penduga regresi dg nilai ditentukan, misal = (asumsi SRS)
Teorema 1.1
Varian:
unbiased estimator dari varian
b
xXbyylr 0
11 1
20
N
XxbYy
nfyV
N
iii
lr
2200
2 21xyxy SbSbS
nf
0b
11 1
20
n
xxbyy
nfyv
n
iii
lr
2200
2 21xyxy sbsbs
nf
2. Penduga regresi dg nilai dihitung dari sampel, least squares estimate dari B, sbb.
Bila merupakan least squares estimate dari B dan
maka dalam pengambilan sampel SRS dg jumlah sampel n ( n besar )
untuk korelasi populasi antara dan
b
n
ii
n
iii
xx
xxyyb
1
2
1
Teorema 1.3
b xXbyylr
22 11
ylr SnfyV
yx
yx
SSS
x y
Estimasi dari varian
XxBYye iii
22 11
ylr SnfyV 222 1 ey SS
21elr S
nfyV
21elr s
nfyv
2
1
2
11
n
iie ee
ns
Utk sampel besar, estimator dari 2eS
2es
1
1
2
n
xxbyyn
iii
Utk populasi yg tak terhingga (infinite) dan regresi linear digunakan penyebut (n-2), bukan (n-1), sehingga penduga varian menjadi :
n
iiilr xxbyy
nnfyv
1
2
21
2
22
21
xxxxyy
yynnf
i
iii
3. Penduga regresi pada stratified sampling a. Separate regression estimate ( penduga regresi dihitung untuk setiap rata-rata strata)
utk
Rumus di atas digunakan apabila koefisien regresi berbeda antar stratum
b. Combine regression estimate ( penduga regresi dihitung secara kombinasi ), yaitu apabila koefisien regresi sama utk semua strata
maka
hhhhlrh xXbyy
h
lrhhlrshh yWyNNW
hB
hB
h
hhst yWy h
hhst xWx
ststlrc xXbyy
c. Penghitungan VarianSeparate regression estimate
Combine regression estimate
nilai merupakan rata-rata tertimbang dari stratum regression koefisien
2222
21xhhyxhhyh
h h
hhlrs SbSbS
nfWyV
2
22
2
min1
xh
yxhyh
h h
hhlrs S
SSnfWyV
2222
21xhyxhyh
h h
hhlrc SbSbS
nfWyV
nilai yg meminimumkan varian di atasb
h h
xhhh
h h
yxhhhc n
SfWn
SfWB
222 11
cB
2
xh
yxhh S
SB
Latihan Soal
1. Seorang petani ingin memperkirakan total berat rambutan di perkebunannya. Jumlah pohon dalam perkebunan sebanyak 70 pohon. Dia mendapatkan total berat rambutan tahun sebelumnya yaitu 11600 kwintal. Buah rambutan dipetik dan ditimbang pada sampel acak sederhana dari 10 pohon dengan hasil sbb:
Hitung perkiraan total berat rambutan dengan penduga regresi dan tentukan kesalahan bakunya!
1 2 3 4 5 6 7 8 9 10 jumlahBerat sekarang (yi)
61 42 50 58 67 45 39 57 71 53 543
Berat tahun lalu (xi)
59 47 52 60 67 48 44 58 76 58 569
2. Tabel berikut ini menyajikan jumlah penduduk (dalam ribuan) untuk setiap sampel acak sederhana dari 49 kota diambil dari populasi 202 kota. Jika diketahui jumlah penduduk pada tahun 2005 sebanyak 20216.
Tabel 1. Jumlah Penduduk 49 Kota (dalam Ribuan) Pada Tahun 2005 (xi) dan Tahun 2010 (yi)
xi yi xi yi xi yi xi yi xi yi76 80 172 183 77 89 87 105 74 93138 143 78 106 64 63 30 111 45 5367 67 66 86 64 77 71 79 36 5429 50 60 57 56 142 256 288 50 58381 464 46 65 40 60 43 61 48 7523 48 2 50 40 64 25 5737 63 507 634 38 52 94 85120 115 179 260 136 139 43 5061 69 121 113 116 130 298 317387 459 50 64 46 53 36 4693 104 44 58 243 291 161 232
a. Hitung perkiraan regresi dari jumlah penduduk tahun 2010 di 202 kota dan kesalahan bakunya!
b. Bandingkan ketelitiannya dengan perkiraan rasio!
3. Suatu survey dilakukan untuk menentukan jumlah hasil pertanian yang dipengaruhi oleh polusi air. Sampil diambil secara acak sederhana sebanyak 20 plot dari 100 populasi plot. Jumlah hasil pertanian disimbolkan (dalam satuan kwintal) dan level polusi disimbolkan . Hasilnya diperoleh
Rata-rata level polusi adalah 5a. Perkirakan rata-rata hasil pertanian berdasarkan level
polusi dengan penduga regresi linier!b. Perkirakan varians dari penduga regresi linier!c. Prediksikan hasil pertanian pada plot dengan level polusi 4!
4. Suatu survey dilaksanakan untuk memperkirakan rata-rata biaya berobat di suatu wilayah. Untuk memudahkan penelitian, kecamatan di wilayah tersebut dikelompokkan ke dalam tiga strata berdasarkan tingkat kesehatan daerah. Data yang diperoleh yaitu sbb:Strata Jumlah
Kec.Jumlah Penduduk Sakit
Jumlah Kec. Terpilih
Jumlah Penduduk Sakit di Kec. Terpilih
Pengeluaran untuk Berobat di masing-masing Kec. Terpilih (puluhan ribu rp)
Rendah
25 910 7 35,30,25,15,5,7,13
889,813,758,711,175,212,650
Sedang
30 65o 9 15,10,5,7,9,11,13,6,4
535,343,179,175,315,375,380,165,13
0Tinggi 20 270 6 5,7,9,3,11,15 253,261,272,120,4
35,525
Perkirakan rata-rata pengeluaran untuk berobat setiap kecamatan beserta standard errornya dengan metode separate regression estimator!(jumlah penduduk sakit sebagai variabel pembantu)
5. Suatu studi bertujuan untuk mempelajari produksi susu dilakukan dengan menarik sampel sebanyak 17 desa dari 117 desa secara SRS-WOR. Estimasi total direncanakan menggunakan metode ratio estimate dan regression estimate. Untuk keperluan tsb, auxiliary variabel yang digunakan adalah jumlah ternak penghasil susu per desa hasil sensus yang lalu. Diketahui total ternak penghasil susu (pada 117 desa) berdasarkan hasil sensus yang lalu adalah X=143968 ekor. Data jumlah ternak penghasil susu hasil survei (y) per desa berikut data jumlah ternak penghasil susu dari sensus yang lalu (x) tersaji pd tabel.Berdasarkan data, hitungah estimasi total ternak penghasil susu berikut satandard error-nya dengan menggunakan metode a). rata-rata per unit,b). ratio estimate,c). regression estimate.
No. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17X i 1141 1144 1127 1153 1117 1140 1153 1146 1189 1137 1170 1115 1130 1118 1122 1113 1166Y i 1129 1144 1125 1138 1137 1127 1163 1153 1164 1130 1153 1125 1116 1115 1112 1112 1123