analisis regresi dan korelasi
DESCRIPTION
ANALISIS REGRESI DAN KORELASI. Oleh. Suryo Guritno. MASALAH k PEUBAH (k 2). APA BILA PENGUKURAN/PENGAMATAN TERHADAP OBJEK YANG MENJADI PERHATIAN ADA DUA ATAU LEBIH ( SETIAP HASIL ADALAH PASANGAN DUA ATAU LEBIH ), MAKA DUA HAL YANG MENARIK UNTUK DIPERHATIKAN ADALAH :. - PowerPoint PPT PresentationTRANSCRIPT
ANALISIS REGRESI DAN KORELASI
Oleh
Suryo Guritno
MASALAH k PEUBAH (k 2)
APA BILA PENGUKURAN/PENGAMATAN TERHADAP OBJEK YANG MENJADI PERHATIAN ADA DUA ATAU LEBIH (SETIAP HASIL ADALAH PASANGAN DUA ATAU LEBIH), MAKA DUA HAL YANG MENARIK UNTUK DIPERHATIKAN ADALAH :
1. BAGAIMANA ERATNYA HUBUNGAN
2. BAGAIMANA BENTUK HUBUNGAN
• SALAH SATU UKURAN KEERATAN HUBUNGAN YANG BANYAK DIGUNAKAN ADALAH
KOEFISIEN KORELASI PEARSON
n
1i
2i
n
1i
2i
n
1iii
YY.XX
YYXX
r
-1 -0,25 0,25 1
-0,75 0 0,75
1r1 ERAT
negatifERAT
positif
AWAS !! • jika r = 0 artinya tidak ada hubungan linear antara X dan Y
• keeratan hubungan yang ditunjukkan adalah keeratan hubungan linear
0ρHo - versus H1 A. 0
B. > 0
C. < 0
- = … ???, pilih 5 % atau 10 % atau …
- daerah kritis/kriteria uji :
tentukan statistik ujiuntuk uji koefisien korelasi (= ) digunakan koef. korelasi sampel (= r)
karena 2n
2
1
2t~
r1
2nr
, maka
A. Ho ditolak jika2)(n;
2
αtt
atau2)(n;
2
αtt
B. Ho ditolak jika 2)(nα;tt
C. Ho ditolak jika 2)(nα;tt
- Perhitungan :
- Kesimpulan :
• 0 => r ~ ??
racrtgh r1
r1ln
2
1z
3n
1 ,
ρ1
ρ1ln
2
1 N ~z
=> uji hipotesis untuk :
oo ρρH - versus H1 A. o
B. > o
C. < o
- = … ???, pilih harga 0 %
- Kriteria uji :
A. Ho ditolak jika2
αo z 3nzz
Ho diterima jika2
αo z 3nzz
B. Ho ditolak jika αo z 3nzz
Ho diterima jika αo z 3nzz
C. Ho ditolak jika αo z- 3nzz
Ho diterima jika αo z- 3nzz
=> interval konfidensi untuk :
dari
3n
1.z
r1
r1ln
2
1
ρ1
ρ1ln
2
1
3n
1.z
r1
r1ln
2
1
2
α
2
α
menjadi
3n
z
ztgh ρ3n
z
ztgh 2
α
2
α
aa
aa
a
ee
ee )(dan tgh
r1
r1ln
2
1z
dengan
Patient Number
Method I Method II
1 132 130
2 138 134
3 144 132
4 146 140
5 148 150
6 152 144
7 158 150
8 130 122
9 162 160
19 168 150
11 172 160
12 174 178
13 180 168
14 180 174
15 188 186
16 194 172
17 194 182
18 200 178
19 200 196
20 204 188
21 210 180
22 210 196
23 216 210
24 220 190
25 220 202
BENTUK PERSAMAAN HUBUNGAN ANTARA SUATU VARIABEL (DEPENDEN VARIABEL) DENGAN PALING SEDIKIT SATU VARIABEL (INDEPENDEN VARIABEL) ADALAH PERSAMAAN REGRESI
•
• UNTUK MEMPERKIRAKAN BENTUK TEPAT SUATU PERSAMAAN REGRESI TERLEBIH DAHULU DILAKUKAN LANGKAH-LANGKAH BERIKUT :
CONTOH
(1.6, 5.5) , (1.0, 6.7) , (1.1, 5.5), (1.2, 5.7) , (1.3, 5.2)
(1.7, 4.5), (2.9, 3.8) , (2.9, 3.8) , (4.2, 3.6), (5.4, 3.5)
.5013X3.0754eY 2.58X6.86X21.27Y
X79.522.39X26.52Y 1.16X7.88Y
)σ(0,~ε , εf(x)Y 2X,Y
)Y,(X, ... ),Y,(X),Y,(X nn2211
Scatter Plot
Kecenderungan garis lurus
xββatau βx αf(x) 1o
Inferensi ???
• dengan metode kuadrat terkecil
2
i2
1
iiii1
XXn
YXYXnβ/βb/
,XYβ/αa/ βb
1βo
ii Yn
1Ydan X
n
1X
x std.dev s
y std.devs , s
s.rb
x
yx
y
2i
2i
2xy
XXn
X σ ,α~a
2i
2xy
XXn
σ ,β~b
2xyσ
2n
yys
2i2
xy
2x
22y sbs
2n
1n
tidak diketahui, 2xyσ
Inferensi untuk atau atau berdasarkan a atau b atau
xXY bxay
jika diduga dengan
untuk inferensi
, Y xX perhatikan bahwa , , dan koefisien determinasi (=2) harus signifikan
2 diduga dengan
1nyy
2nyy1r
2ii
2ii2
• inferensi untuk parameter :
us versααH oo
o
o
o1
α α C.
α α B.
αα A.H
maka ,t~s
α-α karena αdigunakan α mengujiuntuk
: uji teriakritis/kridaerah
2nα
o
A. Ho ditolak jika2)(n;
2
α2)(n;
2
α tatau ttt
B. Ho ditolak jika 2)(n ; αtt
C. Ho ditolak jika 2)(n ; αtt
• inferensi untuk parameter :
us versββH oo
o
o
o1
β β C.
β β B.
ββ A.H
maka ,t~s
β-β karena βdigunakan β mengujiuntuk
: uji teriakritis/kridaerah
2n
β
o
A. Ho ditolak jika2)(n;
2
α2)(n;
2
α tatau ttt
B. Ho ditolak jika 2)(n ; αtt
C. Ho ditolak jika 2)(n ; αtt
ambil sampel acak sederhana berukuran n
k
1i
2iio )σ(0,~ε, εXββY
k1,2,...,i, X,...,X,X,Y iki2i1i
model regresi sampel adalah
)σ(0,~ε , εXβ...XβXββ Y 2iiikki22i11oi
i.i.d
dengan :
ditulis dalam notasi vektor dan matriks
Iσ,0~ε , εβXY 2~~~~~
• Masalah regresi linear ganda :
n21 Y ... Y YY~
n21 ε ... ε εε~
n21 β ... β ββ~
nkn2n1
2k2221
1k1211
X ... X X 1
. . . .
. . . .
. . . .
X ...X X 1
X ... X X 1
X
• masalah : ??σ diketahui tak σ jikadan , ??β 22
~
• dengan MKT, yaitu cari yang meminimumkan~β
n
1
21 ~~ εεεS
i
diperoleh ~~YXXXβ 1
Yang mempunyai sifat BLUE untuk ~β
best linear unbiased estimator
• inferensi untuk atau A ?? ~β
~β
perlu ditambah dengan asumsi distribusi
• yang lazim digunakan adalah
I)σ(0,N~εatau )σN(0,~ε 2n
2~
• perlu dicatat bahwa model regresi
I)σ,0(N~ε , εβXY 2n ~~~~
dikenal pula sebagai model regresi klasik
QUALITATIVE VARIABLE DUMMY VARIABLE
Sex (male, female)
femalefor 0
malefor 11x
Place of residence (urban, rurual, suburban) :
suburban and ruralfor 0
urbanfor 11x
suburban andurban for 0
ruralfor 12x
Smoking status [current smoker, ex-smoker (has not smoked for 5 years or less0, ex-smoker (has not smoked for more than 5 years), never smoked]
otherwise 0
smokercurrent for 11x
otherwise 0
years) 5 (smoker -exfor 12x
otherwise 0
years) 5 (smoker -exfor 13x
• penyimpangan-penyimpangan model regresi klasik identitasskalar non
~ε
stokhastik X
earmultikolin X
sdikhotomou khususnya ,kualitatif dengan iY~Y
• Jika Y dikhotomous
?? )σ N(0,~ε , εXββY 21o
?? 1atau 0 Y
?? ...)P(Y diganti Y
logistik model atau logit model
untuk 1 (satu) peubah bebas
atau
untuk k (k 2) peubah bebas
Xββexp1
Xββexp1)P(Y
1o
1o
k
1iiio
k
1iiio
Xββexp1
Xββexp
1)P(Y