bİyoİstatİstİk...bİyoİstatİstİk ege Üniversitesi, tıp fakültesi, iyoistatistik ve tıbbi...

Post on 18-Jan-2021

11 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

BİYOİSTATİSTİK

Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD.

Web: www.biyoistatistik.med.ege.edu.tr

Regresyon Analizi

1

Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

• Regresyon analizi, bir bağımlı değişken (Y) ile bir ya da daha

çok bağımsız (X1, X2, X3, ....) değişken arasındaki ilişkiyi

yansıtan modeli (eşitliği) bulmaya yarayan bir yöntemdir.

• İki (ya da daha çok) değişken arasındaki ilişkiyi gösteren

denklem, değişkenler arasındaki ilişkinin fonksiyonel şeklini

gösterirken, değişkenlerden birinin değeri bilindiğinde

diğeri hakkında tahmin yapılmasını sağlamaktadır.

2

• Bağımlı değişken ile bağımsız değişken/ler

arasındaki ilişkinin doğrusal olduğu durumlarda,

yöntem, Doğrusal Regresyon Analizi adını alır.

• Eğer bir Y değişkeni ile bir X değişkeni arasında doğrusal

model aranıyor ise

Y= β0 + β1X + e

eşitliğindeki β0 ve β1 parametre değerlerini tahmin etmek ve

elde edilen modelin geçerliliğini test etmek amacıyla yapılan

analiz Basit Doğrusal Regresyon Analizi olur.

4

• Burada;

X: Bağımsız (Açıklayıcı) Değişken

Y: Bağımlı (Açıklanan; Etkilenen; Cevap) Değişken

0: X=0 olduğunda bağımlı değişkenin alacağı değer (kesim

noktası)

1: Regresyon Katsayısı, Bağımsız değişkendeki bir birimlik

değişimin, bağımlı değişkendeki yaratacağı ortalama değişimi

göstermektedir.

e : Hata terimi (Ortalaması=0 ve Varyansı=2’dir)

Y= β0 + β1X + e

6

Kitle için;

Örneklem için;

ii10i exbby i = 1 ,…, n

Y= β0 + β1X +e

Hata terimi (e), her bir gözlem çiftindeki bağımlı değişkene ilişkin gerçek değer ile modelden tahmin edilen değer arasındaki farktır.

• Bağımsız X değişkeni ile bağımlı Y değişkeni arasında

güçlü bir ilişki bulunursa, bu tahmin edilen model

kullanılarak herhangi bir X değeri için Y’nin alabileceği

değer tahmin edilebilir.

7

• Regresyon modeli oluştururken, gerçek gözlem

değeri ile tahmin değeri arasında fark olmaması

yada farkın minimum olması amaçlanmaktadır. Bu

amaçla kullanılan tahmin yöntemlerinden biri “En

Küçük Kareler” kriteridir.

n

i

ii

i

n

i

i yye

1

2

1

2 ˆBu farkın en küçük olması amaçlanır

• Varsayımları:

– Bağımsız değişkenin her bir değeri (xi) için, yi değişkeni

normal dağılıma uyar.

– Bu normal dağılımlar, her bir xi değeri için, sabit bir 2

varyansına sahiptir.

– Bu iki değişken arasında doğrusal bir ilişki vardır.

– Gözlemler birbirlerinden bağımsız olarak elde edilirler.

– Basit Doğrusal Regresyon Analizinde gözlemler (xi,yi) çiftleri

şeklinde alınır.

9

Süreye bağlı olarak, Ca salınımının

incelendiği çalışmada yandaki veriler

elde edilmiş.

X bağımsız değişkeni: Süre (saat) Y bağımlı değişkeni: Ca salınım miktarı (mg/dl)

10

Örnek

Öncelikle serpme (scatter) grafiği ile X ve Y arasında

doğrusal ilişkinin varlığını incelemek gerekir.

Şekilden doğrusal ilişkinin varlığı belirlendikten sonra, En Küçük Kareler

Yöntemine göre Y= β0 + β1X + e modelindeki β0 için b0 ve β1 için b1 tahminleri

elde edilir.

12

En küçük kareler yöntemi ’ lerin minimize edilmesine dayanır.

b1: doğrunun eğimidir.

Aynı zamanda x’deki 1

birim değişimin y’de oluşturduğu değişimin büyüklüğünü verir.

b0: doğrunun y eksenini kestiği noktadır ve x=0’da y’nin aldığı değeri gösterir.

n2

i

i 1

e

1 2

2

0 1

( x)( y)xy

nb( x)

xn

b y b x

13

14

• Doğru denklemi oluşturulduktan sonra;

1. Doğrunun noktalara uyumunun önem kontrolü

2. β0 için önem kontrolü

3. β1 (doğrunun eğimi) için önem kontrolü

• Tahmin edilen regresyon doğrusunun önem kontrolü varyans

analizi (ANOVA) tablosuna benzer bir tablo oluşturularak test

edilir.

1. Doğrunun noktalara uyumunun önem kontrolü

1. Hipotez:

H0: Noktaların doğruya uyumu önemsizdir.

H1: Noktaların doğruya uyumu önemlidir.

15

17

3. Tablo Değeri:

4. Kontrol

Elde edilen

denklemin X ile Y

arasındaki doğrusal

ilişkiyi açıklamakta

önemli olduğuna

karar verilir.

2 RKTR

GKT Belirtme katsayısının 1’e yakın olması

model uyumunun iyi olduğunu gösterir.

18

Fh>Ftablo ise Ho hipotezi reddedilir.

19

2. β0 için önem kontrolü

H0: β0 = 0

H1: β0 ≠ 0

20

3. β1 için önem kontrolü

H0: β1 = 0

H1: β1 ≠ 0

Soru

Bir diş kliniğinde çalışan 15 diş hekimine ait yaş ve maaş bilgileri verilmiştir.

a)Varyans analizi tablosu ile modelin önem kontrolünü yapınız. (α=0,05)

b)Basit doğrusal regresyon modelini elde ediniz ve katsayıların önem kontrolünü yapınız. (α=0,05)

c)Belirtme katsayısını hesaplayıp yorumlayınız.

d)Yaşın 42 ve 43 olduğu durumlarda maaş tahminlerini hesaplayınız.

21

YAŞ MAAŞ

45 133

55 155

60 155

36 118

42 140

39 120

63 140

41 125

49 144

68 160

36 140

67 152

41 145

56 146

55 150 22

y = 0.877x + 97.505 R² = 0.581

90

100

110

120

130

140

150

160

0 10 20 30 40 50 60 70

Maa

ş

Yaş

Bağımlı değişken

Yaş

Maaş

24

Bağımlı değişken Maaş

Bağımsız değişken Yaş

25

H0: Noktaların doğruya uyumu önemsizdir.

H1: Noktaların doğruya uyumu önemlidir.

108094

753

2123

39533

302769

50,2

141,53

a)Varyans analizi tablosu ile modelin önem kontrolünü yapınız. (α=0,05)

a)Varyans Analizi Tablosu

58,1332)7,1531)(87,0(][1

n

yxyxbRKT

ii

ii

73,2293)( 2

2

n

yyGKT

i

i

145,96158,133273,2293 RKTGKTHKT

Ftablo(0,05;1,13) =4,66 H0 RED

• Ho red edildiğinden, noktaların doğruya uyumu önemlidir.

• Başka bir ifade ile elde edilen denklemin X ile Y arasındaki doğrusal ilişkiyi açıklamada önemli olduğuna karar verilir.

b)

87,057,1760

7,1531

)( 2

2

1

n

xx

n

yxyx

bi

i

ii

ii

50,972,50)87,0(53,14110 xbyb

y=97,5+0,87x

b) Basit doğrusal regresyon modelini elde ediniz ve katsayıların önem kontrolünü yapınız. (α=0,05)

35,420,0

87,0

1

1 b

hesapS

bt

20,057,1760

93,73

)( 2

21

n

xx

HKOS

i

i

b

16,2)13;2/05,0( t

31

Ho RED 35,4hesapt

16,2)13;025,0( t

b1 katsayısı anlamlıdır.

6,10)(

12

2

2

0

n

xx

x

nHKOS

i

i

b

19,96,10

5,97

0

0 b

hesapS

bt

16,2)13;2/05,0( t

33

Ho RED 19,9hesapt

16,2)13;025,0( t

b0 katsayısı anlamlıdır.

y=97,5+0,87x

Yorum: Yaş değişkeninde meydana gelen bir birimlik artış maaşı ortalama 0,87 birim yükseltir.

58,073,2293

58,13322 GKT

RKTR

Yorum: Maaş değişkenindeki varyasyonun %58’i yaş değişkeni tarafından açıklanır.

c)Belirtme katsayısını hesaplayıp, yorumlayınız.

YAŞ MAAŞ

45 133

55 155

60 155

36 118

42 140

39 120

63 140

41 125

49 144

68 160

36 140

67 152

41 145

56 146

55 150 36

X=42 y=97,5+0,87x=97,5+(0,87)(42)

y=134,04 (uyum kestirimi)

y=97,5+0,87x

d) Yaşın 42 ve 43 olduğu durumlarda maaş tahminlerini hesaplayınız.

X=43 y=97,5+0,87x=97,5+(0,87)(43)

y=134,91 (ön kestirim)

• Haftaya derste anlatılacak konular…

Uygulama VII

top related