otokorelasyon - hataların bağımsızlığı varsayımı

16
Hataların Bağımsızlığı Varsayımı (Otokorelasyon Olmaması Varsayımı) Hataların birbirinden bağımsız olması veya hatalar arasında otokeralasyon olmaması varsayımı bağımlılığa dayanan yöntemlerde önem arz eder. Nasıl korelasyon katsayısı iki değişken arasındaki lineer ilişkiyi gösteriyorsa, otokorelasyon’da aynı şekilde bunu aynı zaman serisi üzerinde bunun uygulanmasıdır. Otokorelasyon hata terimlerinin ardışık değerleri arasında ilişki olması durumudur. Mesela; t zamanındaki gözlem ile t-1 zamandaki gözlem ile kıyaslarsak aradaki ilişkiyi görebiliriz. Burada t-1 zamandaki gözlem “lagged, gecikmeli” olarak tanımlanır. Benzer şekilde, gözlemi ve ilede kıyaslanabilir. Hataların Bağımlı Olmasının Nedenleri Önemli bir açıklayıcı değişkenin modelde olmaması Örnek birim sayısının az olması Seçilen fonksiyonun tipinin uygun olmaması Ekonomik değişkenlerin zaman serileri analizinde birbirini takip eden hataların trend nedeniyle pozitif otokorelasyon göstermesi Bu durumda regresyon analizinde görülen olumsuz etkiler Regresyon katsayılarının minimum olması sağlanamaz. Otokorelasyon durumunda, t test istatistiği değeri büyük çıkar. Böylece anlamsız bir katsayının anlamlı olma olasılığı artar. 2 de yükselir. Dolayısıyla F değeri olduğundan büyük bulunur. Sonuç olarak t ve F testleri güvenilirliğini yitirip yanıltıcı sonuç verirler. * Otokorelasyon, hata teriminin ardışık değerleri arasındaki ilişki; Otoregresyon, bağımlı değişkenin ardışık değerleri arasındaki ilişkidir. Otokorelasyonun Araştırılması için Yöntemler 1. Grafik Yöntem Eğer zaman serisi analizi ise; de hafta, ay, mesvim ve yıl şeklinde zaman birimleri,

Upload: salih-kurucan

Post on 06-Apr-2016

275 views

Category:

Documents


3 download

DESCRIPTION

otokorelasyon,otokorelasyon nedir,salih kurucan,autocorrelation,otoregresif,

TRANSCRIPT

Page 1: Otokorelasyon - Hataların Bağımsızlığı Varsayımı

Hataların Bağımsızlığı Varsayımı (Otokorelasyon Olmaması Varsayımı) Hataların birbirinden bağımsız olması veya hatalar arasında otokeralasyon olmaması varsayımı bağımlılığa dayanan yöntemlerde önem arz eder. Nasıl korelasyon katsayısı iki değişken arasındaki lineer ilişkiyi gösteriyorsa, otokorelasyon’da aynı şekilde bunu aynı zaman serisi üzerinde bunun uygulanmasıdır. Otokorelasyon hata terimlerinin ardışık değerleri arasında ilişki olması durumudur. Mesela; t zamanındaki gözlem 𝒚𝒕 ile t-1 zamandaki gözlem 𝒚𝒕−𝟏 ile kıyaslarsak aradaki ilişkiyi görebiliriz. Burada t-1 zamandaki gözlem “lagged, gecikmeli” olarak tanımlanır. Benzer şekilde, 𝒚𝒕 gözlemi 𝒚𝒕−𝟐 ve 𝒚𝒕−𝟑 ilede kıyaslanabilir.

Hataların Bağımlı Olmasının Nedenleri

Önemli bir açıklayıcı değişkenin modelde olmaması

Örnek birim sayısının az olması

Seçilen fonksiyonun tipinin uygun olmaması

Ekonomik değişkenlerin zaman serileri analizinde birbirini takip eden hataların trend nedeniyle pozitif otokorelasyon göstermesi

Bu durumda regresyon analizinde görülen olumsuz etkiler

Regresyon katsayılarının minimum olması sağlanamaz.

Otokorelasyon durumunda, t test istatistiği değeri büyük çıkar. Böylece anlamsız bir katsayının anlamlı olma olasılığı artar. 𝑅2 de yükselir. Dolayısıyla F değeri olduğundan büyük bulunur. Sonuç olarak t ve F testleri güvenilirliğini yitirip yanıltıcı sonuç verirler.

* Otokorelasyon, hata teriminin ardışık değerleri arasındaki ilişki; Otoregresyon, bağımlı değişkenin ardışık değerleri arasındaki ilişkidir.

Otokorelasyonun Araştırılması için Yöntemler 1. Grafik Yöntem

Eğer zaman serisi analizi ise; 𝒙 de hafta, ay, mesvim ve yıl şeklinde zaman birimleri,

Page 2: Otokorelasyon - Hataların Bağımsızlığı Varsayımı

Zaman serisi analizi değilse; Bağımsız değişken veya 𝒚′ tahmini değeri dikey eksen ise

standardize hataları 𝒆𝒊 𝑺⁄ gösterir.

A durumu: Standart hataların ortalaması 0 olan normal bir dağılım gösterdiği yani tesadüfi dağıldığı anlaşılır. B durumu: Pozitif büyük hatalar negatif büyük hatalara doğru eğilim gösterdiği için otokorelasyonun pozitif olduğu söylenebilir. C durumu: Negatif büyük hatalar pozitif büyük hatalara doğru hareket ettikleri için otokorelasyonun negatif olduğu söylenebilir. 2. Akış Testi (Run Tests) 1) Parametrik olmayan bu yöntemde önce hipotezler kulur: 𝑯𝟎 : Hatalar anakütlede tesadüfidir. (Birbirinden bağımsızdır) 𝑯𝟏 : Hatalar anakütlede tesadüfi değildir. (Birbirine bağımlıdır) 2) Aşağıdaki formüle göre değerler hesaplanır:

Page 3: Otokorelasyon - Hataların Bağımsızlığı Varsayımı

R: Akış sayısı yani hatalarda işaret değişikliği olduğu durum sayısı 𝑛1 : Pozitif işaretli hata sayısı 𝑛2 : Negatif işaretli hata sayısı 3. Daha sonra 𝑛1ve 𝑛2 ≥ 10 ise;

dönüşümü yapılır. 𝑛1ve 𝑛2 < 10 ise; çeşitli 𝑛1 ve 𝑛2’ler için kritik değerlerin verildiği tablolar kullanılarak test aynen gerçekleştirilir. 4. Bulunan 𝒁 değeri, normal dağılım 𝒁∝

𝟐⁄ değeriyle karşılaştırılır:

𝒁 < 𝒁∝

𝟐⁄ ise 𝐻0 kabul anakütlede hatalar bağımsız yani tesadüfidir.

𝒁 > 𝒁∝𝟐⁄ ise 𝐻0 red anakütlede hataların bağımlıdır.

5. Durbin – Watson Testi

En yaygın olarak kullanılan testtir.

Pozitif ve negatif otokorelasyonların araştırılmasına olanak sağlar. Testte kullanılan d istatistiği şöyledir:

Page 4: Otokorelasyon - Hataların Bağımsızlığı Varsayımı

Her hata ile bir önceki hata arasında farkın kareleri toplamının modelin hata kareleri toplamına bölünmesi ile elde edilir. d istatistiği açıldığında;

ve 𝒆𝒊 ≅ 𝒆𝒊−𝟏 kabul edildiğinde; 𝒅 = 𝟐 − 𝟐�̂� = 𝟐(𝟏 − �̂�) olarak yazılabilir. burada �̂� 𝒆𝒊 ile 𝒆𝒊−𝟏 arasındaki Pearson korelasyon katsayısı yani otokorelasyon katsayısıdır. �̂� = 0 olduğunda otokorelasyon yok demektir. d=2 olur. �̂� = 1 olduğunda tam pozitif otokorelasyon var demektir. d=0 olur. �̂� = −1 olduğunda tam negatif otokorelasyon var demektir. d=4 olur. d istatistiği 0-4 değerleri arasında bir değer almaktadır. d istatistiği hesaplandıktan sonra otokorelasyon testindeki hipotezler ve kararlar gerçekleştirilir. Çift taraflı otokorelasyon testi: 𝑯𝟎 : 𝝆 = 𝟎 Anakütlede otokorelasyon yok. 𝑯𝟏 : 𝝆 ≠ 𝟎 Anakütlede çift taraflı otokorelasyon var. Negatif otokorelasyon testi: 𝑯𝟎 : 𝝆 = 𝟎 Anakütlede otokorelasyon yok. 𝑯𝟏 : 𝝆 < 𝟎 Anakütlede negatif otokorelasyon var.

Page 5: Otokorelasyon - Hataların Bağımsızlığı Varsayımı

Pozitif otokorelasyon testi: 𝑯𝟎 : 𝝆 = 𝟎 Anakütlede otokorelasyon yok. 𝑯𝟏 : 𝝆 > 𝟎 Anakütlede pozitif otokorelasyon var. Karar için örnek birim sayısı n ve k bağımsız değişken sayısı için çift taraflı testler ile tek taraflı testlere ait çeşitli anlamlılık düzeylerindeki d kritik değerleri, Durbin-Watson d istatistiği tablosundan; 𝑑𝐿: 𝑎𝑙𝑡 𝑑𝑒ğ𝑒𝑟 𝑑𝑢: ü𝑠𝑡 𝑑𝑒ğ𝑒𝑟 ile karşılaştırılır. Her üç testte de 𝑑𝐿 < 𝑑 < 𝑑𝑢ise kararsızlık durumu vardır. d değeri arada kalması durumunda otokorelasyon olup olmadığına karar vermek güçleşir. Bunun nedeni otokorelasyon katsayısının sıfırdan ve birden uzak olması tam olrak otokorelasyon var veya yok kararının zorlaşmasıdır. Bu durumda bir kararsızlık aralığı olmayan Von Neumann testi uygulanır.

6. Von Neumann Testi

Zaman serileri için geliştirilmiş bu test n < 15 olduğu durumlarda da uygulanabilen ve kararsızlık aralığı olmayan bir testtir.

Yine Durbin-Watson istatistiğine çok benzemektedir.

d istatistiği ile hesaplanmaktadır. Test istatisiği:

Page 6: Otokorelasyon - Hataların Bağımsızlığı Varsayımı

formülde 𝑛′ = 𝑛 − 𝑘 dır. (k analizde değişken sayısı) Durbin-Watson istatistiğine örnek birim sayısı ve değişken sayısının katksıyıla elde edilmektedir. V değeri, Von Neumann tablosundaki çeşitli anlamlılık düzeyleri ve 𝑛′ değerleri için verilen 𝑉 ve 𝑉′ değerleriyle karşılaştırılmaktadır.

𝑉𝛼 ≤ 𝑉 ≤ 𝑉′𝛼 𝐻0 kabul anakütlede otokorelasyon yok

𝑉 > 𝑉′𝛼 𝐻0 anakütlede negatif korelasyon var.

𝑉 < 𝑉𝛼 𝐻0 anakütlede pozitif korelasyon var.

Hataların Bağımlılığı (Otokorelasyon) Durumunda Çözümler

Eksik açıklayıcı değişken varsa modele dahil edilir.

Örnek birim sayısı artırılır.

Fonksiyon tipi değiştirilerek uygun olan fonksiyon seçilir. Bu yöntemlere rağmen otokorelasyon devam ediyorsa otokorelasyon katsayısının tahmin değeri hesaplanır ve modeldeki her değişken 𝒚𝒊 − �̂�𝒚𝒊−𝟏 ve 𝒙𝒊 − �̂�𝒙𝒊−𝟏 dönüşümüyle modele dahil edilir. Bir diğer çözüm otokorelasyon tahmini 𝝆 ≅ 𝟏 olması durumunda uygulanır. Bir önceki çözümde �̂� yerine �̂� = 𝟏 konulur yani her değişkenin bir önceki değerinden farkı 𝒚𝒊 − 𝒚𝒊−𝟏 ve 𝒙𝒊 − 𝒙𝒊−𝟏 alınarak model oluşturulur. Çözüm yolları denendikten sonra Durbin-Watson testi yeniden uygulanarak otokorelasyonun ortadan kalkıp kalkmadığı tekrar araştırılır.

Page 7: Otokorelasyon - Hataların Bağımsızlığı Varsayımı

ÖRNEK: 2012 ve 2013 yılları için Mayıs ayından Eylül ayına kadar haftalık bazda ortalama elektrik talebi verisi ve türkiye geneli sıcaklık ortalaması mevcuttur. Artan hava sıcaklığına bağlı olarak elektrik talebinin artış gösterdiği ve klimaların vs. kullanımı nedeniyle aralarında pozitif bir ilişki olduğu bilinmektedir.

Page 8: Otokorelasyon - Hataların Bağımsızlığı Varsayımı

Scatter Plot:

Lineer Regresyon Modeli Uygulanırsa

Model Summaryb

Model R R Square

Adjusted R

Square

Std. Error of the

Estimate Durbin-Watson

1 ,906a ,820 ,815 1040,27636 1,162

a. Predictors: (Constant), ortalama sıcaklık

b. Dependent Variable: elektrik talebi

ANOVA

Sum of Squares df Mean Square F Sig.

Regression 1,923E8 1 1,923E8 177,717 ,000

Residual 42204820,986 39 1082174,897

Total 2,345E8 40

The independent variable is ortalama sıcaklık.

Page 9: Otokorelasyon - Hataların Bağımsızlığı Varsayımı

Coefficientsa

Model

Unstandardized Coefficients

Standardized

Coefficients

t Sig. B Std. Error Beta

1 (Constant) 18585,522 1228,001 15,135 ,000

ortalama sıcaklık 671,687 50,385 ,906 13,331 ,000

a. Dependent Variable: elektrik talebi

Otokorelasyon Kontrolü: Kalıntılar denklemin standart hatasına bölünür ve bunlar tahmin değerleri ile grafikte gösterilirse:

Page 10: Otokorelasyon - Hataların Bağımsızlığı Varsayımı
Page 11: Otokorelasyon - Hataların Bağımsızlığı Varsayımı
Page 12: Otokorelasyon - Hataların Bağımsızlığı Varsayımı

Durbin-Watson katsayısı 1,162 olarak bulunmuştu. Durbin-Watson tablosu 𝜶 = 𝟎, 𝟎𝟓 için;

Page 13: Otokorelasyon - Hataların Bağımsızlığı Varsayımı

SPSS üzerinden Analyze > Forecasting > Autocorrelations.. fonksiyonu çalıştırılısa:

Autocorrelations

Series:Error for elektriktalebi with ortalamasıcaklık from CURVEFIT, MOD_2 LINEAR

Lag Autocorrelation Std. Errora

Box-Ljung Statistic

Value df Sig.b

1 ,414 ,151 7,550 1 ,006

2 ,038 ,149 7,617 2 ,022

3 -,025 ,147 7,647 3 ,054

4 ,008 ,145 7,650 4 ,105

5 -,193 ,143 9,482 5 ,091

6 -,144 ,141 10,522 6 ,104

7 ,048 ,139 10,642 7 ,155

8 ,082 ,137 10,999 8 ,202

9 ,102 ,135 11,566 9 ,239

10 ,111 ,133 12,262 10 ,268

11 ,128 ,130 13,218 11 ,279

12 ,024 ,128 13,252 12 ,351

13 -,102 ,126 13,903 13 ,381

14 -,094 ,124 14,479 14 ,415

15 -,083 ,121 14,944 15 ,455

16 -,018 ,119 14,968 16 ,527

17 ,020 ,117 14,999 17 ,596

18 ,185 ,114 17,618 18 ,481

19 ,088 ,112 18,235 19 ,507

20 ,035 ,109 18,336 20 ,565

21 -,092 ,107 19,081 21 ,580

22 -,153 ,104 21,241 22 ,506

23 -,124 ,101 22,749 23 ,476

24 -,036 ,098 22,882 24 ,527

25 ,006 ,095 22,886 25 ,584

26 -,005 ,092 22,890 26 ,639

27 ,029 ,089 22,995 27 ,685

28 ,078 ,086 23,811 28 ,691

29 ,119 ,083 25,899 29 ,631

30 ,045 ,079 26,228 30 ,663

31 -,097 ,075 27,871 31 ,628

32 -,183 ,071 34,449 32 ,351

Page 14: Otokorelasyon - Hataların Bağımsızlığı Varsayımı

33 -,197 ,067 42,982 33 ,114

34 -,186 ,063 51,661 34 ,027

35 -,140 ,058 57,431 35 ,010

36 -,098 ,053 60,786 36 ,006

37 -,052 ,048 61,996 37 ,006

38 -,022 ,041 62,275 38 ,008

39 -,011 ,034 62,385 39 ,010

a. The underlying process assumed is independence (white noise).

b. Based on the asymptotic chi-square approximation.

Page 15: Otokorelasyon - Hataların Bağımsızlığı Varsayımı

Modele Dönüşümlerin Uygulanması

Model Summaryb

Model R R Square

Adjusted R

Square

Std. Error of the

Estimate Durbin-Watson

1 ,818a ,669 ,660 949,25145 1,814

a. Predictors: (Constant), sicaklikyeni

b. Dependent Variable: talepyeni

ANOVAb

Model Sum of Squares df Mean Square F Sig.

1 Regression 69147251,059 1 69147251,059 76,738 ,000a

Residual 34240976,264 38 901078,323

Total 1,034E8 39

a. Predictors: (Constant), sicaklikyeni

b. Dependent Variable: talepyeni

Page 16: Otokorelasyon - Hataların Bağımsızlığı Varsayımı

Coefficientsa

Model

Unstandardized Coefficients

Standardized

Coefficients

t Sig. B Std. Error Beta

1 (Constant) 11767,306 1021,310 11,522 ,000

sicaklikyeni 616,811 70,412 ,818 8,760 ,000

a. Dependent Variable: talepyeni

Residuals Statisticsa

Minimum Maximum Mean Std. Deviation N

Predicted Value 17422,6563 22730,6191 20616,8903 1331,54288 40

Residual -2315,15430 2044,82385 ,00000 937,00253 40

Std. Predicted Value -2,399 1,587 ,000 1,000 40

Std. Residual -2,439 2,154 ,000 ,987 40

a. Dependent Variable: talepyeni