otokorelasyon - hataların bağımsızlığı varsayımı
DESCRIPTION
otokorelasyon,otokorelasyon nedir,salih kurucan,autocorrelation,otoregresif,TRANSCRIPT
Hataların Bağımsızlığı Varsayımı (Otokorelasyon Olmaması Varsayımı) Hataların birbirinden bağımsız olması veya hatalar arasında otokeralasyon olmaması varsayımı bağımlılığa dayanan yöntemlerde önem arz eder. Nasıl korelasyon katsayısı iki değişken arasındaki lineer ilişkiyi gösteriyorsa, otokorelasyon’da aynı şekilde bunu aynı zaman serisi üzerinde bunun uygulanmasıdır. Otokorelasyon hata terimlerinin ardışık değerleri arasında ilişki olması durumudur. Mesela; t zamanındaki gözlem 𝒚𝒕 ile t-1 zamandaki gözlem 𝒚𝒕−𝟏 ile kıyaslarsak aradaki ilişkiyi görebiliriz. Burada t-1 zamandaki gözlem “lagged, gecikmeli” olarak tanımlanır. Benzer şekilde, 𝒚𝒕 gözlemi 𝒚𝒕−𝟐 ve 𝒚𝒕−𝟑 ilede kıyaslanabilir.
Hataların Bağımlı Olmasının Nedenleri
Önemli bir açıklayıcı değişkenin modelde olmaması
Örnek birim sayısının az olması
Seçilen fonksiyonun tipinin uygun olmaması
Ekonomik değişkenlerin zaman serileri analizinde birbirini takip eden hataların trend nedeniyle pozitif otokorelasyon göstermesi
Bu durumda regresyon analizinde görülen olumsuz etkiler
Regresyon katsayılarının minimum olması sağlanamaz.
Otokorelasyon durumunda, t test istatistiği değeri büyük çıkar. Böylece anlamsız bir katsayının anlamlı olma olasılığı artar. 𝑅2 de yükselir. Dolayısıyla F değeri olduğundan büyük bulunur. Sonuç olarak t ve F testleri güvenilirliğini yitirip yanıltıcı sonuç verirler.
* Otokorelasyon, hata teriminin ardışık değerleri arasındaki ilişki; Otoregresyon, bağımlı değişkenin ardışık değerleri arasındaki ilişkidir.
Otokorelasyonun Araştırılması için Yöntemler 1. Grafik Yöntem
Eğer zaman serisi analizi ise; 𝒙 de hafta, ay, mesvim ve yıl şeklinde zaman birimleri,
Zaman serisi analizi değilse; Bağımsız değişken veya 𝒚′ tahmini değeri dikey eksen ise
standardize hataları 𝒆𝒊 𝑺⁄ gösterir.
A durumu: Standart hataların ortalaması 0 olan normal bir dağılım gösterdiği yani tesadüfi dağıldığı anlaşılır. B durumu: Pozitif büyük hatalar negatif büyük hatalara doğru eğilim gösterdiği için otokorelasyonun pozitif olduğu söylenebilir. C durumu: Negatif büyük hatalar pozitif büyük hatalara doğru hareket ettikleri için otokorelasyonun negatif olduğu söylenebilir. 2. Akış Testi (Run Tests) 1) Parametrik olmayan bu yöntemde önce hipotezler kulur: 𝑯𝟎 : Hatalar anakütlede tesadüfidir. (Birbirinden bağımsızdır) 𝑯𝟏 : Hatalar anakütlede tesadüfi değildir. (Birbirine bağımlıdır) 2) Aşağıdaki formüle göre değerler hesaplanır:
R: Akış sayısı yani hatalarda işaret değişikliği olduğu durum sayısı 𝑛1 : Pozitif işaretli hata sayısı 𝑛2 : Negatif işaretli hata sayısı 3. Daha sonra 𝑛1ve 𝑛2 ≥ 10 ise;
dönüşümü yapılır. 𝑛1ve 𝑛2 < 10 ise; çeşitli 𝑛1 ve 𝑛2’ler için kritik değerlerin verildiği tablolar kullanılarak test aynen gerçekleştirilir. 4. Bulunan 𝒁 değeri, normal dağılım 𝒁∝
𝟐⁄ değeriyle karşılaştırılır:
𝒁 < 𝒁∝
𝟐⁄ ise 𝐻0 kabul anakütlede hatalar bağımsız yani tesadüfidir.
𝒁 > 𝒁∝𝟐⁄ ise 𝐻0 red anakütlede hataların bağımlıdır.
5. Durbin – Watson Testi
En yaygın olarak kullanılan testtir.
Pozitif ve negatif otokorelasyonların araştırılmasına olanak sağlar. Testte kullanılan d istatistiği şöyledir:
Her hata ile bir önceki hata arasında farkın kareleri toplamının modelin hata kareleri toplamına bölünmesi ile elde edilir. d istatistiği açıldığında;
ve 𝒆𝒊 ≅ 𝒆𝒊−𝟏 kabul edildiğinde; 𝒅 = 𝟐 − 𝟐�̂� = 𝟐(𝟏 − �̂�) olarak yazılabilir. burada �̂� 𝒆𝒊 ile 𝒆𝒊−𝟏 arasındaki Pearson korelasyon katsayısı yani otokorelasyon katsayısıdır. �̂� = 0 olduğunda otokorelasyon yok demektir. d=2 olur. �̂� = 1 olduğunda tam pozitif otokorelasyon var demektir. d=0 olur. �̂� = −1 olduğunda tam negatif otokorelasyon var demektir. d=4 olur. d istatistiği 0-4 değerleri arasında bir değer almaktadır. d istatistiği hesaplandıktan sonra otokorelasyon testindeki hipotezler ve kararlar gerçekleştirilir. Çift taraflı otokorelasyon testi: 𝑯𝟎 : 𝝆 = 𝟎 Anakütlede otokorelasyon yok. 𝑯𝟏 : 𝝆 ≠ 𝟎 Anakütlede çift taraflı otokorelasyon var. Negatif otokorelasyon testi: 𝑯𝟎 : 𝝆 = 𝟎 Anakütlede otokorelasyon yok. 𝑯𝟏 : 𝝆 < 𝟎 Anakütlede negatif otokorelasyon var.
Pozitif otokorelasyon testi: 𝑯𝟎 : 𝝆 = 𝟎 Anakütlede otokorelasyon yok. 𝑯𝟏 : 𝝆 > 𝟎 Anakütlede pozitif otokorelasyon var. Karar için örnek birim sayısı n ve k bağımsız değişken sayısı için çift taraflı testler ile tek taraflı testlere ait çeşitli anlamlılık düzeylerindeki d kritik değerleri, Durbin-Watson d istatistiği tablosundan; 𝑑𝐿: 𝑎𝑙𝑡 𝑑𝑒ğ𝑒𝑟 𝑑𝑢: ü𝑠𝑡 𝑑𝑒ğ𝑒𝑟 ile karşılaştırılır. Her üç testte de 𝑑𝐿 < 𝑑 < 𝑑𝑢ise kararsızlık durumu vardır. d değeri arada kalması durumunda otokorelasyon olup olmadığına karar vermek güçleşir. Bunun nedeni otokorelasyon katsayısının sıfırdan ve birden uzak olması tam olrak otokorelasyon var veya yok kararının zorlaşmasıdır. Bu durumda bir kararsızlık aralığı olmayan Von Neumann testi uygulanır.
6. Von Neumann Testi
Zaman serileri için geliştirilmiş bu test n < 15 olduğu durumlarda da uygulanabilen ve kararsızlık aralığı olmayan bir testtir.
Yine Durbin-Watson istatistiğine çok benzemektedir.
d istatistiği ile hesaplanmaktadır. Test istatisiği:
formülde 𝑛′ = 𝑛 − 𝑘 dır. (k analizde değişken sayısı) Durbin-Watson istatistiğine örnek birim sayısı ve değişken sayısının katksıyıla elde edilmektedir. V değeri, Von Neumann tablosundaki çeşitli anlamlılık düzeyleri ve 𝑛′ değerleri için verilen 𝑉 ve 𝑉′ değerleriyle karşılaştırılmaktadır.
𝑉𝛼 ≤ 𝑉 ≤ 𝑉′𝛼 𝐻0 kabul anakütlede otokorelasyon yok
𝑉 > 𝑉′𝛼 𝐻0 anakütlede negatif korelasyon var.
𝑉 < 𝑉𝛼 𝐻0 anakütlede pozitif korelasyon var.
Hataların Bağımlılığı (Otokorelasyon) Durumunda Çözümler
Eksik açıklayıcı değişken varsa modele dahil edilir.
Örnek birim sayısı artırılır.
Fonksiyon tipi değiştirilerek uygun olan fonksiyon seçilir. Bu yöntemlere rağmen otokorelasyon devam ediyorsa otokorelasyon katsayısının tahmin değeri hesaplanır ve modeldeki her değişken 𝒚𝒊 − �̂�𝒚𝒊−𝟏 ve 𝒙𝒊 − �̂�𝒙𝒊−𝟏 dönüşümüyle modele dahil edilir. Bir diğer çözüm otokorelasyon tahmini 𝝆 ≅ 𝟏 olması durumunda uygulanır. Bir önceki çözümde �̂� yerine �̂� = 𝟏 konulur yani her değişkenin bir önceki değerinden farkı 𝒚𝒊 − 𝒚𝒊−𝟏 ve 𝒙𝒊 − 𝒙𝒊−𝟏 alınarak model oluşturulur. Çözüm yolları denendikten sonra Durbin-Watson testi yeniden uygulanarak otokorelasyonun ortadan kalkıp kalkmadığı tekrar araştırılır.
ÖRNEK: 2012 ve 2013 yılları için Mayıs ayından Eylül ayına kadar haftalık bazda ortalama elektrik talebi verisi ve türkiye geneli sıcaklık ortalaması mevcuttur. Artan hava sıcaklığına bağlı olarak elektrik talebinin artış gösterdiği ve klimaların vs. kullanımı nedeniyle aralarında pozitif bir ilişki olduğu bilinmektedir.
Scatter Plot:
Lineer Regresyon Modeli Uygulanırsa
Model Summaryb
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate Durbin-Watson
1 ,906a ,820 ,815 1040,27636 1,162
a. Predictors: (Constant), ortalama sıcaklık
b. Dependent Variable: elektrik talebi
ANOVA
Sum of Squares df Mean Square F Sig.
Regression 1,923E8 1 1,923E8 177,717 ,000
Residual 42204820,986 39 1082174,897
Total 2,345E8 40
The independent variable is ortalama sıcaklık.
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig. B Std. Error Beta
1 (Constant) 18585,522 1228,001 15,135 ,000
ortalama sıcaklık 671,687 50,385 ,906 13,331 ,000
a. Dependent Variable: elektrik talebi
Otokorelasyon Kontrolü: Kalıntılar denklemin standart hatasına bölünür ve bunlar tahmin değerleri ile grafikte gösterilirse:
Durbin-Watson katsayısı 1,162 olarak bulunmuştu. Durbin-Watson tablosu 𝜶 = 𝟎, 𝟎𝟓 için;
SPSS üzerinden Analyze > Forecasting > Autocorrelations.. fonksiyonu çalıştırılısa:
Autocorrelations
Series:Error for elektriktalebi with ortalamasıcaklık from CURVEFIT, MOD_2 LINEAR
Lag Autocorrelation Std. Errora
Box-Ljung Statistic
Value df Sig.b
1 ,414 ,151 7,550 1 ,006
2 ,038 ,149 7,617 2 ,022
3 -,025 ,147 7,647 3 ,054
4 ,008 ,145 7,650 4 ,105
5 -,193 ,143 9,482 5 ,091
6 -,144 ,141 10,522 6 ,104
7 ,048 ,139 10,642 7 ,155
8 ,082 ,137 10,999 8 ,202
9 ,102 ,135 11,566 9 ,239
10 ,111 ,133 12,262 10 ,268
11 ,128 ,130 13,218 11 ,279
12 ,024 ,128 13,252 12 ,351
13 -,102 ,126 13,903 13 ,381
14 -,094 ,124 14,479 14 ,415
15 -,083 ,121 14,944 15 ,455
16 -,018 ,119 14,968 16 ,527
17 ,020 ,117 14,999 17 ,596
18 ,185 ,114 17,618 18 ,481
19 ,088 ,112 18,235 19 ,507
20 ,035 ,109 18,336 20 ,565
21 -,092 ,107 19,081 21 ,580
22 -,153 ,104 21,241 22 ,506
23 -,124 ,101 22,749 23 ,476
24 -,036 ,098 22,882 24 ,527
25 ,006 ,095 22,886 25 ,584
26 -,005 ,092 22,890 26 ,639
27 ,029 ,089 22,995 27 ,685
28 ,078 ,086 23,811 28 ,691
29 ,119 ,083 25,899 29 ,631
30 ,045 ,079 26,228 30 ,663
31 -,097 ,075 27,871 31 ,628
32 -,183 ,071 34,449 32 ,351
33 -,197 ,067 42,982 33 ,114
34 -,186 ,063 51,661 34 ,027
35 -,140 ,058 57,431 35 ,010
36 -,098 ,053 60,786 36 ,006
37 -,052 ,048 61,996 37 ,006
38 -,022 ,041 62,275 38 ,008
39 -,011 ,034 62,385 39 ,010
a. The underlying process assumed is independence (white noise).
b. Based on the asymptotic chi-square approximation.
Modele Dönüşümlerin Uygulanması
Model Summaryb
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate Durbin-Watson
1 ,818a ,669 ,660 949,25145 1,814
a. Predictors: (Constant), sicaklikyeni
b. Dependent Variable: talepyeni
ANOVAb
Model Sum of Squares df Mean Square F Sig.
1 Regression 69147251,059 1 69147251,059 76,738 ,000a
Residual 34240976,264 38 901078,323
Total 1,034E8 39
a. Predictors: (Constant), sicaklikyeni
b. Dependent Variable: talepyeni
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig. B Std. Error Beta
1 (Constant) 11767,306 1021,310 11,522 ,000
sicaklikyeni 616,811 70,412 ,818 8,760 ,000
a. Dependent Variable: talepyeni
Residuals Statisticsa
Minimum Maximum Mean Std. Deviation N
Predicted Value 17422,6563 22730,6191 20616,8903 1331,54288 40
Residual -2315,15430 2044,82385 ,00000 937,00253 40
Std. Predicted Value -2,399 1,587 ,000 1,000 40
Std. Residual -2,439 2,154 ,000 ,987 40
a. Dependent Variable: talepyeni