alekhin_ts

56
ОРЛОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ КАФЕДРА МАТЕМАТИКИ И ИНФОРМАТИКИ Е.И.Алехин ОСНОВЫ АНАЛИЗА ВРЕМЕННЫХ РЯДОВ Методические рекомендации студентам факультета экономики и управления ОГУ Орел 2005

Upload: nicolae-zaharia

Post on 23-Oct-2014

872 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: alekhin_ts

ОРЛОВСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ КАФЕДРА МАТЕМАТИКИ И ИНФОРМАТИКИ

Е.И.Алехин

ОСНОВЫ АНАЛИЗА ВРЕМЕННЫХ РЯДОВ

Методические рекомендации студентам факультета экономики и управления ОГУ

Орел 2005

Page 2: alekhin_ts

2

Page 3: alekhin_ts

3

ОГЛАВЛЕНИЕ I. ПРИЕМЫ ПРИКЛАДНОГО АНАЛИЗА ВРЕМЕННЫХ РЯДОВ.................................. 4

1.0 Введение ..................................................................................................................... 4 1.1 Сглаживание данных ................................................................................................. 6

1.1.1 Простое скользящее среднее............................................................................... 6 1.1.2 Взвешенное скользящее среднее ........................................................................ 8 1.1.3 Простое экспоненциальное сглаживание ........................................................... 9

1.2 Модели временных рядов. Выделение тренда ........................................................ 11 1.3 Сезонная компонента............................................................................................... 13

II . ОСНОВЫ АНАЛИЗА СТАЦИОНАРНЫХ ВРЕМЕННЫХ РЯДОВ.......................... 18 2.0 Введение ................................................................................................................... 18 2.1 Процесс белого шума ............................................................................................... 19 2.2 Процесс авторегрессии первого порядка ................................................................ 20 2.3 Процесс авторегрессии порядка р ........................................................................... 23 2.4. Процесс скользящего среднего порядка q.............................................................. 26 2.5 Смешанный процесс авторегрессии-скользящего среднего .................................. 28 2.6 Идентификация стационарной модели ARMA....................................................... 29

2.6.1 Идентификация модели по виду функций ACF и PACF ................................. 30 2.6.2 Проверка гипотез о значимости коэффициентов корреляции......................... 32 2.6.3 Использование информационных критериев ................................................... 34

2.7 Оценивание коэффициентов модели. Диагностика модели ................................... 34 III. НЕСТАЦИОНАРНЫЕ ВРЕМЕННЫЕ РЯДЫ ............................................................ 36

3.1 Основные типы нестационарных рядов .................................................................. 36 3.2 TS- и DS-ряды .......................................................................................................... 39 3.3 Тесты на наличие единичных корней...................................................................... 41

3.3.1 Тест Дики-Фуллера (Dickey-Fuller) .................................................................. 41 3.3.2 Критерий Филипса-Перрона (Phillips-Perron) .................................................. 42

3.4 Правила построения ARIMA-моделей .................................................................... 43 3.4.1 Несезонные модели. Выбор порядка дифференцирования ............................. 43 3.4.2 Выбор количества AR- и MA-членов ............................................................... 46 3.4.3 Смешанные модели ........................................................................................... 52 3.4.4 Единичные корни .............................................................................................. 52 3.4.5 Сезонные модели............................................................................................... 53

Page 4: alekhin_ts

4

I. ПРИЕМЫ ПРИКЛАДНОГО АНАЛИЗА ВРЕМЕННЫХ РЯДОВ

1.0 Введение

Определение: временным рядом называется последовательность числовых данных, упорядоченных по времени.

Не менее часто используются другие названия для временного ряда: ряд динамики или хронологический ряд.

Пример:

В приведенной ниже таблице приведено четыре примера рядов динамики. Три первых из них представляют собой официальные данные (в тысячах франков) реализаций тремя отделами реализаций одного предприятия с 1964 по 1993 годы (они обозначены через A, B, C). Четвертый временной ряд представляет собой объемы продаж (в тысячах штук) с января 1980 по декабрь 1993 некоторого предприятия D.

Таблица 1

Годы A B C 1964 27,0 34,0 30,0 1965 26,0 21,0 32,0 1966 29,0 49,0 40,0 1967 21,9 27,0 24,0 1968 19,9 29,0 25,0 1969 34,0 49,0 52,0 1970 20,0 25,8 33,0 1971 34,5 33,0 46,0 1972 33,5 44,0 54,0 1973 27,0 29,0 48,0 1974 38,0 39,0 59,0 1975 32,0 37,0 54,0 1976 31,0 49,0 53,0 1977 40,0 53,0 54,0 1978 40,5 41,0 56,0 1979 44,7 55,0 62,0 1980 41,0 25,0 50,0 1981 38,0 25,0 48,0 1982 44,0 27,0 54,0 1983 48,0 55,0 45,0 1984 49,0 42,0 63,0 1985 56,0 41,0 67,0 1986 57,0 43,0 58,0 1987 60,0 46,0 71,0 1988 66,0 50,0 71,0

Page 5: alekhin_ts

5

Годы A B C 1989 65,0 59,0 79,0 1990 67,0 54,0 71,0 1991 71,0 47,0 80,0 1992 72,0 52,0 80,0 1993 74,0 59,0 88,0

Рис. 1.1 Графическое отображение рядов А и С из табл. 1

Временные ряды могут относиться к разным типам. Если данные представляют собой непрерывную функцию времени, говорят о непрерывном хронологическом ряде. Напротив, если данные получены лишь в некоторые, отдельные, моменты времени, говорят о дискретном хронологическом ряде. Примером непрерывного ряда может служить кривая, оставленная самописцем на ленте. Дискретные временные ряды встречаются чаще, чем непрерывные.

Изменение условий развития явления ведет к ослаблению действия одних факторов и усилению других и в конечном счете к варьированию изучаемого признака во времени. Характерным для временного ряда K,, 21 tt xx является то, что порядок в последовательности

K,, 21 tt существенен для анализа, т.е. время выступает как один из определяющих факторов. Это отличает временной ряд от случайной выборки, где индексы служат лишь для удобства идентификации.

Как правило, имеют дело с рядами, определенными в равноотстоящие друг от друга моменты времени. Тогда в качестве единицы времени выбирают интервал между двумя соседними моментами и члены ряда обозначают символами K,,, 210 xxx . Если необходимо рассматривать значения ряда в моменты предшествующие начальному, то используются обозначения 123 ,,, xxxK .

Очевидное требование к временному ряду состоит в том, чтобы результаты наблюдений были сравнимы между собой. Для обеспечения сравнимости в случае, когда временными

Page 6: alekhin_ts

6

интервалами являются месяцы или дни, необходимо до проведения анализа устранять некоторые мешающие эффекты. Например, месяцы имеют различную продолжительность, общественные праздники влияют на сравнимость экономических и социологических данных.

Задачи анализа временных рядов

Временной ряд является совокупностью наблюдений случайного процесса. Во временных рядах главный интерес представляет описание или моделирование их структуры. Применяемые при обработке временных рядов методы во многом опираются на методы и характеристики, разработанные математической статистикой. Последние базируются на достаточно жестких требованиях к исходным данным (таким как однородность данных, предположения о типе их распределения и т. д.). В то же время при исследовании временных рядов (особенно экономических данных) проверка выполнимости этих требований в должной мере зачастую невозможна. Поэтому выводы, полученные на базе формально-статистического инструментария, должны восприниматься с осторожностью и дополняться содержательным анализом.

Следует иметь в виду, что конечной целью анализа временных рядов (как и статистического анализа вообще), является достижение более глубокого понимания тех причинных механизмов, которые обусловливают появление этих рядов.

Можно выделить три основных задачи исследования временных рядов:

1. Описание изменения исследуемого признака во времени и выявление свойств исследуемого ряда.

2. Объяснение механизма изменения уровней ряда. 3. Статистическое прогнозирование значений изучаемого признака для будущих моментов

времени. Задачу прогнозирования можно сформулировать следующим образом:

По имеющейся информации (данным) X требуется предсказать величину Y, которую нельзя измерить непосредственно, но которая стохастически связанна с X (т.е. имеет с X некоторое совместное распределение L(X, Y)).

1.1 Сглаживание данных

1.1.1 Простое скользящее среднее

Пусть имеется некоторый ряд значений

K,, 21 xx Предполагается, что на значения этого ряда оказывают влияние как закономерные, так и случайные факторы. Чтобы сгладить влияние случайных флуктуаций, можно вычислить скользящее среднее временного ряда.

Сглаживание временного ряда представляет собой представление тренда в данной точке посредством взвешенного среднего значений, наблюдаемых в окрестностях этой точки. Оно определяется для каждого момента времени, за исключение нескольких первых и нескольких последних точек.

Page 7: alekhin_ts

7

В простейшем случае вычисление производится следующим образом: берется k значений временного ряда, начиная с tx , соответствующего текущему моменту времени t:

121 ,,,, +−−− ktttt xxxx K , и находится их среднее арифметическое

knktk

xxxxxs ktkttktktt −+=

++++++= +−++−− ,,1,11 K

KK. (1)

Затем точка t сдвигается вправо на один шаг, опять производится усреднение значений временного ряда и т.д.

Временной интервал, по которому производится усреднение, называется окном. Окно представляет собой натуральное число, большее единицы. В рассмотренном примере ширина окна равна k.

Пример:

Рассмотрим следующий пример: найдем скользящее среднее следующего временного ряда С из таблицы 1 при ширине окна, равной 3.

В результате вычислений по формуле (1) получим следующую таблицу: Годы 1964 1965 1966 1967 1968 1969 1970 1971 1972 C 30,00 32,00 40,00 24,00 25,00 52,00 33,00 46,00 54,00 C1 34,00 32,00 29,67 33,67 36,67 43,67 44,33 49,33 Годы 1973 1974 1975 1976 1977 1978 1979 1980 1981 C 48,00 59,00 54,00 53,00 54,00 56,00 62,00 50,00 48,00 C1 53,67 53,67 55,33 53,67 54,33 57,33 56,00 53,33 50,67 Годы 1982 1983 1984 1985 1986 1987 1988 1989 1990 C 54,00 45,00 63,00 67,00 58,00 71,00 71,00 79,00 71,00 C1 49,00 54,00 58,33 62,67 65,33 66,67 73,67 73,67 76,67 Годы 1991 1992 1993 C 80,00 80,00 88,00 C1 77,00 82,67

Здесь ряд С1 содержит усредненные значения. Результат усреднения графически представлен на рис. 1.2

Page 8: alekhin_ts

8

Рис. 1.2 Рассмотренный пример описывает центрированное сглаживание. При центрированном сглаживании данные усредняются на основании значений справа и слева симметрично от выбранной точки.

Ряд необязательно должен быть центрированным. Иногда убывает удобным начинать нумерацию точек сглаженного ряда таким образом, чтобы последние индексы радов tx и ts совпадали. В правой части рис. 1.3 представлен график именно такого сглаженного ряда С2. Левая часть воспроизводит рис. 1.2 в уменьшенном масштабе.

Рис. 1.3

Видно, что ряд в правой части рис. 1.3 сдвинут по сравнению с центрированным рядом. изображенным в левой части рисунка.

1.1.2 Взвешенное скользящее среднее

Используемым при вычислении скользящего среднего значениям исходного ряда можно приписать веса. Чем больше вес данного значения, тем больше его вклад в среднее значение. Как правило, более поздним наблюдениям приписывается больший вес.

Взвешенное скользящее среднее определяется формулой

k

ktkktkktkktkt www

xwxwxwxws+++

++++= +−+−+−+−−−

K

K

21

1111 (1)

или

mnmtmkxwsm

miitit −+=+== ∑

−=+ ,,1;12, K (2)

Известно, что при выравнивании скользящим средним без отрицательных весов, в тенденцию привносится авторегрессия, т.е. имеет место эффект Слуцкого-Юла.

Взвешенное центрированное скользящее среднее часто применяется при сглаживании данных, содержащих сезонную компоненту (см. ниже).

Веса iw могут быть заданы исследователем, а могут быть и определены в результате решения системы нормальных уравнений.

Page 9: alekhin_ts

9

Предположим, что нам нужно построить наилучшее приближение по пяти точкам ( 2,5 == mk ), и нас устраивает аппроксимация квадратичным полиномом

2210 tataast ++= . Система нормальных уравнений имеет следующий вид:

( )

( )

( )∑

−=

−=

−=

=−−−∂

=−−−∂∂

=−−−∂

m

mtt

m

mtt

m

mtt

tataaxa

tataaxa

tataaxa

,0

,0

,0

22210

2

22210

1

22210

0

а ее решение для 0a можно записать следующим образом:

( )21122

0 31217123351517

351

++−−−=−=

−+++−=

−= ∑∑ ttttt

m

mtt

m

mtt xxxxxxtxa ,

откуда определим веса:

353,

3512,

3517,

3512,

353

21012 −====−= −− wwwww .

Остается выяснить вопрос об определении порядка аппроксимирующего полинома. Известно, что если временной ряд содержит в качестве своей неслучайной составляющей алгебраический полином порядка р, то переход к последовательным разностям, при которых исходный ряд заменяется на ряд разностей 2

12321

1121 , xxxyxxxy ∆=−=∆=−= и т.д.,

повторенный 1+p раз (т.е. переход к последовательным разностям порядка 1+p ), исключает неслучайную составляющую. Таким образом, для определения порядка аппроксимирующего полинома нужно взять последовательные разности k раз, пока полученный ряд не утратит тренд и стабилизируется. Это значение k и будет представлять собой увеличенный на 1 порядок полинома: 1−= kp .

1.1.3 Простое экспоненциальное сглаживание

Пусть имеется временной ряд K,2,1, =txt Простое экспоненциальное сглаживание этого ряда определяется формулой

K,2,1,)1( 1 =−+= − tsxs ttt αα (3)

Нетрудно заметить, что при 0=α получаем ряд 1−= tt ss , т.е. прямую линию, а при 1=α — ряд tt xs = , т.е. сглаженный ряд совпадает с несглаженным.

Применяя последовательно формулу (3) саму к себе, получим

L+−+−+= −− 22

1 )1()1( tttt xxxs ααααα (4)

Другими словами, простое экспоненциальное сглаживание представляет собой вариант вычисления взвешенного скользящего среднего с экспоненциально убывающими весами и бесконечным числом слагаемых, по которым проводится усреднение.

Page 10: alekhin_ts

10

Нетрудно заметить, что последовательность весов образует геометрическую прогрессию с первым членом α и знаменателем )1( α− . Нетрудно убедиться, что сумма этой прогрессии равна единице, как это и должно быть для суммы весов.

Экспоненциальное сглаживание позволяет учитывать все значения временного ряда. При этом наибольшее влияние на результат вычислений оказывают последние значения.

Этот метод применяется для прогнозирования нестационарных временных рядов, имеющих случайные изменения уровня и угла наклона. По мере удаления от текущего момента времени в прошлое вес соответствующего члена ряда быстро (экспоненциально) уменьшается и практически перестает оказывать какое-либо влияние на значение st.

Легко получить, что )( 11 −− −+= tttt sxss α .

Последнее соотношение позволяет дать следующую интерпретацию экспоненциальной средней: если 1−ts — прогноз значения ряда xt, то разность 1−− tt sx есть погрешность прогноза; таким образом прогноз st для следующего момента времени t+1 учитывает ставшую известной в момент t ошибку прогноза.

Можно показать, что математические ожидания наблюдений и экспоненциальных средних совпадают, а дисперсия сглаженных уровней меньше дисперсии наблюдений. Если α близка к единице, то различие между дисперсиями невелико, однако с уменьшением α колебания экспоненциальной средней все более поглощаются.

На рис. 1.4 представлен ряд данных, сглаженный при различных значениях параметра α .

Рис. 1.4

Как и следовало ожидать, при очень малых значениях α сглаживание оказывается слишком сильным и искажает тренд. При больших же значениях этого параметра сглаживание оказывается незначительным.

Page 11: alekhin_ts

11

Метод экспоненциального сглаживания часто применяется для краткосрочного прогнозирования. При этом основной задачей является выбор параметра сглаживания. Общие соображения таковы: метод хорош для прогнозирования достаточно гладких рядов. В этом случае можно выбрать сглаживающую константу путем минимизации ошибки прогноза на один шаг вперед, оцененной по последней трети ряда. Если же высокочастотная компонента ряда имеет достаточно большую дисперсию, не следует использовать большие значения параметра сглаживания, например, большие 0.2. (Использование больших значений сглаживающей константы приведет к плохим прогнозам.)

1.2 Модели временных рядов. Выделение тренда

В общем случае при исследовании динамических рядов экономических показателей выделяют следующие четыре основные составляющие:

1. устойчивую систематически изменяющуюся долговременную составляющую — тренд Т,

2. циклические колебания С, 3. сезонную составляющую S, 4. остаток ε .

Тренд является долговременной тенденцией изменения, обусловленной ростом популяции, технологическими изменениями и другими долговременными воздействиями.

Циклическая (конъюнктурная) составляющая проявляется на протяжении длительного времени и является результатом действия факторов, обладающих большим последействием, либо циклически изменяющихся со временем. Характерным примером служат циклы деловой активности, демографические и астрофизические циклы. Циклическое изменение не обязательно периодично.

Сезонная составляющая обусловлена действием некоторого периодически повторяющегося в определенное время года механизма.

Случайная составляющая не поддается учету и регистрации, образована в результате суперпозиции большого числа внешних факторов, не участвующих в формировании детерминированной составляющей.

Первые три составляющие часто объединяют в одну детерминированную и рассматривают модель ряда в виде

ttttt CTSfx ε+= ),,( . (1) Надо, однако, помнить, что такая операция разложения, допустимая с математической точки зрения и часто полезная для осознания механизма формирования изучаемого явления, может в некоторых случаях ввести в заблуждение. В частности, при таком подходе чрезмерным упрощением может оказаться предположение о независимом действии указанных составляющих.

Определение: трендом (или тенденцией) называют неслучайную медленно меняющуюся составляющую временного ряда, на которую могут накладываться случайные колебания или сезонные эффекты.

Не вполне строгое понятие тренда лежит в основе нескольких моделей и методов анализа временных рядов, так или иначе разлагающих временной ряд на несколько компонент, одна

Page 12: alekhin_ts

12

из которых является в том или ином смысле достаточно гладкой, а остальные компоненты характеризуют воздействие случайных факторов.

Следует признать относительность слов «медленно меняющаяся составляющая» в определении тренда. Это зависит от поставленных целей. Например, при исследовании величины осадков в течении сотни лет, медленное увеличение в течение всей длительности изучаемого периода может быть понято как тренд, однако на самом деле этот рост осадков, характерный для данного столетия, может оказаться частью некоторого медленного колебательного процесса наблюдаемого в пределах нескольких тысячелетий. Делать вывод на тысячелетие вперед на основе «тренда», выявленного по данным одного столетия, очевидно, неправильно.

Говоря о тренде, мы должны учитывать длину ряда, к которому относится формулируемое утверждение. При различении тренда и колебания невозможно исключить из рассуждений элемент субъективности. Поэтому на практике, при прикладном анализе временных рядов, часто объединяют тренд и циклическую составляющую в одну компоненту tTC .

Проверка гипотезы о существовании тренда

Для выявления факта наличия или отсутствия неслучайной составляющей, то есть для проверки гипотезы о существовании тренда можно использовать несколько критериев. Нулевая гипотеза заключается в отсутствии тренда:

constaxEH t ==)(:0 . (2) 1. Критерий серий Определяем медиану ряда medx и образуем последовательность плюсов и минусов, соответствующую исходному ряду, по правилу: если medt xx > , то tx соответствует плюс, если medt xx < , то — минус. Под серией понимается последовательность подряд идущих плюсов и подряд идущих минусов. Подсчитаем общее число серий ν и протяженность самой длинной серии τ . Если хотя бы одно из неравенств:

)196,12(21

−−+> nnν ,

)1ln(43,1 +< nτ (3)

окажется нарушенным, то гипотеза Н0 отвергается с вероятностью ошибки 0975.00500.0 ≤≤ α .

2. Критерий «восходящих» и «нисходящих» серий Аналогично предыдущему критерию исследуется последовательность плюсов и минусов. Правило построения последовательности: 01 >−+ tt xx , то tx соответствует плюс, если

01 <−+ tt xx , то — минус (если подряд идут несколько равных наблюдений, то во внимание принимается одно из них).

Если хотя бы одно из неравенств:

−−−> )

90291696,1)12(

31 nnν ,

0ττ < ,

(3)

Page 13: alekhin_ts

13

где 0τ определяется из следующей таблицы: n 26≤n 15326 ≤< n 1170153 ≤< n

0τ 5 6 7 окажется нарушенным, то гипотеза Н0 отвергается с вероятностью ошибки

0975.00500.0 ≤≤ α .

1.3 Сезонная компонента

Определение. Под сезонностью понимают систематически повторяющиеся колебания показателей, обусловленные особенностями производственных условий (или условий сбыта) в определенный период.

Примером сезонных колебаний могут служить рыночные цены на сельскохозяйственную продукцию, например на картофель. Очевидно, что цены будут самыми низкими в период после уборки основных сортов картофеля, потом по мере роста затрат на хранение цены будут увеличиваться и достигнут своего максимума перед урожаем следующего года. И это повторяется каждый год.

Сезонные колебания присутствуют не только в сельскохозяйственных рядах, но и во многих общеэкономических. Потребление электроэнергии, газа, продажа определенных видов товаров, деловая активность предприятий — все эти ряды в той или иной степени подвержены эффекту сезонности.

Причинами возникновения сезонности являются эффекты, связанные с астрономическими либо календарными причинами. Так, в ряду ежемесячных данных естественно ожидать наличие сезонных эффектов с периодом 12, в квартальных рядах — с периодом 4. В свою очередь, в информации, собираемой с интервалом 1 час, вполне могут возникнуть сезонные эффекты с периодом 24.

Применительно к задачам краткосрочного управления и прогнозирования сезонная составляющая зачастую не является информативной, т.е. при прогнозе основная проблема сводится к оценке тенденции, после чего эта оценка корректируется на сезонность. Таким образом, при анализе и прогнозе временных рядов мы два раза сталкиваемся с необходимостью учета влияния сезонности. Во-первых, при оценке тенденции, которая представляет собой ряд, очищенный от случайной составляющей и сезонности. Сезонная составляющая в таких случаях лишь затрудняют идентификацию тех составляющих динамики, которые являются информативными. Во-вторых, с сезонностью сталкиваемся, при корректировке прогнозных значений.

Существует несколько методик оценки сезонной компоненты. Основные отличия их сводятся к тому, в какой последовательности производить выделение составляющих временного ряда, какими методами и на каком этапе считать выделение составляющих достаточно точным.

В анализе временных рядов принято рассматривать три формы взаимосвязи: аддитивную, мультипликативную, а так же смешанную.

Аддитивная форма

В аддитивной форме ряд представляется в виде

Page 14: alekhin_ts

14

tttt STCx ε++= (5) Чтобы оценить сезонную составляющую в модели, нужно сначала сгладить данные. Из модели (1) следует, что для выделения сезонной компоненты нужно сначала оценить тренд, а затем вычесть его из исходных данных:

tttt TCxS −=+ ε .

После этого для компенсации случайной компоненты следует провести усреднение.

Рассмотрим выделение сезонной компоненты в случае помесячных данных.

1. Выделим тренд.

В данном случае тренд принято оценивать не методом наименьших квадратов, а с помощью усреднения скользящим средним за большой промежуток времени. Поскольку теоретическое значение при методе сглаживания скользящим средним определяется для центрального элемента окна, то ширина окна сглаживания должна быть нечетной. Но период сезонности обычно включает четное число временных интервалов (12 месяцев, 4 квартала). Для выхода из такой ситуации используется метод центрированного среднего: для ежемесячных данных — это среднее с весами:

1,2,1 65456 ====== −−− wwwww K ,

242222 654456 +++−−− ++++++

= ttttttt

xxxxxxTC L

т.е. используется ширина окна 13, при этом данные за крайние месяца берутся с весом 1, или на половину меньше чем все остальные, и, таким образом, данные за все 12 месяцев учитываются одинаково.

2. Затем считается разница между исходными данными и центрированными средними, т.е. считают отклонения, которые и есть эффект сезонности плюс случайная компонента:

ttt TCxy −= . 3. Для определения влияния каждого конкретного периода года на динамику

рассчитываются средние 1221 ,,, yyy K (по месяцам), тем самым по возможности компенсируя случайную компоненту:

=

=

=

∑−

=+

=+

1

012

112

12,,8,7,1

6,,2,1,1

p

jji

p

jji

i

iyp

iyp

yK

K

(6)

где р — число целых циклов в ряду.

Различные пределы суммирования объясняются тем фактом, что центрированное среднее дает первое значение для момента t = 7, а последнее — для момента t = 12p – 6.

4. Сезонный индекс определяется из соотношения

yyS ii −= ,

Page 15: alekhin_ts

15

где

∑=

=12

1iiyy .

Это соотношение необходимо для того, чтобы суммарное воздействие индексов сезонности на динамику было нейтральным:

012

1=∑

=iiS .

Мультипликативная форма

Мультипликативная форма имеет следующий вид:

tttt STCx ε⋅⋅= (7) Мультипликативные индексы сезонности используются в случае, когда по мере повышения среднего уровня динамики увеличиваются абсолютные отклонения, вызванные сезонностью. В отличие от аддитивных индексов сезонности, которые имеют абсолютную величину, мультипликативные отражают относительное отклонение каждого периода сезона от средней величины.

Из уравнения (7) следует, что мультипликативные индексы рассчитываются из отношения исходных данных к тренду — центрированным скользящим средним:

ttt TCxy /= ,

где ty содержит также случайную компоненту. Затем определяется среднее арифметическое отношений по каждому месяцу 1221 ,,, yyy K . После этого вычисляется y как среднее геометрическое величин 1221 ,,, yyy K :

12 1221 yyyy K= .

Сезонные индексы iS рассчитываются как отношения соответствующих средних по месяцам

iy к y :

yy

S ii = .

В случае мультипликативной сезонности корректировка производится путем умножения на индекс. Следовательно, для корректности вычислений необходимо, чтобы произведение всех индексов равнялось единице:

11221 =⋅ SSS L . Пример В качестве примера вычислим сезонные индексы для ряда, изображенного на рис. 1.4. На нем представлены данные по объему пассажирских авиаперевозок Соединенного Королевства с 1949 по 1960 гг. Данные по объему перевозок приведены на рис. 1.5. 1. Сглаживание ряда взвешенным скользящим средним

Page 16: alekhin_ts

16

Поскольку мы имеем дело с помесячными данными, сгладим их в соответствии с формулой

242222 654456 +++−−− ++++++

= ttttttt

xxxxxxs

L.

Сглаженные данные приведены на рис. 1.6. Отметим, что при сглаживании часть данных теряется. 2. Определение модели сезонной компоненты Графики исходного и сглаженного радов приведены на рис. 1.7. По виду графика исходных данных определяем, что естественнее пользоваться мультипликативной моделью сезонной компоненты.

Рис. 1.5 Объем пассажирских перевозок с 1949 по 1960 г.

Рис.1.6 Сглаженные дынные

Page 17: alekhin_ts

17

Рис. 1.7 Исходный и сглаженный ряды

3. Вычисление мультипликативных индексов. Вычисление мультипликативных индексов производится следующим образом: сначала находятся отношения соответствующих данных. В нашем случае находим отношения В9/В24, В10/В25 и т.д. и помещаем их в новую таблицу в ячейки В55, В56 и т.д.:

Рис. 1.8 Мультипликативные индексы

Затем вычисляем среднее арифметическое полученных индексов по строкам. Соответствующие отношения находятся в столбце N на рис. 1.8. После этого вычисляем среднее геометрическое средних значений месячных индексов. В нашем случае оно находится в ячейке N61. На заключительном этапе вычисляем искомые значения мультипликативных индексов как отношения средних значений месячных индексов из ячеек N49:N60 к среднему геометрическому.

Page 18: alekhin_ts

18

II . ОСНОВЫ АНАЛИЗА СТАЦИОНАРНЫХ ВРЕМЕННЫХ РЯДОВ

2.0 Введение

Основная отличительная особенность статистического анализа временных рядов состоит в том, что последовательность наблюдений nxxx ,,, 21 K рассматривается как реализация последовательности, вообще говоря, статистически зависимых случайных величин

nXXX ,,, 21 K , имеющих некоторое совместное распределение с функцией распределения

),,,(),,,( 221121 nnn XXXPF νννννν <<<= KK . Мы будем рассматривать в основном временные ряды, у которых совместное распределение случайных величин nXXX ,,, 21 K имеет совместную плотность распределения

),,,( 21 nxxxp K .

Чтобы сделать задачу статистического анализа временных рядов доступной для практического решения, приходится так или иначе ограничивать класс рассматриваемых моделей временных рядов, вводя те или иные предположения относительно структуры ряда и структуры его вероятностных характеристик. Одно из таких ограничений предполагает стационарность временного ряда.

Определение. Ряд называется строго стационарным (или стационарным в узком смысле), если совместно распределение вероятностей m наблюдений

mttt xxx ,,,21

K такое же,

как и для m наблюдений τττ +++ mttt xxx ,,,

21K , для любых m, mttt ,,, 21 K и τ .

Как мы уже говорили, одно из главных отличий последовательности наблюдений, образующих временной ряд, заключается в том, что члены временного ряда являются, вообще говоря, статистически взаимозависимыми. Степень тесноты статистической связи между случайными величинами tX и τ+tX может быть измерена парным коэффициентом корреляции

)Var()Var(),Cov(

),(τ

ττρ

+

++ =

tt

tttt XX

XXXX ,

где [ ]))())(((),Cov( τττ +++ −−= tttttt XEXXEXEXX .

Если ряд tx стационарный, то значение ),Cov( τ+tt XX не зависит от t и является функцией только от τ ; мы будем использовать для него обозначение ),Cov()Cov( ττ += tt XX .

В частности,

)0Cov(),Cov()Var( == ttt XXX .

Соответственно, для стационарного ряда и значение коэффициента корреляции ),( τρ +tt XX зависит только от τ ; мы будем использовать для него обозначение )(τρ , так что

)0/Cov()Cov(),Corr()( ττρ τ == +tt XX .

В частности, 1)0( =ρ .

Page 19: alekhin_ts

19

Определение. Ряд, для которого выполнены следующие три условия:

1. µ≡)( tXE ,

2. 2)Var( σ≡tX , 3. )Cov(),Cov( ττ =+tt XX для любых t и τ

называют стационарным в широком смысле (слабо стационарным, стационарным второго порядка или ковариационно стационарным).

Определение. Ряд ntxt ,,1, K= называется гауссовским, если совместное распределение случайных величин nXXX ,,, 21 K является n-мерным нормальным распределением.

Итак, пусть ntxt ,,1, K= — стационарный ряд с µ≡)( tXE , 2)Var( σ≡tX , )(),Cov( ττ CovXX tt =+ . Поскольку в данном случае коэффициент )(τρ измеряет

корреляцию между членами одного и того же временного ряда, его принято называть коэффициентом автокорреляции (или просто автокорреляцией). По той же причине о ковариациях ),Cov()Cov( ττ += tt XX говорят как об автоковариациях.

Определение. Зависимость величины )(τρ от значения τ называют автокорреляционной функцией )(τρ .

Автокорреляционная функция безразмерна, т.е. не зависит от масштаба измерения анализируемого временного ряда. Ее значения могут изменяться в пределах от –1 до +1; при этом R(0) = 1. Кроме того, из стационарности ряда ntxt ,,1, K= следует, что )()( τρτρ =− , так что при анализе поведения автокорреляционных функций обычно ограничиваются рассмотрением только неотрицательных значений τ .

Определение. График зависимости )(τρ от значения τ называют коррелограммой.

Он может использоваться для характеризации некоторых свойств механизма, порождающего временной ряд. Для дальнейшего заметим, что если tx — стационарный временной ряд и с — некоторая постоянная, то временные ряды tx и ( cxt + ) имеют одинаковые коррелограммы.

2.1 Процесс белого шума

Определение. Белым шумом называется последовательность tx независимых одинаково распределенных случайных величин с математическим ожиданием 0)( =txE и конечной

дисперсией 2)Var( xtx σ= .

Вследствие независимости случайных величин tx имеем

0)( =τρ при 0≠τ .

Page 20: alekhin_ts

20

Величины x часто называются импульсами. Очевидно, что белый шум является частным случаем стационарного случайного процесса.

Определение. Гауссовским белым шумом. называют последовательность взаимно независимых случайные величин nXXX ,,, 21 K , имеющих одинаковое нормальное

распределение ),0( 2xN σ .

В то же время, в общем случае, даже если некоторые случайные величины nXXX ,,, 21 K взаимно независимы и имеют одинаковое распределение, то это еще не означает, что они образуют процесс белого шума, т.к. случайная величина tX может просто не иметь математического ожидания и/или дисперсии.

Временной ряд, соответствующий процессу белого шума, ведет себя крайне нерегулярным образом из-за некоррелированности при t ± s случайных величин tX и sX .

В связи с этим процесс белого шума не годится для непосредственного моделирования эволюции большинства временных рядов, встречающихся в экономике. В то же время, как мы увидим ниже, такой процесс является базой для построения более реалистичных моделей временных рядов, порождающих «более гладкие» траектории ряда. В связи с частым использованием процесса белого шума в дальнейшем изложении, мы будем отличать этот процесс от других моделей временных рядов, используя для него обозначение tε .

2.2 Процесс авторегрессии первого порядка

Одной из широко используемых моделей временных рядов является процесс авторегрессии (модель авторегрессии). Простейшей формой этой модели является модель авторегрессии первого порядка AR(1).

Определение. Моделью авторегрессии первого порядка AR(1) называют процесс

ttt aXX ε+= −1 , nt ,,1 K= , (1)

где tε — процесс белого шума, имеющий нулевое математическое ожидание и дисперсию 2εσ , 0X — некоторая случайная величина, а 0≠a — некоторый постоянный

коэффициент.

При этом

)()( 1−= tt XaEXE ,

так что рассматриваемый процесс может быть стационарным только при условии 0)( =tXE для всех t.

Очевидно, что

tttt

tttttt aaXaaXaaXX εεεεεε ++++=++=+= −−−−− L2

21

10121 )( ,

123

12

01

121 −−−−

−−− ++++=+= tttt

ttt aaXaaXX εεεε L ,

224

13

02

232 −−−−

−−− ++++=+= tttt

ttt aaXaaXX εεεε L ,

K ,

(2)

Page 21: alekhin_ts

21

101 ε+= aXX .

Если случайная величина 0X не коррелирована со случайными величинами nεεε ,,, 21 K , то отсюда следует, что

0),Cov( 10 =εX , 0),Cov( 21 =εX , . . . , 0),Cov( 1 =− ttX ε (3)

и с учетом этого соотношения

21

21

21 )r(V)Var()Var()Var()Var( εσεε +=+=+= −−− tttttt XaaXaaXX . (4)

Учитывая, что для стационарного процесса

201 )Var()Var()Var( xtt XXX σ≡=== − K ,

из уравнения (4) находим:

2222εσσσ += xx a . (5)

Последнее может выполняться только при выполнении условия 12 <a , т.е. 1|| <a .

При этом из (5) получаем выражение для 2xσ :

2

22

1 ax

−= εσ

σ . (6)

Вычислим автоковариацию ),Cov( τ+tt XX :

,Cov(),Cov( 22

11

0 tttt

tt aaXaXX εεετ ++++= −−+ L

=++++ +−+−++ )2

21

10 τ

τττ εεε tttt aaXa L

( ) )Var()Var( 12422

02 εα ττ ttt aaaXa −−−++ ++++= K .

Используем выражение для суммы первых n членов геометрической прогрессии:

qqbS

nn −

−=

11

1 .

В нашем случае 21 /1 aqb == , поэтому

11

2

22242

−=+++ −−−−

aaaaaa

tttK .

Используя это выражение, с учетом (6) получим

=−

−+= +

+ )Var(11)Var(),Cov( 12

20

2 εατττ

aaXaXX

tt

tt .

)Var()Var()1()Var( 002

02 XaXaXa tt τττ α =−−= +

Тогда

τττρ aXXX tt == +

)Var(),Cov(

)(0

. (8)

Page 22: alekhin_ts

22

т.е. при сделанных предположениях автоковариаций и автокорреляции зависят только от τ .

На рис. 2.1 представлен график коррелограммы процесса AR(1) при положительном и отрицательном а.

Рис. 2.1

Таким образом, механизм порождения последовательных наблюдений, заданный соотношением (1), порождает стационарный временной ряд, если выполняются следующие условия:

1. 1|| <a ;

2. 0X не коррелированна с te для всех t: 0),Cov( 10 =εX , 0),Cov( 20 =εX , . . . , 0),Cov( 0 =tX ε ;

3. 0)( 0 =XE ;

4. )1/()Var( 220 aX −= εσ .

При этом ττ τρρ aXX tt ==+ )(),( .

Теперь мы должны обратить внимание на следующее важное обстоятельство. В практических ситуациях «стартовое» значение 00 xX = , на основе которого в соответствии с соотношением ttt aXX ε+= −1 строятся последующие значения ряда tX , может относиться к концу предыдущего периода, на котором просто в силу других экономических условий эволюция соответствующего экономического показателя следует иной модели, например, модели ttt aXX ε+= −1 с другими значениями а и 2

εσ . Более того, статистические данные о поведении ряда до момента t = 0 могут отсутствовать вовсе, так что значение 0X является просто некоторой наблюдаемой числовой величиной. В обоих случаях ряд tX уже не будет стационарным даже при 1|| <a . Рассмотрим подробнее характеристики и поведение ряда в таких ситуациях.

Если не конкретизировать модель, в соответствии с которой порождались наблюдения до момента t = 1, то значение 0x можно рассматривать как фиксированное. При этом

tttt

t aaxaX εεε ++++= −− L22

11

0 , (9)

Page 23: alekhin_ts

23

022

11

0 )()( xaaaxaEXE tt

tttt =++++= −− εεε L ,

=++++=+++= −−− 2)2(2)1(2221

10 )1()Var()Var( εσσεε LL tt

xt

ttt

t aaaaxaX 222xx

ta σσ += , 22 )1(),Cov( x

ttt aaXX στ

τ +=+ , так что и математическое ожидание и дисперсия случайной величины, а также ковариации зависят от t. В то же время, если 1|| <a , в пределе при ∞→t получаем 0)( 0 →XE ,

)1/()( 220 aXD −→ εσ , 22

21),Cov( xtt a

aaXX σσ τ

ε

τ

τ =−

→+ . Другими словами, при ∞→t

указанные величины стабилизируются, приближаясь к своим предельным значениям.

С этой точки зрения, условие 1|| <a можно трактовать как условие стабильности ряда, порождаемого моделью авторегрессии первого порядка.

2.3 Процесс авторегрессии порядка р

Определение. Моделью авторегрессии порядка p (в кратком обозначении AR(p)) называют процесс

tptpttt XaXaXaX ε++++= −−− K2211 , 0≠pa , (1)

где tε — процесс белого шума, имеющий нулевое математическое ожидание и дисперсию 2εσ .

Для простоты мы будем теперь сразу полагать, что

0),Cov( =− tstX ε для всех 0>s . (2)

При этом говорят, что случайные величины tε образуют инновационную (обновляющую) последовательность, а случайная величина tε называется инновацией для наблюдения в момент t . Такая терминология объясняется тем, что наблюдаемое значение ряда в момент t получается здесь как линейная комбинация р предшествующих значений этого ряда плюс не коррелированная с этими предшествующими значениями случайная составляющая tε , отражающая обновленную информацию, скажем, о состоянии экономики, на момент t, влияющую на наблюдаемое значение tX .

При рассмотрении процессов авторегрессии и некоторых других моделей удобно использовать оператор запаздывания L (lag operator), который воздействует на временной ряд и определяется соотношением

1−= tt XXL . (3) в некоторых руководствах его называют оператором обратного сдвига и используют для него обозначение В (backshift operator).

Если оператор запаздывания применяется k раз, что обозначается как kL , то это дает в результате

ktt XX −=kL . (4)

Page 24: alekhin_ts

24

Используя оператор запаздывания, преобразуем выражение (1):

tpptptt XaaaXaXaXa )( 2212211

pLLL +++=+++ −−− KK .

а соотношение, определяющее процесс авторегрессии р-то порядка, в запишем виде

ttXa ε=)(L , где )(1)( 221

pLLLL paaaa +++−= K . (5)

Отметим, что оператор )(La превращает исследуемый ряд tX в белый шум.

Для того, чтобы такой процесс был стационарным, все корни характеристического алгебраического уравнения

0)( =za (6) (вещественные и комплексные) должны лежать вне единичного круга 1|| ≤z , т.е. по модулю должны быть больше единицы.

В частности, для процесса AR(1) имеем уравнение

01)( =−= azza , которое имеет корень z = 1/a , и условие стационарности 1|| >z равносильно уже знакомому нам условию 1|| <a .

Наша задача заключается в нахождении оператора )(1 L−a , обратного оператору )(La в уравнении (5):

tt aX ε)(1 L−= (6)

Будем искать этот оператор в виде следующего разложения:

∑∞

=−

− =0

1 )(j

jtiba εL , где ∑∞

=∞<

0||

jjb . (7)

Из уравнения (7) в частности, следует, что

( ) 0)(00

==

= ∑∑

=−

=−

jjti

jjtij EbbEXE εε .

Коррелограмма процесса AR(p) при р > 1 имеет более сложную форму, зависящую от расположения (на комплексной плоскости) корней уравнения a(z) = 0. Однако для больших значений k автокорреляция )(kρ хорошо аппроксимируется выражением

kAk θρ ≈)( , где min/1 z=θ ,

minz — наименьший по абсолютной величине корень уравнения a(z) = 0, если этот корень

является вещественным и положительным, или заключена в интервале || kA θ± в противном случае. Здесь |А| > 0 — некоторая постоянная, определяемая коэффициентами paaa K,, 21 .

Page 25: alekhin_ts

25

Умножим обе части уравнения (1) на )0( >kX k и возьмем от обеих частей математическое ожидание

)Cov()2Cov()1Cov()Cov( 21 pkakakak p −++−+−= K , 0>k .

Разделив обе части последнего на )0Cov( , приходим к системе уравнений Юла-Уокера

)()2()1()( 21 pkakakak p −++−+−= ρρρρ K , 0>k . (8)

Эта система позволяет последовательно находить значения автокорреляций и дает возможность, используя первые р уравнений, выразить коэффициенты ja через значения первых р автокорреляций, что можно непосредственно использовать при подборе модели авторегрессии к реальным статистическим данным.

Пример.

Рассмотрим процесс авторегрессии AR(2)

tttt XXX ε+−= −− 21 1245,025,0 (9)

Уравнение (6) a(z) = 0 принимает в этом случае вид

0125,025,01 2 =+− zz

и имеет корни 712,1 iz ±= . Оба корня по абсолютной величине больше единицы, так что процесс стационарный.

Для построения коррелограммы воспользуемся уравнениями Юла-Уокера . У нас р = 2, так что

0),2(125,0)1(25,0)( >−−−= kkkk ρρρ По определению,

1)0( =ρ

Для R(1) имеем

222,0)1(125,0)0(25,0)1(125,0)0(25,0)1( =−=−−= ρρρρρ Далее последовательно находим:

069,0)0(125,0)1(25,0)2( −=−= ρρρ 045,0)1(125,0)2(25,0)3( −=−= ρρρ 003,0)2(125,0)3(25,0)4( −=−= ρρρ

005,0)3(125,0)4(25,0)5( =−= ρρρ и т.д.

Корреляции даже между соседними наблюдениями очень малы, и можно ожидать, что поведение траекторий такого ряда не очень существенно отличается от поведения реализаций процесса белого шума. Теоретическая коррелограмма рассматриваемого процесса приведена ниже на рис. 2.2

Page 26: alekhin_ts

26

Рис. 2.2

2.4. Процесс скользящего среднего порядка q

Определение. Моделью скользящего среднего порядка q (в кратком обозначении MA(q)) называют процесс

qtqtttt bbbX −−− +++++= εεεε K2211 , 0≠qb , (1)

где tε — процесс белого шума, имеющий нулевое математическое ожидание и дисперсию 2εσ .

Название модели объясняется сходством процесса (1) и процессом взвешенного скользящего среднего (1) п.1.1.2.

Для процесса скользящего среднего порядка q используется обозначение МА(q) (скользящее среднее — moving average).

При q = 0 получаем процесс белого шума. Если q = 1, то

1−+= ttt bX εε , (2) — скользящее среднее первого порядка. В последнем случае

22 )1()Var( εσbX t += ,

[ ] 21 εσbXXE tt =− ,

[ ] 0=−ktt XXE , k > 0,

(3)

так что процесс tX является стационарным. Автоковариации и автокорреляции этого процесса равны

1,1,0

,0,

,)1()Cov( 2

22

>==

+=

kkk

bb

k ε

εσ

σ,

1,1,0

,0),1/(

,1)( 2

>==

+=

kkk

bbkρ (4)

т.е. коррелограмма процесса имеет весьма специфический вид. Коррелированными оказываются только соседние наблюдения. Корреляция между ними положительна, если

Page 27: alekhin_ts

27

b > 0, и отрицательна при b < 0. Соответственно, процесс МА(1) с b > 0 имеет более гладкие, по сравнению с белым шумом, реализации, а процесс МА(1) с b < 0 имеет менее гладкие, по сравнению с белым шумом, реализации. Заметим, что для любого процесса МА(1)

5,0|)1(| <ρ , т.е. корреляционная связь между соседними наблюдениями невелика, тогда как у процесса AR(1) такая связь может быть сколь угодно сильной.

Модель МА(q) кратко можно записать в виде

tt bX ε)(L= , где q2 LLLL qbbbb ++++= K211)( (5)

Для нее

[ ]

>

≤≤== ∑

=+

qk

qkbbXXEk

kq

jkjj

ktt

0

0,)Cov(0

2εσ ,

>

≤≤

= ∑∑−

=

=+

qk

qkbbbk

kq

jj

kq

jkjj

0

0,)(0

2

(6)

так что MA(q) является стационарным процессом с нулевым математическим ожиданием и дисперсией

2222

21

2 )1( εσσ qx bbb ++++= K . (7)

Здесь статистическая связь между наблюдениями сохраняется в течение q единиц времени (т.е. «длительность памяти» процесса равна q).

Подобного рода временные ряды соответствуют ситуации, когда некоторый экономический показатель находится в равновесии, но отклоняется от положения равновесия в силу последовательно возникающих непредсказуемых событий, причем система такова, что влияние таких событий отмечается на протяжении некоторого периода времени.

Если влияние прошлых событий ослабевает с течением времени показательным образом, так что 10, <<= aab j

j , то искусственное предположение о том, что ряд tε начинается в «бесконечном прошлом», приводит к модели бесконечного скользящего среднего )(∞MA :

∑∑∞

=−

=− ==

00 jjtj

jjt

jt baX εε , где ∑

=∞<

0||

jjb . (8)

Ранее мы видели, что такое же представление допускает стационарный процесс авторегрессии первого порядка AR(1), т.е. в рассматриваемом случае процесс )MA(∞ эквивалентен процессу AR(1). Вообще, всякий стационарный процесс AR(p) можно записать в форме процесса )(∞MA .

Примеры.

Рассмотрим процесс 21 125,075,0 −− +−= ttttX εεε .

Имеем:

Page 28: alekhin_ts

28

535.0)/()()1( 22

21

202110 −=+++= bbbbbbbρ ,

079.0)2( =ρ

2.5 Смешанный процесс авторегрессии-скользящего среднего

Определение. Процесс tX с нулевым математическим ожиданием

tqtqttptpttt bbbXaXaXaX εεεε ++++++++++= −−−−−− KK 22112211 ,

0≠pa , 0≠qb , (1)

где tε — процесс белого шума, имеющий нулевое математическое ожидание и дисперсию 2εσ , принадлежащий к классу процессов, характеризующийся порядками р и q его AR и

МА составляющих, называется смешанным процессом авторегрессии-скользящего среднего и обозначается как процесс ARMA(p, q) (autoregressive moving average, mixed autoregressive moving average).

Запишем уравнение (1) в более короткой форме:

∑∑=

−=

− +=q

jjtj

p

jjtjt bXaX

01ε , где 0≠pa , 0≠qb , 10 =b . (2)

В операторной форме последнее уравнение принимает вид

tt bXa ε)()( LL = (3) a(L) и b(L) имеют тот же вид, что и в определенных ранее моделях AR(p) и МА(q). Отметим следующие свойства процесса ARMA(p, q):

Процесс стационарен, если все корни уравнения 0)( =za лежат вне единичного круга 1|| ≤z .

1. Если процесс стационарен, то существует эквивалентный ему процесс )MA(∞

∑∞

=−=

0jjtjt cX ε или tt cX ε)(L= , где ∑

=∞<=

00 ||,1

jjcc ,

)()()(

zazbzc = .

2. Если все корни уравнения 0)( =zb лежат вне единичного круга 1|| ≤z (условие обра-тимости), то существует эквивалентное представление процесса tX в виде процесса авторегрессии бесконечного порядка )(∞AR

ttXd ε=)(L , где )()()(

zbzazd = .

Таким образом, стационарный процесс ARMA(p, q) всегда можно аппроксимировать процессом скользящего среднего достаточно высокого порядка, а при выполнении условия обратимости его можно также аппроксимировать процессом авторегрессии достаточно высокого порядка.

Специфику формы коррелограммы процесса ARMA(p, q) в общем случае указать труднее, чем для моделей AR(p) и МА(q). Отметим только, что для значений k > q коррелограмма

Page 29: alekhin_ts

29

процесса tt bXa ε)()( LL = выглядит так же, как и коррелограмма процесса авторегрессии

ttXa ε=)(L .

Так, для процесса ARMA(1, 1) )1()( 1 −= kak ρρ для k = 2, 3, ..., как и у процесса

ttt XaX ε+= −11 . При этом, однако, 1)1( a≠ρ .

Предпосылкой для обоснования использования моделей ARMA является следующий факт. Если ),ARMA( 11 qp ряд tX и ),ARMA( 22 qp ряд tY статистически независимы между собой, и ttt YXZ += , то типичным является положение, когда tZ является ARMA(p, q) рядом, у которого

11 qpp += ;

21 qpq += , если 1221 qpqp +>+ ;

12 qpq += , если 1221 qpqp +<+ ;

Возможны также ситуации, когда значения р и q оказываются меньше указанных значений. Такие ситуации возникают в случаях, когда многочлены )(zaX и )(zaY , соответствующие авторегрессионным частям процессов tX и tY , имеют общие корни.

В частном случае, когда оба ряда имеют тип AR(1), но с различными параметрами, их сумма имеет тип ARMA(2, 1).

В экономике многие временные ряды являются агрегированными. Из указанного выше факта вытекает, что если каждая из компонент отвечает простой модели AR, то при независимости этих компонент их сумма будет ARMA процессом. Такого же рода процесс мы получим, если часть компонент имеет тип AR, а остальные компоненты имеют тип МА. Единственным исключением является случай, когда все компоненты являются МА процессами — в этом случае в результате получаем МА процесс.

Предположим, наконец, что «истинный» экономический ряд отвечает AR(р) модели, но значения этого ряда измеряются со случайными ошибками, образующими процесс белого шума (т.е. МА(0)). Тогда наблюдаемый ряд имеет тип ARMA(p, p).

Замечание.

Ранее мы уже говорили о том, что если ARMA(p, q) процесс tX удовлетворяет условию обратимости, то его можно представить в виде стационарного процесса )(∞AR . Последний, в свою очередь, можно аппроксимировать стационарным процессом AR(р), быть может, достаточно высокого порядка.

Таким образом, в практических задачах можно было бы и вовсе обойтись без использования моделей ARMA, ограничиваясь либо AR либо МА моделями. При этом, однако, количество коэффициентов, подлежащих оцениванию, может оказаться слишком большим (что снижает точность оценивания) и даже превосходить количество имеющихся наблюдений. В этом смысле модели ARMA могут быть «более экономными».

2.6 Идентификация стационарной модели ARMA

На этапе идентификации производится выбор некоторой частной модели из всего класса ARMA, т.е. выбор значений р и q. Используемые при этом процедуры являются не вполне точными, что может при последующем анализе привести к выводу о непригодности

Page 30: alekhin_ts

30

идентифицированной модели и необходимости замены ее альтернативной моделью. На этом же этапе делаются предварительные грубые оценки коэффициентов paaa ,,, 21 K ,

qbbb ,,, 21 K идентифицированной модели.

На втором этапе производится уточнение оценок коэффициентов модели с использованием эффективных статистических методов. Для оцененных коэффициентов вычисляются стандартные ошибки, дающие возможность, при дополнительных предположениях о распределениях случайных величин tX , строить доверительные интервалы для этих коэффициентов и проверять гипотезы об их истинных значениях с целью уточнения спецификации модели.

На третьем этапе применяются различные диагностические процедуры проверки адекватности выбранной модели имеющимся данным (misspecification tests). Неадекватности, обнаруженные в процессе такой проверки, могут указать на необходимую корректировку модели, после чего производится новый цикл подбора, и т.д. до тех пор, пока не будет получена удовлетворительная модель.

Разумеется, если мы имеем дело с ситуацией, когда уже имеется достаточно отработанная и разумно интерпретируемая модель эволюции того или иного показателя, можно обойтись и без этапа идентификации.

2.6.1 Идентификация модели по виду функций ACF и PACF

Основной отправной точкой для идентификации стационарной модели ARMA является различие поведения автокорреляционных (ACF) и частных автокорреляционных (PACF) функций (ACF — autocorrelation function, PACF — partial autocorrelation function) рядов, соответствующих различным моделям ARMA.

О поведении автокорреляционных функций для различных моделей ARMA мы уже говорили. Однако по поведению только автокорреляционной функции трудно идентифицировать даже порядок чистого (без МА составляющей) процесса авторегрессии. Решению этого вопроса помогает рассмотрение поведения частной автокорреляционной функции (PACF) стационарного процесса tX . Ее значение )(kpartρ на лаге k определяется

как значение коэффициента корреляции между случайными величинами tX и ktX + , очищенными от влияния остальных членов временного ряда.

Это соответствует тому, что )(kpartρ является коэффициентом при tX в линейной

комбинации случайных величин ktt XX −− ,,1 K , наилучшим образом приближающей случайную величину tX . Исходя из последнего, можно показать, что )(kpartρ определяется как решение относительно од системы первых k уравнений Юла-Уокера

)()2()1()( 21 ksasasas k −++−+−= ρρρρ K , ks ,,2,1 K= , которую в этом случае удобнее записать в виде

)()()2()1( 21 saksasas k ρρρρ =−++−+− K , ks ,,2,1 K= ,

подчеркивая, что неизвестными здесь являются kaaa ,,, 21 K , a )(,),1( kss −− ρρ K — известные коэффициенты. Исходя из этого и применяя известное из алгебры правило Крамера решения системы k линейных уравнений с k неизвестными, находим, что вычисление PACF можно производить по формулам

Page 31: alekhin_ts

31

1)0( =partρ ,

)1()1( ρρ =part ,

K

1)2()2()1(

)3(1)1()2()2()1(1)1()1()2()1(1

)()2()2()1(

)3(1)1()2()2()1(1)1()1()2()1(1

)(

K

MOMMM

K

K

K

K

MOMMM

K

K

K

−−−

−−−

−−−=

kkk

kkk

kkkkkpart

ρρρ

ρρρρρρρρρ

ρρρρ

ρρρρρρρρρ

ρ ,

Замечательным является тот факт, что если tX — процесс типа AR(p), то тогда

0)( ≠ppartρ ,

0)( =ppartρ для k > p.

Это позволяет по графику PACF определять порядок процесса авторегрессии и отличать процесс авторегрессии от процессов скользящего среднего и ARMA(p, q) с q > 0.

Напомним, что зануление ACF после лага q соответствует процессу МА(q). Теперь же мы видим, что зануление PACF после лага р соответствует процессу AR(p). Поэтому идентификация этих моделей по ACF и PACF более определенна.

В то же время, вместо не известных нам истинных последовательностей автокорреляций )(kρ и частных автокорреляций )(kpartρ мы можем довольствоваться только их

состоятельными оценками — выборочной ACF, образованной выборочными автокор-реляциями

=

=+−

= T

tt

kT

tktt

xT

xxkT

kr

1

2

1

1

1

)(

и выборочной PACF, образованной выборочными частными автокорреляциями )(krpart .

Получить последние можно, заменяя входящие в выражения для )(kpartρ автокорреляции

)(sρ их оценками )(sr . Однако проще поступить иначе, исходя из того, что )(kpartρ

является коэффициентом при ktX − в линейной комбинации случайных величин

ktt XX −− ,,1 K , наилучшим образом приближающей случайную величину tX . Именно, можно просто оценить методом наименьших квадратов коэффициенты в модели

tptpttt uXaXaXaX ++++= −−− K2211 .

Полученная в результате оценка коэффициента ka и есть )(kpartρ

Page 32: alekhin_ts

32

Если tX является стационарным процессом типа ARMA(p, q) и ∞<)( 4tXE , то указанные

оценки Cov(k) , r(k) и )(krpart являются состоятельными оценками для ковариации, )(kρ и

)(kpartρ , соответственно. Поскольку r(k) и )(krpart всего лишь оценки для )(kρ и

)(kpartρ , то их наблюдаемые значения могут значительно отличаться от истинных значений. Более того, характер изменения теоретической автокорреляционной функции вовсе не обязательно будет воспроизводиться в ее выборочном аналоге — выборочной автокор-реляционной функции.

Тем не менее, во многих случаях поведение теоретических ACF и PACF в какой-то мере отражается и на поведении их выборочных аналогов. Поэтому представление о поведении теоретических ACF и PACF может помочь в решении задачи идентификации соответствующих моделей в рамках общего класса моделей ARMA. В этой связи мы суммируем в следующей таблице свойства ACF и PACF для некоторых популярных моделей стационарных временных рядов.

Моде ль ACF PACF

Белый шум, МА(0)

0)( =kρ для 0≠k 0)( =kpartρ для 0≠k

AR(1) 01 >a

Экспоненциальное убывание kak =)(ρ

1)1( apart =ρ

2,0)( ≥= kkpartρ AR(1)

01 <a Осциллирующее убывание

kak =)(ρ 1)1( apart =ρ

2,0)( ≥= kkpartρ AR(p) Убывание к нулю с возможной

осцилляцией pkkpart ≥= ,0)(ρ

МА(1) 01 >b

Положительный пик при k = 1; 0)( =kρ для 1>k

Осциллирующее убывание; 0)1( >partρ

МА(1) 01 <b

Отрицательный пик при k = 1; 0)( =kρ для 1>k

Убывание по абсолютной величине; 1,0)( ≥< kkpartρ

МА(q) 0)( =kρ для pk ≥ ARMA(1, 1)

01 >a Экспоненциальное убывание с лага 1; знак )1(ρ совпадает со знаком

)( 11 ba +

Осциллирующее убывание с лага 1; )1()1( ρρ =part

ARMА(1, 1) 01 <a

Осциллирующее убывание с лага 1; знак )1(ρ совпадает со знаком

)( 11 ba +

Экспоненциальное убывание с лага 1; )1()1( ρρ =part ; знак )(kpartρ совпадает со знаком 1),1( >kρ

ARMA(p, q) Осциллирующее или прямое убывание, начинающееся с лага q

Осциллирующее или прямое убывание, начинающееся с лага p

2.6.2 Проверка гипотез о значимости коэффициентов корреляции

Имея в виду возможность идентификации моделей ARMA(p, q) по графикам функций r(k) и )(krpart , желательно иметь статистические критерии для проверки гипотез о равенстве нулю

тех или иных значений )(kρ и )(kpartρ на основании наблюдаемых значений r(k) и r(k).

Page 33: alekhin_ts

33

Вопрос этот весьма сложный, и мы ограничимся только двумя приближенными рецептами, которые предполагают гауссовость инноваций (т.е., что tε — гауссовский белый шум).

1. Если tX — процесс типа МА(q), то при больших п

[ ]

+≈ ∑

=

q

jj

Tkr

1

2 )(211)(Var ρ для k > q.

Более того, при больших Т и k > q распределение случайной величины r(k) близко к нормальному распределению. Отсюда вытекает, что естественный приближенный критерий проверки гипотезы 0H : « tX — процесс типа МА(q)» состоит в том, чтобы отвергать эту гипотезу, если

∑=

+>q

jjr

Tkr

1

2 )(12)( для k > q.

Уровень значимости такого критерия приближенно равен 0.05.

В частности, если q = 0, то tX — белый шум, и гипотеза 0H : « tX — белый шум» отвергается указанным приближенным критерием при

Tkr 2)( > для k > 0.

2. Если tX — процесс типа AR(p), то при больших Т и k > p распределение )(krpart можно аппроксимировать нормальным распределением c нулевым математическим ожиданием и дисперсией, равной 1/Т. Следовательно, если гипотезу 0H : « tX — процесс типа AR(p)» отвергать при

Tkr 2)( > для k > р,

то получим критерий, уровень значимости которого приближенно равен 0.05.

Имея в виду два указанных приближенных критерия, в процедурах анализа временных рядов обычно предусмотрена распечатка графиков выборочных ACF и PACF, на которые нанесены границы полосы T/2± . В этих границах с вероятностью, близкой к 0.95, должно заключаться значение r(k), если tX — белый шум, и значение )(krpart , если tX — процесс типа AR(p). Здесь следует сделать одно важное предупреждение. Именно, оба построенных критерия имеют уровень значимости, близкий к 0.05, только когда мы проверяем гипотезу

0H при некотором фиксированном k. В распечатках анализа временных рядов вместе с графиками выборочных ACF и PACF обычно печатаются значения Q-статистики, относящиеся к критерию проверки гипотезы о том, что наблюдаемые данные являются реализацией процесса белого шума. Существует несколько вариантов Q-статистик. Один из таких вариантов — статистика Люнга-Бокса(Ljung, Box), используемая в пакете EViews:

∑= −

+=M

k kTkrTTQ

1

2 )()2( ,

Page 34: alekhin_ts

34

которая при ∞→T имеет асимптотическое распределение )(2 Mχ . В пакете EViews значения Q-статистики Люнга-Бокса распечатываются вместе с приближенными p-значениями, соответствующими распределениям )(2 Mχ . Уже из рассмотренного примера ясно, что на этапе выбора подходящей модели среди всего множества ARMA моделей используемые процедуры являются не вполне точными и часто приводят к довольно неопределенным выводам. В итоге этого этапа возможно оставление для дальнейшего исследования не одной, а нескольких потенциальных моделей. Более определенные выводы при выборе модели на первом этапе можно получить, применяя информационные критерии отбора моделей.

2.6.3 Использование информационных критериев

Если заранее ограничиваться рассмотрением только AR моделей, т.е. полагать, что процесс tX следует модели AR(k) с неизвестным истинным порядком k, то для определения k в таких

ситуациях долгое время использовался информационный критерий Акаике (Akaike). Согласно этому критерию, среди альтернативных значений k выбирается значение, которое минимизирует величину

TkkAIC k

2ˆln)( 2 += σ ,

где Т — количество наблюдений, а 2ˆkσ — оценка дисперсии инноваций et в AR модели k-го порядка. Впоследствии было выяснено, что оценка Акаике несостоятельна и асимптотически переоценивает (завышает) истинное значение k с ненулевой вероятностью. В связи с этим, были предложены состоятельные критерии. Одним из таких критериев является часто используемый в настоящее время информационный критерий Шварца (Schwarz) — SIC,

TTkkSIC k

lnˆln)( 2 += σ .

Несколько позднее был предложен критерий Хеннана-Куинна (Hannan, Quinn)

TTkkHQ k

lnln2ˆln)( 2 += σ .

обладающий более быстрой сходимостью к истинному значению k при ∞→T . Однако при небольших значениях Т этот критерий недооценивает порядок авторегрессии.

2.7 Оценивание коэффициентов модели. Диагностика модели

После того как произведена идентификация стационарной модели ARMA, т.е. на основании имеющихся наблюдений принято решение о значениях р, q в модели ARMA(p, q), порождающей данные, переходят к этапу оценивания коэффициентов модели. На этом этапе обычно используется метод максимального правдоподобия, который в конечном счете сводится к методу наименьших квадратов. За исключением некоторых наиболее простых случаев (например, модели AR(1)), эта задача решается итерационными методами, требующими задания некоторых «начальных» («стартовых») значений параметров, которые затем последовательно уточняются. В качестве таких начальных значений можно использовать предварительные оценки, полученные на первом этапе. Такие начальные значения можно найти, приравнивая

Page 35: alekhin_ts

35

неизвестные «истинные» значения автокорреляций )(kρ значениям r(k) выборочной автокорреляционной функции и используя функциональную связь между значениями )(kρ и значениями коэффициентов модели. Например, если оценивается модель AR(p), то коэффициенты kaaa ,,, 21 K определяются из системы первых р уравнений Юла – Уокера

)()()2()1( 21 kapkakak p ρρρρ =−++−+− K , pk ,,2,1 K= , (1)

в которые вместо неизвестных значений )(,),2(),1( pρρρ K автокорреляций подставляются наблюдаемые (вычисляемые по реализации ряда) значения r(1), r(2), ..., r(р) выборочных автокорреляций. При оценивании моделей с МА(q) составляющей (q > 0) существенным оказывается условие обратимости, сформулированное в разд. 2.5. Если в результате оценивания получена модель, в которой условие обратимости не выполняется, рекомендуется повторить процедуру оценивания с использованием другого набора начальных значений. После выбора типа и оценивания коэффициентов модели производится диагностика оцененной модели, т.е. выяснение того, насколько хорошо модель соответствует данным наблюдений (адекватна данным наблюдений) — это является третьим этапом процедуры подбора модели. Для целей диагностики можно использовать целый ряд различных статистических процедур, которые направлены в основном на проверку гипотезы 0H о том, что в модели, порождающей наблюдения, последовательность tε действительно образует процесс белого шума. Следовательно, если ошибки tε образуют процесс белого шума, то их выборочные оценки — остатки tε̂ — должны имитировать процесс белого шума. Есть несколько способов проверить это обстоятельство. Можно проверить статистическую значимость выборочных автокорреляций с помощью Q-статистики Люнга-Бокса:

∑= −

+=M

kLB kT

rTTQ1

2)2( ε ,

∑−

=

=+

= kT

tt

kT

tktt

kr

1

2

1

ˆ

ˆˆ

)(ε

εε

ε , (1)

которая имеет асимптотическое распределение )(2 qpM −−χ . Именно эта статистика приводится в пакете eViews рядом с коррелограммой. Второй способ заключатся в проверке гипотезы о нормальности распределения анализируемого ряда. В этом случае лучше всего воспользоваться популярным критерием Жарка-Бера (Jarque, Bera). Подводя итоги, можно сказать, что нужно еще раз провести анализ остатков в предположении, что они порождаются процессом ARMA(p, q) и убедиться, что в ряду остатков не имеется значимой автокорреляции.

Page 36: alekhin_ts

36

III. НЕСТАЦИОНАРНЫЕ ВРЕМЕННЫЕ РЯДЫ

3.1 Основные типы нестационарных рядов

Рассмотрим два процесса, обладающих выраженным линейным трендом:

Процесс TS Процесс DS

Оценим тренд для каждого из этих рядов: Dependent Variable: TS Method: Least Squares Sample: 1 100 Included observations: 100

Variable Coefficient Std. Error t-Statistic Prob. T 0.138506 0.001029 134.6370 0.0000 C 0.553869 0.059839 9.255949 0.0000

Dependent Variable: DS Method: Least Squares Sample: 1 100 Included observations: 100

Variable Coefficient Std. Error t-Statistic Prob. T 0.125959 0.003040 41.42808 0.0000 C -0.887868 0.176856 -5.020299 0.0000

а затем найдем остатки для каждого из процессов после удаления тренда.

Рассмотрим коррелограммы остатков. Остатки первого из рядов образуют стационарный процесс.

Page 37: alekhin_ts

37

Коррелограмма процесса TS без тренда

Остатки второго ряда имеют все признаки процесса AR(1):

Коррелограмма процесса DS без тренда

Оценим AR(1)-модель остатков второго ряда: Dependent Variable: DS_DETR Method: Least Squares Sample(adjusted): 2 100 Included observations: 99 after adjusting endpoints Convergence achieved after 3 iterations

Variable Coefficient Std. Error t-Statistic Prob. C 0.049498 0.555765 0.089063 0.9292

AR(1) 0.946796 0.034113 27.75496 0.0000 R-squared 0.888164 Mean dependent var -0.008941 Adjusted R-squared 0.887011 S.D. dependent var 0.873041 S.E. of regression 0.293463 Akaike info criterion 0.405866 Sum squared resid 8.353698 Schwarz criterion 0.458292 Log likelihood -18.09035 F-statistic 770.3378 Durbin-Watson stat 1.794677 Prob(F-statistic) 0.000000 Inverted AR Roots .95

Коррелограмма остатков этой модели имеет все признаки коррелограммы стационарного процесса:

Page 38: alekhin_ts

38

Коррелограмма AR(1)-модели процесса DS: 1948.0615.1024.0 −+−⋅= tt XtX

Однако обращает на себя внимание тот факт, что коэффициент в уравнении при 1−tX близок к единице. Напомним, что AR(1) процесс определяется уравнением

ttt XaX ε+= −11 , (1) а условие его стационарности заключается в требовании 1|| 1 <a . Найдем доверительный 95%-й интервал для коэффициента 1a : 014,1880,0 1 << a . Он включает в себя единицу, поэтому нет оснований отвергать гипотезу о нестационарности ряда DS.

Более точные оценки можно было получить, сразу оценивая модель ttt uXatX +++= −11αβ , но она приводит практически к тем же численным результатам:

Dependent Variable: DS Method: Least Squares Sample(adjusted): 2 100 Included observations: 99 after adjusting endpoints Convergence achieved after 4 iterations

Variable Coefficient Std. Error t-Statistic Prob. T 0.150047 0.025530 5.877205 0.0000 C -2.503194 2.021545 -1.238258 0.2186

AR(1) 0.947823 0.034037 27.84658 0.0000 R-squared 0.993989 Mean dependent var 5.527117 Adjusted R-squared 0.993864 S.D. dependent var 3.737006 S.E. of regression 0.292725 Akaike info criterion 0.410671 Sum squared resid 8.226066 Schwarz criterion 0.489311 Log likelihood -17.32822 F-statistic 7937.880 Durbin-Watson stat 1.824326 Prob(F-statistic) 0.000000 Inverted AR Roots .95

Таким образом, несмотря на то, что при полученной точечной оценке 0.95 коэффициента при 1−tX построенная модель формально оказывается стационарной относительно

детерминированного линейного тренда (т.е. детрендированный процесс следует стационарной AR(1) модели), мы не можем с достаточной степенью уверенности гарантировать, что истинная модель порождения наблюдений также стационарна относительно линейного тренда.

Рассмотрим более подробно процесс ttt XX ε+= −1 . На рисунке приведена одна из его реализаций при n = 1000. Мы видим, что при 11 =a количество пересечений нулевого уровня

Page 39: alekhin_ts

39

намного меньше, чем для процесса белого шума ( 01 =a ), длинными оказываются периоды, в течение которых значения ряда находятся по одну сторону от нулевого уровня.

Характерное свойство такого процесса состоит в том, что такой процесс, начавшись в момент t = 1 с некоторого значения значения (в данном случае x1 = 0), в дальнейшем очень редко пересекает уровень x1 («возвращается к уровню x1») и, находясь в течение длительного времени по одну сторону от этого уровня (выше или ниже), может удаляться от этого уровня на значительные расстояния.

«Повернутая вертикально», траектория ряда напоминает траекторию движения нетрезвого человека, пытающегося продвигаться вперед по прямой, но не имеющего возможности успешно выдерживать нужное направление. И это служит некоторым оправданием термина, используемого для AR(1) процесса с 11 =a : «случайное блуждание».

Определение. Процесс, порождаемый уравнением

ttt XX ε+= −1 , (2) называется случайным блужданием (или процессом случайного блуждания — random walk). Процесс, порождаемый уравнением

ttt XX εµ ++= −1 , const=µ , (3) называется случайным блужданием со смещением (или со сносом).

Процесс (3) обладает ярко выраженным трендом.

Случайное блуждание не является стационарным процессом.

3.2 TS- и DS-ряды

В течение довольно долгого времени было принято при анализе рядов с выраженным трендом производить оценивание и выделение детерминированного тренда, после чего производить подбор динамической модели (например, ARMA) к ряду, «очищенному от тренда», т.е. к ряду остатков от соответствующей оцененной регрессионной модели. После введения Боксом и Дженкинсом (Бокс, Дженкинс (1974)) в обиход моделей ARIMA стало

Page 40: alekhin_ts

40

модным остационаривание рядов с выраженным трендом и медленным убыванием (оцененной) автокорреляционной функции путем перехода к рядам первых или вторых разностей. Однако, как показали дальнейшие исследования, произвольный выбор одного из этих двух способов остационаривания ряда вовсе не так безобиден, как это казалось поначалу.

Определение. Временной ряд tX называется стационарным относительно детермини-рованного тренда tT , если ряд tt TX − стационарный. Если ряд tX стационарен относительно некоторого детерминированного тренда, то говорят, что этот ряд принадлежит классу рядов, стационарных относительно детерминированного тренда, или что он является TS рядом (TS — time stationary).

Таким образом, TS-ряд имеет детерминированный тренд, после удаления которого с ним можно работать обычными методами, использующимися для стационарных рядов.

Говорят, что ряд вида

ttt XX εµ ++= −1 (1) имеет стохастический тренд, который можно удалить путем взятия разностей (иногда эта операция называется дифференцированием ряда).

Возьмем первые разности ряда (1). Вычтем из обеих частей уравнения (1) величину 1−tX :

tttt XXX εµ +=∆=− −1 или

ttX εµ +=∆ . (2) Ряд (2) является стационарным. Иногда взятие разностей приходится применять несколько раз, прежде чем продифференцированный ряд станет стационарным.

Определение. Временной ряд tX называется интегрированным порядка k (k = 1, 2, …), если

• ряд tX не является стационарным или стационарным относительно детерминирован-ного тренда, т.е. не является TS рядом;

• ряд tk X∆ , полученный в результате k-кратного дифференцирования ряда tX ,

является стационарным рядом;

• ряд tk X1−∆ , полученный в результате (k – 1)-кратного дифференцирования, ряда tX ,

не является TS рядом. Интегрированный ряд порядка d обозначается I(d). )0(~}{ IX t соответствует стационарному ряду.

Таким образом, можно сформулировать следующие правила: • вычитание детерминированной составляющей TS ряда приводит к стационарному

ряду; • вычитание детерминированной составляющей DS ряда приводит к DS ряду; • дифференцирование TS ряда приводит к TS ряду; если стохастическая составляющая

исходного TS ряда описывается стационарной моделью ARMA, то дифференцирование приводит к TS ряду с необратимой MA-составляющей, имеющей единичный корень;

Page 41: alekhin_ts

41

• k- кратное дифференцирование ряда )(~}{ kIX t приводит к стационарному ряду;

• если стохастическая составляющая исходного I(k) ряда описывается моделью ARIMA, то k-кратное дифференцирование стационарному ряду с обратимой MA составляющей.

Определение. Разностно стационарным, или DS рядом (DS — difference stationary) называется интегрированный ряд порядка k = 1, 2, …

Пусть ряд tX — интегрированный порядка k. Подвергнем этот ряд k-кратному дифференци-рованию. Если в результате получается стационарный ряд типа ARMA(p, q), то говорят, что исходный ряд tX является рядом типа ARIMA(p, k, q), или k раз проинтегрированным ARMA(p, q) рядом (ARIMA — autoregressive integrated moving average). Если при этом p = 0 или q = 0, то тогда употребляются и более короткие обозначения:

ARIMA(p, k, 0) = ARI (p, k), ARIMA(0, k, q) = IMA( k, q),

ARIMA(0, k, 0) = ARI (0, k) = IMA(k, 0).

Важным обстоятельством является также то, что в TS-рядах влияние предыдущих шоковых воздействий затухает с течением времени, а в DS-рядах такое затухание отсутствует и каждый отдельный шок влияет с одинаковой силой на все последующие значения ряда.

3.3 Тесты на наличие единичных корней

3.3.1 Тест Дики-Фуллера (Dickey-Fuller)

Наиболее известным тестом на наличие единичного корня в уравнении временного ряда является тест Дики-Фулера. В рамках данного теста исследуется уравнение вида:

ttt XX εψ +=∆ −1 , 1−−=∆ ttt XXX . (1) Проводится проверка нулевой и альтернативной гипотез: H0: 0=ψ (уравнение содержит единичный корень); Н1 : 0<ψ (ряд стационарен). Тест Дики — Фуллера имеет три разновидности: 1. В первой разновидности теста в качестве нулевой гипотезы рассматривается случайное

блуждание, а в качестве альтернативной — авторегрессионный процесс первого порядка AR(l) с нулевым постоянным членом.

H0: ttX ε=∆ ,

Н1 : ttt XX εψ +=∆ −1 , 0<∆ψ .

2. Во второй разновидности теста в качестве нулевой гипотезы рассматривается случайное блуждание, а в качестве альтернативной — авторегрессионный процесс первого порядка AR(1) с ненулевым постоянным членом .

H0: ttX ε=∆ ,

Н1 : ttt XX εµψ ++=∆ −1 , 0<∆ψ .

Page 42: alekhin_ts

42

3. В третьей разновидности теста в качестве нулевой гипотезы рассматривается случайное блуждание, а в качестве альтернативной — авторегрессионный процесс первого порядка AR(l) с ненулевым постоянным членом и детерминистическим трендом:

H0: ttX ε=∆ ,

Н1 : ttt tXX ελµψ +++=∆ −1 , 0<∆ψ .

По результатам оценки уравнений исследуется статистика Дики-Фуллера:

)ˆ.(.ˆψ

ψes

DF =

Данная статистика не подчиняется t-распре делению, т.к. в рамках нулевой гипотезы ряд является нестационарным. Критические значения нестандартного распределения, которому следует статистика теста в случае верности нулевой гипотезы, были получены в результате компьютерного моделирования при )05.0( =α :

ttXH ε=∆:0

n

ttt XXH εψ +=∆ −11 : ,

ttt XXH εµψ ++=∆ −11 : ttt tXXH ελµψ +++=∆ −11 :

25 –3.00 –3.60 50 –2.92 –3.50 100 –2.89 –3.45 250 –2.88 –3.43 500 –2.87 –3.42 ∞ –2.86 –3.41

Нулевая гипотеза о наличии единичного корня отвергается, если фактическая величина статистики превышает по модулю ее критическое значение (т.е. является более негативной). Если по результатам проверки гипотеза 0H отвергается, то делается вывод о том, что уравнение не содержит единичного корня. Если гипотеза 0H не отвергается, то необходимо провести новый тест на проверку гипотезы )2(~}{:0 IXH t против )1(~}{:1 IXH t . Если по результатам нового теста гипотеза 0H отвергается, то делается вывод о том, что исходный временной ряд tX содержит единственный единичный корень. Если же гипотеза 0H не отвергается (что маловероятно на практике), то делается вывод о том, что исходный ряд tX является как минимум интегрированным второго порядка. Тесты следует продолжать аналогичным образом до тех пор, пока нулевая гипотеза не будет отвергнута. Необходимо отметить, что тесты Дики-Фуллера дают корректные результаты только в том случае, если остатки tε представляют собой «белый шум».

3.3.2 Критерий Филипса-Перрона (Phillips-Perron)

Этот критерий сводит проверку гипотезы о принадлежности ряда tX классу DS к проверке гипотезы ttXH ε=∆:0 (т.е. 0=ψ ) против ttt tXXH ελµψ +++=∆ −11 : , 0<∆ψ .

Page 43: alekhin_ts

43

где, как и в критерии Дики-Фуллера, параметры µ и λ могут быть взяты равными нулю. Однако, в отличие от критерия Дики-Фуллера, случайные составляющие tε с нулевыми математическими ожиданиями могут быть автокоррелированными (с достаточно быстрым убыванием автокорреляционной функции), иметь различные дисперсии (гетероскедастич-ность) и не обязательно нормальные распределения (но такие, что CE t ≤δε || для некоторого 2>δ ). Тем самым, в отличие от критерия Дики-Фуллера, к рассмотрению допускается более широкий класс временных рядов. Критерий Филлипса-Перрона основывается на Z-статистике для проверки гипотезы 0H . Для применения критерия Филипса-Перрона необходимо решить вопрос о выборе коли-чества используемых лагов L в оценке Newey-West (параметр L называют «шириной окна» — window size). Этот вопрос достаточно важен, т.к. недостаточая ширина окна ведет к отклонениям от номинального размера критерия (уровня значимости). В то же время, увеличение ширины окна для избежания отклонений от номинального размера критерия ведет к падению мощности критерия. Таким образом, выбор какой-то конкретной ширины окна является компромиссом между двумя этими противоположными тенденциями. Целый ряд исследований в этом направлении (сюда относятся, например, работы [Phillips, Одно из правил выбора значения L реализованное, в частности, в пакете EViews. Оно состоит в выборе значения ])100/(4[ 9/2nL ⋅= .

3.4 Правила построения ARIMA-моделей

По материалам сайта http://www.duke.edu/~rnau/411home.htm Robert F. Nau [email protected]

3.4.1 Несезонные модели. Выбор порядка дифференцирования

Самый первый и самый важный шаг при построении АРПСС-модели – определение порядка дифференцирования, необходимого для того, чтобы превратить ряд в стационарный. Как правило, дифференцировать нужно до тех пор, пока мы не получим ряд, благонравно флуктуирующий вокруг понятного среднего, ACF которого быстро убывает, стремясь к нулю сверху или снизу. Если у ряда наблюдается медленный тренд или другие отклонения, либо если его ACF положительна при достаточно больших значениях аргумента (число 10 уже достаточно велико), ряд, видимо, нужно продифференцировать еще раз. Мы назовем это первым правилом выбора ARIMA-модели:

Правило 1: Если автокорреляционная функция ряда положительна при значении аргумента, равном k, этот ряд, по-видимому, понадобится продифференцировать не менее k раз.

Дифференцирование уменьшает коррелированность: если корреляции исходного ряда строго положительны, то (несезонное дискретное) дифференцирование уменьшает их или даже делает отрицательными. Повторное дифференцирование еще уменьшает автокорреляции. Если значение ACF в точке k значимо отрицательно (отрицательные значения ACF не меньше 0.5 по абсолютной величине!), это вполне может означать, что ряд пере-дифференцирован. На первый взгляд такой ряд может выглядеть вполне случайным. Приглядитесь внимательнее к графику: у передифференцированного ряда последовательные значения слишком часто меняют знак: плюс-минус-плюс-минус… — такое поведение не случайно!

Page 44: alekhin_ts

44

Правило 2: Если автокорреляционная функция отрицательна или равна нулю при значении аргумента, равном k-1, ряд не нуждается в дифференцировании порядка, превосходящего k. Если значения автокорреляционной функции меньше или равны –0.5, ряд, по-видимому, передифференцирован.

Еще один признак возможной передифференцированности — увеличение стандартного отклонения с ростом порядка дифференцирования. Это и станет нашим третьим правилом:

Правило 3: Оптимальный порядок дискретной производной — тот, при котором минимально стандартное отклонение.

Первые два правила не всегда позволяют сколько-нибудь точно определить нужный порядок дифференцирования. Ниже мы увидим, что “умеренную недодифференцированность” можно скомпенсировать добавлением AR-членов, а “умеренную передифференцированность” — добавлением МА-членов. Иногда можно построить две модели, которые соответствуют данным примерно одинаково: модель, в которой порядок дифференцирования равен 0 или 1 и имеются AR-члены, и модель с большим порядком дифференцирования и СС-членами. Выбор между двумя такими моделями может основываться на ваших личных предпочтениях о виде нестационарности исходного ряда — другими словами, что вы предпочитаете: отсутствие фиксированного среднего или постоянный средний тренд.

Правило 4: Модель без дифференцирования предполагает, что исходный ряд стационарен. В модели с первой производной предполагается, что у исходного ряда имеется постоянный тренд (примером является случайное блуждание). В модели с второй производной предполагается, что тренд ряда непостоянен во времени (пример — случайный тренд).

При выборе порядка дифференцирования следует принимать во внимание роль константы в модели, если, конечно, она включена. Константа представляет среднее ряда в моделях без дифференцирования, линейный тренд в моделях с производными первого порядка, нелинейный полиномиальный тренд в моделях с производными более высокого порядка. Как правило, предполагается, что производные второго и более высокого порядка элиминируют тренд, так что в подобные модели константу не включают. В модели без дифференцирования или с производной первого порядка константу часто включают. Таким образом, мы получаем:

Правило 5: В модели без дифференцирования константу, как правило, включают – в них она соответствует среднему ряда. В модели с производными второго и более высокого порядка константу, как правило, не включают. В модели с производной первого порядка константу следует включить в случае, если у производной имеется тренд.

Пример На рис. 1(а) представлен график ряда, впервые рассмотренного (ряд М) в основополагающей книжке Бокса и Дженкинса. Автокорреляционная функция этого ряда, представленная на рис. 1(б) убывает медленно и линейно, что характерно для нестационарных рядов.

Page 45: alekhin_ts

45

145

137

129

121

113

105

97

89

81

73

65

57

49

41

33

25

17

9

1

M

280

260

240

220

200

180

(а)

ACF

16151413121110987654321

1.0

.8

.6

.4

.2

0.0

-.2

(б)

Рис. 1. Ряд M из книжки Бокса и Дженкинса – уровни продаж (а) и его ACF (б). Ясно, что ряд нужно продифференцировать по крайней мере один раз. Первая производная ряда представлена на рис.2.

145

137

129

121

113

105

97

89

81

73

65

57

49

41

33

25

17

9

M

6

4

2

0

-2

-4

(а)

M

Ïðåîáðàçîâàíèÿ: ïðîèçâîäíàÿ(1)

16

15

14

13

12

11

10

9

8

7

6

5

4

3

2

1

ÀÊ

Ô

,4

-,1

Äîâåðèòåëüíûå

ïðåäåëû

Êîýôôèöèåíò

(б)

Рис. 2. Производная ряда М (а) и ACF производной (б) Обратите внимание на то, что продифференцированный ряд уже похож на стационарный: в нем не виден тренд, он демонстрирует явственную тенденцию возвращаться к своему среднему, быть может, чуть-чуть слишком лениво. У ACF на рис. 2(б) достаточно мало положительных значений, хотя, конечно, хотелось бы, чтобы их было еще меньше. Из нижеследующих дескриптивных статистик мы видим, что и стандартное отклонение среднего сильно уменьшилось – с 21.48 до 1.44.

Дескриптивные статистики M N 150 Минимум 198,60 Максимум 263,30 Среднее 229,9780 Стд. отклонение 21,4797

DIFF(M,1) N 149 Минимум -2,70 Максимум 4,80 Среднее ,4201 Стд. отклонение 1,4440

N валидных N 149

Page 46: alekhin_ts

46

Поскольку тренд у ряда DIFF(SALES,1) отсутствует, а количество положительных автокорреляций достаточно мало, можно считать его стационарным. На всякий случай посмотрим, что получится, если мы возьмем еще одну производную:

145137

129121

113105

9789

8173

6557

4941

3325

179

M

4

2

0

-2

-4

-6

M

1615

1413

1211

109

87

65

43

21

AC

F

,5

0,0

-,5

Confidence Limits

Coefficient

Посмотрите: мы видим упоминавшиеся выше признаки передифференцированности: значения ряда слишком часто меняют знак, а на графике ACF мы видим одно большое отрицательное значение, близкое к -0.5, при лаге, равном 1. Кроме того, и стандартное отклонение возросло от 1.444 до 1.698:

Дескриптивные статистики M N 150 Минимум 198,60 Максимум 263,30 Среднее 229,9780 Стд. отклонение 21,4797 DIFF(M,2) N 148 Минимум -4,70 Максимум 3,40 Среднее 7,432E-03 Стд. отклонение 1,6977 N валидных N 148

Итак, нам следует начать с ряда, продифференцированного один раз. Конечно, исследование на этом не заканчивается: вполне может оказаться, что при добавлении AR- или МА-членов нам понадобится другой порядок производной ряда. Или может оказаться, что для долговременного прогноза свойства модели с другим порядком производной окажутся более согласующимися с интуитивными представлениями (мы еще поговорим об этом). Однако, в качестве первого приближения мы пока можем считать подходящей производную первого порядка.

3.4.2 Выбор количества AR- и MA-членов

После того, как ряд «стационаризован» дифференцированием, нам нужно установить, какие члены нужны для аппроксимации оставшихся автокорреляций — АР или МА. Конечно, можно попросту испытать несколько моделей и посмотреть, какая из них работает лучше. Есть, однако, путь, экономящий затраты умственной энергии. Рассматривая графики ACF и PACF ряда мы можем ориентировочно оценить нужное количество AR- и/или МА-членов.

Page 47: alekhin_ts

47

Как вы, конечно, помните, автокорреляционная функция (ACF) состоит из обычных корреляций между рядом и им же, сдвинутым на одну, две и т.д. позиции, лаги. Аналогично, частная автокорреляционная функция (PACF) состоит из частных корреляций между рядом и им же, сдвинутым на один, два и т.д. лага.

Вернемся к ряду М. Вот как выглядят ACF и PACF этого ряда:

M

Íîìåð ëàãà

1615

1413

1211

109

87

65

43

21

ÀÊ

Ô

1,0

,5

0,0

-,5

Äîâåðèòåëüíûå

ïðåäåëû

Êîýôôèöèåíò

(a)

M

Íîìåð ëàãà

1615

1413

1211

109

87

65

43

21

×àñò

íàÿ

ÀÊ

Ô

1,0

,5

0,0

-,5

Äîâåðèòåëüíûå

ïðåäåëû

Êîýôôèöèåíò

(b)

Автокорреляции значимы при больших значений аргумента. Но, быть может, автокорреляции при лагах, больших 2, велики только из-за «распространения» автокорреляции при лаге 1? Это предположение подтверждается графиком PACF(b), из которого мы видим, что значимым является лишь значение PACF при лаге 1. Это и означает, это и имеют в виду, когда говорят, что автокорреляции при больших лагах полностью объясняются автокорреляцией при лаге 1.

Частные автокорреляции при всех лагах можно вычислить, подгоняя последовательность авторегрессионный моделей с увеличивающимся числом членов. В частности, частная автокорреляция при лаге k равняется k-му коэффициенту AR(k) в авторегрессионной модели с k членами. То же самое по другому: если мы возьмем переменную Y и рассмотрим ее регрессию на переменные )(XL , )(X2L , …, )(XkL , то коэффициент при переменной

)(XjL , как раз и будет равен j–й частной автокорреляции. Таким образом, вы можете определить нужное количество AR–членов, просто глядя на PACF ряда: если значения PACF значимы до лага k, а после него незначимы, следует начинать с авторегрессионной модели порядка k. Наш ряд демонстрирует в точности описанное поведение: у его PACF пик при лаге 1 и более нет значимых значений. Это говорит нам, что если ряд не дифференцировать, то следует использовать модель AR(1). Однако, в данном конкретном случае такая модель эквивалентна однократному дифференцированию, поскольку коэффициент при AR(1)–члене (который равняется высоте пика PACF при лаге 1) почти в точности равняется 1. Действительно, рассмотрим уравнение AR(1) модели:

11 −+= tt XaX µ

Если коэффициент 1a при AR(1)–члене равен 1, то уравнение говорит нам, что первая (дискретная) производная ряда равна константе, т.е. что уравнение задает, на самом деле, модель случайного блуждания с линейным сносом:

µ=− −1tt XX .

PACF ряда SALES говорит нам, что если мы не хотим дифференцировать ряд, то нам следует использовать модель AR(1), которая оказывается эквивалентной модели с первой

Page 48: alekhin_ts

48

производной. Другими словами, ряд SALES на самом деле нужно продифференцировать — это «стационаризует» его.

Признаки AR и MA. Если PACF резко обрывается, а ACF убывает достаточно медленно (т.е. имеет значимые пики при достаточно больших лагах), мы говорим, что «стационаризованный» ряд демонстрирует AR-признаки, имея в виду, что наблюдаемые свойства автокорреляций ряда легко объясняются добавлением AR-членов, и трудно — добавлением MA-членов. Как правило, AR-признаки вызываются положительной автокорреляцией при лаге 1, т.е. обычно возникают в слегка недодифференцированных рядах. Причиной этого является то, что AR-член ведет себя в уравнении, как «частная производная». Например, в AR(1)-моделях он ведет себя как первая производная, если коэффициент при нем равен 1, и как частная производная, если коэффициент находится между 0 и 1. Таким образом, если ряд слегка недодифференцирован, т.е. если нестационарность, вызванная положительной автокорреляцией, не полностью элиминирована, AR-член «попросит» частную производную проявиться как AR-признак. Итак, мы приходим к следующему эмпирическому правилу:

Правило 6: Если PACF продифференцированного ряда резко обрывается в точке k и/или значение автокорреляции в точке k–1 положительно, т.е. если ряд выглядит слегка “недодифференцированным”, следует попробовать добавить к модели авторегрессионный член. Значение аргумента k, после которого PACF “обрывается”, — первый кандидат на порядок авторегрессионной части модели.

В принципе любую автокорреляционную картину можно смоделировать, добавляя в модель “стационаризованного” ряда достаточное количество авторегрессионных членов; PACF помогает нам определить их примерное число. Однако, это не всегда приводит к простейшей модели: иногда лучше добавлять МА-члены. Автокорреляционная функция для МА-членов играет ту же роль, которую для AR-членов играет PACF: значения ACF говорят нам, сколько примерно МА-членов понадобится. Если значения ACF значимы до лага k (после они незначимы), в модели, по-видимому, уместно использовать k МА-членов. В таких случаях говорят, что стационаризованный ряд демонстрирует «МА-признаки», имея в виду, что характер автокорреляций легче объясняется добавлением МА-членов, чем добавлением AR-членов.

МА-признаки, как правило, связывают с отрицательными автокорреляциями при лаге 1. Другими словами, они часто возникают в слегка передифференцированных рядах. Это можно объяснить тем, что МА-члены могут частично уравновесить дифференцирование в модели. В самом деле, вспомним, что модель ARIMA(0,1,1) без константы эквивалентна обычному экспоненциальному сглаживанию. Уравнение такой модели:

111 −− −= ttt bXX ε ,

где МА(1)-коэффициент 1b соответствует α−1 в экспоненциальном сглаживании. Если коэффициент при МА(1)-члене равен 1, в соответствующей модели экспоненциального сглаживания 1=α , так что эта модель в качестве прогноза предлагает константу, поскольку модельное значение не корректируется. Это означает, что когда МА(1)-коэффициент равен 1, модель на самом деле аннулирует дифференцирование, а это приводит к тому, что прогноз экспоненциально сглаженной модели «приклеивается» к последнему наблюдению. С другой стороны, если МА(1)-коэффициент равен 0, модель сводится к модели случайного блуждания, т.е. оставляет только дифференцирование. Таким образом, если МА(1)-коэффициент больше 0, можно сказать, что мы слегка уменьшили порядок дифференцирования. Если ряд уже передифференцирован, т.е. если наблюдаются отрицательные автокорреляции, он «попросит» слегка уменьшить порядок дифференцирования, продемонстрировав МА-признаки. (Обратите внимание на высокую

Page 49: alekhin_ts

49

степень нестрогости всех этих рассуждений!) Итак, мы приходим к следующему эмпирическому правилу:

Правило 7: Если ACF продифференцированного ряда резко обрывается и/или значение ACF в точке k-1 отрицательно, т.е. ряд выглядит слегка передифференцированным, следует ввести в модель МА-члены. Значение аргумента k, при котором ACF обрывается, — первый кандидат на порядок МА-части модели.

Модель ARIMA(2,1,0) для ряда М Мы уже определили, что ряд М требуется продифференцировать (по крайней мере) один раз. ACF и PACF производной выглядят так:

DIFF(M,1)

Ëàã

1615

1413

1211

109

87

65

43

21

ÀÊ

Ô

,5

0,0

-,5

Äîâåðèòåëüíûå

ïðåäåëû

Êîýôôèöèåíò

DIFF(M,1)

Ëàã

1615

1413

1211

109

87

65

43

21

×àñò

íàÿ

ÀÊ

Ô

,5

0,0

-,5

Äîâåðèòåëüíûå

ïðåäåëû

Êîýôôèöèåíò

Обратите внимание на то, что (а) корреляция при лаге 1 значима и положительная; (б) у PACF «обрыв» более крутой, чем у ACF. В частности, у PACF ровно два значимых значения, в то время как у ACF — целых четыре. Таким образом, согласно правилу 7, продиф-ференцированный ряд демонстрирует нам признаки AR(2). Вот как выглядят графики ACF и PACF для остатков модели ARIMA(2,1,0): Прогноз за пределы обучающего периода демонстрирует линейный тренд:

Page 50: alekhin_ts

50

172163

154145

136127

118109

10091

8273

6455

4637

2819

101

305

285

265

245

225

205

185

M

Fit

95% LCL

95% UCL

Тренд в долговременном прогнозе возникает из-за того, что в модель входят (несезонная) производная и константа — модель, таким образом, является случайным блужданием со сносом, аппроксимируемым двумя AR-членами. Итак, уравнение модели выглядит следующим образом:

)()( 3222111 −−−−− −+−++= tttttt XXXXXX ϕϕµ .

Другая модель для ряда М – ARIMA(0,2,1) Напомню, что когда мы начали анализировать ряд, мы не были вполне уверены в порядке производной. Производная первого порядка дала нам ряд с минимальным стандартным отклонением и умеренной положительной автокорреляцией, зато производная второго порядка выглядит более стационарной, хотя и сильнее автокоррелированной. Вот графики ACF И PACF второй производной:

M

Transforms: difference (2)

1615

1413

1211

109

87

65

43

21

AC

F

,5

0,0

-,5

Confidence Limits

Coefficient

M

Transforms: difference (2)

1615

1413

1211

109

87

65

43

21

Par

tial A

CF

,5

0,0

-,5

Confidence Limits

Coefficient

Page 51: alekhin_ts

51

На графике ACF мы видим единственный отрицательный пик при лаге 1, который, согласно правилу 8, интерпретируем как МА(1)-признак. Таким образом, если мы захотим работать с второй производной, нам понадобится также включить в модель МА(1)-член, что приводит нас к модели ARIMA(0,2,1). Согласно правилу 5 нам лучше исключить из модели постоянный член. Вот как выглядят результаты подгонки модели ARIMA(0,2,1) без константы: Уравнение для этой модели выглядит следующим образом:

11212 −−− +−= tttt XxX εθ ,

где 1θ — коэффициент при МА(1)-члене. Взгляните на это соотношение внимательнее! Узнаете экспоненциальное сглаживание? Коэффициент 1θ равняется 2×(1-α), где α — весовой коэффициент из модели экспоненциального сглаживания. Поскольку 1θ = 0.75, экспоненциальное сглаживание с около 0.63 должно примерно так же соответствовать данным. Оказывается, оптимальное α равно примерно 0.61, что не слишком далеко от 0.63. Все три модели ведут себя примерно одинаково в обучающем периоде, а в экзаменационном ARIMA(2,1,0) выглядит чуточку лучше. Основываясь только на приведенных статистических результатах, трудно остановиться на какой-либо одной модели. Однако, если мы посмотрим на график, мы увидим, что ARIMA(0,2,1) без константы (которая, как мы видели, во всем существенном совпадает с моделью экспоненциального сглаживания) сильно отличается от ARIMA(2,1,0).

Ìîäåëü ARIMA(0,2,1)

172163

154145

136127

118109

10091

8273

6455

4637

2819

101

320

300

280

260

240

220

200

180

M

Fit

95% LCL

95% UCL

Мы видим, что у прогноза имеется тренд, который несколько меньше, чем тренд предыдущей модели — поскольку тренд у конца ряда слегка меньше среднего тренда ряда. Зато доверительные границы растут намного быстрее. Модель с производной второго порядка предполагает, что тренд ряда изменяется со временем, поэтому ближайшее будущее с «точки зрения» этой модели намного менее определенно, чем с «точки зрения» модели с производной первого порядка.

Page 52: alekhin_ts

52

Какую же модель выбрать? Это зависит от предположений о характере тренда, которые мы готовы принять. Если мы предполагает, что тренд — константа, то нам подходит модель с производной первого порядка. Такая модель чрезвычайно оптимистично оценивает надежность прогноза на одну точку вперед. Модель с производной второго порядка более подходит, если мы считаем, что характер тренда непостоянен, что тренд меняется со временем. Такая модель близка к линейному экспоненциальному сглаживанию, которое и разработано для случаев с неустойчивым трендом. При прочих равных, нужно, конечно, выбирать модели с наименьшим возможным порядком производной. Как правило, модели случайного блуждания и простое экспоненциальное сглаживание работают лучше, чем линейное экспоненциальное сглаживание.

3.4.3 Смешанные модели

Во многих случаях лучшими оказываются «чистые» модели – либо авторегрессионные, либо модели скользящего среднего. В тех случаях, когда это не так, когда данные лучше аппроксимирует смешанная модель, нужно тщательно подбирать AR- и MA-порядки, поскольку AR- и MA-члены взаимозависимы и взаимозаменяемы. Вполне может оказаться, что два таких члена «гасят» друг друга, хотя оба оказываются значимыми, если основываться на t-статистике для их коэффициентов. Пусть, например, «истинной» является модель ARIMA(0,1,1), а мы оцениваем модель ARIMA(1,1,2). Излишние члены могут оказаться значимыми в модели, но на деле они работают «противоположных направлениях». В процесс оценки параметров окажется неустойчивым и потребует много (скажем, больше 10) итераций. Итак, вот наше

Правило 8: Вполне может случиться, что AR- и МА-члены взаимно «аннигилируют». Поэтому, если вы подгоняете смешанную модель, не поленитесь исследовать модель, в которой на 1 меньше AR-членов, а также модель, в которой на 1 меньше МА-членов. Это особенно важно, когда процесс подгонки исходной модели требует много итераций; 10 итераций – это уже много.

По этой причине при идентификации модели ARIMA не применимо пошаговое исключение. Другими словами, вы не можете включить лишние AR- и МА-члены, а потом исключать по одному те из них, при которых коэффициенты окажутся незначимыми. Вместо этого следует использовать пошаговое включение, добавляя нужные члены в соответствии с поведением ACF и PACF.

3.4.4 Единичные корни

Признаком того, что ряд сильно пере- или сильно недодифференцирован, часто является единичный корень в оцененных AR- или MA-коэффициентах модели. Про единичный корень у АР(1)-модели говорят в случае, когда оценка АР(1)-коэффициента примерно равна 1. В подобных случаях АР(1)-член эквивалентен взятию первой производной, так что следует отказаться от AR-члена и честно продифференцировать ряд. (Вы столкнетесь с такой ситуацией, если попытаетесь подогнать модель ARIMA(1,0,0) для ряда sales.) При работе с AR-моделями более высокого порядка о единичном корне говорят, когда сумма AR-коэффициентов в точности равна 1. В подобных ситуациях следует уменьшить AR-порядок модели на 1 и увеличить на 1 порядок дифференцирования. Временной ряд с единичным корнем нестационарен и, значит, «хочет», чтобы его продифференцировали.

Правило 9: Если в AR-части модели имеется единичный корень, т.е. если сумма AR-коэффициентов равна 1, следует уменьшить на единицу число AR-членов и увеличить на единицу порядок дифференцирования.

Page 53: alekhin_ts

53

Аналогично, говорят, что у МА(1)-модели имеется единичный корень, когда МА(1)-коэффициент в точности равен 1. В подобной ситуации МА(1)-член точно «отменяет» одно дифференцирование; другими словами, следует уменьшить МА-порядок модели на 1 и на 1 уменьшить порядок дифференцирования. При работе с МА-моделями более высокого порядка о единичном корне говорят, когда сумма МА-коэффициентов в точности равна 1.

Правило 10: Если в МА-части модели имеется единичный корень, т.е. если сумма МА-коэффициентов равна 1, следует уменьшить на 1 число МА-членов и уменьшить на 1 порядок дифференцирования.

Если, например, вы подгоняете модель линейного экспоненциального сглаживания (т.е. ARIMA(0,2,2)), в то время, как достаточным было бы простое экспоненциальное сглаживание (т.е. ARIMA(0,1,1)), то вы вполне можете получить два МА-коэффициента, сумма которых близка к 1. Уменьшив МА-порядок и порядок дифференцирования на 1 каждый, вы и получите более адекватную модель простого экспоненциального сглаживания. Модель прогноза с единичным корнем в оцененных МА-коэффициентах иногда называют необратимой, имея в виду, что остатки такой модели нельзя рассматривать как оценки «истинного» случайного шума, лежащего в основе анализируемого временного ряда. Другим симптомом единичного корня является неестественный характер прогноза. Если график долговременного прогноза временного ряда выглядит странно, например, его тренд имеет «взрывной» характер, следует проверить коэффициенты модели — нет ли там единичного корня.

Правило 11: Если долговременный прогноз оказывается в каком бы то ни было смысле неустойчивым или странным, следует проверить коэффициенты модели на присутствие единичного корня.

Обратите внимание на то, что ни одна из этих проблем не возникла в рассмотренных здесь моделях. Объяснение совсем простое — мы тщательно подбирали подходящий порядок дифференцирования и количества AR- и МА-членов. Идентификация модели основывалась на графиках ACF и PACF.

3.4.5 Сезонные модели

Сезонная часть модели ARIMA строится по той же схеме, что и ее несезонная часть: у нее может быть AR- и/или МА-часть, в нее также может быть включена (дискретная сезонная) производная. В сезонной части модели все эти составляющие оперируют с последовательными членами ряда, расположенными на расстоянии s друг от друга, где s – число отсчетов на период. Сезонная модель ARIMA обозначается так: ARIMA(p,d,q)×(P,D,Q), где P — количество сезонных АР(САР)-членов, D — порядок сезонной производной, Q — количество сезонных МА-членов. При идентификации сезонной модели прежде всего определите, нужна ли в модели сезонная производная? Нельзя ли «обменять» ее на обычную (несезонную) производную? Может быть, стоит использовать сезонную производную вместо обычной? Принять это решение вам помогут графики ACF и PACF для всех возможных комбинаций сезонной и несезонной производных нулевого и первого порядков. Предупреждения: никогда не пользуйтесь сезонной производной порядка выше 1; никогда не пользуйтесь моделями, в которых сумма порядков сезонной и несезонной производных больше 2. Если сезонная зависимость достаточно сильна и устойчива (скажем, значения высоки летом и малы зимой или наоборот), то, по-видимому, следует включить в модель сезонную производную вне зависимости от того, включена ли в модель обычная, несезонная, производная. Если этого не сделать, сезонная компонента будет убывать при долговременном прогнозе. Итак, добавим к нашему списку правил следующее:

Page 54: alekhin_ts

54

Правило 12: Если ряд демонстрируют достаточно явственную и устойчивую сезонную компоненту, следует включить в модель сезонную производную. Не используйте сезонные производные порядка, большего 1; не пользуйтесь моделями, у которых сумма порядков сезонной и несезонной производных больше двух.

Сезонные AR- и МА-проявления схожи с их несезонными аналогами. Различие проявляется только в том, что на графиках ACF и PACF они отстоят друг от друга на лаг s. Например, у чистого процесса SMA(1) мы найдем пики ACF при лагах s, 2s, 3s и т.д., а PACF равна нулю после лага s. У чистого процесса SAR(1) мы, напротив, увидим пики PACF при лагах s, 2s, 3s и т.д., а после лага s равна нулю ACF. Признаки SAR наблюдаются, как правило, когда автокорреляции в лагах s, 2s, 3s и т.д. положительны, а признаки SMA — когда они отрицательны. Таким образом,

Правило 13: Если автокорреляции в сезонных точках положительны, попробуйте включить в модель SAR-члены. Если же эти автокорреляции отрицательны, включайте в модель SMA-члены. Не смешивайте SAR- и SMA-члены в модели, избегайте включения более одного из них.

Как правило, достаточно, чтобы модель была либо SAR(1), либо SMA(1). Модели с SAR(2) или с SMA(2) встречаются редко, еще реже у вас хватит данных, чтобы оценить коэффициенты подобных моделей. В самом деле, чтобы оценить коэффициенты, вам понадобится 4–5 сезонных периода. Таким образом, как правило, рассматриваются модели ARIMA лишь с небольшим числом параметров; таким образом, наиболее популярной сезонной моделью ARIMA оказывается ARIMA(0,1,1)×(0,1,1), т.е. модель AR(1)×SMA(1) с сезонной и несезонной производными. Узнали модель сезонного экспоненциального сглаживания?

Error for M from ARIMA(2,1,0)

Ëàã

1615

1413

1211

109

87

65

43

21

ÀÊ

Ô

,5

0,0

-,5

Äîâåðèòåëüíûå

ïðåäåëû

Êîýôôèöèåíò

Error for M from ARIMA(2,1,0)

Ëàã

1615

1413

1211

109

87

65

43

21

×àñò

íàÿ

ÀÊ

Ô

1,0

,5

0,0

-,5

-1,0

Äîâåðèòåëüíûå

ïðåäåëû

Êîýôôèöèåíò

Автокорреляции в самых важных лагах — лагах 1 и 2 — «ушли», отсутствуют сколько-нибудь выраженные закономерности при больших лагах. На графике остатков мы наблюдаем не вполне удовлетворяющую нас тенденцию: ряд "блуждает" вокруг среднего,

Page 55: alekhin_ts

55

145137

129121

113105

9789

8173

6557

4941

3325

179

1

Err

or fo

r M fr

om A

RIM

A(2

,1,0

)

4

2

0

-2

-4

-6

Однако, из результатов, выдаваемым процедурой ARIMA, мы видим, модель, тем не менее, ведет себя вполне удовлетворительно. Оба AR-коэффициента значимо отличаются от нуля. Единичный корень не грозит нашей модели, поскольку сумма AR-коэффициентов (.248 + .199=.447) достаточно далека от 1. В целом, довольно хорошая модель!

Page 56: alekhin_ts

56

ЛИТЕРАТУРА 1. Носко В.П. Эконометрика. Введение в регрессионный анализ временных рядов.

www.iet.ru 2. Арженовский С.В., Молчанов И.Н. Статистические методы прогнозирования. Учебное

пособие для аспирантов. Ростов-на-Дону, 2001 http://rseu.narod.ru/stat_meth_forecas_02.pdf 3. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики. —

М: ЮНИТИ, 1998. — 1022с.