Лекції з економетрії
1. Вступ. Загальні принципи побудови економетричних моделей.
1. Предмет економетрії. Виникнення, становлення і розвиток економетрії.
2. Математичне та статистичне підгрунтя економетрії, роль ЕОМ в сучасній
економетрії.
3. Звя’зок економетрії з макроекономікою. Приклади економетричних моделей.
4. Роль економетрії в економічних дослідженнях.
5. Інформаційна база економетричних моделей.
Сьогодні можна стверджувати, що сучасна економіка з різноманітністю її
засобів спостереження, методів обробки інформації та моделювання
економічних систем стала значною мірою міждисциплінарним утворенням, що
об’єднує багато галузей науки, таких як математика і інформатика, теорія
ймовірностей та математична статистика тощо. Особливе місце в цьому списку
займає економетрія.
В буквальному перекладі слово ―економетрія‖ означає ―вимірювання
економіки‖. Але звичайно це поняття є значно ширшим, хоча вимірювання є
однією з його складових частин.
Часто використовується наступне визначення: економетрія –– це наука,
що вивчає кількісні закономірності та взаємозв’язки економічних об’єктів і
процесів за допомогою математико-статистичних методів та моделей.
Як самостійна дисципліна економетрія сформувалась у 20—30-х роках
ХХ століття завдяки працям Г. Мура та Г. Шульца. До цього вже були відомі
спроби математичної формалізації економіко-статистичних даних у працях
В.Парето (рівняння гіперболи для опису розподілу прибутку населення (1897
р.)) та Р.Хукера і А.Чупрова з кореляційного аналізу економічних процесів.
Перші праці з економетрії були присвячені розробці аналітико-статистичних
моделей. Здебільшого, це були рівняння лінійної регресії з параметрами, що
оцінювались за методом найменших квадратів. Такі рівняння дозволяли
описати як функції попиту та залежність їх від прибутків, обсягів випуску
продукції, рівня цін, податків та ін., так і функції пропозиції, виробничі
функції, що відображали технологічну залежність випуску продукції від затрат
праці та засобів виробництва. Одна з перших виробничих функцій була
побудована Коббом та Дугласом у 1928 році, а потім узагальнена Р. Солоу.
Лекції з економетрії
Починаючи з 30-х років відомі економісти Я.Танберген, Л.Клейн, Р.Стоун
та інші розробили моделі економіки, які описували статистичні зв'язки ви-
робництва, кінцевого індивідуального і державного попиту, цін, податків, зов-
нішньої торгівлі, пропозиції робочої сили, накопичення та зношування капі-
талу. Такі моделі складалися вже з багатьох рівнянь, у зв'язку з чим значно
ускладнились проблеми оцінювання невідомих параметрів. А це в свою чергу
привело до необхідності використання нового математичного апарату та
розширило можливості практичного використання економетрії.
До числа типових економіко-математичних моделей, які на сьогоднішній
день розробляє і вивчає економетрія, відносяться: виробничі функції, функції
попиту різних груп споживачів та цільові функції переваги споживачів,
статистичні та динамічні міжгалузеві моделі виробництва, розподілу і
споживання продукції, моделі загальної економічної рівноваги. Це певним
чином споріднює економетрику з макроекономікою.
У практичних дослідженнях економетричні методи використовуються не
тільки в економіці. Вони поширені у біології, історії, соціології та інших
суспільних і природничих науках, де необхідно розробляти та оцінювати
моделі, які формалізують зв'язки між великою кількістю змінних.
Крім того, сучасні економетричні методи широко використовуються для
порівняння ефективності різноманітних економічних гіпотез та послідовного їх
уточнення.
Етапи проведення економетричного аналізу
У стислому вигляді економетричний аналіз складається з таких етапів.
1. Формулювання теорії чи гіпотези.
2. Розробка економетричної моделі для перевірки цієї теорії.
3. Оцінка параметрів обраної моделі.
4. Перевірка моделі, статистичні висновки.
5. Прогнозування на основі отриманої моделі.
6. Застосування моделі (для контролю тощо).
Лекції з економетрії
Можна виділити такі основні завдання, які розв'язує економетрія.
1. Специфікувати модель, тобто необхідно, щоб усі функціональні зв'язки
входили до моделі у явному вигляді. Цього можна досягти методом ―від
простого до складного‖: почавши з найпростіших функцій, вводити та
перевіряти різні гіпотези і поступово, виходячи з реальних даних,
ускладнювати характер функціональних зв'язків.
2. Вибрати означення та одиниці вимірювання змінних, які входять до
моделі.
3. Оцінити всі невідомі параметри моделі та розрахувати інтервали довіри
(інтервали, до яких із заданою ймовірністю попадатиме обчислювана
величина).
4. Оцінити якість побудованої моделі за допомогою різних тестів та
критеріїв. Це допомагає остаточно вирішити питання, чи треба змінювати
початково обрану модель, та деякі теоретичні припущення. Якщо така
зміна необхідна, то треба проводити нові розрахунки і нове тестування.
5. Провести аналіз результатів, які планується використовувати на практиці
для прийняття рішень.
Лекції з економетрії
2. Проста вибіркова лінійна регресія.
Метод найменших квадратів.
Ймовірнісні і статистичні характеристики
простої вибіркової лінійної регресії
1. Загальне поняття про лінійну регресію.
2. Оцінка параметрів лінійної регресії за допомогою методу найменших
квадратів.
3. Властивості простої вибіркової лінійної регресії.
4. Коефіцієнти кореляції та детермінації.
5. Поняття про ступені вільності.
6. Дисперсійний аналіз у лінійній регресії.
Просту лінійну регресію використовують для встановлення лінійного
зв'язку між двома змінними: незалежною змінною x і залежною змінною y ,
значення яких є значеннями деяких ознак економічних процесів або явищ. При
цьому ознаку x називають факторною, а y –– результативною.
При регресійному аналізі визначаються два параметри: 0b –– перетин і
1b –– нахил регресії. Перетин показує значення y при умові, що x дорівнює
нулю, а значення нахилу 1b показує на скільки зміниться значення
результативної ознаки y при умові, що значення факторної ознаки x
збільшиться на 1.
На першому етапі побудови регресійної моделі для визначення форми
зв’язку між x та y будують діаграму розподілу (будують точки з координатами
( x , y )).
Одним з методів, які використовуються для обчислення параметрів
рівняння лінійної регресії, є метод найменших квадратів. При цьому шукають
такі параметри прямої, які б мінімізували загальну суму квадратів відхилень
фактичних значень від значень, які лежать на побудованій прямій (теоретичних
значень).
Основні припущення моделі лінійної регресії:
1) значеннями незалежної змінної x є або фіксовані числа, або, якщо
вони є випадковими змінними, то вони статистично незалежні від
випадкової величини (неспостережуваної випадкової величини);
2) випадкова величина розподілена за нормальним законом з
нульовим математичним сподіванням і постійною дисперсією;
Лекції з економетрії
3) випадкові величини i та ix статистично незалежні.
Щоб оцінити щільність зв’язку між x та y , використовують коефіцієнт
кореляції та коефіцієнт детермінації, які показують, наскільки варіація змінної
x пояснює варіацію y .
Щоб оцінити наскільки добре лінія регресії пояснює зв’язок між x та y ,
використовують стандартну помилку залишків, яка показує відхилення
емпіричних значень від лінії регресії.
При побудові регресійної моделі перевіряється гіпотеза про її
адекватність. Для цього можна використовувати F -критерій Фішера.
Під час оцінки параметрів регресії перевіряються гіпотези, чи
статистично значимо вони відрізняються від нуля. Для цього можна
використовувати t -тест Стьюдента.
Побудовану регресійну модель можна використовувати для
прогнозування величини результативної ознаки y при заданому значенні
факторної ознаки x , при цьому бажано будувати інтервал довіри для прогнозу.
Основні формули
Узагальнена регресійна модель xy 10 .
Вибіркова лінійна регресійна модель exbby 10 .
Коефіцієнт кореляції yx
n
iii
n
yyxx
r
1
))((
,
де n
xxn
ii
x
1
2
2
)(
, n
yyn
ii
y
1
2
2
)(
Обчислення параметрів за методом найменших квадратів
2
11
))((
x
n
iii
n
yyxx
b
, xbyb 10 .
Коефіцієнт детермінації
n
ii
n
iii
n
ii
n
ii
yy
yy
yy
yy
R
1
2
1
2
1
2
1
2
2
)(
)ˆ(
1
)(
)ˆ(
.
Лекції з економетрії
F -тест Фішера для перевірки моделі на адекватність:
2
)ˆ(
1
2
2,1
1
2
)ˆ(
n
yy
n
ii
n n
iii
yy
F ,
Спостережуване значення t -критерію Стьюдента для перевірки значущості
коефіцієнта кореляції:
22
1
2
r
nrtn
.
Спостережуване значення t -критерію Стьюдента для перевірки гіпотези
iibH :0 ( iibH :1 ):
,ˆ
2
ib
iin
bt
1,0i ,
n
ii
n
ii
b
xxn
x
1
2
1
2
)(
ˆˆ0 ,
n
ii
b
xx1
2)(
ˆˆ
1
, 2
)ˆ(
ˆ 1
2
2
n
yyn
iii
.
Спостережуване значення t -критерію Стьюдента для перевірки гіпотези
0:0 ibH ( 0:1 ibH ):
,ˆ
2
ib
in
bt
1,0i .
Довірчий інтервал для математичного сподівання значення ky :
n
ii
knk
xx
xx
nty
1
2
2
2,2/
)(
)(1ˆ
Довірчий інтервал для окремого значення ky :
n
ii
knk
xx
xx
nty
1
2
2
2,2/
)(
)(1ˆˆ .
Довірчий інтервал для прогнозованого значення 1ny :
n
ii
nnn
xx
xx
nty
1
2
21
2,2/1
)(
)(11ˆˆ
.
Лекції з економетрії
Зразки розв’язання задач
ix iy
15 580
19 590
21 591
22 595
25 600
26 602
27 602
28 607
31 608
Розв’язання. Побудуємо точковий графік залежності емпіричних значень
y від х.
Мал. 1.
575
580
585
590
595
600
605
610
0 5 10 15 20 25 30 35
x
yЗавдання 1. На базі статистичних даних про
річний продаж фірмою продукції y (тис. од.) та
витратами на наукові дослідження x (тис. гр. од.)
вибрати форму однофакторної моделі, оцінити всі її
параметри, визначити довірчі інтервали при рівні
значущості 05,0 . Оцінити прогноз 1ny для
наступного значення 341 nx , побудувати довірчий
інтервал для прогнозованого значення.
Лекції з економетрії
Форма графіка дозволяє зробити припущення про лінійну форму
залежності:
xbby 10 .
Обчислимо середні значення, дисперсії та середні квадратичні
відхилення продаж та витрат на наукові дослідження (допоміжні обчислення
наведені в таблиці 1):
1) середні значення:
78,239
2141
n
x
x
n
ii
; 22,5979
53751
n
y
y
n
ii
;
2) дисперсії:
95,219
56,197)(
1
2
2
n
xxn
ii
x ;
06,739
56,657)(
1
2
2
n
yyn
ii
y ;
3) середні квадратичні відхилення:
69,495,21 x ; 55,806,73 y .
Таблиця 1.
ix iy xxi yyi 2)( xxi 2)( yyi ))(( yyxx ii
15 580 -8,78 -17,22 77,05 296,60 151,17
19 590 -4,78 -7,22 22,83 52,16 34,51
21 591 -2,78 -6,22 7,72 38,72 17,28
22 595 -1,78 -2,22 3,16 4,94 3,95
25 600 1,22 2,78 1,49 7,72 3,40
26 602 2,22 4,78 4,94 22,83 10,62
27 602 3,22 4,78 10,38 22,83 15,40
28 607 4,22 9,78 17,83 95,60 41,28
31 608 7,22 10,78 52,16 116,16 77,84
Сума 214 5375 197,56 657,56 355,44
Лекції з економетрії
1. Обчислимо коефіцієнт кореляції:
99,055,869,49
44,355))((
1
yx
n
iii
n
yyxx
r
.
Оскільки значення коефіцієнта кореляції близькі до 1, то між факторним і
результативним показниками існує суттєвий прямий зв’язок.
Зміна факторного показника впливає на %10099,0 22 R =98% на зміну
результативного покзника.
2. Оцінимо параметри 1b та 0b лінійного рівняння регресії
xbby 10 за допомогою методу найменших квадратів.
80,195,219
44,355))((
2
11
x
n
iii
n
yyxx
b
,
42,55478,2380,122,59710 xbyb .
Рівняння регресії має вид:
xy 8,142,554ˆ .
Аналізуючи параметри рівняння регресії, можна зробити висновок: при
збільшенні факторного показника (витрат на наукові дослідження) на 1 (1 тис.
гр. од.) результативний показник (продаж продукції) збільшиться на 1,8 (1,8
тис. од.); якщо значення факторного показника будуть дорівнювати 0, то
значення результативного дорівнюватимуть 554,42.
3. Перевіримо адекватність побудованої моделі
Обчислимо дисперсію похибки:
9
04,18)ˆ(
1
2
2
n
yyn
iii
e 2,00.
Дисперсія похибки не прямує до нуля, але її значення значно менше
дисперсії 2y . Це дозволяє висунути гіпотезу про адекватність побудованої
моделі.
Застосуємо критерій Фішера, тобто перевіримо нульову гіпотезу
)ˆ(0: 10 yyH i при альтернативній )ˆ(0: 11 yyH i , де 1 –– нахил
узагальненої регресійної моделі.
Лекції з економетрії
Таблиця 2.
iy 2)ˆ( yyi 2)ˆ( ii yy
581,44 249,01 2,07
588,64 73,62 1,85
592,24 24,80 1,54
594,04 10,11 0,92
599,44 4,93 0,31
601,24 16,16 0,58
603,04 33,87 1,08
604,84 58,06 4,67
610,24 169,52 5,02
Сума 640,08 18,04
Обчислимо спостережуване значення F -критерію:
37,24804,18
08,6407
)ˆ(
)ˆ()2(
1
2
1
2
.
n
iii
n
ii
спост
yy
yyn
F .
За таблицями F -критерію за рівнем значущості 05,0 (надійністю
0,95) та числами ступенів свободи 1 і 72 n знаходимо 59,5)05,0(7,1 F .
Оскільки )05,0(7,1. FFспост , то побудована нами регресійна модель
може вважатись адекватною з ймовірністю 0,95.
4. Перевіримо значущість параметрів 0b та 1b .
Обчислимо середню квадратичну похибку рівняння регресії:
61,12
)ˆ(
ˆ 1
2
n
yyn
iii
та оцінки дисперсій параметрів 0b і 1b :
7679,2
)(
ˆˆ
1
2
1
2
0
n
ii
n
ii
b
xxn
x
; 0731,0
)(
ˆˆ
1
21
n
ii
b
xx
.
Лекції з економетрії
Перевіримо нульову гіпотезу 0:0 iH при альтернативній
0:1 iH за критерієм Стьюдента.
Знайдемо спостережувані значення Критерію Стьюдента для
параметрів регресії:
31,2007679,2
44,554
ˆ
||)(
0
00.
b
спост
bbt
; 62,24
0731,0
8,1
ˆ
||)(
1
11.
b
спост
bbt
.
Критичне значення 365,2)05,0(7 t .
Оскільки спостережувані значення більші )05,0(7t , то нульова гіпотеза
( 0:0 ibH ) для кожного параметра відкидається, а отже, обчислені значення 0b
та 1b є статистично значущими.
Побудуємо довірчі інтервали для параметрів рівняння регресії 0 та
1 :
2076,08,10731,084,28,1ˆ12
11 btb ,
86,744,5547679,284,244,554ˆ02
00 btb ,
що означає:
975,0}39,359,1{ 1 P , 975,0}28,56256,546{ 1 P .
5. Обчислимо прогноз для значення факторної ознаки 341 nx :
64,615348,144,554ˆ1101 nn xbby .
Побудуємо довірчий інтервал для залежної змінної y :
ky , де
61,4
56,197
)78,2334(
8
1161,1227,2
)(
11ˆ
2
1
2
2
1025,0
n
ii
n
xx
xx
nt .
Отже, інтервал довіри для прогнозу має вигляд 61,464,6151 ny .
Тобто з ймовірністю 0,95 можна стверджувати, що прогнозоване значення
результативної ознаки набуватиме значення з інтервалу (611,03; 620,25).
Побудуємо в одній системі координат графік емпіричної залежності
між факторною та результативною ознаками, теоретичну лінію регресії, а також
межі довірчого інтервалу для індивідуальних значень ky .
Лекції з економетрії
575
580
585
590
595
600
605
610
615
620
0 10 20 30 40
x
y
Емпірична
залежність
Лінія регресії
Нижня межа
довірчого інтервалу
Верхня межа
довірчого інтервалу
Мал. 2.
Лекції з економетрії
3. Криві зростання
1. Поняття про криві зростання.
2. Найпростіші перетворення нелінійних моделей у лінійні. Зведення до
лінійної регресії експоненціальної функції.
3. Зведення до лінійної регресії степеневої функції.
4. Квадратичні функції.
5. Деякі інші криві: крива Гомперця, логістична крива.
6. Методи обчислення невідомих параметрів нелінійних моделей.
Криві зростання використовуються для опису нелінійного зв’язку між
двома змінними.
Певні класи кривих зростання шляхом перетворень можна звести до
простої лінійної регресії. Для таких кривих залишаються правильними всі дії,
які були правильними для простої лінійної регресії, а саме:
обчислення невідомих параметрів проводиться за допомогою методу
найменших квадратів;
модель тестується на адекватність за F -критерієм Фішера;
параметри тестуються на значущість за t -критерієм Стьюдента;
будуються інтервали довіри для параметрів і для прогнозованого
значення.
Певний клас кривих зростання (модифікована експонента, крива
Гомперця, логістична крива) є нелінійними відносно своїх параметрів. Для
розрахунку невідомих параметрів у таких випадках використовуються методи
нелінійної регресії. У особливих випадках можливе також застосування
спрощених методів оцінювання, наприклад, методу трьох точок.
Лекції з економетрії
Основні формули
Основні типи кривих зростання та перетворення, які приводять їх до
лінійної форми:
Крива Перетворення Заміна
1. Експоненційна: xy lnlnln xy
10 ln,ln,ln bbzy
2. Степенева: xy xy lnlnln txbzy ln,ln,ln 0
3. Обернена: x
bby1
10
tx
1
4. Квадратична:
2210 xbxbby
2
21, txtx
Основні типи кривих, які зводяться до модифікованої експоненти
xy :
Крива Перетворення Заміна
1. Крива Гомперця:
x
ey
xyln zy ln
2. Логістична крива:
xy
1
x
y
1 z
y
1
Алгоритм методу трьох точок (на прикладі модифікованої
експоненти):
1. Розділити дані на 3 групи І, ІІ і ІІІ. Причому:
а) якщо вся кількість елементів ділиться на 3 без остачі, тобто kn 3 ,
то утворюємо 3 групи, кожна з яких містить k елементів;
б) якщо 13 kn , то група ІІ складається з 1k елементів, а групи І
та ІІІ містять по k елементів;
в) якщо 23 kn , то група ІІ складається з k елементів, а групи І та
ІІІ –– з 1k елементів.
2. Обчислити значення медіан у трьох групах. Позначимо ці значення
відповідно: IIIIII yyy ,, .
Лекції з економетрії
3. Розв’язати систему трьох рівнянь (нелінійних) з трьома невідомими:
.
,
,
III
II
I
xIII
xII
xI
y
y
y
Дану систему можна розв’язати наступним чином:
а) визначити різниці між другим і першим рівнянням та між третім і
другим:
)( IIIII xxIIIII yy , (1)
)( III xxIII yy ; (2)
б) поділити почленно рівняння (1) на рівняння (2), позначивши
IIIIIIII xxxx :
III
IIIII
yy
yy,
звідки
III
IIIII
yy
yyln
1ln .
в) визначити IIIII xx
IIIII yy
і Ix
Iy .
Остаточно отримаємо формули:
III
IIIII
yy
yyA ln
1, Ae ,
IIIII xx
IIIII yy
, Ix
Iy .
Лекції з економетрії
Зразки розв’язання задач
Завдання 2. Підібрати криву, яка
найточніше описує залежність між ознаками x та
y. Оцінити невідомі параметри рівняння регресії.
Розв’язання.
Побудуємо графік залежності між ознаками
x та y (мал. 3).
x y
1 78,2
2 265,88
3 903,992
4 3073,573
5 10450,15
6 35530,5
7 120803,7
8 410732,6
9 1396491
10 4748069
11 16143434
Мал. 3.
0
2000000
4000000
6000000
8000000
10000000
12000000
14000000
16000000
18000000
0 2 4 6 8 10 12
Лекції з економетрії
Розглянемо експоненційну модель xy та обчислимо її невідомі
параметри.
І спосіб.
Виконавши перетворення lnlnln xy та заміни
10 ln,ln,ln bbzy , отримаємо:
Таблиця 4.
ix iz 2)( xxi 2)( zzi )( xxi )( zzi
1 4,3593 25 37,441 30,594
2 5,583 16 23,962 19,58
3 6,8068 9 13,479 11,014
4 8,0306 4 5,9905 4,8951
5 9,2544 1 1,4976 1,2238
6 10,478 0 0 0
7 11,702 1 1,4976 1,2238
8 12,926 4 5,9905 4,8951
9 14,149 9 13,479 11,014
10 15,373 16 23,962 19,58
11 16,597 25 37,441 30,594
Сума 66 115,26 110 164,74 134,62
Аналогічно до завдання 1 обчислимо значення 22,11 b , 14,30 b . Отже,
отримали лінійне рівняння регресії 14,322,1ˆ xz .
Обчислимо параметри експоненційної моделі:
10,230 b
e , 39,31 b
e .
Лекції з економетрії
Побудуємо в одній системі координат графіки емпіричної та
узагальненої експоненційної залежностей між ознаками:
Мал.4.
Зауваження. Бажано проводити повне дослідження побудованої лінійної
моделі (див. завдання 1.).
0
2000000
4000000
6000000
8000000
10000000
12000000
14000000
16000000
18000000
1 2 3 4 5 6 7 8 9 10 11
Експоненційна залежність Емпірична залежність
Лекції з економетрії
ІІ спосіб (метод трьох точок).
Розділимо дані на 3 групи (оскільки 11n , то І і ІІІ групи міститимуть по
4 елементи, а ІІ –– 3 елементи):
x y
1 78,2
2 265,88
3 903,992
4 3073,573
5 10450,15
6 35530,5
7 120803,7
8 410732,6
9 1396491
10 4748069
11 16143434
В кожній групі визначимо медіану:
5,2Ix , Iy 584,936;
6IIx , IIy 35530,5;
5,9IIIx , IIIy 3072280.
Обчислимо 5,35,26 ,
.23,1
936,5845,35530
5,355303072280ln
5,3
1ln
42,324,1 e ;
98,24)42,3()42,3(
5,355303072228065,9
.
Порівнявши отримані результати зі значеннями, обчисленими за І
способом, бачимо, що вони досить близькі (відносна похибка не перевищує
5%).
Лекції з економетрії
5. БАГАТОФАКТОРНА ЛІНІЙНА РЕГРЕСІЯ
1. Класична багатофакторна модель.
2. Етапи побудови багатофакторної регресійної моделі.
3. Розрахунок невідомих параметрів багатофакторної регресії за методом
найменших квадратів.
4. Матричний підхід до лінійної багатофакторної регресії.
5. Методи побудови багатофакторної регресійної моделі.
Багатофакторна лінійна регресія є узагальненням простої лінійної
регресії, яка розглядалась в першому розділі. У багатофакторній регресії ми
припускаємо, що на залежну змінну y може впливати більше, ніж один фактор.
Основні припущення моделі багатофакторної лінійної регресії:
1) випадкова величина (неспостережувана випадкова величина) має
нормальний розподіл з нульовим математичним сподіванням і сталою
дисперсією;
2) значення випадкової величини не залежить від величини p , яка
визначає кількість незалежних змінних, що входять в модель;
3) випадкові величини i є статистично незалежними;
4) факторні ознаки ix є лінійно незалежними (у випадку лінійної
залежності отримуємо явище мультиколінеарності).
Методи побудови багатофакторної регресійної моделі:
1. Метод усіх можливих регресій.
2. Метод виключень.
3. Покроковий регресійний метод.
Невідомі параметри багатофакторної регресії обчислюються за
допомогою методу найменших квадратів, суть якого полягає в мінімізації суми
квадратів помилок.
Вплив кожного фактора (кожної незалежної змінної) на залежну змінну
характеризується частковими коефіцієнтами регресії (параметрами).
Частковий коефіцієнт регресії показує, на скільки одиниць зміниться значення
залежної змінної при збільшенні значення відповідного фактора на одиницю
при умові, що значення всіх інших факторів залишатимуться постійними.
Значущість всіх параметрів одночасно перевіряється за допомогою F -
критерію, а кожного окремо –– за допомогою t -критерію (для простої лінійної
Лекції з економетрії
регресії F - та t -тести були еквівалентними, для багатофакторної моделі це не
так).
Основні формули
Узагальнена багатофакторна регресійна модель:
ppxxxy ...22110 .
Вибіркова багатофакторна регресійна модель:
exbxbxbby pp ...22110 .
Оцінювання невідомих параметрів у багатофакторній регресії
З матричної форми вибіркової багатофакторної регресійної моделі:
EXBY , маємо )()( 1 YXXXB T , де
ny
y
y
Y...
2
1
–– вектор-стовпець значень залежної змінної y ,
pnnn
p
p
xxx
xxx
xxx
X
...1
...............
...1
...1
21
22212
12111
–– матриця значень факторних ознак 1x , 2x , …, px
(матриця спостережень), TX –– матриця, транспонована до матриці X ,
pb
b
b
B...
1
0
–– вектор-стовпець невідомих параметрів,
pe
e
e
E...
1
0
–– вектор-стовпець помилок.
Коефіцієнт множинної кореляції:
n
ii
n
ii
n
iii
yyyy
yyyy
R
1
2
1
2
1
)ˆˆ()(
)ˆˆ)((
.
Лекції з економетрії
Коефіцієнт детермінації:
n
ii
n
iii
n
ii
n
ii
yy
yy
yy
yy
R
1
2
1
2
1
2
1
2
2
)ˆ(
)ˆ(
1
)ˆ(
)ˆ(
.
Оцінений коефіцієнт детермінації:
1
1)1(11 2
1
)(
1
)ˆ(
2
1
2
1
2
pn
nRR
n
yy
pn
yy
n
ii
n
iii
.
Спостережуване значення критерію Фішера для перевірки моделі на
адекватність:
1
)ˆ(
)ˆ(
1,
1
2
1
2
pn
yy
p
yy
pnp n
iii
n
ii
F .
Довірчий інтервал довіри для окремого значення ky :
Tk
Tknk XXXXty 1
22 )(1ˆˆ
.
Довірчий інтервал довіри для прогнозованого значення 1ˆ
ny :
Tn
Tnnn XXXX
nty 1
11221 )(
11ˆˆ
.
Лекції з економетрії
Зразки розв’язання задач
Завдання 3. Визначити параметри
лінійної моделі залежності витрат на
споживання ( y ) від рівня доходів ( 1x ),
збережень ( 2x ) та заробітної плати ( 3x ).
Оцінити коефіцієнт детермінації та
перевірити показники на
мультиколінеарність між факторами.
Обчислення виконати на базі n
статистичних показників певного регіону.
Виконати прогноз для значень
30,12,16 3)1(2)1(1)1( nnn xxx .
iy ix1
ix2 ix3
17,08 11,08 9,71 13,02
15,96 13,15 9,62 12,66
17,44 13,30 9,86 14,68
20,54 12,29 10,20 17,48
23,98 13,11 10,93 22,50
23,42 12,71 11,02 21,86
25,98 13,11 9,34 24,22
26,06 13,33 12,10 23,86
27,42 13,38 12,53 27,94
31,82 15,70 11,55 27,68
33,62 15,79 11,97 28,50
Розв’язання.
Побудуємо багатофакторну лінійну регресійну модель:
3322110 xbxbxbby ,
або в матричній формі: XBY .
Для визначення параметрів ib застосуємо метод найменших квадратів
YXXXB TT 1)( , де
3
2
1
0
b
b
b
b
B .
Матриця X :
1 11,08 9,71 13,02
1 13,15 9,62 12,66
1 13,30 9,86 14,68
1 12,29 10,20 17,48
1 13,11 10,93 22,50
1 12,71 11,02 21,86
1 13,11 9,34 24,22
1 13,33 12,10 23,86
1 13,38 12,53 27,94
Лекції з економетрії
1 15,70 11,55 27,68
1 15,79 11,97 28,50
Матриця TX :
1 1 1 1 1 1 1 1 1 1 1
11,08 13,15 13,3 12,29 13,11 12,71 13,11 13,33 13,38 15,7 15,79
9,71 9,62 9,86 10,2 10,93 11,02 9,34 12,1 12,53 11,55 11,97
13,02 12,66 14,68 17,48 22,5 21,86 24,22 23,86 27,94 27,68 28,5
Матриця XX T :
11 146,95 118,83 234,4
146,95 1981,4 1595,7 3187,6
118,83 1595,7 1296,3 2583,9
234,4 3187,6 2583,9 5349,9
Матриця 1)( XX T :
23,575 -1,06 -1,511 0,3282
-1,06 0,1063 0 -0,017
-1,511 0 0,1966 -0,029
0,3282 -0,017 -0,029 0,0097
Матриця YX T :
263,32
3580,8
2892,5
5947,1
Матриця B :
-5,165
1,0521
-0,203
0,8091
Отже, 165,50 b , 0521,11 b , 203,02 b , 8091,03 b
Отримали рівняння регресії 321 8091,0203,00521,1165,5ˆ xxxy .
Обчислимо коефіцієнти множинної кореляції та детермінації (допоміжні
обчислення в таблиці 5).
Таблиця 5.
iy 2)( yyi iy 2)ˆˆ( yyi )( yyi )ˆˆ( yyi 2)ˆ( yyi 2)ˆ( ii yy
17,08 47,035 15,056 78,8728 60,9078 78,88922 4,09568
15,96 63,651 16,956 48,7317 55,6941 48,74454 0,99292
17,44 42,226 18,7 27,4258 34,0307 27,43546 1,58834
20,54 11,548 19,837 16,8103 13,9327 16,8179 0,4939
23,98 0,0017 24,614 0,45771 0,02829 0,45646 0,4017
23,42 0,2685 23,658 0,07799 0,14471 0,078508 0,05664
25,98 4,169 26,323 5,69375 4,8721 5,68935 0,11794
26,06 4,5021 25,711 3,14668 3,76387 3,143412 0,1217
Лекції з економетрії
27,42 12,123 28,979 25,4161 17,5534 25,40678 2,42953
31,82 62,123 31,4 55,6975 58,8226 55,68372 0,17612
33,62 93,738 32,074 66,2111 78,7812 66,19609 2,38925
Сума 263,32 341,4 263,3 328,541 328,531 328,5414 12,864
Коефіцієнт множинної кореляції:
9810,05,3284,341
531,328
R .
Коефіцієнт детермінації:
4,341
5414,3282 R =0,96.
Отже, варіація змінних 321 ,, xxx пояснює 96 % варіації залежної змінної y .
Перевіримо побудовану модель на адекватність, використовуючи F-
критерій Фішера. Обчислимо
1311
864,12
3
5414,328
1
.
pnSSE
pSSR
спостF 59,59.
За F-таблицями знаходимо 89,8)05,0;7;3(. крF . Оскільки .. спосткр FF , то
нульова гіпотеза ( 0: 32100 H ) відкидається, що свідчить про
адекватність моделі.
Перевіримо значущість параметрів рівняння регресії. Обчислимо
дисперсії 2ˆib (як добуток 2ˆ
на відповідний елемент головної діагоналі
матриці 1)( XX T ).
43,19
864,12
2
)ˆ(ˆ 1
2
2
n
yyn
iii
,
70,33575,2343,1ˆ 2
0b , 80,5ˆ
0
b , 15,01063,043,1ˆ 2
1b , 39,0ˆ
1
b ,
28,01966,043,1ˆ 2
2b , 53,0ˆ
2
b , 01,00097,043,1ˆ 2
3b , 12,0ˆ
3
b .
Обчислимо розрахункове значення критерію Стьюдента для кожного
параметра:
ib
iспост
bt
||. ,
Лекції з економетрії
89,080,5
165,5)( 0 b
спост.t , 70,239,0
0521,1)( 1 b
спост.t ,
38,053,0
203,0)( 2 b
спост.t , 74,612,0
8091,0)( 3 b
cgjcn.t .
Критичне значення 833,1)05,0(9 t .
Оскільки спостережувані значення критерію Стьюдента для 1b і 3b
більші критичного значення )05,0(9t , то нульова гіпотеза ( 0:0 ibH ) для
кожного цих параметрів відкидається, а отже, обчислені значення 1b і 3b є
статистично значущими. Параметри 0b і 2b є статистично незначущими.
Обчислимо прогнозоване значення результативної ознаки:
5,33308091,012203,0160521,1165,5ˆ1 ny .
Побудуємо інтервал довіри для прогнозу з рівнем значущості 05,0 :
1ˆ
ny , де 11
12,2/ )(1ˆ
n
TTnn XXXXt ,
262,2)025,0(922 ttn , 20,1
9
864,12ˆ , 30121611 nX ,
30
12
16
1
1TnX .
Тоді 11 )( XXX TT
n 0052,00140,013,066,1 , 47,0)( 11
1
nTT
n XXXX ,
29,3 .
Отже, довірчий інтервал для прогнозу має вигляд 29,35,331 ny .
Тобто з ймовірністю 0,95 можна стверджувати, що прогнозоване значення
результативної ознаки набуватиме значення з інтервалу (30,21; 36,79).
Перевіримо фактори на мультиколінеарність.
Побудуємо матрицю коефіцієнтів парної кореляції:
19981,03737,0965,0
9981,015399,07304,0
3737,05399,017983,0
965,07304,07983,01
2332313
3222212
3121211
3212
xxxxxyx
xxxxxyx
xxxxxyx
yxyxyxy
rrrr
rrrr
rrrr
rrrr
R .
Коефіцієнт парної кореляції 32xxr набуває значення, близьке до 1, а це
означає, що між факторами існує лінійний зв’язок. Щоб позбавитись
мультиколінеарності, можна вилучити з моделі один або два фактори,
Лекції з економетрії
залишивши той, коефіцієнт кореляції якого з величиною y найбільший (в
даному випадку це 3x ). Але такий метод може привести до помилки
специфікації моделі і зміщених оцінок. Тому для того, щоб позбавитись
мультиколінеарності, потрібно збільшити число спостережень або використати
додаткову інформацію про економічний зміст зв’язків між факторами.
Лекції з економетрії
6. АВТОКОРЕЛЯЦІЯ. ДИСТИРИБУТИВНО-ЛАГОВІ
І АВТОРЕГРЕСІЙНІ МОДЕЛІ
1. Автокореляція: її природа та тестування.
2. Оцінка параметрів регресійної моделі при наявності автокореляції.
3. Авторегресивні моделі.
4. Дистрибутивно-лагові моделі.
Одним з припущень класичного регресійного аналізу є припущення
про незалежність залишків моделі. Якщо дана умова порушується, то виникає
явище автокореляції. Явище автокореляції часто є наслідком існування
залежності між попередніми і наступними значення результативного показника
моделі (найчастіше побудованої на основі часового ряду). Можливими
негативними наслідками явища автокореляції можуть бути:
1. Збільшення значень дисперсій параметрів моделі, що приводить до
неефективності їх оцінок.
2. Неможливість використання спостережуваних значень критерію
Стьюдента та критерію Фішера при перевірці статистичних
гіпотез.
3. Збільшення величини довірчого інтервалу для прогнозованих
значень.
Перевірка наявності автокореляції може здійснюватись за допомогою:
1. Коефіцієнта автокореляції.
2. Критерію Дарбіна-Уотсона.
3. Критерію фон Неймана.
Параметри моделі з автокорельованими залишками можна оцінити за
допомогою наступних методів:
1. Методу Ейткена (узагальненого методу найменших квадратів).
2. Перетворення вихідної інформації.
3. Методу Кочрена-Оркатта.
4. Методу Дарбіна.
Моделі, в яких значення результативного показника в момент часу t
визначається не лише поточними, а й попередніми значеннями факторного
показника, називаються дистрибутивно-лаговими.
Лекції з економетрії
Для оцінювання параметрів дистрибутивно-лагових моделей
використовуються два підходи: послідовне оцінювання і апріорне оцінювання.
Моделі, в яких значення результативного показника в момент часу t
визначається не лише поточними значеннями факторного показника, а й своїми
попередніми значеннями, називаються авторегресійними.
За допомогою заміни незалежних лагових змінних однією залежною
дистрибутивно-лагові моделі можуть бути представлені у вигляді
авторегресійних моделей одного з трьох типів: моделі Койка, моделі
адаптованих сподівань або моделі часткового коригування.
В залежності від характеру залишків моделі, для оцінювання її параметрів
використовуються методи:
1) метод найменших квадратів;
2) метод Ейткена;
3) ітераційний метод;
4) метод інструментальних змінних;
5) алгоритм Уолліса.
Основні формули
Коефіцієнт автокореляції:
n
ii
n
iii
e
ee
1
2
21
, де 1 iii yye .
Спостережуване значення критерію Дарбіна-Уотсона:
n
ii
n
iii
спост
e
ee
d
1
2
2
21
.
)(
.
Області автокореляційного зв’язку для критерію Дарбіна-Уотсона
0 4 dL dU 4–dL 4–dU
Автокореляція відсутня Додатна Від’ємна
Області невизначеності
Лекції з економетрії
Спостережуване значення критерію фон Неймана:
..1
спостспост dn
nq
.
Метод Ейткена оцінювання параметрів рівняння регресії:
)()( 111 YXXXB TT ,
де
pb
b
b
B...
1
0
–– матриця параметрів;
pnnn
p
p
xxx
xxx
xxx
X
...1
...............
...1
...1
21
22212
12111
–– матриця значень факторних ознак 1x , 2x ,
…, px (матриця спостережень), TX –– матриця, транспонована до матриці X ,
ny
y
y
Y...
2
1
–– вектор-стовпець значень залежної змінної y ,
1...0000
.....................
00...10
00...01
00...001
1
1 2
2
2
1
–– матриця,
обернена до автокореляційної матриці .
Лекції з економетрії
Зразки розв’язання задач
Завдання 4. На основі
взаємопов’язаних динамічних рядів
значень факторного та
результативного показників
побудувати модель, що
характеризує залежність
результативного показника від
факторного, дослідити модель на
автокореляцію залишків, оцінити
параметри моделі за допомогою
методу Ейткена, порівняти
отримані результати, зробити
висновки.
it ix iy
1 1 74
2 2 79
3 3 85
4 15 255
5 28 434
6 28 430
7 44 654
8 48 711
9 49 724
Лекції з економетрії
Розв’язання. Таблиця 1.
ix iy xxi yyi 2)( xxi 2)( yyi ))(( yyxx ii
1 74 -23 539,27 -309 95412,35 7173,09
2 79 -22 493,83 -304 92348,46 6753,09
3 85 -21 450,38 -298 88737,79 6321,86
15 255 -9 85,05 -128 16355,57 1179,42
28 434 4 14,27 51 2612,35 193,09
28 430 4 14,27 47 2219,46 177,98
44 654 20 391,16 271 73501,23 5361,98
48 711 24 565,38 328 107656,90 7801,75
49 724 25 613,94 341 116356,79 8451,98
Сума 218 3446 3167,56 595200,89 43414,22
Середні значення: 22,249
2181
n
x
x
n
ii
; 89,3829
34461
n
y
y
n
ii
.
Дисперсії: 95,3519
56,3167)(
1
2
2
n
xxn
ii
x ;
43,661339
89,595200)(
1
2
2
n
yyn
ii
y ;
Середні квадратичні відхилення: 76,18x ; 16,257y .
Обчислимо коефіцієнт кореляції:
9998,016,25776,189
22,43414))((
1
yx
n
iii
n
yyxx
r
.
Оскільки значення коефіцієнта кореляції близькі до 1, то між факторним і
результативним показниками існує суттєвий прямий зв’язок.
Оцінимо параметри 1b та 0b лінійного рівняння регресії xbby 10
за допомогою методу найменших квадратів.
71,13
))((
2
11
x
n
iii
n
yyxx
b
,
Лекції з економетрії
90,5010 xbyb .
Рівняння регресії має вид:
tt xy 71,1390,50ˆ .
Обчислимо дисперсію похибки:
n
yyn
iii
e1
2
2
)ˆ(
18,84.
Таблиця 2.
iy 2)ˆ( yyi 2)ˆ( ii yy
64,61 101303,2 88,223
78,31 92766,37 0,472
92,02 84605,24 49,268
256,49 15976,69 2,220
434,67 2680,948 0,445
434,67 2680,948 21,779
653,96 73480,24 0,001
708,78 106208,2 4,907
722,49 115329,5 2,278
Сума 595031,3 169,5917
Обчислимо спостережуване значення F -критерію:
28,24650
)ˆ(
)ˆ()2(
1
2
1
2
.
n
iii
n
ii
спост
yy
yyn
F .
За таблицями F -критерію за рівнем значущості 05,0 (надійністю
0,95) та числами ступенів свободи 1 і 72 n знаходимо 59,5)05,0(7,1 F .
Оскільки )05,0(7,1. FFспост , то побудована нами регресійна модель
може вважатись адекватною з ймовірністю 0,95.
Перевіримо модель на наявність автокореляції.
Таблиця 3.
iy ie 2ie
21)( ii ee 1iiee
Лекції з економетрії
74
79 5
85 6 36 1 30
255 170 28900 26896 1020
434 179 32041 81 30430
430 -4 16 33489 -716
654 224 50176 51984 -896
711 57 3249 27889 12768
724 13 169 1936 741
Сума 114587 142276 43377
Обчислимо коефіцієнт автокореляції:
n
ii
n
iii
e
ee
1
2
21
=0,38.
Обчислимо спостережуване значення критерію Дарбіна-Уотсона:
n
ii
n
iii
спост
e
ee
d
1
2
2
21
.
)(
=1,24.
За таблицею критичних значень критерію Дарбіна-Уотсона знайдемо
значення 82,0Ld , 32,1Ud ( 1,9,05,0 kn ). Оскільки
спостережуване значення критерію лежить між Ld і Ud (в області
невизначеності), то критерій Дарбіна-Уотсона відповідь на питання про
наявність атокореляції не дає.
Значення коефіцієнта автокореляції не є близьким до 1, але не прямує і
до 0, з чого можна зробити висновок про наявність незначеної додатної
автокореляції. В цьому випадку параметри моделі модна оцінити за допомогою
методу Ейткена:
)()( 111 YXXXB TT .
Знайдемо матриці:
Лекції з економетрії
1...0000
.....................
00...10
00...01
00...001
1
1 2
2
2
1
=
17,144,00000000
44,034,144,0000000
044,034,144,000000
0044,034,144,00000
00044,034,144,0000
000044,044,144,000
0000044,034,144,00
00000044,034,144,0
000000044,017,1
.
Матриця X :
1 1
1 2
1 3
1 15
1 28
1 28
1 44
1 48
1 49
Матриця TX :
1 1 1 1 1 1 1 1 1
1 2 3 15 28 28 44 48 49
Матриця 1TX :
0,73 0,46 0,46 0,46 0,46 0,46 0,46 0,46 0,73
0,29 0,92 -3,46 6,46 18,6 5,84 25,52 23,4 36,21
Лекції з економетрії
Матриця XX T 1 :
4,68 113,78
113,78 4793,34
Матриця 11 )( XX T :
0,5053 -0,0120
-0,0120 0,0005
Матриця YX T 1 :
1800,62
71574,46
Матриця
)()( 111 YXXXB TT :
51,3592
13,7130
Отже, 3592,511 b , 7130,130 b
Рівняння регресії має вид: tt xy 71,1390,50ˆ .
Обчислимо дисперсію похибки і F спостережуване для отриманої моделі:
Таблиця 4.
iy 2)ˆ( yyi 2)ˆ( ii yy
65,07 101007,5 79,707
78,31 92766,37 0,472
92,02 84605,24 49,268
256,49 15976,69 2,220
434,67 2680,948 0,445
434,67 2680,948 21,779
653,96 73480,24 0,001
708,78 106208,2 4,907
722,49 115329,5 2,278
Сума 594735,6 161,0748
n
yyn
iii
e1
2
2
)ˆ(
17,90; 06,25846
)ˆ(
)ˆ()2(
1
2
1
2
.
n
iii
n
ii
спост
yy
yyn
F .
Отже, при обчисленні параметрів моделі за допомогою методу Ейткена
дисперсія похибки зменшилась в порівняння з моделлю, параметри якої буди
обчислені за допомогою методу найменших квадратів, а F-відношення
збільшилось, що говорить про покращання моделі за рахунок врахування
автокореляції (якщо б автокореляція була б більш значною, то спостерігалось
би ще суттєвіше покращання моделі).
Лекції з економетрії
9. СИСТЕМИ ОДНОЧАСНИХ РІВНЯНЬ.
НЕПРЯМИЙ МЕТОД НАЙМЕНШИХ КВАДРАТІВ ОЦІНЮВАННЯ
ПАРАМЕТРІВ ТОЧНО ІДЕНТИФІКОВАНИХ СИСТЕМ
(на прикладі мультиплікативної моделі споживання Кейнса)
Найпростіша мультиплікативна модель споживання Кейнса для
певного регіону на основі статистики за n років задається системою рівнянь:
),()()(
),()()( 10
tItCtY
tetYaatC
де )(tC –– споживання, )(tY –– національний доход, )(te –– стохастичне
відхилення, похибка, )(tI –– інвестиції, 10 , aa –– параметри моделі.
Розглянемо випадок, коли розглядається статична модель (народне
господарство закритого типу без державного регулювання).
Перетворимо рівняння:
)()()()())()(()( 11010 tetIatCaatetItCaatC ,
)()()1)(( 101 tetIaaatC ,
)(1
1)(
11)(
11
1
1
0 tea
tIa
a
a
atC
,
)(1
1)(
1
1
1)(
111
0 tea
tIaa
atY
,
)()()( 221 tetItY , де 1
2
1
01
1
1,
1 aa
a
.
Оцінимо параметри 21, :
tt
ttt
tIntI
tYtIntYtI
)()(
)()()()(
222 ;
tt
tttt
tIntI
tYtItYtItI
)()(
)()()()()(
22
2
1 .
Тоді
)()(ˆ 21 tItY , )()(ˆ)( 2 tetYtY .
2
1
11
a –– гранична схильність до споживання (приріст
споживчих витрат, пов’язаних із зростанням доходу на грошову одиницю).
)1( 110 aa –– автономне споживання.
Лекції з економетрії
ДЕЯКІ СТАНДАРТНІ ФУНКЦІЇ EXCEL,
ЯКІ МОЖНА ВИКОРИСТОВУВАТИ
ПРИ ОБЧИСЛЕННІ ПАРАМЕТРІВ РЕГРЕСІЙНИХ МОДЕЛЕЙ
Категорія Функція Призначення
Математические МОБР Знаходження оберненої матриці
Математические МОПРЕД Знаходження визначника матриці
Математические МУМНОЖ Знаходження добутку матриць
Математические ФАКТР Обчислення факторіала натурального
числа
Математические ЧИСЛКОМБ Знаходження числа комбінацій knC
Статистические FРАСПОБР Знаходження критичного значення
критерію Фішера
Статистические ДИСПР Знаходження дисперсії генеральної
сукупності
Статистические КВПИРСОН Знаходження критичного значення
критерію Пірсона 2
Статистические КОРРЕЛ Знаходження коефіцієнта кореляції
Статистические ЛИНЕЙН Знаходження параметрів лінійного
рівняння регресії за методом
найменших квадратів
Статистические МЕДИАНА Знаходження медіани варіаційного
ряду
Статистические МОДА Знаходження моди варіаційного ряду
Статистические РАНГ Знаходження рангу числа в множині
чисел (при обчисленні коефіцієнта
рангової кореляції)
Статистические СРЗНАЧ Знаходження середнього значення
Статистические СТЬЮДРАСПОБР Знаходження критичного значення
критерію Стьюдента
Ссылки и
массивы
ТРАНСП Знаходження транспонованої матриці
Лекції з економетрії
Список рекомендованої літератури
1. Винн Р., Холден К. Введение в прикладной эконометрический анализ. –– М.,
1981. –– 294с.
2. Грубер Й. Эконометрия. Учебное пособие для студентов экономический
специальностей. –– К., 1996. –– Т.1. Введение в эконометрию. –– 400с.
3. Джонстон Дж. Эконометрические методы. –– М., 1980. –– 444с.
4. Клас А., Герики К., Колен Ю., Шуян И. Введеиние в эконометрическое
моделирование. –– М., 1978. –– 152с.
5. Лещинський О.Л., Рязанцева В.В., Юнькова О.О. Економетрія. –– К.: МАУП,
2003. –– 208с.
6. Лук’яненко І.Г., Краснікова Л.І. Економетрика: Підручник. –– К.: Тов.
―Знання‖, 1998. –– 494с.
7. Маленбо Э. Статистические методы в эконометрии. –– М., 1976. –– 325с.
8. Тинтнер Г. Введение в эконометрию. –– М., 1965. –– 361с.