Download - › files › StorinkaVikladacha › ... МЕТОДИЧНІ ВКАЗІВКИщо вивчає кількісні закономірності та взаємозв’язки економічних

Лекції з економетрії

1. Вступ. Загальні принципи побудови економетричних моделей.

1. Предмет економетрії. Виникнення, становлення і розвиток економетрії.

2. Математичне та статистичне підгрунтя економетрії, роль ЕОМ в сучасній

економетрії.

3. Звя’зок економетрії з макроекономікою. Приклади економетричних моделей.

4. Роль економетрії в економічних дослідженнях.

5. Інформаційна база економетричних моделей.

Сьогодні можна стверджувати, що сучасна економіка з різноманітністю її

засобів спостереження, методів обробки інформації та моделювання

економічних систем стала значною мірою міждисциплінарним утворенням, що

об’єднує багато галузей науки, таких як математика і інформатика, теорія

ймовірностей та математична статистика тощо. Особливе місце в цьому списку

займає економетрія.

В буквальному перекладі слово ―економетрія‖ означає ―вимірювання

економіки‖. Але звичайно це поняття є значно ширшим, хоча вимірювання є

однією з його складових частин.

Часто використовується наступне визначення: економетрія –– це наука,

що вивчає кількісні закономірності та взаємозв’язки економічних об’єктів і

процесів за допомогою математико-статистичних методів та моделей.

Як самостійна дисципліна економетрія сформувалась у 20—30-х роках

ХХ століття завдяки працям Г. Мура та Г. Шульца. До цього вже були відомі

спроби математичної формалізації економіко-статистичних даних у працях

В.Парето (рівняння гіперболи для опису розподілу прибутку населення (1897

р.)) та Р.Хукера і А.Чупрова з кореляційного аналізу економічних процесів.

Перші праці з економетрії були присвячені розробці аналітико-статистичних

моделей. Здебільшого, це були рівняння лінійної регресії з параметрами, що

оцінювались за методом найменших квадратів. Такі рівняння дозволяли

описати як функції попиту та залежність їх від прибутків, обсягів випуску

продукції, рівня цін, податків та ін., так і функції пропозиції, виробничі

функції, що відображали технологічну залежність випуску продукції від затрат

праці та засобів виробництва. Одна з перших виробничих функцій була

побудована Коббом та Дугласом у 1928 році, а потім узагальнена Р. Солоу.


Починаючи з 30-х років відомі економісти Я.Танберген, Л.Клейн, Р.Стоун

та інші розробили моделі економіки, які описували статистичні зв'язки ви-

робництва, кінцевого індивідуального і державного попиту, цін, податків, зов-

нішньої торгівлі, пропозиції робочої сили, накопичення та зношування капі-

талу. Такі моделі складалися вже з багатьох рівнянь, у зв'язку з чим значно

ускладнились проблеми оцінювання невідомих параметрів. А це в свою чергу

привело до необхідності використання нового математичного апарату та

розширило можливості практичного використання економетрії.

До числа типових економіко-математичних моделей, які на сьогоднішній

день розробляє і вивчає економетрія, відносяться: виробничі функції, функції

попиту різних груп споживачів та цільові функції переваги споживачів,

статистичні та динамічні міжгалузеві моделі виробництва, розподілу і

споживання продукції, моделі загальної економічної рівноваги. Це певним

чином споріднює економетрику з макроекономікою.

У практичних дослідженнях економетричні методи використовуються не

тільки в економіці. Вони поширені у біології, історії, соціології та інших

суспільних і природничих науках, де необхідно розробляти та оцінювати

моделі, які формалізують зв'язки між великою кількістю змінних.

Крім того, сучасні економетричні методи широко використовуються для

порівняння ефективності різноманітних економічних гіпотез та послідовного їх

уточнення.

Етапи проведення економетричного аналізу

У стислому вигляді економетричний аналіз складається з таких етапів.

1. Формулювання теорії чи гіпотези.

2. Розробка економетричної моделі для перевірки цієї теорії.

3. Оцінка параметрів обраної моделі.

4. Перевірка моделі, статистичні висновки.

5. Прогнозування на основі отриманої моделі.

6. Застосування моделі (для контролю тощо).


Можна виділити такі основні завдання, які розв'язує економетрія.

1. Специфікувати модель, тобто необхідно, щоб усі функціональні зв'язки

входили до моделі у явному вигляді. Цього можна досягти методом ―від

простого до складного‖: почавши з найпростіших функцій, вводити та

перевіряти різні гіпотези і поступово, виходячи з реальних даних,

ускладнювати характер функціональних зв'язків.

2. Вибрати означення та одиниці вимірювання змінних, які входять до

моделі.

3. Оцінити всі невідомі параметри моделі та розрахувати інтервали довіри

(інтервали, до яких із заданою ймовірністю попадатиме обчислювана

величина).

4. Оцінити якість побудованої моделі за допомогою різних тестів та

критеріїв. Це допомагає остаточно вирішити питання, чи треба змінювати

початково обрану модель, та деякі теоретичні припущення. Якщо така

зміна необхідна, то треба проводити нові розрахунки і нове тестування.

5. Провести аналіз результатів, які планується використовувати на практиці

для прийняття рішень.


2. Проста вибіркова лінійна регресія.

Метод найменших квадратів.

Ймовірнісні і статистичні характеристики

простої вибіркової лінійної регресії

1. Загальне поняття про лінійну регресію.

2. Оцінка параметрів лінійної регресії за допомогою методу найменших

квадратів.

3. Властивості простої вибіркової лінійної регресії.

4. Коефіцієнти кореляції та детермінації.

5. Поняття про ступені вільності.

6. Дисперсійний аналіз у лінійній регресії.

Просту лінійну регресію використовують для встановлення лінійного

зв'язку між двома змінними: незалежною змінною x і залежною змінною y ,

значення яких є значеннями деяких ознак економічних процесів або явищ. При

цьому ознаку x називають факторною, а y –– результативною.

При регресійному аналізі визначаються два параметри: 0b –– перетин і

1b –– нахил регресії. Перетин показує значення y при умові, що x дорівнює

нулю, а значення нахилу 1b показує на скільки зміниться значення

результативної ознаки y при умові, що значення факторної ознаки x

збільшиться на 1.

На першому етапі побудови регресійної моделі для визначення форми

зв’язку між x та y будують діаграму розподілу (будують точки з координатами

( x , y )).

Одним з методів, які використовуються для обчислення параметрів

рівняння лінійної регресії, є метод найменших квадратів. При цьому шукають

такі параметри прямої, які б мінімізували загальну суму квадратів відхилень

фактичних значень від значень, які лежать на побудованій прямій (теоретичних

значень).

Основні припущення моделі лінійної регресії:

1) значеннями незалежної змінної x є або фіксовані числа, або, якщо

вони є випадковими змінними, то вони статистично незалежні від

випадкової величини (неспостережуваної випадкової величини);

2) випадкова величина розподілена за нормальним законом з

нульовим математичним сподіванням і постійною дисперсією;


3) випадкові величини i та ix статистично незалежні.

Щоб оцінити щільність зв’язку між x та y , використовують коефіцієнт

кореляції та коефіцієнт детермінації, які показують, наскільки варіація змінної

x пояснює варіацію y .

Щоб оцінити наскільки добре лінія регресії пояснює зв’язок між x та y ,

використовують стандартну помилку залишків, яка показує відхилення

емпіричних значень від лінії регресії.

При побудові регресійної моделі перевіряється гіпотеза про її

адекватність. Для цього можна використовувати F -критерій Фішера.

Під час оцінки параметрів регресії перевіряються гіпотези, чи

статистично значимо вони відрізняються від нуля. Для цього можна

використовувати t -тест Стьюдента.

Побудовану регресійну модель можна використовувати для

прогнозування величини результативної ознаки y при заданому значенні

факторної ознаки x , при цьому бажано будувати інтервал довіри для прогнозу.

Основні формули

Узагальнена регресійна модель xy 10 .

Вибіркова лінійна регресійна модель exbby 10 .

Коефіцієнт кореляції yx

n

iii

n

yyxx

r

1

))((

,

де n

xxn

ii

x

1

2

2

)(

, n

yyn

ii

y

1

2

2

)(

Обчислення параметрів за методом найменших квадратів

2

11

))((

x

n

iii

n

yyxx

b

, xbyb 10 .

Коефіцієнт детермінації

n

ii

n

iii

n

ii

n

ii

yy

yy

yy

yy

R

1

2

1

2

1

2

1

2

2

)(

)ˆ(

1

)(

)ˆ(

.


F -тест Фішера для перевірки моделі на адекватність:

2

)ˆ(

1

2

2,1

1

2

)ˆ(

n

yy

n

ii

n n

iii

yy

F ,

Спостережуване значення t -критерію Стьюдента для перевірки значущості

коефіцієнта кореляції:

22

1

2

r

nrtn

.

Спостережуване значення t -критерію Стьюдента для перевірки гіпотези

iibH :0 ( iibH :1 ):

,ˆ

2

ib

iin

bt

1,0i ,

n

ii

n

ii

b

xxn

x

1

2

1

2

)(

ˆˆ0 ,

n

ii

b

xx1

2)(

ˆˆ

1

, 2

)ˆ(

ˆ 1

2

2

n

yyn

iii

.

Спостережуване значення t -критерію Стьюдента для перевірки гіпотези

0:0 ibH ( 0:1 ibH ):

,ˆ

2

ib

in

bt

1,0i .

Довірчий інтервал для математичного сподівання значення ky :

n

ii

knk

xx

xx

nty

1

2

2

2,2/

)(

)(1ˆ

Довірчий інтервал для окремого значення ky :

n

ii

knk

xx

xx

nty

1

2

2

2,2/

)(

)(1ˆˆ .

Довірчий інтервал для прогнозованого значення 1ny :

n

ii

nnn

xx

xx

nty

1

2

21

2,2/1

)(

)(11ˆˆ

.


Зразки розв’язання задач

ix iy

15 580

19 590

21 591

22 595

25 600

26 602

27 602

28 607

31 608

Розв’язання. Побудуємо точковий графік залежності емпіричних значень

y від х.

Мал. 1.

575

580

585

590

595

600

605

610

0 5 10 15 20 25 30 35

x

yЗавдання 1. На базі статистичних даних про

річний продаж фірмою продукції y (тис. од.) та

витратами на наукові дослідження x (тис. гр. од.)

вибрати форму однофакторної моделі, оцінити всі її

параметри, визначити довірчі інтервали при рівні

значущості 05,0 . Оцінити прогноз 1ny для

наступного значення 341 nx , побудувати довірчий

інтервал для прогнозованого значення.


Форма графіка дозволяє зробити припущення про лінійну форму

залежності:

xbby 10 .

Обчислимо середні значення, дисперсії та середні квадратичні

відхилення продаж та витрат на наукові дослідження (допоміжні обчислення

наведені в таблиці 1):

1) середні значення:

78,239

2141

n

x

x

n

ii

; 22,5979

53751

n

y

y

n

ii

;

2) дисперсії:

95,219

56,197)(

1

2

2

n

xxn

ii

x ;

06,739

56,657)(

1

2

2

n

yyn

ii

y ;

3) середні квадратичні відхилення:

69,495,21 x ; 55,806,73 y .

Таблиця 1.

ix iy xxi yyi 2)( xxi 2)( yyi ))(( yyxx ii

15 580 -8,78 -17,22 77,05 296,60 151,17

19 590 -4,78 -7,22 22,83 52,16 34,51

21 591 -2,78 -6,22 7,72 38,72 17,28

22 595 -1,78 -2,22 3,16 4,94 3,95

25 600 1,22 2,78 1,49 7,72 3,40

26 602 2,22 4,78 4,94 22,83 10,62

27 602 3,22 4,78 10,38 22,83 15,40

28 607 4,22 9,78 17,83 95,60 41,28

31 608 7,22 10,78 52,16 116,16 77,84

Сума 214 5375 197,56 657,56 355,44


1. Обчислимо коефіцієнт кореляції:

99,055,869,49

44,355))((

1

yx

n

iii

n

yyxx

r

.

Оскільки значення коефіцієнта кореляції близькі до 1, то між факторним і

результативним показниками існує суттєвий прямий зв’язок.

Зміна факторного показника впливає на %10099,0 22 R =98% на зміну

результативного покзника.

2. Оцінимо параметри 1b та 0b лінійного рівняння регресії

xbby 10 за допомогою методу найменших квадратів.

80,195,219

44,355))((

2

11

x

n

iii

n

yyxx

b

,

42,55478,2380,122,59710 xbyb .

Рівняння регресії має вид:

xy 8,142,554ˆ .

Аналізуючи параметри рівняння регресії, можна зробити висновок: при

збільшенні факторного показника (витрат на наукові дослідження) на 1 (1 тис.

гр. од.) результативний показник (продаж продукції) збільшиться на 1,8 (1,8

тис. од.); якщо значення факторного показника будуть дорівнювати 0, то

значення результативного дорівнюватимуть 554,42.

3. Перевіримо адекватність побудованої моделі

Обчислимо дисперсію похибки:

9

04,18)ˆ(

1

2

2

n

yyn

iii

e 2,00.

Дисперсія похибки не прямує до нуля, але її значення значно менше

дисперсії 2y . Це дозволяє висунути гіпотезу про адекватність побудованої

моделі.

Застосуємо критерій Фішера, тобто перевіримо нульову гіпотезу

)ˆ(0: 10 yyH i при альтернативній )ˆ(0: 11 yyH i , де 1 –– нахил

узагальненої регресійної моделі.


Таблиця 2.

iy 2)ˆ( yyi 2)ˆ( ii yy

581,44 249,01 2,07

588,64 73,62 1,85

592,24 24,80 1,54

594,04 10,11 0,92

599,44 4,93 0,31

601,24 16,16 0,58

603,04 33,87 1,08

604,84 58,06 4,67

610,24 169,52 5,02

Сума 640,08 18,04

Обчислимо спостережуване значення F -критерію:

37,24804,18

08,6407

)ˆ(

)ˆ()2(

1

2

1

2

.

n

iii

n

ii

спост

yy

yyn

F .

За таблицями F -критерію за рівнем значущості 05,0 (надійністю

0,95) та числами ступенів свободи 1 і 72 n знаходимо 59,5)05,0(7,1 F .

Оскільки )05,0(7,1. FFспост , то побудована нами регресійна модель

може вважатись адекватною з ймовірністю 0,95.

4. Перевіримо значущість параметрів 0b та 1b .

Обчислимо середню квадратичну похибку рівняння регресії:

61,12

)ˆ(

ˆ 1

2

n

yyn

iii

та оцінки дисперсій параметрів 0b і 1b :

7679,2

)(

ˆˆ

1

2

1

2

0

n

ii

n

ii

b

xxn

x

; 0731,0

)(

ˆˆ

1

21

n

ii

b

xx

.


Перевіримо нульову гіпотезу 0:0 iH при альтернативній

0:1 iH за критерієм Стьюдента.

Знайдемо спостережувані значення Критерію Стьюдента для

параметрів регресії:

31,2007679,2

44,554

ˆ

||)(

0

00.

b

спост

bbt

; 62,24

0731,0

8,1

ˆ

||)(

1

11.

b

спост

bbt

.

Критичне значення 365,2)05,0(7 t .

Оскільки спостережувані значення більші )05,0(7t , то нульова гіпотеза

( 0:0 ibH ) для кожного параметра відкидається, а отже, обчислені значення 0b

та 1b є статистично значущими.

Побудуємо довірчі інтервали для параметрів рівняння регресії 0 та

1 :

2076,08,10731,084,28,1ˆ12

11 btb ,

86,744,5547679,284,244,554ˆ02

00 btb ,

що означає:

975,0}39,359,1{ 1 P , 975,0}28,56256,546{ 1 P .

5. Обчислимо прогноз для значення факторної ознаки 341 nx :

64,615348,144,554ˆ1101 nn xbby .

Побудуємо довірчий інтервал для залежної змінної y :

ky , де

61,4

56,197

)78,2334(

8

1161,1227,2

)(

11ˆ

2

1

2

2

1025,0

n

ii

n

xx

xx

nt .

Отже, інтервал довіри для прогнозу має вигляд 61,464,6151 ny .

Тобто з ймовірністю 0,95 можна стверджувати, що прогнозоване значення

результативної ознаки набуватиме значення з інтервалу (611,03; 620,25).

Побудуємо в одній системі координат графік емпіричної залежності

між факторною та результативною ознаками, теоретичну лінію регресії, а також

межі довірчого інтервалу для індивідуальних значень ky .


575

580

585

590

595

600

605

610

615

620

0 10 20 30 40

x

y

Емпірична

залежність

Лінія регресії

Нижня межа

довірчого інтервалу

Верхня межа

довірчого інтервалу

Мал. 2.


3. Криві зростання

1. Поняття про криві зростання.

2. Найпростіші перетворення нелінійних моделей у лінійні. Зведення до

лінійної регресії експоненціальної функції.

3. Зведення до лінійної регресії степеневої функції.

4. Квадратичні функції.

5. Деякі інші криві: крива Гомперця, логістична крива.

6. Методи обчислення невідомих параметрів нелінійних моделей.

Криві зростання використовуються для опису нелінійного зв’язку між

двома змінними.

Певні класи кривих зростання шляхом перетворень можна звести до

простої лінійної регресії. Для таких кривих залишаються правильними всі дії,

які були правильними для простої лінійної регресії, а саме:

обчислення невідомих параметрів проводиться за допомогою методу

найменших квадратів;

модель тестується на адекватність за F -критерієм Фішера;

параметри тестуються на значущість за t -критерієм Стьюдента;

будуються інтервали довіри для параметрів і для прогнозованого

значення.

Певний клас кривих зростання (модифікована експонента, крива

Гомперця, логістична крива) є нелінійними відносно своїх параметрів. Для

розрахунку невідомих параметрів у таких випадках використовуються методи

нелінійної регресії. У особливих випадках можливе також застосування

спрощених методів оцінювання, наприклад, методу трьох точок.



Основні типи кривих зростання та перетворення, які приводять їх до

лінійної форми:

Крива Перетворення Заміна

1. Експоненційна: xy lnlnln xy

10 ln,ln,ln bbzy

2. Степенева: xy xy lnlnln txbzy ln,ln,ln 0

3. Обернена: x

bby1

10

tx

1

4. Квадратична:

2210 xbxbby

2

21, txtx

Основні типи кривих, які зводяться до модифікованої експоненти

xy :

Крива Перетворення Заміна

1. Крива Гомперця:

x

ey

xyln zy ln

2. Логістична крива:

xy

1

x

y

1 z

y

1

Алгоритм методу трьох точок (на прикладі модифікованої

експоненти):

1. Розділити дані на 3 групи І, ІІ і ІІІ. Причому:

а) якщо вся кількість елементів ділиться на 3 без остачі, тобто kn 3 ,

то утворюємо 3 групи, кожна з яких містить k елементів;

б) якщо 13 kn , то група ІІ складається з 1k елементів, а групи І

та ІІІ містять по k елементів;

в) якщо 23 kn , то група ІІ складається з k елементів, а групи І та

ІІІ –– з 1k елементів.

2. Обчислити значення медіан у трьох групах. Позначимо ці значення

відповідно: IIIIII yyy ,, .


3. Розв’язати систему трьох рівнянь (нелінійних) з трьома невідомими:

.

,

,

III

II

I

xIII

xII

xI

y

y

y

Дану систему можна розв’язати наступним чином:

а) визначити різниці між другим і першим рівнянням та між третім і

другим:

)( IIIII xxIIIII yy , (1)

)( III xxIII yy ; (2)

б) поділити почленно рівняння (1) на рівняння (2), позначивши

IIIIIIII xxxx :

III

IIIII

yy

yy,

звідки

III

IIIII

yy

yyln

1ln .

в) визначити IIIII xx

IIIII yy

і Ix

Iy .

Остаточно отримаємо формули:

III

IIIII

yy

yyA ln

1, Ae ,

IIIII xx

IIIII yy

, Ix

Iy .



Завдання 2. Підібрати криву, яка

найточніше описує залежність між ознаками x та

y. Оцінити невідомі параметри рівняння регресії.

Розв’язання.

Побудуємо графік залежності між ознаками

x та y (мал. 3).

x y

1 78,2

2 265,88

3 903,992

4 3073,573

5 10450,15

6 35530,5

7 120803,7

8 410732,6

9 1396491

10 4748069

11 16143434

Мал. 3.

0

2000000

4000000

6000000

8000000

10000000

12000000

14000000

16000000

18000000

0 2 4 6 8 10 12


Розглянемо експоненційну модель xy та обчислимо її невідомі

параметри.

І спосіб.

Виконавши перетворення lnlnln xy та заміни

10 ln,ln,ln bbzy , отримаємо:

Таблиця 4.

ix iz 2)( xxi 2)( zzi )( xxi )( zzi

1 4,3593 25 37,441 30,594

2 5,583 16 23,962 19,58

3 6,8068 9 13,479 11,014

4 8,0306 4 5,9905 4,8951

5 9,2544 1 1,4976 1,2238

6 10,478 0 0 0

7 11,702 1 1,4976 1,2238

8 12,926 4 5,9905 4,8951

9 14,149 9 13,479 11,014

10 15,373 16 23,962 19,58

11 16,597 25 37,441 30,594

Сума 66 115,26 110 164,74 134,62

Аналогічно до завдання 1 обчислимо значення 22,11 b , 14,30 b . Отже,

отримали лінійне рівняння регресії 14,322,1ˆ xz .

Обчислимо параметри експоненційної моделі:

10,230 b

e , 39,31 b

e .


Побудуємо в одній системі координат графіки емпіричної та

узагальненої експоненційної залежностей між ознаками:

Мал.4.

Зауваження. Бажано проводити повне дослідження побудованої лінійної

моделі (див. завдання 1.).

0

2000000

4000000

6000000

8000000

10000000

12000000

14000000

16000000

18000000

1 2 3 4 5 6 7 8 9 10 11

Експоненційна залежність Емпірична залежність


ІІ спосіб (метод трьох точок).

Розділимо дані на 3 групи (оскільки 11n , то І і ІІІ групи міститимуть по

4 елементи, а ІІ –– 3 елементи):

x y

1 78,2

2 265,88

3 903,992

4 3073,573

5 10450,15

6 35530,5

7 120803,7

8 410732,6

9 1396491

10 4748069

11 16143434

В кожній групі визначимо медіану:

5,2Ix , Iy 584,936;

6IIx , IIy 35530,5;

5,9IIIx , IIIy 3072280.

Обчислимо 5,35,26 ,

.23,1

936,5845,35530

5,355303072280ln

5,3

1ln

42,324,1 e ;

98,24)42,3()42,3(

5,355303072228065,9

.

Порівнявши отримані результати зі значеннями, обчисленими за І

способом, бачимо, що вони досить близькі (відносна похибка не перевищує

5%).


5. БАГАТОФАКТОРНА ЛІНІЙНА РЕГРЕСІЯ

1. Класична багатофакторна модель.

2. Етапи побудови багатофакторної регресійної моделі.

3. Розрахунок невідомих параметрів багатофакторної регресії за методом

найменших квадратів.

4. Матричний підхід до лінійної багатофакторної регресії.

5. Методи побудови багатофакторної регресійної моделі.

Багатофакторна лінійна регресія є узагальненням простої лінійної

регресії, яка розглядалась в першому розділі. У багатофакторній регресії ми

припускаємо, що на залежну змінну y може впливати більше, ніж один фактор.

Основні припущення моделі багатофакторної лінійної регресії:

1) випадкова величина (неспостережувана випадкова величина) має

нормальний розподіл з нульовим математичним сподіванням і сталою

дисперсією;

2) значення випадкової величини не залежить від величини p , яка

визначає кількість незалежних змінних, що входять в модель;

3) випадкові величини i є статистично незалежними;

4) факторні ознаки ix є лінійно незалежними (у випадку лінійної

залежності отримуємо явище мультиколінеарності).

Методи побудови багатофакторної регресійної моделі:

1. Метод усіх можливих регресій.

2. Метод виключень.

3. Покроковий регресійний метод.

Невідомі параметри багатофакторної регресії обчислюються за

допомогою методу найменших квадратів, суть якого полягає в мінімізації суми

квадратів помилок.

Вплив кожного фактора (кожної незалежної змінної) на залежну змінну

характеризується частковими коефіцієнтами регресії (параметрами).

Частковий коефіцієнт регресії показує, на скільки одиниць зміниться значення

залежної змінної при збільшенні значення відповідного фактора на одиницю

при умові, що значення всіх інших факторів залишатимуться постійними.

Значущість всіх параметрів одночасно перевіряється за допомогою F -

критерію, а кожного окремо –– за допомогою t -критерію (для простої лінійної


регресії F - та t -тести були еквівалентними, для багатофакторної моделі це не

так).


Узагальнена багатофакторна регресійна модель:

ppxxxy ...22110 .

Вибіркова багатофакторна регресійна модель:

exbxbxbby pp ...22110 .

Оцінювання невідомих параметрів у багатофакторній регресії

З матричної форми вибіркової багатофакторної регресійної моделі:

EXBY , маємо )()( 1 YXXXB T , де

ny

y

y

Y...

2

1

–– вектор-стовпець значень залежної змінної y ,

pnnn

p

p

xxx

xxx

xxx

X

...1

...............

...1

...1

21

22212

12111

–– матриця значень факторних ознак 1x , 2x , …, px

(матриця спостережень), TX –– матриця, транспонована до матриці X ,

pb

b

b

B...

1

0

–– вектор-стовпець невідомих параметрів,

pe

e

e

E...

1

0

–– вектор-стовпець помилок.

Коефіцієнт множинної кореляції:

n

ii

n

ii

n

iii

yyyy

yyyy

R

1

2

1

2

1

)ˆˆ()(

)ˆˆ)((

.


Коефіцієнт детермінації:

n

ii

n

iii

n

ii

n

ii

yy

yy

yy

yy

R

1

2

1

2

1

2

1

2

2

)ˆ(

)ˆ(

1

)ˆ(

)ˆ(

.

Оцінений коефіцієнт детермінації:

1

1)1(11 2

1

)(

1

)ˆ(

2

1

2

1

2

pn

nRR

n

yy

pn

yy

n

ii

n

iii

.

Спостережуване значення критерію Фішера для перевірки моделі на

адекватність:

1

)ˆ(

)ˆ(

1,

1

2

1

2

pn

yy

p

yy

pnp n

iii

n

ii

F .

Довірчий інтервал довіри для окремого значення ky :

Tk

Tknk XXXXty 1

22 )(1ˆˆ

.

Довірчий інтервал довіри для прогнозованого значення 1ˆ

ny :

Tn

Tnnn XXXX

nty 1

11221 )(

11ˆˆ

.



Завдання 3. Визначити параметри

лінійної моделі залежності витрат на

споживання ( y ) від рівня доходів ( 1x ),

збережень ( 2x ) та заробітної плати ( 3x ).

Оцінити коефіцієнт детермінації та

перевірити показники на

мультиколінеарність між факторами.

Обчислення виконати на базі n

статистичних показників певного регіону.

Виконати прогноз для значень

30,12,16 3)1(2)1(1)1( nnn xxx .

iy ix1

ix2 ix3

17,08 11,08 9,71 13,02

15,96 13,15 9,62 12,66

17,44 13,30 9,86 14,68

20,54 12,29 10,20 17,48

23,98 13,11 10,93 22,50

23,42 12,71 11,02 21,86

25,98 13,11 9,34 24,22

26,06 13,33 12,10 23,86

27,42 13,38 12,53 27,94

31,82 15,70 11,55 27,68

33,62 15,79 11,97 28,50

Розв’язання.

Побудуємо багатофакторну лінійну регресійну модель:

3322110 xbxbxbby ,

або в матричній формі: XBY .

Для визначення параметрів ib застосуємо метод найменших квадратів

YXXXB TT 1)( , де

3

2

1

0

b

b

b

b

B .

Матриця X :

1 11,08 9,71 13,02

1 13,15 9,62 12,66

1 13,30 9,86 14,68

1 12,29 10,20 17,48

1 13,11 10,93 22,50

1 12,71 11,02 21,86

1 13,11 9,34 24,22

1 13,33 12,10 23,86

1 13,38 12,53 27,94


1 15,70 11,55 27,68

1 15,79 11,97 28,50

Матриця TX :

1 1 1 1 1 1 1 1 1 1 1

11,08 13,15 13,3 12,29 13,11 12,71 13,11 13,33 13,38 15,7 15,79

9,71 9,62 9,86 10,2 10,93 11,02 9,34 12,1 12,53 11,55 11,97

13,02 12,66 14,68 17,48 22,5 21,86 24,22 23,86 27,94 27,68 28,5

Матриця XX T :

11 146,95 118,83 234,4

146,95 1981,4 1595,7 3187,6

118,83 1595,7 1296,3 2583,9

234,4 3187,6 2583,9 5349,9

Матриця 1)( XX T :

23,575 -1,06 -1,511 0,3282

-1,06 0,1063 0 -0,017

-1,511 0 0,1966 -0,029

0,3282 -0,017 -0,029 0,0097

Матриця YX T :

263,32

3580,8

2892,5

5947,1

Матриця B :

-5,165

1,0521

-0,203

0,8091

Отже, 165,50 b , 0521,11 b , 203,02 b , 8091,03 b

Отримали рівняння регресії 321 8091,0203,00521,1165,5ˆ xxxy .

Обчислимо коефіцієнти множинної кореляції та детермінації (допоміжні

обчислення в таблиці 5).

Таблиця 5.

iy 2)( yyi iy 2)ˆˆ( yyi )( yyi )ˆˆ( yyi 2)ˆ( yyi 2)ˆ( ii yy

17,08 47,035 15,056 78,8728 60,9078 78,88922 4,09568

15,96 63,651 16,956 48,7317 55,6941 48,74454 0,99292

17,44 42,226 18,7 27,4258 34,0307 27,43546 1,58834

20,54 11,548 19,837 16,8103 13,9327 16,8179 0,4939

23,98 0,0017 24,614 0,45771 0,02829 0,45646 0,4017

23,42 0,2685 23,658 0,07799 0,14471 0,078508 0,05664

25,98 4,169 26,323 5,69375 4,8721 5,68935 0,11794

26,06 4,5021 25,711 3,14668 3,76387 3,143412 0,1217


27,42 12,123 28,979 25,4161 17,5534 25,40678 2,42953

31,82 62,123 31,4 55,6975 58,8226 55,68372 0,17612

33,62 93,738 32,074 66,2111 78,7812 66,19609 2,38925

Сума 263,32 341,4 263,3 328,541 328,531 328,5414 12,864

Коефіцієнт множинної кореляції:

9810,05,3284,341

531,328

R .

Коефіцієнт детермінації:

4,341

5414,3282 R =0,96.

Отже, варіація змінних 321 ,, xxx пояснює 96 % варіації залежної змінної y .

Перевіримо побудовану модель на адекватність, використовуючи F-

критерій Фішера. Обчислимо

1311

864,12

3

5414,328

1

.

pnSSE

pSSR

спостF 59,59.

За F-таблицями знаходимо 89,8)05,0;7;3(. крF . Оскільки .. спосткр FF , то

нульова гіпотеза ( 0: 32100 H ) відкидається, що свідчить про

адекватність моделі.

Перевіримо значущість параметрів рівняння регресії. Обчислимо

дисперсії 2ˆib (як добуток 2ˆ

на відповідний елемент головної діагоналі

матриці 1)( XX T ).

43,19

864,12

2

)ˆ(ˆ 1

2

2

n

yyn

iii

,

70,33575,2343,1ˆ 2

0b , 80,5ˆ

0

b , 15,01063,043,1ˆ 2

1b , 39,0ˆ

1

b ,

28,01966,043,1ˆ 2

2b , 53,0ˆ

2

b , 01,00097,043,1ˆ 2

3b , 12,0ˆ

3

b .

Обчислимо розрахункове значення критерію Стьюдента для кожного

параметра:

ib

iспост

bt

||. ,


89,080,5

165,5)( 0 b

спост.t , 70,239,0

0521,1)( 1 b

спост.t ,

38,053,0

203,0)( 2 b

спост.t , 74,612,0

8091,0)( 3 b

cgjcn.t .

Критичне значення 833,1)05,0(9 t .

Оскільки спостережувані значення критерію Стьюдента для 1b і 3b

більші критичного значення )05,0(9t , то нульова гіпотеза ( 0:0 ibH ) для

кожного цих параметрів відкидається, а отже, обчислені значення 1b і 3b є

статистично значущими. Параметри 0b і 2b є статистично незначущими.

Обчислимо прогнозоване значення результативної ознаки:

5,33308091,012203,0160521,1165,5ˆ1 ny .

Побудуємо інтервал довіри для прогнозу з рівнем значущості 05,0 :

1ˆ

ny , де 11

12,2/ )(1ˆ

n

TTnn XXXXt ,

262,2)025,0(922 ttn , 20,1

9

864,12ˆ , 30121611 nX ,

30

12

16

1

1TnX .

Тоді 11 )( XXX TT

n 0052,00140,013,066,1 , 47,0)( 11

1

nTT

n XXXX ,

29,3 .

Отже, довірчий інтервал для прогнозу має вигляд 29,35,331 ny .

Тобто з ймовірністю 0,95 можна стверджувати, що прогнозоване значення

результативної ознаки набуватиме значення з інтервалу (30,21; 36,79).

Перевіримо фактори на мультиколінеарність.

Побудуємо матрицю коефіцієнтів парної кореляції:

19981,03737,0965,0

9981,015399,07304,0

3737,05399,017983,0

965,07304,07983,01

2332313

3222212

3121211

3212

xxxxxyx

xxxxxyx

xxxxxyx

yxyxyxy

rrrr

rrrr

rrrr

rrrr

R .

Коефіцієнт парної кореляції 32xxr набуває значення, близьке до 1, а це

означає, що між факторами існує лінійний зв’язок. Щоб позбавитись

мультиколінеарності, можна вилучити з моделі один або два фактори,


залишивши той, коефіцієнт кореляції якого з величиною y найбільший (в

даному випадку це 3x ). Але такий метод може привести до помилки

специфікації моделі і зміщених оцінок. Тому для того, щоб позбавитись

мультиколінеарності, потрібно збільшити число спостережень або використати

додаткову інформацію про економічний зміст зв’язків між факторами.


6. АВТОКОРЕЛЯЦІЯ. ДИСТИРИБУТИВНО-ЛАГОВІ

І АВТОРЕГРЕСІЙНІ МОДЕЛІ

1. Автокореляція: її природа та тестування.

2. Оцінка параметрів регресійної моделі при наявності автокореляції.

3. Авторегресивні моделі.

4. Дистрибутивно-лагові моделі.

Одним з припущень класичного регресійного аналізу є припущення

про незалежність залишків моделі. Якщо дана умова порушується, то виникає

явище автокореляції. Явище автокореляції часто є наслідком існування

залежності між попередніми і наступними значення результативного показника

моделі (найчастіше побудованої на основі часового ряду). Можливими

негативними наслідками явища автокореляції можуть бути:

1. Збільшення значень дисперсій параметрів моделі, що приводить до

неефективності їх оцінок.

2. Неможливість використання спостережуваних значень критерію

Стьюдента та критерію Фішера при перевірці статистичних

гіпотез.

3. Збільшення величини довірчого інтервалу для прогнозованих

значень.

Перевірка наявності автокореляції може здійснюватись за допомогою:

1. Коефіцієнта автокореляції.

2. Критерію Дарбіна-Уотсона.

3. Критерію фон Неймана.

Параметри моделі з автокорельованими залишками можна оцінити за

допомогою наступних методів:

1. Методу Ейткена (узагальненого методу найменших квадратів).

2. Перетворення вихідної інформації.

3. Методу Кочрена-Оркатта.

4. Методу Дарбіна.

Моделі, в яких значення результативного показника в момент часу t

визначається не лише поточними, а й попередніми значеннями факторного

показника, називаються дистрибутивно-лаговими.


Для оцінювання параметрів дистрибутивно-лагових моделей

використовуються два підходи: послідовне оцінювання і апріорне оцінювання.

Моделі, в яких значення результативного показника в момент часу t

визначається не лише поточними значеннями факторного показника, а й своїми

попередніми значеннями, називаються авторегресійними.

За допомогою заміни незалежних лагових змінних однією залежною

дистрибутивно-лагові моделі можуть бути представлені у вигляді

авторегресійних моделей одного з трьох типів: моделі Койка, моделі

адаптованих сподівань або моделі часткового коригування.

В залежності від характеру залишків моделі, для оцінювання її параметрів

використовуються методи:

1) метод найменших квадратів;

2) метод Ейткена;

3) ітераційний метод;

4) метод інструментальних змінних;

5) алгоритм Уолліса.


Коефіцієнт автокореляції:

n

ii

n

iii

e

ee

1

2

21

, де 1 iii yye .

Спостережуване значення критерію Дарбіна-Уотсона:

n

ii

n

iii

спост

e

ee

d

1

2

2

21

.

)(

.

Області автокореляційного зв’язку для критерію Дарбіна-Уотсона

0 4 dL dU 4–dL 4–dU

Автокореляція відсутня Додатна Від’ємна

Області невизначеності


Спостережуване значення критерію фон Неймана:

..1

спостспост dn

nq

.

Метод Ейткена оцінювання параметрів рівняння регресії:

)()( 111 YXXXB TT ,

де

pb

b

b

B...

1

0

–– матриця параметрів;

pnnn

p

p

xxx

xxx

xxx

X

...1

...............

...1

...1

21

22212

12111

–– матриця значень факторних ознак 1x , 2x ,

…, px (матриця спостережень), TX –– матриця, транспонована до матриці X ,

ny

y

y

Y...

2

1

–– вектор-стовпець значень залежної змінної y ,

1...0000

.....................

00...10

00...01

00...001

1

1 2

2

2

1

–– матриця,

обернена до автокореляційної матриці .



Завдання 4. На основі

взаємопов’язаних динамічних рядів

значень факторного та

результативного показників

побудувати модель, що

характеризує залежність

результативного показника від

факторного, дослідити модель на

автокореляцію залишків, оцінити

параметри моделі за допомогою

методу Ейткена, порівняти

отримані результати, зробити

висновки.

it ix iy

1 1 74

2 2 79

3 3 85

4 15 255

5 28 434

6 28 430

7 44 654

8 48 711

9 49 724


Розв’язання. Таблиця 1.

ix iy xxi yyi 2)( xxi 2)( yyi ))(( yyxx ii

1 74 -23 539,27 -309 95412,35 7173,09

2 79 -22 493,83 -304 92348,46 6753,09

3 85 -21 450,38 -298 88737,79 6321,86

15 255 -9 85,05 -128 16355,57 1179,42

28 434 4 14,27 51 2612,35 193,09

28 430 4 14,27 47 2219,46 177,98

44 654 20 391,16 271 73501,23 5361,98

48 711 24 565,38 328 107656,90 7801,75

49 724 25 613,94 341 116356,79 8451,98

Сума 218 3446 3167,56 595200,89 43414,22

Середні значення: 22,249

2181

n

x

x

n

ii

; 89,3829

34461

n

y

y

n

ii

.

Дисперсії: 95,3519

56,3167)(

1

2

2

n

xxn

ii

x ;

43,661339

89,595200)(

1

2

2

n

yyn

ii

y ;

Середні квадратичні відхилення: 76,18x ; 16,257y .

Обчислимо коефіцієнт кореляції:

9998,016,25776,189

22,43414))((

1

yx

n

iii

n

yyxx

r

.

Оскільки значення коефіцієнта кореляції близькі до 1, то між факторним і

результативним показниками існує суттєвий прямий зв’язок.

Оцінимо параметри 1b та 0b лінійного рівняння регресії xbby 10

за допомогою методу найменших квадратів.

71,13

))((

2

11

x

n

iii

n

yyxx

b

,


90,5010 xbyb .

Рівняння регресії має вид:

tt xy 71,1390,50ˆ .

Обчислимо дисперсію похибки:

n

yyn

iii

e1

2

2

)ˆ(

18,84.

Таблиця 2.


64,61 101303,2 88,223

78,31 92766,37 0,472

92,02 84605,24 49,268

256,49 15976,69 2,220

434,67 2680,948 0,445

434,67 2680,948 21,779

653,96 73480,24 0,001

708,78 106208,2 4,907

722,49 115329,5 2,278

Сума 595031,3 169,5917

Обчислимо спостережуване значення F -критерію:

28,24650

)ˆ(

)ˆ()2(

1

2

1

2

.

n

iii

n

ii

спост

yy

yyn

F .

За таблицями F -критерію за рівнем значущості 05,0 (надійністю

0,95) та числами ступенів свободи 1 і 72 n знаходимо 59,5)05,0(7,1 F .

Оскільки )05,0(7,1. FFспост , то побудована нами регресійна модель

може вважатись адекватною з ймовірністю 0,95.

Перевіримо модель на наявність автокореляції.

Таблиця 3.

iy ie 2ie

21)( ii ee 1iiee


74

79 5

85 6 36 1 30

255 170 28900 26896 1020

434 179 32041 81 30430

430 -4 16 33489 -716

654 224 50176 51984 -896

711 57 3249 27889 12768

724 13 169 1936 741

Сума 114587 142276 43377

Обчислимо коефіцієнт автокореляції:

n

ii

n

iii

e

ee

1

2

21

=0,38.

Обчислимо спостережуване значення критерію Дарбіна-Уотсона:

n

ii

n

iii

спост

e

ee

d

1

2

2

21

.

)(

=1,24.

За таблицею критичних значень критерію Дарбіна-Уотсона знайдемо

значення 82,0Ld , 32,1Ud ( 1,9,05,0 kn ). Оскільки

спостережуване значення критерію лежить між Ld і Ud (в області

невизначеності), то критерій Дарбіна-Уотсона відповідь на питання про

наявність атокореляції не дає.

Значення коефіцієнта автокореляції не є близьким до 1, але не прямує і

до 0, з чого можна зробити висновок про наявність незначеної додатної

автокореляції. В цьому випадку параметри моделі модна оцінити за допомогою

методу Ейткена:

)()( 111 YXXXB TT .

Знайдемо матриці:


1...0000

.....................

00...10

00...01

00...001

1

1 2

2

2

1

=

17,144,00000000

44,034,144,0000000

044,034,144,000000

0044,034,144,00000

00044,034,144,0000

000044,044,144,000

0000044,034,144,00

00000044,034,144,0

000000044,017,1

.

Матриця X :

1 1

1 2

1 3

1 15

1 28

1 28

1 44

1 48

1 49

Матриця TX :

1 1 1 1 1 1 1 1 1

1 2 3 15 28 28 44 48 49

Матриця 1TX :

0,73 0,46 0,46 0,46 0,46 0,46 0,46 0,46 0,73

0,29 0,92 -3,46 6,46 18,6 5,84 25,52 23,4 36,21


Матриця XX T 1 :

4,68 113,78

113,78 4793,34

Матриця 11 )( XX T :

0,5053 -0,0120

-0,0120 0,0005

Матриця YX T 1 :

1800,62

71574,46

Матриця

)()( 111 YXXXB TT :

51,3592

13,7130

Отже, 3592,511 b , 7130,130 b

Рівняння регресії має вид: tt xy 71,1390,50ˆ .

Обчислимо дисперсію похибки і F спостережуване для отриманої моделі:

Таблиця 4.


65,07 101007,5 79,707

78,31 92766,37 0,472

92,02 84605,24 49,268

256,49 15976,69 2,220

434,67 2680,948 0,445

434,67 2680,948 21,779

653,96 73480,24 0,001

708,78 106208,2 4,907

722,49 115329,5 2,278

Сума 594735,6 161,0748

n

yyn

iii

e1

2

2

)ˆ(

17,90; 06,25846

)ˆ(

)ˆ()2(

1

2

1

2

.

n

iii

n

ii

спост

yy

yyn

F .

Отже, при обчисленні параметрів моделі за допомогою методу Ейткена

дисперсія похибки зменшилась в порівняння з моделлю, параметри якої буди

обчислені за допомогою методу найменших квадратів, а F-відношення

збільшилось, що говорить про покращання моделі за рахунок врахування

автокореляції (якщо б автокореляція була б більш значною, то спостерігалось

би ще суттєвіше покращання моделі).


9. СИСТЕМИ ОДНОЧАСНИХ РІВНЯНЬ.

НЕПРЯМИЙ МЕТОД НАЙМЕНШИХ КВАДРАТІВ ОЦІНЮВАННЯ

ПАРАМЕТРІВ ТОЧНО ІДЕНТИФІКОВАНИХ СИСТЕМ

(на прикладі мультиплікативної моделі споживання Кейнса)

Найпростіша мультиплікативна модель споживання Кейнса для

певного регіону на основі статистики за n років задається системою рівнянь:

),()()(

),()()( 10

tItCtY

tetYaatC

де )(tC –– споживання, )(tY –– національний доход, )(te –– стохастичне

відхилення, похибка, )(tI –– інвестиції, 10 , aa –– параметри моделі.

Розглянемо випадок, коли розглядається статична модель (народне

господарство закритого типу без державного регулювання).

Перетворимо рівняння:

)()()()())()(()( 11010 tetIatCaatetItCaatC ,

)()()1)(( 101 tetIaaatC ,

)(1

1)(

11)(

11

1

1

0 tea

tIa

a

a

atC

,

)(1

1)(

1

1

1)(

111

0 tea

tIaa

atY

,

)()()( 221 tetItY , де 1

2

1

01

1

1,

1 aa

a

.

Оцінимо параметри 21, :

tt

ttt

tIntI

tYtIntYtI

)()(

)()()()(

222 ;

tt

tttt

tIntI

tYtItYtItI

)()(

)()()()()(

22

2

1 .

Тоді

)()(ˆ 21 tItY , )()(ˆ)( 2 tetYtY .

2

1

11

a –– гранична схильність до споживання (приріст

споживчих витрат, пов’язаних із зростанням доходу на грошову одиницю).

)1( 110 aa –– автономне споживання.


ДЕЯКІ СТАНДАРТНІ ФУНКЦІЇ EXCEL,

ЯКІ МОЖНА ВИКОРИСТОВУВАТИ

ПРИ ОБЧИСЛЕННІ ПАРАМЕТРІВ РЕГРЕСІЙНИХ МОДЕЛЕЙ

Категорія Функція Призначення

Математические МОБР Знаходження оберненої матриці

Математические МОПРЕД Знаходження визначника матриці

Математические МУМНОЖ Знаходження добутку матриць

Математические ФАКТР Обчислення факторіала натурального

числа

Математические ЧИСЛКОМБ Знаходження числа комбінацій knC

Статистические FРАСПОБР Знаходження критичного значення

критерію Фішера

Статистические ДИСПР Знаходження дисперсії генеральної

сукупності

Статистические КВПИРСОН Знаходження критичного значення

критерію Пірсона 2

Статистические КОРРЕЛ Знаходження коефіцієнта кореляції

Статистические ЛИНЕЙН Знаходження параметрів лінійного

рівняння регресії за методом

найменших квадратів

Статистические МЕДИАНА Знаходження медіани варіаційного

ряду

Статистические МОДА Знаходження моди варіаційного ряду

Статистические РАНГ Знаходження рангу числа в множині

чисел (при обчисленні коефіцієнта

рангової кореляції)

Статистические СРЗНАЧ Знаходження середнього значення

Статистические СТЬЮДРАСПОБР Знаходження критичного значення

критерію Стьюдента

Ссылки и

массивы

ТРАНСП Знаходження транспонованої матриці


Список рекомендованої літератури

1. Винн Р., Холден К. Введение в прикладной эконометрический анализ. –– М.,

1981. –– 294с.

2. Грубер Й. Эконометрия. Учебное пособие для студентов экономический

специальностей. –– К., 1996. –– Т.1. Введение в эконометрию. –– 400с.

3. Джонстон Дж. Эконометрические методы. –– М., 1980. –– 444с.

4. Клас А., Герики К., Колен Ю., Шуян И. Введеиние в эконометрическое

моделирование. –– М., 1978. –– 152с.

5. Лещинський О.Л., Рязанцева В.В., Юнькова О.О. Економетрія. –– К.: МАУП,

2003. –– 208с.

6. Лук’яненко І.Г., Краснікова Л.І. Економетрика: Підручник. –– К.: Тов.

―Знання‖, 1998. –– 494с.

7. Маленбо Э. Статистические методы в эконометрии. –– М., 1976. –– 325с.

8. Тинтнер Г. Введение в эконометрию. –– М., 1965. –– 361с.

Download - › files › StorinkaVikladacha › ... МЕТОДИЧНІ ВКАЗІВКИщо вивчає кількісні закономірності та взаємозв’язки економічних

Top Related