chab m3e2 2013

Post on 26-Jun-2015

147 Views

Category:

Documents

2 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Методи прогнозування часових рядів та проблема складності

Д.М. Чабаненко

Кафедра економічної кібернетики

ЧНУ ім. Б. Хмельницького

Стан проблеми моделювання і прогнозування складних систем

• Прості системи можуть бути описані простими моделями

• Системи середньої складності описуються простими моделями гірше, ніж складними (обгрунтована необхідність ускладнення)

• Складні системи погано описуються як простими, так і складними моделями

• ? При якій складності моделі можна отримати кращі прогнози складної системи?

Підходи до оцінювання складності моделі, порівняння

складності моделей• Розрахункова складність (складність

алгоритму побудови і використання моделі)

• Складність за кількістю факторів, які враховує модель

• Описова складність (множина станів системи, які можуть бути описані моделлю)

Приклад моделі зі змінною складністю – модель

поліноміального тренду

Y(t)=a0+a1t+a2t2+…+aktk

Горизонт прогнозу Np – задається дослідником

Степінь поліному k та довжина вибірки навчання –параметри, які треба визначити

N

ytyMSE

N

iii

1

2

%1001

NpN

Ni i

ii

y

yty

NpMAPE

Приклад моделі зі змінною складністю – модель поліноміального

тренду• Степінь полінома k – параметр складності.• Довжина навчальної вибірки N – теж

параметр складності.• Похибка на перевірочній вибірці – міра якості

моделі з заданими параметрами k та N.• Постановка задачі: знайти значення

параметрів k (степінь полінома) та N (довжина навч. вибірки), при яких середня абсолютна процентна похибка була б мінімальною.

Пошук оптимальних order та nlearn при прогнозуванні на 3 дні (за даними iндексу S&P 500)

Максимум по полю MAPE

nlearn                  

order 10 50 100 250 500 1000 2000 4500 7000Общий

итог

1 6,48 5,43 9,95 8,29 21,89 52,86 59,10 74,37 68,63 74,37

2 3,76 8,24 8,04 13,79 11,78 20,26 59,68 53,71 72,32 72,32

3 3,45 7,45 7,86 9,51 11,16 10,74 26,15 44,36 60,01 60,01

4 5,04 4,60 6,57 8,89 13,67 12,50 15,20 68,97 45,02 68,97

5 7,14 9,28 4,15 9,55 8,99 14,43 18,99 40,11 57,40 57,40

6 22,28 2,54 7,15 14,57 8,92 10,68 20,14 24,80 63,36 63,36

7 34,28 5,38 6,34 10,28 16,02 13,62 14,78 17,41 29,22 34,28

8 131,60 4,56 3,96 7,02 11,61 7,57 11,30 15,62 21,07 131,60

9 304,13 6,75 4,84 6,48 8,55 12,34 13,78 21,71 23,79 304,13

103801,9

49,73 6,56 10,35 6,03 10,45 13,26 23,03 25,60 3801,94

Общий итог3801,9

49,73 9,95 14,57 21,89 52,86 59,68 74,37 72,32 3801,94

Пошук оптимальних order та nlearn при прогнозуванні на 10 днів (за даними iндексу S&P 500)

Максимум по полю MAPE nlearn                  

order 10 50 100 250 500 1000 2000 4500 7000

Общий итог

1 11,16 8,33 11,15 8,30 22,03 53,63 59,98 75,35 69,58 75,35

2 10,56 14,39 9,24 14,18 11,41 20,18 60,57 54,31 73,29 73,29

3 39,70 12,21 13,57 10,92 12,29 11,84 27,37 45,04 58,61 58,61

4 92,04 14,60 14,00 11,19 15,90 13,48 16,64 70,16 43,62 92,04

5 375,99 34,02 7,98 17,80 10,13 15,31 19,57 40,47 58,35 375,99

6 1893,43 28,28 18,32 26,79 12,21 13,93 22,76 25,74 64,46 1893,43

7 6524,69 93,34 14,35 17,67 19,41 16,05 15,23 17,68 29,18 6524,69

8 47974,03 82,86 49,65 16,29 15,89 10,32 12,81 18,41 21,7347974,0

3

9 295755,70205,5

9 65,03 14,64 17,24 16,73 16,13 24,81 24,86295755,

70

10 6555847,00372,5

8 92,21 33,56 12,80 16,85 14,31 26,17 25,176555847

,00

Общий итог 6555847,00372,5

8 92,21 33,56 22,03 53,63 60,57 75,35 73,296555847

,00

Nprogn=25Максимум

по полю MAPE nlearn                  

order 10 50 100 250 500 1000 2000 4500 7000

Общий итог

1 15,65 13,58 10,67 10,63 27,60 62,12 68,98 85,26 79,15 85,26

2 49,52 23,84 21,23 19,71 14,41 25,13 69,62 57,62 83,10 83,10

3 330,46 20,12 23,31 12,75 14,60 15,30 29,47 52,92 57,74 330,46

4 1400,24 61,42 42,45 18,18 18,03 15,09 18,53 80,37 46,73 1400,24

5 12998,10 221,13 33,54 35,19 10,27 15,85 21,39 47,36 67,4612998,1

0

6 137585,00 491,66 96,15 57,92 25,49 18,62 26,10 26,92 74,22137585,

00

7 926874,001767,1

9 103,63 37,80 43,53 18,91 16,64 20,80 34,60926874,

00

8 15074860,001449,7

3 774,59 100,57 40,90 20,60 17,11 22,46 24,50

15074860,0

0

9200997400,0

0

10267,07

1042,82 87,43 44,14 31,96 24,68 29,69 27,39

200997400,00

108975297000,

00

24017,21

1642,17 205,17 53,01 44,60 21,48 31,11 26,92

8975297000,00

Общий итог

8975297000,00

24017,21

1642,17 205,17 53,01 62,12 69,62 85,26 83,10

8975297000,00

Nprogn=50

order 10 50 100 250 500 1000 2000 4500 7000Общий

итог

1 30,17 18,57 14,86 14,68 28,12 65,11 72,36 89,05 82,78 89,05

2 202,42 54,49 36,39 26,53 16,21 24,72 73,03 59,90 86,84 202,42

3 2089,63 49,37 47,19 14,79 20,51 24,85 31,55 55,53 58,94 2089,63

4 18419,37 294,38 153,76 47,11 28,32 21,72 23,14 85,01 48,92 18419,37

5 260232,70 1962,56 166,89 98,49 17,97 18,03 27,24 48,64 71,15 260232,70

65803432,0

0 7726,11 568,47 177,79 58,76 27,68 37,83 30,67 78,545803432,0

0

765455470,

0034865,9

0 903,61 164,18 102,87 31,14 20,33 25,55 34,2265455470,

00

8

2096270000,0

036546,6

910353,5

1 692,76 95,26 44,20 23,87 27,96 28,76

2096270000,0

0

9

50192010000,

00503721,

6019260,1

9 596,54 148,20 68,80 41,76 36,91 37,32

50192010000,

00

10

43521700000

00,00

1670006,00

35216,22 2143,14 214,51 109,41 37,06 45,71 33,96

43521700000

00,00

Общий итог

43521700000

00,00

1670006,00

35216,22 2143,14 214,51 109,41 73,03 89,05 86,84

43521700000

00,00

Nprogn=100order 10 50 100 250 500 1000 2000 4500 7000

Общий итог

1 36,54 24,08 31,02 20,61 22,14 55,28 62,56 78,43 72,48 78,43

2 697,37 106,40 62,48 51,94 26,96 27,44 63,24 66,03 76,37 697,37

3 11924,40 221,09 129,38 28,27 38,44 36,25 33,92 45,88 65,10 11924,40

4 219838,80 1962,11 711,70 124,22 57,56 44,66 31,24 76,42 47,67 219838,80

5 5988953,00 21752,77 1224,78 299,62 51,73 37,32 35,03 37,00 62,085988953,0

0

6 278159400,00154649,3

0 5931,18 670,34 174,94 54,63 68,58 39,96 69,9927815940

0,00

7 5779644000,00993965,2

0 14801,69 1384,13 330,25 67,75 43,74 41,20 40,90

5779644000,0

0

8346871200000,0

02599520,

00271978,7

0 6710,82 358,96 139,63 39,10 39,68 45,71

34687120000

0,00

918045660000000

,00

51020920,0

0833355,4

0 7450,22 924,30 224,50 92,48 52,84 63,45

18045660000

000,00

1024422500000000

00,00

281481200,00

2305422,00 40609,37 1487,62 378,03 78,89 83,23 48,88

24422500000000

00,00

Общий итог

2442250000000000,00

281481200,00

2305422,00 40609,37 1487,62 378,03 92,48 83,23 76,37

24422500000000

00,00

Nprogn=250order 10 50 100 250 500 1000 2000 4500 7000

Общий итог

1 93,21 56,03 67,81 33,78 32,56 37,24 44,89 59,37 53,94 93,21

2 3498,65 370,91 215,51 129,56 71,66 38,42 45,89 57,98 57,59 3498,65

3 135303,00 2372,84 952,36 102,17 98,39 85,00 42,17 44,49 59,71 135303,00

46485158,0

0 37286,54 10324,95 872,57 165,11 113,61 50,79 63,10 52,046485158,0

0

544884820

0,00899441,0

0 40617,25 2735,97 370,61 91,90 95,61 67,93 51,2244884820

0,00

6

64014320000,

00

14875760,0

0399126,0

0 12170,00 1692,65 238,74 176,44 101,95 56,58

64014320000,

00

7

2831991000000,00

224720600,00

1665734,00 59840,37 3981,63 332,05 183,97 104,07 78,38

2831991000000,00

8

377304100000000,

00

1839821000,00

58621780,0

0402531,9

0 6446,49 1390,28 201,29 91,15 115,23

377304100000000,

00

9

47777690000000000,00

66729830000,0

0

380470000,00

1095978,00 36460,68 2534,10 522,53 127,62 146,13

47777690000000000,00

10

14540530000000000000

,00

704080200000,00

2355935000,00

8219427,00 70165,60 5330,43 479,76 234,42 102,84

14540530000000000000

,00

Общий итог

14540530000000000000

,00

704080200000,00

2355935000,00

8219427,00 70165,60 5330,43 522,53 234,42 146,13

14540530000000000000

,00

Nprogn=500order 10 50 100 250 500 1000 2000 4500 7000

Общий итог

1 176,79 84,31 115,78 64,10 46,13 57,58 66,11 48,32 51,56 176,79

2 13614,80 1207,31 683,85 287,24 146,85 68,83 72,09 51,63 48,39 13614,80

3 957593,10 14324,89 5748,30 498,81 239,67 190,09 69,43 75,86 71,43 957593,10

497159650,

00450322,9

0 95890,08 6109,34 704,37 271,48 117,54 79,35 88,8797159650,

00

5

13686330000,

0020817130

,00716936,1

0 30718,92 3177,79 409,08 279,21 128,65 83,64

13686330000,

00

6

4543667000000,00

671821400,0

015868790

,00198422,6

0 18789,10 1890,23 500,70 239,11 135,40

4543667000000,00

7

349736800000000,

00

23499150000,00

114226200,0

02206650,

00 72947,72 3033,68 854,52 244,01 175,92

349736800000000,

00

8

81745420000000000,00

388810400000,0

0

6720627000,00

22143230,00

153020,60 19419,42 1251,79 307,02 279,78

81745420000000000,00

9

21846480000000000000

,00

25134900000000,00

82166980000,00

107536300,0

01754308,

00 42370,19 3544,63 449,79 353,83

21846480000000000000

,00

10

12555440000000000000000,

00

536189000000000,0

0

1045540000000,00

1354498000,00

5612151,00

110562,40 5617,61 823,08 269,58

12555440000000000000000,

00

Общий итог

12555440000000000000000,

00

536189000000000,0

0

1045540000000,00

1354498000,00

5612151,00

110562,40 5617,61 823,08 353,83

12555440000000000000000,

00

Nprogn=1000or

der 10 50 100 250 500 1000 2000 4500 7000

Общий итог

1 276,59 112,09 192,03 112,02 79,40 85,03 71,65 44,57 53,80 276,59

2 62561,39 3947,81 2244,71 694,66 318,01 121,91 99,52 72,10 51,31 62561,39

3 6449697,00 93728,45 43434,57 2363,94 1051,36 490,78 190,60 120,97 88,206449697,0

0

41361029000,0

05656989,

001108622,

00 52198,20 6472,26 1005,16 305,75 133,95 115,32

1361029000,0

0

5478789600000

,00

499054100,0

017151620

,00424190,1

0 43488,99 3284,73 1309,24 334,12 139,12

478789600000

,00

6312687600000

000,00

31753160000,00

809238200,0

06161058,

00330685,9

0 17914,90 2195,84 722,79 276,41

312687600000000,

00

7

39284060000000000,0

0

2735363000000,00

13925630000,00

143620500,0

02263199,

00 54100,44 6850,78 851,53 464,65

39284060000000000,00

8

1863287000000000000

0,00

90156150000000,00

991617600000,0

0

1986344000,00

8827860,00

496532,80 16709,82 1486,44 919,79

18632870000000000000

,00

9

15208250000000000000000,00

10893330000000000,00

23202600000000,00

17903500000,00

149121100,0

01541439,

00 58077,83 2410,90 1209,44

15208250000000000000000,

00

10

10491980000000000000000000

,00

464445300000000000,0

0

548462400000000,0

0

408131900000,0

0

847127300,0

06745760,

00106228,2

0 5835,30 1739,70

10491980000000000000000000,0

0

Общий итог

10491980000000000000000000

,00

464445300000000000,0

0

548462400000000,0

0

408131900000,0

0

847127300,0

06745760,

00106228,2

0 5835,30 1739,70

10491980000000000000000000,0

0

Оптимальна складність поліноміальних моделей в залежності від горизонту прогнозування

Горизонт прогнозування

Оптимальна довжина

навчальної вибірки

Оптимальний степінь

полінома MAPE

3 100 8 3,96 10 100 5 7,98 25 250 1 10,63 50 250 1 14,08 100 250 1 15,5 250 500 1 32,56 500 500 1 46,13

1000 4500 1 44,57

Висновки з експерименту

• При збільшенні бажаної довжини прогнозу точність прогнозування зменшується.

• При бажаних довжинах прогнозу довше 25 днів оптимальний степінь полінома –1 (лінійний тренд, найпростіша модель)

• Оптимальна довжина вибірки навчання варіюється від Np до 4,5*Np (Np – довжина прогнозу), найкраща якість прогнозу продемонстрована для 2*Np (250 та 500 днів для більшості випадків)

• Для прогнозування на короткі відстані (менше 25 днів) найбільш оптимальне є застосування поліномів степеня 5.

Метод дискретного Фур’є-продовженняІтераційний метод визначення гармонік в методі дискретного Фур’є-продовження

- вихідний ряд.

• На кожному кроці за методом МНК мінімізується нев’язка

• одночастинне наближення,• двохчастинне наближення,…

0r t y t

m

jijijijii etdcbtatrtr

11 sin

1,2,...i

i ir t

y t

1m2m

Лінійно-гармонічна модель з одночастинним наближенням,

абсолютний варіант

Довжина навчальної вибірки nf 500 1000 2000 3000 4500

1 18,36 21,36 19,40 60,84 43,91 2 17,71 27,30 20,53 55,55 17,33 3 16,92 25,95 21,77 40,93 10,32 4 16,92 24,46 21,12 37,89 15,16 5 17,01 24,28 17,85 35,77 23,14 6 17,02 24,63 16,51 41,12 26,23 7 17,21 25,12 16,59 35,51 21,70 8 17,24 24,75 16,34 31,74 21,84 9 17,20 24,55 15,34 33,58 23,24

10 17,09 25,02 14,86 33,71 22,39

Лінійно-гармонічна модель з одночастинним наближенням, відносний

варіант

Довжина навчальної вибірки nf 500 1000 2000 3000 4500

1 18,50 15,51 15,73 47,84 30,37 2 17,83 21,18 14,67 44,69 18,43 3 17,13 18,45 21,73 32,99 24,58 4 17,12 17,53 20,88 30,19 26,60 5 17,18 18,07 18,63 28,43 22,39 6 17,15 18,17 17,58 31,74 18,83 7 17,32 19,39 17,98 32,43 17,11 8 17,33 19,17 18,05 31,39 15,34 9 17,19 19,70 19,06 30,17 15,76

10 17,18 19,74 19,22 30,22 16,74

Лінійно-гармонічна модель з двохчастинним наближенням,

абсолютний варіант Довжина навчальної вибірки nf

500 1000 2000 3000 4500 2 30,03 20,21 21,87 38,68 38,76 4 28,61 19,70 20,60 29,93 18,88 6 28,81 19,95 17,04 21,21 24,33 8 31,40 19,81 18,63 24,28 19,47

10 31,44 19,50 17,37 20,93 21,88

Лінійно-гармонічна модель з двохчастинним наближенням,

відносний варіант

Довжина навчальної вибірки nf 500 1000 2000 3000 4500

2 24,07 19,98 38,40 17,21 30,85 4 23,01 19,46 26,16 14,75 19,35 6 20,95 19,33 26,84 15,67 18,48 8 22,14 19,14 23,86 15,63 12,90

10 21,32 19,09 22,31 16,25 13,85

Лагові моделі прогнозування

tmtyttyttytyftty ,...,2,,

Метод групового урахування аргументів

jimjitjtyatitya

tjtytityatjtyatityaa

tjtytityftty

,,...2,1,,

,

25

24

3210

Зовнішній критерій - RMSE

Пошук значущих лагових змінних(дані індексу S&P 500)

Пошук значущих лагових змінних (дані ф’ючерсу на індекс UX)

Інтегровані процеси

ttytyr tabs )1

tty

tyr trel

1)2

tty

ttytyr trel

2)3

tty

tyr trel

1)2

ttytyr tabs )1

tty

tyr trel

1)2

Пошук значущих лагових змінних (дані індексу S&P 500)

ttytyr tabs )1

tty

ttytyr trel

2)3

Точність однокрокового прогнозу

• Часовий ряд – S&P 500• Оптимальна

максимальна кількість лагових змінних – 100

• Крок дискретизації 1 день

• Міра точності – MAPE, %

Без приростів

1абс 2відн 3Відн приб

40 5 9 6

Точність однокрокового прогнозу

• Часовий ряд – UX-C• Оптимальна

максимальна кількість лагових змінних – 50

• Крок дискретизації 1 день

• Міра точності – MAPE, %

Без приростів

1абс 2відн 3Відн приб

2,3 1,46 1,56 1,55

Точність багатокрокового прогнозу

• Часовий ряд – S&P 500• Оптимальна

максимальна кількість лагових змінних – 100

• Крок дискретизації 1 день

• Міра точності – MAPE, %

• Прогнозування на 100 днів

Без приростів

1абс 2відн

3Відн приб

6 6,4 4,5 6,4

Точність багатокрокового прогнозу

• Часовий ряд – UX-C• Оптимальна

максимальна кількість лагових змінних – 50

• Крок дискретизації 1 день

• Міра точності – MAPE, %

• Прогнозування на 100 днів

Без приростів

1абс 2відн 3Відн приб

3,4 16,2 4,9 4,8

Висновки і перспективи досліджень

• Оптимальні параметри прогнозної моделі (її складність) залежать від заданого горизонту прогнозування

• В класі поліноміальних моделей при довгостроковому прогнозуванні більш ефективними є моделі 1 порядку (лінійні)

• В класі лінійних гармонічних моделей оптимальним є апроксимація по одній гармоніці

Висновки і перспективи досліджень

Перспективи досліджень:

• Дослідження оптимальної складності поліноміальних моделей при короткостроковому прогнозуванні

• Створення методів пошуку оптимальної складності (крос-валідації) для авторегресійних, нейромережних, марківських моделей

top related