МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИd0%9d%d0%b0%d1%83%d0%ba… ·...

201

Upload: others

Post on 07-Oct-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного
Page 2: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

Державний вищий навчальний заклад

«КИЇВСЬКИЙ НАЦІОНАЛЬНИЙ ЕКОНОМІЧНИЙ УНІВЕРСИТЕТ

імені ВАДИМА ГЕТЬМАНА»

Журнал є науковим фаховим виданням України,

в якому можуть публікуватися результати дисер-таційних робіт на здобуття наукових ступенів

доктора і кандидата наук в галузі економіки

(наказ МОН України від 26.05.2014 № 642 — оголошення в спецвипуску газети

«Освіта України», червень 2014 р.).

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ

В ЕКОНОМІЦІ

Науково-аналітичний журнал

Заснований у 2011 р.

Виходить двічі на рік

№ 6

Київ 2017

Page 3: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

УДК 519.86

Редакційна колегія

Почесний Головний редактор Лотфі А. Заде, доктор наук, професор (США).

Головний редактор А. В. Матвійчук, доктор економічних наук, професор. Відповідальний секретар Г. І. Великоіваненко, канд. фіз.-мат. наук, професор; І. З. Батиршин, доктор фіз.-мат. наук, професор (Мексика); А. М. Борисов, доктор техн. наук, професор (Латвія); В. В. Вітлінський, доктор екон. наук, професор; В. К. Галіцин, доктор екон. наук, професор; К. Д. Іманов, чл.-кор. НАН Азербайджану, доктор екон. наук, професор (Азербайджан); А. Б. Камін-ський, доктор екон. наук, професор; Т. С. Клебанова, доктор екон. наук, професор; К. Ф. Ковальчук, доктор екон. наук, професор; Ю. Г. Лисенко, чл.-кор. НАН України, доктор екон. наук, професор; І. Г. Лук’яненко, доктор екон. наук, професор; Т. В. Меркулова, доктор екон. наук, професор; Лешек Рутковський, член Польської академії наук, доктор наук, професор (Польща); В. М. Соловйов, доктор фіз.-мат. наук, професор; С. В. Устенко, доктор екон. наук, професор; О. І. Черняк, доктор екон. наук, професор; С. Д. Штовба, доктор техн. наук, професор; О. В. Язенін, доктор фіз.-мат. наук, професор (Росія).

Адреса редакційної колегії: 03680, м. Київ, просп. Перемоги, 54/1, кімн. 220 ДВНЗ «Київський національний економічний університет імені Вадима Гетьмана»

Тел./факс: 044 371 61 09 E-mail: [email protected]

Веб-сайт журналу: http://nfmte.com/

Засновник та видавець

Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана»

Свідоцтво про державну реєстрацію КВ № 18370-7170Р, видане Державною реєстраційною службою України 27.10.2011

Рекомендовано до друку Вченою радою КНЕУ

Протокол № 14 від 22.06.2017

Загальна та наукова редакція А. Матвійчука

Журнал індексується в міжнародних реферативних базах даних: Index Copernicus, CiteFactor, Ulrichsweb, Global Serials Directory, EBSCO, OAJI, ResearchBible, Google Scholar.

ISSN 2306-3289 КНЕУ, 2017

Page 4: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

УДК 330.4: 336.774

АНАЛІЗ ВАГОМОСТІ КРИТЕРІЇВ В ОЦІНЮВАННІ

КРЕДИТОСПРОМОЖНОСТІ ФІЗИЧНИХ ОСІБ

Г.В. Гаврилюк

Кандидат економічних наук, Заступник начальника

Представництво ПАТ «Українська залізниця» в Російській Федерації та Республіці Білорусь

провулок Вознесенський, 17, м. Москва, 125009, Росія

[email protected]

Стаття присвячена вирішенню завдання аналізу вагомості ха-рактеристик потенційних позичальників – фізичних осіб в оці-нюванні їх кредитоспроможності. Обґрунтовано доцільність застосування з цією метою методу нечіткого багатокритеріаль-ного аналізу, за яким вибір найбільш кредитоспроможних по-зичальників за рядом критеріїв здійснюється на основі парних порівнянь альтернатив. Особливістю запропонованого методу є застосування принципу Беллмана-Заде, згідно якого компенса-ція недоліку одних показників надлишком інших є неприпус-тимою. Як розв’язок, найпривабливішим для кредитування ви-значається потенційний позичальник, який одночасно задо-вольняє усім критеріям найбільшою мірою. В ході проведеного аналізу сформовано множину критеріїв оцінювання кредито-спроможності фізичних осіб і виявлено вплив критеріїв на мож-ливість підвищення ефективності такої оцінки. Практичною цінністю проведеного дослідження є отримані нові знання що-до впливу критеріїв відбору фізичних осіб на оцінювання ризи-ку дефолту, що в подальшому слугуватиме одним із інструмен-тів для попередження втрат від невиконання кредитних зобо-в’язань.

Ключові слова: кредитоспроможність фізичної особи, кредит-ний ризик, багатокритеріальний аналіз, нечіткі множини, парні порівняння.

© Г. В. Гаврилюк, 2017 3

Page 5: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

4

АНАЛИЗ ВЕСОМОСТИ КРИТЕРИЕВ В ОЦЕНИВАНИИ

КРЕДИТОСПОСОБНОСТИ ФИЗИЧЕСКИХ ЛИЦ

А.В. Гаврилюк

Кандидат экономических наук, Заместитель начальника

Представительство ПАО «Украинская железная дорога» в Российской Федерации и Республике Беларусь

переулок Вознесенский, 17, г. Москва, 125009, Россия

[email protected]

Статья посвящена решению задач анализа весомости характе-ристик потенциальных заёмщиков – физических лиц при оце-нке их кредитоспособности. Обоснована целесообразность применения с этой целью метода нечеткого многокритериа-льного анализа, согласно которому выбор наиболее кредитос-пособных заёмщиков по ряду критериев осуществляется на основе парных сравнений альтернатив. Особенностью пред-ложенного метода является применение принципа Беллмана-Заде, когда компенсация недостатка одних показателей переи-збытком других является недопустимой. При таком подходе наиболее привлекательным для кредитования определяется тот потенциальный заемщик, который одновременно удовлет-воряет всем критериям в наибольшей степени. В ходе прове-денного анализа сформировано множество критериев оцени-вания кредитоспособности физических лиц и показано влияние критериев на возможность повышения эффективнос-ти такой оценки. Практичной ценностью выполненного иссле-дования являются полученные новые знания о влиянии кри-териев отбора физических лиц на оценку риск дефолта, что в дальнейшем будет служить одним из инструментов предупре-ждения потерь от невыполнения кредитных обязательств.

Ключевые слова: кредитоспособность физического лица, кре-дитный риск, многокритериальный анализ, нечеткие множества, парные сравнения.

Page 6: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Аналіз вагомості критеріїв в оцінюванні… А. В. Гаврилюк

5

ANALYSIS OF THE CRITERIA SIGNIFICANCE IN ASSESSING THE CREDITWORTHINESS OF INDIVIDUALS

Ganna Gavrilyuk PhD in Economics,

Deputy Head

Representative of the Public Joint Stock Company «Ukrainian Railways» in the Russian Federation and the Republic of Belarus

17 Voznesensky lane, Moscow, 125009, Russia [email protected]

The article is devoted to solving the problems of analyzing the weight of the characteristics of potential borrowers — individuals in assessing their creditworthiness. The expediency of applying for this purpose the method of fuzzy multi-criteria analysis is substantiated, according to which the selection of the most creditworthy borrowers for a number of criteria is carried out on the basis of paired comparisons of alternatives. A feature of the proposed method is the application of the Bellman-Zadeh principle, according to which compensation for the lack of certain indicators by an overabundance of others is unacceptable. As a solution, the most attractive for lending is the potential borrower, which meets all the criteria to the greatest extent. In the course of the analysis a number of criteria for assessing the creditworthiness of individuals were formed and the influence of the criteria on the possibility of improving the efficiency of such an assessment was shown. The practical value of the research is the new knowledge gained on the impact of the selection criteria of individuals on the credit risk assessment, which in the future will serve as one of the tools to prevent costs from defaulting on loan commitments.

Key words: creditworthiness of an individual, credit risk, multicriteria analysis, fuzzy sets, pair comparisons.

JEL Classіfіcatіon: C13, D70, D81, E51

Постановка проблеми

Сукупність складних економічних, соціальних і політичних

умов української сучасності призвели до зростання частки про-блемних кредитів у банківських установах. За даними НБУ до 2014 року обсяг проблемної заборгованості змінювався незнач-ними темпами: у 2012 році спостерігалось зменшення на 8,3 % порівняно з 2011 роком, у 2013 році зменшення склало ще 3,0 % у порівнянні з попереднім роком [1]. Однак у 2014 році обсяг

Page 7: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

6

проблемної заборгованості зріс на 93,6 % відносно попереднього року, у 2015 році ще на 56,9 %. У жовтні 2016 році в порівнянні з жовтнем 2015 року зростання склало 31,6 % [2].

Зростання частки проблемної заборгованості в кредитному портфелі банку, згідно банківської нормативно-правової бази [3], зумовлює значні відрахування в резерви на покриття втрат за кредитними операціями. Так, частка резервів за активними опе-раціями банків у 2008–2015 роках повторює тенденцію за част-кою простроченої заборгованості за кредитами. Зокрема, у 2012 році частка резервів за активними операціями зменшилась на 1,8 %, порівняно з 2011 роком, у 2013 році зменшилась на 2,9 %, у 2014 році відбулось зростання на 6,0 %, а у 2015 році зростання склало 12,9 % при порівнянні з попереднім роком [2]. Це свід-чить про низьку якість активів банку та призводить до зменшен-ня розміру потенційного прибутку.

У зв’язку з такою ситуацією ряд банків зменшив обсяг креди-тування населення, що у свою чергу здійснило додатковий негати-вний вплив на прибутковість банків, обумовило певні труднощі для кредиторів і позичальників, знизило довіру до банківської сис-теми та ускладнило відновлення кредитування реального сектора економіки України. З огляду на необхідність збільшення обсягів кредитування та виведення цього процесу на ефективніший рівень, розробка адекватного інструментарію оцінювання кредитоспро-можності фізичних осіб є вкрай актуальним завданням.

Проблеми оцінювання кредитоспроможності фізичних осіб традиційно перебувають в центрі уваги вчених і є одним із най-більш досліджених розділів банківської справи. Дослідження в цьому напрямі представлені як зарубіжними, так і вітчизняними дослідниками, серед яких варто відзначити: Д. Дюрана [4], В. Ві-тлінського [5], А. Камінського [6], Н. Сіддікі [7].

Представлені в науковій літературі підходи свідчать про те, що в зарубіжній і вітчизняній банківській практиці кредитоспромож-ність потенційного позичальника завжди була і залишається од-ним з основних критеріїв визначення доцільності встановлення кредитних відносин з клієнтом. Тому проведення оцінювання кредитоспроможності фізичної особи на стадії прийняття рішення про доцільність видачі кредиту є необхідним інструментом для ефективного управління кредитним ризиком банку.

Оцінюючи кредитоспроможність позичальника, банк фактич-но визначає рівень кредитного ризику, який він приймає на себе,

Page 8: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Аналіз вагомості критеріїв в оцінюванні… А. В. Гаврилюк

7

надавши кредит. Таким чином, рівень ризику потенційного пози-чальника трансформується у ризик самого банку за умови вста-новлення кредитних відносин.

Отже, оцінювання кредитного ризику фізичних осіб є важли-вою складовою в забезпеченні беззбиткового функціонування банку. Також важливим є формування множини критеріїв оціню-вання позичальника та подальший аналіз їх впливу на кредито-спроможність фізичної особи.

Виклад основного матеріалу дослідження

Розробка власної рейтингової системи оцінювання кредито-спроможності позичальника надає можливість формування кри-теріїв та вимог до клієнта відповідно до положень кредитної по-літики банку. Критерії оцінювання кредитоспроможності позичальника можуть визначатись кожним банком самостійно і мають бути документально закріплені в окремому положенні, яке входить до стандартів кредитної політики банку. Залежно від того, яким чином будуть сформовані критерії для оцінюван-ня кредитоспроможності позичальника, буде залежати величина ризику для банку.

Національним банком України в Положенні «Про порядок фо-рмування та використання резерву для відшкодування можливих втрат за кредитними операціями банків» [8] встановлено систему кількісних та якісних показників для оцінювання кредитоспромо-жності позичальника, врахування яких обов’язкове для банків. За-тверджені Положенням вимоги є мінімально необхідними і кожен банк може самостійно визначати додаткові критерії, що підвищу-ють вимоги до позичальників, з метою адекватного оцінювання рі-вня кредитного ризику і належного контролю за ним.

При виборі системи показників оцінювання кредитоспромож-ності позичальника потрібно враховувати специфіку того сегмен-та ринку, який обслуговує банк, спеціалізацію банку (іпотечний, інвестиційний, ощадний), форми (іпотечні, споживчі, лізингові тощо), строки кредитів (коротко-, довгострокові), кредитні стра-тегії та політику банку (обережна, помірна чи агресивна), рівень кваліфікації працівників кредитного відділу, рівень організації і технічного забезпечення аналітичної роботи в банку.

Відбір кредитоспроможних позичальників необхідно забезпе-чити з урахуванням умов слабоформалізованості та невизначено-

Page 9: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

8

сті початкових даних, беручи до уваги одночасно якісні та кількі-сні характеристики позичальника.

Для цього вважаємо відомими: Р = {р1, р2, ..., рm} – множина потенційних позичальників (тих

фізичних осіб, які претендують на отримання кредиту); К ={k1, k2,..., kп} – множина кількісних та якісних критеріїв ві-

дбору для оцінювання кредитоспроможності потенційних пози-чальників.

Задача багатокритеріального оцінювання полягає у впорядку-ванні елементів множини Р за критеріями з множини К.

На сьогодні не існує стандартного набору характеристик, за якими можна класифікувати фізичних осіб за рівнем кредито-спроможності. Аналіз робіт [7–9] дає підстави виділити такі по-казники для оцінювання кредитоспроможності потенційних по-зичальників:

k1 – вік; k2 – сімейний стан; k3 – кількість утриманців; k4 – освіта позичальника; k5 – заробітна плата; k6 – кількість телефонів позичальника (вибір даного критерію

обумовлений тим, що відсутність такого роду інформації або час-та зміна телефонів підвищують імовірність вчинення позичаль-ником шахрайських дій);

k7 – стать. Враховуючи той факт, що критерії оцінювання позичальників

представлені як кількісними, так і якісними показниками, засто-суємо метод нечіткого багатокритеріального аналізу варіантів [10–13] для ранжування потенційних позичальників за їх креди-тоспроможністю. За подібного підходу критерії будемо розгляда-ти як нечіткі множини, що задані на універсальній множині варі-антів за допомогою функцій належності.

Нехай )( jk рi

– рівень кредитоспроможності потенційного по-

зичальника pj P за критерієм відбору Kki : )( jk pi

приймає зна-

чення в діапазоні [0, 1] – чим більше число )( jk pi

, тим вища оцінка

Page 10: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Аналіз вагомості критеріїв в оцінюванні… А. В. Гаврилюк

9

позичальника за критерієм nimjKki ,1;,1, . У такому випадку критерій відбору Kki можна представити у вигляді нечіткої

множини іk~

, яку задано на універсальній множині P таким чином:

m

mkkk

іp

p

p

p

p

pk iii

)(,...,

)(,

)(~

2

2

1

1 , (1)

де )( jk pi

– ступінь належності елемента pj до нечіткої множи-

ни іk~

.

Ступені належності нечіткої множини (1) знайдемо за мето-

дом побудови функцій належності на основі парних порівнянь.

При такому підході формуються матриці за кожним із критеріїв,

а загальна кількість таких матриць співпадає із кількістю критері-

їв відбору і дорівнює n. Для критерію Kki матриця парних по-

рівнянь приймає вигляд:

iii

iii

iii

i

kmm

km

km

km

kk

km

kk

k

aaa

aaa

aaa

A

...

............

...

...

21

22221

11211

, (2)

де iklja — рівень переваги за критерієм ki позичальника pl над по-

зичальником mjlp j ,1,, , який визначається за дев’ятибальною

шкалою Сааті [14]: 1 – якщо відсутня перевага pl над pj; 3 – якщо

перевага pl над pj

є слабкою; 5 – якщо перевага pl над pj є помір-

ною; 7 – якщо перевага pl

над pj є сильною; 9 – якщо перевага pl над pj

є абсолютною; 2, 4, 6, 8 – проміжні оцінки: 2 – ледь слаб-

ка перевага; 4 – помітна перевага; 6 – майже сильна перевага;

8 – майже абсолютна перевага.

Слід зазначити, що матриця (2) є діагональною ( jla iklj 1 )

та обернено симетричною (елементи матриці парних порівнянь

пов’язані математичним виразом ,a

1a

jl

lj k1,jl, ).

Page 11: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

10

Ступенями належності нечіткої множини (1) будуть виступати

коефіцієнти відносної важливості, обчислення яких проводимо із

використанням середнього геометричного елементів кожного із

рядків матриці А [14; 15, с. 46]:

ml

aa

aam

l

mlml

mlml

l ,1,

...

...

1

1

1

. (3)

Згідно підходу Беллмана–Заде найкращим буде результат,

який найбільшою мірою одночасно задовольняє усім критеріям

відбору. При цьому нечіткий розв’язок задачі розрахунку відпо-

відності позичальника всім критеріям знаходиться як перетин їх

нечітких множин [16]:

nkkkD~

...~~~

21 . (4)

Ступені належності нечіткого розв’язку

m

mDDD

p

p

p

p

p

pD

)(,...,

)(,

)(~

2

2

1

1 знаходимо через операцію пере-

тину Заде mjpp jknijD i,1,

min

,1

.

Найбільш кредитоспроможним є потенційний позичальник з

максимальним ступенем належності:

mDDDp

ppppi

,...,,maxarg 21 .

За різної важливості критеріїв формула (4) набуває вигляду:

, (5)

де αi – коефіцієнти відносної важливості критеріїв ki, i = n,1 , та-

кі, що α1 +···+ αn =1.

D = k 1α1 k 2

α2 … k nαn =

min

i=1,n μki

αi p1

p1

,

mini=1,n μki

αi p2

p2

,… ,

mini=1,n μki

αi pm

pm

Page 12: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Аналіз вагомості критеріїв в оцінюванні… А. В. Гаврилюк

11

Степінь αi у формулі (5) концентрує функції належності нечіт-

ких множин n,l,k~l 1 , згідно важливості критерію ki, відповідно

до підходу, описаного у [14]. Коефіцієнти відносної важливості

критеріїв визначаються за формулою (3). Проведемо аналіз ваго-

мості впливу критеріїв відбору на результуючу оцінку та здійс-

нимо оцінювання кредитоспроможності чотирьох потенційних

позичальників, інформацію щодо яких наведено у табл. 1. Таблиця 1

ХАРАКТЕРИСТИКИ ПОЗИЧАЛЬНИКІВ

Потенційний

позичальник

Критерії

k1 k2 k3 k4 k5 k6 k7

1 43 одружений — середня 437,8 2 чоловік

2 49 розлучений — незакінчена

вища 500 2 чоловік

3 60 заміжня 2 вища — 2 жінка

4 83 в громадянському

шлюбі —

незакінчена

вища 478,8 3 чоловік

При формуванні матриць парних порівнянь (2) експерту пот-

рібно розуміти, наскільки відповідально позичальники з різних вікових груп виконують власні зобов’язання по кредитам. З цією метою виникає доцільність у формуванні еталону, який містити-ме характеристики найкращого позичальника за усіма відібрани-ми критеріями одночасно. Отримати еталон можна в результаті проведення аналізу розширеної вибірки даних за багатьма пози-чальниками.

Такий аналіз дозволив виявити закономірності у кредитній по-ведінці за всіма критеріями оцінювання позичальників. Ступінь відповідальності у поведінці позичальників можна оцінити через так званий коефіцієнт повернення кредиту (КПК), під яким розумі-тимемо співвідношення кількості стандартно завершених угод до кількості невиконаних кредитних угод. Виходячи з аналізу стати-стичних даних за цим показником пропонуємо наступну шкалу для оцінювання КПК: від 0 до 5 – поганий рівень повернення кре-

Page 13: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

12

Рис. 1. Динаміка КПК у віковій групі

від 38 до 44 років

0

1

2

3

4

5

6

7

8

9

10

0

5

10

15

20

25

30

35

40

38 39 40 41 42 43 44 45

Кіл

ьк

ість

по

зич

ал

ьн

ик

ів, ч

ол

Ко

еф

іціє

нт

по

ве

рн

ен

ня

к

ре

ди

ту

Роки

Коефіцієнт Кількість позичальників

дитів; (5; 7] – низький рівень повернення кре-дитів; (7; 10] – середній рівень повернення кре-дитів; більше 10 – ви-сокий рівень повер-нення кредитів. Так, наприклад, рис. 1 вка-зує на найвищий сту-пінь відповідальності в кредитній поведінці позичальників у віці 43 та 44 роки, для яких КПК знаходиться на рі-вні близько 30 (кіль-кість стандартно завер-

шених угод у 30 разів більша, ніж дефолтів за кредитними зо-бов’язаннями) і свідчить про високий рівень повернення кредитів.

На рис. 2 спостерігаємо значення КПК для вікової групи від 45 до 53 років, яке коливається в інтервалі від 8 до 15. Однак для ві-кової категорії 46 років коефіцієнт повернення кредитів стрибає до рівня 32. Подібні сплески носять випадковий характер і не мають узагальнюючих властивостей, адже, наприклад, вже через рік у

цю категорію перей-дуть сьогоднішні со-рокап’ятирічні і зна-чення КПК для неї опуститься у чотири рази. Враховуючи це, доцільним стає по-дання вихідних ре-зультатів з групуван-ням за більш тривалими періодами. Результати аналізу за-лежності коефіцієнта повернення кредитів позичальниками від їх віку при об’єднанні за

Рис. 2. Динаміка КПК у віковій групі

від 45 до 53 років

Page 14: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Аналіз вагомості критеріїв в оцінюванні… А. В. Гаврилюк

13

п’ятирічними діапазонами наочно представлені на рис. 3. Рис. 4 – 8 ілюструють результати розрахунку КПК за іншими кри-теріями.

Рис. 3. Динаміка КПК від 37 до 98 років

Рис. 4. Динаміка КПК залежно від сімейного стану позичальника

Рис. 5. Динаміка КПК залежно від кількості утриманців

Рис. 6. Динаміка КПК залежно від рівня освіти

Рис. 7. Динаміка КПК залежно від рівня заробітної плати

Рис. 8. Динаміка КПК залежно від кількості

телефонів позичальника

0,00

5,00

10,00

15,00

20,00

25,00

30,00

37-42 43-47 48-52 53-57 58-62 63-67 68-72 73-77 78-82 83-87 88-92

Кп

к

Роки

0

2

4

6

8

10

12

14

КП

К

Сімейний стан

0

2

4

6

8

10

12

немає 1 2 3 4 5 не надали дані

КП

К

Кількість утриманців

0

2

4

6

8

10

12

14

16

КП

К

Освіта

0

2

4

6

8

10

12

14

КП

К

Заробітня плата

0

2

4

6

8

10

12

14

16

1 2 3 4 5 6 7 8 9 10 Немає

даних

КП

К

Кількість телефонів позичальника

Page 15: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

14

Проведений аналіз також дозволив виявити, що жінки є на-

дійнішими позичальниками, порівняно з чоловіками. Так, коефі-

цієнт повернення кредитів жінками дорівнює 9,99, тоді як для

чоловіків КПК = 8,12.

Як уже зазначалось, у результаті проведених обчислень має

бути сформований еталон, з яким далі здійснюватиметься порів-

няння кожного потенційного позичальника. Еталону має відпові-

дати найбільш кредитоспроможний позичальник по запропоно-

ваних критеріях.

З урахуванням отриманих значень КПК сформуємо матриці па-

рних порівнянь (2) за кожним із критеріїв. Об’єктами оцінювання

виступають чотири потенційні позичальники (див. табл. 1).

1515171513151531317531

1

/////

k,

135331131513113131131

2/////

Аk

,

(6)

12112113151

13111511

3

///А

k ,

1331331131

33113311311

4

//

///

Аk

,

175147117171

5717417711

5

////

//

Аk

,

1332311113111121111

6

///

Аk

,

1211121313113111311

7

///

Аk

.

Відповідно до сформованої дев’ятибальної шкали Сааті пер-

ша матриця за критерієм k1 інтерпретується такими висловлю-

ваннями: слабка перевага позичальника р1 над р2, помірна пере-

Page 16: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Аналіз вагомості критеріїв в оцінюванні… А. В. Гаврилюк

15

вага позичальника р1 над р3, сильна перевага позичальника р1

над р4, слабка перевага позичальника р2 над р3, помірна перевага

позичальника р2 над р4, помірна перевага позичальника р3 над р4.

Перший позичальник попадає у вікову групу від 43 до 47 із КПК

22,63 (див. рис. 3). Дана вікова група характеризується високим

рівнем повернення кредитів. Це свідчить про його перевагу над

усіма іншими претендентами, що і відображено у матриці 1kА .

Аналогічно побудовано й інші матриці парних порівнянь.

Знаходимо по кожній із матриць парних порівнянь (6) за до-

помогою формули (3) коефіцієнти відносної важливості критері-

їв, які будуть виступати ступенями належності нечіткої множини

(1). У результаті отримаємо нечіткі множини:

.20,0

,17,0

,32,0

,32,0~

;47,0

,17,0

,17,0

,19,0~

;24,0

,04,0

,61,0

,11,0~

;28,0

,12,0

,48,0

,12,0~

;27,0

,10,0

,30,0

,34,0~

;52,0

,20,0

,08,0

,20,0~

;05,0

,13,0

,26,0

,56,0~

4321

7

4321

6

4321

5

4321

4

4321

3

4321

2

4321

1

ppppk

ppppk

ppppk

ppppk

ppppk

ppppk

ppppk

(7)

Щоб оцінити, наскільки потенційні позичальники р1÷р4 задово-

льняють критеріям, представимо нечіткі множини (7) у вигляді:

Page 17: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

16

(8)

Функції належності нечітких множин 41 p~p~ , відображені на рис. 9, свідчать, що різні потенційні позичальники мають певні переваги за тим чи іншим критерієм. Так, позичальник р1 є кра-щим за критеріями k1, k3 та k7, позичальник р2 – за критеріями k4, k5 і k7, а позичальник р4 – за критеріями k2 та k6. Позичальник р3

не має переваг перед іншими за обраними критеріями.

Рис. 9. Порівняння потенційних позичальників за критеріями

Вибір потенційного позичальника доцільно проводити з ура-хуванням важливості критеріїв. Експертні парні порівняння важ-ливості критеріїв виявились такими: відсутня перевага k1 над k2; помірна перевага k1 над k4, k5 і k6; відсутня перевага k2 над k4; сла-

𝑝1 = 0,56

𝑘1,0,20

𝑘2,0,34

𝑘3,0,12

𝑘4,0,11

𝑘5,0,19

𝑘6,0,32

𝑘7 ;

𝑝2 = 0,26

𝑘1,0,08

𝑘2,0,30

𝑘3,0,48

𝑘4,0,61

𝑘5,0,17

𝑘6,0,32

𝑘7 ;

𝑝3 = 0,13

𝑘1,0,20

𝑘2,0,10

𝑘3,0,12

𝑘4,0,04

𝑘5,0,17

𝑘6,0,17

𝑘7 ;

𝑝4 = 0,05

𝑘1,0,52

𝑘2,0,27

𝑘3,0,28

𝑘4,0,24

𝑘5,0,47

𝑘6,0,20

𝑘7 .

0,00

0,10

0,20

0,30

0,40

0,50

0,60

0,70

k1 k2 k3 k4 k5 k6 k7

p1 p2 p3 p4

Page 18: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Аналіз вагомості критеріїв в оцінюванні… А. В. Гаврилюк

17

бка перевага k2 над k6 і k7; слабка перевага k3 над k1, k4 і k7; помірна перевага k3 над k2 і т.д. Цим висловлюванням відповідає матриця парних порівнянь:

(9)

Знаходимо коефіцієнти важливості критеріїв для даної матри-ці за формулою (3): ;34,0;05,0;21,0;10,0;17,0 54321

.06,0;07,0 76 Розраховані коефіцієнти свідчать, що найбі-

льше впливають на прийняття рішень щодо кредитоспроможнос-ті позичальника його вік, кількість утриманців і заробітна плата.

Для застосування формули (5) знайдемо nik i

i ,1,~

на основі (8)

і матриці (9). У результаті отримуємо нечіткі множини критеріїв із урахуванням їх важливості:

43214

17,0

3

17,0

2

17,0

1

17,0

1

60,0,

71,0,

80,0,

91,005,0,

13,0,

26,0,

56,0~1

ppppppppk ;

43214

10,0

3

10,0

2

10,0

1

10,0

2

94,0,

85,0,

77,0,

85,052,0,

20,0,

08,0,

20,0~2

ppppppppk ;

43214

21,0

3

21,0

2

21,0

1

21,0

3

76,0,

61,0,

77,0,

79,027,0,

10,0,

30,0,

34,0~3

ppppppppk ;

43214

05,0

3

05,0

2

05,0

1

05,0

4

94,0,

90,0,

96,0,

90,028,0,

12,0,

48,0,

12,0~4

ppppppppk ;

43214

34,0

3

34,0

2

34,0

1

34,0

5

62,0,

33,0,

85,0,

48,024,0,

04,0,

61,0,

11,0~5

ppppppppk ;

43214

07,0

3

07,0

2

07,0

1

07,0

6

95,0,

88,0,

88,0,

89,047,0,

17,0,

17,0,

19,0~6

ppppppppk ;

𝐴 =

1 1 1/3 5 1/3 5 51 1 1/5 1 1/5 3 33 5 1 3 1/3 1 3

1/5 1 1/3 1 1/5 1 1/33 5 3 5 1 3 5

1/5 1/3 1 1 1/3 1 11/5 1/3 1/3 3 1/5 1 1

.

Page 19: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

18

43214

06,0

3

06,0

2

06,0

1

06,0

7

91,0,

90,0,

93,0,

93,020,0,

17,0,

32,0,

32,0~7

ppppppppk .

Функції належності потенційних позичальників до відібраних

критеріїв з урахуванням їх важливості наведено на рис. 10.

Рис. 10. Порівняння позичальників з урахуванням важливості критеріїв

Порівнюючи рис. 9 і 10 видно, що із урахуванням важливості

критеріїв відстань між оцінками позичальників зменшилась.

Перетин нечітких множин усіх критеріїв за формулою (5)

k~

...k~

k~

nαn

αα 2121

дає такі ступені належності вихідного рішення D~

:

.60,091,0;95,0;62,0;94,0;76,0;94,0;60,0min

;33,090,0;88,0;33,0;90,0;61,0;85,0;72,0min

;77,093,0;88,0;85,0;96,0;77,0;77,0;82,0min

;48,093,0;89,0;48,0;90,0;79,0;85,0;90,0min

4

3

2

1

p

p

p

p

D

D

D

D

Результат розрахунку подаємо у вигляді нечіткої множини:

4321

60,0;

33,0;

77,0;

48,0~

ppppD ,

яка свідчить про перевагу позичальника p2 над іншими(тобто, по-зичальник p2 задовольняє встановленим критеріям із урахуван-ням їх важливості більшою мірою за решту позичальників). Ви-

0,00

0,20

0,40

0,60

0,80

1,00

1,20

k1 k2 k3 k4 k5 k6 k7

p1 p2 p3 p4

Page 20: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Аналіз вагомості критеріїв в оцінюванні… А. В. Гаврилюк

19

хідне рішення щодо видачі кредитів формується в результаті по-рівняння потенційних позичальників. Потенційний позичальник із найбільшою мірою належності більше за інших відповідає ви-могам, що визначені критеріями відбору. Дослідження впливу ва-гомості критеріїв відбору на результуючий показник дозволили сформувати таку шкалу для прийняття управлінських рішень щодо видачі кредиту: (0; 0,33] – відмовити у видачі кредиту; (0,33; 0,70] – видача кредиту із більш «жорсткими» умовами; (0,70; 1] – доцільно надати кредит.

Відповідно до цієї шкали позичальнику p2 доцільно надати кредит, позичальникам p1 та p4 можна надати кредит, але з більш «жорсткими» умовами, позичальнику p3 – відмовити.

Проведемо аналіз впливу критеріїв на результат оцінювання кредитоспроможності позичальників із застосуванням методики дослідження чутливості прийнятого рішення на основі «що, якщо» аналізу. Такий підхід дозволяє встановити, як зміниться оцінка по-зичальника, якщо змінити значення одного з парних порівнянь. За-стосуємо запропонований у роботах [17, 18] підхід до аналізу чут-ливості з метою виявлення впливу критеріїв відбору на оцінку кредитоспроможності потенційного позичальника.

Скористаємось отриманими вище результатами багатокритері-ального аналізу позичальників. З’ясуємо, наприклад, яким чином можна скорегувати переваги критеріїв, щоб позичальник р1 став найбільш кредитоспроможним з-поміж інших за оцінкою банку.

Наразі позичальник p1 має третій ранг після p2 та p4. Будемо вважати, що є можливість покращити парні порівняння цього по-зичальника за критерієм k5 (тобто, є потенційна можливість змі-нити роботу і, відповідно, збільшити рівень заробітної плати). З’ясуємо, як впливає на оцінку кредитоспроможності поступова зміна рівня переваги потенційного позичальника p2 над p1 з пото-чного значення «сильна перевага p2 над p1» на всі можливі варіа-нти до оцінки «відсутня перевага p2 над p1». Для цього послідов-но змінимо значення елемента а12 матриці парних порівнянь Ak5 з 1/7 на 1/6, 1/5, 1/4, 1/3, 1/2, 1 та проведемо розрахунки за викла-деною у [10] методикою, результати яких зведемо до табл. 2. При цьому необхідно враховувати ту обставину, що зміна переваги за критерієм k5 у потенційного позичальника p1 відносно p2 може привести до зміни переваг і з іншими позичальниками. Тобто, якщо зарплата першого потенційного позичальника була макси-

Page 21: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

20

мально нижчою, ніж у другого (оцінка переваги 1/7), але при цьому максимально вищою порівняно з третім (оцінка 7), то з ро-стом зарплати першого його перевага до третього залишиться максимальною – рівною 7, але перевага до четвертого потенцій-ного позичальника буде зростати. В таких випадках відбувається зміна попарних порівнянь у матриці і, відповідно, результуючих показників, що можна бачити у табл. 2.

Таблиця 2

ВПЛИВ КРИТЕРІЮ k5 НА РЕЗУЛЬТУЮЧУ ОЦІНКУ

КРЕДИТОСПРОМОЖНОСТІ ПОЗИЧАЛЬНИКА р1

ПРИ ЗМІНІ ПАРНОЇ ПЕРЕВАГИ а12

а12 𝐴 𝑘

1/7

[

]

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

1/6

[

]

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

1/5

[

]

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

1/4

[

]

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

1/3

[

]

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

1/2

[

]

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

1

[

]

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

𝑝

Page 22: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Аналіз вагомості критеріїв в оцінюванні… А. В. Гаврилюк

21

На рис. 11 відображено динаміку оцінок кредитоспроможності усіх потенційних позичальників за даними з табл. 2, де видно, що позичальник p1 стане другим за рангом (зрівняється з p4), коли за критерієм k5 перевага p4 над p1 буде відсутньою (а14 = 1).

Рис. 11. Динаміка оцінок кредитоспроможності потенційних

позичальників при зміні переваг за критерієм k5

З рис. 11 бачимо, що в результаті підвищення рівня заробітної плати позичальника p1 із відповідним збільшенням його переваги за цим критерієм відносно інших позичальників, його інтеграль-на оцінка зросла з 0,48 до 0,72. Хоча він і не став кращим за по-тенційного позичальника p2, проте, враховуючи встановлені діа-пазони результуючої шкали для прийняття рішень, потенційний позичальник p1 за таких умов зможе одержати кредит.

Висновки з проведеного дослідження

Поява проблемної заборгованості може призвести до негатив-них наслідків у роботі банку, погіршувати його здатність генеру-вати прибуток і динамічно розвиватись в умовах мінливого зов-нішнього середовища. Тому зменшення кредитних ризиків, пошук і формування нових і вдосконалення існуючих методів ре-гулювання проблемних кредитів є одними з головних завдань, що стоять перед банківськими установами.

У статті проведено дослідження особливості оцінювання кре-дитоспроможності потенційних позичальників. У результаті було виділено такі критерії оцінювання як вік, сімейний стан позича-льника, кількість утриманців, освіта, заробітна плата, кількість

0

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

0,9

1/7 1/6 1/5 1/4 1/3 1/2 1

м

а12

D(P1)

D(P2)

D(P3)

D(P4)

Page 23: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

22

телефонів і стать позичальника. Процедуру відбору кредито-спроможних позичальників реалізовано на основі методу нечіт-кого багатокритеріального аналізу, згідно якого оцінювання здій-снюється на основі парних порівнянь варіантів. Показано, що застосування не абсолютних значень критеріїв, а парних порів-нянь їх переваг є зручнішим для експертів. Особливістю метода багатокритеріального аналізу є використання принципу Беллма-на-Заде, за яким найкращим визначається позичальник, що одно-часно задовольняє усім критеріям найбільшою мірою.

В ході аналізу вагомості критеріїв на основі нечітких парних порівнянь сформульовані рекомендації, яким чином необхідно змінювати характеристики потенційному позичальнику, щоб під-няти рівень його кредитоспроможності за оцінкою банку.

Література

1. Основні показники діяльності банків України [Електронний ре-сурс] // Національний банк України. – 2014–2016. – Режим доступу: https://bank.gov.ua/control/uk/publish/article?art_id=34661442.

2. Аналітичний огляд банківської системи України за 9 місяців 2016 року [Електронний ресурс] // Національне рейтингове агенство Рюрік. – 2016. – Режим доступу: http://rurik.com.ua/documents/research/bank_ system_3_kv_2016.pdf.

3. Положення «Про порядок формування та використання банками України резервів для відшкодування можливих втрат за активними ба-нківськими операціями» [Електронний ресурс] / Затверджено Постано-вою Правління Національного банку України від 25.01.2012 № 23. – Режим доступу: http://zakon2.rada.gov.ua/laws/show/z0231-12.

4. Durand D. Risk Elements in Consumer Instalment Financing / David Durand. – New York: National Bureau of Economic Research, 1941. – 128 p.

5. Вітлінський В. В. Кредитний ризик комерційного банку: навч. посіб. / В. В. Вітлінський, О. В. Пернарівський, Я. С. Наконечний, Г. І. Великоіваненко. – К. : Знання, 2000. – 251 с.

6. Камінський А. Б. Нейромережеві технології в управлінні портфелем простроченої заборгованості / А. Б. Камінський, В. О. Сікач // Моделюван-ня та інформаційні системи в економіці. – 2011. – Вип. 84. – С. 5–19.

7. Сиддики Н. Скоринговые карты для оценки кредитных рисков. Разработка и внедрение интеллектуальных методов кредитного скорин-га / Наим Сиддики. – М.: Изд-во МИФ, 2014. – 268 с.

8. Положення «Про порядок формування та використання резерву для відшкодування можливих втрат за кредитними операціями банків» [Електронний ресурс] / Затверджено Постановою Правління Націона-

Page 24: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Аналіз вагомості критеріїв в оцінюванні… А. В. Гаврилюк

23

льного банку України від 6 липня 2000 р. № 279. – Режим доступу: http://zakon4.rada.gov.ua/laws/show/z0474-00.

9. Гаврилюк Г.В. Ієрархічна модель оцінювання кредитоспромож-ності позичальників. Актуальні проблеми прогнозування поведінки складних економічних систем: колективна наукова монографія / за ред. О.І. Черняка, П.В. Захарченка. – Бердянськ: Видавець Ткачук О.В, 2016. – 512 с.

10. Ротштейн А. П. Интеллектуальные технологии идентификации [Електронний ресурс]. – Режим доступу: http://matlab.exponenta.ru/ fuzzylogic/book5/7_4.php.

11. Rotshtein A. Fuzzy multicriteria analysis of variants with the use of paired comparisons / A. Rotshtein, S. Shtovba // Journal of Computer and Systems Sciences International. – 2001. – Vol. 40. – № 3. – P. 499–503.

12. Борисов А. Н. Принятие решений на основе нечетких моделей: примеры использования / А. Н. Борисов, О. А. Крумберг, И. П. Федо-ров. — Рига: Зинатне, 1990. – 184 с.

13. Ротштейн А. П. Интеллектуальные технологи идентификации: нечеткая логика, генетические алгоритмы, нейронные сети / А. П. Рот-штейн. – Винница: УНІВЕРСУМ-Вінниця, 1999. – 295 с.

14. Саати Т. Принятие решений. Метод анализа иерархий / Т. Саа-ти. – М.: Радио и связь, 1993. – 279 с.

15. Кігель В.Р. Математичні методи ринкової економіки / В.Р. Кігель. – К.: Кондор, 2003. – 158 с.

16. Bellman R. Decision-making in a fuzzy environment / R. Bellman, L. Zadeh // Management Science. – 1970. – Vol. 17. – № 4. – P. 141–164.

17. Штовба С.Д. Проектирование нечетких систем средствами MATLAB / С. Д. Штовба. – М.: Горячая линия – Телеком, 2007. – 288 с.

18. Ротштейн А.П. Многокритериальный выбор бренд-проекта с помощью нечетких парных сравнений альтернатив / А. П. Ротштейн, С. Д. Штовба, Е. В. Штовба // Управление проектами и программами. – 2006. – № 2. – C. 138–146.

References

1. National Bank of Ukraine. (2014–2016). Osnovni pokazately diyal’nosti bankiv Ukrayiny. Retrieved from https://bank.gov.ua/control/ uk/publish/article?art_id=34661442 [in Ukrainian].

2. National rating agency Rurik. (2016). Analitychnyy ohlyad bankivs’koyi systemy Ukrayiny za 9 misyatsiv 2016 roku. Retrieved from http://rurik. com.ua/documents/research/bank_system_3_kv_2016.pdf [in Ukrainian].

3. National Bank of Ukraine. (2012). Polozhennya Pro poryadok formu-vannya ta vykorystannya bankamy Ukrayiny rezerviv dlya vidshkoduvannya mozhlyvykh vtrat za aktyvnymy bankivs’kymy operatsiyamy. Retrieved from http://zakon2.rada.gov.ua/laws/show/z0231-12 [in Ukrainian].

Page 25: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

24

4. Durand D. (1941). Risk Elements in Consumer Instalment Financing. New York: National Bureau of Economic Research.

5. Vitlins’kyj, V. V., Pernarivs’kyj, O. V., Nakonechnyj, Ya. S., & Velykoivanenko, H. I. (2000). Kredytnyj ryzyk komertsijnoho banku. Kyiv, Ukraine: Znannia [in Ukrainian].

6. Kamins’kyy, A. B., & Sikach, V. O. (2011). Neyromerezhevi tekhnolohiyi v upravlinni portfelem prostrochenoyi zaborhovanosti. Modelyuvannya ta informatsiyni systemy v ekonomitsi (Modelling and information systems in economy), 84, 5–19 [in Ukrainian].

7. Siddiqi, N. (2006). Credit Risk Scorecards: Developing and Implementing Intelligent Credit Scoring. New Jersey: John Wiley and Sons.

8. National Bank of Ukraine. (2000). Polozhennya Pro poryadok formuvannya ta vykorystannya rezervu dlya vidshkoduvannya mozhlyvykh vtrat za kredytnymy operatsiyamy bankiv. Retrieved from http://zakon4. rada.gov.ua/laws/show/z0474-00.

9. Gavrilyuk, G. V. (2016). Iyerarkhichna model’ otsinyuvannya kredy-tospromozhnosti pozychal’nykiv. In Aktual’ni problemy prohnozuvannya povedinky skladnykh ekonomichnykh system: kolektyvna naukova monohrafiya. (pp. 258–268). Berdyans’k, Ukraine: Vydavets’ Tkachuk O.V. [in Ukrainian].

10. Rotshtein, A. P. Intellektual’nyye tekhnologii identifikatsii. Retrieved from http://matlab.exponenta.ru/fuzzylogic/book5/7_4.php.

11. Rotshtein, A., & Shtovba, S. (2001). Fuzzy multicriteria analysis of variants with the use of paired comparisons. Journal of Computer and Systems Sciences International, 40(3), 499—503.

12. Borisov, A. N., Krumberg, O. A., & Fedorov I. P. (1990). Prinyatiye resheniy na osnove nechetkikh modeley: primery ispol’zovaniya. Riga, Latvia: Zinatne [in Russian].

13. Rotshteyn, A. P. (1999). Intellektual’nyye tekhnologi identifikatsii: nechetkaya logika, geneticheskiye algoritmy, neyronnyye seti. Vinnitsa, Ukraine: UNÍVERSUM-Vínnitsya [in Russian].

14. Saati, T., & Joyce, A. (1989). Conflict Resolution: The Analytic Hierarchy Process. New York: Praeger.

15. Kigel, V. R. (2003). Matematychni metody rynkovoyi ekonomiky. Kyiv, Ukraine: Kondor [in Ukrainian].

16. Bellman, R., & Zadeh, L. (1970). Decision-making in a fuzzy environment. Management Science, 17(4), 141—164.

17. Shtovba, S. D. (2007). Proyektirovaniye nechetkikh sistem sredstva-mi MATLAB. Moscow, Russia: Goryachaya liniya — Telekom [in Russian].

18. Rotshtein, A.P., Shtovba, S.D., & Shtovba, E. V. (2006). Mnohokry-teryal'nyi vybor brend-proekta s pomoshchyu nechetkykh parnykh sravneniy al'ternatyv. Upravleniye proektami i prohrammami (Project and Program Management), 2, 138–146 [in Russian]. Стаття надійшла до редакції 29.03.2017

Page 26: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

УДК 332.12

ОЦІНЮВАННЯ ВНУТРІШНЬОРЕГІОНАЛЬНОЇ ДИФЕРЕНЦІАЦІЇ

НА ЗАСАДАХ НЕЙРО-НЕЧІТКОГО МОДЕЛЮВАННЯ

Т. І. Єфанова

Магістр з економічної кібернетики, здобувач кафедри економічної кібернетики

Дніпровський національний університет імені Олеся Гончара проспект Гагаріна, 72, м. Дніпро, 49010, Україна

[email protected]

Дана стаття містить результати дослідження у сфері регіональ-ного розвитку, зокрема огляд існуючих принципів і розробку ефективного підходу до аналізу регіонального простору задля покращення соціального та економічного середовища в регіонах. Аналіз результатів проведених експериментів виявив невідпові-дність традиційних підходів реальним умовам розвитку регіонів. Запропонований підхід, який базується на принципах нейро-нечіткого моделювання та експертних методах, поєднує сценарні розрахунки з урахуванням якісних і кількісних показників, екс-пертних знань у предметній області. Це дозволяє досягти топо-логічної впорядкованості об’єктів, провести групування та про-аналізувати динаміку розвитку районів обраного регіону. Апробація запропонованого методологічного підходу була про-ведена із застосуванням реальних даних щодо діяльності районів Дніпропетровської області за 2006–2015 рр., яка підтвердила ефективність розробленого математичного інструментарію при виявленні загальних закономірностей у розвитку районів за їх фінансово-соціальними показниками. Ключові слова: регіональний розвиток, карти самоорганізації Кохонена, нечітка логіка, експертні методи.

© Т. І. Єфанова, 2017 25

Page 27: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

26

ОЦЕНИВАНИЕ ВНУТРИРЕГИОНАЛЬНОЙ ДИФЕРЕНЦИАЦИИ

НА ОСНОВЕ НЕЙРО-НЕЧЕТКОГО МОДЕЛИРОВАНИЯ

Т. И. Ефанова

Магистр по экономической кибернетике, соискатель кафедры экономической кибернетики

Днепровский национальный университет имени Олеся Гончара проспект Гагарина, 72, г. Днепр, 49010, Украина

[email protected]

Данная статья содержит результаты исследования в области ре-гионального развития, в частности обзор существующих прин-ципов и разработку эффективного подхода к анализу региональ-ного пространства для улучшения социальной и экономической среды в регионах. Анализ результатов проведенных эксперимен-тов обнаружил несоответствие традиционных подходов реаль-ным условиям развития регионов. Предложенный подход, осно-ванный на принципах нейро-нечеткого моделирования и экспертных методах, сочетает сценарные расчеты с учетом каче-ственных и количественных показателей, экспертных знаний в предметной области. Это позволяет достичь топологической упорядоченности объектов, разделить по группам и проанали-зировать динамику развития районов выбранного региона. Ап-робация предложенного методологического подхода была про-ведена с применением реальных данных о деятельности районов Днепропетровской области за 2006–2015 гг., которая подтвер-дила эффективность разработанного математического инстру-ментария при выявлении общих закономерностей в развитии районов согласно их финансово-социальных показателей.

Ключевые слова: региональное развитие, карты самоорганизации

Кохонена, нечеткая логика, экспертные методы.

Page 28: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

27

EVALUATION OF INTRA-REGIONAL DIFFERENTIATION BASED ON NEURO-FUZZY SIMULATION

Tetiana Efanova

Master’s Degree in Economic Cybernetics, PhD student, Department of Economic Cybernetics

Oles Honchar Dnipro National University 72 Gagarin Avenue, Dnipro, 49010, Ukraine

[email protected]

This article contains the results of a study on regional development, in particular a review of existing principles and the development of an effective approach to the analysis of the regional space for improving the social and economic environment in the regions. An analysis of the results of carried out experiments revealed a discrepancy between the traditional approaches to the real conditions of the regions develop-ment. The suggested approach, based on the principles of neuro-fuzzy modeling and expert methods, combines scenario calculations with qualitative and quantitative indicators, experts knowledge in the subject area. It allows reaching a topological ordering of objects, dividing into groups and analyzing the dynamics of development of districts of the chosen region. The approbation of the proposed methodological approach was carried out using real data on the activi-ties of districts of Dnipropetrovsk region in 2006-2015, which confirmed the effectiveness of the developed mathematical tools in identifying common patterns in the development of areas according to their financial and social indicators.

Keywords: regional development, Kohonen self-organization map, fuzzy logic, expert method.

JEL Classification: C61, R11 Постановка проблеми

Регіональна економічна система України сьогодні перебуває у

стані кардинальних змін, які потребують реального оцінювання поточного стану та однозначного формулювання завдань розвит-ку. Традиційні підходи та способи формування перспективних стратегій розвитку регіону в умовах сучасних реалій, які харак-теризуються відсутністю яких-небудь достовірних кількісних прогнозів у масштабі всієї країни, значно ускладнюють вирішен-ня завдання розробки ефективної соціально-економічної стратегії на рівні регіону. Через це існує нагальна потреба у неперервному,

Page 29: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

28

своєчасному, достовірному моніторингу соціально-економічної ситуації, тактичному та стратегічному плануванні регіональних процесів і розробки інструментарію формування стратегій.

Активний перехід до децентралізації став передумовою змі-щення акценту з державної стратегії до регіональної. Стратегія розвитку окремого регіону має розроблятися відповідно до Дер-жавної стратегії регіонального розвитку, в якій визначаються пріоритетні напрямки для кожного регіону.

У регіонах прийнята значна кількість цільових програм, але не всі вони розроблені відповідно до регіональних стратегій. Це призво-дить до розпорошення та неефективного використання бюджетних ресурсів і, відповідно, недосягнення цілей і завдань соціально-економічного розвитку регіону, суттєвого ускладнення контролю за результативністю виконання програм, неможливості ефективної концентрації бюджетних ресурсів і продуктивнішого їх викори-стання. Тому, необхідно чітко окреслити коло показників, які адек-ватно відображають загальноекономічну та соціальну ситуацію в регіоні, та обрати методики, які дозволять одержати обґрунтовані пропозиції з формування стратегії регіонального розвитку.

Аналіз останніх джерел і публікацій

Питання соціально-економічного розвитку територій і форму-вання їх соціальної політики неодноразово порушувались у пра-цях зарубіжних і вітчизняних науковців, зокрема, С. І. Богуслав-ської [1], З. С. Варналія [2], М. А. Захарової [3], В. Є. Реутової [4] та ін. Більшість учених розглядали підходи до визначення скла-дових регіональної соціальної політики, не приділяючи увагу ме-тодології для визначення кількісного показника рівня її ефектив-ності. Спроби кількісно оцінити подібний показник закінчувалися невдало, адже складно врахувати якісні складові формування соціальної політики.

Для оцінки якісних показників рівня розвитку соціальної полі-тики застосовуються експертні методи та методологія нечіткого моделювання, які дають можливість кількісно оцінювати різно-манітні якісні характеристики. Розробкою, дослідженням і порів-нянням різноманітних методів експертних оцінок займалися С. Д. Бешелев [5], О. Г. Гофман [6], Б. Г. Литвак [7], а також ба-гато інших вітчизняних та іноземних науковців. Основні поло-ження теорії нечітких моделей було закладено американським математиком Лотфі Заде [8]. В Україні питаннями нечіткого мо-

Page 30: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

29

делювання в економіці займались В. В. Вітлінський [9], К. Ф. Ко-вальчук [10], А. В. Матвійчук [11] та ін.

Утім, низка питань, пов’язаних з поєднанням кількісних і які-сних, суб’єктивних та об’єктивних характеристик із застосуван-ням експертних методів і нечіткої логіки до оцінювання рівня життя населення в регіонах, залишаються нерозв’язаними. Не-зважаючи на велику кількість робіт, присвячених класифікації регіонів, досі не було розроблено підходу, який би включав ком-плексний аналіз фінансово-економічної складової розвитку райо-нів, рівня життя населення, як основного індикатора ефективнос-ті соціальної політики, та виявлення можливих траєкторій і тенденцій розвитку.

Мета і завдання дослідження

Метою роботи є обґрунтування теоретико-методологічних по-ложень і практичних рекомендацій щодо визначення тенденцій формування регіонального простору на засадах економіко-мате-матичного моделювання. Основним завданням статті є побудова моделі оцінювання внутрішньорегіональної диференціації в ди-наміці у контексті економічного розвитку регіону на підґрунті поєднання інструментарію теорії нечіткої логіки та технологій штучних нейронних мереж.

Виклад основного матеріалу

Соціально-економічна ситуація в регіоні у кожен момент часу t

,Tt=1 характеризується певними комбінаціями параметрів розвитку

усіх районів, які входять до його складу. На зростання рівня розвит-

ку районів впливають як фінансово-економічні Н, так і соціальні

показники H~

, які утворюють матрицю };e={E trhˆˆ ;,Tt=1 ;H,Hh=

~1

,Rr=1 , де trhe – значення h-го показника розвитку r-го району в

момент часу t. Звертаємо увагу, що самі соціальні показники міс-

тяться у векторі-стовпці ),,...,,( ~21 HyyyY H,h=

~1 . Необхідно:

- визначити кількісні характеристики якісних показників розвитку. При цьому основним індикаторним параметром пропо-нується розглядати рівень ефективності проведення соціальної політики в районах області як одної із якісних складових рівня життя населення кожного району;

Page 31: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

30

- згрупувати райони в однорідні групи, тобто провести топо-

логічне упорядкування районів з метою оцінювання ефективності

державної регіональної політики, в контексті фінансових і соціа-

льних показників розвитку.

Для розв’язання сформульованої задачі пропонується застосу-

вати методологічний підхід, за яким слід:

- сформувати тривимірну матрицю лінгвістичних оцінок

R1,=r ;H1,=h ;T1,=t };e{=E trh

~~~, де елемент

trhe~ – це лінгвістична

оцінка r-го району за h-им якісним показником соціального роз-витку протягом t-го періоду часу; - здійснити перехід від оцінок якісних показників тривимір-

ної матриці }e={E trh

~~ у кількісні значення }; G={gtr

h;,Tt=1

,R;r=H,h= 1~

1 , які нададуть можливість визначити рівень ефекти-вності соціальної політики в розрізі районів, тобто сформувати

двомірну матрицю ,R;r=,Tt=}{U tr 11; ;

- сформувати тривимірну матрицю ;1,T}; t=e={E tr

h ;H,h= ˆ1

1ˆ1 HH;,R r= , інформативних показників, які поєднують кіль-

кісні та якісні оцінки районів, де H – кількість показників, що

мають кількісний характер ( trh

trh ee ˆ , ,H; h=,Tt= 11 ). У кожен t-ий

період часу елемент trHe 1 буде приймати значення ;,Tt=tr 1,

,Rr=1 , для інтегральної кількісної оцінки якісних соціальних по-казників. Таким чином, елементи матриці утворюють вектори

trtrH

tr1

tr δ,e...,,eε ˆˆ , ,R;r=,Tt= 11 . Тоді сама матриця може бути

записана у вигляді trE , ,R;r=,Tt= 11 ;

- провести кластеризацію районів за фінансово-соціальними показниками, тобто визначити місце кожного з R районів серед

інших у момент часу t, ,T t=1 .

Загальну схему реалізації підходу до оцінювання внутрішньоре-

гіональної диференціації в динаміці у контексті розвитку регіональ-

ного простору, яка включає усі зазначені етапи, зображено на рис. 1.

Page 32: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

31

Рис. 1. Схема оцінювання внутрішньорегіональної диференціації в динаміці у контексті розвитку регіонального простору

[авторська розробка]

Задачу визначення кількісних оцінок якісних показників роз-витку розглянемо детальніше.

На основі матриці ,R; r=H,; h=,T}; t=e={E trh 1

~11~~

, формуємо

матрицю кількісних експертних оцінок за соціальними показниками

Сформувати набір інформативних показників кількісного характеру,

тобто матрицю: ,

ЗАДАЧА ГРУПУВАННЯ РАЙОНІВ

Визначити місце кожного з R районів та розподілити їх за кластерами в момент часу

t,

Матриця кількісних

показників розвитку

Матриця якісних показників розвитку

,

де елемент — це лінгвістична оцінка

Отримати попередні числові оцінки експертними методами

Застосувати методи нечіткого моделювання

для обробки оцінок якісних характеристик

Знайти інтегральний показник рівня ефективності соціальної політики

Матриця фінансово-економічних та соціальних показників

, де – значення

h-го показника розвитку r-го району в момент часу t

Page 33: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

32

,R;r=H,;h=,T}; t=G={g trh 1

~11 . Для того, щоб представити лінгві-

стичні оцінки в кількісній формі, необхідно провести попередню їх

обробку із застосуванням експертних методів. У результаті отриму-

ються елементи матриці G, де trhg – кількісна оцінка h-го соціально-

го показника розвитку у кожен t-ий період часу для r-го району.

Етапи отримання експертної суб’єктивної оцінки рівня розвитку

соціальної політики по районам для кожного року t, t= ,T1 є такими:

визначення мінімально-необхідної кількості експертів κmax;

формування матриці ~

, яка складається з векторів

H~

,h,~,...,~,...,~maxhhphh 11 , з елементами hp

~ , які є кі-

лькісними оцінками за h-показником і виставлені p-експертом,

max,p 1 . Дана матриця формується на основі тривимірної мат-

риці лінгвістичних оцінок };e={E tr

h~~

; ,Tt=1 ,R; r=H, h= 1~

1 , із за-

стосуванням шкали, що наведена в табл. 1. Таблиця 1

ШКАЛА ПЕРЕХОДУ ВІД ЛІНГВІСТИЧНИХ ОЦІНОК ДО КІЛЬКІСНИХ ОЦІНОК

Якісний показник Лінгвістичне значення показникаtr

he~ Шкала оцінювання hp~

у1

низький 0–3

допустимий 3–7

високий 7–10

у2

низький 0–4

середній 4–7

високий 7–10

… …

… …

… …

Hу ~

неефективний 0–2

помірно ефективний 2–6

високо ефективний 6–10

Page 34: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

33

оцінка рівня компетентності експертів αр, max,1 p ;

оцінка альтернатив і визначення їх корисності h~ , H,h~

1

(в якості оцінюваних альтернатив виступають соціальні показни-

ки діяльності районів області, для яких має бути визначена інди-

відуальна суб’єктивна оцінка, яка дає можливість визначати важ-

ливість кожної із альтернатив при оцінюванні рівня ефективності

соціальної політики);

визначення ступеня узгодженості оцінок об’єктів експертизи

H,hK th

~1, ;

аналіз отриманих результатів експертизи. Зазначимо, що на розмір експертної групи впливає велика кі-

лькість факторів та обставин, зокрема ступінь актуальності,

складність і багатогранність проблеми, яку необхідно вирішити.

Мінімально-необхідна кількість експертів розраховується за

формулою [5]:

,+/*,=max 5350 (1)

де (0;1) – можлива помилка результатів експертизи, що зада-

ється особою, яка проводить експертизу.

Виходячи із значення κmax особа, яка приймає рішення, має

сформувати групу експертів, оцінити рівень їх компетентності αр

та визначити корисність кожної із оцінюваних альтернатив h

~ .

Для обробки експертних суджень використовуємо метод гру-

пового оцінювання, який дозволяє визначити коефіцієнт компе-

тентності експертів αр та групові оцінки якісних характеристик

h~ . При цьому компетентність експертів визначається за ступе-

нем узгодженості їх оцінок із груповою оцінкою. На підставі су-

джень експертів формується матриця ~

кількісних оцінок за

кожною суб’єктивною характеристикою:

max,1,~

,1,~~ pHhhp , (2)

Page 35: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

34

де hp~ – оцінка за h-показником p-експертом.

Процес знаходження зазначених характеристик представляє

собою ітераційну процедуру. Вагові коефіцієнти компетентності

експертів αр містяться у відповідному векторі-рядку, рівність

компонент якого означає, що експерти на початковому етапі ма-

ють однаковий ступінь компетентності:

)1,...1,1(),...,(maxmaxmax

002

01

0

max

. (3)

На основі цього вектора визначається групова оцінка якісних

характеристик діяльності районів h

~, що являє собою корисність

альтернатив, значення яких містяться у векторі-стовпці

H~

,h,h 1 :

max

1

1 ~~

p

hpph , Hh~

,1 , Z,1 . (4)

Зазначимо, що 1~~

1

1

H

hh .

Отримані значення групової оцінки використовуються для ко-

ригування коефіцієнтів компетентності, які заносяться у вектор-

рядок Z,1,,...,,max21

, елементи p якого розра-

ховуються за формулою:

h

H

hhpp

~*~1~

1

1

, max,1 p , Z,1 , (5)

де 1

~

1 1

~*~max

h

H

h

hp

p

, що є коефіцієнтом, який водиться для

нормування ваг компетентностей експертів

1max

1

pp .

Page 36: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

35

Для розрахунку рівня компетентності експертів αр та рівня ко-

рисності альтернатив h~ застосовуємо теорему Фробеніуса–

Перона, згідно якої за умови, що τ→∞, вектор-стовпець з оцінками

корисності альтернатив h

~, Hh

~,1 , та вектор-рядок з оцінками

рівня компетентності експертів p , max,1 p , збігаються до

власних векторів матриць T~~

і ~~ T , відповідно [12].

На наступному етапі аналізу, який проводиться експертною

групою, формується матриця кількісних експертних оцінок за

соціальними показниками ,R;r=H,;h=,T}; t=G={g trh 1

~11 . Кожен

p-ий експерт у період часу t виставляє кожному r-му району за

h-м показником деяке число trhp , яке відповідає кількісному

значенню лінгвістичної оцінки, шкалу якої наведено в табл. 2.

Таблиця 2

КІЛЬКІСНА ШКАЛА ЛІНГВІСТИЧНОЇ ОЦІНКИ

Якісний показник Лінгвістичне значення показника Шкала оцінювання trhp

у1

низький 0–0,3

допустимий 0,3–0,7

високий 0,7–1

у2

низький 0–0,2

середній 0,2–0,6

високий 0,6–1

… …

… …

… …

Hу ~

неефективний 0–0,4

помірно ефективний 0,4–0,7

високо ефективний 0,7–1

Page 37: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

36

Підсумкова кількісна оцінка соціальних показників розвитку у

кожен t-ий період часу за h-м показником r-го району розрахову-

ється за формулою:

,RrH,h,Tt)*ψ*(g php

trhp

trh 1,

~1,1,~max

1

, (6)

де trhp – оцінка r-го району p-м експертом за h-м показником у

t-ий період часу;

hψ~ – оцінка корисності h-ої альтернативи;

αр – оцінка компетентності р-го експерта.

Для того, щоб упевнитись у достовірності оцінок trhg кількісно

оцінимо ступінь узгодженості думок експертів, розрахувавши для

кожного h-го показника значення коефіцієнта конкордації [5]:

H~

,h,,T;tH~

H~

*

*dK

max

tht

h 1112

32

, (7)

де Hh,T;tHrddR

r

R

r p

trhp

trh

th

~,1,1))1

~(**5,0( 2

1 1 2max

2 max

;

κmax – кількість експертів;

H~

– кількість властивостей, які розглядаються;

R – кількість районів регіону;

T – кількість періодів часу, за які аналізується статистика за

районами; trhpr – місце, яке зайняв r-ий район серед інших районів у ран-

жуванні p-м експертом за h-м показником у період часу t; trhd – відхилення суми рангів по r-ому району за h-м показни-

ком від середнього арифметичного сум рангів за H~

показниками

у t-ий період.

Page 38: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

37

Слід зазначити, що ]1;0[thK . Якщо 0t

hK , то це свідчить про

абсолютну протилежність оцінок експертів, а якщо 1thK – повне

співпадіння ранжувань. Достовірність оцінювання вважається

адекватною, якщо 7,0thK .

Соціально-економічна ситуація, яка притаманна регіону, хара-

ктеризується певними комбінаціями параметрів розвитку кожно-

го району, які входять до складу області. На зростання рівня роз-

витку районів впливають як фінансово-економічні, так і соціальні

показники. Більше того, соціальні характеристики вже давно ви-

ступають центральними індикаторами, які визначають збалансо-

ваний розвиток будь-якого регіону. Однією з якісних складових

рівня життя населення, яка є найскладнішою категорією у соціа-

льній теорії, є показник ефективності проведення соціальної по-

літики в районах області.

Тож наступний етап запропонованого методологічного підхо-

ду до оцінювання внутрішньорегіональної диференціації полягає

у знаходженні інтегрального показника рівня ефективності про-

ведення соціальної політики tr , ,R;r=,Tt= 11 , на засадах інстру-

ментарію нечіткого моделювання.

Необхідно сформувати двовимірну матрицю ;}{U tr ;,Tt=1

,Rr=1 , яка отримується шляхом обробки тривимірної матриці

,R;r=H,;h=,T}; t=G={g trh 1

~11 , що містить кількісні оцінки тих

якісних показників соціального розвитку, за якими було оцінено

окремий район для кожного t-го періоду часу.

Процес нечіткого моделювання для знаходження інтеграль-

ного показника рівня ефективності проведення соціальної політи-

ки tr , ,R;r=,Tt= 11 , можна представити такими етапами [13]:

— формування вхідних факторів ),...,,( ~21 HyyyY і вибір

якісної результуючої змінної ESCtr, ,R;r=,Tt= 11 , що відповідає

кількісному показнику tr ; — процес фаззифікації (введення нечіткості) – встановлення

відповідності між конкретним значенням вхідної змінної системи

Page 39: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

38

нечіткого висловлювання і значенням її функції належності до

кожної нечіткої множини, що описується відповідним лінгві-

стичним термом;

— формування нечіткої бази знань – правил, на основі яких

формується нечіткий логічний висновок стосовно ефективності

рівня соціальної політики за районами;

— проведення модельних експериментів та уточнення пара-

метрів моделі;

— формулювання висновків і рекомендацій.

Як зазначалося, вхідними даними для отримання інтегральної

оцінки розвитку соціальної політики районів ,R;r=,Tt=tr 11, ,

визначеної для Т періодів часу, є матриця }{ trhgG , яка склада-

ється з елементів ,R;r=H,;h=,T t=g trh 1

~11, , що визначають підсумко-

ву експертну оцінку r-го району за h-м показником.

Прийняття рішення щодо визначення рівня ефективності

соціальної політики здійснюється відповідно до алгоритму

Мамдані [14]. Крок 1. Вектор фіксованих значень вхідних змінних визнача-

ється вектором ),...,,( ~21 HyyyY , який містить у собі якісні пока-

зники для оцінки рівня ефективності соціальної політики. Крок 2. Скласти нечітку базу знань у вигляді сукупності не-

чітких правил типу “ЯКЩО — ТОДІ”, що визначають взаємо-

зв’язок між вхідними змінними ),...,,( ~21 HyyyY та результую-

чою змінною ESCtr, ,R;r=,Tt= 11 , моделі. На основі цієї бази ви-

водиться система нечітких логічних рівнянь типу Мамдані для всіх варіантів вихідної змінної, що враховувала б усі терми з

множини HhwwwW hfhhhh

~,1},,...,,{ 21 , де hf кількість термів у

множині Wh вхідної змінної Hhyh

~,1, .

Вигляд вирішальних правил для оцінки рівня ефективності проведення соціальної політики у загальному вигляді представ-

лено у табл. 3, в якій ddf

hw – значення лінгвістичного терму вхід-

Page 40: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

39

ної змінної yh, Hh~

,1 , за fd правилом, що відповідає d-му терму

результуючої змінної, а dfd

– вага правила прийняття рішення.

Таблиця 3

ЗАГАЛЬНИЙ ВИГЛЯД НЕЧІТКОЇ БАЗИ ЗНАНЬ

№ вхідної

комбінації

Вхідні змінні Вага

правила

Вихідна

змінна

у1 у2 …

yh …

Hy ~ ESC

11 11

1w 11

2w … 11

hw … 11~H

w 11

1v … … … … … … … …

11 f 11

1

fw 11

2f

w … 11 f

hw … 11~f

Hw 1

1f

… … … … … … … … …

1D 1

1

Dw 1

2

Dw … 1Dhw …

1~D

Hw D

1

Dv … … … … … … … …

DDf DDfw1

DDfw2 … DDf

hw … DDf

Hw ~

DfD

Нечітка база знань, яка побудована, спираючись на знання ек-

спертів, ставить у відповідність вектору вхідних змінних одне з

можливих значень vd, Dd ,1 , за принципом “ЯКЩО — ТОДІ”,

тобто:

ЯКЩО 1111 wy ТА 11

22 wy ТА… ТА 11~~HH

wy

(з вагою 11 )

АБО 1211 wy ТА 12

22 wy ТА … ТА 12~~HH

wy

(з вагою 12 )

Page 41: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

40

АБО …

АБО 1111

fwy ТА 11

22f

wy ТА … ТА 11 f

H~H

~ wy

(з вагою 1

1f ),

ТОДІ 1vESC .

ЯКЩО 111Dwy ТА 1

22Dwy ТА… ТА 1

~~D

HHwy

(з вагою D1 )

АБО …

АБО DDfwy 11 ТА DDf

wy 22 ТА … ТА DDf

HHwy ~~

(з вагою DfD

),

ТОДІ DvESC . (8)

Базу правил прийняття рішень і систему нечітких логічних рі-

внянь у компактній формі можна записати як:

.,1,,...,,

~

11~21 Ddyyyy h

dlh

wH

h

dl

df

lH

dv

(9)

Після проведення операції дефаззифікації (перетворення нечі-

ткої множини у чітке число) знаходиться кількісна оцінка резуль-

туючої змінної ESCtr*, яка відповідає заданому вхідному вектору

Y [11].

У результаті обробки отриманих експертних оцінок якісних

показників за допомогою побудованої нечіткої моделі, для кож-

ного r-го району в період часу t визначається числове значення

інтегрального показника рівня ефективності соціальної політики tr , утворюючи таким чином загальну для регіону матрицю

,R;r=,Tt={U tr 11}; .

Крок 3. Відповідно до вектора вхідних змінних

H~y,...,y,yY 21 і результуючого показника ESCtr, ;,Tt=1 ,Rr=1 ,

Page 42: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

41

задається вигляд функції належності ),...,,( ~21 H

vyyyd нечітких

термів D},d{vV d ,1 .

Для опису всіх лінгвістичних термів як вхідних, так і резуль-

туючої змінних пропонується застосовувати квазідзвоноподібні

функції належності. Зокрема, аналітичний вигляд функції належ-

ності результуючої змінної ESCtr, ,R;r=,Tt= 11 , задається співвід-

ношенням:

,

1

1)(

2

d

d

d

v

v

v

c

bYY 10( )

де )(Ydv – належність змінної Y до відповідного терму

D},d{vV d ,1 ;

dvc – коефіцієнт концентрації-розтягування квазідзвоноподіб-

ної функції належності;

dvb – координата максимуму функції належності.

Для конкретизації виду цієї функції необхідно задати орієнто-

вні межі змін усіх нечітких множин кожного з показників yh,

Hh~

,1 , відповідно до їх нормативних значень. Таким чином

встановлюються рівні показників, які будуть відповідати своїм

лінгвістичним термам.

Параметри квазідзвоноподібних функцій належності для вхід-

них змінних, які були застосовані в дослідженні, представлено в

табл. 4. Зауважимо, що чим більше значення коефіцієнту концент-

рації-розтягування dvc , тим пологіший вигляд має функція належ-

ності. Низьке значення коефіцієнта концентрації-розтягування ак-

центує увагу на невеликому околі координати максимуму, що

притаманне вхідним змінним з невеликим розмахом [15].

Page 43: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

42

Таблиця 4

ПАРАМЕТРИ КВАЗІДЗВОНОПОДІБНИХ ФУНКЦІЙ НАЛЕЖНОСТІ ВХІДНИХ ЗМІННИХ

Вхідна

змінна

Лінгвістичне значення

показника

Коефіцієнт концентрації-

розтягування функції dvc

Координата

максимуму функції dvb

у1 низький 0,7 0

допустимий 0,7 1

високий 0,7 4

у2

низький 0,4 0

середній 0,3 0,3

високий 0,3 0,6

у3

кризовий 1 2

передкризовий 1 6

задовільний 4 9

… … …

… … …

… … …

Hу ~

неефективний 0,8 0

помірно ефективний 1 2

високо ефективний 1 4

Крок 4. Застосовуючи логічні рівняння, обчислюються значення

функцій належності ),...,,( ~21 H

vyyyd вектора ),...,,( ~21 H

yyyY для

всіх значень DV,dvd ,1 , вихідної змінної ESCtr, ,R;r=,Tt= 11 .

Крок 5. Значення функції належності ),...,,( ~21 H

vyyyd для

кожного лінгвістичного терму Ddvd ,1, , результуючої змінної

ESCtr, ,R;r=,Tt= 11 , моделі у кожний t-ий період часу для кожно-

го r-го району розраховується таким чином:

,Rr,TtyyyESC

H

v

Ddvvv

tr d

d

1,1,,...,,maxarg ~21,1,...,, 21

. (11)

Page 44: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

43

Розглянемо процес формування бази знань для визначення «ефективного рівня» проведення соціальної політики.

Спочатку для оцінки всіх якісних показників вхідних yh,

Hh~

,1 , і результуючої ESCtr, ,R;r=,Tt= 11 , змінних сформуємо

власні множини можливих лінгвістичних змінних. Так для

вхідної змінної у1, яка відповідає рівню екологічного забруднен-

ня, застосуємо шкалу якісних термів із терм-множини

ВДНwwwWf

,,,...,, 1

121

111 : Н – кризовий рівень показника, Д –

передкризовий і В – допустимий. Аналогічним чином формують-

ся терм-множини для інших якісних показників. Для оцінки ре-

зультуючої змінної ESCtr, ,R;r=,Tt= 11 , будемо використовувати

терми із множини НЕ,ПЕ,ЕФVvd : ЕФ – ефективний рівень,

ПЕ – помірно ефективний рівень, НЕ – неефективний рівень. Після визначення лінгвістичних змінних будуємо функції на-

лежності вхідних і результуючої змінної, які мають квазідзвоно-подібний вигляд. Експертна система на базі нечітких правил для результуючої змінної ESCtr, яка ставить у відповідність їй терм ЕФ (ефективний рівень), наведена у табл. 5.

Таблиця 5

НЕЧІТКА БАЗА ЗНАНЬ ДЛЯ ВИЗНАЧЕННЯ «ЕФЕКТИВНОГО РІВНЯ» СОЦІАЛЬНОЇ ПОЛІТИКИ

№ вхідної комбінації

Вхідні змінні Вага

правила Вихідна змінна

у1 у2 … H

y ~ ESC

11 В Д … Д ЕФ1

ЕФ

12 Д Д … В ЕФ2

… … … … … …

11 f В Н … В ЕФf1

Page 45: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

44

Правила прийняття рішень для визначення «ефективного рів-ня» соціальної політики в аналітичній формі набувають вигляд:

,)(...)()(

...)(...)()(

)(...)()(),...,(

~21

~212

~211~1

1 H

BНВЕФ

f

Н

ВДДЕФ

Н

ДДВЕФ

H

ЕФ

yyу

ууу

уууyy

(12)

де ),...,( ~1 Hv

yyd – функція належності вектора вхідних змінних

),...,( ~1 Hyy лінгвістичному терму DV,dvd ,1 , результуючої

змінної;

vd – значення вихідної змінної ESCtr, ,R;r=,Tt= 11 , з терм-

множини {ЕФ, ПЕ, НЕ}; dfd

– ваги правил (числа з діапазону [0,1], що характеризують

ступінь упевненості експерта в істинності конкретного правила);

fd – номер правила, що відповідає d-му терму результуючої

змінної ESCtr, ,R;r=,Tt= 11 ;

D – кількість лінгвістичних значень результуючої змінної ESCtr [16].

Згідно сформульованого методологічного підходу далі постає задача об’єднання районів за однорідними групами.

Для адекватного аналізу та оцінки соціально-економічного

потенціалу районів у контексті регіону необхідно, щоб фактори,

які враховуються під час кластеризації, охоплювали різні групи

показників, такі як фінансові, соціальні, демографічні, освітні та

інші. Тому матрицю RrTteeE trtrH

tr ,1;,1,,ˆ...,,1 , для гру-

пування районів було сформовано з урахуванням кількісних і

якісних показників. Для вирішення цієї задачі пропонується застосовувати само-

організуючі Карти Кохонена. На відміну від класичного кластер-ного аналізу, який дозволяє лише згрупувати однорідні об’єкти, карти Кохонена на додачу до цього також надають можливість візуалізувати результати. Також карти Кохонена не потребують наявності апріорної інформації про параметри кластерів. Зокре-

Page 46: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

45

ма, формування «еталонів класів» у процесі навчання такої нейронної мережі відбувається на основі вхідної інформації.

Топологія самоорганізуючих карт Кохонена представлена нейронною мережею, яка складається з нейронів вхідного шару, що виконують розподільчу функцію, і обчислювального шару, нейрони якого розташовуються на площині – шар Кохонена. Кар-та самоорганізації навчається «без учителя» – це такий вид опти-мізаційної моделі, при якому значення вихідної змінної заздале-гідь невідомі і нейромережа вчиться виявляти приховані закономірності у масиві вхідних даних. Мета функціонування мережі полягає у здійсненні топологічного упорядкування вхід-них сигналів, за якого «сусіднім» вхідним образам знаходяться відповідні сусідні нейронні елементи з обчислювального шару. Для розв’язання цього завдання формується область тяжіння нейрона-переможця, у якій всі нейрони, які потрапляють у цю область, змінюють свої вагові коефіцієнти і тим самим стають більш подібними до поданого вектора даних і, відповідно, нейро-на-переможця [17].

Перед проведенням навчання нейронної мережі здійснюється ініціалізація карти, тобто відбувається процедура привласнення невеликих випадкових чисел усім параметрам нейронів.

На кожному кроці навчання відбувається порівняння вектора вхідних значень з векторами усіх нейронів. У процесі цього від-бувається «змагання» між нейронами з метою визначення нейро-на-переможця, який має бути найближчим по значенню до вхід-ного вектора даних. У результаті такого ітеративного процесу на карті Кохонена формуються кластери із векторів з однорідними показниками.

Нехай s~ – номер ітерації, Ss~

,0~ (на початковому етапі но-

мер ітерації 0). У процесі самоорганізації карти Кохонена вико-

нуються такі кроки:

- вибираємо випадковий вектор ,,ˆ...,,1

trtr

H

trtr ee ;,1 Tt

Rr ,1 , із множини вхідних значень }{ trE ;

- знаходимо нейрон, який є найближчим за евклідовою відс-

танню до вхідного вектора ɛtr:

)~(~)~(~)~()~(~)~( ~~~ snsnssnsll

tr

z

tr , (13)

Page 47: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

46

де )~(~~ snz

– вектор ваг нейрона-переможця zN ~

~;

)~(~~ snl

– вектор ваг l

N ~~

-го вузла на карті.

Якщо умові (13) задовольняють кілька нейронів, нейрон-пере-можець обирається з них випадковим чином;

- корегуємо вектори ваг нейронів. З кожною ітерацією здійс-нюється коригування ваг нейрона-переможця та його сусідів за формулою:

))~(~)~()(~(*)~()~(~)1~(~ ~~~~~ snsshssnsnl

trlzll

, (14)

де 10 s~ – навчальний співмножник, монотонно спадаючий

з кожною наступною ітерацією;

s~hl~

z~ – міра сусідства, яка визначає «ступінь сусідства» вуз-

лів zN~~

і l

N~~

. На практиці для її реалізації зазвичай застосовують

функцію Гауса:

)~(2

exp)~(2

2

~~

~~s

rr

shlz

lz , (15)

де lz rr ~~ , – координати нейронів zN~~

і l

N~~

на карті;

)~(s – співмножник, який монотонно спадає по мірі навчан-

ня, зменшуючи кількість сусідів нейрона-переможця з кожною

наступною ітерацією.

Параметри функцій s~ , s~ та їх характер спадання зада-

ються аналітиком.

На «навчену» мережу подають новий вектор даних, що міс-

тить фінансово-соціальні показники певного району, визначають

нейрон-переможець і виявляють кластер, відповідний цьому ней-

рону. Можемо зробити висновок, що новий вектор даних має

властивості, які притаманні всім векторам (районам), що потра-

пили в даний кластер. Відповідність між об’єктами та нейронами

більм-менш зберігають топологію простору вхідних даних. Кла-

Page 48: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

47

си, які отримуються після кластеризації, є топологічно впорядко-

ваними та можуть бути легко перегрупованими у разі необхідно-

сті [18].

Апробація запропонованого підходу була проведена на даних

щодо розвитку районів Дніпропетровської області протягом де-

сяти років (2006–2015 рр.), тобто T = 10. Аналіз діяльності райо-

нів Дніпропетровського регіону проводився за кількісними та

якісними показниками розвитку. Зокрема, було визначено п’ять

найбільш значущих якісних показників ( H~

=5):

- рівень екологічного забруднення y1;

- рівень розвитку системи охорони здоров’я y2;

- рівень розвитку культури y3;

- рівень соціальної безпеки y4;

- рівень якості послуг у сфері соціального обслуговування y5. Далі формується група експертів, яка надає оцінку кожній із

зазначених якісних характеристик. Розрахунок мінімально-необхідної кількості експертів за формулою (1), прийнявши ϕ = 0,15, дозволив отримати значення 5,12max . Тому було

сформовано групу експертів з 15 осіб. Рівень компетентності ко-жного з них і корисність альтернатив було знайдено, застосовую-чи метод групового оцінювання. За формулами (2)–(5) були роз-

раховані коефіцієнти компетентності експертів αр, 151,p , та

оцінки корисності кожного із якісних показників h~ , 51,h , для

періоду t = 10. Значення оцінок компетентності експертів зведено до табл. 6.

Таблиця 6

ОЦІНКИ КОМПЕТЕНТНОСТІ ЕКСПЕРТІВ

№ експерта (р) Оцінка компетентності (p )

1 0,072366

2 0,072958

3 0,068298

4 0,068841

Page 49: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

48

Закінчення табл. 6

5 0,05872

6 0,062992

7 0,07635

8 0,084441

9 0,061062

10 0,072755

11 0,062415

12 0,065135

13 0,049205

14 0,067201

15 0,057261

Оцінки корисності якісних показників розвитку h~ , H,h~

1 ,

за формулою (4) наведено у табл. 7.

Таблиця 7

ОЦІНКИ ЯКІСНИХ ПОКАЗНИКІВ

№ Назва якісного показника h~

1. Рівень екологічного забруднення 0,2127

2. Рівень розвитку системи охорони здоров’я 0,2000

3. Рівень розвитку культури 0,1958

4. Рівень соціальної безпеки 0,2127

5. Рівень якості послуг у сфері соціального обслуговування 0,1788

Наступний етап, який проводиться експертною групою, поля-

гає у виставленні кожним експертом p у період часу t кожному

району r за h-м показником у відповідність деякого числа trhp , яке

знаходиться у проміжку від 0 до 1. У табл. 8 наведено матрицю,

елементи якої trhp характеризують рівень екологічного забруд-

нення (h = 1) у період часу t = 10.

Page 50: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

49

Таблиця 8

ОЦІНКА ЕКСПЕРТІВ РІВНЯ ЕКОЛОГІЧНОГО ЗАБРУДНЕННЯ

Номер експерта

Назва району 1 2 3 4 5 6 … 13 14 15

Апостолівський 0,56 0,6 0,78 0,81 0,6 0,73 … 0,73 0,73 0,56

Васильківський 0,65 0,71 0,72 0,4 0,67 0,45 … 0,72 0,69 0,53

Верхньодніпровський 0,7 0,65 0,61 0,55 0,6 0,49 … 0,62 0,54 0,49

Дніпровський 0,78 0,75 0,71 0,69 0,68 0,72 … 0,61 0,55 0,6

Криворізький 0,88 0,81 0,8 0,76 0,83 0,65 … 0,86 0,67 0,72

Криничанський 0,86 0,8 0,54 0,67 0,62 0,72 … 0,73 0,8 0,57

Магдалинівський 0,67 0,62 0,72 0,88 0,81 0,8 … 0,55 0,6 0,49

Межівський 0,62 0,54 0,49 0,88 0,81 0,76 … 0,7 0,55 0,6

Нікопольський 0,61 0,55 0,6 0,88 0,81 0,7 … 0,6 0,49 0,88

Новомосковський 0,86 0,67 0,72 0,69 0,68 0,69 … 0,72 0,76 0,76

Павлоградський 0,73 0,8 0,57 0,64 0,46 0,78 … 0,56 0,78 0,7

Петриківський 0,55 0,6 0,49 0,6 0,49 0,82 … 0,8 0,57 0,69

Петропавлівський 0,88 0,81 0,7 0,62 0,54 0,49 … 0,64 0,46 0,78

Покровський 0,88 0,81 0,6 0,61 0,55 0,6 … 0,6 0,49 0,82

П’ятихатський 0,69 0,68 0,73 0,8 0,57 0,68 … 0,62 0,54 0,49

Синельниківський 0,7 0,55 0,6 0,7 0,72 0,76 … 0,61 0,55 0,6

Солонянський 0,6 0,49 0,88 0,69 0,56 0,78 … 0,86 0,67 0,72

Софіївський 0,6 0,7 0,72 0,73 0,8 0,57 … 0,73 0,8 0,57

Томаківський 0,88 0,69 0,56 0,71 0,64 0,46 … 0,55 0,6 0,49

Царичанський 0,88 0,81 0,8 0,55 0,6 0,49 … 0,88 0,81 0,8

Широківський 0,78 0,7 0,55 0,6 0,49 0,81 … 0,88 0,81 0,8

Юр’ївський 0,55 0,6 0,49 0,88 0,81 0,8 … 0,69 0,68 0,72

За формулою (6) була визначена підсумкова кількісна оцінка

якісних характеристик рівня розвитку соціальної політики по ра-

Page 51: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

50

йонам Дніпропетровської області для кожного t-го періоду, зна-

чення яких для останнього періоду (t = 10) наведено у табл. 9.

Таблиця 9

ЕКСПЕРТНІ ОЦІНКИ ЯКІСНИХ ХАРАКТЕРИСТИК РІВНЯ РОЗВИТКУ СОЦІАЛЬНОЇ ПОЛІТИКИ РАЙОНІВ

ДНІПРОПЕТРОВСЬКОЇ ОБЛАСТІ ЗА 2015 РІК

Назва альтернативи

Назва району

Рівень

екологічного

забруднення

Рівень розвитку

системи охорони

здоров’я

Рівень

розвитку

культури

Рівень

соціальної

безпеки

Рівень якості

послуг

у соціальному

обслуговуванні

Апостолівський 0,700 0,348 0,468 0,469 0,41

Васильківський 0,808 0,598 0,328 0,511 0,483

Верхньодніпровський 0,750 0,496 0,190 0,712 0,583

Дніпровський 0,180 0,489 0,870 0,237 0,402

Криворізький 0,190 0,418 0,760 0,217 0,387

Криничанський 0,664 0,354 0,467 0,593 0,492

Магдалинівський 0,650 0,320 0,547 0,643 0,524

Межівський 0,630 0,360 0,360 0,607 0,289

Нікопольський 0,178 0,398 0,409 0,189 0,501

Новомосковський 0,637 0,598 0,453 0,591 0,542

Павлоградський 0,200 0,461 0,796 0,26 0,71

Петриківський 0,864 0,465 0,493 0,805 0,672

Петропавлівський 0,769 0,567 0,234 0,589 0,591

Покровський 0,470 0,754 0,234 0,432 0,481

П’ятихатський 0,624 0,564 0,567 0,348 0,375

Синельниківський 0,150 0,414 0,568 0,391 0,59

Солонянський 0,789 0,440 0,330 0,363 0,491

Софіївський 0,876 0,567 0,345 0,543 0,631

Томаківський 0,416 0,278 0,354 0,389 0,23

Царичанський 0,670 0,654 0,458 0,723 0,681

Широківський 0,754 0,453 0,675 0,613 0,39

Юр’ївський 0,686 0,430 0,234 0,563 0,2

Page 52: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

51

За формулою (7) було розраховано коефіцієнт конкордації, який визначає ступінь узгодженості оцінок експертів, значення

якого 82,0thK свідчить про те, що достовірність оцінювання є

адекватною. За допомогою fuzzyTECH 6.02, який спеціалізується на нечіт-

кому моделюванні, була сформована єдина система нечіткого виводу. Для кожної вхідної змінної були визначені такі терм-множини, які задаються відповідними функціями належності:

• рівень екологічного забруднення: ecology={negative; zero; positive};

• рівень розвитку системи охорони здоров’я: social={small; medium; large};

• рівень розвитку культури: culture={low; medium; high}; • рівень соціальної безпеки: security={low; medium; high}; • рівень якості послуг у сфері соціального обслуговування:

service={decrease; steady; increase}. Згідно з послідовністю етапів оцінки та аналізу (8) – (12) за-

стосовуємо систему нечіткого виводу. Для отримання кількісного значення δtr вихідної змінної ESCtr, якій відповідає лінгвістично заданий терм з множини: ESCtr ={effective, medium-effective, non-effective}, що вказує на ефективність проведення соціальної полі-тики, задаються конкретні значення вхідних показників (рівень екологічного забруднення, рівень розвитку системи охорони здо-ров’я, рівень розвитку культури, рівень соціальної безпеки та рі-вень якості послуг у сфері соціального обслуговування) і засто-совується система нечіткого висновку.

Кількісна шкала оцінювання ефективності соціальної політики δtr має вигляд: від 0 до 0,35 – соціальна політика неефективна, від 0,35 до 0,6 – помірно ефективна, від 0,6 до 1 – соціальна політика ефективна.

На рис. 2 – 4 наведено функції належності та відкладені на них

реальні значення вхідних змінних Hhyh

~,1, , та результуючої

змінної ESCtr для трьох районів Дніпропетровської області. Для на-глядного прикладу було обрано райони, які входять до різних груп розвитку – це Петриківський, Синельниківський і Покровський.

Отримане за допомогою правил нечіткого висновку значення ефективності проведення соціальної політики для Петриківського

Page 53: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

52

району наведено на рис. 2 і дорівнює 0,7148, отже соціальну по-літику можна вважати ефективною. Хоча даний район не є ліде-ром за економічними показниками, проте він займає одне з пер-ших місць серед районів за рівнем життя населення. Перш за все це пов’язане з відсутністю промислових об’єктів на території ра-йону, що позитивно впливає на екологію та соціально-демогра-фічні процеси. Кількість бібліотек, освітніх закладів і медичних установ створюють гарні передумови для розвитку культурної освіченості населення даного району і підвищення рівня якості послуг у сфері соціального обслуговування.

Рис. 2. Функції належності для якісних характеристик Петриківського району за 2015 рік

Отримане на основі правил нечіткого висновку значення ефе-ктивності проведення соціальної політики для Синельниківсько-го району наведено на рис. 3 і дорівнює 0,2736, що вказує на не-ефективність соціальної політики. Дані результати свідчать про те, що незважаючи на лідерство Синельниківського району за економічними показниками, проблемам екології та ситуації у сфері охорони здоров’я тут приділяють недостатньо уваги. За-проваджені ініціативи або не виконуються, або не є ефективни-ми. Стає зрозумілим, що такі значення за показниками рівня жит-тя є загрозливими і тому потребують посиленого регулювання з боку органів державної влади.

ecology = 0,864 social = 0,465

culture = 0,493 ESCtr = 0,7148

security = 0,493

service = 0,672

Page 54: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

53

Рис. 3. Функції належності для якісних характеристик Синельниківського району за 2015 рік

Процедуру розрахунку ефективності проведення соціальної політики для Покровського району графічно відображено на рис. 4, рівень якої складає 0,4899. Отже, соціальну політику мож-на вважати помірно ефективною. Даний район входить до класу середньо розвинених районів за доходними показниками та за рі-внем соціальної політики. Це свідчить про стабільний і рівномір-ний розвиток району в обох напрямах.

Рис. 4. Функції належності для якісних характеристик Покровського району за 2015 рік

ecology = 0,15

social = 0,414 culture = 0,568 ESC

tr = 0,2736

security = 0,391

service = 0,55

ecology = 0,47

social = 0,71

culture = 0,234 ESCtr = 0,4899

security = 0,432

service = 0,481

Page 55: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

54

Аналогічні розрахунки проведені за допомогою нечіткого мо-делювання для інших районів Дніпропетровської області з 2006 по 2015 роки, які дозволили порівняти райони між собою та зро-бити висновок про ефективність проведення соціальної політики у регіоні в цілому. Результати розрахунків для 2015 року наведе-но на рис. 5, за яким можна зробити висновок, що в більшості ра-йонів у цьому році рівень соціальної політики був помірно-ефективним.

Рис. 5. Інтегральний показник рівня ефективності соціальної політики в районах Дніпропетровської області за 2015 рік

Отриманий інтегральний показник рівня розвитку соціальної

політики tr , заноситься до матриці }e={E trh за правилом

RrTteeE trtrH

tr ,1;,1,,ˆ...,,1 .

Таким чином, до матриці інформативних кількісних показни-

ків 1ˆ1ˆ11 HH;,R;r=H,;h=,T}; t=e={E trh , де H = 22 – кількість

показників (сумарно вхідних і вихідного), T = 10 – кількість пері-

Page 56: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

55

одів, що оцінюються, R = 22 – кількість районів Дніпропетровсь-

кої області, входять такі групи показників:

демографічно-міграційні: tre1 – населення r-го району Дніпропетровської області; tre2 – кількість народжених у r-му районі;

tre3 – кількість померлих у r-му районі;

tre4 – зовнішня міграція в r-му районі;

tre5 – внутрішня міграція в r-му районі; tre6 – міське населення в r-му районі; tre7 – сільське населення в r-му районі;

економічні: tre8 – іноземні інвестиції в r-ий район; tre9 – експорт із r-го району; tre10 – імпорт у r-ий район; tre11 – валовий районний продукт у r-му районі; tre12 – доходи населення в r-му районі; tre13 – витрати населення в r-му районі; tre14 – кількість безробітних у r-му районі; tre15 – кількість зайнятих у r-му районі;

промислові: tre16 – добувна промисловість в r-му районі; tre17 – переробна промисловість в r-му районі; tre18 – виробництво та розподіл електроенергії, газу та води в r-му

районі;

аграрні: tre19 – рослинництво в r-му районі; tre20 – тваринництво в r-му районі;

Page 57: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

56

tre21 – харчова промисловість у r-му районі;

соціальний: tre22 = tr – інтегральний показник рівня ефективності соціаль-

ної політики в r-му районі.

Для проведення кластеризації районів за формулами (13) –

(15) було застосовано програмний пакет ViscoverySOMine6, за

допомогою якого для періоду часу Т = 10 років (з 2006 року по

2015 рік) з матриці вхідних даних сформовано карту, яку для

кращої візуалізації та аналізу було розбито на Т карт.

Проведемо спочатку кластерізацію районів для отримання од-

норідних груп за фінансово-економічними показниками (тобто

без урахування tre22 – інтегрального показника рівня ефективності

соціальної політики). З цією метою виділимо три класи районів:

високо розвинені, середньо розвинені та нерозвинені. Розглянемо

на рис. 6, як змінювалось на картах Кохонена положення районів

протягом 2006–2015 рр.

а) 2006 рік б) 2007 рік в) 2008 рік г) 2009 рік

д) 2010 рік е) 2011 рік ж) 2012 рік з) 2013 рік

Page 58: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

57

к) 2014 рік л) 2015 рік

Рис. 6. Карти Кохонена за фінансово-економічними показниками районів Дніпропетровської області

На рис. 6 різними відтінками сірого кольору виділені відпові-

дні класи районів:

- клас S1 (нерозвинені райони);

- клас S2 (середньо розвинені райони);

- клас S3 (високо розвинені райони).

На рис. 7 наведено процентне співвідношення представництва

районів між класами S1, S2, S3.

Рис. 7. Процентне співвідношення між класами S1, S2, S3

Page 59: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

58

Результати візуального аналізу фінансово-економічних по-

казників, які наведено на рис. 7, свідчать, що Дніпропетровсь-

кий регіон відноситься до категорії областей, які вразливі до

впливу глобальної кризи. Так, криза 2008 року в Дніпропетров-

ській області набула обвального характеру і падіння економіки

було глибоким, що чітко демонструє порівняння відсоткового

співвідношення між найбільш розвиненими та нерозвиненими

районами. Протягом 2008–2010 рр. процент нерозвинених ра-

йонів становив 77,27 %, тоді як у докризовому 2007 році цей

процент складав лише 54,55 %, а у 2006 році і того менше –

45,45 %.

Це перш за все пов’язано з тим, що Дніпропетровський регі-

он має експортну орієнтацію і саме зростаючий попит світових

ринків на продукцію, яка виробляється в області підтримував

стійкість розвитку серед районів. Під час глобальної економіч-

ної кризи 2008 року найглибший спад спостерігався саме в екс-

портних галузях української економіки, тому не дивно, що саме

в цей період вразливість економіки Дніпропетровського краю

була найбільшою. Починаючи з 2011 року процент нерозвине-

них районів скоротився до 59,09 %, порівнюючи з кризовим пе-

ріодом, а у 2013 році досягнув свого мінімуму 36,36 %. Однак,

політична ситуація, яка склалася в країні у 2014–2015 рр., стала

підґрунтям до зниження економічного потенціалу регіону, що

спричинило поетапне збільшення кількості нерозвинених райо-

нів. У 2015 році цей показник становив 45,45 %.

Зауважимо, що у програмному пакеті ViscoverySOMine6 кар-

ти Кохонена будуються таким чином, що кожному району на

карті відповідає певна сукупність точок (рис. 8 і 9), аналізуючи

розміщення яких можна зробити висновки щодо розташування

районів у динаміці, яка супроводжується зміною економічних

показників.

Розглянемо детальніше, як змінювалося положення Синель-

никівського (рис. 8) та Павлоградського (рис. 9) районів віднос-

но інших за фінансово-економічними показниками.

Page 60: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

59

Рис. 8. Карти Кохонена за фінансово-економічними показниками

Синельниківського району за 2006–2015 рр.

У 2006 році Синельниківський район займав одне з центра-

льних місць з-поміж середньо розвинених районів, але з 2007

року його позиції почали падати, так що в 2008–2009 рр. він за-

ймав останні позиції серед районів із класу S2. Як видно з рис. 8,

у ці роки район граничить з класом S1, до якого входять нероз-

винені райони (тобто, спостерігалися тенденції до зниження ро-

звитку району за доходними показниками). Але завдяки вдало

проведеним антикризовим заходам уже на початку 2011 року

ситуація стабілізувалася, що стало передумовою для того, щоб

район у 2012 році потрапив до класу S3 – високо розвинених ра-

йонів. У 2013 році район зайняв одне з центральних місць серед

класу S2 – середньо розвинених районів, а у 2014 році знову по-

вернувся до класу S3 – високо розвинених районів. Проте неста-

більна економічна ситуація в країні стала передумовою того, що

району не вдалося втримати лідируючі позиції та у 2015 році він

знову опустився до класу S2 – середньо розвинених районів.

Page 61: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

60

Рис. 9. Карти Кохонена за фінансово-економічними показниками

Павлоградського району за 2006–2015 рр.

Павлоградський район є лідером серед хімічної галузі та

спеціалізується на видобуванні коксового вугілля. Даний район

робить основний внесок в український експорт серед зазначе-

них галузей. На глибину падіння виробництва у хімічній про-

мисловості вплинули погіршення кон’юнктури на зовнішніх

ринках і різке зростання цін на імпортований газ, який є основ-

ною сировиною для галузі. Вугільна ж промисловість відно-

ситься до традиційно збиткових галузей, які постійно підтри-

муються державою. Криза, яка мала наслідком зниження

попиту на обидва види вугілля – коксівне й енергетичне, спри-

чинила різке падіння обсягів виробництва у Павлоградському

районі. Шахти призупиняли видобуток, склади були переван-

тажені вугільними запасами.

Усі зазначені фактори вплинули на розташування району на

карті Кохонена, що можна бачити на рис. 9 (район завжди займав

центральні позиції серед усіх класів). Так, починаючи з 2006 ро-

ку, він був серед лідерів у класі S2 – середньо розвинених райо-

нів, у 2007 році він посилив свої позиції і став наближатися до

класу S3 – високо розвинених районів, а у 2008 році уже знахо-

дився на границі з ним.

Page 62: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

61

Але криза 2008 року віддалила район від попадання до класу

S3. Для подолання кризової ситуації було запроваджено ряд за-

ходів, які вивели б район на докризовий рівень. Серед них мож-

на зазначити заходи зі стимулювання попиту на мінеральні доб-

рива з боку українських сільгоспвиробників, масована закупівля

добрив у державний резерв. Така масштабна підтримка забезпе-

чила хімічній промисловості одні з найвищих серед промисло-

вих галузей темпів відновлення виробництва. Тому в 2012 році

район стає лідером у класі S3 – високо розвинених районів.

Аналізуючи місце району в 2013 році, можна зробити висновок,

що відбулося падіння обсягів виробництва по основних галузях.

Хоча у 2014 році район потрапив до класу S3 – високо розвине-

них районів, але він зайняв місце, яке знаходиться на границі з

класом S1 – нерозвинених районів. Це стало передумовою того,

що у 2015 році він закріпився у класі S2 – середньо розвинених

районів.

Незважаючи на складну економічну кон’юнктуру, економіка

Дніпропетровського регіону витримала і за обмеженої зовнішньої

допомоги почала швидше за інші регіони самостійно виходити з

кризи. Як видно з рис. 7, у 2013 році розподіл районів за класами

ефективності став навіть кращим, ніж у докризовий час. Процент

високо розвинених районів склав 22,73 %, а середньо розвине-

них – 40,91 %, тобто частка нерозвинених районів стала менше

половини. Політичні та економічні негаразди 2013–2014 рр. мали

негативний вплив на розподіл районів. У 2015 році процент ви-

соко розвинених районів становив лише 9,1 %, середньо розви-

нених – 45,45 %, нерозвинених – 45,45 %. Хоча відсоток нероз-

винених районів не перевищує 50 %, однак така ситуація в

регіоні свідчить про те, що в ньому відбувся спад у виробничій і

фінансовій сфері. Розвиненіші райони втрачають свої позиції та

наближаються до менш розвинених.

Проаналізуємо, як зміниться розташування районів при вра-

хуванні tre22 – інтегрального показника рівня ефективності соці-

альної політики. На рис. 10 наведено карти Кохонена за фінан-

Page 63: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

62

сово-економічними та соціальними показниками розвитку з

2006 по 2015 рр.

Рис. 10. Карти Кохонена за фінансово-соціальними

показниками районів Дніпропетровської області

В результаті аналізу рис. 10 можемо прослідкувати, як зміни-

ли своє положення райони на карті Кохонена у порівнянні з роз-

поділом за фінансово-економічними показниками (див. рис. 6).

Так, ряд доходних районів, таких як Криворізький, Нікопольсь-

а)2006 рік б)2007 рік в)2008 рік г)2009 рік

д)2010 рік е)2011 рік ж)2012 рік з)2013 рік

к)2014 рік л)2015 рік

Page 64: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

63

кий, Павлоградський і Синельниківський, перемістилися з верх-

ніх класів до класу S1 – нерозвинутих районів. У свою чергу

менш розвинені райони по доходним показникам, такі як Цари-

чанський, Петриківський, Верхньодніпровський, перемістилися

до класу S3 – високо розвинених районів. Це свідчить про важли-

вість соціальної політики при формуванні стратегій розвитку ре-

гіону, врахування якої дозволить забезпечити регіону збалансо-

ване зростання у всіх галузях.

Порівняння карт Кохонена на рис. 6 і рис. 10 підтверджують

факт, що соціальна політика у Дніпропетровській області перебу-

ває у стані динамічного, але незбалансованого розвитку, що до-

зволяє задовольняти соціальні потреби мешканців регіону на мі-

німальному рівні. Так, обсяг соціальних видатків на одного

жителя в регіоні є найнижчим серед великих промислових регіо-

нів України, при тому, що показники економічного зростання,

навпаки, займають найвищі рейтингові позиції. Усе це приводить

до висновку, що першочерговим завданням для органів регіона-

льної влади та місцевого самоврядування має бути реалізація за-

ходів, які пов’язані з покращенням рівня та якості життя насе-

лення. Висновки

У статті розроблено методологічний підхід до оцінювання рі-

вня ефективності соціальної політики в районах на основі як кі-

лькісних фінансово-економічних, так і якісних соціальних показ-

ників, а також проведення порівняльного аналізу районів у

регіоні. Розроблений підхід базується на поєднанні різноманітних

математичних інструментів аналізу характеристик діяльності ре-

гіону, зокрема карт Кохонена, теорії нечіткої логіки та експерт-

них методів.

Побудована в рамках запропонованого методологічного під-

ходу комплексна економіко-математична модель дозволяє про-

аналізувати динаміку зміни регіонального простору.

Page 65: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

64

Апробація запропонованого методологічного підходу була

проведена із застосуванням реальних даних щодо районів Дніп-

ропетровської області з 2006–2015 рр. Отримані результати за-

свідчили високу адекватність запропонованого підходу та розро-

блених економіко-математичних моделей.

Література 1. Богуславська С. І. Соціальна політика в умовах ринкових відно-

син [Електронний ресурс] / С. І. Богуславська, Л. В. Потапенко // Фі-нансовий простір. – 2013. – № 2. – С. 106–110. – Режим доступу: http://nbuv.gov.ua/j-pdf/Fin_pr_2013_2_14.pdf.

2. Варналій З. С. Регіони України: проблеми та пріоритети соціаль-но-економічного розвитку: монографія / З. С. Варналій, А. І. Мокій, О. Ф. Новікова, С. А. Романюк, В. І. Чужиков та ін.; за ред. З. С. Варна-лія. – К. : Знання України, 2005. – 498 с.

3. Захаров М. А. Региональная социальная политика в условиях ад-министративной реформы [Электронный ресурс] / М. А. Захаров // Из-вестия ВУЗов. Поволжский регион. Общественные науки. – 2007. – № 3. – С. 24–29. – Режим доступу: https://cyberleninka.ru/article/n/ regionalnaya-sotsialnaya-politika-v-usloviyah-administrativnoy-reformy.

4. Реутов В. Є. Закономірності і парадигми регіонального розвитку [Електронний ресурс] / В. Є. Реутов // Ефективна економіка : електрон-не наукове фахове видання. – 2010. – № 9. – С. 118–123. – Режим дос-тупу: http://www.economy.nayka.com.ua/?op=1&z=319.

5. Бешелев С. Д. Математико-статистические методы экспертных оценок / С. Д. Бешелев, Ф. Г. Гурвич. – М. : Статистика, 1980. – 263 с.

6. Гофман О. Г. Экспертное оценивание : учеб. пособие / О. Г. Го-фман. – Воронеж : Воронеж. гос. ун-т, 1991. – 152 с.

7. Литвак Б. Г. Экспертные оценки и принятие решений / Б. Г. Лит-вак. – М.: Патент, 1996. – 298 с.

8. Zadeh L. Fuzzy Sets // Information and Control. – 1965. – № 8. – P. 338–353.

9. Вітлінський В. В. Математичні моделі та методи ринкової еконо-міки: навч. посіб. / В. В. Вітлінський, О. В. Піскунова. – К.: КНЕУ, 2010.— 531 с.

10. Kovalchuk K. F. Intelligent Decision Support System // Proc. First Asian Fuzzy Systems Symposium (Singapore, November 23—26). – 1993. – P. 510–516.

Page 66: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

65

11. Матвійчук А. В. Штучний інтелект в економіці: нейронні мере-

жі нечітка логіка: монографія / А. В. Матвійчук. – К.: КНЕУ, 2011. —

439 с.

12. Тинякова В. И. Математичские методы обработки экспертной

информации / В. И. Тинякова. – Воронеж : Изд-во Воронеж. гос. ун-т,

2006. — 68 c.

13. Ольховська О. Л. Економіко-математична модель діагностики

банкрутства страхової компанії на основі нечіткої логіки / О. Л. Оль-

ховська // Моделювання та інформаційні системи в економіці. — К.:

КНЕУ, 2010. — № 81. — С. 59–74.

14. Mamdani E. H. Advances in the Linguistic Synthesis of Fuzzy

Controller / E. H. Mamdani // International Journal Man-Machine Studi-

es. — 1976. — Vol. 8. — P. 669—678.

15. Шарапов О. Д. Оцінювання можливого банкрутства на основі

індикаторів фінансового стану кампаній з використанням нейронних

мереж зустрічного розповсюдження / О. Д. Шарапов, Д. Б. Кайдано-

вич // Нейро-нечіткі технології моделювання в економіці. — 2012. —

№ 1. — С. 207–227.

16. Shtovba S. Prediction of Competitive Position of Brand Product by

Fuzzy Knowledge Base / S. Shtovba, O. Shtovba // Journal of Automation

and Information Sciences. — 2006. — № 8. — P. 69–80.

17. Максишко Н. К. Оцінювання системних характеристик еконо-

мічної динаміки на базі результатів комплексного фрактального ана-

лізу / Н. К. Максишко // Вісник Запорізького національного універси-

тету: зб. наук. праць. Економічні науки. — 2011. — № 2 (10). —

С. 119–130.

18. Kohonen T. Self-organization and associative memory / T. Kohonen. —

Springer–Verlag, 1989. — 312 p. References

1. Boguslavska, S. I., & Potapenko, L. V. (2013). Sotsialna politika v

umovah rinkovih vidnosin. Finansoviy prostir (Financial space), 2, 106–

110. Retrieved from: http://nbuv.gov.ua/j-pdf/Fin_pr_2013_2_14.pdf [in

Ukrainian].

2. Varnalyy, Z. S. (2005). Regioni Ukrayini: problemi ta prioriteti sotsialno-ekonomichnogo rozvitku. Kyiv, Ukraine: Znannya Ukrayiny [in

Ukrainian].

Page 67: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

66

3. Zaharov, M. A. (2007). Regionalnaya sotsialnaya politika v usloviyah

administrativnoy reformyi. Izvestiya VUZov. Povolzhskiy region. Obschest-vennyie nauki (Proceedings of the universities. Volga region. Social sciences), 3, 24–29. Retrieved from: https://cyberleninka.ru/article/

n/regionalnaya-sotsialnaya-politika-v-usloviyah-administrativnoy-reformy

[in Russian].

4. Reutov, V. E. (2010). Zakonomirnosti i paradigmi regionalnogo

rozvitku. Efektivna ekonomika: elektronne naukove fahove vidannya (Effective economy: electronic scientific professional edition), 9, 118–123.

Retrieved from: http://www.economy.nayka.com.ua/?op=1&z=319 [in

Ukrainian].

5. Beshelev, S. D., & Gurvich, F. G. (1980). Matematiko-statisticheskie metodyi ekspertnyih otsenok. Moscow, Russia: Statistika [in Russian].

6. Gofman, O. G. (1991). Ekspertnoe otsenivanie. Voronezh, Russia: Voronezh. gos. un-t [in Russian].

7. Litvak, B. G. (1996). Ekspertnyie otsenki i prinyatie resheniy. Moscow, Russia: Patent [in Russian].

8. Zadeh, L. (1965). Fuzzy Sets. Information and Control, 8, 338–353. 9. Vitlins’kyy, V. V., & Piskunova, O. V. (2010). Matematichni modeli

ta metodi rinkovoyi ekonomiki. Kyiv, Ukraine: KNEU [in Ukrainian]. 10. Kovalchuk, K. F. (1993, November 23—26). Intelligent Decision

Support System. Proc. First Asian Fuzzy Systems Symposium (Singapore), 510–516.

11. Matviychuk, A. V. (2011). Shtuchniy Intelekt v ekonomitsi: neyronni merezhi nechitka logika. Kyiv, Ukraine: KNEU [in Ukrainian].

12. Tinyakova,V. I. (2006). Matematichskie metodyi obrabotki ekspertnoy informatsii. Voronezh : Izd-vo Voronezh. gos. un-t [in

Russian].

13. Olhovska, O. L. (2010). Ekonomiko–matematichna model

diagnostiki bankrutstva strahovoyi kompaniyi na osnovi nechitkoyi logiki.

Modelyuvannya ta informatsiyni sistemi v ekonomitsi (Modeling and Information Systems in Economics), 81, 59–74 [in Ukrainian].

14. Mamdani, E. H. (1976). Advances in the Linguistic Synthesis of Fuzzy Controller. International Journal Man-Machine Studies, 8, 669—678.

15. Sharapov, O. D., & Kaidanovich, D. B. (2012). Otsinyuvannya

mozhlivogo bankrutstva na osnovi indikatoriv fInansovogo stanu kampaniy z vikoristannyam neyronnih merezh zustrichnogo rozpovsyudzhennya. Neyro–nechitki tehnologіyi modelyuvannya v ekonomitsi (Neuro-fuzzy modeling techniques in economics), 1, 207–227 [in Ukrainian].

Page 68: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оцінювання внутрішньорегіональної диференції на засадах… Т. І. Єфанова

67

16. Shtovba, S., & Shtovba, О. (2006). Prediction of Competitive

Position of Brand Product by Fuzzy Knowledge Base. Journal of Automation and Information Sciences, 8, 69–80.

17. Maksishko, N. K. (2011). Otsinyuvannya sistemnih harakteristik

ekonomichnoyi dinamiki na bazi rezultativ kompleksnogo fraktalnogo

analizu. Visnik Zaporizkogo natsionalnogo universitetu. Ekonomichni nauki (Bulletin of the Zaporizhzhya National University. Economic Sciences), 2(10), 119–130 [in Ukrainian].

18. Kohonen, T. (1989). Self-organization and associative memory.

New-York: Springer–Verlag.

Стаття надійшла до редакції 5.05.2017.

Page 69: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

330.47:519

ОЦЕНКА ДОВЕРИЯ: ТЕОРЕТИЧЕСКИЕ МОДЕЛИ И РЕЗУЛЬТАТЫ ЭМПИРИЧЕСКОГО

ИССЛЕДОВАНИЯ НА ПРИМЕРЕ СОЦИАЛЬНЫХ СЕТЕЙ

Е. Ю. Кононова Доктор экономических наук, доцент,

доцент кафедры экономической кибернетики и прикладной экономики Харьковский национальный университет им. В.Н. Каразина

площадь Свободы, 4, г. Харьков, 61022, Украина [email protected]

В условиях перехода к е-обществу количество ежедневно генери-руемой информации растет стремительными темпами, при этом оценивать ее качество и достоверность становится все сложнее. Это ведет к формированию повышенного спроса на методы и мо-дели оценки доверия как к источникам информации, так и к самой информации. К понятию доверия в последние годы обращались ученые из различных научных сфер – психологии, социологии, эко-номики, информатики. Однако, несмотря на растущее количество научных публикаций в данном направлении, исследования остают-ся фрагментарными и не дают целостного представления об осо-бенностях формирования и распространения доверия в обществе. Новое междисциплинарное направление – анализ данных социаль-ных медиа, в рамках которого исследуются профили и поведение пользователей онлайновых социальных сетей, – охватывает такие области как машинное обучение, искусственный интеллект, ви-зуализация данных, алгоритмы поиска информации, лингвисти-ка и масштабные вычисления. Принимая во внимание тот факт, что пользователями социальных сетей сегодня является более четверти населения планеты, социальные данные представляют собой репрезентативный срез общества и могут составить осно-ву для построения и верификации моделей оценки доверия. Целью исследования является проверка теоретических предполо-жений моделей оценки доверия на основе анализа поведения поль-зователей и структуры социальных сетей. В статье проанализиро-вано распределение пользователей, их сообщений, друзей и групп, описаны нетипичные примеры. В результате кластеризации пользователей идентифицированы типы их поведения: выявле-ны кластера «писателей», «распространителей» информации и ее потребителей – «читателей», а также кластер «малоактивных» пользователей. Анализ кластеров показал, что зачастую генерато-ры контента не являются основным каналом распространения ин-формации, что противоречит теоретическим предположениям мо-дели оценки доверия. Однако исследование структуры неявных связей между агентами свидетельствует в пользу гипотезы о том, что наиболее активно пишущие пользователи имеют наибольшее число контактов и пользуются наибольшим доверием. Ключевые слова: онлайновые социальные сети (ОСС), модели оценки доверия, типы поведения пользователей, карты Кохонена, структура сети, графовые модели.

© К. Ю. Кононова, 2017 68

Page 70: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оценка доверия: теоретические модели… Е. Ю. Кононова

69

ОЦІНКА ДОВІРИ: ТЕОРЕТИЧНІ МОДЕЛІ ТА РЕЗУЛЬТАТИ ЕМПІРИЧНОГО

ДОСЛІДЖЕННЯ НА ПРИКЛАДІ СОЦІАЛЬНИХ МЕРЕЖ

К. Ю. Кононова Доктор економічних наук, доцент,

доцент кафедри економічної кібернетики та прикладної економіки

Харківський національний університет ім. В.Н. Каразіна площа Свободи, 4, м Харків, 61022, Україна

[email protected]

В умовах переходу до е-суспільства кількість інформації, що ге-нерується щодня, зростає швидкими темпами, при цьому оціню-вати її якість і достовірність стає все складніше. Це веде до фор-мування підвищеного попиту на методи та моделі оцінки довіри як до джерел інформації, так і до самої інформації. До поняття довіри останніми роками зверталися вчені з різних наукових сфер – психології, соціології, економіки, інформатики. Однак, не-зважаючи на зростаючу кількість наукових публікацій у даному напрямку, дослідження залишаються фрагментарними та не да-ють цілісного уявлення про особливості формування та поши-рення довіри в суспільстві. Новий міждисциплінарний напрямок – аналіз даних соціальних ме-діа, в рамках якого досліджуються профілі та поведінка користува-чів онлайнових соціальних мереж, – охоплює такі області як ма-шинне навчання, штучний інтелект, візуалізація даних, алгоритми пошуку інформації, лінгвістика та масштабні обчислення. Беручи до уваги той факт, що користувачами соціальних мереж сьогодні є понад чверть населення планети, соціальні дані представляють со-бою репрезентативний зріз суспільства та можуть скласти основу для побудови та верифікації моделей оцінки довіри. Метою дослідження є перевірка теоретичних гіпотез моделей оцінки довіри на основі аналізу поведінки користувачів і струк-тури соціальних мереж. У статті проаналізовано розподіл корис-тувачів, їх повідомлень, друзів і груп, описані нетипові приклади. В результаті кластеризації користувачів ідентифіковані типи їх поведінки: виявлено кластери «письменників», «розповсюджу-вачів» інформації та її споживачів – «читачів», а також кластер «малоактивних» користувачів. Аналіз кластерів показав, що най-частіше генератори контенту не є основним каналом поширення інформації, що суперечить теоретичним припущенням моделі оцінки довіри. Однак дослідження структури неявних зв’язків між агентами свідчить на користь гіпотези про те, що ті користу-вачі, які найбільш активно пишуть, мають найбільше число кон-тактів і користуються найбільшою довірою.

Ключові слова: онлайнові соціальні мережі (ОСМ), моделі оцінки довіри, типи поведінки користувачів, карти Кохонена, структура мережі, графові моделі.

Page 71: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

70

TRUST EVALUATION: THEORETICAL MODELS AND RESULTS OF EMPIRICAL RESEARCH ON SOCIAL NETWORKS

Kateryna Kononova

Doctor of Economics, Docent, Associate Professor of Department

of Economic Cybernetics and Applied Economics

V.N. Karazin Kharkiv National University 4 Svobody Sq., Kharkiv, 61022, Ukraine

[email protected]

The amount of daily generated information is growing at a catas-trophic rate while assessing its quality and reliability becomes more and more difficult. This leads to an increase in demand for methods and models of trust evaluation both to sources of information and to information itself. Scientists from various fields – psychology, sociology, economics, and computer science – dealt with the concept of trust in recent years. However, despite the growing number of scientific publications in this field, the relevant studies are fragmented and there is not yet a holistic understanding of the topic. A new interdisciplinary area – Social Media Mining, which studies social networks structures, users’ profiles and their behavior, spans areas such as machine learning, graph mining, information retrieval, knowledge-based systems, linguistics, common-sense reasoning, natural language processing and big data computing. Taking into account the fact that more than a quarter of the world population are users of several online social networks, social data are fully representative cross-section of society and can be the basis for the design and verification of trust models. The purpose of the study is to examine the theoretical assumptions of trust models based on an analysis of users behavior and the structure of social networks. The article examines the distribution of users, their messages, friends and groups, describes atypical examples. Users clustering allowed identifying the types of their posting behavior: identified the clusters of “writers”, “distributors” of information and its consumers – “readers”, as well as a cluster of “low-active” users. Analysis of clusters showed that content generators are not the main channel for diffusion of information, which contradicts the theoretical assumptions of trust model. However, a study of the implicit relationships structure confirms the hypothesis that “writers” have the largest number of contacts and are most trusted. Key words: online social network (OSN), trust evaluation model, users posting behavior, Kohonen map, network structure, graph model.

JEL Classification: C45, С81, D85

Page 72: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оценка доверия: теоретические модели… Е. Ю. Кононова

71

Введение

В результате развития информационных технологий сегодня более 80 % населения развитых стран имеют доступ в интернет. Сеть стала новой площадкой для делового и дружеского обще-ния, основным источником политических, культурных и научных новостей, средством осуществления коммерческих сделок и вза-имодействия с органами государственной власти.

В основе успешного взаимодействия между агентами сети лежит доверие между сторонами. Однако, если раньше оно бази-ровалось на легко проверяемой информации (в условиях, когда информационные потоки были относительно скудными, выводы можно было сделать на основе физического контакта, перепрове-рить информацию через третьих лиц), сегодня верификация вхо-дящей информации становится все более и более сложной зада-чей, все труднее становится принимать решения о том, каким источникам доверять, а каким – нет. Таким образом, в последние 10–15 лет сформировался новый спрос на методы анализа инфор-мации и механизмы формирования доверия. Он породил предло-жение со стороны научного сообщества, понятие доверия исследо-валось в психологии, социологии, экономике, информатике.

Анализ данных социальных медиа, в рамках которого иссле-дуются профили и поведение пользователей социальных сетей, также вырос из этой новой потребности. Он сочетает в себе такие дисциплины, как структурный анализ сетей, управление мульти-медиа, аналитика социальных медиа, анализ трендов и мнений, машинное обучение, искусственный интеллект, визуализация данных, алгоритмы поиска информации, теория систем, основан-ных на знаниях, лингвистика и масштабные вычисления. Учиты-вая, что более четверти населения планеты являются пользовате-лями онлайновых социальных сетей (число агентов Facebook превысило два миллиарда), можно утверждать, что накоплен-ные (и регулярно обновляемые) социальные данные о предпоч-тениях и поведении пользователей могут выступать основой для построения и верификации моделей оценки доверия, анализа процессов его формирования и распространения.

Понятие, свойства и типы доверия

Понятие доверия исследовалось в различных науках. В психо-логии под доверием понимается состояние агента, когда доверя-

Page 73: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

72

ющий принимает риск на основании позитивных ожиданий отно-сительно намерений доверителя [4, 28, 29, 31]. В социологии и экономике доверие определяется как субъективное ожидание до-веряющего относительно будущего поведения доверителя [9, 23, 24]. В информатике доверие рассматривается с точки зрения «пользователя» и «системы» [22].

Во всех дисциплинах отношение доверия имеет два важных аспекта: риск и взаимозависимость [8, 28, 37]. Источником риска является неопределенность в отношении намерений другой сто-роны. Взаимозависимость обусловлена тем, что интересы обеих сторон связаны и не могут быть достигнуты без полагания друг на друга. Кроме того, доверие имеет следующие свойства:

зависимость от контекста, динамичность – доверие может увеличиться или умень-

шаться с новым опытом (основанном на результатах взаимодейс-твий или наблюдений) [32],

распространяемость – аналогично феномену распростра-нения информации «из уст в уста» [1],

нетранзитивность – потеря достоверности заключений вследствие увеличения их информативности [39],

комбинаторность – возможность формирования доверия на основе мнений различных агентов, зачастую напрямую не свя-занных с данным,

субъективность, асимметричность – один агент может доверять другому

больше, чем второй доверяет первому, самоусиление (положительная обратная связь) – агенты

склонны к усилению взаимодействия с теми, кому они уже доверяют, чувствительность – доверие требует много времени для

формирования, но достаточно одного негативного события, что-бы его полностью уничтожить [24].

Шерхан [21] рассматривает следующие типы доверия: расчетное доверие (на основе дилеммы заключенного)

определяется исходя из предположения о максимизации выгоды доверителя [36];

реляционное доверие формируется в результате повторных взаимодействий между доверителем и доверяющим;

эмоциональное доверие возникает в результате ощущения безопасности и комфорта в отношении доверителя [15];

Page 74: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оценка доверия: теоретические модели… Е. Ю. Кононова

73

когнитивное доверие основывается на рациональном пове-дении агентов [15],

институциональное доверие обеспечивает среду, которая поощряет сотрудничество между членами и наказывает «безби-летников» [17],

диспозициональное доверие основано на предположении, что в течение жизни человек развивает обобщенные ожидания относительно достоверности поведения других людей [28].

Опыт моделирования доверия

Для моделирования доверия используются статистические и эвристические методы, методы машинного обучения и анализа поведения агентов. С использованием статистических методов для оценивания доверия разработаны модели на основе байесов-ских систем [14, 23], в рамках машинного обучения – модели ис-кусственных нейронных сетей и сетей Маркова [21, 31]. Эврис-тические модели использовались для оценки репутации агентов [13]. В поведенческих моделях рассмотрены характер взаимодей-ствия и способы распространения информации [1].

Для исследования доверия в социальных сетях разработаны модели на основе: 1) структуры сети (графовые модели), 2) пове-дения агентов, 3) гибридные модели.

Графовые модели, как правило, основаны на концепции «сети доверия» или FOAF (friend-of-a-friend) [10]. Также на основе структуры сети разрабатывались гравитационные модели дове-рия [20]. В графовой модели доверия Баскенса [7] рассматрива-лась гипотеза, что создатели контента имеют более высокий уро-вень доверия.

Для прогнозирования доверия Лиу предложил использовать шаблоны поведения пользователей [18]. Непал [25] разработал модель, в которой оценка доверия проводится на основе популя-рности (числа друзей) и участия (как часто агент посещает сайты, сколько сообщений он читает и комментирует). Адали [1] оцени-вал доверие на основе следующих факторов: общение (насколько долго и/или как часто два агента взаимодействуют друг с другом) и распространение (передается ли информация, полученная от одного агента, к другим).

Кроме того, в рамках этого направления исследовались вопро-сы создания и распространения информации. Ранние работы бы-

Page 75: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

74

ли сфокусированы на поведении пользователей в блогах и изуча-ли информационные эпидемии с использованием классической модели диффузии инноваций. Кумар [16] исследовал «взрывной характер» блогов, анализируя эволюционирующую структуру ссылок. Грюль [11] изучал проблему распространения тем из блога в блог, основываясь на анализе текстов, а не гиперссылок. Гуо [12] выявил ежедневные и еженедельные шаблоны поведе-ния, исследуя две группы пользователей – активных и пассив-ных. Бамсук [6] также исследовал временные характеристики по-ведения агентов, сравнивая блогосферу и Twitter, коммерческие и некоммерческие блоги. Папагелис [17] анализировал связь между индивидуальным поведением и социальным влиянием. Лю [13] прогнозировал поведение пользователя на основе анализа кли-ков, Сюй [21] – на основе «горячих» новостей, репостов друзей и интересов пользователя, указанных в профиле. Роман [27] пред-ложил стохастическую модель, основанную на психологии при-нятия решений.

В гибридных моделях доверия рассматриваются оба аспекта – и структура графа, и взаимодействия внутри сети. В таких моде-лях оценка явного доверия делается на основе сетевой структуры, тогда как оценка неявного доверия – на основе взаимодействий пользователя в сети. В рамках данного подхода Трифуновичем [34] предложена модель оппортунистической сети.

Цель и задачи исследования В данной работе использован гибридный подход. Однако при

разработке моделей мы будем исходить, в первую очередь, не из теоретических предположений, а из структуры и содержания данных.

Целью исследования является проверка теоретических пре-дположений моделей доверия на основе анализа поведения пользователей и структуры онлайновой социальной сети. Для ее достижения в работе были поставлены и решены следующие задачи:

проанализировать профили пользователей социальной сети, проживающих в целевом регионе, а также контент, ими генери-руемый;

Page 76: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оценка доверия: теоретические модели… Е. Ю. Кононова

75

выявить пользователей, проявляющих активность в рамках определенной тематики;

определить типы поведения этих пользователей; исследовать связи между пользователями; оценить уровень доверия к тематическому контенту и гру-

ппам пользователей, его формирующим.

Сбор и подготовка данных Исследование построено на основе анализа 248 тыс. профилей

пользователей одной из самых популярных (до недавнего време-ни) в отечественном сегменте социальных сетей «ВКонтакте», а также контенте – сообщениях и комментариях – этих пользовате-лей. Собранная база данных включает следующие записи:

идентификатор пользователя; список друзей пользователя; список групп, в которых состоит пользователь; открытые сообщения пользователя (посты и комментарии). На первом этапе исследования набор данных был очищен от

неинформативных сообщений: которые не содержали текстовой информации (а лишь ссыл-

ки, изображения, аудио и т. п.); язык которых не соответствовал анализируемому (для иден-

тификации постов на русском языке использовалась библиотека poliglot языка python).

Затем, используя модуль tokenizer библиотеки nltk python, в сообщениях пользователей были выделены отдельные слова и удалены посторонние символы (знаки препинания, смайлики и т.п.). На основе библиотеки pymorphy2 слова были лемматизиро-ваны, все буквы в словах переведены в нижний регистр.

Частотные характеристики выборки После предварительной подготовки для каждого пользователя

были рассчитаны его характеристики и число постов на заданную тему. В результате была сформирована таблица следующего вида (табл. 1).

Page 77: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

76

Таблица 1

ФРАГМЕНТ ДАННЫХ БАЗЫ ВК

Идентификатор Число друзей

Число групп

Число постов

Число пос-тов

друзей

Число постов, тема 1

… Число

постов, тема 5

195269137 49 3 992 1439 138 61

187704426 53 10 949 62 109 39

17241807 193 1 925 593 95 20

35833523 332 1 789 726 82 13

906761 300 3 773 291 356 48

23419701 273 4 754 55 104 31

51258489 536 10 735 754 158 31

Распределение числа друзей пользователей сети описывается,

как и большинство распределений в Интернет [1], степенным за-коном, как показано на рис. 1. При этом более чем у четверти пользователей друзей нет, около трети имеет от пятидесяти до ста друзей, почти 7 % – тысячники.

Рис. 1. Распределение числа друзей пользователя

Page 78: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оценка доверия: теоретические модели… Е. Ю. Кононова

77

Анализ показал, что две трети пользователей подписаны не более чем на пять групп, из них более 40 % вообще не состоят в тематических группах.

Рис. 2. Распределение числа групп, в которых состоит пользователь

Распределение общего числа постов имеет очень длинный хвост, для анализа которого пользователи, написавшие более 50 000 постов, были сгруппированы в один бин. На рис. 3 видим, что около одного процента пользователей не написали ни одного поста за исследуемый период, примерно столько же написало бо-лее 50 тысяч. Оба числа свидетельствуют о нетипичном поведе-нии пользователей.

Рис. 3. Распределение общего числа постов пользователя

Page 79: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

78

При этом на заданную тему в течение исследуемого периода почти половина пользователей написали от 500 до 1000 постов, в то же время лишь чуть меньше 4 % не написали вообще ничего (рис. 4).

Рис. 4. Распределение числа тематических постов пользователя

Это распределение также имеет длинный хвост, анализ кото-рого показал, что примерно 5 % пользователей написали более двух тысяч тематических постов за исследуемый период, что вы-зывает подозрение об их ангажированности. Принимая во внима-ние, что некоторые пользователи размещали посты 5–10 раз в день, можно предположить, что эта деятельность являлась для них своеобразной работой.

Как показало предварительное исследование, часть пользова-телей имеет колоссальное количество друзей, некоторые состоят в большом числе групп, некоторые размещают большое число собственных постов или сообщений друзей. В связи с этим, а та-кже опираясь на теоретические предположения моделей оценки доверия, может быть поставлен ряд вопросов для достижения це-лей нашего исследования:

состоят ли в группах те пользователи, у кого много друзей; много ли друзей у тех, кто много пишет;

Page 80: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оценка доверия: теоретические модели… Е. Ю. Кононова

79

все ли темы создаются идентичным образом (например, за счет написания постов или ре-постов от друзей / из групп).

Для ответа на эти вопросы была проведена идентификация типов поведения пользователей ОСС.

Анализ типов поведения пользователей

Для выявления и описания типов поведения были использова-ны методы кластеризации (в частности карты Кохонена, позво-ляющие выявлять скрытые закономерности в данных).

В качестве параметров кластеризации были выбраны следу-ющие:

количество друзей; количество тематических постов; количество тематических групп, в которых состоит пользо-

ватель; количество тематических постов на стенах друзей пользо-

вателя. После серии экспериментов с фрагментом базы данных сети

ВКонтакте был получен набор карт, представленный на рис. 5.

Рис. 5. Набор карт Кохонена, описывающих поведение пользователей

Page 81: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

80

Анализ профилей представленных на рис. 5 кластеров (табл. 2) позволил описать следующие типы контент-поведения пользователей: «писатели», «распространители», «читатели» и «малоактивные».

Таблица 2 ТИПЫ ПОВЕДЕНИЯ ПОЛЬЗОВАТЕЛЕЙ, %

Кластер Число друзей

Число групп

Число постов

Число постов друзей

Писатели (7,2 %) 31 31 71 33

Распространители (8,3 %) 13 50 12 12

Читатели (13,4 %) 48 13 10 49

Малоактивные (71,1 %) 7 6 8 6

Рассмотрим особенности кластеров. Чуть более семи процен-тов пользователей составили кластер «писателей». Хотя этот кластер самый маленький, его участники генерируют основной контент по заданной тематике. Кроме того, они чаще других ос-тавляют комментарии.

Следующим по численности является кластер «распространи-телей» (около 8 %) – это пользователи с наибольшим количест-вом ре-постов из тематических групп. В отличие от других поль-зователей, у них мало друзей, они сосредоточены на сборе информации из тематических групп и ее дальнейшем распрост-ранении.

Среди людей, которые активно интересуются данной темой, наиболее многочисленным является кластер «читателей» (13 %), новостные ленты которых состоят из сообщений друзей. В отли-чие от «распространителей», они ориентированы скорее на пот-ребление информации, чем на ее распространение.

Хотя большинство пользователей ВКонтакте (более 70 %) оказались слабо заинтересованы в исследуемой тематике (они и писали, и читали, и ре-постили относительно редко), однако не-которую активность в рамках тематики они все же продемонст-рировали, отчего и попали в общий список. А значит, их можно рассматривать как потенциальную аудиторию.

Идентифицированные типы поведения графически представ-лены на рис. 6.

Page 82: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оценка доверия: теоретические модели… Е. Ю. Кононова

81

Рис. 6. Характеристики ядер кластеров

Анализ поведения пользователей показал, что у основных ге-нераторов контента, составивших кластер «писателей», не самое большое число друзей, что противоречит предположениям моде-лей оценки доверия. Поэтому для дальнейшего исследования бы-ло решено проанализировать граф связей пользователей.

Анализ структуры сети Для построения графа связей между пользователями были

протестированы следующие гипотезы: связь между пользователями есть, если они дружат между

собой в соцсетях (прямая связь), при этом сила связи определяет-ся количеством общих друзей;

связь между пользователями есть, если они имеют ненуле-вое количество общих друзей, но дружить друг с другом не обя-заны (связь через друзей).

После ряда экспериментов с разными видами связей установ-лено, что соединение типа «связь через друзей» является более информативной с точки зрения формирования групп: выделились неявные группы пользователей, соответствующие исследуемым темам. На рис. 7 представлены графы связей пользователей в ра-зрезе тем (рис. 7а) и кластеров (рис. 7б). Здесь размер маркера соответствует числу связей.

Page 83: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

82

а)

б)

Рис. 7. Графы связей пользователей в разрезе: а) тем, б) кластеров

Page 84: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оценка доверия: теоретические модели… Е. Ю. Кононова

83

Анализ структуры сети, в которой реализовано соединение «связь через друзей», показал, что в этом случае мы снимаем вы-явленное выше противоречие с моделью оценки доверия Баскен-са: действительно, при таком подходе вершины, соответствую-щие пользователям, составившим кластер «писателей», являются самыми значительными. Приведенная графовая модель позволяет выявить пользователей, пользующихся наибольшим доверием (пять центральных вершин графа).

Кроме того, на рис. 7 мы видим, что темы по кластерам расп-ределены неравномерно. Детальный анализ показал, что лишь малоактивные пользователи интересуются темой 2, что можно видеть на рис. 8. В целом, интерес к этой и пятой теме одинаково низок как со стороны «писателей», так и среди «читателей» и «распространителей».

Рис. 8. Тематический срез кластеров

Выводы

В работе предложен комплекс моделей оценки доверия на ос-нове анализа поведения пользователей и структуры онлайновых социальных сетей. В результате кластеризации агентов с исполь-зованием сетей Кохонена идентифицированы и описаны типы их поведения: выявлены кластера «писателей», «распространи-телей» информации и ее потребителей – «читателей», а также

Page 85: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

84

кластер «малоактивных» пользователей. Анализ показал, что хо-тя кластер «писателей» является самым малочисленным, именно эти пользователи генерируют основную часть контента. Однако, вопреки теоретическим предположениям модели оценки доверия, друзей у пользователей этого кластера не так много, как можно было бы ожидать. При этом, исследование структуры неявных контактов между агентами на основе графовой модели, в которой реализована «связь через друзей», свидетельствует в пользу ги-потезы о том, что «писатели» имеют наибольшее число контак-тов и пользуются наибольшим доверием. Анализ кластеров в ра-зрезе тем свидетельствует о неравномерном распределении активности пользователей и наводит на размышления об искус-ственно создаваемом интересе к некоторым из них. Этот вопрос нуждается в дальнейшем исследовании.

Литература 1. Abdul-Rahman A., Hailes S. Supporting trust in virtual communi-

ties // Proceedings of the 33rd Annual Hawaii International Conference on System Sciences. – Maui, Hawaii: IEEE Computer Society, 2000. – P. 1769–1777.

2. Adali S., Escriva R., Goldberg M. K., Hayvanovych M., Magdon-Ismail M., Szymanski B. K., Wallace W.A., Williams G. Measuring beha-vioral trust in social networks // Proceedings of the IEEE International Conference on Intelligence and Security Informatics. – 2010. – P. 150–152.

3. Adamiс L.A., Huberman B.A. Power-law distribution of the World Wide Web // Science. – 2000. – Vol. 287. – P. 2115–2115.

4. Beatty P., Reay I., Dick S., Miller J. Consumer trust in e-commerce web sites: A meta-study // ACM Computing Surveys. – 2011. – № 43. – Vol. 3. – P. 1–14.

5. Benevenuto F., Magno G., Rodrigues T., Almeida V. Detecting Spammers on Twitter [Електронний ресурс]. – Режим доступу : http://www.decom.ufop.br/fabricio/download/ceas10.pdf.

6. Bumsuk L. A temporal analysis of posting behavior in social media streams [Електронний ресурс]. – Режим доступу : http://www.aaai.org/ ocs/index.php/ICWSM/ICWSM12/paper/viewFile/4741/5094.

7. Buskens V. The social structure of trust // Social Networks. – 1998. – № 20. – Vol. 3. – P. 265–289.

8. Coleman J. S. Foundations of Social Theory. – Cambridge, MA: Belnap Press of Harvard University Press, 1990. – 993 p.

9. Dumouchel P. Trust as an action // European Journal of Sociology. – 2005. – № 46. – P. 417–428.

Page 86: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оценка доверия: теоретические модели… Е. Ю. Кононова

85

10. Golbeck J., Parsia B., Hendler J. Trust networks on the semantic web // Proceedings of the 7

th International Workshop on Cooperative

Intelligent Agents. – Helsinki, Finland, 2003. – P. 238–249. 11. Gruhl D., Guha R., Liben-Nowell D., Tomkins A. Information

diffusion through blogspace [Електронний ресурс]. – Режим доступу : http://people.csail.mit.edu/dln/papers/ blogs/idib.pdf.

12. Guo L., Tan E., Chen S., Zhang X., Zhao Y. Analyzing patterns of user content generation in online social networks [Електронний ресурс]. – Режим доступу : https://cs.gmu.edu/~sqchen/publications/kdd09.pdf.

13. Huynh T.D., Jennings N.R., Shadbolt N.R. Certified reputation: How an agent can trust a stranger // Proceedings of the 5th International Joint Conference on Autonomous Agents and Multiagent Systems. – NY: ACM Press, 2006. – P. 1217–1224.

14. Josang A., Ismail R. The beta reputation system // Proceedings of the 15th Bled Electronic Commerce Conference. – Bled, Slovenia, 2002. – P. 891–900.

15. Kuan H., Bock G. The collective reality of trust: An investigation of social relations and networks on trust in multi-channel retailers // Proceedings of the 13th European Conference on Information Systems. – Regensburg, Germany, 2005. – P. 1–8.

16. Kumar R., Novak J., Raghavan P., Tomkins A. On the bursty evolution of blogspace [Електронний ресурс]. – Режим доступу : http://www.disco.ethz.ch/lectures/fs12/ seminar/paper/Barbara/32.pdf.

17. Lewis J.D., Weigert A. Trust as a social reality // Social Forces. – 1985. – №63. – Vol. 4. – P. 967–985.

18. Liu H., Lim E.-P., Lauw H.W., Le M.-T., Sun A., Srivastava J., Kim Y.A. Predicting trusts among users of online communities: An epinions case study // Proceedings of the 9th ACM Conference on Electronic Commerce. – New York: ACM Press, 2008. – P. 310–319.

19. Liu J., Dolan P., Pedersen E.R. Personalized news recommendation based on click behavior [Електронний ресурс]. – Режим доступу : http://cs.northwestern.edu/~jli156/IUI224-liu.pdf.

20. Maheswaran M., Tang H.C., Ghunaim A. Towards a gravity-based trust model for social networking systems // Proceedings of the 27th international conference on distributed computing systems workshops. – Washington, DC: IEEE Computer Society, 2007. – P. 24.

21. Malik Z., Akbar I., Bouguettaya A. Web services reputation assessment using a hidden markov model // Proceedings of the 7th International Joint Conference on Service-Oriented Computing. – 2009. – P. 576–591.

22. Marsh S.P. Formalising trust as a computational concept: PhD Thesis. – Stirling, UK: University of Stirling. – 1994.

23. Mui L. Computational models of trust and reputation: Agents, evolu-tionary games, and social networks [Електронний ресурс].– Режим доступу: http://groups.csail.mit.edu/medg/people/lmui/docs/phddissertation.pdf.

Page 87: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

86

24. Nepal S., Sherchan W., Bouguettaya A. A behavior based trust model for service web // IEEE Conference on Service-Oriented Computing and Applications. – 2010. – P. 1–4.

25. Nepal S., Sherchan W., Paris C. STrust: A trust model for social networks // Proceedings of the 10th IEEE International Conference on Trust, Security and Privacy in Computing and Communications. – 2011. – P. 841–846.

26. Papagelis M., Murdock V., van Zwol R. Individual behavior and social influence in online social systems [Електронний ресурс]. – Режим доступу : http://www.cs.toronto.edu/~papaggel/docs/papers/all/HT11-Individual-Behavior-and-Social-Influence-in-Online-Social-Systems.pdf.

27. Roman P. E., Gutierrez M.E., Rios S.A. A model for content generation in On-line social network [Електронний ресурс]. – Режим доступу : https://www.researchgate.net/publication/233897861.

28. Rotter J. B. A new scale for the measurement of interpersonal trust // Journal Personality. – 1967. – № 35. – Vol. 4. – P. 651–665.

29. Rousseau D. M., Sitkin S. B., Burt R. S., Camerer C. Not so different after all: A cross-discipline view of trust // Academy Management Review. – 1998. – Vol. 23. – No. 3. – P. 393–404.

30. Sherchan W., Nepal S., Paris C. A Survey of trust in social networks [Електронний ресурс] // ACM Computing Surveys. – 2013. – Vol. 45. – No. 4. – P. 47:1–47:33. – Режим доступу : http://people.cs.vt.edu/~irchen/ 5984/pdf/Sherchan-acm-CSUR13.pdf.

31. Song W., Phoha V. V., Xu X. The hmm-based model for evaluating recommender’s reputation // Proceedings of the IEEE International Conference on E-Commerce Technology for Dynamic E-Business. – 2004. – P. 209–215.

32. Staab S., Bhargava B., Lilien L., Rosenthal A., Winslett M., Slo-man M., Dillon T. S., Chang E., Hussain F. K., Nejdl W., Olmedilla D., Kashyap V. The pudding of trust: Managing the dynamic nature of trust // IEEE Intelligent Systems. – 2004. – Vol. 19. – Is. 5. – P. 74–88.

33. Sztompka P. Trust: A Sociological Theory. – Cambridge: Cambridge University Press, 1999. – 214 p.

34. Trifunovic S., Legendre F., Anastasiades C. Social trust in opportunistic networks // Proceedings of the INFOCOM IEEE Conference on Computer Communications Workshops. – 2010. – P. 1–6.

35. Tyler T. R. Why People Obey the Law. – New Haven, CT: Yale University Press, 1990. – 256 p.

36. Tyler T. R., Degoey P. Trust in organizational authorities: The influ-ence of motive attributions on willingness to accept decisions // Trust in Orga-nizations: Frontiers of Theory and Research / R. M. Kramer and T. R. Tyler, Eds. – Thousand Oaks, CA: Sage Publications, 1996. – P. 331–356.

37. Williamson O. E. Calculativeness, trust and economic organization // Journal of Law and Economics. – 1993. – № 30. – Is. 1. – P. 131–145.

Page 88: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оценка доверия: теоретические модели… Е. Ю. Кононова

87

38. Xu Z., Zhang Y., Wu Y., Yang Q. Modeling User Posting Behavior on Social Media [Електронний ресурс]. – Режим доступу : http://yaowu.co/docs/sigir12.pdf.

39. Yu B., Singh M. P. A social mechanism for reputation management in electronic communities // Proceedings of the 4th International Workshop on Cooperative Information Agents. – 2000. – P. 154–165.

References

1. Abdul-Rahman, A., & Hailes, S. (2000, January 7). Supporting trust in virtual communities. Proceedings of the 33rd Annual Hawaii Internation-al Conference on System Sciences (Maui, Hawaii: IEEE Computer Society), 1769–1777. DOI: 10.1109/HICSS.2000.926814

2. Adali, S., Escriva, R., Goldberg, M. K., Hayvanovych, M., Magdon-Ismail, M., Szymanski, B. K., Wallace, W.A., & Williams, G. (2010). Mea-suring behavioral trust in social networks. Proceedings of the IEEE Interna-tional Conference on Intelligence and Security Informatics, 150–152.

3. Adamiс, L.A., & Huberman, B.A. (2000). Power-law distribution of the World Wide Web. Science, 287, 2115–2115.

4. Beatty, P., Reay, I., Dick, S., & Miller, J. (2011). Consumer trust in e-commerce web sites: A meta-study. ACM Computing Surveys, 43(3), 1–14.

5. Benevenuto, F., Magno, G., Rodrigues, T., & Almeida, V. (2010). Detecting Spammers on Twitter. Retrieved from http://www.decom.ufop.br/ fabricio/download/ceas10.pdf.

6. Bumsuk, L. (2012). A temporal analysis of posting behavior in social media streams. Retrieved from http://www.aaai.org/ocs/index.php/ICWSM/ ICWSM12/paper/viewFile/4741/5094.

7. Buskens, V. (1998). The social structure of trust. Social Networks, 20(3), 265–289.

8. Coleman, J. S. (1990). Foundations of Social Theory. Cambridge, MA: Belknap Press of Harvard University Press.

9. Dumouchel, P. (2005). Trust as an action. European Journal of Sociology, 46, 417–428.

10. Golbeck, J., Parsia, B., & Hendler, J. (2003, August 27–29). Trust networks on the semantic web. Proceedings of the 7

th International

Workshop on Cooperative Intelligent Agents (Helsinki, Finland), 238–249. 11. Gruhl, D., Guha, R., Liben-Nowell, D., & Tomkins, A. (2004).

Information diffusion through blogspace. Retrieved from http://people.csail. mit.edu/dln/papers/ blogs/idib.pdf.

12. Guo, L., Tan, E., Chen, S., Zhang, X., & Zhao, Y. (2009). Analyzing patterns of user content generation in online social networks. Retrieved from https://cs.gmu.edu/~sqchen/publications/kdd09.pdf.

13. Huynh, T.D., Jennings, N.R., & Shadbolt, N.R. (2006). Certified reputation: How an agent can trust a stranger. Proceedings of the 5th

Page 89: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

88

International Joint Conference on Autonomous Agents and Multiagent Systems (New York), 1217–1224.

14. Josang, A., & Ismail, R. (2002, June 17–19). The beta reputation system. Proceedings of the 15th Bled Electronic Commerce Conference (Bled, Slovenia), 891–900.

15. Kuan, H., & Bock, G. (2005, May 26–28). The collective reality of trust: An investigation of social relations and networks on trust in multi-channel retailers. Proceedings of the 13th European Conference on Information Systems (Regensburg; Germany), 1–8.

16. Kumar, R., Novak, J., Raghavan, P., & Tomkins, A. (2003). On the bursty evolution of blogspace. Retrieved from http://www.disco.ethz.ch/ lectures/fs12/ seminar/paper/Barbara/32.pdf.

17. Lewis, J. D., & Weigert, A. (1985). Trust as a social reality. Social Forces, 63(4), 967–985.

18. Liu, H., Lim, E.-P., Lauw, H.W., Le, M.-T., Sun, A., Srivastava, J., & Kim, Y.A. (2008). Predicting trusts among users of online communities: An epinions case study. Proceedings of the 9th ACM Conference on Electronic Commerce (New York), 310–319.

19. Liu, J., Dolan, P., & Pedersen, E. R. (2010). Personalized news recommendation based on click behavior. Retrieved from http://cs.northwestern.edu/~jli156/IUI224-liu.pdf.

20. Maheswaran, M., Tang, H.C., & Ghunaim, A. (2007). Towards a gravity-based trust model for social networking systems. Proceedings of the 27th international conference on distributed computing systems workshops (Washington, DC), 24.

21. Malik, Z., Akbar, I., & Bouguettaya, A. (2009). Web services reputation assessment using a hidden markov model. Proceedings of the 7th International Joint Conference on Service-Oriented Computing, 576–591.

22. Marsh, S.P. (1994). Formalising trust as a computational concept. PhD thesis. Stirling, UK: University of Stirling.

23. Mui, L. (2003). Computational models of trust and reputation: Agents, evolutionary games, and social networks. Retrieved from http://groups.csail.mit.edu/medg/people/lmui/docs/phddissertation.pdf.

24. Nepal, S., Sherchan, W., & Bouguettaya, A. (2010, December 13–15). A behavior based trust model for service web. IEEE Conference on Service-Oriented Computing and Applications, 1–4.

25. Nepal, S., Sherchan, W., & Paris, C. (2011). STrust: A trust model for social networks. Proceedings of the 10th IEEE International Conference on Trust, Security and Privacy in Computing and Communications, 841–846.

26. Papagelis, M., Murdock, V., & van Zwol, R. (2011). Individual behavior and social influence in online social systems. Retrieved from http://www.cs.toronto.edu/~papaggel/docs/papers/all/HT11-Individual-Behavior-and-Social-Influence-in-Online-Social-Systems.pdf.

Page 90: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Оценка доверия: теоретические модели… Е. Ю. Кононова

89

27. Roman, P. E., Gutierrez, M. E., & Rios, S. A. (2012). A model for content generation in On-line social network. Retrieved from https://www.researchgate.net/publication/233897861.

28. Rotter, J.B. (1967). A new scale for the measurement of interpersonal trust. Journal Personality, 35(4), 651–665.

29. Rousseau, D. M., Sitkin, S. B., Burt, R. S., & Camerer, C. (1998). Not so different after all: A cross-discipline view of trust. Academy Management Review, 23(3), 393–404.

30. Sherchan, W., Nepal, S., & Paris, C. (2013, August). A Survey of trust in social networks. ACM Computing Surveys, 45(4). DOI: http://dx.doi.org/10.1145/2501654.2501661

31. Song, W., Phoha, V.V., & Xu, X. (2004). The hmm-based model for evaluating recommender’s reputation. Proceedings of the IEEE International Conference on E-Commerce Technology for Dynamic E-Business, 209–215.

32. Staab, S., Bhargava, B., Lilien, L., Rosenthal, A., Winslett, M., Sloman, M., Dillon, T. S., Chang, E., Hussain, F. K., Nejdl, W., Olmedilla, D., & Kashyap, V. (2004). The pudding of trust: Managing the dynamic nature of trust. IEEE Intelligent Systems, 19(5), 74–88.

33. Sztompka, P. (1999). Trust: A Sociological Theory. Cambridge, UK: Cambridge University Press.

34. Trifunovic, S., Legendre, F., & Anastasiades, C. (2010). Social trust in opportunistic networks. Proceedings of the INFOCOM IEEE Conference on Computer Communications Workshops, 1–6.

35. Tyler, T. R. (1990). Why People Obey the Law. New Haven, CT: Yale University Press.

36. Tyler, T. R., & Degoey, P. (1996). Trust in organizational authorities: The influence of motive attributions on willingness to accept decisions. In Trust in Organizations: Frontiers of Theory and Research. (pp. 331–356). Thousand Oaks, CA: Sage Publications.

37. Williamson, O.E. (1993). Calculativeness, trust and economic organization. Journal of Law and Economics, 30(1), 131–145.

38. Xu, Z., Zhang, Y., Wu, Y., & Yang, Q. (2012). Modeling User Posting Behavior on Social Media. Retrieved from http://yaowu.co/docs/ sigir12.pdf.

39. Yu, B., & Singh, M. P. (2000). A social mechanism for reputation management in electronic communities. Proceedings of the 4th International Workshop on Cooperative Information Agents, 154–165.

Стаття надійшла до редакції 12.04.2017

Page 91: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

УДК: 004.89:519.816

МОДЕЛЮВАННЯ ІННОВАЦІЙНИХ ІНТЕЛЕКТУАЛЬНИХ СИСТЕМ ПРИЙНЯТТЯ РІШЕНЬ В ЕКОНОМІЦІ

Ю. Г. Лисенко

Доктор економічних наук, професор, член-кореспондент НАНУ, директор Навчально-наукового інституту

«Інноваційні технології управління»

Вищий навчальний заклад Укоопспілки «Полтавський університет економіки і торгівлі»

вул. Коваля, 3, м. Полтава, 36014, Україна [email protected]

О. Ю. Мінц Кандидат економічних наук, доцент,

докторант кафедри фінансів і банківської справи

Державний вищий навчальний заклад «Приазовський державний технічний університет»

вул. Університетська, 7, м. Маріуполь, 87500, Україна [email protected]

У статті систематизовано та розширено теоретико-методологічні засади процесів синтезу інноваційних інтелектуальних систем прийняття рішень. Визначено концептуальні підходи до застосу-вання методів інтелектуальних обчислень для моделювання систем прийняття рішень. Запропоновано класифікацію мето-дів інтелектуальних обчислень і класифікацію задач з аналізу та обробки даних. Розглянуто методологічні підходи до реалізації процесів спостереження, моделювання, ідентифікації та оцінки ефективності результатів моделювання інноваційних інтелекту-альних систем прийняття рішень в економіці. Предметом дослідження є методологія моделювання інновацій-них інтелектуальних систем прийняття рішень в економіці. Метою дослідження є формалізація процесів синтезу інновацій-них інтелектуальних систем прийняття рішень для підвищення ефективності функціонування суб’єктів економічної діяльності. Результати дослідження дозволяють підвищити ефективність роботи із слабко структурованою інформацією, а також якість прийняття управлінських рішень в умовах невизначеності.

Ключові слова: інтелектуальні обчислення, інтелектуальні си-стеми, прийняття рішень, нейронні мережі, аналіз даних, обробка даних, ідентифікація, моделювання, оцінка ефективності.

© Ю. Г. Лисенко, 90 О. Ю. Мінц, 2017

Page 92: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

91

МОДЕЛИРОВАНИЕ ИННОВАЦИОННЫХ ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМ ПРИНЯТИЯ РЕШЕНИЙ В ЭКОНОМИКЕ

Ю.Г. Лысенко Доктор экономических наук, профессор, член-корреспондент НАНУ,

директор Учебно-научного института «Инновационные технологии управления»

Высшее учебное заведение Укоопсоюза «Полтавский университет экономики и торговли»

ул. Коваля, 3, г. Полтава, 36014, Украина [email protected]

А.Ю. Минц Кандидат экономических наук, доцент,

докторант кафедры финансов и банковского дела

Государственное высшее учебное заведение «Приазовский государственный технический университет»

ул. Университетская, 7, г. Мариуполь, 87500, Украина [email protected]

В статье систематизированы и расширены теоретико-методоло-гические основы процессов синтеза инновационных интеллек-туальных систем принятия решений. Определены концептуаль-ные подходы к применению методов интеллектуальных вычислений для моделирования систем принятия решений. Пре-дложена классификация методов интеллектуальных вычисле-ний и классификация задач анализа и обработки данных. Расс-мотрены методологические подходы к реализации процессов наблюдения, моделирования, идентификации и оценки эффек-тивности результатов моделирования инновационных интелле-ктуальных систем принятия решений в экономике. Предметом исследования является методология моделирования инновационных интеллектуальных систем принятия решений в экономике. Целью исследования является формализация процессов синтеза инновационных интеллектуальных систем принятия решений для повышения эффективности функционирования субъектов экономической деятельности. Результаты исследования позволяют повысить эффективность об-работки слабоструктурированной информации, а также качество принятия управленческих решений в условиях неопределенности.

Ключевые слова: интеллектуальные вычисления, интеллекту-альные системы принятия решений, нейронные сети, анализ дан-ных, обработка данных, идентификация, моделирование, оценка эффективности.

Page 93: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

92

MODELING OF INNOVATIVE INTELLECTUAL DECISION-MAKING SYSTEMS IN THE ECONOMY

Yuriy Lysenko Doctor of Economics, Professor, Corresponding Member of NASU,

Director of the Educational and Scientific Institute "Innovative Management Technologies"

Higher Educational Establishment "Poltava University of Economics and Trade" 3 Kovalya str., Poltava, 36014, Ukraine

[email protected]

Oleksii Mints PhD in Economics, Docent,

Doctoral Candidate of the Department of Finance and Banking State Higher Educational Establishment "Priazovsky State Technical University"

7 Universitetskaya str., Mariupol, 87500, Ukraine [email protected]

The article systematizes and extends the theoretical and methodolo-gical foundations of the synthesis processes of innovative intellectual decision-making systems. Conceptual approaches to application of methods of intellectual calculations for modeling of systems of deci-sion-making are defined. Classification of methods of soft computing, and classification of tasks of data analysis and data processing are offered. Methodological approaches to implementation of the pro-cesses of observation, modeling, identification and evaluation of effec-tiveness of the results of innovative intellectual decision-making systems modeling in the economy are considered. The subject of study is the modeling of innovative intellectual deci-sion-making systems in the economy. The research objective is to formalize the synthesis processes of innovative intellectual decision-making systems to improve the efficiency of the functioning of economic systems. The results of the research make it possible to improve the efficiency of poorly structured data processing and the quality of decision-making under uncertainty. Keywords: intellectual calculations, decision making, neural networks, data analysis, data processing, identification, modeling, assessment of efficiency.

JEL Classification: C45, C51, C52, C81, D81

Вступ

Однією з глобальних сучасних тенденцій розвитку економіки є різке зростання кількості інформації, обсяги якої, за оцінками

Page 94: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

93

експертів, підвищуються на 30 % щорічно [1]. Лавиноподібне на-ростання маси різноманітної інформації в сучасному суспільстві отримало назву «інформаційного вибуху», в результаті якого можливості засобів обробки інформації перестали встигати за темпами росту її обсягів. У зв’язку з цим успіх в інформаційному суспільстві досягається за рахунок найбільш ефективних техно-логій здобуття, обробки та аналізу інформації. Внаслідок цього на конкурентоспроможність економічних суб’єктів і соціальних груп істотно впливає як нерівність доступу до засобів інформацій-них технологій, яка отримала назву «перший цифровий розрив», так і нерівність в знаннях щодо використання таких технологій – «другий цифровий розрив». Тому проблема усунення цифрових розривів в Україні, де відставання в інноваційних технологіях об-робки інформації рівнозначно відставанню в розвитку національ-ної економіки, у даний час набуває особливої актуальності.

Важливою ознакою сучасних тенденцій розвитку інформацій-них технологій є поступове розширення функцій систем на осно-ві інтелектуальних обчислень зі здійснення інформаційної підт-римки прийняття рішень людиною до появи повноцінних інтелектуальних систем, здатних до прийняття рішень навіть в умовах мінливого середовища та часткової невизначеності.

Інноваційні інтелектуальні системи прийняття рішень мають самостійне значення для вирішення багатьох економічних задач, зокрема фінансової діагностики, торгівлі на фінансових ринках, створення систем інформаційної безпеки. Але навіть більш зна-чущим слід вважати той факт, що вони здатні стати потужним синергетичним фактором зростання ефективності та життєздат-ності існуючих економічних систем. У моделі життєздатної сис-теми С. Біра [2] застосування інтелектуальних систем прийняття рішень можливе у всіх підсистемах організаційної структури, що підвищує її адаптаційні здібності та життєздатність.

Різноманітні аспекти моделювання інтелектуальних систем прийняття рішень досліджуються в роботах вітчизняних і закор-донних учених, серед яких варто згадати В. Вітлінського [3], В. Анфілатова [4], А. Матвійчука [5], С. Хайкіна [6], Г. Сетлак [7].

Разом із тим слід зазначити, що теоретичну базу та практич-ний інструментарій моделювання інноваційних інтелектуальних систем прийняття рішень розроблено недостатньо. У більшості

Page 95: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

94

публікацій з даної тематики зосереджено увагу на використанні окремих методів, без намірів об’єднати їх у єдину систему. Тому комплексне дослідження питань моделювання інноваційних інте-лектуальних систем прийняття рішень в економіці є актуальним науковим завданням.

Загальні визначення

Інтелектуальними обчисленнями будемо називати методи та системи штучного інтелекту, які спрямовані на підтримку прийн-яття рішень, зокрема на вирішення задач інтелектуального аналі-зу даних, обробки даних, оптимізації.

Можна виділити два класичних підходи до класифікації та ро-зробки методів інтелектуальних обчислень – «нисхідний» і «ви-східний» [8].

Нисхідний, або семіотичний підхід (англ. Top-Down AI), має за мету створення систем штучного інтелекту на основі імітації ви-сокорівневих психічних процесів, таких як мислення, міркування. Результатом застосування цього підходу є, наприклад, експертні системи, бази знань, системи логічного висновку (включаючи не-чітку логіку).

Висхідний, або біологічний підхід (англ. Bottom-Up AI), поля-гає у створенні систем штучного інтелекту на основі моделюван-ня базових біологічних і фізичних процесів. Результатом реаліза-ції цього підходу є такі інструменти інтелектуальних обчислень, як штучні нейронні мережі.

Подальший розвиток методів аналізу даних змусив розширити цю класифікацію. Різні школи пропонують різноманітні її варіан-ти, але в рамках даного дослідження будемо виділяти в якості самостійних агентно-еволюційний та імітаційний підходи до проектування інтелектуальних систем.

Агентно-еволюційний підхід полягає у використанні для розв’язання задачі деякого набору самостійних програм – агентів. Агенти діють в програмно-створеному середовищі, характерис-тики якого залежать від умов розв’язуваної задачі. Кожен агент наділений деякими можливостями щодо сприйняття умов сере-довища і вибору варіантів дій, виходячи з цих умов. Для даного підходу характерна не тільки часова, а й просторова неоднорід-ність створюваної моделі. В рамках агентно-еволюційного підхо-

Page 96: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

95

ду можна виділити генетичні алгоритми та інші непереборні ме-тоди вирішення NP-повних задач (імітація відпалювання, метод мурашиних колоній тощо).

Імітаційний підхід дозволяє створювати і досліджувати моде-лі систем, для яких відомі лише деякі закономірності поведінки (так звана «чорна скринька»). Переваги імітаційного підходу ви-являються тоді, коли необхідно отримати знання про поведінку системи, яка складається з безлічі «чорних скриньок», що зви-чайними методами зробити неможливо.

Класифікацію методів інтелектуальних обчислень за розгля-нутими підходами показано на рис. 1.

Рис. 1. Класифікація методів інтелектуальних обчислень

Як видно з класифікації, наведеної на рис. 1, деякі методи ін-телектуальних обчислень можуть бути розглянуті в рамках кіль-кох підходів. Але це не є наслідком недосконалості класифікації, а показує багатогранність інтелектуальних обчислень.

Концептуальні підходи до моделювання інноваційної інтелектуальної системи прийняття рішень

У загальному вигляді задача вибору рішення формулюється так [4]:

)(C , (1)

де – множина можливих варіантів рішень; ω – обране рішення; C – правила вибору найкращої альтернативи (задаються у вигляді функції вибору).

Шту

чні не

йр

онні

ме

ре

жі

(біл

ьш

е 2

0 т

ипів

)

Не

чіт

ка л

огі

ка

Ге

не

тичні

ал

гор

итм

и

Екс

пе

ртн

і си

сте

ми

Мо

де

лю

ва

ння

си

сте

мно

ї д

ина

мік

и

Системи інтелектуальних

обчислень

ВисхіднийНисхіднийАгентно-

еволюційнийІмітаційний

Іміт

ац

ія

від

па

лю

ва

ння

Ме

тод

мур

аш

ини

х

кол

оній

Де

ре

ва

пр

ий

нятт

я

ріш

ень

Ди

скр

етн

о -

по

дій

не

мо

де

лю

ва

ння

Аге

нтн

е м

од

ел

юва

ння

Під

хо

ди

Ме

то

ди

Page 97: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

96

Вибір відповідних методів пошуку рішень залежить від рівня

визначеності множини варіантів і ступеня формалізації функції

вибору C, що можна бачити з табл. 1.

Таблиця 1

МЕТОДИ ВИРІШЕННЯ ЕКОНОМІЧНИХ ЗАДАЧ

№ C Тип задачі Методи вирішення

1. Однозначно визначена

Строго фор-малізовано

Задача оптима-льного вибору

Аналітичні методи; Дослідження операцій; Спеціальні методи оптимального вибору

2.

Визначена, але перевищує обчис-лювальні можли-вості системи

Строго фор-малізовано

Задача пошуку оптимальних рішень

Генетичні алгоритми; Рекурентні нейронні мережі; Методи фізико-біологічної оптимізації

3. Однозначно визначена

Не формалі-зовано

Задача вибору

Методи скорочення невизначеності: - Імітаційне моделю-вання; - Методи експертних оцінок

4. Може доповню-ватися

Не формалі-зовано

Загальна задача прийняття рішень

Нечітка логіка; Нейронні мережі; Методи логіко-лінгвістичного моде-лювання

З табл. 1 легко помітити, що традиційні методи пошуку рішень

дозволяють адекватно вирішувати тільки задачі оптимального ви-бору, які є добре структурованими. В цьому випадку отримане рі-шення буде об’єктивним і найкращим в наявних умовах. Однак ускладнення економічних процесів, що спостерігається в останні десятиліття, суттєво обмежує застосування таких підходів.

Якщо в задачі існує формальний критерій оптимальності, але характеристики простору рішень виключають можливість засто-сування аналітичних і переборних методів (наприклад, задача є NP-повною), то її можна віднести до типу задач пошуку опти-мальних рішень. Універсальним методом їх вирішення є генети-чні алгоритми, однак застосовується і ряд інших інструментів

Page 98: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

97

інтелектуальних обчислень, серед яких штучні нейронні мережі Хопфілда, мережі з нейронами Поттса, зростаючі нейронні ме-режі, метод імітації відпалювання, метод мурашиних колоній та інші [9].

Якщо простір вибору визначено, але неможливо об’єктивно сформулювати правило відбору кращої альтернативи, задача від-носиться до категорії задач вибору. У цьому випадку критерій вибору і його результат суб’єктивно залежить від особи, що приймає рішення (ОПР). Для розв’язання задач вибору викорис-товуються імітаційне моделювання, методи експертних оцінок, теорія корисності та інші підходи, які дозволяють зменшити не-визначеність при виборі критеріїв.

Найхарактернішою задачею в управлінні складними система-ми є загальна задача прийняття рішень (ЗЗПР) [10]. Для неї ха-рактерна відсутність можливості визначення не тільки критеріїв оптимальності, але і те, що сам простір вибору постійно видозмі-нюється, що веде до необхідності безперервного моніторингу стану системи і вироблення коригувальних рішень. Підтримка прийняття рішень в ЗЗПР реалізується шляхом формування про-міжної множини альтернатив, з яких здійснює вибір ОПР, тобто ЗЗПР зводиться до класу задач вибору. Формування проміжної множини альтернатив може здійснюватись за допомогою нейро-мережевих інструментів, методів нечіткої логіки, а також методів логіко-лінгвістичного моделювання.

Для задачі пошуку оптимальних рішень, задачі вибору та за-гальної задачі прийняття рішень визначення гарантовано-кращо-го рішення за припустимий час неможливе внаслідок великої кі-лькості можливих варіантів чи недостатньої формалізації правил вибору найкращої альтернативи. Такі економічні задачі будемо називати складними.

Розглядаючи прийняття рішень як процес, що відбувається в часі, слід зазначити, що в міру його розвитку необроблений ма-сив інформації, який характеризує досліджувану систему, про-ходить через ряд послідовних трансформацій, що приводять в остаточному підсумку до вибору рішення, яке визначає подаль-ший розвиток системи. У цій послідовності можна виділити процеси, пов’язані із спостереженням та моделюванням дослі-

Page 99: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

98

джуваної системи, ідентифікацією її стану, оцінкою та вибором альтернатив.

Процес спостереження включає відбір із простору станів аналізованої системи Z множини характеристик системи Y, які спостерігаються, відстеження їх значень і збереження отриманої інформації в базі даних. У термінах системного аналізу рішення цієї задачі зводиться до відшукання такого відображення

ZYg :1 ,

яке для кожної реалізації характеристик Y, що спостерігаються, ставить в однозначну відповідність внутрішній стан об’єкта управління.

Процес моделювання з формальної точки зору може розгляда-тися як побудова абстрактної множини E, ізоморфної предметної області:

EY : .

Основним призначенням моделі Е у задачі прийняття рішень є вивчення та прогнозування реакції об’єкта на керуючі впливи.

Процес ідентифікації (ψ) пов’язаний із вирішенням задачі розпізнавання образів, тобто відшукання відповідності між хара-ктеристиками системи, які спостерігаються в даний момент (век-тор S), і станами системи, які спостерігалися раніше.

Процес оцінки та вибору альтернатив для складних економі-чних задач пов’язаний із необхідністю згортки багатовимірного простору критеріїв [11]. При цьому кожній моделі поведінки економічної системи відповідає свій набір коефіцієнтів важливо-сті критеріїв. Задача оцінювання альтернатив, таким чином, зво-диться до відшукування відображення

M: ,

тобто такого набору функцій μj, які б забезпечували однозначну

відповідність між альтернативою та її оцінкою M відповід-

но до заданого критерію j. Зазначені процеси можна звести у схему концепції моделю-

вання інноваційної інтелектуальної системи прийняття рішень (ІІСПР), представлену на рис. 2.

Page 100: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

99

Рис. 2. Концепція моделювання інноваційної інтелектуальної системи прийняття рішень

Розглянемо процедуру формування рішення в ІІСПР, схема-тично зображену на рис. 2.

Поточна ситуація zi спостерігається та відображається у ви-гляді вектора Si. Його структура повторює структуру елемента множини Y у частині вхідної інформації. Далі в процесі функціо-нування ІІСПР поточна ситуація ідентифікується за допомогою моделей Е (процес ψ). Ідентифікація дозволяє відібрати з множи-ни Ω деяку підмножину рішень (пред’явлення) для подальшого вибору найкращої альтернативи.

Вибір альтернативи ωi здійснюється на підставі результатів моделювання та їх оцінки. Вибір методів оцінювання регламен-тується актуальними в поточній ситуації правилами прийняття рішень (елемент множини С).

Таким чином, у розглянутій концепції ІІСПР процес пошуку рішення зводиться до послідовності процесів спостереження, мо-делювання, ідентифікації, оцінювання та вибору. Розглянемо де-які аспекти, пов’язані з реалізацією цих процесів у ІІСПР, які по-требують ретельного вивчення та удосконалення.

Реалізація процесу спостереження

Будь-яка складна економічна система характеризується вели-кою кількістю параметрів. У той же час кількість станів системи

Простір станів

системи

(Z)

Рішення

(Ω)

Модель

системи

(E)

Множина

оцінок (M)

zi

g φ μ

Правила

вибору

(C)

ωi

Вектор

поточного

стану (Si )

δ

База

спостережува-

них даних (Y)

База

моделей

Page 101: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

100

(прикладів), які можуть бути відстежені за даними передісторії, звичайно обмежена. Тому в рамках процесу спостереження, як одного з етапів моделювання інноваційної інтелектуальної сис-теми прийняття рішень, одними з головних є задачі, пов’язані з визначенням характеристик вхідної вибірки даних, зокрема її ро-змірності (кількості параметрів), необхідного обсягу (кількості прикладів) та значущості параметрів.

Проілюструємо зв’язок між цими характеристиками та ефек-тивністю ідентифікації стану системи за допомогою графіка, на-веденого на рис. 3 (дані умовні). Критерієм ефективності іденти-фікації стану системи покладемо частку правильно розпізнаних прикладів на тестовій вибірці даних.

Рис. 3. Ілюстрація задачі пошуку оптимальних характеристик вхідних даних

Крива 1 на рис. 3 описує зміну ефективності ідентифікації те-

стових прикладів при фіксованій і гарантовано достатній кілько-сті прикладів у навчальній вибірці, в залежності від частки пара-метрів вхідної множини даних, які включені в цю вибірку. При цьому параметри відсортовані за зниженням значущості. Графік цієї кривої при збільшенні кількості параметрів у загальному ви-падку є неспадним.

0

10

20

30

40

50

60

70

80

90

100

10 20 30 40 50 60 70 80 90 100

Розмірність вектору вхідних даних (% від загальної кількості параметрів)

Еф

екти

вн

ість

ід

ен

тиф

ікац

ії

ста

ну с

исте

ми

(%

від

макси

мум

у)

1. Велика вибірка, параметри відсортовані 2. Мала вибірка, параметри невідсортовані

3. Мала вибірка, параметри відсортовані

Page 102: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

101

Крива 2 відображає зміну ефективності ідентифікації тестових прикладів при фіксованій і гарантовано недостатній кількості прикладів у навчальній вибірці, а також за умов рівної значущос-ті всіх її параметрів. Починаючи з певного моменту, ефективність ідентифікації при малій вибірці даних буде зменшуватися за ра-хунок ефекту перенавчання.

Крива 3 відображає ефективність ідентифікації тестових при-кладів при фіксованій і гарантовано недостатній кількості прик-ладів у навчальній вибірці, але якщо параметри відсортовані за значущістю.

Таким чином, на етапі спостереження перед дослідником мо-жуть виникати різні проблеми, залежно від розмірності та обсягу вхідних даних. Так при вибірці великого обсягу, але низької роз-мірності, виникає проблема підвищення різноманітності даних, а при вибірці великої розмірності, але малого обсягу – проблема оцінки значущості параметрів. Тісно пов’язані з ними також про-блеми визначення достатнього обсягу даних і синтезу оптималь-ної структури моделі, які повинні вирішуватися комплексно.

Хоча зазначені проблеми різною мірою стосуються багатьох методів інтелектуальних обчислень, найбільшу актуальність вони мають при використанні для аналізу даних штучних нейронних мереж (ШНМ), тому будуть розглянуті саме на їх прикладі.

Нехай Т – навчальна вибірка, яка являє собою множину даних,

що складається з векторів Xi та очікуваного відклику мережі

Yi = )( iXf :

I

iii YXT1

,

, (2)

де I – кількість прикладів у вибірці, а Xi – вектор, що має вигляд:

),...,,( ,2,1, Miiii xxxX , (3)

де M – кількість параметрів, що складають один приклад. Нехай NS – структура нейронної мережі, яка в загальному ви-

гляді може бути описана таким чином:

,,LNNS , (4)

Page 103: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

102

де N – множина нейронів, що складають ШНМ; L – множина зв’язків між нейронами; ψ – відношення інцидентності, що ста-вить у відповідність кожному зв’язку з множини L два нейрона з множини N.

Для повнозв’язаних багатошарових нейронних мереж прямого поширення при описі структури можна обмежитися зазначенням кількості нейронів в кожному шарі. У цьому випадку структуру (точніше – архітектуру) мережі можна записати формулою виду

N1 – N2 – …– Nlay, (5)

де lay – кількість шарів нейронної мережі; N1 – кількість нейронів

у вхідному шарі, що збігається з М – кількістю параметрів у на-

вчальному прикладі; N2 … Nlay-1 – кількість нейронів у кожному з

прихованих шарів; Nlay – кількість нейронів у вихідному шарі, які

і є виходами ШНМ.

Так, наприклад, формулою 5-6-3-1 описується архітектура

ШНМ, що має 5 входів, 6 нейронів у першому прихованому шарі,

3 нейрона в другому прихованому шарі та 1 вихід.

У загальному вигляді проблема відбору вхідних даних зво-

диться до знаходження такої вибірки TT , щоб при заданому

параметрі обсягу вибірки I забезпечувалась достатньо точна ап-

роксимація функції )( iXf і, відповідно, рішення досліджуваної

задачі. При цьому на вибірку T можуть накладатись обмеження

залежно від умов задачі.

Існування проблеми відбору вхідних даних обумовлено зале-

жністю між складністю структури нейронної мережі та кількістю

прикладів, які необхідні для її навчання. Теоретично достатню

кількість прикладів у навчальній вибірці можна визначити, відш-

товхуючись від концепції виміру Вапніка–Червоненкіса (VC-

виміру) [12], що відображає «обчислювальну потужність сімейст-

ва функцій класифікації, реалізованих машинами, здатними до

навчання» [6]. VC-вимір також може бути інтерпретований як

«максимальне число образів, на яких штучна нейронна мережа

може бути навчена без помилок для всіх можливих бінарних ма-

ркувань функцій класифікації» [6, с. 148]. Хоча точне аналітичне

Page 104: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

103

визначення цього параметра для конкретної архітектури ШНМ у

більшості випадків неможливе, оцінки, зроблені в [13], показу-

ють, що для найпоширенішого типу нейронної мережі (тобто ме-

режі прямого поширення, яка складається з нейронів із сигмоїда-

льною активаційною функцією) верхня межа VC-виміру пропор-

ційна W2, де W – кількість вільних параметрів ШНМ, до яких від-

носяться вагові коефіцієнти зв’язків і параметри функцій актива-

ції нейронів:

W=|L|+|N|. (6)

При цьому:

1

11

lay

iii NNL , (7)

lay

iiNN

2

. (8)

Розглянемо вимоги до кількості прикладів у вхідній вибірці на

прикладі порівняно невеликої повнозв’язаної нейронної мережі

прямого поширення з сигмоїдальною активаційною функцією та

архітектурою 5-5-1. У такій мережі lay = 3, отже з (6)–(8)

|L|=25+5=30, |N|=6 W=36. Таким чином VC вимір має той же

порядок що 362 = 1296. Це означає, що для найякіснішого налаш-

тування параметрів даної нейронної мережі для ідентифікації

стану складної системи достатньо вибірки, яка містить близько

1000 незалежних прикладів. Якщо кількість незалежних парамет-

рів буде перевищувати VC-вимір, це вже не поліпшить ефектив-

ність ідентифікації. Інші методи оцінки (наприклад, метод, запропонований у [14])

дозволяють задавати допустимий рівень помилки мережі, що дає можливість отримати оптимістичніші значення розмірів навчальної вибірки при прийнятному рівні ефективність ідентифікації, однак вимоги до її обсягу все одно залишаються досить високими.

Слід наголосити на тому, що вираз W2 обмежує лише теорети-чну верхню межу VC-виміру нейронної мережі [6]. Тому на

Page 105: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

104

практиці може бути достатньо вибірки значно меншого розміру. Але вирази (6)–(8) дозволяють порівнювати різні варіанти архі-тектури нейронних мереж з погляду потреб до обсягу даних для навчання.

З (7) випливає, що в повнозв’язаних нейронних мережах кіль-кість вільних параметрів безпосередньо залежить від кількості нейронів у вхідному і вихідному шарах, а отже від розмірності вектора вхідних даних і його представлення в ШНМ. При цьому нерідко зустрічається ситуація, коли цей параметр великий, а кі-лькість прикладів у навчальній вибірці навпаки – замала. Так, наприклад, задача передбачення банкрутств у банківській систе-мі України пов’язана з аналізом більш ніж 30 параметрів, що ха-рактеризують активи, пасиви і фінансові результати банків, що обумовлює достатній обсяг вибірки на рівні приблизно 25000 прикладів (розрахунки зроблені для нейронної мережі з архітек-турою 30-5-1). У той же час вибірка, що зроблена на основі бан-ківської статистики України, має обсяг на порядок менше необ-хідного. Аналогічна ситуація виникає і в багатьох інших випадках, коли зібрати базу даних, обсяг якої був би достатнім для ефективного навчання нейронної мережі, не представляється можливим.

Проблема відбору вхідних даних тісно пов’язана з задачею знаходження такої структури мережі NS, яка б забезпечувала мі-німум помилки моделювання. У сукупності ці дві задачі не ма-ють і швидше за все не можуть мати аналітичних методів рішен-ня. Не існує також і надійних емпіричних методів їх розв’язання, тому поширеним способом є простий перебір можливих варіан-тів. Однак, якщо при відносно невеликих обсягах вхідних даних використання переборних алгоритмів цілком допустимо, то із збільшенням обсягу вибірки і розмірності вхідного вектора даних витрати часу на навчання ШНМ істотно зростають, що робить використання переборних алгоритмів недоцільним [15].

Розглянемо методи зниження розмірності даних, що ґрунту-ються на:

– логічному аналізі даних; – оптимізації представлення даних; – кореляційному аналізі; – непрямих методах аналізу значущості даних.

Page 106: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

105

Очевидно, що основною метою застосування цих методів є видалення пояснюючих змінних, які слабо впливають або взагалі не впливають на результуючий показник. Отже, в ряді випадків насамперед доцільно провести логічний аналіз даних з метою від-сікання параметрів, які не несуть інформаційного навантаження за умов задачі. Так, наприклад, при аналізі стандартних анкетних даних банківського позичальника з вибірки можна виключити поля «Порядковий номер», «№ паспорта», «ПІБ» і тому подібні.

Наступним методом зниження розмірності є оптимізація представлення даних. Цей метод може бути використаний для по-дання на вхід нейронної мережі нечислових даних. Варіанти пред-ставлення таких даних наведено на рис. 4.

Рис. 4. Варіанти представлення нечислових даних, на прикладі параметра «Місце проживання клієнта»:

а) представлення через позицію біта; б) представлення

через бітову маску; в) представлення через ранг значення

Розглянемо переваги і недоліки кожного варіанта. Варіант представлення даних через визначення позиції біта

(рис. 4-а) для кожного значення параметра є найточнішим, але разом з тим і найбільш ресурсномістким (потребує найбільше па-раметрів ШНМ для його представлення).

Обласний

центр

Місто

а) б)

Сільська

місцевість

біт 1

біт 2

j

в)

Page 107: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

106

Позначимо через vj кількість можливих варіантів значення нечислового параметра j. При поданні параметра через позицію біта, відповідно до (6) – (8), буде потрібно

2NvJ j (9)

параметрів мережі для кодування цього показника, де N2 – кіль-кість нейронів у другому шарі ШНМ.

Для прикладу, який показано на рис. 4-а, |J| = 3*4 = 12. При кодуванні бітовою маскою порядковий номер кожного з

варіантів представляється у вигляді двійкового числа і його біти, що мають значення «1», активують відповідні входи ШНМ (рис. 4-б). Кількість параметрів мережі для подібного кодування нечислового показника, можна розрахувати за формулою

22log NvJ j , (10)

де знак позначає операцію округлення в сторону більшого числа. Для варіанту представлення даних з рис. 4-б вхідний показник

може бути закодований двома бітами. При цьому значенню «Об-ласний центр» може відповідати маска «11», значенням «Місто» та «Село» – маски «10» та «01», відповідно. Кількість необхідних параметрів |J| = 2 * 4 = 8.

Недоліком цього способу кодування є деяке погіршення адек-ватності представлення вхідних показників, а також складність аналізу структури ШНМ для виявлення знайдених мережею за-лежностей.

Представлення нечислових параметрів у вигляді рангів значень (рис. 4-в) може використовуватись тоді, коли для цих параметрів існує критерій розподілу на шкалі «краще» – «гірше», але якщо такий критерій може бути синтезовано, виходячи з умов задачі. Якщо критерію розподілу немає, або він не є явним, даний спосіб кодування можна застосовувати тільки у виняткових випадках, що є основним недоліком даного способу. Перевагою його є міні-мальні вимоги до ресурсів ШНМ. Дійсно, у цьому випадку

2NJ , (11)

що очевидно менше, ніж значення, отримані за формулами (9) або (10).

Page 108: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

107

У розглянутому прикладі вхідні значення можна закодувати, наприклад, виходячи з питомої ваги проблемних кредитів в різ-них регіонах. Так, якщо найнадійнішими є кредити, що видані мешканцям обласних центрів, а найменш надійними – кредити мешканцям міст, то значенням «Обласний центр» відповідає код 1, значенням «Село» – код 0,33, а значенням «Місто» – код 0,66. При цьому кількість вільних параметрів складатиме всього |J| = 4.

Кодування нечислових даних можна розглядати як компроміс між точністю відображення вхідної інформації та використовува-ними ресурсами ШНМ. При великому обсязі вхідної вибірки або при малій кількості можливих значень параметра (наприклад, ха-рактеристика «стать» може приймати всього два значення) доці-льно використовувати кодування позицією біта. За великої кіль-кості можливих значень параметра або при невеликому обсязі навчальної вибірки доцільно використовувати кодування бітовою маскою. У окремих випадках може бути виправдане кодування шляхом ранжирування значень. Крім того, доцільно вивчити статистичні характеристики показників навчальної вибірки і ро-зглянути можливість видалення з неї рідко використовуваних значень.

Кореляційний аналіз є найбільш відомим і поширеним мето-дом формального аналізу, на підставі якого з вхідних даних мож-на виключити як параметри, які занадто слабо пов’язані з резуль-туючим показником, так і параметри, які занадто сильно пов’язані з іншими вхідними факторами. Недоліком кореляційно-го аналізу є можливість виявляти залежності між зміною тільки тих параметрів, які мають числове вираження. Нечислові параме-три можуть бути проаналізовані лише в тому випадку, якщо вони можуть бути розташовані за принципом «краще» – «гірше», що не завжди можливо.

Недоліком класичного метода визначення коефіцієнта кореля-ції є те, що він достовірно дозволяє знаходити тільки лінійні за-лежності, тоді як реальні економічні процеси можуть розвиватися за законами, далекими від лінійних. Проведені дослідження пока-зали, що при аналізі даних, заданих у вигляді аналітичної функ-ції, коефіцієнт кореляції Пірсона сягає 1 тільки для лінійної за-лежності. Для кубічної та експоненційної залежності його

Page 109: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

108

значення знаходиться в межах від 0,6 до 0,7, а для періодичних функцій, які зустрічаються в аналізі економічних систем досить часто, значення коефіцієнту кореляції близьке до 0 [16].

Значно кращих результатів із виявлення функціональних за-кономірностей дозволяє домогтися використання сучасних мето-дів аналізу взаємозалежностей в даних. За результатами дослі-дження [16] найефективнішим виявився метод, заснований на обчисленні коефіцієнта максимуму взаємної інформації (maximal information coefficient, MIC). Значення MIC для всіх аналітично-заданих залежностей дорівнювало 1, що відповідає максималь-ному ступеню зв’язку.

Хоча коефіцієнт MIC було запропоновано порівняно недавно, у 2011 році він швидко набув поширення для аналізу слабострук-турованих даних. Вже у 2012 році К. Мерфі в монографії, прис-вяченій перспективам розвитку машинного навчання, назвав MIC кореляцією XXI століття [17, с. 61].

Слід зазначити і недоліки MIC. Головний з них обумовлений вимогами до дискретності аналізованих показників. Це змушує використовувати для аналізу неперервних величин алгоритми дискретизації даних, що негативно позначається на точності ви-явлення слабких залежностей. Для підвищення точності рекоме-ндується вибір методу дискретизації проводити ітеративно, що дозволяє трохи підвищити точність але, в свою чергу, збільшує трудомісткість і витрати часу. Таким чином, використання MIC вимагає високої кваліфікації аналітика. Крім того, застосування цього методу стримується його відсутністю у поширених про-грамних продуктах.

Важливу роль при вирішенні задачі зниження розмірності ви-бірки можуть зіграти непрямі методи аналізу значимості даних. У роботі [18] показано, що в якості методу відбору значущих па-раметрів може бути використаний будь-який метод, що дозволяє виконати ранжирування набору даних за ступенем їх впливу на вихідний параметр, навіть якщо таке ранжирування не є його ос-новною функцією. До таких методів, наприклад, можна віднести алгоритм автоматичної побудови дерев рішень C4.5 [19].

Використання цього алгоритму дозволяє провести ранжиру-вання не тільки тих факторів, які мають числовий вираз, але і не-числових факторів, які не можуть бути приведені до числового

Page 110: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

109

виду. Особливості роботи алгоритму дозволяють варіювати кіль-кість параметрів, які відкидаються (тобто таких, яким присвою-ється нульова значущість), що підвищує гнучкість методу. Ще однією перевагою алгоритму C4.5, порівняно з кореляційним аналізом, є автоматичне відкидання параметрів, що мають сильну взаємну кореляцію з іншими.

За малої розмірності вектора вхідних даних, великої кількості прикладів у вибірці та наявності складної залежності між вхід-ними і вихідними параметрами постає проблема підвищення різ-номанітності вхідних даних. Прикладом таких даних може бути біржова інформація з валютних торгів.

Базовий набір вхідних даних, що описує стан ринку, в зага-

льному випадку містить лише інформацію про курсові відноси-

ни різних пар валют за часовими періодами. При цьому в кож-

ному періоді виділяється курс на початок періоду oi, на кінець

періоду ci, а також максимальні hi і мінімальні li значення курсу

за період. Оскільки сам по собі такий вектор не несе ніякої ін-

формації про тенденції змін цін на біржі, для урахування дина-

міки цього та інших часових рядів застосовують трансформа-

цію вхідного набору даних за допомогою ковзного вікна, тобто

замість вектора {iiii clho ,,, } використовується вектор

{iiiiiiiikikikikiki clhoclhooclho ,,,,,,,,...,,,,, 11111 }. Однак

і цей спосіб не дозволяє досягти високих результатів у прогнозу-

ванні навіть із застосуванням персептронних і подібних до них

нейронних мереж, що є наслідком з фундаментальних обмежень,

які були сформульовані Розенблаттом і доповнені М. Минскім і

С. Пейпертом [20]: – персептронні мережі не здатні до узагальнення своїх харак-

теристик на нові стимули або нові ситуації, а також не здатні аналізувати складні ситуації в зовнішньому середовищі шляхом розчленування їх на простіші;

– персептрони мають обмеження в задачах, пов’язаних з інва-ріантним представленням образів.

Зменшити вплив цих обмежень можна шляхом надання персе-птронам додаткової інформації, що уточнює поточну ситуацію. Така інформація може бути отримана, наприклад, із використан-

Page 111: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

110

ням емпіричних методів аналізу, які формулюються у вигляді «умова» – «наслідок». Фактично, такі методи можна розглядати як мікро-експертні системи (ЕС-1 … ЕС-n на рис. 5).

Рис. 5. Структура вхідної частини нейро-експертного модуля аналізу даних

Так, в якості ЕС-1…ЕС-n на рис. 5 на валютних і фондових

ринках можуть виступати ринкові індикатори та осцилятори, які дозволяють отримувати вихідний сигнал у вигляді набору (-1/0/1), що відповідає прогнозуванню відповідно зниження ку-рсу (-1), збереження нинішнього рівня (0) та підвищення курсу (1). Існують методи і для більш детального прогнозу [21].

Реалізація процесу моделювання Серед методологічних проблем, які виникають на етапі моде-

лювання ІІСПР, особливо слід виділити такі, що пов’язані із пос-тановкою завдання і вибором ефективних інструментів його рі-шення. Хоча в [5, 22] надаються деякі рекомендації щодо застосування певних нейромережевих інструментів для вирішен-ня різноманітних економічних задач, наприклад, побудови рей-

Вхід

ні д

ані

ЕС-1

ЕС-n

...

...

...

...

Page 112: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

111

тингів, прогнозування, класифікації, проте не сформульовано єдиного комплексного підходу до конструювання штучних ней-ронних мереж з урахуванням специфіки задачі (вибору типу ме-режі, структури, обробки вхідних і вихідних даних тощо).

Аналіз використання цього терміна в різних літературних джерелах показує, що найбільше уваги визначенню правильної постановки задачі надається в рамках теорії розв’язання винахід-ницьких завдань, запропонованої та розвиненої Г. С. Альтшулле-ром і його послідовниками [23, 24]. В рамках цієї теорії постано-вка відокремлюється як самостійний етап розв’язання задачі, який значною мірою визначає остаточний результат.

За запропонованою концепцією моделювання інноваційних інтелектуальних систем прийняття рішень (див. рис. 2) постанов-ка задачі є складовою частиною процесу моделювання φ. Резуль-тати проведеного дослідження показали, що при використанні ін-телектуальних методів пошуку одна й та сама задача в деяких випадках може бути поставлена по-різному [25]. При цьому ефе-ктивність її рішення знаходиться у значній залежності від поста-новки задачі, а отже, від використаних методів та інструментів. Адже, відповідно даному вище визначенню складної економічної задачі, для неї неможливе знаходження гарантовано-кращого рі-шення за припустимий час. Тому всі методи розв’язання таких задач відшукують тільки приблизні варіанти рішень. Тому ефек-тивність застосування різних інструментів у загальному випадку відрізнятиметься.

Етап постановки задачі передбачає її віднесення до одного чи декількох класів. Тому слід розглянути класифікацію задач з ана-лізу та обробки даних.

Аналізом даних будемо називати процес вилучення з необроб-лених даних відомостей, корисних для дослідника.

Обробкою даних в широкому сенсі назвемо процеси, пов’язані зі збором, зберіганням, аналізом та трансформацією даних.

Обробкою даних у вузькому сенсі назвемо процеси, в результа-ті яких з одного масиву даних виходить інший, із заданими влас-тивостями.

Щоб уникнути можливих різночитань, далі термін «обробка даних» буде використовуватися виключно у вузькому сенсі.

Класифікацію задач з аналізу даних наведено на рис. 6.

Page 113: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

112

Рис. 6. Класифікація задач інтелектуального аналізу даних На відміну від запропонованих раніше [26–30], класифікація

на рис. 6 містить чотири ранги за рахунок виділення і впорядку-вання таксономічних ознак. Це дозволяє краще зрозуміти взає-мозв’язок між різними класами задач і методами їх вирішення, що надає можливість підвищення ефективності аналізу даних.

Задачі аналізу даних за метою вирішення поділяються на дві великі групи – прогностичні та описові.

В рамках прогностичної групи на рис. 6 виділено такі класи: 1. Задачі класифікації. За кількістю класів, на які поділяється

вхідна вибірка, слід виділяти задачі бінарної та полінарної класи-фікації. При бінарній класифікації вхідна вибірка ділиться тільки на два класи (наприклад – видавати кредит, або ні; надійний чи ненадійний контрагент). При полінарній класифікації вхідна ви-бірка ділиться на три або більше класів. Прикладами таких задач є: розпізнавання образів, сегментація клієнтів (якщо класи задані заздалегідь) тощо. Незважаючи на схожість постановок задач бі-

Задачі з аналізу даних

Описові

Кластериз

ація

Аналіз зв’язків

Ви

діл

ення з

на

чущ

их

озн

ак

Ви

явл

ення п

ри

чи

нно

-на

сл

ідко

ви

х з

в'я

зків

По

шук

асо

ціа

тивни

х

пр

ави

л

Ряд

По

шук

під

по

сл

ідо

вно

сте

й

Ма

три

цяРяд

Прогностичні

Пр

огн

озу

ва

ння

Ре

гре

сія

РегресіяКласифі-

кація

По

шук

ано

ма

лій

Ана

ліз

со

ціа

льни

х м

ер

еж

Граф

Гр

упува

ння

об

’єкт

ів

Ма

три

ця

Граф

Ана

ліз

ме

ре

же

ви

х

вза

єм

од

ій

Аналіз відхилень

Бін

ар

на

По

лін

ар

на

Ана

ліз

ча

со

ви

х

ряд

ів

Page 114: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

113

нарної та полінарної класифікації, методи та інструменти їх ви-рішення суттєво різняться.

2. Задачі регресії потребують виявлення взаємозв’язку між вхідними та вихідними змінними. Прикладом задачі регресії мо-же бути визначення суми кредиту, який може бути виданий кліє-нту. Існують також такі різновиди задач регресії, як прогнозу-вання та аналіз часових рядів. Метою прогнозування є наближена оцінка значень деяких показників у майбутньому на підставі ві-домих значень у минулому і сьогоденні. Метою аналізу часових рядів є прогнозування майбутніх значень деякого набору даних, де значення вихідної змінної залежить не тільки від її минулих значень, але і від часу.

У задачах описової групи на рис. 6 виділено такі класи: 1. Задачі кластеризації. При їх вирішенні потрібно знайти за-

кономірності в масиві даних, виділити в ньому деяку кількість зон (кластерів) і розподілити по ним дані. До цього класу відне-сено задачі з пошуку підпослідовностей у рядах даних, групування об’єктів та аналізу соціальних мереж, які відрізняються тільки представленням вхідних даних і розмірністю простору угрупо-вання. Так, пошук підпослідовностей у динамічних рядах факти-чно являє собою задачу кластеризації в одновимірному просторі часу, де кожен елемент має тільки двох сусідів – попереднє зна-чення ряду і наступне. В задачах угруповання масиву вхідних да-них кожен елемент (крім крайніх і кутових) має фіксоване число сусідів. У двомірному ортогональному просторі їх чотири, в три-вимірному – шість, і так далі. Вхідні дані у такому випадку пред-ставляються в матричному вигляді. Нарешті, аналіз соціальних мереж – це задача, де кожен елемент вхідних даних (вершина графа) може мати будь-яку кількість сусідів, яка в реальних соці-альних мережах може сягати кількох тисяч (а для окремих людей і більше).

2. Задачі з аналізу зв’язків вирішуються за необхідності вста-новлення зв’язків і відносин між змінними у великих базах да-них. Предметом виявлення причинно-наслідкових зв’язків є пошук статистично значущих закономірностей у часовій послідовності даних, який дозволяє відповісти на питання: «З якою ймовірніс-тю настання події А тягне за собою настання події Б?». Пошук асоціативних правил дозволяє знаходити закономірності між

Page 115: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

114

пов’язаними подіями, тобто дає можливість відповісти на питан-ня: «З якою ймовірністю пов’язані події А і Б?». При цьому пос-лідовність настання подій значення не має. Аналіз мережевих взаємодій дозволяє вирішити задачу пошуку епіцентрів мереже-вої активності, тобто вузлів, що впливають на процеси, які відбу-ваються в мережі, або ініціюють такі процеси. Вхідні дані при цьому подаються у вигляді графа. У широкому сенсі ця задача зводиться до виявлення для кожного вузла мережі керуючих і ке-рованих вузлів.

3. До задач аналізу відхилень відносяться задачі з пошуку ано-малій і виділення значущих ознак. Пошук аномалій включає ви-явлення та ідентифікацію таких елементів даних, які не відпові-дають встановленим закономірностям. Причому такі аномалії можуть бути як новими закономірностями (наприклад, нові трен-ди в біржових даних), так і сигналами про ненормальну поведін-ку об’єкта спостереження. Об’єктом пошуку аномалій можуть бути результати вимірювань, часові ряди, текстова інформація, графи. Задача виділення значущих ознак набула особливої актуа-льності у зв’язку з розвитком Internet і різким зростанням обсягів інформаційних ресурсів. Суть її зводиться до створення на підс-таві вхідної інформації деякої вибірки, яка б при заданих обме-женнях на обсяг найповніше представляла її суть. Спочатку така задача вирішувалася виключно для текстових документів (авто-матичне реферування), проте у даний час сфера її застосування охоплює всі основні види представлення інформації, у тому числі зображення, звук та відео. Серед актуальних прикладів її засто-сування – тематичний пошук контенту, контекстний пошук, ви-явлення матеріалів, що порушують інтереси правовласників чи законодавчі обмеження, тощо.

Класифікацію задач інтелектуальної обробки даних наведено на рис. 7.

Як видно з аналізу рис. 7, основною класифікаційною ознакою задач інтелектуальної обробки даних пропонується ознака впли-ву на порядок елементів вхідної вибірки даних.

Зміна порядку елементів відбувається при вирішенні задач ра-нжирування і сортування. Вхідні дані при цьому зазвичай пред-ставлені у вигляді рядів або зводяться до них. В інших задачах зміна порядку елементів вхідних даних не відбувається.

Page 116: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

115

Рис. 7. Класифікація задач інтелектуальної обробки даних Сортування – задача, пов’язана з розташуванням елементів

даних у заданій послідовності або розподілом їх по групах. Задача ранжирування відрізняється від сортування тим, що

для її вирішення необхідно визначити метод визначення рангу кожного елемента вхідної послідовності даних (тобто метод, який дозволяє згорнути весь вектор значень елемента в єдиний параметр – ранг). Це дозволяє порівнювати між собою будь-яку кількість елементів із вхідного набору, не вдаючись до його по-вного сортування, що ефективно за наявності великих обсягів даних.

Під фільтрацією при обробці економічних даних будемо мати на увазі відбір інформації, що задовольняє заданому критерію. Вхідні дані для фільтрації можуть бути представлені у вигляді ряду, масиву або графа.

Філ

ьтр

ац

ія

Со

рту

ва

ння

Від

но

вл

ення

Очи

ще

ння

Ра

нж

ир

ува

ння

Ква

нту

ва

ння

Обробка даних

Без зміни порядку

елементів

Зі зміною порядку

елементівР

яд

Граф

Ма

три

ця

Ряд

Граф

Ма

три

ця

Ряд

Граф

Ма

три

ця

Ряд

Ма

три

ця

Ряд

Ряд

Page 117: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

116

Задача очищення даних, по суті, є зворотною до задачі фільтра-ції та передбачає виключення з початкової вибірки «зайвих» да-них. Очищення даних може стосуватись рядів, матриць і графів.

Очищення рядів передбачає усунення «викидів», тобто даних, які явно виходять за межі основної тенденції. Причинами появи таких викидів можуть бути як помилки вимірювання, так і на-вмисні спотворення інформації. У будь-якому випадку, спотво-рені дані роблять сильний вплив на якість подальшого аналізу, особливо при використанні виключно формальних методів, в то-му числі машинного навчання.

Очищення даних, представлених у матричній формі, прово-диться для усунення з вхідної вибірки факторів, що мало впли-вають на вихідні показники або зовсім не пов’язані з ними.

Відносно графів очищення передбачає проріджування зв’язків і застосовується як по відношенню до вхідних даних, так і до де-яких видів економіко-математичних моделей, структурою яких є граф, наприклад штучних нейронних мереж. При цьому усува-ються слабкі зв’язки, які мало впливають на загальний результат але ускладнюють аналіз.

Необхідність у відновленні даних виникає в тому випадку, як-що вхідна вибірка містить пропуски або якісь дані в ній відсутні, але є гіпотези про природу їх виникнення, що дозволяє оцінити найімовірніші значення. Відновлення даних дозволяє підвищити ефективність машинного навчання за рахунок розширення вхід-ної вибірки даних. Необхідність відновлення даних може вини-кати при їх поданні у будь-якій з розглянутих форм – у вигляді рядів, матриць або графів. В останньому випадку об’єктом відно-влення виступають відсутні у вхідній вибірці зв’язки між верши-нами графа.

Квантування використовується для динамічних рядів даних за необхідності зменшення кількості їх елементів, тобто при спро-щенні рядів. Існують такі різновиди, як квантування за рівнем і квантування за часом. У першому випадку діапазон значень не-перервної або дискретної величини розбивається на кінцеве чис-ло інтервалів. Якщо протягом деякого періоду часу значення ве-личин динамічного ряду не виходило за межі одного інтервалу, то в результаті квантування всі ці величини будуть замінені од-ним значенням [31, с. 184]. У другому випадку розбиття динамі-

Page 118: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

117

чного ряду на інтервали відбувається за часом. Кожен інтервал замінюється одним усередненим значенням елементів ряду, або декількома, що відображають граничні значення показника за цей період. Останній спосіб використовується для представлення біржових даних. Існують також різновиди квантування за рівнем і за часом зі змінним кроком квантування [32].

Складність задач обробки даних зростає з ускладненням стру-ктури поля критеріїв і зменшенням їх визначеності.

Таким чином, вирішення задач аналізу чи обробки даних у складі ІІСПР доцільно розпочинати з постановки завдання та від-несення задачі до одного чи кількох класів із наступним моделю-ванням кожної з постановок та оцінкою ефективності результа-тів. Наприклад, задача біржового спекулянта може бути вирішена щонайменш у трьох постановках – класифікації, регресії та клас-теризації, а задача передбачення банкрутств комерційних банків може бути зведена до постановок класифікації, прогнозування та кластеризації.

Реалізація процесу ідентифікації Основна проблема ідентифікації полягає в тому, що внаслідок

обмеження часу спостереження повний збіг значень вектора S характеристик системи, які спостерігаються в даний момент, з якимось елементом вхідної вибірки даних (множини Y) предста-вляється неможливим (зрозуміло, якщо характеристики Y досить повно відображають стан системи, тобто за умови кваліфіковано-го рішення задачі спостереження). Отже, задача ідентифікації зводиться до відшукування найбільш схожої ситуації з-поміж тих, що спостерігалися раніше. Для цього використовуються ме-тоди, засновані на визначенні відстані між вектором S і вектора-ми, які описують попередні стани системи в n-вимірному просто-рі (моделлю системи), де n – розмірність вектора S. Найбільш схожій ситуації буде відповідати мінімальна відстань. На прак-тиці, однак, необхідно мати на увазі різну значущість характери-стик у кожному конкретному випадку.

Точність ідентифікації значною мірою визначається адекват-ністю моделі і, як наслідок, залежить від результатів процесу мо-делювання. Разом з тим, достовірність ідентифікації може бути

Page 119: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

118

підвищена за рахунок зменшення невизначеності зовнішнього середовища шляхом оцінювання параметрів економічної систе-ми, які на момент ідентифікації не є достовірно відомими. До них, зокрема, відносяться параметри, які формально визначають-ся за підсумками періоду, але можуть бути достатньо точно оці-нені й раніше на підставі розрахункових чи імітаційних моделей. Останні розглянемо докладніше.

Існує кілька різновидів імітаційного моделювання [34, 35]: – Моделювання системної динаміки. Виникнення цього на-

прямку пов’язане з ім’ям Дж. Форрестера, який у середині 1950-х років розробив його основні засади. Системна динаміка пе-редбачає найвищий рівень агрегування компонентів з усіх мето-дів імітаційного моделювання. Завдяки ряду спрощень, прийня-тих в моделях системної динаміки (абстрагування від індивіду-альних характеристик об’єктів і фізичних характеристик навко-лишнього середовища, неперервність усіх змінних і процесів), вони дозволяють простими засобами отримати адекватний опис процесів у досить складних системах. Модель системної дина-міки може служити для виявлення та аналізу причинно-наслідкових зв’язків між будь-якими компонентами системи, дозволяє порівняти варіанти рішень з її управління. Наприклад, імітаційна модель ціноутворення на ринку житлової нерухомос-ті [36] може бути використана для аналізу взаємозв’язків між факторами ринку і для прогнозування ринкових цін, що є важ-ливим для кредитних організацій та ріелторів. Імітаційна мо-дель сімейного бюджету банківського позичальника [37] дозво-ляє комерційним банкам оцінити ймовірність повернення кредитів і розрахувати можливі сценарії реструктуризації про-строченої кредитної заборгованості.

– Дискретно-подійне моделювання передбачає дослідження функціонування системи в часі та аналіз впливу на її стан зовні-шніх подій, які подаються у вигляді «заявок». Найвідомим прик-ладом застосування цього різновиду імітаційного моделювання є аналіз систем масового обслуговування. Сферою застосування дискретно-подійного моделювання можуть служити будь-які си-стеми, пов’язані з обслуговуванням потоку об’єктів – системи передачі інформації, логістичні, транспортні, виробничі системи тощо.

Page 120: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

119

– Агентне моделювання. Передбачає визначення поведінки одиничної простої структури – агента – у взаємодії з іншими та-кими ж агентами і навколишнім середовищем. Агент розгляда-ється як деяка сутність, яка має активність, автономну поведінку, може приймати рішення відповідно до деякого набору правил, може взаємодіяти з оточенням та іншими агентами, а також може еволюціонувати. Вивчення поведінки сукупності агентів дозво-ляє отримати інформацію про властивості системи, що вивчаєть-ся, на макрорівні.

Агентний підхід доцільно застосовувати в тому випадку, коли індивідуальна поведінка об’єктів має великий вплив на поведінку системи в цілому. До таких завдань відносяться моделювання ринків, конкуренції, динаміки населення та ін. Крім того, агент-ний підхід може застосовуватись і спільно з іншими різновидами імітаційного моделювання, зокрема в рамках моделей системної динаміки.

Таким чином, імітаційне моделювання відноситься до непря-мих методів оцінки параметрів економічних систем і дозволяє розширити різноманітність вхідних даних для аналізу і, в резуль-таті, підвищити обґрунтованість прийнятих рішень.

Реалізація процесу оцінки ефективності

Слід виділити як мінімум два підходи до оцінки ефективності інтелектуальних обчислень – абсолютний і відносний.

Визначення абсолютних оцінок дає можливість проаналізува-ти ефективність деякої моделі та відповісти на питання про її придатність або непридатність для вирішення поставленої задачі.

Визначення відносних оцінок дає можливість порівняння кіль-кох моделей і визначення кращої з них за діючих умов.

Крім цього, задачу оцінки ефективності інтелектуальних сис-тем прийняття рішень слід розглядати відносно різних об’єктів і процесів, серед яких відзначимо:

– алгоритми і програмне забезпечення; – процес навчання; – моделі аналізу даних; – моделі обробки даних. Розглянемо зміст поняття «ефективність» по відношенню до

цих об’єктів.

Page 121: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

120

Необхідність оцінки ефективності роботи програмного за-безпечення обумовлена тим, що різні реалізації принципів інтеле-ктуальних обчислень можуть сильно відрізнятись як за точністю, так і за швидкістю роботи. Аналогічна ситуація виникає при зіс-тавленні ефективності роботи різних алгоритмів, що виконують функцію навчання моделі або налаштування параметрів інтелек-туальних обчислень [38]. Таким чином, виникає потреба у надій-ному методі зіставлення різних програмних продуктів та алгори-тмів за ефективністю їх реалізації.

Оцінку ефективності машинного навчання необхідно розгля-дати в зв’язку з вирішенням задачі оптимальної настройки алго-ритмів навчання, які чутливі до обсягу навчальної вибірки та до параметрів процесу навчання. Існуючі підходи до оптимізації цих параметрів носять емпіричний характер і потребують уза-гальнення.

Ефективність моделей аналізу даних означає здатність роз-робленої моделі виконувати поставлені практичні завдання та має за мету визначення і порівняння економічної вигоди від їх застосування. Слід враховувати, що, принаймні, для різних кла-сів економічних задач підходи до оцінки ефективності можуть відрізнятися.

При оцінюванні ефективності моделей обробки даних необ-хідно знайти відповідь на питання про економічну вигоду, що отримується в результаті застосування різних методів обробки.

Таким чином, задача дослідження ефективності виникає на таких етапах реалізації інтелектуальних методів вирішення еко-номічних задач, як вибір програмного забезпечення, навчання ін-телектуальних систем і оцінка результатів їх роботи для завдань аналізу і обробки даних. Розглянемо їх докладніше.

Оцінка ефективності роботи програмного забезпечення та ал-горитмів навчання. Розвиток теорії інтелектуальних обчислень спричинив появу великої кількості модифікацій методів і алгори-тмів машинного навчання. Так, кількість типів ШНМ на даний час перевищує 20. При цьому, наприклад, у математичному паке-ті Matlab тільки для одного з цих типів – персептрона – передба-чено більше ніж 10 варіантів навчання. Як правило, жодна з цих модифікацій не дозволяє отримати поліпшення ефективності на всьому діапазоні значущих параметрів і для всіх різновидів задач,

Page 122: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

121

але для окремих видів приріст ефективності може бути суттєвим (див., наприклад, [38]). Аналогічна ситуація спостерігається і стосовно програмного забезпечення, виробники якого часто ви-користовують спрощені реалізації методів та алгоритмів, які не дозволяють отримати найефективніші рішення.

Очевидно, що здійснення повного перебору всіх доступних варіантів для кожної задачі істотно збільшує трудомісткість реа-лізації ІІСПР. Тому на практиці до цього вдаються рідко, покла-даючись на досвід та інтуїцію розробника. Однак такий підхід не завжди дозволяє одержати найкращий результат. Ефективнішою є така організація процесу вибору, за якої безліч варіантів зво-диться до мінімуму за допомогою апріорного порівняння.

Питання порівняння ефективності алгоритмів та їх реалізацій вперше було піднято Д. Кнутом [39]. Незважаючи на загальнови-знану важливість таких досліджень, слід зазначити, що для оцін-ки ефективності роботи програмного забезпечення та алгоритмів інтелектуальних обчислень запропоновані в них ідеї повинні бу-ти доповнені та розвинені з урахуванням новітніх розробок.

Зокрема, основним критерієм ефективності алгоритмів у [39] приймається швидкість роботи. Однак, з огляду на те, що слабко-структуровані задачі не завжди можуть сходитись до глобального оптимуму похибки моделювання, іншим важливим критерієм слід вважати точність одержуваних результатів. Оскільки крите-рії швидкості та точності є взаємно суперечливими, залежно від умов задачі один із них доцільно обмежувати. Тобто, можна шу-кати або найточніший алгоритм при заданих обмеженнях за ча-сом роботи, або найшвидший алгоритм при заданих обмеженнях по точності.

Для отримання порівнянних результатів необхідно забезпечи-ти однакові умови тестування для різних методів. З технічного боку це повинно проявлятись в однаковій апаратній платформі для перевірки різних алгоритмів. Не меншу важливість має за-безпечення подібності задач для тестування. Для виконання останньої умови можна запропонувати підхід до реалізації та зіс-тавлення алгоритмів машинного навчання, заснований на понятті типових задач.

Типовою назвемо задачу, основні характеристики якої з погля-ду вхідних даних і результатів є досить близькими для деякого набору інших задач у схожій постановці.

Page 123: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

122

До задач, які можна використовувати за типові з економіки, висунемо такі вимоги (В.1 – В.6):

В.1. Доступність вхідних даних, причому в різних варіантах, які, тим не менш, мали б схожі характеристики розподілу. Вико-нання цієї вимоги необхідно для забезпечення порівнянності ре-зультатів досліджень, проведених у різні часи і за різних умов.

В.2. Прозорість економічної інтерпретації результатів. Не-обхідно для забезпечення можливості прямого зіставлення алго-ритмів, які досліджуються, за основним критерієм, прийнятим в економіці – вигоді від використання.

В.3. Можливість перевірки результату. Повинні існувати ме-тоди визначення абсолютно кращого варіанту розв’язання задачі. Це дозволить не тільки порівнювати алгоритми між собою, а й оцінювати їх абсолютну ефективність.

В.4. Складність рішення. Типові задачі мають відноситися до задач пошуку оптимальних рішень, задач вибору чи загальних задач прийняття рішень (див. табл. 1).

В.5. Можливість порівняння результатів. Постановка задачі повинна забезпечувати можливість визначення якості результатів різних її рішень.

В.6. Репрезентативність. Чим більше різних економічних за-дач може бути зведено до тих самих постановок, що і типова, тим краще.

Слід зазначити, що de facto у сфері інтелектуальних обчис-лень вже склався певний набір задач, які традиційно викорис-товуються для перевірки роботи алгоритмів і демонстрації їх можливостей.

Так, довгий час однією з них була задача класифікації, в якій потрібно віднести рослину ірис до одного з трьох видів (setosa, versicolour або virginica) в залежності від довжини і ширини ча-шолистків і пелюсток. Аналіз відповідності вимогам В.1 – В.6 показує, що ця задача повністю відповідає лише вимогам В.3 і В.5, а також частково – В.6. Таким чином, підстав використову-вати її в якості типової немає. Це розуміють і виробники про-грамного забезпечення, тому в демонстраційних прикладах су-часних систем нейромережевого моделювання вона майже не зустрічається.

Page 124: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

123

Для аналізу ефективності рішення NP-повних задач часто ви-користовується задача комівояжера – одна з найвідоміших задач комбінаторної оптимізації [40, 41]. Суть її зводиться до відшуку-вання найкоротшого шляху обходу заданих міст із подальшим поверненням на початок маршруту. Починаючи з 1950-х років ведеться систематичний пошук аналітичних рішень цієї задачі, що дозволило отримати методи і алгоритми розрахунку найкоро-тших шляхів для досить великої кількості вузлів. Недоліком цих методів є досить вузька спеціалізація, проте їх застосування до-зволяє виконати вимогу В.3 до типових завдань. Інші вимоги та-кож виконуються: дані легко можуть бути згенеровані (В.1); най-коротший маршрут є зазвичай і найвигіднішим економічно (В.2); знаходження найкоротшого шляху є дійсно складною задачею (В.4); відношення знайденого шляху до найкоротшого дозволяє однозначно порівнювати ефективність різних алгоритмів (В.5); до комбінаторної оптимізації в економіці можна звести велику кількість практичних задач (В.6).

Ще однією задачею, яка має велике значення для порівняння алгоритмів реалізації інтелектуальних обчислень, є задача біржо-вого спекулянта, яка також відповідає вимогам В.1 – В.6. Так, ре-зультати біржових торгів є відкритими і загальнодоступними, що забезпечує виконання вимоги В.1. Отримані результати прямо виражаються через прибуток, що забезпечує прозорість їх еконо-мічної інтерпретації (В.2). Абсолютно кращий варіант рішення відповідає точному прогнозу розвитку подій, який відомий з ана-лізу даних передісторії. Це забезпечує виконання вимог з переві-рки результату (В.3). Досягнення абсолютно кращого результату на практиці неможливе, оскільки на розвиток подій впливає без-ліч факторів, які лише побічно проявляються у вхідних даних (В.4). Результати роботи різних алгоритмів можна зіставити за розміром отриманого прибутку (В.5). Що стосується репрезента-тивності результатів (В.6), то вище вже зазначалось, що дана за-дача може розглядатись у різних постановках (регресії, класифі-кації, кластеризації), до яких можна звести велику кількість різних економічних задач з аналізу слабкозв’язаних даних.

Використання системи типових задач у поєднанні з розробле-ними раніше методами забезпечення порівнянності результатів [39, 42, 43] дозволяє підвищити обґрунтованість вибору програм-

Page 125: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

124

них засобів і алгоритмів навчання та знизити витрати на створен-ня ІІСПР. При цьому система типових задач може формуватися поступово, на підставі узагальнення накопиченого досвіду в створенні ІІСПР.

Ефективність машинного навчання. Термін «навчання» стосо-вно систем штучного інтелекту (комп’ютерних програм) визна-чено в класичній монографії Т. Мітчелла таким чином [44, с. 2]:

Кажуть, що комп’ютерна програма навчається при вирішен-ні якоїсь задачі з класу T, якщо її продуктивність, згідно метри-ки P, поліпшується при накопиченні досвіду E.

При цьому P, T і E можуть мати різні значення для різних задач. Отже, момент припинення росту продуктивності системи є

очевидним маркером закінчення процесу навчання. Однак на практиці виявлення цього моменту часто є нетривіальною зада-чею, зважаючи на складність визначення продуктивності інтелек-туальної системи для різних класів задач. Крім того, поняття «на-вчання», відповідно до визначення, даного вище, можна розгля-дати у вузькому і в широкому сенсах.

У вузькому сенсі під навчанням будемо розуміти настройку параметрів інтелектуальної системи спеціалізованим навчальним алгоритмом (наприклад, Back Propagation для ШНМ, C4.5 для де-рев рішень, оператори селекції генетичних алгоритмів).

У широкому сенсі під навчанням будемо розуміти настройку самих навчальних алгоритмів, а також визначення структури сис-теми інтелектуальних обчислень (наприклад – кількість нейронів у прихованих шарах ШНМ, кількість розгалужень у деревах рі-шень, розмір популяції в генетичних алгоритмах).

Питання визначення оцінки продуктивності системи штучного інтелекту найприродніше вирішується для задач аналізу даних, що відносяться до прогностичної групи (класифікація і регресія). Вхідна вибірка даних у цьому випадку ділиться на навчальну та тестову, а якість навчання визначається за такими критеріями [45, с. 96]:

К.1. Мінімізація помилки у розпізнаванні навчальної множини; К.2. Мінімізація помилки у розпізнаванні тестової множини; К.3. Досягнення адекватної динаміки процесу навчання. Пояснимо критерій К.3. Аналіз динаміки навчання нейронної

мережі дозволяє виявити момент перенавчання ШНМ, що є осно-

Page 126: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

125

вною небезпекою роботи з малими вибірками даних, та уникнути його. На рис. 8 зображено класичний вид графіка зміни середньої помилки моделювання ШНМ на навчальній і тестовій множинах даних.

Рис. 8. Динаміка процесу навчання ШНМ З аналізу рис. 8 видно, що якщо середня помилка на навча-

льній множині монотонно зменшується, то середня помилка ШНМ на тестовій множині проходить через екстремум, після чого починає збільшуватися. Проходження через екстремум і є моментом, коли процес навчання необхідно зупинити. У такому випадку ШНМ замість узагальнення залежностей між вхідними та вихідними даними починає підлаштовуватись і «запам’ято-вувати» приклади з навчальної множини.

С. Хайкін вказує, що перехресна перевірка з використанням тестової множини і рання зупинка процесу навчання доцільні при виконанні такої умови [6, с. 293]:

I < 30 W, (12)

де I – кількість прикладів у навчальній вибірці; W – кількість ві-льних параметрів нейронної мережі.

Тобто при малих обсягах навчальної вибірки перехресна пере-вірка необхідна.

Епохи

Рів

ень п

ом

ил

ки

Навчальна

множина

Тестова

множина

Точка зупинення процесу

навчання

Page 127: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

126

Графік, показаний на рис. 8, є лише схематичною ілюстрацією процесу контролю за навчанням, оскільки за явної суперечливос-ті характеристик навчальної вибірки і архітектури ШНМ його ви-гляд буде істотно відрізнятись від наведеного.

При аналізі ефективності навчання в задачах, де відсутня мо-жливість розбиття вхідної вибірки на тестову і навчальну, засто-сування критерію К.2 неможливе. Якщо при цьому кількість іте-рацій у процесі навчання не обмежена, може бути задіяний критерій К.3, відповідно до якого маркером закінчення процесу навчання слід вважати припинення поліпшення значень функції продуктивності. Наприклад, для генетичних алгоритмів такою буде функція пристосованості, а для самоорганізаційних ШНМ із шаром Кохонена – помилка кластеризації.

Відзначимо, що оцінка продуктивності інтелектуальної систе-ми у вузькому сенсі за критерієм К.3 не є можливою для алгори-тмів навчання з кінцевою кількістю ітерацій, наприклад для алго-ритмів синтезу дерев рішень. Взагалі, непряма оцінка ефектив-ності навчання за критеріями К.1 – К.3 для таких випадків не має сенсу. Підбір параметрів навчання таких алгоритмів здійснюєть-ся в комплексі з оцінкою ефективності результатів методами комбінаторної оптимізації.

Оцінка ефективності результатів аналізу даних. При оціню-ванні результатів вирішення економічних задач головним крите-рієм ефективності є економічна вигода, тобто ефективність озна-чає здатність розробленої моделі виконувати поставлені прак-тичні завдання.

Оцінка ефективності отриманої моделі може здійснюватись або в режимі реальної експлуатації, або на підставі даних про минулий стан системи. Режим реальної експлуатації дозволяє ви-явити справжню ефективність рішення, але ця перевірка обхо-диться дорожче і займає багато часу. Перевірка на підставі мину-лих даних може бути проведена набагато швидше і коштує дешевше, але вона дозволяє знайти тільки очікувану ефективність і її достовірність падає в умовах мінливого зовнішнього середо-вища. Однак перевірка ефективності на історичних даних дозво-ляє порівняти між собою значну кількість моделей і обрати для практичного використання ту, що має найбільшу очікувану ефек-тивність, у той час як режим реальної експлуатації передбачає

Page 128: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

127

аналіз зазвичай лише одної впровадженої системи. Тому обидва методи на практиці застосовуються спільно.

Розглянемо класифікацію моделей аналізу даних з погляду на оцінку їх ефективності, яка ґрунтується на класифікації, даній у [42, с. 565].

Кількісними моделями першого типу будемо називати моделі, економічна ефективність яких однозначно визначається кількіс-ними метриками, заснованими на різниці між результатами, пе-редбаченими моделлю, і фактичними даними. До цього типу, на-приклад, відносяться моделі, які вирішують задачу прогнозування.

Кількісними моделями другого типу будемо називати моделі, економічна ефективність яких також залежить від достовірності передбачених подій, але абсолютна вартість правильних і помил-кових прогнозів різниться. Серед моделей аналізу даних до цього типу відносяться, зокрема, ті, що вирішують задачі бінарної кла-сифікації.

До дескриптивного типу будемо відносити моделі, результат роботи яких носить характер опису і для яких застосування фор-мальних методів оцінки точності неможливе. Такими є, напри-клад, моделі, що відносяться до класу аналізу зв’язків.

Ефективність кількісних моделей першого типу добре опису-ється такою метрикою, як середньоквадратична помилка прогно-зування на навчальній і тестовій вибірках даних. У складних ви-падках, коли вибірка даних недостатньо репрезентативна, а крива динаміки процесу навчання істотно відрізняється від виду, пока-заного на рис. 8, можуть бути використані додаткові засоби візу-альної оцінки ефективності прогнозування, зокрема діаграми ро-зсіювання, що дозволяють візуально оцінити рівень і розподіл помилок прогнозування [42]. Вважається, що чим ближче розра-хункові значення до реальних, тим менша помилка прогнозуван-ня. Однак така інтерпретація лише дублює показник середньок-вадратичної помилки, тоді як діаграми розсіювання можуть використовуватись і для виявлення ефекту перенавчання.

Розглянемо діаграми, представлені на рис. 9. Вони отримані при аналізі розрахунків ШНМ, навчених на вибірці даних, об’єм якої згідно (6) і (12) можна трактувати як недостатній. Це викли-кає ефект перенавчання, в результаті чого нейронна мережа «за-пам’ятовує» вхідну вибірку даних і демонструє на ній дуже точні

Page 129: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

128

результати прогнозування. На реальних же даних прогноз часто виявляється помилковим.

а)

б)

Рис. 9. Діаграми розсіювання моделей прогнозування

а) коректно навчена модель б) перенавчена модель Для подолання ефекту перенавчання необхідно зменшити кі-

лькість вільних параметрів нейронної мережі до мінімуму, що за-безпечує припустиму ефективність рішення задачі. Використання традиційного способу – розбиття вхідної вибірки на навчальну і тестову, з подальшим контролем помилки за тестовою вибіркою (див. рис. 8), у даному випадку може виявитись недостатньо ефек-тивним з огляду на занадто малий розмір вхідної вибірки. У той же час, аналіз діаграм розсіювання різних моделей дозволяє отримати непряму інформацію щодо їх узагальнюючих здібностей.

Page 130: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

129

Так, діаграма на рис. 9-а відображає результати, отримані за допомогою ШНМ, що містить у прихованому шарі 2 нейрона. Ді-аграма, показана на рис. 9-б, відображає результати розрахунків ШНМ, що містить у прихованому шарі 3 нейрона. Незважаючи на те, що діаграма на рис. 9-б ілюструє практично ідеальне розпі-знавання вхідних прикладів, вона свідчить про перенавчання ШНМ. Тому для подальшого використання доцільно вибрати ме-режу з меншою кількістю нейронів, діаграма розсіювання якої наведена на рис. 9-а.

Ефективність кількісних моделей другого типу досліджується за допомогою інструментів, що дозволяють інтерпретувати ре-зультати інтелектуальних обчислень з погляду економічного ефекту та з урахуванням особливостей конкретної задачі. Суть цих інструментів зазвичай зводиться до розрахункових моделей, а також візуальних методів аналізу, серед яких можна виділити матриці спряженості, Lift-діаграми, ROC-криві тощо [42]. Розг-лянемо деякі з них.

Для формальної оцінки точності бінарного класифікатора роз-роблено різноманітні метрики оцінювання. Однак, найчастіше використовуються такі з них, як точність і повнота [43].

Точність класифікатора показує, скільки з передбачених по-зитивних результатів виявились дійсно позитивними:

FPTP

TPPrec

, (13)

де TP – кількість правильно розпізнаних позитивних результатів; FP – кількість негативних результатів, розпізнаних як позитивні.

Повнота класифікатора показує, скільки із загальної кількості позитивних результатів було передбачено правильно:

FNTP

TPRec

, (14)

де FN – кількість позитивних результатів, розпізнаних як негативні. Тут позитивним результатом є важливіший з точки зору задачі

клас досліджуваних об’єктів. Скажімо, в задачі класифікації потенційних позичальників для банків важливіше точніше пе-редбачати дефолти за кредитами, ніж визначати надійних пози-чальників, адже втрати за дефолтами критичніші, ніж недоотри-

Page 131: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

130

мання прибутку від невидачі кредиту. Отже, у даному контексті дефолт стає позитивним результатом, у той час як виконання позичальником кредитних зобов’язань – негативним.

У різних практичних задачах одна з характеристик (Prec чи Rec) може виявитись важливішою за іншу. Наприклад, у задачах ранньої медичної діагностики важливіше повнота, а при класифі-кації потенційних банківських позичальників – точність.

Існують й інші формули для формальної оцінки бінарних кла-сифікаторів, але часто наочнішим і зручнішим є візуальний ана-ліз. Одним з його інструментів є матриця спряженості, приклад якої наведено у табл. 2.

Таблиця 2

ПРИКЛАД МАТРИЦІ СПРЯЖЕНОСТІ ПРИ АНАЛІЗІ БАНКІВСЬКИХ ПОЗИЧАЛЬНИКІВ

Класифіковано

Фактично Позитивний Негативний Всього

Позитивний 34 1 35

Негативний 3 111 114

Всього 37 112 149

Матриця спряженості відображає кількість правильно і непра-

вильно класифікованих зразків із вхідної вибірки та дозволяє ко-нтролювати результати навчання в разі асиметрії ціни помилок класифікації першого і другого роду. До помилок першого роду відноситься класифікація позитивних результатів як негативних, до помилок другого роду – класифікація негативних результатів як позитивних.

Ціна помилок першого і другого роду може мати суттєві від-мінності. Так при аналізі кредитоспроможності клієнта банк по-несе істотно більші збитки, якщо поганого клієнта прийме за хо-рошого, ніж навпаки. Тобто в цьому випадку вартість помилок першого роду значно вище, ніж помилок другого роду.

Найскладнішими для оцінки ефективності результатів аналізу даних є дескриптивні моделі. Застосування апріорних методів оцінки економічного ефекту для них у більшості випадків немо-

Page 132: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

131

жливе, тому всі використовувані прийоми носять непрямий ха-рактер.

До таких прийомів відносяться принципи «бритва Оккама» та «мінімальна довжина опису», засновані на доказі теореми про те, що з кількох моделей, які описують дані з однаковою точністю, кращою є більш коротка [44]. Хоча в оригінальному дослідженні Т. Мітчелл пише про дерева прийняття рішень, дані принципи мо-жуть бути поширені і на інші інструменти інтелектуальних обчис-лень, які вирішують схожі задачі. Зокрема, рішення по діаграмах розсіювання, наведених вище на рис. 9, також відповідає ним.

Оцінка ефективності результатів обробки даних. В рамках ІІСПР задачі обробки даних переважно носять забезпечувальний характер, тобто вирішуються для поліпшення результатів пода-льшого аналізу даних. У цьому випадку відносна ефективність застосування k-го методу обробки даних порівняно з h-м визна-чається як:

hs

kshk

dpe

ee / , (15)

де kse та

hse – ефективність усієї ІІСПР (або тої її частини, для

якої вона може бути розрахована) за умови використання k-го та

h-го методу обробки даних При цьому інші методи та складові

ІІСПР залишаються незмінними (за винятком внутрішньої струк-

тури, створюваної в результаті навчання). Оцінки, отримані за допомогою виразу (15), є відносними, то-

ді як на практиці зручнішими є абсолютні. Для отримання мож-ливості роботи з абсолютними оцінками (щоб було зрозуміло, чи обробка даних дає позитивний ефект) можна використовувати концепцію «наївного» методу обробки, застосування якого гара-нтовано не покращує структуру вихідних даних. Для задач обро-бки даних зі зміною порядку елементів таким є випадковий вибір даних із вхідного масиву. Для задач обробки даних без зміни по-рядку елементів дані на виході «наївного» методу будуть збігатися з даними на його вході, тобто фактично обробка буде відсутня.

По відношенню до «наївного» будь-який метод, що за форму-лою (15) дає результат більше 1, може вважатися ефективним, а

Page 133: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

132

при результаті менше 1 – неефективним. При цьому виконується правило транзитивності оцінок, яке можна сформулювати так:

Якщо метод k1 краще «наївного» в x разів, а метод k2 краще

«наївного» в y разів, то метод k1 краще k2 у y

x разів.

Існують також економічні задачі, вирішення яких збігається саме до задачі обробки даних (у цьому випадку процедура оцінки ефективності передбачає визначення економічного результату від застосування методу). Серед них є задача ранжирування, до якої зводиться широке коло економічних задач. Існують як суто роз-рахункові, так і розрахунково-графічні методи оцінки ефективно-сті вирішення задач ранжирування. Серед останніх слід виділити Lift-криві та їх різновиди (Profit-криві, Gain-діаграми та ін.) [42].

Lift-крива формується на основі ліфт-фактора, який був впер-ше запропонований при вирішенні задачі оптимізації масової ро-зсилки як показник, що відображає збільшення числа відгуків ві-дносно кількості дій (поштових відправлень). За горизонтальною віссю графіка відкладається розмір вибірки, впорядкованої за зменшенням показника rpi – імовірності настання позитивного результату, розрахованої аналізованою моделлю. За вертикаллю фіксується кумулятивне число позитивних результатів у кожній підвибірці (ліфт). Оскільки істинна рангова ознака trpx у даному випадку є бінарною величиною, яка приймає значення 1 у разі позитивного результату x та значення 0 у разі негативного, вираз для розрахунку ліфта можна записати у такий спосіб:

i

xxtrpilft

1

. (16)

Як приклад використання Lift-кривої розглянемо задачу ран-жирування прострочених кредитних справ у колекторському ско-рингу, в яких об’єкти необхідно розташувати за рівнем зменшення ймовірності відновлення позичальником платежів за кредитом. Припустимо, що для ранжирування застосовуються три моделі:

Модель 1 є емпіричною і використовується в багатьох кредит-них підрозділах для ранжирування даних про позичальників. Ра-нговими ознаками rpi в ній обрано кількість днів, які пройшли з моменту останнього платежу.

Page 134: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

133

Модель 2 заснована на визначенні зв’язку між вхідними пока-зниками та результуючим (імовірністю відновлення платежів) за допомогою логістичної регресійної моделі.

Модель 3 передбачає відсутність ранжирування, тобто випад-ковий вибір позичальника. Таку модель назвемо «наївною». Вона служить візуальним орієнтиром для аналізу та зіставлення ефек-тивності інших моделей і завжди присутня на діаграмі з Lift-кривими.

Графіки Lift-кривих зазначених моделей наведено на рис. 10.

Рис. 10. Lift-криві різних моделей ранжирування позичальників у колекторському скорингу

Практичний сенс зіставлення ефективності за допомогою Lift-

кривих полягає у визначенні моделі, що дозволяє зробити най-меншу кількість дій, необхідних для досягнення певного резу-льтату.

Загальним критерієм оцінки моделі за її Lift-кривою є площа під кривою, що виражена у відсотках від загальної площини. Для «наївної» моделі цей показник завжди дорівнює 50 %. Для моделі логістичної регресії з рис.10 площа під кривою – 63,3 %. Для на-веденої там же емпіричної моделі ранжирування – 55,1 %. Таким

0

10

20

30

40

50

60

70

80

90

100

0 10 20 30 40 50 60 70 80 90 100

Обсяг опрацьованих даних (% від обсягу вибірці)

Отр

им

ан

о п

ози

тив

ни

х р

езу

ль

таті

в

(% в

ід їх з

ага

ль

но

ї кіл

ько

сті

)

Модель 3

Модель 2 Модель1

Page 135: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

134

чином, з розглянутих моделей за результатами зіставлення за площею під Lift-кривою ефективнішою для ранжирування пози-чальників виявилась модель логістичної регресії.

Іншим критерієм оцінки ефективності вирішення задач ран-жирування є частка відгуків, одержуваних при здійсненні певної кількості дій. Так, з аналізу графіків на рис. 10 можна побачити, що для отримання 50 % позитивних відгуків у «наївної» моделі необхідно обробити 50 % кредитних справ, з використанням мо-делі логістичної регресії – 31 % кредитних справ, а з використан-ням моделі оцінки ймовірності погашення боргу за періодом про-строчення – 41 % справ. Очевидно, що в даному випадку також доцільніше вибрати саме модель логістичної регресії. При цьому слід зазначити, що емпірична модель демонструє прийнятні ре-зультати при обробці малої кількості заявок. Отже, можливість дослідження не тільки загальної ефективності моделей, але й ефективності їх на окремих ділянках діапазону ранжирування, є безумовною перевагою розрахунково-графічних методів оцінки ефективності вирішення задач ранжирування.

Але недоліком класичних Lift-кривих є неможливість їх вико-ристання для аналізу ефективності моделей ранжирування в тому випадку, якщо елементи множини дійсних рангових ознак trpx мають не бінарну природу. Однак, даний метод може бути вдос-коналений для аналізу ефективності при довільній природі дійс-них рангових ознак. Вираз для розрахунку ліфта при цьому:

i

xxtrrilft

1

, (17)

де xtrr =1, якщо умова істинна, і 0 – якщо помилкова.

Метод побудови кривої ефективності ранжирування, заснова-ний на функції (17), дозволяє забезпечити пріоритетну значи-мість правильного ранжирування об’єктів на початку списку. Дійсно, якщо за основний критерій ефективності моделі ранжи-рування прийняти площу під кривою (у частках від загальної площі графіка):

2

1

)(

n

ilft

S

n

ilft

, (18)

Page 136: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

135

то правильне розташування об’єкта на першому місці в ранзі збі-

льшить загальну площу під кривою на величину 2n

nSlft , тоді як

правильне розташування об’єкта на останньому місці в ранзі –

тільки на величину 2

1

nSlft . Таким чином, значимість місць

об’єктів у ранзі в запропонованому методі оцінки ефективності (17) убуває в арифметичній прогресії.

Висновки

Проведене дослідження дозволило запропонувати концепцію моделювання інноваційної інтелектуальної системи прийняття рішень, як сукупності процесів спостереження, моделювання, ідентифікації, оцінювання та вибору рішення. Розглянуто реалі-зацію цих процесів, що базується на розробках вітчизняних і за-рубіжних авторів у таких областях, як статистичний аналіз, спо-стереження і експеримент, технології баз даних, математичне моделювання, інтелектуальних аналіз і обробка даних, методи оптимізації.

Вдосконалено та актуалізовано класифікацію економічних за-дач з аналізу й обробки даних та інтелектуальних методів їх ви-рішення.

Розвинуто методологію моделювання штучних нейронних ме-реж для вирішення економічних задач в частині вибору інстру-ментів моделювання, визначення архітектури штучних нейрон-них мереж, вдосконалення методів роботи із вхідними даними, дослідження ефективності вирішення економічних задач метода-ми нейромережевого моделювання.

Систематизовано та розширено підходи до оцінки результатів інтелектуальних обчислень, сформульовано та деталізовано кон-цепцію типових задач, запропоновано розрахункові та розрахун-ково-графічні методи вирішення проблеми оцінки результатів обробки даних.

Розроблена методологія моделювання інноваційних інтелек-туальних систем прийняття рішень в економіці надає можливість вирішити нагальну для управління економікою України пробле-

Page 137: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

136

му подолання цифрових розривів, що забезпечуватиме підґрунтя для підвищення ефективності функціонування економічних сис-тем різного рівня, відкриваючи нові можливості для економічно-го росту.

Література

1. Hilbert M. The World’s Technological Capacity to Store, Communi-cate, and Compute Information / Martin Hilbert, Priscila López // Science. – 2011. – № 332 (6025). – P. 60–65.

2. Бир С. Мозг фирмы / С. Бир. – М.: Едиториал УРСС, 2005. – 416 с. 3. Вітлінський В.В. Штучний інтелект у системі прийняття управ-

лінських рішень / В.В. Вітлінський // Нейро-нечіткі технології моделю-вання в економіці. – 2012. – № 1. – С. 97–118.

4. Анфилатов B. C. Системный анализ в управлении / B. C. Анфила-тов, А. А. Емельянов, А. А. Кукушкин. – М.: Финансы и статистика, 2002. – 368 с.

5. Матвійчук А. В. Штучний інтелект в економіці: нейронні мережі, нечітка логіка: монографія / А. В. Матвійчук. – К.: КНЕУ, 2011. – 439 с.

6. Хайкин С. Нейронные сети: Полный курс / С. Хайкин – [2-е изд.]. – М.: Вильямс, 2006. – 1104 с.

7. Сетлак Г. Интеллектуальные системы поддержки принятия ре-шений / Г. Сетлак. – К.: ЛОГОС, 2004. – 250 с.

8. Copeland J. Artificial Intelligence: A Philosophical Introduction / Jack Copeland. – NJ: Wiley-Blackwell. – 1993. – 328 p.

9. Неітеративні, еволюційні та мультиагентні методи синтезу нечіт-кологічних і нейромережних моделей: Монографія / Під заг. ред. С. О. Субботіна. – Запоріжжя: ЗНТУ, 2009. – 375 с.

10. Сараев А. Д. Системный анализ и современные информационные технологии / А. Д. Сараев, О. А. Щербина. – Симферополь: СОНАТ, 2006. – 342 с.

11. Макаров И. М. Теория выбора и принятия решений / И. М. Ма-каров, Т. М. Виноградская, А. А. Рубчинский, В. Б. Соколов. – М.: Нау-ка, 1982. – 328 с.

12. Vapnik V. N. On the uniform convergence of relative frequencies of events to their probabilities / V. N. Vapnik, A. Ya. Chervonenkis // Theoretical Probability and Its Applications. – 1971. – № 17. – P. 264–280.

13. Koiran P. Neural networks with quadratic VC dimension / P. Koiran, E. D. Sontag // Advances in Neural Information Processing Systems. – 1996. – № 8. – P. 197–203.

14. Baum E. B. What sixe net gives valid generalization? / E. B. Baum, D. Haussler // Neural Computation. – 1989. – № 1. – P. 151–160.

Page 138: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

137

15. Кравчук Е. В. Искусственные нейронные сети и генетические ал-горитмы / Е. В. Кравчук, Э. Хантер. – Донецк: ДонГУ, 2000. – 200 с.

16. Reshef D. N. Detecting Novel Associations in Large Data Sets / D. N. Reshef, Y. A. Reshef, H K. Finucane and others // Science. – 2011. – № 334 (6062). – P. 1518–1524.

17. Murphy K. P. Machine Learning: A Probabilistic Perspective (Adaptive Computation and Machine Learning series) – 1st Edition / Kevin P. Murphy. – Cambridge, MA: MIT Press, 2012. – 1067 p.

18. Минц А. Ю. Методы отбора данных для нейросетевого модели-рования / А. Ю. Минц // Моделювання та інформаційні системи в еко-номіці: зб.наук.пр. – Київ: КНЕУ, 2011. – Вип. 84. – С. 256–270.

19. Quinlan R. J. C4.5: Programs for Machine Learning / Ross J. Quinlan // Machine Learning. – 1994. – Vol. 16. – № 3. – P. 235–240.

20. Minsky M. L. Perceptrons / M. L. Minsky, S. A. Papert. – Cambridge, MA: MIT Press, 1969. – 263 p.

21. Эрлих А. Технический анализ товарных и фондовых рынков / А. Эрлих.– М.: Юнити, 1996. – 318 с.

22. Ежов А. А. Нейрокомпьютинг и его применения в экономике и бизнесе / А. А. Ежов, С. А. Шумский., под ред. проф. В. В. Харитонова. – М.: МИФИ, 1998. – 224 с.

23. Альтшуллер Г. С. Творчество как точная наука / Г. С. Альтшул-лер. – М.: Сов. радио, 1979. – 175 с.

24. Альтшуллер Г. С. Найти идею: Введение в ТРИЗ – теорию реше-ния изобретательских задач. – 4-е изд. / Г. С. Альтшуллер. – М.: Альпи-на Паблишерз, 2011. – 400 с.

25. Минц А. Ю. Общие вопросы постановки задач в нейросетевом моделировании / А. Ю. Минц // Нейро-нечіткі технології моделювання в економіці. – 2012. – № 1. – С. 189–206.

26. Neelamadhab P. The Survey of Data Mining Applications and Feature Scope / Padhy Neelamadhab, Mishra Pragnyaban, Rasmita Panigrahi // International Journal of Computer Science, Engineering and Information Technology. – 2012. – Vol. 2. – № 3. – P. 43–58.

27. Seddawy Ahmed Bahgat El. Enhanced K-mean Algorithm to Improve Decision Support System under Uncertain Situations / Ahmed Bahgat El Seddawy, Sultan Turky, Khedr Ayman // IJCSNS International Journal of Computer Science and Network Security. – 2013. – Vol. 13. – № 7. – P. 50–58.

28. Sangameshwari B. Survey on Data Mining Techniques In Business Intelligence / B. Sangameshwari, P. A. Uma // International Journal Of Engineering And Computer Science. – 2014. – Vol. 3. – № 10. – P. 8575–8582.

29. Larose D. T. Discovering Knowledge in Data: An Introduction to Data Mining / D. T. Larose. – NJ: Wiley & Sons, Inc, 2004. – 240 p.

30. Evolution of data mining, Gartner Group Advanced Technologies and Applications Research Note, 2/1/95 [Електронний ресурс]. – Режим дос-тупу: http://www.thearling.com/text/dmwhite/dmwhite.htm.

Page 139: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

138

31. Дьяконов В. Математические пакеты расширения Matlab. Специа-льный справочник / В. Дьяконов, В. Круглов.– СПб.: Питер, 2001.– 480 с.

32. Минц А. Ю. Метод упрощения динамических рядов с использо-ванием генетических алгоритмов / А. Ю. Минц // Економічний вісник запорізької державної інженерної академії : зб. наук. праць. – Запоро-жье: ЗДІА, 2016. – Вип. 4 (04). – Ч. 2. – С. 120–124.

33. Минц А. Ю. Интеллектуальные методы анализа надежности уча-стников рынков финансовых услуг / А. Ю. Минц // Вісник Донецького університету економіки та права : зб. наук. праць. – Артемівськ: ДонУЕП, 2015. – № 2/2015. – С. 85–90.

34. Карпов Ю. Имитационное моделирование систем. Введение в моделирование с AnyLogic 5 / Ю. Карпов.– СПб.: БХВ-Петербург, 2005. – 400 с.

35. Форрестер Дж. Основы кибернетики предприятия (Индустриаль-ная динамика) / Дж. Форрестер. Пер. с англ. – М.: Прогресс, 1971. – 466 с.

36. Минц А. Ю. Моделирование ценообразования на рынке жилой недвижимости методами системной динамики / А. Ю. Минц // Техноло-гический аудит и резервы производства. – 2016. – № 5/4(31). – С. 39–45.

37. Мінц О. Ю. Моделювання процесів реструктуризації кредитів // Вісник Університету банківської справи НБУ: Зб. наук. праць. – К.: УБС НБУ, 2012. – № 2(14). – С. 329–333.

38. Schauerhuber M. Benchmarking Open-Source Tree Learners in R/RWeka / M. Schauerhuber, A. Zeileis, D. Meyer In C. Preisach, H. Burkhardt, L. Schmidt-Thieme, R. Decker (eds.) // Data Analysis, Machine Learning and Applications (Proceedings of the 31st Annual Conference of the Gesellschaft für Klassifikation e.V., Albert-Ludwigs-Universität Freiburg, 2007, March 7–9). – 2007. – P. 389–396.

39. Кнут Д. Искусство программирования. Том 1. Основные алгори-тмы / Дональд Кнут. – М.: Вильямс, 2006. – 720 с.

40. Ватутин Э. И. Основы дискретной комбинаторной оптимизации / Э. И. Ватутин, В. С. Титов, С. Г. Емельянов. – М.: АРГАМАК-МЕДИА, 2016. – 270 с.

41. Карпенко А. П. Современные алгоритмы поисковой оптимиза-ции. Алгоритмы, вдохновленные природой / А. П. Карпенко. – М.: Из-дательство МГТУ им. Н. Э. Баумана, 2014. – 446 с.

42. Паклин Н. Б. Бизнес-аналитика: от данных к знаниям / Н. Б. Пак-лин, В. И. Орешков. – СПб.: Питер, 2013. – 704 с.

43. Powers D. M. W. Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation / David M. W. Powers // Journal of Machine Learning Technologies. – 2011. – № 2 (1). – P. 37–63.

44. Mitchell Т. Machine learning / Т. Mitchell. – NY: McGraw-Hill, 1997. – 414 p.

Page 140: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

139

45. Нечеткие модели и нейронные сети в анализе и управлении эко-номическими объектами: монография / под ред. Ю. Г. Лысенко. – До-нецк: Юго-Восток, 2012. – 388 с.

References 1. Hilbert, M., & López P. (2011). The World’s Technological Capacity to

Store, Communicate, and Compute Information. Science, 332(6025), 60–65. 2. Bir, S. (2005). Mozg firmy. Moskow, Russia: Yeditorial URSS [in

Russian]. 3. Vitlinskiy, V.V. (2012). Shtuchnyi intelekt u systemi pryinyattya up-

ravlinskykh rishen. Neiro-nechitki tekhnologii modelyuvannya v ekonomitsi (Neuro-fuzzy modeling techniques in economics), 1, 97–118 [in Ukrainian].

4. Anfilatov, V. S., Yemel’yanov, A. A., & Kukushkin, A. A. (2002). Sistemnyi analiz v upravlenii. Moskow, Russia: Finansy i statistika [in Russian].

5. Matviychuk, A. V. (2011). Shtuchniy intelekt v ekonomitsi: neironni merezhi, nechitka logika. Kyiv, Ukraine: KNEU [in Ukrainian].

6. Haykin, S. (2006). Neyronnye seti: Polnyy kurs. Moskow, Russia: Wil-liams [In Russian].

7. Setlak, G. (2004). Intellektualnye sistemy podderzhki prinyatiya resheniy. Kyiv, Ukraine: LOGOS [in Ukrainian].

8. Copeland, J. (1993). Artificial Intelligence: A Philosophical Introduc-tion. Oxford: Wiley-Blackwell.

9. Subbotin, S. O. (2009) Neiteratyvni, evolyutsiyni ta multyagentni metody syntezu nechitkologichnykh i neyromerezhnykh modeley. Za-porizhzhya, Ukraine: ZNTU [in Ukrainian].

10. Sarayev, A. D., & Shcherbina, O. A. (2006). Sistemnyy analiz i sovremennyye informatsionnyye tekhnologii. Simferopol, Ukraine: SONAT [in Russian].

11. Makarov, I. M., Vinogradskaya, T. M., Rubchinskiy, A. A., & Sokolov, V. B. (1982). Teoriya vybora i prinyatiya resheniy. Moskow, Russia: Nauka [in Russian].

12. Vapnik, V. N., & Chervonenkis, A. Ya. (1971). On the uniform con-vergence of relative frequencies of events to their probabilities. Theoretical Probability and Its Applications, 17, 264–280.

13. Koiran, P., & Sontag, E. D. (1996). Neural networks with quadratic VC dimension. Advances in Neural Information Processing Systems, 8, 197–203.

14. Baum, E. B., & Haussler, D. (1989). What sixe net gives valid gener-alization? Neural Computation, 1, 151–160.

15. Kravchuk, E. V., & Khanter, E. (2000). Iskusstvennyye neyronnyye seti i geneticheskiye algoritmy. Donetsk, Ukraine: DonGU [in Russian].

16. Reshef, D. N., Reshef, Y. A., Finucane, H. K., & others. (2011). Detec-ting Novel Associations in Large Data Sets. Science, 334(6062), 1518–1524.

Page 141: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

140

17. Murphy, K. P. (2012). Machine Learning: A Probabilistic Perspec-tive. Cambridge, MA: MIT Press.

18. Mints, A. Yu. (2011). Metody otbora dannykh dlya neirosetevogo modelirovaniya. Modelyuvannya ta informatsiini systemy v ekonomitsi (Modelling and information systems in economy), 84 , 256–270 [in Russian].

19. Quinlan, R. J. (1994, September). C4.5: Programs for Machine Learning. Machine Learning, 3(16), 235–240.

20. Minsky, M. L., & Papert, S. A. (1969). Perceptrons. Cambridge, MA: MIT Press.

21. Erlikh, A. (1996). Tekhnicheskiy analiz tovarnykh i fondovykh ryn-kov. Moskow, Russia: Yuniti [in Russian].

22. Yezhov, A. A., & Shumskiy, S. A. (1998). Neyrokompyuting i yego primeneniya v ekonomike i biznese. Moskow, Russia: MIFI [in Russian].

23. Altshuller, G. S. (1979). Tvorchestvo kak tochnaya nauka. Moskow, Russia: Sovetskoye radio [In Russian].

24. Altshuller, G. S. (2011). Nayti ideyu: Vvedeniye v TRIZ – teoriyu resheniya izobretatel’skikh zadach. Moskow, Russia: Alpina Pablisherz [in Russian].

25. Mints, A. Yu. (2012). Obshchiye voprosy postanovki zadach v neirosetevom modelirovanii. Neiro-nechitki tekhnologii modelyuvannya v ekonomitsi (Neuro-fuzzy modeling techniques in economics), 1, 189–206 [in Russian].

26. Neelamadhab, P., Pragnyaban, M., & Panigrahi, R. (2012). The Sur-vey of Data Mining Applications and Feature Scope. International Journal of Computer Science, Engineering and Information Technology, 3(2), 43–58.

27. Seddawy, A. B. El, Turky, S., & Ayman, K. (2013). Enhanced K-mean Algorithm to Improve Decision Support System under Uncertain Situations. International Journal of Computer Science and Network Security, 7(13), 50–58.

28. Sangameshwari, B., & Uma, P. A. (2014). Survey on Data Mining Techniques in Business Intelligence. International Journal of Engineering and Computer Science, 10(3), 8575–8582.

29. Larose, D. T. (2004). Discovering Knowledge in Data: An Introduc-tion to Data Mining. Hoboken, New Jersey: Wiley & Sons.

30. Gartner Group Advanced Technologies and Applications Research Note. (1995). Evolution of data mining. Retrieved from http://www. thearling.com/text/dmwhite/dmwhite.htm.

31. D’yakonov, V., & Kruglov, V. (2001). Matematicheskiye pakety ras-shireniya Matlab. Spetsial’nyy spravochnik. St. Petersburg, Russia: Piter [in Russian].

32. Mints, A. Yu. (2016). Metod uproshcheniya dinamicheskikh ryadov s ispolzovaniyem geneticheskikh algoritmov. Ekonomichnyi visnyk zaporizkoi

Page 142: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Моделювання інноваційних інтелектуальних… Ю. Г. Лисенко, О. Ю. Мінц

141

derzhavnoi inzhenernoi akademii (Economic Bulletin of Zaporozhye State Engineering Academy), 4(2), 120–124 [in Russian].

33. Mints, A. Yu. (2015). Intellektualnyye metody analiza nadezhnosti uchastnikov rynkov finansovykh uslug. Visnyk donetskogo universytetu ekonomiky ta prava (Bulletin of the Donetsk University of Economics and Law), 2, 85–90 [in Russian].

34. Karpov, Yu. (2005). Imitatsionnoye modelirovaniye sistem. Vvedeni-ye v modelirovaniye s AnyLogic 5. St. Petersburg, Russia: BKHV-Peterburg [in Russian].

35. Forrester, J. (1971). Osnovy kibernetiki predpriyatiya (Industri-al’naya dinamika). Moskow, Russia: Progress [In Russian].

36. Mints, A. Yu. (2016). Modelirovaniye tsenoobrazovaniya na rynke zhiloy nedvizhimosti metodami sistemnoy dinamiki. Tekhnologicheskiy au-dit i rezervy proizvodstva (Technology audit and production reserves), 5/4(31), 39–45 [in Russian].

37. Mints, O. Yu. (2012). Modelyuvannya protsesiv restrukturyzatsii kredytiv Visnik Universytetu bankivskoi spravy NBU (Bulletin of the Univer-sity of Banking of the NBU), 2(14), 329–333 [in Ukrainian].

38. Schauerhuber, M., Zeileis, A., & Meyer, D. (2007, March 7–9). Benchmarking Open-Source Tree Learners in R/RWeka. Proceedings of the 31st Annual Conference of the Gesellschaft für Klassifikation e.v. (Albert-Ludwigs-Universität: Freiburg), 389–396.

39. Knut, D. (2006). Iskusstvo programmirovaniya. Tom 1. Osnovnyye algoritmy. Moskow, Russia: Williams [In Russian].

40. Vatutin, E. I., Titov, V. S., & Yemel’yanov, S. G. (2016). Osnovy diskretnoy kombinatornoy optimizatsii. Moskow, Russia: Argamak-Media [in Russian].

41. Karpenko, A. P. (2014). Sovremennyye algoritmy poiskovoy optimi-zatsii. Algoritmy, vdokhnovlennyye prirodoy. Moskow, Russia: MGTU im. N. E. Baumana [in Russian].

42. Paklin, N. B., & Oreshkov, V. I. (2013). Biznes-analitika: ot dannykh k znaniyam. St. Petersburg, Russia: Piter [in Russian].

43. Powers, D. M. W. (2011). Evaluation: From Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation. Journal of Machine Learning Technologies, 2(1), 37–63.

44. Mitchell, T. (1997) Machine learning. USA: McGraw-Hill. 45. Lysenko, Yu. G. (2012). Nechetkiye modeli i neyronnyye seti v

analize i upravlenii ekonomicheskimi obyektami. Donetsk, Ukraine: Yugo-Vostok [in Russian].

Стаття надійшла до редакції 31.05.2017

Page 143: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

УДК 338.124.4, 519.865.7

ВИБІР ОПТИМАЛЬНОЇ ТОПОЛОГІЇ НЕЙРОННОЇ МЕРЕЖІ В

ЗАДАЧАХ КЛАСИФІКАЦІЇ ДИНАМІЧНИХ ЕКОНОМІЧНИХ СИСТЕМ

І. І. Стрельченко Кандидат економічних наук, доцент,

докторант кафедри економіко-математичного моделювання

Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана» проспект Перемоги, 54/1, м. Київ, 03680, Україна

[email protected]

Стаття висвітлює головні ускладнення в процесі побудови та за-стосування нейронних мереж, які пов’язані, перш за все, з підбо-ром оптимальної внутрішньої структури, а для мереж типу карти Кохонена – кількості нейронів у прихованому шарі. Показано, що процес оптимізації нейронних мереж полягає в ітераційному знаходженні деяких параметрів, що забезпечують екстремум фу-нкції якості, яка, як правило, не має властивості неперервності та гладкості. Тому істотним недоліком такого підходу є неможли-вість забезпечення гарантій оптимальності застосовуваних ме-тодів і алгоритмів. Відповідно, у статті розроблено покроковий алгоритм конструю-вання карт Кохонена, призначених для вирішення задачі класи-фікації динамічних економічних систем відповідно до обраного критерію. У роботі вперше запропоновано використання ранго-вого коефіцієнта конкордації в якості критерію оптимальності для побудови нейронної мережі-класифікатора, який характери-зує ступінь узгодженості у наборі вхідних змінних. Експериментально протестовано покроковий алгоритм побудо-ви карти Кохонена, котра має оптимальну топологію за обраним критерієм і розбиває вихідну вибірку на шість груп. Відповідно до значень коефіцієнта конкордації реакція ключових макроеко-номічних індикаторів усередині отриманих кластерів характери-зується високим рівнем подібності. Ключові слова. Динамічна економічна система, фінансова криза, макроекономічний індикатор, класифікація, ранговий коефіцієнт конкордації, нейронна мережа, карта Кохонена.

© І. І. Стрельченко, 2017 142

Page 144: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Вибір оптимальної топології нейронної мережі… І. І. Стрельченко

143

ВЫБОР ОПТИМАЛЬНОЙ ТОПОЛОГИИ НЕЙРОННОЙ СЕТИ В ЗАДАЧАХ КЛАССИФИКАЦИИ ДИНАМИЧЕСКИХ

ЭКОНОМИЧЕСКИХ СИСТЕМ

И. И. Стрельченко

Кандидат экономических наук, доцент, докторант кафедры экономико-математического моделирования

Государственное высшее учебное заведение «Киевский национальный экономический университет имени Вадима Гетьмана»

проспект Победы, 54/1, г. Киев, 03680, Украина

[email protected] Статья посвящена решению проблем, возникающих в процессе построения и применения нейронных сетей, которые связаны, прежде всего, с подбором их оптимальной внутренней структу-ры, а для сетей типа карты Кохонена – количества нейронов в скрытом слое. Показано, что процесс оптимизации нейронных сетей заключается в итерационном определении некоторых па-раметров, обеспечивающих экстремум функции качества, кото-рая, как правило, не имеет свойства непрерывности и гладкости. Поэтому существенным недостатком такого подхода является невозможность обеспечения гарантий оптимальности применя-емых методов и алгоритмов. Соответственно, в статье разработан пошаговый алгоритм конс-труирования карт Кохонена, предназначенных для решения за-дачи классификации динамических экономических систем в соо-тветствии с выбранным критерием. В работе впервые предложено использование рангового коэффициента конкорда-ции в качестве критерия оптимальности при построении ней-ронной сети-классификатора, который характеризует степень согласованности в наборе входных переменных. Экспериментально протестирован пошаговый алгоритм оптими-зации топологии карты Кохонена согласно выбранному крите-рию, разбивающий в результате исходную выборку на шесть групп. В соответствии со значениями коэффициента конкорда-ции реакция ключевых макроэкономических индикаторов внут-ри полученных кластеров характеризуется высоким уровнем сходства. Ключевые слова. Динамическая экономическая система, финан-совый кризис, макроэкономический индикатор, классификация, ранговый коэффициент конкордации, нейронная сеть, карта Кохонена.

Page 145: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

144

SELECTION OF A NEURAL NETWORK OPTIMUM TOPOLOGY IN

PROBLEMS OF DYNAMIC ECONOMIC SYSTEMS CLASSIFICATION

Inna Strelchenko PhD in Economics, Docent,

DSc Candidate, Department of Economic and Mathematical Modeling

State Higher Educational Establishment «Kyiv National Economic University named after Vadym Hetman»

54/1 Peremogy Avenue, Kyiv, 03680, Ukraine

[email protected]

The article is dedicated to solve the main disadvantage, which arise in the process of constructing and applying neural networks and associated primarily with the selection of optimal internal structure, and for the Kohonen maps – with the number of neurons in the hidden layer. It is shown that the process of optimization of neural networks consists in iterative finding of some parameters that provide an extremum of the quality function, which, as a rule, does not have the property of continuity and smoothness. Therefore, a significant drawback of this approach is the inability to ensure the guarantees of the optimality of applied methods and algorithms. Accordingly, in the article a step-by-step algorithm for constructing Kohonen maps is developed, which intended to solve the problem of classifying dynamic economic systems in accordance with the chosen criterion. For the first time, it was proposed to use the rank coefficient of concordance as an optimality criterion for constructing a neural network-classifier that characterizes the degree of coherence in a set of input variables. It was experimentally tested step-by-step algorithm for constructing the Kohonen map, which has the optimal topology according to the chosen criterion and splits the original sample into six groups. In accordance with the values of the concordance coefficient, the reaction of key macroeconomic indicators within the obtained clusters is characterized by a high level of similarity.

Keywords. Dynamic economic system, financial crisis, macroeconomic indicator, classification, ranking coefficient of concordance, neural network, Kohonen map.

JEL Classification: C45, F36, G15, G17

Вступ

На етапі первинного аналізу великих масивів неструктурова-ної економічної інформації актуальною є задача узагальнення,

Page 146: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Вибір оптимальної топології нейронної мережі… І. І. Стрельченко

145

класифікації та візуалізації вихідних даних, яка надасть можли-вість виявити внутрішні закономірності для коректнішої побудо-ви економіко-математичних моделей.

У випадку, коли кожна точка простору вимірів описується двома або трьома показниками, побачити подібність між окре-мими елементами вибірки можна за допомогою графіків і діаг-рам. Набагато складніше виконати класифікацію масивів багато-вимірних даних. Для вирішення такого класу задач найчастіше використовують проекційні методи, кластерний аналіз і методи, засновані на використанні карт Кохонена.

Серед основних переваг карт, що самоорганізуються, відзна-чимо простоту реалізації, високу апроксимаційну здатність, мож-ливість обробки нових даних у режимі реального часу.

У загальному випадку процес моделювання на основі карти, що самоорганізується, включає в себе такі етапи:

1) збір даних для навчання; 2) підготовка даних (вибір єдиної шкали, нормалізація); 3) вибір топології майбутньої карти (кількість нейронів при-

хованого шару); 4) експериментальний підбір характеристик мережі; 5) навчання; 6) перевірка адекватності нейронної мережі та коригування

параметрів; 7) вербалізація (словесний опис) отриманих результатів. Найбільш дискусійним і складним питанням у процесі побудо-

ви нейронних мереж типу карти Кохонена є вибір кількості нейро-нів у прихованому шарі. Адже ускладнення архітектури нейронної мережі дає покращення апроксимації лише до певної межі, потім відбувається процес, що отримав назву «деградації» [1].

Тому для вибору найраціональнішої структури мережі постає питання чисельної оцінки оптимальності отриманого розв’язку. В задачах кластеризації, у тому числі на основі карт Кохонена, коли об’єктом дослідження виступають економічні процеси, порівняти отримані результати групування з певним еталонним значенням неможливо в принципі. У випадку, якщо потрібно оцінити подіб-ність динаміки множини макроекономічних індикаторів за пев-ний проміжок часу для вибірки з кількох десятків країн, рецептів оцінки оптимальності отриманої класифікації не існує.

Page 147: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

146

Мета і завдання дослідження

Враховуючи зазначене, постає актуальна задача розробки аде-кватного критерію оптимальності процесу кластеризації, який визначатиме відповідну топологію нейронної мережі типу карти Кохонена, що обумовлює мету дослідження.

Досягнення мети передбачає необхідність розв’язання таких завдань:

1) обрати критерій оптимальності, котрий відповідає таким вимогам:

- може бути виміряний чисельно та знаходиться в межах пе-вного інтервалу;

- має зрозумілу вербальну інтерпретацію; - дозволяє працювати з неоднорідними вихідними даними; - дає можливість визначити подібність реакції динамічних

економічних систем всередині визначеного кластеру; 2) побудувати нейронну мережу типу карти Кохонена з топо-

логією, оптимальною за обраним критерієм; 3) провести моделювання з отриманням відповідних виснов-

ків та рекомендацій.

Виклад основного матеріалу дослідження

Дослідження впливу критерію оптимальності на результат кластеризації із застосуванням карт Кохонена здійснюватимемо на прикладі країн із різним рівнем розвитку економіки у період протікання світової фінансової кризи 2007–2009 рр. З цією метою сформовано вибірку з 65 країн, представлену макроекономічни-ми індикаторами: валовий внутрішній продукт, зовнішні зо-бов’язання резидентів країни перед нерезидентами, валютний курс, обсяг золотовалютних резервів, вартість державних обліга-цій. Таким чином, масив вихідних даних складається з 65×5×12=3900 елементів.

Якщо розглянути розмірність даних, то кожна країна характе-ризується п’ятьма координатами – значеннями макроекономічних індикаторів, які, у свою чергу, мають глибину в дванадцять що-квартальних замірів. Загалом така система характеристик вклада-ється у шість вимірів: час і п’ять макроекономічних показників.

Задача кластеризації полягає у розподілі заданої сукупності країн за групами, в межах яких динаміка обраних індикаторів

Page 148: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Вибір оптимальної топології нейронної мережі… І. І. Стрельченко

147

протягом зазначеного періоду буде подібною. Вище було вста-новлено вимоги до критерію «подібності» (зрозуміла інтерпре-тація, відсутність обмежень на однорідність даних, числова оці-нка в границях обмеженої шкали рівня подібності реакції динамічних систем).

Розглянемо існуючі підходи до визначення поняття «обґрунто-ваності кластеризації» на предмет відповідності даним вимогам.

Перший підхід визначає якість кластеризації як міру відповід-ності між отриманим розподілом і реально існуючими класами елементів навчальної вибірки [2]. Для поставленої задачі такий вид оцінки є неможливим через відсутність еталонної кластерної структури вибірки за визначеними показниками.

Друге визначення якості кластеризації ґрунтується на оціню-ванні характеристик отриманої структури кластерів. З цією ме-тою визначають дві так звані властивості обґрунтованості клас-теризації (англійський термін «cluster validity») [2–4]:

1) компактність кластерів – елементи кожного кластеру мають бути розташовані якомога ближче один до одного. Вимірюють за допомогою показників математичної статистики (середня відс-тань між елементами кластера, середньоквадратичне відхилення), індексів обґрунтованості (RMSSD-індекс, SD-індекс);

2) відокремленість кластерів – кластери мають бути чітко ві-докремлені один від одного. Вимірюють за допомогою показни-ків математичної статистики (середня відстань між об’єктами з різних кластерів), індексів обґрунтованості (індекс Данна, SD-індекс, RS-індекс).

Проте показники обґрунтованості кластеризації не дають ві-дповіді на принципове питання: «Чи характеризуються країни всередині кожного окремого кластера подібністю в коливаннях визначених макроекономічних індикаторів протягом досліджува-ного періоду, і в якій мірі?».

Зважаючи на це, автор пропонує використати в якості крите-рію «подібності» ранговий коефіцієнт конкордації Кендала [5–7]. Він характеризує ступінь узгодженості між набором змінних, що є оцінками множини вихідних даних:

)(

1232 nnm

SW

, (1)

Page 149: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

148

де n – кількість об’єктів, що підлягають ранжуванню; m – кіль-кість вибірок; S знаходиться за формулою:

n

i

i RRS1

2)( , (2)

де Ri – сума рангів i-го об’єкту (

m

j

iji RR1

); R – середнє суми

рангів за всіма об’єктами. У термінах вирішуваної задачі змінні, що увійшли до виразів

(1) і (2), мають таку інтерпретацію: n – довжина часового ряду (n = 12); m – кількість країн, що увійшли до конкретного кластеру (приймає значення від 1 до 65).

R – вектор рангів від 1 до 12, що проставляються по рядках кожної з п’яти матриць індикаторів окремо для кожної країни та-ким чином, щоб максимальному значенню індикатора призначав-ся ранг 1, а найменше значення показника отримувало ранг 12. Така процедура повторюється для всіх рядків матриць (m разів за кількістю країн кластера). За таких умов i-ий об’єкт у формулах (1) і (2) описується вектором елементів Rij, які є рангами всіх кра-їн даного кластеру у i-му періоді.

Розраховане значення коефіцієнта конкордації вказує, чи існує схожість у тому, як змінювався цільовий показник у межах даної групи країн. Значення коефіцієнта конкордації знаходиться в ін-тервалі 0 ≤ W ≤ 1. Якщо W = 0, то послідовності рангів різних країн кластеру у відповідні періоди є абсолютно неузгодженими (несхожими). У випадку W = 1 результат інтерпретується як пов-ний збіг у динаміці досліджуваних показників. Чим ближче W до 1, тим більша узгодженість спостерігається у вихідних рядах да-них за різними країнами в межах одного кластеру.

Використання коефіцієнта конкордації на початковій фазі до-слідження має ряд переваг:

1) він немає обмежень щодо типу розподілу вхідних даних; 2) не потрібно попередньо обробляти вихідні дані, щоб спів-

віднести їх до спільної шкали; 3) відсутні обмеження на розподіл оцінок у рядках матриці

рангу, наприклад, нормальний розподіл або лінійні співвідно-шення;

Page 150: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Вибір оптимальної топології нейронної мережі… І. І. Стрельченко

149

4) має просту та інтуїтивно зрозумілу інтерпретацію. Значення коефіцієнта конкордації дозволить оцінити рівень

подібності у динаміці відібраних індикаторів у кризовий період. Для того аби протестувати ефективність використання коефі-

цієнта конкордації для визначення оптимальної топології карти Кохонена, розрахуємо певні його стартові значення для подаль-шого порівняння. Зокрема, розділимо вихідну вибірку вручну на дві групи відповідно до загальноприйнятої класифікації Міжна-родного валютного фонду на країни з розвиненою економікою та групу країн з економікою, що розвивається. Обчислимо значення коефіцієнта конкордації для кожного з п’яти індикаторів. Резуль-тати розрахунків представлено у вигляді пелюсткової діаграми на рис. 1.

Рис. 1. Пелюсткова діаграма рангового коефіцієнта конкордації для двох груп країн за класифікацією МВФ:

країни з розвинутою економікою – суцільна лінія; країни з економікою, що розвивається – переривчаста лінія

Значення коефіцієнта конкордації свідчать про низький рівень

подібності динаміки досліджуваних індикаторів у межах кожної групи. Зокрема, для групи країн з розвинутою економікою лише два з п’яти показників мають значення коефіцієнта конкордації трохи більші за 0,5: для валютного курсу W1 = 0,5183 і міжнарод-ної інвестиційної позиції W3 = 0,5426. Що стосується групи країн з економікою, котра розвивається, значення коефіцієнта для всіх

0

0,1

0,2

0,3

0,4

0,5

0,6Валютний курс

ВВП

Міжнародна інвестиційна

позиціяВалютні резерви

Вартість державних облігацій

Page 151: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

150

показників не перевищує 0,4. Це вказує на те, що процес прохо-дження світової фінансової кризи 2007–2009 рр. різними країна-ми не залежав від того, чи вони належать до групи країн з розви-нутою економікою або таких, що розвиваються.

Отже, відповідно до мети дослідження постає питання розбит-тя множини досліджуваних країн на групи, однорідні за проце-сом проходження через фінансову кризу. Це вимагає вирішення задачі побудови нейронної мережі типу карти Кохонена з топо-логією, оптимальною за обраним критерієм. Для вибору оптима-льної структури майбутнього класифікатора на основі рангового коефіцієнта конкордації розроблено та програмно реалізовано в системі MATLAB алгоритм, що складається з таких кроків:

1) задається кількість кластерів n нейронної мережі. Верхня межа показника визначається з емпіричного співвідношення [8]:

e

NN nv

% , (3)

де Nnv – розмір навчальної вибірки (Nnv = 65); %e – відсоток по-милки навчання (%e = 0,1). Звідси максимально можлива кіль-кість кластерів max(N) = 6;

2) відбувається попередня нормалізація даних; 3) будується нейронна мережа із заданою на першому кроці

кількістю кластерів N; 4) обчислюються коефіцієнти рангової конкордації для отри-

маної кластерної структури

kNl

kNj

kN

kil

kij

ki

kl

kj

k

W...,W...,W

W...,W...,W

W...,W...,W

1

1

1111

, де l –

кількість макроекономічних індикаторів (l = 5), k – номер ітерації

алгоритму;

5) розраховується критерій оптимальності

N

i

l

j

kij

kN WPO

1 1

;

6) відбувається порівняння параметрів оптимальності – пото-

чної та отриманої на попередній ітерації: якщо 1 kN

kN POPO , то

Page 152: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Вибір оптимальної топології нейронної мережі… І. І. Стрельченко

151

структура нейронної мережі, що має більше значення параметра

оптимальності, зберігається окремо в робочій області; 7) ітерації алгоритму продовжуються до тих пір, доки не бу-

дуть перевірені всі можливі кластерні структури. Кілька структур нейронної мережі, що були отримані під час

моделювання, наведено на рис. 2.

Рис. 2. Структура карти Кохонена, отримана на різних ітераціях роботи алгоритму

Результатом роботи оптимізаційного алгоритму стала карта

Кохонена, що розбиває початкову вибірку на шість груп і має то-пологію, оптимальну за обраним критерієм. Візуалізацію підсум-кової кластерної структури наведено на рис. 3.

Page 153: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

152

Рис. 3. Кластерна структура нейронної мережі типу карти Кохонена, оптимальна за обраним критерієм

На рис. 4 зображено пелюсткову діаграму рангового коефіціє-

нта конкордації, що відповідає нейронній мережі з оптимальною топологією.

Рис. 4. Пелюсткова діаграма рангового коефіцієнта конкордації,

що відповідає оптимальній кластерній структурі нейронної мережі-класифікатора

0

0,2

0,4

0,6

0,8

1Валютний курс

ВВП

Міжнародна інвестиційна позиціяВалютні резерви

Вартість державних облігацій

Page 154: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Вибір оптимальної топології нейронної мережі… І. І. Стрельченко

153

Порівнюючи отримані значення коефіцієнта робимо висновок про суттєве зростання подібності в динаміці макроекономічних індикаторів (валовий внутрішній продукт, зовнішні зобов’язання резидентів країни перед нерезидентами, валютний курс, обсяг зо-лотовалютних резервів, вартість державних облігацій) всередині кожної з шести груп у порівнянні зі стартовою класифікацією.

Так, значення коефіцієнта конкордації не опускається нижче 0,5 і в 50 % випадків знаходиться у межах від 0,7 до 0,9, що свід-чить про високий рівень подібності у реакції досліджуваних ди-намічних економічних систем зі сформованих груп на протікання світової фінансової кризи 2007–2009 рр.

Для перевірки зроблених висновків щодо адекватної роботи алгоритму побудовано графіки динаміки темпів змін валютного курсу для 1-го та 2-го кластерів, котрі характеризуються високими

значеннями коефіцієнта конкордації – 7832,01811 W і 7962,018

12 W ,

відповідно (рис. 5). А також для третього кластера, що характе-

ризується трохи нижчим рівнем подібності: 6052,01813 W .

З отриманої візуалізації на рис. 5 чітко видно схожість у динаміці валютного курсу, що була притаманна економікам країн всередині кожного кластера під час фінансової кризи 2007–2009 рр. Щільність розташування графіків динаміки відповідає абсолютним значенням коефіцієнта конкордації. Так, кластер номер два (Австралія, Канада, Нова Зеландія, Норвегія, Швеція, Індонезія, Кірибаті, Самоа, Тонга, Вануату, Угорщина, Польща, Сербська Республіка), котрий має найвище значення коефіцієн-та, демонструє настільки високу подібність, що подекуди лінії графіків збігаються. А період максимального падіння валютного курсу для всіх країн даної групи є ідентичним і припадає на че-твертий квартал 2008 року.

Трохи розмитішою виглядає сукупність графіків динаміки темпів зміни валютного курсу в кластері номер один (Єврозона, Естонія, Литва, Чехія, Данія, Ізраїль, Сінгапур, Швейцарія, Спо-лучені Штати Америки та ін.). Проте на рисунку чітко видно точ-ку максимального просідання вартості національних грошових одиниць по відношенню до долара США – це четвертий квартал 2008 року. Та, на відміну від другого кластера, йому передувало

Page 155: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

154

помітне зростання валютного курсу у четвертому кварталі 2007 року – першому кварталі 2008 року.

Рис. 5. Графіки динаміки темпів змін валютного курсу для країн, що потрапили у перший, другий і третій кластери, відповідно

Page 156: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Вибір оптимальної топології нейронної мережі… І. І. Стрельченко

155

Інша динаміка характеризує країни, що увійшли до третього

кластера (Бангладеш, Вірменія, Грузія, Молдова). Він характери-

зується довшим латентним періодом [9] і максимальним падін-

ням показника у першому півріччі 2009 року. Значення коефіці-

єнта конкордації 6052,01813 W очікувано супроводжується ще

меншою близькістю розташування ліній у просторі, проте їх

форма, що відповідає напрямку реакції економічних систем країн

на протікання світової фінансової кризи, є дуже подібною. Висновки і перспективи подальших досліджень у даному напрямку У результаті проведеного дослідження запропоновано та впе-

рше обґрунтовано використання непараметричного критерію – рангового коефіцієнта конкордації – для застосування в задачах класифікації динамічних економічних систем. Він відповідає ви-могам щодо зрозумілої інтерпретації, відсутності обмежень на однорідність даних, числової оцінки в границях обмеженої шкали рівня подібності реакції динамічних систем.

Розроблено покроковий алгоритм побудови нейронної мережі типу карти Кохонена, призначеної для вирішення задачі класифі-кації вихідної вибірки відповідно до обраного критерію.

Отримані переконливі результати щодо коректності застосу-вання рангового коефіцієнта конкордації для вирішення класу за-дач класифікації багатовимірних даних, коли кожний досліджу-ваний об’єкт характеризується набором характеристик у динаміці на певну хронологічну глибину.

Проведене експериментальне дослідження дозволило розподі-лити вихідну вибірку з шістдесяти п’яти країн на шість кластерів за максимальним значенням критерію оптимальності. В середині кожної групи динаміка кожного індикатора характеризується ви-соким рівнем подібності, що підтверджено абсолютними значен-нями коефіцієнта конкордації та графічною візуалізацією отри-маних результатів.

Розроблений підхід може бути використаний під час вирішен-ня задач розподілу на кластери інших об’єктів, котрі мають схожі особливості класифікаційних ознак. Зокрема, в задачах медичної

Page 157: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

156

сфери (для роботи з кардіограмами пацієнтів із серцево-судин-ними захворюваннями, що мають тривалу історію хвороби), со-ціальної сфери (для оцінки стану розвитку країн за рівнем життя населення, станом медичного обслуговування, смертності та ін.), машинного навчання (пошуку закономірностей в інтернет-запитах користувачів, підбору контекстної реклами тощо).

Література 1. Jothi S. Avoiding Network Performance Degradation Problem in

Zigbee / S. Jothi, D. Daniel, J. Durairani, A. Rekha // International Journal of Innovative Research in Computer and Communication Engineering. – 2015. – Vol. 3. – Is. 3. – P. 1438–1445.

2. Hammah E. Validity Measures for the Fuzzy Cluster Analysis of Orientations / E. Hammah, E. Reginald, J. Curran // IEEE Transacions on pattern analysis and machine intelligence. – 2000. – Vol. 22. – Is. 12. – P. 1467–1472.

3. Chen Li. Clustering for Approximate Similarity Search in High-Dimensional Spaces / Chen Li, E. Y. Chang, H. Garcia-Molina, G. Wiederhold // IEEE Transactions on Knowledge and Data Engineering. – 2002. – Vol. 14. – No. 4. – P. 792–808.

4. Kanth K. Dimensionality reduction for similarity searching in dynamic databases / K. Kanth, D. Agrawal, A. Singh // Proceedings of the 1998 ACM SIGMOD international conference on Management of data (Seattle, Washington, USA), 1998. – P. 166–176.

5. Kendall M. G. Rank correlation methods / M. G. Kendall // New York: Hafner Publishing Co. – 1955. – 160 p.

6. Kendall M. G. The problem of m rankings / M. G. Kendall, B. S. Babington // Annals of Mathematical Statistics. – 1939. – No. 10. – Vol. 3. – P. 275–287.

7. Legendre P. Species associations: The Kendall coefficient of concordance revisited / P. Legendre // Journal of Agricultural, Biological, & Environmental Statistics. – 2005. – Vol. 10. – P. 226–245.

8. Hush D. Progress in supervised neural network / D. Hush, B. Horne // IEEE Signal Processing Magazine. – 1993. – No. 10. – Vol. 1. – P. 8–39.

9. Матвійчук А. В. Використання системи випереджальних інди-каторів для прогнозування негативних зрушень на фінансовому ринку України / А. В. Матвійчук, І. І. Стрельченко // Фінанси України. – 2015. – № 8. – С. 74–87. – Режим доступу: http://nbuv.gov.ua/ UJRN/Fu_2015_8_7.

Page 158: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Вибір оптимальної топології нейронної мережі… І. І. Стрельченко

157

References 1. Jothi, S., Daniel, D., Durairani, J.A., & Rekha, A. (2015). Avoiding

Network Performance Degradation Problem in Zigbee. International Journal of Innovative Research in Computer and Communication Engineering, 3(3),

1438–1445.

2. Hammah, E., Reginald, E., & Curran, J. (2000). Validity Measures for

the Fuzzy Cluster Analysis of Orientations. IEEE Transacions on pattern analysis and machine intelligence, 22(12), 1467–1472.

3. Chen, Li, Chang, E. Y., Garcia-Molina, H., & Wiederhold, G. (2002,

July). Clustering for Approximate Similarity Search in High-Dimensional

Spaces. IEEE Transactions on Knowledge and Data Engineering, 14(4),

792–808. doi: 10.1109/TKDE.2002.1019214

4. Kanth, K., Agrawal, D., & Singh, A. (1998, June 01–04). Dimensi-

onality reduction for similarity searching in dynamic databases. Proceedings of the 1998 ACM SIGMOD international conference on Management of data (Seattle, Washington, USA), 166–176. doi: 10.1145/276304.276320

5. Kendall, M. G. (1955). Rank correlation methods. New York: Hafner

Publishing Co.

6. Kendall, M. G., & Babington, B. S. (1939). The problem of m

rankings. Annals of Mathematical Statistics, 10(3), 275–287.

7. Legendre, P. (2005). Species associations: The Kendall coefficient of

concordance revisited. Journal of Agricultural, Biological, & Environmental Statistics, 10, 226–245.

8. Hush, D., & Horne, B. (1993). Progress in supervised neural network.

IEEE Signal Processing Magazine, 10(1), 8–39.

9. Matviychuk, A. V., & Strelchenko, I. I. (2015). Vykorystannya

systemy vyperedzhauchikh indykatoriv dlya prognozuvannya negatyvnykh

zrushen’ na finansovomu rynku Ukrainy. Finansy Ukrainy (Finance of Ukraine), 8, 74–87. Retrieved from http://nbuv.gov.ua/UJRN/Fu_2015_8_7

[in Ukrainian].

Стаття надійшла до редакції 13.06.2017

Page 159: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

УДК 330.46:519.71

ЗАСТОСУВАННЯ МАТЕМАТИЧНИХ МОДЕЛЕЙ ДЛЯ ГОЛОСОВОЇ

ІДЕНТИФІКАЦІЇ СУБ’ЄКТІВ У СФЕРІ ФІНАНСОВОЇ БЕЗПЕКИ

Є. Ю. Щербаков

Кандидат економічних наук, начальник науково-виробничого відділу

ТОВ «Науково-виробничий центр «Інфозахист» вул. Верховинна, 59, м. Київ, 03115, Україна

[email protected]

У статті проведено дослідження з вибору найефективніших ма-тематичних методів та оптимальних комбінацій параметрів по-передньої обробки даних у вирішенні завдань біометричної іден-тифікації. Досліджено етапи підготовки даних, поданих у вигляді часових рядів, для завдань розпізнавання образів. Встановлено ознаки потоку даних, які можуть бути використані як вхідні па-раметри для побудови моделі класифікації. Проведено порівня-льний аналіз точності моделей класифікації, побудованих з ви-користанням штучних нейронних мереж, комітетів дерев прий-няття рішень та алгоритму опорних векторів, а також порівнян-ня показників витрат комп’ютерного часу на побудову таких мо-делей. Для зменшення витрат часу для пошуку гіперпараметрів запропоновано застосовувати двоетапний підхід зі скороченням розміру навчальної вибірки та залученням спрощених математи-чних методів на попередньому етапі пошуку. Проведена експе-риментальна перевірка підтвердила доцільність застосування такого підходу в процесі оптимізації параметрів підготовки да-них і конфігурації нейронної мережі та засвідчила його ефекти-вність з точки зору витрат комп’ютерного часу. Висновки з проведеного дослідження та побудовані моделі можуть бути використані банківськими структурами та іншими установами, зацікавленими в біометричній ідентифікації особи за голосом. Ключові слова: Біометрична ідентифікація, нейромережа, ко-мітети дерев прийняття рішень, оптимізація гіперпараметрів, витрати процесорного часу.

© Є. Ю. Щербаков, 2017 158

Page 160: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

159

ПРИМЕНЕНИЕ МАТЕМАТИЧЕСКИХ МОДЕЛЕЙ ДЛЯ ГОЛОСОВОЙ ИДЕНТИФИКАЦИИ СУБЪЕКТОВ

В СФЕРЕ ФИНАНСОВОЙ БЕЗОПАСНОСТИ

Е. Ю. Щербаков

Кандидат экономических наук, начальник научно-производственного отдела

ООО «Научно-производственный центр «Инфозахист» ул. Верховинная, 59, г. Киев, 03115, Украина

[email protected]

В статье проведено исследование, посвященное выбору наиболее эффективных математических методов и поиску оптимальных комбинаций параметров предварительной обработки данных в решении задач биометрической идентификации. Исследованы этапы подготовки данных, представленных в виде временных рядов, для задач распознавания образов. Установлены признаки потока данных, которые могут быть использованы как входные параметры для построения модели классификации. Проведен сравнительный анализ точности моделей классификации, пост-роенных с использованием искусственных нейронных сетей, ко-митетов деревьев принятия решений и алгоритма опорных век-торов, а также сравнение показателей затрат компьютерного времени на построение таких моделей. Для уменьшения затрат времени для поиска гиперпараметров предложено применять двухэтапный подход с сокращением объема обучающей выборки и привлечением упрощенных математических методов на пред-варительном этапе поиска. Проведенная экспериментальная проверка подтвердила целесообразность применения такого по-дхода в процессе оптимизации параметров подготовки данных и конфигурации нейронной сети, а также показала его эффектив-ность с точки зрения затрат компьютерного времени. Выводы из проведенного исследования и построенные модели могут быть использованы банковскими структурами и другими учреждени-ями, заинтересованными в биометрической идентификации ли-чности по голосу. Ключевые слова: Биометрическая идентификация, нейросеть, комитеты деревьев принятия решений, оптимизация гиперпара-метров, расходы процессорного времени.

Page 161: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

160

APPLICATION OF MATHEMATICAL MODELS FOR VOICE IDENTIFICATION IN THE FIELD OF FINANCIAL SECURITY

Yehor Shcherbakov PhD in Economics,

Head of the Scientific and Production Department

LLC "Scientific and Production Center "INFOZAHIST" 59 Verhovynna Str., Kyiv, 03115, Ukraine

[email protected]

The article is devoted to choosing the most effective mathematical methods and optimal parameters combinations on data preparation and modeling in solving the problems of biometric identification. Stages of the time series data transformation into the form, applicable for pattern recognition tasks, are discovered. The components of the data flow that can be used as input parameters for building a classi-fication model are developed. A comparative analysis of the accuracy of classification models built using artificial neural networks, decision trees committees and support vector algorithm is performed. It’s given the comparison of the cost of computer time to build such models. To reduce the computational cost of searching for hyper-parameters there proposed to use two-phased approach on reducing the size of the training sample and simplifying mathematical methods in the preliminary step of search. Experimental testing confirmed the applicability of the approach to optimize the parameters of the data and configuration of the neural network and its efficiency in terms of cost of computer time. Findings from the research and the built models may be used by banking institutions and other organizations interested in biometric identification by voice.

Keywords: Biometric identification, neural network, Random forest method, hyper-parameters optimization, computational costs.

JEL Classіfіcatіon: C45, C61, C89

Постановка проблеми та її зв’язок із важливими науковими чи практичними завданнями

Підтвердження особи є однією з суттєвих складових банківсь-кого процесу. Так, у 2003 році ідентифікація клієнта стала безу-мовною вимогою до всіх фінансових інститутів США при прове-денні всіх фінансових транзакцій [1]. Окрім того, відповідно до програми запобігання відмиванню грошей, впровадженої урядом США [2], обов’язковій ідентифікації підлягають не тільки фізич-ні особи, які здійснюють банківські операції, але й особи, пов’я-зані з управлінням юридичними особами, а також задіяні у опе-

Page 162: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

161

раціях з кредитними спілками, ощадними асоціаціями та деякими іншими фінансовими установами.

У той же час, розвиток технологій і рівня сервісу фінансових структур вимагає методів ідентифікації особи, які дозволяли б здійснення операцій та обслуговування віддалено, засобами те-лефонного банкінгу, інтернет-банкінгу тощо.

Деякі з банківських операторів починають переходити на біо-метричні технології ідентифікації, зокрема один з найбільших сві-тових банків Barclays, який запровадив систему пасивної голосової автентифікації клієнтів. Згідно з [2] для перевірки автентичності цією установою потребується близько 20 секунд аудіо-даних.

Окрім того, біометрична ідентифікація вважається безпечнішим методом, ніж автентифікація на основі пароля або процесу «секре-тне питання», і тому її розвиток та поширення може вбачатись одним із пріоритетних напрямків підвищення якості та безпеки обслуговування у фінансовій сфері.

Аналіз останніх досліджень та публікацій

Розпізнавання особи за голосом відноситься до класу задач розпізнавання образів [4]. У більшості досліджень [5] розділя-ються завдання розпізнавання голосового мовлення, розпізнаван-ня особи, що говорить (диктора), та підтвердження автентичності особи, що говорить (диктора).

У задачі розпізнавання диктора вхідними показниками для моделювання у більшості джерел розглядаються мел-частотні ке-пстральні коефіцієнти та кепстральні коефіцієнти лінійного пе-редбачення, а також використовуються характеристичні вектори довжиною від 12 [6] до 60 [7, 8] показників, тобто діапазонів час-тот, для яких здійснюється обчислення сумарної енергії сигналу.

Разом з тим, порівняння використання різного типу вхідних показників, проведене у [9], показало, що використання мел-частотних кепстральних коефіцієнтів дає кращі результати, ніж використання кепстральних коефіцієнтів лінійного передбачення. У [7] висвітлено позитивний ефект від видалення шумової ком-поненти вхідного сигналу, а також запропоновано використову-вати метод опорних векторів при побудові класифікатора.

У [6, 10] для побудови систем розпізнавання особи, що гово-рить, та мови, на якій ця особа говорить, пропонується викорис-товувати нейронні мережі, зокрема нейронні мережі глибокого навчання. Запропоновано використовувати нейронну мережу з

Page 163: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

162

великою кількістю прихованих шарів, один з яких є так званим «вузьким місцем» моделі, завданням якого є пониження розмір-ності вектора вхідних параметрів.

Виділення невирішених раніше частин загальної проблеми, котрим присвячується стаття

Незважаючи на те, що напрацювання щодо аналізу аудіо-даних і часових послідовностей мають достатньо тривалу істо-рію, з огляду на широкий асортимент доступних на сьогодні ма-тематичних методів, вибір найефективніших з них для аналізу мовлення залишається дискусійним питанням.

Окрім того, незважаючи на те, що останнім часом набули зна-чної популярності методи математичного аналізу, пов’язані з розпізнаванням зображень та аудіо-потоків на основі нейронних мереж, вибір конфігурації мережі та вхідних даних для неї є за-вданням, яке доводиться щоразу заново вирішувати при побудові інформаційної системи, зважаючи на особливості її застосування.

Відповідно, ця стаття присвячена дослідженню з вибору найефективніших математичних методів, оптимальних комбіна-цій параметрів підготовки даних і побудови моделей розпізна-вання особи за голосом.

Формулювання мети і завдання дослідження

Метою статті є розробка методу розпізнавання особи, що го-ворить, на основі частотного аналізу діалогу за участі цієї особи, що передбачає вирішення таких завдань:

1) формування вектора факторів впливу для проведення аналі-зу та розпізнавання голосів;

2) розробка алгоритму та його реалізація у вигляді програмно-го скрипта для автоматизації розпізнавання особи, що говорить, у діалозі з іншою особою, зокрема, банківським оператором;

3) формування навчальної вибірки, що включає записи моноло-гів і діалогів з різних джерел, включаючи стільниковий зв’язок, супутниковий телефон, радіозв’язок короткохвильового діапазону;

4) вибір математичного інструментарію та побудова моделі, що дозволяє визначати особу, що говорить, за її голосом з доста-тньою достовірністю;

5) аналіз якості, прогностичних можливостей та оперативності роботи побудованої моделі.

Page 164: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

163

Виклад основного матеріалу дослідження з обґрунтуванням отриманих наукових результатів

Загальними етапами у побудові будь-якої системи оброблення даних засобами машинного навчання є:

- попереднє оброблення даних і виявлення впливових факто-рів для моделювання у вигляді числових змінних;

- вибір класу математичних методів, який буде застосований для побудови класифікатора;

- оптимізація моделі та пошук оптимальних параметрів і гі-перпараметрів моделювання;

- тестування показників точності отриманої моделі. Згідно з [8], необхідними етапами роботи для побудови сис-

теми розпізнавання особи, що говорить, є: - введення голосових даних у цифровому вигляді (як число-

вої послідовності); - виявлення впливових факторів (ознак) для аналізу; - визначення ймовірності належності голосу до кожного з

потенційних кандидатів (можливих суб’єктів); - визначення найбільш імовірного суб’єкта та встановлення

особи диктора. Розглянемо детальніше реалізацію кожного з зазначених етапів.

Підготовка даних і виявлення впливових факторів як числових змінних

Згідно з [5] розпізнавання особи, що говорить, так само як роз-пізнавання голосового мовлення, ґрунтується на особливостях фі-зіології голосового апарату людини та особливостях сприйняття звуку людиною. Так, оскільки показником, що характеризує мов-лення кожної конкретної людини є переважно тональність звуку голосу (яка залежить від фізичних розмірів та акустичних харак-теристик голосового апарату людини) та характер переходу між звуками, можна дійти висновку, що впливовими факторами для розпізнавання повинні бути домінуючі частоти та швидкість зміни цих частот. Оскільки ж сприйняття людиною звукових частот має не лінійний, а логарифмічний характер, відповідним чином повин-ні бути трансформовані частотні показники і для моделювання.

Таким чином, підготовка числових змінних для моделювання буде складатись з таких дій:

1) Отримання запису звуку людського мовлення у вигляді числової послідовності, на зразок до представленої на рис. 1.

Page 165: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

164

Рис. 1. Відображення числової послідовності цифрового запису голосу

2) Розділення потоку цифрових аудіо-даних на фрагменти за-даної тривалості із згладжуванням меж фрагменту. Зазвичай дов-жина фрагменту обирається в діапазоні від 25 мілісекунд до 0,5 секунди, і є одним з гіперпараметрів моделі розпізнавання. Згла-джування здійснюється мультиплікацією послідовності та віконної функції Блекмана [11] відповідної розмірності та виконується для кожного фрагменту. Приклад змісту фрагмента наведено на рис. 2.

Рис. 2. Відображення числової послідовності одного фрагмента голосу для аналізу

Page 166: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

165

3) Здійснення швидкого перетворення Фур’є та переведення сигналу у частотний діапазон. При цьому здійснюється також пе-реведення із фізичних одиниць частоти звуку (Герц) у психофі-зичні (Мел) за формулою [12]:

70011127

flnm , (1)

де m – частота сигналу в Мелах; f – частота сигналу в Герцах. Переведення із фізичних одиниць у психофізичні дозволяє ви-

явити для подальшого математичного аналізу більшу варіативність у тій зоні частот, яка зазвичай домінує при сприйнятті голосу люди-ною, що дозволяє наблизити модель за показниками точності розпі-знавання до людського сприйняття. Порівняння спектрів, складених по фізичних і психофізичних одиницях, наведено на рис. 3.

Рис. 3. Відображення спектрального складу фрагмента за шкалою Герц і Мел

4) Для того, щоб на підставі наявної мел-спектральної харак-

теристики отримати вектор числових характеристик, придатних для проведення моделювання, здійснюється інтегрування частот-них даних визначеною кількістю трикутних частотних фільтрів. Кількість фільтрів, нижня та верхня межі їх діапазону також є гі-

Page 167: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

166

перпараметрами моделі. Схематично фільтри, які застосовуються до спектрального складу моделі, наведено на рис. 4.

Рис. 4. Відображення спектрального складу фрагмента за шкалою Мел і фільтрів, які застосовуються для переведення його у числовий вектор

5) У результаті інтегрування даних, отриманих із застосуванням

фільтрів, формується вектор чисел, на зразок до зображених на рис. 5, які можуть бути використані як вхідні параметри для моделі.

Рис. 5. Вектор, який відображає спектральний склад одного фрагмента

Page 168: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

167

Після того, як ці операції проведено для всієї сукупності спо-стережень навчальної вибірки аудіо-даних, стає можливим пе-рейти до етапу побудови моделі на основі цих даних та оціню-вання її адекватності.

Побудова моделі голосової ідентифікації суб’єктів на основі наявних даних Для класифікації фрагментів аудіо-даних за дикторами у цій

статі розглянуто такі типи моделей: - штучні нейронні мережі; - класифікатори на основі комітетів дерев прийняття рішень

(Random forest); - алгоритм опорних векторів. Відповідно до [13] на початковому етапі пошуку найкращої

моделі необхідно провести попереднє дослідження з використан-ням найоперативнішого методу для встановлення так званої «ві-дправної точки» точності роботи моделі. Це дозволяє оцінити ефективність подальших дій з оптимізації параметрів моделі та застосування інших класів моделей.

У даному випадку за найшвидший метод побудови моделей голосової ідентифікації було обрано класифікатори на основі ко-мітетів дерев прийняття рішень (Random forest). Початковими гі-перпараметрами моделі, які використано для формування масиву числових даних для аналізу, обрано на основі [14] такі:

- кількість Мел-фільтрів: 26; - тривалість одного фрагменту: 0,03 секунди; - нижня межа діапазону частот: 10 Герц; - верхня межа діапазону частот: 4000 Герц. Критерієм оцінювання точності моделей слугував відсоток

коректного визначення належності фрагмента до відповідної множини аудіо-даних запису голосу на крос-валідації при розді-ленні наявної вибірки даних на навчальну та тестову у співвід-ношенні 70 % на 30 %. У навчальній і тестовій вибірках викорис-тано в загальній сукупності 25 хвилин аудіо-записів мовлення 10 різних осіб і виділено окрему категорію даних «шум», яка не на-лежить до людського мовлення. За таких умов було отримано по-казники точності побудованих моделей, що наведені у табл. 1.

Page 169: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

168

Таблиця 1

ПАРАМЕТРИ МОДЕЛЕЙ ТА ПОРІВНЯЛЬНІ РЕЗУЛЬТАТИ ЇХ АПРОБАЦІЇ

№ п/п

Тип моделі

Кількість вхідних

параметрів (вхідних нейронів)

Кількість нейронів

у прихованому шарі (вирощених

дерев)

Кількість ітерацій навчання

Точність класифікації на крос-валідації,

%

Витрати процесорного

часу на побудову моделі, с.

1 Random Forest 26 100 — 79,67 80,32

2 Нейронна мережа

26 10 600 73,30 429,61

3 Нейронна мережа

26 20 600 77,54 772,95

4 Нейронна мережа

26 30 600 78,32 1225,86

5 Алгоритм опор- них векторів

26 — — 75,32 2145,70

Витрати часу на побудову моделі оцінювались для реалізації

процесу мовою R на апаратній платформі Intel i3. Як бачимо з табл. 1, базовим математичним інструментарієм

для швидкої побудови ефективної моделі розпізнавання голосу можуть слугувати класифікатори Random forest. Моделі, заснова-ні на використанні штучних нейронних мереж, за ефективністю наближаються до Random forest, хоча при цьому потребують сут-тєво більшого часу для навчання та проведення додаткових дос-ліджень з пошуку оптимальної конфігурації мережі й визначення кількості ітерацій навчання.

З метою підвищення точності моделювання на наступному етапі необхідним є проведення пошуку в просторі гіперпарамет-рів оптимальної структури моделі та підготовки вхідних даних.

Оптимізація моделі розпізнавання диктора та пошук оптимальних гіперпараметрів моделювання Як зазначається у [7, 10], для підвищення точності класифіка-

ції доцільно використовувати, зокрема, перший і другий дельта-коефіцієнти від послідовностей спектральних коефіцієнтів, які інколи називаються «похідними» таких послідовностей. У свою

Page 170: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

169

чергу, у [15, с. 65] дельта-коефіцієнт для MFCC-послідовностей визначається як:

21

1

2

ttt

ccd ,

де dt – дельта-коефіцієнт (аналог похідної першого порядку) в момент часу t;

ct-θ, ct+θ – відповідні статичні MFCC-коефіцієнти в моменти часу t – θ та t + θ;

Θ – розмір напів-вікна (виражений у кількості часових фраг-ментів-кадрів), яке використовується для обчислення похідної. Розмір вікна застосовується до та після поточного кадру та оби-рається як один з гіпер-параметрів моделювання.

Дельта-коефіцієнт другого порядку аналогічним чином вирахо-вується із використанням замість статичних коефіцієнтів ct-θ, ct+θ відповідних їм дельта-коефіцієнтів першого порядку dt-θ та dt+θ.

Як бачимо, оскільки для побудови кожної моделі гіпер-параметр Θ обирається одноразово як константне значення, похі-дні, вирахувані таким чином у момент часу t, є лінійною комбі-нацією MFCC-коефіцієнтів у межах обраного вікна Θ з деякими незмінними чисельними коефіцієнтами.

З іншого боку, зважаючи на здатність штучних нейронних ме-реж моделювати лінійні комбінації вхідних параметрів, можна стверджувати, що з метою підвищення точності класифікації за допомогою нейромережевого класифікатора припустимим є ви-користання в якості вхідних даних замість першої та другої похі-дної наведеного вигляду звичайної послідовності спектральних коефіцієнтів, доповненої MFCC-спектральними коефіцієнтами Θ попередніх і Θ наступних кадрів.

Виходячи з викладеного, для підвищення точності моделі не-обхідно здійснити пошук оптимального набору її гіперпараметрів за такими вимірами:

- кількість спектральних фільтрів (довжина вектора фільтрів) для одного кадру;

- тривалість одного кадру в секундах; - нижня межа діапазону частот, які аналізуються;

Page 171: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

170

- верхня межа діапазону частот; - порогове заповнення кадру, нижче якого кадр вважається

порожнім; - кількість додаткових кадрів, які включаються до аналізу; - кількість нейронів у прихованому шарі (у разі використання

нейронної мережі); - кількість ітерацій навчання (у разі використання нейронної

мережі). При цьому, як зазначається у [16], серед методів, які зазвичай

застосовуються для пошуку гіперпараметрів, найпоширенішими є: - регулярний перебір комбінацій гіперпараметрів із заданим

кроком; - випадковий пошук комбінації за встановленою кількістю

спроб; - послідовна оптимізація за кожним із параметрів. На початковому етапі дослідження випробуємо найпростіший

метод оптимізації гіперпараметрів – регулярний перебір комбіна-цій із заданим кроком. Для прикладу, пошук оптимального роз-міру кадру за умови незмінності інших параметрів моделі виявив таку залежність точності моделі, виміряної за результатами крос-валідації, від розміру кадру, що зображено на рис. 6.

Рис. 6. Залежність точності моделі від розміру кадру за незмінних інших параметрах

Page 172: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

171

Як бачимо з рис. 6, за умови незмінності інших параметрів то-чність моделі виявляє загальну тенденцію до зростання зі збіль-шенням тривалості одного кадру, в межах якого аналізується спектральний склад (але не більше 4 секунд). Зауважимо також, що з огляду на високу варіативність отриманих результатів, по-шук за умови змінюваності інших параметрів може виявити інші оптимальні значення цієї змінної, що буде розглянуто нижче.

З урахуванням винайденої оцінки оптимального значення ро-зміру кадру та за умови незмінності інших параметрів процес пошуку оптимальної кількості спектральних Мел-фільтрів відо-бражено на рис. 7.

Рис. 7. Залежність точності моделі від обраної кількості Мел-фільтрів за незмінних інших параметрах

У той же час, дослідження точності розпізнавання голосу дик-тора одночасно за двома зазначеними гіперпараметрами (розмір кадру та кількість Мел-фільтрів), дає результати, які доцільніше подати у вигляді тривимірної поверхні, представленої на рис. 8.

Як видно з рис. 8, поверхня залежності точності моделі від цих гіперпараметрів характеризується високою нерівномірністю та може проявити глобальний оптимум, який відрізняється від оптимальних значень, знайдених по кожному з цих двох параме-трів окремо.

Page 173: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

172

Рис. 8. Залежність точності моделі від обраного розміру кадру та кількості Мел-фільтрів (спільно)

З огляду на це, пошук оптимальної комбінації гіперпараметрів має ґрунтуватись на таких самих підходах, як і пошук оптималь-них параметрів самої математичної моделі. Разом з тим, зважаю-чи на стохастичні складові загального процесу попередньої під-готовки даних, штучне розбиття їх на навчальну та тестову вибірки, у результатах оцінювання точності моделі присутня сут-тєва складова, яка може бути охарактеризована як шум.

Розглянемо, наприклад, результати пошуку оптимальної кіль-кості нейронів у прихованому шарі нейронної мережі персепт-ронного типу, точність моделювання якої на крос-валідації про-демонстрована на рис. 9.

Як бачимо з рис. 9, збільшення чи зменшення кількості ней-ронів у прихованому шарі мережі на один нейрон може призвес-ти до зміни показників точності моделювання в ході тестування в межах 20 %, що викликане впливом зовнішніх причин (стохасти-чних факторів). При цьому узагальнена точність моделі за розмі-рності прихованого шару в межах діапазону від 200 до 300 ней-ронів не змінюється. З огляду на це, наприклад, чисельне знаходження похідної функції точності моделювання від кіль-кості нейронів мережі не є можливим. З цих причин виникають

Page 174: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

173

обмеження у застосуванні прямих методів оптимізації, таких як, наприклад, градієнтний спуск.

Рис. 9. Залежність точності моделі від обраної кількості нейронів у прихованому шарі персептрону за незмінних інших параметрах Зменшити відносну шумову варіативність результатів оціню-

вання точності моделі може збільшення кількості спостережень, за якими здійснюється навчання та оцінка роботи моделі, а також проведення кількох процедур оцінювання моделі для кожної комбінації її гіперпараметрів.

Разом з тим, зауважимо, що, виходячи з табл. 1, проведення пошуку оптимальних гіперпараметрів шляхом регулярного або випадкового перебору великої кількості моделей потребуватиме значних витрат процесорного часу.

З огляду на це, для підвищення ефективності процесів оптимі-зації моделі розпізнавання голосу диктора та пошуку оптимальних гіперпараметрів моделювання можна застосувати такі підходи:

- проведення попереднього швидкого пошуку загальних тен-денцій у залежностях точності отриманої моделі від кожного з гіперпараметрів, із використанням невеликої частки наявних на-вчальних даних;

- проведення попереднього пошуку гіперпараметрів на основі найшвидшого з відібраних математичних методів побудови моделі;

Page 175: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

174

- після знаходження області максимальної точності моделей, проведення детальнішого дослідження в межах звуженого діапа-зону можливих значень гіперпараметрів із використанням біль-шої частки навчальних даних і з залученням різних математич-них методів для побудови моделей класифікації.

Для перевірки адекватності цих підходів проведемо пошук оп-тимальних значень гіперпараметрів із використанням кожного з них окремо:

А) Порівняння результатів пошуку гіперпараметрів на повній і неповній вибірках.

Для перевірки гіпотези про можливість проведення пошуку із пришвидшенням за рахунок зменшення навчальної вибірки сфор-мовано два набори даних, у яких в якості навчальної вибірки ви-користано 90 % і 10 % наявних даних, відповідно. Порівняння ре-зультатів пошуку оптимальних гіперпараметрів наведено на рис. 10.

Рис. 10. Залежність точності моделі від обраної кількості Мел-фільтрів за незмінних інших параметрах при моделюванні

на повній (чорний колір) і зменшеній (сірий) вибірках Як бачимо на рис. 10, поведінка залежності точності моделю-

вання від кількості спектральних складових співпадає для повної

Page 176: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

175

та часткової вибірок, із очікуваним зменшенням загальної точно-сті моделі, побудованої на часткових даних. При цьому, як бачи-мо на рис. 11, витрати часу на побудову моделей для повної та часткової вибірок різнились у середньому в 50 разів.

Рис. 11. Залежність витрат часу на побудову моделей на повній (чорний колір) і зменшеній (сірий) вибірках

Це підтверджує припустимість використання підходу щодо

зменшення розміру навчальної вибірки на етапі швидкого пошу-ку оптимальних гіперпараметрів моделі.

Б) Порівняння результатів пошуку гіперпараметрів на ос-нові різних математичних методів класифікації.

Для перевірки гіпотези про можливість проведення пошуку гіперпараметрів на основі різних математичних моделей здійс-нимо таку саму процедуру, як і в попередньому випадку, але із застосуванням випробуваних вище методів Random forest і штуч-них нейронних мереж. Порівняння результатів пошуку оптима-льних гіперпараметрів за цими підходами наведено на рис. 12.

Page 177: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

176

Рис. 12. Залежність точності моделі від обраної кількості Мел-фільтрів при моделюванні за методом класифікації Random forest

(чорний колір) та із застосуванням нейронної мережі (сірий)

Як видно з рис. 12, поведінка точності моделей на основі за-значених двох методів співпадає. При цьому різниця у витратах часу на побудову нейромережі зі структурою 100 нейронів у при-хованому шарі та 1000 ітерацій градієнтного наближення в де-яких випадках становить більше ніж 100 разів, порівняно з Random forest, що можна бачити з рис. 13.

Рис. 13. Залежність витрат часу на побудову моделі за методом класифікації Random forest (чорний колір) і нейронної мережі (сірий)

Page 178: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

177

Проведений аналіз підтверджує припустимість використан-ня підходу щодо застосування спрощених математичних мето-дів на етапі швидкого пошуку оптимальних гіперпараметрів моделі.

Для перевірки результативності застосування вказаних вище підходів з метою прискорення пошуку оптимальної комбінації гіперпараметрів моделі проведено пошук за вибіркою, яка скла-дається з 500 випадкових комбінацій значень шести гіперпара-метрів:

- кількість спектральних фільтрів; - тривалість одного кадру в секундах; - нижня та верхня межа діапазону частот, які аналізуються; - порогове заповнення кадру, нижче якого кадр вважається

порожнім; - кількість кадрів до та після поточного, які враховуються

при аналізі. Необхідно зазначити, що рівномірний розподіл випадкових

значень у межах заданого діапазону використано для усіх гіпер-параметрів, окрім тривалості одного кадру в секундах. Так, для тривалості кадру не застосовувались значення, які могли в поєд-нанні з заданою кількістю кадрів до та після поточного, що вра-ховуються при аналізі, дати загальну необхідну тривалість аудіо-потоку для розпізнавання більше 2,5 секунд. Це обумовлено ви-могами фактичної можливості ідентифікації особи в телефонній розмові за вимовлянням ключового слова або мінімальної ціліс-ної фрази одного з учасників діалогу.

Як показав аналіз, нерівномірна щільність розподілу ймові-рності при випадковому виборі значення гіперпараметру, так само як і наявність пов’язаних гіперпараметрів, суттєво впли-вають на поведінку точності моделі в ході пошуку глобального оптимуму.

Так, тенденція до зростання точності моделі з підвищенням кількості додаткових кадрів, які враховуються при моделюванні (рис. 14), вплинула на поведінку точності моделі залежно від тривалості одного кадру (рис. 15), яка більше не проявляє моно-тонної тенденції до зростання, як це було при аналізі за умови не-змінності інших гіперпараметрів (див. рис. 6).

Page 179: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

178

Рис. 14. Залежність точності моделі від кількості додаткових кадрів, які враховуються при моделюванні, за результатами пошуку

в просторі змінних комбінацій гіперпараметрів

Рис. 15. Залежність точності моделі від обраної тривалості одного кадру, за результатами пошуку в просторі

змінних комбінацій гіперпараметрів

Page 180: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

179

Пошук у просторі гіперпараметрів зі змінними випадковими комбінаціями дозволив виявити оптимуми значень нижньої та верхньої межі діапазону частот, які використовуються для аналі-зу (рис. 16 і 17).

Рис. 16. Залежність точності моделі від обраної нижньої межі діапазону частот, за результатами пошуку в просторі змінних комбінацій гіперпараметрів

Рис. 17. Залежність точності моделі від обраної верхньої межі діапазону частот, за результатами пошуку в просторі змінних комбінацій гіперпараметрів

Page 181: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

180

Що ж стосується поведінки таких гіперпараметрів як поро-гове значення заповнення кадру, нижче якого кадр вважається порожнім (рис. 18), та кількість використаних спектральних фільтрів (рис. 19), які проявляють монотонну тенденцію до зростання, то їх значення в практичному застосуванні мають обмеження, обумовлені ймовірністю виродження аудіо-потоку в порожню множину (у разі використання порогового значення заповнення вище 0,02) та неприпустимим зростанням витрат часу на побудову моделі при збільшенні кількості фільтрів (як показано на рис. 13).

Рис. 18. Залежність точності моделі від обраного порогового значення заповнення кадру, нижче якого кадр вважається порожнім, за

результатами пошуку в просторі змінних комбінацій гіперпараметрів

В) Перевірка стабільності роботи моделі для знайдених оп-тимальних значень гіперпараметрів.

За результатами пошуку в просторі гіперпараметрів було знайдено таку комбінацію, яка забезпечила побудову моделі з показником точності на крос-валідації на рівні 98,6 %. Разом з тим, наявність у процесі попередньої обробки даних і побудови

Page 182: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

181

моделі стохастичних складових (таких як розділення масиву да-них на тренувальну та крос-валідаційну вибірки, вирощування комітету дерев прийняття рішень або ініціалізація початкового стану нейронної мережі) обумовлює необхідність проведення пе-ревірки повторюваності отриманих результатів.

Рис. 19. Залежність точності моделі від обраної кількості Мел-фільтрів, за результатами пошуку в просторі змінних комбінацій гіперпараметрів

Як було запропоновано вище, для проведення такої перевірки

доречним є здійснення детальнішого повторюваного дослідження в межах звуженого діапазону можливих значень гіперпараметрів, у тому числі з залученням різних математичних методів для по-будови моделей класифікації.

Серед результатів проведеного вище пошуку на вибірці з 500 можливих комбінацій гіперпараметрів оберемо 10 таких, які ви-явили найвищі показники точності побудованої з їх використан-ням спрощеної моделі (табл. 2).

Page 183: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

182

Таблиця 2

КОМБІНАЦІЇ ГІПЕРПАРАМЕТРІВ МОДЕЛЮВАННЯ ТА ПОРІВНЯЛЬНІ РЕЗУЛЬТАТИ ЇХ АПРОБАЦІЇ

№ п/п

Кіл

ькіс

ть

спек

трал

ьни

х

філ

ьтрів

Три

вал

ість

одн

ого

кад

ру, с

Мін

імал

ьна

час

тота

, М

ел

Мак

сим

альн

а

час

тота

, М

ел

Поріг

від

сікан

ня

ти

ші

Кіл

ькіс

ть

додат

кови

х к

адрів

Точн

ість

клас

иф

ікац

ії с

уб’є

кта

меж

ах

10 м

ож

ли

вих к

лас

ів)

Ви

трат

и

ком

пю

’тер

ного

час

у

на

під

гото

вку д

ани

х, с

Ви

трат

и

ком

п’ю

терн

ого

час

у

на

побудову

модел

і, с

1 36 0,34 9 2635 0,011 7 98,61 % 16,59 7,85

2 46 0,22 10 3230 0,015 6 98,37 % 10,8 7,06

3 47 0,29 27 3214 0,019 6 98,28 % 20,25 9,37

4 44 0,64 45 2855 0,018 2 98,20 % 8,11 0,59

5 39 0,54 22 2619 0,008 4 98,17 % 9,54 1,68

6 19 0,79 7 2231 0,017 2 98,17 % 8,53 0,31

7 30 0,48 2 2144 0,004 5 98,13 % 17,02 5,59

8 30 0,37 15 2371 0,009 6 98,11 % 17,69 6,88

9 47 0,45 3 2557 0,008 4 98,08 % 24,54 5,27

10 49 0,52 31 3521 0,019 4 98,06 % 12,78 2,11

За обраними комбінаціями гіперпараметрів проведемо повто-

рне дослідження, під час якого для кожної з них побудуємо 10 нових моделей та оцінимо повторюваність отриманих результа-тів. Загальна кількість підготовлених навчальних вибірок і побу-дованих моделей на цьому етапі складе 100. Оціночну точність моделі залежно від обраних комбінацій гіперпараметрів за ре-зультатами повторного дослідження наведено на рис. 20.

Page 184: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

183

Page 185: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

184

Рис. 20. Залежність точності моделі від обраної комбінації гіперпараметрів, за результатами пошуку в межах звуженого

діапазону можливих значень

Page 186: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

185

Як бачимо на рис. 20, проведення повторного дослідження то-чності моделей, отриманих з використанням 10 найефективніших комбінацій гіперпараметрів, підтвердило найвищу результатив-ність комбінації № 2 (з наведених у табл. 2). Найбільша точність класифікації за її використання сягнула 98,97 % при перевірці на крос-валідаційній вибірці.

Із застосуванням побудованої моделі класифікації стає мож-ливим впровадження механізму розпізнавання голосів як складо-вої частини системи ідентифікації клієнтів банківської установи при обслуговуванні засобами телефонного банкінгу.

При практичній імплементації запропонованого підходу та побудованих моделей найдоцільнішим є не просто визначення особи, що говорить, з переліку можливих варіантів, а й відобра-ження ступеня належності звукового ряду до класу, що відпові-дає певній особі (для тих класів, для яких ця належність не є ну-льовою), за кожним з фрагментів (кадрів) аудіо-запису або аудіо-потоку під час розмови в режимі реального часу.

Здійснимо перевірку роботи моделі на тестовому фрагменті аудіо-запису, наведеному на початку статті. Візуалізацію процесу розпізнавання голосів наведено на рис. 21.

Рис. 21. Візуалізація результатів розпізнавання голосів на тестовому записі діалогу клієнта з оператором кол-центру банківської установи

Page 187: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

186

Як бачимо з рис. 21, опрацювання запису за допомогою по-будованої моделі дозволило діагностувати діалог між клієнтом банківської установи (Суб’єкт № 1) та оператором кол-центру (Суб’єкт № 2) із високим ступенем впевненості при розділенні змішаних аудіо-даних.

Висновки і перспективи подальших досліджень у даному напрямку Проведене дослідження підтвердило припустимість практич-

ного використання технологій розпізнавання образів, зокрема бі-ометричної ідентифікації за голосом, у банківській сфері. Експе-риментальне дослідження ефективності низки альтернативних методів класифікації дозволило дійти таких висновків:

1) застосування біометричної ідентифікації при здійсненні банківських операцій засобами телекомунікаційного зв’язку до-зволяє підвищити рівень їх безпеки завдяки можливості досяг-нення високої точності визначення особи з використанням сучас-них моделей класифікації (штучні нейронні мережі та комітети дерев прийняття рішень);

2) для досягнення максимальної точності роботи моделі не-обхідним є проведення пошуку оптимальної комбінації парамет-рів підготовки та перетворення даних, а також параметрів моде-лювання (гіперпараметрів) для конкретних умов застосування моделей класифікації;

3) здійснення пошуку оптимуму в просторі гіперпараметрів за своєю результативністю позитивно відрізняється від послідов-ного пошуку оптимального значення за кожним із гіперпарамет-рів, але потребує більших витрат часу, що обумовлює потребу в розробленні нових методичних підходів до пришвидшення тако-го процесу;

4) для скорочення часу на здійснення пошуку оптимуму в просторі гіперпараметрів результативним виявилось застосуван-ня на першому етапі часткових вибірок навчальних даних і мате-матичних моделей, які забезпечують швидший пошук оптималь-них параметрів класифікації;

5) для точнішого визначення оптимальної комбінації гіпер-параметрів необхідним є здійснення повторюваного дослідження

Page 188: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

187

з метою зменшення впливу стохастичних складових на процес підготовки даних, розділення масиву на навчальну та тестову ви-бірки, а також побудову моделей класифікації різних типів і структур;

6) з огляду на ймовірність впливу стохастичних складових процесу побудови моделей, при здійсненні пошуку оптимуму в просторі гіперпараметрів застосування таких методів оптимізації, як градієнтний спуск, може дати хибні результати.

З огляду на зазначене, напрямами подальшого дослідження доцільно розглядати:

1) застосування для класифікації аудіо-даних, представлених у вигляді часових рядів, штучних нейронних мереж із складні-шими типами архітектури, такими як згорткова (convolutional), рекурентна та нейронна мережа з довгою короткочасною пам’яттю (LSTM);

2) застосування для пришвидшення пошуку глобального оп-тимуму в просторі гіперпараметрів статистичних методів, які до-зволили б знайти оптимальну комбінацію за мінімальної кількос-ті спроб, зокрема, Байєсівської оптимізації;

3) застосування регресійних методів для побудови наближе-них моделей поведінки показників точності (наприклад, їх апрок-симації поліномом n-го ступеня) залежно від гіперпараметрів та обчислення оптимальних комбінацій шляхом аналітичного зна-ходження їх екстремумів.

Література 1. Interagency Interpretive Guidance on Customer Identification Pro-

gram Requirements under Section 326 of the USA PATRIOT Act [Електронний ресурс] // U.S. Department of the Treasury. – 2005. – Режим доступу: https://www.fincen.gov/resources/statutes-regulations/guidance/ interagency-interpretive-guidance-customer-identification.

2. Treasury § 103.121 Subpart I — Anti-Money Laundering Programs [Електронний ресурс] // USA Monetary Offices. – Режим доступу: https://www.gpo.gov/fdsys/pkg/CFR-2010-title31-vol1/pdf/CFR-2010-title31-vol1-sec103-121.pdf.

3. Banking on the power of speech [Електронний ресурс]. – Режим доступу: https://wealth.barclays.com/en_gb/home/international-banking/ insight-research/manage-your-money/banking-on-the-power-of-speech.html.

Page 189: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

188

4. Homayoon B. Fundamentals of Speaker Recognition / Beigi Homayoon. – Berlin: Springer Science+Business Media, 2011. – 860 p.

5. Cassidy S. COMP449: Speech Recognition (Lecture notes) / Steve Cassidy. – Sydney, Australia: Macquarie University, 2002 [Електронний ресурс]. – Режим доступу: http://web.science.mq.edu.au/~cassidy/ comp449/html/comp449.html.

6. Richardson F. Deep Neural Network Approaches to Speaker and Language Recognition / F. Richardson, D. Reynolds, N. Dehak // IEEE Signal Processing Letters. – 2015. – № 22. – P. 1671–1675.

7. Sturim D. The MIT LL 2010 speaker recognition evaluation system: scalable language-independent speaker recognition / D. Sturim, W. Campbell, N. Dehak etc. // International conference on acoustics, speech and signal processing. – Prague, Czech Republic: IEEE, 2011. – P. 5272–5275.

8. Do M. How to Build an Automatic Speaker Recognition System (lec-ture notes) / Mihn Do. – Urbana Champaign, Illinois: University of Illinois, 2014. – 11 p.

9. Chechi R. Performance Analysis of MFCC and LPCC Techniques in Automatic Speech Recognition / Rajiv Chechi // India International Journal of Engineering Research & Technology (IJERT). – 2013. – Vol. 2. – Is. 9. – P. 3142–3146.

10. Richardson F. A. Unified Deep Neural Network for Speaker and Language Recognition / F. Richardson, D. Reynolds, N. Dehak // INTER-SPEECH 2015 proceedings of conference. – Dresden, Germany: ISCA, 2015. – P. 1146–1150.

11. Allen J. Short Time Spectral Analysis, Synthesis, and Modification by Discrete Fourier Transform / Jont Allen // IEEE Transactions on Acous-tics, Speech, and Signal Processing. – 1977. – Vol. 25. – Is. 3. – P. 235–238.

12. Stevens S. S. A scale for the measurement of the psychological mag-nitude pitch / S. S. Stevens, J. Volkmann, E. B. Newman // Journal of the Acoustical Society of America. – 1937. –Vol. 8. – No. 3. – P. 185–190.

13. Ng A. Machine Learning (lecture notes) [Електронний ресурс] / Andrew Ng. – Stanford, CA: Stanford University. – Режим доступу: http://cs229.stanford.edu/materials/ML-advice.pdf.

14. Adarsh K. Implementation of a Voice – Based Biometric System / K. Adarsh, A. Deepak, R. Diwakar, R. Karthik. – Belgaum, India: Visveswa-raya Technological University, 2007. – 101 p.

15. Young S. The HTK Book / S. Young, G. Evermann, D. Kershaw and others. – Cambridge: Cambridge University Engineering Department / Mi-crosoft Corporation, 2002. – 355 p.

Page 190: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Застосування математичних моделей… Є. Ю. Щербаков

189

16. Claessen M. Hyperparameter Search in Machine Learning / M. Claessen, B. De Moor // MIC 2015: The XI Metaheuristics International Conference. – Agadir, Morocco, 2015. – С. 14.1–14.5.

References 1. US Department of the Treasury. (2005). Interagency Interpretive

Guidance on Customer Identification Program Requirements under Section 326 of the USA PATRIOT Act. Retrieved from https://www.fincen.gov/ resources/statutes-regulations/guidance/interagency-interpretive-guidance-customer-identification.

2. USA Monetary Offices. (2003, May 9). Treasury § 103.121 Subpart I — Anti-Money Laundering Programs. Retrieved from https://www.gpo.gov/fdsys/pkg/CFR-2010-title31-vol1/pdf/CFR-2010-title31-vol1-sec103-121.pdf.

3. Barclays. (2017). Banking on the power of speech. Retrieved from https://wealth.barclays.com/en_gb/home/international-banking/insight-research/manage-your-money/banking-on-the-power-of-speech.html.

4. Homayoon, B. (2011). Fundamentals of Speaker Recognition. Berlin, Germany: Springer Science+Business Media.

5. Cassidy, S. (2002). COMP449: Speech Recognition (Lecture notes). Sydney, Australia: Macquarie University. Retrieved from http://web. science.mq.edu.au/~cassidy/comp449/html/comp449.html.

6. Richardson, F., Reynolds, D., & Dehak, N. (2015). Deep Neural Network Approaches to Speaker and Language Recognition. IEEE Signal Processing Letters, 22, 1671–1675.

7. Sturim, D., Campbell, W., Dehak, N., Karam, Z., McCree, A., Reyn-olds, D., Richardson, F., Torres-Carrasquillo, P., & Shum, S. (2011). The MIT LL 2010 speaker recognition evaluation system: scalable language-independent speaker recognition. Proceedings of the International confer-ence on acoustics, speech and signal processing (Prague, Czech Republic: IEEE), 5272–5275.

8. Do, M. (2014). How to Build an Automatic Speaker Recognition Sys-tem (lecture notes). Urbana Champaign, Illinois: University of Illinois.

9. Chechi, R. (2013). Performance Analysis of MFCC and LPCC Tech-niques In Automatic Speech Recognition. India International Journal of En-gineering Research & Technology, 2(9), 3142–3146.

10. Richardson, F., Reynolds, D., & Dehak, N. (2015). A Unified Deep Neural Network for Speaker and Language Recognition. INTERSPEECH 2015 proceedings of conference (Dresden, Germany: ISCA), 1146–1150.

Page 191: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

190

11. Allen, J. (1977, June). Short Time Spectral Analysis, Synthesis, and Modification by Discrete Fourier Transform. IEEE Transactions on Acous-tics, Speech and Signal Processing, 25(3), 235–238. doi: 10.1109/TASSP. 1977.1162950

12. Stevens, S., Volkmann, J., & Newman, E. (1937). A scale for the measurement of the psychological magnitude pitch. Journal of the Acousti-cal Society of America, 8(3), 185–190.

13. Ng, A. Machine Learning (lecture notes). Stanford, CA: Stanford University. Retrieved from http://cs229.stanford.edu/materials/ML-advice.pdf.

14. Adarsh, K., Deepak, A., Diwakar, R., & Karthik, R. (2007). Imple-mentation of a Voice – Based Biometric System. Belgaum, India: Visveswa-raya Technological University.

15. Young, S., Evermann, G., Kershaw, D., & others. (2002). The HTK Book. Cambridge, UK: Cambridge University Engineering Department / Microsoft Corporation.

16. Claessen, M., & De Moor, B. (2015). Hyperparameter Search in Machine Learning. MIC 2015: The XI Metaheuristics International Con-ference (Agadir, Morocco: University of Lille), 14.1–14.5.

Стаття надійшла до редакції 17.02.2017

Page 192: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Нові видання за тематикою журналу

191

Кононова К. Ю. Інформаційна

економіка: моделювання еволю-

ційних процесів : [монографія] /

К. Ю. Кононова. – Х.: ХНУ імені

В. Н. Каразіна, 2015. – 312 с.

У монографії на підставі постулатів еволюційної економічної

теорії досліджуються феномени інформаційної економіки на ма-

кро- та мікрорівнях. Обґрунтовано методику ідентифікації стадій

розвитку інформаційної економіки, запропоновано макроеконо-

мічну модель зміни макрогенерацій. На підставі авторської кон-

цепції еволюції популяції економічних агентів розроблено муль-

тиагентну модель макродинаміки системи як результату

взаємодії агентів на мікрорівні. Комплекс моделей конкурентної

взаємодії користувачів соціальних мереж дає можливість дослі-

дити еволюційні механізми їх розвитку.

В роботі використані сучасні методи моделювання, зокрема

мультиагентний підхід для імітації еволюції популяції економіч-

них агентів та взаємодії користувачів онлайнових соціальних ме-

реж; засоби штучного інтелекту – для розробки інструментарію

ідентифікації стадій розвитку інформаційної економіки. При роз-

робленні моделі зміни макрогенерацій поряд з класичними мето-

дами були застосовані нейронні мережі.

Питання, розглянуті в монографії, можуть бути цікаві фахів-

цям в області економіко-математичного моделювання, а також

широкому колу читачів, які цікавляться проблемами економічної

еволюції та розвитку інформаційної економіки.

Page 193: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

НЕЙРО-НЕЧІТКІ ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ 2017, № 6

192

Мінц О. Ю. Методологія моде-

лювання інноваційних інтелекту-

альних систем прийняття рішень

в економіці: [монографія] /

О. Ю. Мінц. – Маріуполь: ДВНЗ

«Приазовський державний техні-

чний університет», 2017. – 216 с.

У монографії систематизовано та розширено теоретико-

методологічні дослідження процесів синтезу інноваційних інте-

лектуальних систем прийняття рішень. Визначено методологічні

підходи до застосування методів інтелектуальних обчислень, зо-

крема нейронних мереж, генетичних алгоритмів, нечіткої логіки

для моделювання систем прийняття рішень. Запропоновано мо-

делі і методи вдосконалення процесів прийняття рішень у кон-

тексті забезпечення життєздатності та конкурентоспроможності

суб’єктів національної економіки.

Для науковців, викладачів, докторантів, аспірантів і студентів

економічних спеціальностей вищих навчальних закладів, пред-

ставників органів державного управління, керівників і менедже-

рів підприємств та організацій.

Page 194: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Вимоги до оформлення статтей

193

ІНФОРМАЦІЯ Шановні колеги! Державний вищий навчальний заклад «Київський національний еко-

номічний університет імені Вадима Гетьмана» запрошує Вас до публі-кацій у науково-аналітичному журналі «Нейро-нечіткі технології мо-делювання в економіці». Журнал виходить раз на рік.

Умови подання статті до журналу Для публікації статті до редакції журналу необхідно подати: 1. Електронний варіант статті, оформлений відповідно до наведе-

них нижче вимог. Статті повинні містити вагомі наукові результати, які можуть носи-

ти як теоретичний (здійснювати внесок в розвиток теорії та методології нейронних мереж чи нечіткої логіки), так і практичний характер (місти-ти розв’язок конкретної прикладної задачі з побудовою економіко-математичних моделей, їх програмною реалізацією та експерименталь-ним дослідженням їх ефективності). Результати будуть оцінюватися за рівнем їх науково-технічного потенціалу.

2. Заявку мовою статті та англійською, оформлену за наступною формою:

«Нейро-нечіткі технології моделювання в економіці» Назва статті ___________________________________________ П.І.Б. автора ___________________________________________ Науковий ступінь, вчене звання __________________________ Місце роботи __________________________________________ Посада _______________________________________________ Контактний телефон ____________________________________ E-mail ________________________________________________ Поштова адреса ________________________________________ Прим. Уся ця інформація подається на кожного автора (крім назви статті, яка даєть-

ся один раз на весь авторський колектив).

Статті в електронному вигляді українською, російською або англій-

ською мовою разом із заявкою надсилаються на адресу [email protected].

Файли називати прізвищем першого автора латинськими літерами (наприклад, Savina.doc, Savina_zayav.doc).

Page 195: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Вимоги до оформлення статтей

194

Вимоги до наукових статей, що подаються до науково-аналітичного журналу

«Нейро-нечіткі технології моделювання в економіці»

Вимоги до стуктури статті 1. Індекс УДК до статті. На першій сторінці у правому верхньому кутку, прописними літе-

рами, шрифт — жирний. 2. Назва статті. Через рядок по центру, прописними літерами, шрифт — жирний.

Подається назва статті українською, російською та англійською мовами (переклад).

3. Автор статті. Через рядок по центру вказується ініціали та прізвище автора про-

писними літерами, шрифт — жирний. Інформація подається українсь-кою, російською та англійською мовами (транслітерація). Транслітеру-вати власні назви, прізвища та імена необхідно згідно постанови Кабінету Міністрів України від 27.01.2010 №55 «Про впорядкування транслітерації українського алфавіту латиницею».

4. Відомості про авторів. З наступного рядка по центру вказати без скорочень науковий сту-

пінь, вчене звання автора. З нового рядка — посаду і місце роботи ав-тора (повністю без скорочень і абревіатур). З нового рядка — повну ро-бочу адресу з поштовим індексом і назвою країни. Всі відомості вказати українською, російською та англійською мовами (використову-вати повний офіційний переклад назви організацій). З нового рядка — адресу електронної пошти.

Якщо у статті кілька авторів, то по кожному автору наводиться пов-на інформація згідно пп. 3, 4 з пропущеним рядком між авторами. Бі-льше чотирьох авторів не допускається.

5. Анотація. Через рядок. Анотація має бути структурованою, лаконічною, інфо-

рмативною та містити такі аспекти: предмет, мету, метод чи методоло-гію дослідження, результати дослідження, сферу застосування резуль-татів, ступінь наукової новизни, висновки. Обсяг анотації — від 100 до 250 слів. Анотація має бути українською, російською та англійською мовами.

6. Ключові слова. Не менше п’яти та не більше десяти слів або словосполучень, кур-

сивом, українською, російською та англійською мовами. 7. Код JEL класифікації до статті. У наступному рядку після ключових слів, кількість може бути від 1

до 5 кодів, в одному рядку, через кому, жирним. Наприклад: JEL Classіfіcatіon: C12, H12.

Page 196: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Вимоги до оформлення статтей

195

8. Текст статті. Через рядок. У стуктурі статті необхідно виділити: — вступ (у якому необхідно висвітлити: постановку проблеми та її

зв’язок із важливими науковими чи практичними завданнями; аналіз останніх досліджень та публікацій з обов’язковим посиланням на вико-ристані джерела; невирішені раніше частини загальної проблеми, кот-рим присвячується стаття);

— формулювання мети і завдань дослідження; — виклад основного матеріалу дослідження з повним обґрунту-

ванням отриманих наукових результатів; — висновки і перспективи подальших досліджень у даному на-

прямку; — два переліки використаних літературних джерел. Перший перелік використаних літературних джерел подається під

заголовком «Список літератури» мовою оригіналу і має містити не менше 8 джерел. Бібліографічний опис літературних джерел оформлю-ється згідно з ДСТУ ГОСТ 7.1:2006 «Система стандартів з інформації, бібліотечної та видавничої справи. Бібліографічний запис. Бібліогра- фічний опис. Загальні вимоги та правила складання». (Приклади офор-млення бібліографічного опису наведено в «Бюлетені ВАК Украї- ни». — 2009. — № 5. — С. 26—30.).

Другий перелік використаних літературних джерел подається під за-головком «References», що містить ті самі літературні джерела, але у латинському алфавіті, оформлені за міжнародним бібліографічним стан- дартом APA-2010. Якщо наукова праця написана мовою, що використо-вує кирилицю, то її бібліографічний опис необхідно транслітерувати латинськими літерами. Транслітерувати власні назви, прізвища та імена слід згідно з постановою Кабінету Міністрів України від 27.01.2010 № 55 «Про впорядкування транслітерації українського алфавіту лати-ницею». Назви періодичних україно- та російськомовних видань (жур-налів, збірників та ін.) подаються транслітерацією, а в дужках — анг-лійською мовою. Наприклад: Finansy Ukrainy (Finance of Ukraine). У кінці кожної позиції необхідно зазначити мову оригіналу: [in Ukrai-nian], [in Russian] тощо.

У кінці статті має бути примітка, що стаття подана для публікації

лише до журналу «Нейро-нечіткі технології моделювання в економіці».

Page 197: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Вимоги до оформлення статтей

196

Технічні вимоги до оформлення статті

1. Вимоги до оформлення тексту: — використовувати текстовий редактор MS Word 2003 чи вище; — текстові файли подаються у форматі MS Word з розширенням

«doc»; — формат паперу — A4; — гарнітура — Times New Roman Cyr; — кегль — 14; — міжрядковий інтервал — 1,5; — нумерація сторінок — з правого нижнього краю сторінки; — усі поля сторінки по 2 см; від краю аркуша до колонтиту-

ла — 1,25 см; — абзац — 1,25 см; — не здійснювати перенос частин слів; — встановити заборону висячих рядків в абзаці; — обсяг статті 0,5 — 2 друк. арк. (12 — 48 стор.); — назви розділів у тексті статті — по центру жирним шрифтом,

назви підрозділів — по центру курсивом; — нумерація сторінок, пунктів, рисунків, таблиць, формул пода-

ються арабськими цифрами без символу «№»; — при наборі не застосовувати для форматування тексту додаткові

пробіли; — не встановлювати відступ (абзац) першого рядка табуляцією або

пробілами (форматування здійснювати лише через параметри абзацу); — лапки необхідно набирати однакові по всій статті; — не використовувати дефіс замість тире.

2. Вимоги до оформлення ілюстрацій: — якість ілюстрації повинна забезпечити її чітке відтворення; — рисунки та графіки у статтю вставляють або у графічному реда-

кторі MS Word, або в одному з форматів jpeg, bmp чи tif з роздільною здатністю не менше ніж 300 dpi (подавати якісні оригінали);

— всі об’єкти в рисунках, зроблених у MS Word, мають бути обо- в’язково згруповані. Текст статті не повинен містити рисунків і/або тексту в рамках рисунків, розташованих поверх/за текстом тощо;

— рисунки підписують і нумерують (якщо їх більше ніж один); — підпис має бути під ілюстрацією і позначається скороченим

словом «Рис.»; — схеми слід розміщувати після першого посилання на них по

тексту; — ілюстрації не повинні виходити на поля; — оскільки друк чорно-білий, не застосовувати фон і колір у гра-

фіках, діаграмах тощо.

Page 198: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Вимоги до оформлення статтей

197

3. Вимоги до оформлення таблиць: — перед кожною таблицею необхідно подати слово «Таблиця» з її

порядковим номером у статті з вирівнюванням по правому боку; — у наступному рядку наводиться назва таблиці курсивом з вирів-

нюванням посередині поля, за якою розміщується сама таблиця; — текст таблиці може бути дещо меншим від основного тексту. 4. Вимоги до оформлення формул: — формули набираються тільки допоміжною програмою MS Equa-

tion 3.0 (редактор формул в MS Word); — формули вирівнюють по центру; — формули нумерують в круглих дужках праворуч сторінки на-

скрізною нумерацією. 5. Посилання на використані джерела: — при посиланні в тексті на літературне джерело слід навести по-

рядковий номер у квадратних дужках, який відповідна праця має у спи-ску літератури;

— список літератури наводять у кінці статті у порядку згадуваних джерел;

— на всі наведені в списку літератури джерела мають бути поси-лання у тексті статті;

— усі цитування у тексті або згадування про отримані іншими ав-торами результати мають супроводжуватись відповідним посиланням.

6. Примітки: — примітки до тексту розміщуються внизу сторінки з текстом, що

потребує пояснень; — примітки до тексту робляться автоматично і нумеруються пос-

лідовно арабськими цифрами; — примітки до таблиць та рисунків, в яких наводяться довідкові і по-

яснювальні дані, можуть нумеруватись послідовно в межах однієї сторінки; — якщо приміток до таблиць чи рисунків на одному аркуші кілька,

то після слова «Примітки» ставлять двокрапку, наприклад: Примітки: 1. … 2. … Якщо є одна примітка, то її не нумерують і після слова «Примітка»

ставлять крапку. Додатково: — усі статті проходять обов’язкове рецензування; — у тексті статті можуть бути внесені редакційні виправлення під

час опрацювання редактором та вичитки коректором; — автори статті несуть відповідальність за правильність і точність

наведених у статті термінів, даних, фактів, цитат, статистичних матері-алів тощо, а також за наведення в статті даних, що не є предметом відк-ритої публікації;

— в одному номері може бути опублікована тільки одна стаття автора.

Page 199: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Зміст

ЗМІСТ

Гаврилюк Г. В.

Аналіз вагомості критеріїв в оцінюванні кредитоспроможності

фізичних осіб . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Єфанова Т. І. Оцінювання внутрішньорегіональної диференціації на засадах нейро-

нечіткого моделювання . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

Кононова Е. Ю.

Оценка доверия: теоретические модели и результаты эмпирического

исследования на примере социальных сетей . . . . . . . . . . . . . . . . . . . . . . 68

Лисенко Ю. Г., Мінц О. Ю.

Моделювання інноваційних інтелектуальних систем прийняття

рішень в економіці . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

Стрельченко І. І.

Вибір оптимальної топології нейронної мережі в задачах

класифікації динамічних економічних систем . . . . . . . . . . . . . . . . . . . . 142

Щербаков Є. Ю. Застосування математичних моделей для голосової ідентифікації

суб’єктів у сфері фінансової безпеки . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

Нові видання за тематикою журналу . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

198

Page 200: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Зміст

199

CONTENTS

Ganna Gavrilyuk

Analysis of the criteria significance in assessing the creditworthiness of

individuals . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

Tetyana Efanova

Evaluation of intra-regional differentiation based on neuro-fuzzy

simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

Kateryna Kononova

Trust evaluation: theoretical models and results of empirical research on

social networks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

Yuriу Lysenko, Oleksii Mints Modeling of innovative intellectual decision-making systems in the

economy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

Inna Strelchenko Selection of a neural network optimum topology in problems of dynamic

economic systems classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142

Yehor Shcherbakov Application of mathematical models for voice identification in the field of

financial security . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158

New editions on the journal's subject . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191

Page 201: МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИD0%9D%D0%B0%D1%83%D0%BA… · ти такой оценки. Практичной ценностью выполненного

Наукове видання

НЕЙРО-НЕЧІТКІ

ТЕХНОЛОГІЇ МОДЕЛЮВАННЯ В ЕКОНОМІЦІ

Науково-аналітичний журнал

Заснований у 2011 р.

Виходить двічі на рік

№ 6

Художники обкладинки Г. Мір Алленде, М. Мейдич Коректор Ю. Пригорницький

Верстка О. Руденко

Підписано до друку 15.09.17. Формат 6084/16. Папір офсет. № 1. Гарнітура Тип Таймс. Друк офсетний. Ум. друк. арк. 11,62.

Обл.-вид. арк. 13,22. Наклад 100 пр. Зам. № 17-5376

Державний вищий навчальний заклад «Київський національний економічний університет імені Вадима Гетьмана»

03680, м. Київ, проспект Перемоги, 54/1

Тел./факс (044) 537-61-41; тел. (044) 537-61-44 E-mail: [email protected]