oлопкова hльга ндреевна МЕТОДЫ И АЛГОРИТМЫ...

2ФГБОУ ВО «РОССИЙСКИЙ ЭКОНОМИЧЕСКИЙ УНИВЕРСИТЕТ

ИМЕНИ Г.В. ПЛЕХАНОВА»

На правах рукописи

Хлопкова Ольга Андреевна

МЕТОДЫ И АЛГОРИТМЫ ИНТЕЛЛЕКТУАЛИЗАЦИИ ПРИНЯТИЯ

РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ НА БАЗЕ АППАРАТА

НЕЙРОННЫХ СЕТЕЙ И ЭВОЛЮЦИОННОГО МОДЕЛИРОВАНИЯ

Специальность 05.13.17 – Теоретические основы информатики

Диссертация

на соискание ученой степени

кандидата технических наук

Научный руководитель:

Комлева Нина Викторовна,

кандидат экономических наук, доцент

Москва 2016

2

Оглавление

ВВЕДЕНИЕ ............................................................................................................ 4

ГЛАВА 1. ОБЗОР НЕЙРОЭВОЛЮЦИОННЫХ МЕТОДОВ И СИСТЕМ

ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

......................................................................................................................................... 11

1.1.1 Постановка задачи принятия решений в условиях

неопределенности ................................................................................................... 11

1.1.2 Обзор методов и систем поддержки принятия решений в условиях

неопределенности ................................................................................................... 13

1.3.1 Метод эволюции нейронных систем путем стохастического синтеза

................................................................................................................................... 22

1.3.2 Нейроэволюционный метод расширения топологий ....................... 23

1.3.3 Метод эволюционной модификации топологии нейронных сетей 26

1.3.4 Метод оптимизации нейронной сети ................................................. 29

1.3.5 Метод динамической нейроэволюции с ограничениями ................ 31

1.3.6 Метод адаптивной симбиотической нейроэволюции ...................... 32

1.3.7 Метод усиления субпопуляций .......................................................... 35

1.3.8 Стандартный метод нейроэволюции ................................................. 36

1.3.9 Метод клеточного кодирования ......................................................... 37

1.3.10 Метод обобщенного наращивания рекуррентных связей ............. 39

1.3.11 Метод эволюционного программирования нейросети .................. 41

1.3.12 Метод новой эволюционной стратегии ........................................... 44

1.3.13 Сравнение и классификация нейроэволюционных методов ......... 45

ГЛАВА 2. РАЗРАБОТКА НЕЙРОЭВОЛЮЦИОННОГО МЕТОДА И

АЛГОРИТМОВ ДЛЯ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ

НЕОПРЕДЕЛЕННОСТИ .............................................................................................. 55

2.1.1 Определение схемы кодирования хромосом .................................... 55

3

2.1.2 Определение генетических операторов ............................................. 57

2.1.3 Определение этапов эволюции топологии и настройки параметров

особей ....................................................................................................................... 60

2.1.4 Определение дополнительных структур данных ............................. 61

2.2.1 Описание структур данных нейроэволюционного метода ............. 62

2.2.2 Реализация этапов нейроэволюционного метода ............................. 64

2.3.1 Генетический алгоритм глобального поиска .................................... 66

2.3.2 Генетический алгоритм локального поиска ...................................... 75

ГЛАВА 3. РАЗРАБОТКА МЕТОДИКИ ПОДБОРА КРИТЕРИЕВ ОЦЕНКИ

НЕЙРОЭВОЛЮЦИОННОГО МЕТОДА И ЭМПИРИЧЕСКОЕ ИССЛЕДОВАНИЕ

ЕГО ЭФФЕКТИВНОСТИ ............................................................................................ 82

3.2.1 Задачи адаптивного управления......................................................... 87

3.2.2 Задача о классификации точек единичного гиперкуба ................... 91

3.2.3 Задача восстановления поврежденных данных ................................ 93

3.2.4 Сравнение эффективности нейэроэволюцонных методов .............. 95

3.3.1 Модель системы поддержки принятия решений на базе

нейроэволюции ...................................................................................................... 100

3.3.2 Программная реализация системы поддержки принятия решений

на базе нейроэволюции ........................................................................................ 102

ГЛАВА 4. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ РАЗРАБОТАННОГО

НЕЙРОЭВОЛЮЦИОННОГО МЕТОДА .................................................................. 109

4.2.1 Подбор показателей, используемых для многокритериальной

оценки контента .................................................................................................... 118

4.2.2 Реализация предварительной обработки данных ........................... 121

4.2.3 Архитектура системы интегрированной рейтинговой оценки ..... 123

ЗАКЛЮЧЕНИЕ ................................................................................................. 141

СПИСОК СОКРАЩЕНИЙ И УСЛОВНЫХ ОБОЗНАЧЕНИЙ .................... 143

СПИСОК ЛИТЕРАТУРЫ ................................................................................ 145

4

ВВЕДЕНИЕ

Актуальность темы исследования. Нейросетевые модели по праву

считаются одним из эффективных инструментов решения широкого круга задач

когнитивистики, прогнозирования и управления. Они демонстрируют высокие

показатели качества в системах поддержки принятия решений (СППР),

оперирующих неполными, трудноформализуемыми и неточными данными.

Успешно разрабатываются, совершенствуются и применяются различные модели

искусственных нейронных сетей (ИНС). Однако масштабному распространению

СППР на базе ИНС препятствуют сложности, связанные с процессом подбора

топологии и обучения сети, закономерные в рамках парадигмы нейросетей, но

преодолимые путем гибридизации с методами эволюционного моделирования.

Основные трудности обучения ИНС связаны с задачей нахождения глобального

экстремума функции ошибки, и именно попытки ее решения способствовали

развитию нейроэволюционной теории, изучающей гибридные формы настройки

нейросетей эволюционными алгоритмами.

Большинство известных нейроэволюционных методов применимы для

нейросетей определенного типа (например, только прямого распространения или

только полносвязных), накладывают ряд входных ограничений на ИНС и

модифицируют в ходе эволюции не все ее параметры. При этом для каждой

конкретной задачи параметры нейросети выбираются эмпирически, что не всегда

приводит к оптимальным результатам, требует времени и участия эксперта. В

связи с этим вопросы автоматизации выбора топологии и процесса настройки

параметров нейросетей представляют особый прикладной и научный интерес.

Решаемые в диссертационной работе задачи реализации предлагаемого

нейроэволюционного метода для интеллектуализации принятия решений в

условиях неопределенности являются важными для исследований в направлении

оптимизации СППР.

5

Степень разработанности темы. В разработку теории принятия решений

внесли неоспоримый вклад видные отечественные и зарубежные ученые:

А. Н. Колмогоров, И. В. Павлов, Э. А. Трахтенгерц, Л. Вайс, Л. Заде, Т. Андерсон,

Е. Пейдж, Т. Саати и другие.

Развитием теории искусственных нейронных сетей в разное время

занимались многие известные ученые, в том числе У. Маккалок, В. Питтс, М.

Минский, Д. Хебб, Ф. Розенблатт. Авторство различных моделей ИНС

принадлежит Т. Кохонену, А. Галушкину, К. Фукусимае, Д. Хопфилду, С.

Барцеву, В. Охонину и другим.

Методы эволюционного моделирования представлены в работах таких

ученых как Дж. Г. Холланд, Н. А. Барричелли, Л. Дж. Фогель, А. Фрейзер.

Вопросы гибридизации ИНС и методов эволюционного моделирования

освещались в работах следующих ученых: В. Добрынин, С. Ульянов, А. Мишин,

Г. Бени, Д.Е. Румельхарт, Л. Ванг, И. Рехенберг, Дж. Миллер, К. Стэнли, Р.

Мииккулайнен. Авторство наиболее эффективных нейроэволюционных методов

принадлежит таким известным ученым как Ф. Паземан, П. Энжелин, Г. Сондерс,

Г. Шер, Л. Шеффер, Ф. Грюау, Кс. Яо, Ю. Ли, Х. Китано, С. Нолфи, Д. Париси, Л.

Элман.

Несмотря на наличие значительного количества работ в данной области,

существует необходимость разработки новых нейроэволюционных методов и

алгоритмов, позволяющих существенно расширить возможности нейроэволюции

и повысить эффективность систем поддержки принятия решений.

Цели и задачи диссертационной работы. Целью исследования является

разработка метода, модели и алгоритмов на базе аппарата нейронных сетей и

эволюционного моделирования для интеллектуализации принятия решений в

условиях неопределенности. Достижение поставленной цели реализуется как

решение комплекса взаимосвязанных задач:

6

1. Исследование, критический анализ и классификация систем поддержки

принятия решений, а также известных нейроэволюционных методов,

используемых для решения задач в условиях неопределенности.

2. Разработка нейроэволюционного метода для генерирования эффективной

топологии и автоматической настройки параметров нейросети в соответствии с

решаемой практической задачей.

3. Разработка алгоритмов глобального и локального генетического поиска

для оптимизации структуры и модификации параметров нейросетей

произвольной топологии.

4. Разработка методики расчета основных критериев оценки параметров

нейроэволюционного метода для исследования его эффективности на множестве

эталонных задач.

5. Построение модели системы принятия решений, инкапсулирующей

модуль для нейроэволюционной обработки данных в условиях неопределенности.

6. Разработка программного инструментария, обеспечивающего реализацию

нейроэволюционного метода и модели системы поддержки принятия решений в

условиях неопределенности.

7. Экспериментальное исследование работоспособности и эффективности

предложенной модели СППР в приложении к актуальным практическим задачам,

а также оценка качества полученных результатов.

Объектом исследования является нейроэволюционная интеллектуализация

обработки данных.

Предметом исследования является разработка метода и алгоритмов

интеллектуализации поддержки принятия решений в условиях неопределенности

на базе нейроэволюции.

Область исследования. Работа выполнена в соответствии с п. 2

«Исследование информационных структур, разработка и анализ моделей

информационных процессов и структур», п. 8 «Исследование и когнитивное

моделирование интеллекта, включая моделирование поведения, моделирование

7

рассуждений различных типов, моделирование образного мышления» и п. 13

«Применение бионических принципов, методов и моделей в информационных

технологиях» специальности 05.13.17 – «Теоретические основы информатики».

Научная новизна заключается в следующих научно обоснованных

результатах, полученных лично автором в ходе диссертационного исследования:

1. Впервые проведены анализ и классификация известных

нейроэволюционных методов, что позволило сформулировать их основные

особенности, достоинства и недостатки, а также подтвердило необходимость

разработки концептуально нового метода, учитывающего опыт предыдущих

исследований в данной области.

2. Разработан новый нейроэволюционный метод, позволяющий

корректировать топологию и параметры нейросети и обладающий оригинальной

совокупностью свойств, основными из которых являются адаптивность структуры

и низкая связность особей, динамичность эволюции, а также возможность

гибридизации. В отличие от большинства классических реализаций

нейроэволюции, метод лишен таких недостатков как конкуренция представлений,

незащищенность инноваций, проблемы начального размера и топологических

инноваций.

3. Разработаны алгоритмы глобального и локального генетического поиска,

позволяющие, в отличие от существующих, модифицировать нейросеть

произвольной топологии и направлять эволюцию как по пути структурного

упрощения, так и структурного усложнения ИНС, за счет чего достигается

снижение ресурсоемкости и расширение пространства генетического поиска.

4. Разработана методика подбора и расчета критериев оценки

нейроэволюционного метода для его практического применения в качестве

модуля СППР. Данные критерии являются наиболее полными в сравнении с

известными критериями для аналогичных методов. Они позволяют учитывать

такие параметры генетического представления как онтогенетическая

приспосабливаемость, множественность, компактность, замкнутость

8

представления, устойчивость, а также совокупные характеристики процесса

эволюции и характеристики генерируемых нейросетей.

5. Разработана модель системы поддержки принятия решений в условиях

неопределенности на базе нейроэволюции. В отличие от существующих СППР,

такая система является самообучаемой: в ходе нейроэволюции она может быть

модифицирована в соответствии с изменяющимися условиями задачи.

6. Разработан программный инструментарий, обеспечивающий реализацию


условиях неопределенности и позволяющий использовать его при решении

практических задач интеллектуализации обработки данных в качестве

встраиваемого или автономного модуля СППР.

Теоретическая и практическая значимость работы. Основные

положения диссертации представляют собой определенный вклад в теорию

принятия решений в части решения задач в условиях неопределенности с

помощью методов на базе нейросетей и эволюционного моделирования.

Выводы и результаты исследования ориентированы на практическое

применение разработанного метода и алгоритмов в интеллектуальных системах

поддержки принятия решений, оперирующих данными в условиях

неопределенности. Самостоятельное практическое значение имеет программный

инструментарий, созданный на основе данного метода и реализующий

нейроэволюционную модель системы поддержки принятий решений в условиях

неопределенности.

Методология и методы исследования. Для решения поставленных задач

применялись методы теоретической информатики, теории принятия решений,

вычислительной математики, математического анализа, математического

моделирования и теории искусственного интеллекта.

Положения, выносимые на защиту:

9

1. Нейроэволюционный метод для начального конфигурирования,

настройки параметров, оптимизации топологии и обучения нейросетей с

произвольной топологией.

2. Алгоритмы глобального и локального генетического поиска для

оптимизации топологии и параметров нейросетей, формируемых в ходе

нейроэволюции.

3. Методика подбора и расчета критериев оценки нейроэволюционного

метода для его практического применения в качестве модуля СППР.

4. Модель системы поддержки принятия решений, инкапсулирующая

модуль нейроэволюционной обработки данных в условиях неопределенности.

5. Результаты экспериментальных исследований метода, алгоритмов и

модели СППР, проведенные на разработанном программном инструментарии в

приложении к актуальным практическим задачам, оценка качества полученных

результатов.

Степень достоверности и апробация результатов. Результаты

диссертационной работы внедрены в Научно-исследовательском финансовом

институте Минфина России (НИФИ) при разработке СППР для защиты от

DDoS-атак, а также при разработке СППР для автоматизации обработки

материалов в виртуальной среде и контроля процесса научной деятельности.

Основные положения работы доказывались на следующих конференциях и

семинарах:

1. Всероссийская научно-практическая конференция «Математические

методы и интеллектуальные системы в экономике и образовании», Ижевск,

2013 г.

2. Международная научно-практическая конференция «Ценности и

интересы современного общества», Москва, 2013 г.

3. 5-я Международная научно-практическая конференция «Наука и

общество», Лондон, 2013 г.

10

4. Международная научно-практическая конференция «Ценности и

интересы современного общества», Москва, 2015 г.

5. Всероссийская научно-практическая конференция «Теоретические и

практические аспекты развития научной мысли в современном мире», Уфа,

2015 г.

Публикации. По результатам выполненных в диссертации исследований

опубликовано 9 работ, в том числе: 4 в периодических изданиях,

рекомендованных ВАК; 5 опубликовано в других изданиях, сборниках статей и

докладов конференций.

Структура и объем диссертации. Диссертационная работа состоит из

введения, 4-х глав, заключения, списка сокращений и библиографического списка

из 127 наименований. Работа содержит 157 страниц текста с 30 рисунками и 12

таблицами.

11

ГЛАВА 1. ОБЗОР НЕЙРОЭВОЛЮЦИОННЫХ МЕТОДОВ И

СИСТЕМ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В УСЛОВИЯХ

НЕОПРЕДЕЛЕННОСТИ

1.1 Обзор походов к интеллектуализации принятия решений

в условиях неопределенности

1.1.1 Постановка задачи принятия решений в условиях

неопределенности

Под принятием решений понимается процесс рационального выбора

альтернатив, имеющий целью достижение некоторого результата [1]. Для

исследования принятия решений было сформировано комплексное научное

направление - теория принятия решений, объединяющая понятия и методы

математики, теоретической информатики, системного анализа, статистики с

целью изучения закономерностей выбора путей решения проблем и задач, а также

способов достижения желаемого результата [17, 18]. В задачах принятия решений

c учетом большого количества факторов требуется точный математический

аппарат, позволяющий качественно и количественно сравнивать альтернативные

решения.

Задача принятия решений формулируется следующим образом. Пусть

имеется множество Α = {𝑎1, … , 𝑎𝑖 , … , 𝑎𝑆}, 𝑆 ≥ 2 альтернативных решений, одно из

которых в рамках данной задачи должно выбрать лицо, принимающее решение

(ЛПР). Возможные объективные условия, оказывающие влияние на выбор i-ого

решения множества Α, составляют множество состояний природы

Ω = {𝜔1, … , 𝜔𝑗 , … , 𝜔𝑇}, 𝑇 > 0, одно или несколько из которых имеют место во

время принятия решения. Множество Ω может обладать таким свойствами как

непрерывность и бесконечность. Помимо множества Ω на выбор той или иной

12

альтернативы оказывает влияние последствие принимаемого решения [3].

Последствие u – это функция, определенная на множестве альтернатив и на

множестве состояний природы:

𝑢 ∶ (𝐴 × Ω) → ℝ (1.1)

Задача ЛПР заключается в выборе решения из множества 𝐴 с учетом

состояний природы и последствий. В контексте нейроэволюционного подхода

совокупность состояний природы и последствий называется средой.

Оптимальность осуществленного ЛПР выбора в рамках поставленной задачи

зависит не только от критериев оптимальности альтернативы, но и от объема и

вида информации о среде (о состояниях природы). На основании этого в задаче

определяется критерий оптимальности – правило, позволяющее численно выявить

условие предпочтения одного решения по отношению к другому [1]. При помощи

критерия оптимальности возможно провести ранжирование множества 𝐴 по

предпочтительности.

По наличию случайных и неопределенных факторов задачи принятия

решений принято подразделять на три класса: детерминированные,

стохастические и в условиях неопределенности [49]. Большинство практических

задач, изучаемых теорией принятия решений, в том или ином виде содержат

неопределенность. Условиями неопределенности считается ситуация, при

которой результаты принимаемых решений неизвестны. К основным видам

неопределенности в зависимости от свойств имеющихся данных относятся:

неизвестность, то есть отсутствие каких-либо данных [9]; недостоверность

(недостаточность, неадекватность и неполнота данных, при которой невозможно

определить единственное распределение вероятностей для состояний природы

[16]); неоднозначность входных данных [15].

Принятие решений с учетом различного типа неопределенностей является

общим случаем задачи принятия решений, а принятие решений без их учета –

частным случаем. Несмотря на это, в связи с концептуальными и методическими

13

трудностями на данный момент отсутствует единый методологический подход к

решению таких задач.

1.1.2 Обзор методов и систем поддержки принятия решений в условиях

неопределенности

Система поддержки принятия решений – это специализированная

информационно-управляющая система, предназначенная для помощи в работе

лиц, принимающих решения [2]. Для выработки решений в СППР используются

методы из различных областей знаний, в том числе разработанные в рамках

концепции вычислительного интеллекта. В случае, если в качестве базы СППР

заложены методы искусственного интеллекта, то говорят об интеллектуальной

СППР [10]. Далее перечислены основные классические и базирующиеся на

теории искусственного интеллекта методы, применяющиеся в СППР [27].

Информационный поиск (information retrieval) [4] – совокупность методов

формирования на основе массива информации записей, удовлетворяющих

сформулированному запросу или условию поиска. Изучениям методов

информационного поиска посвящена междисциплинарная область науки,

объединяющая информатику, информационный дизайн, лингвистику, семиотику.

Глубинный анализ данных (data mining) [123] – совокупность методов

обнаружения в данных ранее неизвестных, нетривиальных и обладающих

практической пользой знаний, доступных для интерпретации и необходимых для

принятия решений в различных сферах деятельности. Основу глубинного анализа

данных составляют методы классификации, моделирования и прогнозирования,

основанные на применении деревьев решений, ИНС, ассоциативной памяти,

нечеткой логики [54]. К методам глубинного анализа данных также относятся

статистические методы анализа, среди которых: дескриптивный,

корреляционный, регрессионный, факторный, дисперсионный, компонентный,

дискриминантный, анализ временных рядов [5] и т.д.

14

Поиск знаний в базах данных (KDD, Knowledge Discovery in Databases) [5] –

совокупность методов поиска полезных знаний в массивах данных. Методами

KDD реализуются процессы подготовки данных, выбора информативных

признаков, очистки данных, применения глубинного анализа данных,

постобработки и интерпретации полученных результатов.

Рассуждение на основе прецедентов (CBR – Case-Based Reasoning) [38] –

совокупность методов ИИ, позволяющих использовать накопленный СППР опыт

при решении новых, неизвестных задач и помогающих ЛПР осуществлять

адекватный выбор при управлении процессами различной природы и сложными

объектами в условиях временных ограничений и различного типа

неопределенностей [11].

Имитационное моделирование [17] – совокупность методов

математического моделирования, применяющихся в исследовании систем, для

которых отсутствуют аналитические модели. Суть данных методов состоит в

замене изучаемой системы моделью, с достаточной точностью ее описывающей,

над которой проводятся эксперименты для получения информации о системе [6].

Когнитивное моделирование [13, 75] – совокупность методов анализа и

принятия решений в плохо определенных ситуациях, основанная на

моделировании субъективных представлений экспертов о ситуации.

К наиболее эффективным методам CI, используемым в интеллектуальных

СППР, относятся нейросети и эволюционные алгоритмы [40, 41].

Эволюционные алгоритмы [77] – это раздел эволюционного моделирования,

имитирующий принципы естественного отбора в задачах оптимизации.

Эволюционные алгоритмы отличаются тем, что легко могут быть описаны в

терминах математики [64]. К данной области относятся следующие направления

исследований, нашедшие применение в реализации СППР:

Генетические алгоритмы (ГА) [69] – эвристические методы поиска,

используемые для решения задач оптимизации и моделирования путем

случайного подбора, комбинирования и вариации искомых параметров.

15

Эволюционные стратегии (ЭС) [69, 75] – эвристические методы, схожие с

генетическими алгоритмами за исключением того, что в последующие поколения

передаются только положительные мутации.

Генетическое программирование (ГП) [83] – методы автоматической

генерации и модификации структуры исходного кода программ с помощью

генетических алгоритмов.

Эволюционное программирование (ЭП) [91] – методы автоматической

модификации параметров исходного кода программ с помощью генетических

алгоритмов.

Дифференциальная эволюция [124] – стохастический метод многомерной

оптимизации, использующий идеи генетических алгоритмов для нахождения

экстремума недифференцируемых, нелинейных, мультимодальных функций [90].

Программирование с экспрессией генов [120] – методы, объединяющие

идеи ГА и ГП для оптимизации особей, представляющих собой префиксные

записи выражений и хранящихся в виде строк фиксированной длины. Для того,

чтобы по строке всегда можно было построить выражение, вводится требование

корректности [116]: с заданной позиции строка должна содержать только

терминалы. Генетические операции реализуются аналогично операциям над

строками фиксированной длины в ГА [113]. Единственное отличие состоит в

требовании корректности строк.

Системы обучающихся классификаторов (LCS, Learning Classifier Systems)

[88] – методы создания эволюционирующих обучающихся систем, строящихся на

основе множества правил, алгоритмов вычисления вознаграждений, адаптивного

усиливающего обучения и ГА. В зависимости от способа применения

генетических алгоритмов данные системы делятся на два типа: Питтсбургские и

Мичиганские LCS [45]. Питтсбургские LCS определяют популяцию отдельных

наборов правил и оптимизирующий их ГА. В Мичиганских LCS определен

единственный набор правил в популяции, а генетический поиск направлен на

отбор лучших классификаторов в данном наборе. Мичиганские LCS условно

16

классифицируются по виду функции приспособленности на ZCS

(оптимизирующие силу) и XCS (оптимизирующие точность).

Искусственные нейронные сети. ИНС классифицируются на основании

следующих параметров: характер входных сигналов (двоичные или аналоговые)

[125], вид связей нейросети (ИНС прямого распространения и рекуррентные [43]),

тип обучения (с учителем или самоорганизация), структура (полносвязные,

многослойные, слабосвязные). Конфигурация структуры ИНС осуществляется на

основании особенностей и сложности решаемой задачи. Для решения многих

классов задач уже предложены и хорошо исследованы различные топологии

ИНС. Однако, если задача не может быть сведена к одному из известных типов,

требуется решать нетривиальную проблему выбора новой конфигурации [28].

Следует отметить, что нейросетевые системы и эволюционные методы,

несмотря на их возрастающую популярность в качестве модулей СППР, принято

рассматривать как альтернативное направление в теории принятия решений [31].

1.2 Анализ биоинспирированного подхода к

интеллектуализации принятия решений

Основная цель интеллектуальной поддержки принятия решений состоит в

том, чтобы помочь ЛПР в определенной предметной области оценить возникшую

ситуацию и спланировать действия в соответствии с известными условиями.

Необходимость поддержки принятия решений возникает на

трудноформализуемых этапах принятия решений [9], в связи с чем в качестве

основы для ее реализации целесообразно использовать модели и методы

вычислительного интеллекта.

К категории трудноформализуемых относятся задачи, имеющие

формальные постановки и алгоритмы решения, но не гарантирующие получение

качественного результата за приемлемое для конечного пользователя время,

особенно в случае их высокой размерности (NP-сложные задачи) [84]. Особо

17

остро необходимость в интеллектуальной поддержке принятий решений

проявляется при решении задач неформального (творческого, интеллектуального)

плана. Такие задачи характерны прежде всего для предметных областей, в

которых не существует функционально полных математических теорий описания

объектов и моделей принятия решений [7]. В качестве средств интеллектуальной

поддержки процессов принятия решений в таких предметных областях

целесообразно использовать биоинспирированные методы CI [12, 14, 45]. В

частности, прекрасно зарекомендовали себя нейросетевые технологии. Тем не

менее, распространению СППР на базе нейросетей препятствуют сложности,

возникающие при подборе топологии и параметров ИНС и нахождении

глобального экстремума функции ошибки. Также процесс обучения ИНС требует

составления выборок данных (обучающего, тестового и валидационного

множеств), охватывающих предметную область. К факторам, осложняющим

формирование обучающей выборки данных, относятся:

– неформализуемость или трудная формализуемость задачи [5];

– неполная либо полностью отсутствующая информация о корректных

значениях выходных сигналов, при которой известно множество векторов

входных сигналов, но соответствующие им выходные векторы не заданы;

– высокие вычислительные затраты или технически сложная реализуемость

составления репрезентативной обучающей выборки [122];

– отсутствие адекватной модели системы.

Для нивелирования обозначенных препятствий, возникающих при

использовании нейросетевого подхода интеллектуализации принятия решений,

хорошо подходят методы эволюционного моделирования [32]. Принято выделять

несколько причин, по которым эволюционные методы используются для

обучения и оптимизации нейросетей. Так, к преимуществам эволюционной

коррекции весовых коэффициентов и пороговых значений ИНС относятся:

1. Снижение риска возникновения проблемы локального оптимума [29]. С

увеличением количества примеров в обучающей выборке и сложности топологии

18

ИНС сложность пространства поиска также возрастает. Для функции ошибки

определяется все больше и больше локальных минимумов, распределенных по

растущему пространству поиска. Градиентные алгоритмы обучения ИНС [24] не

предназначены для выхода из локального оптимума для нахождения глобального

экстремума. Эволюционные методы (в частности, генетические алгоритмы)

прекрасно зарекомендовали себя в области эффективного перемещения по

большому пространству поиска со сложной структурой для определения

оптимального или квазиоптимального решения. При этом с ростом сложности и

размера пространства поиска растет и эффективность ГА для обучения ИНС в

качестве альтернативы градиентным методам обучения.

2. Универсальность эволюционных методов [79]. Способность

эволюционных методов к обобщению заключается в том, что для их применения к

ИНС различного типа требуются минимальные изменения в самом методе. Они

оптимизируют веса для рекуррентных ИНС и ИНС прямого распространения,

ИНС с сигмоидными, линейными и даже ступенчатыми функциями активации,

градиентные методы обучения для которых в принципе не применимы.

Тем не менее, нейроэволюционный подход обладает качествами, которые в

ряде случаев могут быть расценены как недостатки: большое количество

эвристик, заложенных в нейроэволюционном методе [34]; множество параметров,

оптимальные значения которых выявляются опытным путем; отсутствие метода

формализации априорных знаний о проблеме и процесса управления поиском

решения [96]. Ключевым элементом универсальности эволюционных методов

является возможность применения к ИНС произвольной функции

приспособленности, в том числе и разрывных функций, формирующихся по

принципу минимальной длины описания (MDL, minimum description length) [24].

Согласно принципу минимальной длины описания, следует минимизировать

общую длину описания данных с помощью модели и описания самой модели.

Применительно к нейросетевому моделированию данный принцип позволяет

повысить качество обобщения ИНС.

19

Использование произвольной оценочной функции требуется не столько в

классических нейросетевых задачах (распознавание образов и аппроксимация

функций), сколько в задачах управления и поддержки принятия решений. В

данных областях вычисление эффективности ИНС выходит за рамки расчета

среднеквадратической ошибки сети и является нетривиальной задачей.

3. Эволюция правил обучения. Очевидно, для различных топологий и задач

обучения требуются и различные алгоритмы. Поиск оптимального или

квазиоптимального правила обучения, как правило, происходит с учетом

экспертных знаний и зачастую - методом проб и ошибок [32, 33]. Поэтому весьма

перспективным является развитие автоматических методов изменения правил

обучения ИНС. Широкими возможностями в этой области обладает

эволюционный подход. Схема хромосомного представления в случае эволюции

правил обучения отражает такие динамические характеристики как вероятность и

вид мутации, размер популяции, правила применения кроссинговера. Под

статическими параметрами в данном случае понимаются топология и значения

весов сети, которые кодировать значительно проще. В сравнении со

стандартными методами обучения с подкреплением нейроэволюционные методы

более робастны и стойки к зашумленным и поврежденным входным образам.

Несмотря на перечисленные достоинства эволюционного обучения,

согласно теореме NFL (No Free Lunch theorem) [124] на полном множестве задач

нельзя выделить самый лучший метод оптимизации. Поэтому с большой

вероятностью нейроэволюционные методы покажут не лучшие результаты по

сравнению со специально разработанными методами: если алгоритм выигрывает

по своим характеристикам при решении некоторого класса задач, то это

компенсируется худшими характеристиками для остальных задач. Однако одним

из главных достоинств нейроэволюционных систем является предоставляемый

ими унифицированный подход к решению различных проблем. В частности, для

сложных переборных задач (большинство из которых NP-полные),

нейроэволюционные алгоритмы показывают блестящие результаты [125, 126].

20

1.3 Анализ и классификация нейроэволюционных методов

принятия решений

В настоящее время, несмотря на бурное развитие теории нейроэволюции,

число эффективных методов, которые целесообразно применять на практике,

невелико. Прежде чем перейти к их рассмотрению, необходимо дать некоторые

определения. Генетические алгоритмы манипулируют популяциями – конечным

множеством хромосом. Хромосомы представляют собой упорядоченные

последовательности генов, каждый из которых кодирует какой-либо параметр

ИНС [99]. Структура, содержащая набор хромосом конкретной особи, называется

генотипом.

G – пространство генотипов в выбранной схеме кодирования, которое

может быть задано напрямую перечислением или косвенно грамматикой Г с

языком L(Г) = G. Фенотип – это декодированный генотип, то есть одно из

решений в пространстве поиска. Аллель - это значение гена, размещенного в

конкретной позиции (локусе) хромосомы.

Функция декодирования D для формирования фенотипа p определяется по

формуле 𝑝 = 𝐷(𝑔, 𝐸𝐷), где D – функция декодирования фенотипа p,

соответствующего генотипу 𝑔 в окружающей среде 𝐸𝐷, в случае, если среда

влияет на параметры функции. D может быть стохастической функцией с

соответствующим вероятностным распределением на пространстве

фенотипов [63].

𝑝2 = 𝐿(𝑝1, 𝐸𝐿) – функция обучения, преобразующая под влиянием среды

фенотип 𝑝1 в фенотип 𝑝2. Среда может включать в себя обучающую выборку и

множество дополнительных параметров (например, скорость обучения).

P – пространство всех возможных в данной схеме кодирования фенотипов:

(∀𝑝 ∈ 𝑃)(∃𝑔 ∈ 𝐺)((𝑝1 = 𝐷(𝑔, 𝐸𝐷) ∩ (𝑝 = 𝐿(𝑝1, 𝐸𝐿))) (1.2)

21

𝜋 – функция приспособленности (функция оценки, фитнес-функция),

которая представляет меру приспособленности каждой особи в популяции [64].

S – множество решений: структуры нейросетей, т.е. фенотипы

(подмножество P), которые удовлетворяют критериям, заданным функцией 𝜋 в

среде 𝐸𝜋. В нейроэволюционной системе с представлением R существует решение

в случае, если 𝑆 ⊆ 𝑃, или хотя бы 𝑆 ∩ 𝑃 ≠ ∅. Таким образом, данная схема

кодирования должна генерировать по крайней мере одно решение.

A – множество приемлемых решений, также называемых «хорошими». В

общем случае возможны ситуации, когда 𝐴 ∩ 𝑃 = ∅, но для практического

использования нейроэволюционная система должна отвечать критерию

𝐴 ∩ 𝑆 ≠ ∅ (1.3)

Нейроэволюционный процесс [35] в общем случае состоит из этапов,

представленных на рисунке 1.1.

Рисунок 1.1 – Основные этапы нейроэволюции

Очевидно, процессы кодирования и декодирования хромосом играют

важную роль в процессе нейроэволюции. А так как эффективность их реализации

во многом определяется схемой кодирования, то от нее во многом зависит

пространственная и временная сложность метода. При помощи введенной

терминологии далее изложены 12 основных нейроэволюционных методов,

проанализированы их достоинства и недостатки.

Генотип Фенотип

Декодирование

Обученная ИНС

Процесс обучения

Новая

популяция

Применение

генетических

операторов

Расчет функции

приспособленности и

кодирование

22

1.3.1 Метод эволюции нейронных систем путем стохастического синтеза

ENS3 (Evolution of Neural Systems by Stochastic Synthesis, эволюция

нейронных систем путем стохастического синтеза) – метод, основу которого

составляет биологическая теория коэволюции [101]. Метод был разработан в

2007 г. в Институте теоретической математики имени Макса Планка Фрэнком

Паземаном и Ульфом Дикманом. Коэволюция [87, 112] – это процесс совместной

эволюции, при котором приспособленность отдельных особей зависит от других

особей популяции. Метод ENS3 применим для ИНС, состоящих из нейронов,

использующих сигмоидную функцию активации, но не накладывает ограничений

на количество нейронов и топологию. Он единовременно оптимизирует

топологию нейросети и ее параметры: пороги активации, весовые коэффициенты.

Метод основан на поведенческо-ориентированном подходе к проектированию

нейронных систем. Изначально он был разработан для изучения сложной

динамики в сенсорно-двигательных системах автономных роботов и

программных агентов.

Метод ENS3 состоит из шести основных шагов:

1. Генерация начальной популяции 𝑃(0), состоящей из n(0) нейросетей.

2. Создание следующей популяции 𝑃′(0) путем репродукции начальной

популяции 𝑃(𝑡).

3. Изменение структуры и параметров особей популяции 𝑃′(𝑡) с

последовательным применением стохастических операторов S, E, V. Оператор V

(Variation operator) – стохастический аналог мутации, реализующий добавление и

удаление нейронов, связей и корректировку параметров. Результат его

применения зависит от вероятностей, постоянных для отдельных нейронов и

связей. Оператор расчета E (Evaluation operator) определяется решаемой задачей и

в общем случае задается в терминах функции приспособленности. Оператор

селекции S (Selection operator) определяет количество особей, попадающих в

новую популяцию.

23

4. Оценка каждой особи исходной и производной популяций 𝑃(𝑡) и 𝑃′(𝑡),

расчет функций приспособленности их особей.

5. Генерация популяции 𝑃′(𝑡 + 1) с использованием ранговой селекции

особей популяций 𝑃(𝑡) и 𝑃′(𝑡) в соответствии с их значениями

приспособленности.

6. Проверка достижения критериев остановки (по достижению

максимального количества эпох или заданной точности нейросетевого вывода).

Если ни один из критериев не достигнут, осуществляется переход к шагу 2.

К достоинствам метода относятся простота реализации и хорошая

производительность для нейросетей маленького и среднего размера. Однако в

методе ENS3 не реализован оператор кроссинговера, что необходимо посчитать

его недостатком, так как при должной реализации кроссинговер способен

существенно сократить время эволюции и ускорить формирование оптимальной

особи. Метод ENS3 также не допускает модификацию вида функций активации

нейронов. Кроме того, фиксированные вероятности мутации для нейронов и

связей сокращают пространство поиска: многие эффективные конфигурации ИНС

не могут быть сформированы в связи с низкой вероятностью изменения в

соответствующих узлах ИНС текущей популяции.

1.3.2 Нейроэволюционный метод расширения топологий

NEAT (Neuro-Evolution by Augmenting Topologies, нейроэволюционный

метод расширения топологий) – метод, оптимизирующий веса и последовательно

усложняющий структуру ИНС [77, 120]. Метод был разработан в 2002 году Кеном

Стэнли в Университете Техаса, Остин. Исходная популяция генерируется из

полносвязных нейросетей, состоящих из входного и выходного слоев, количество

нейронов в которых определяется заранее. За основу структуры генотипа в методе

взят список синапсов. Каждый синапс хранит индексы двух нейронов (источника

и получателя сигнала), вес связи, бит активности, указывающий, активен ли

24

данный синапс, и инновационное число для определения аналогичных генов при

кроссинговере [78]. Таким образом, в методе используется прямая схема

кодирования. Метод NEAT реализует два оператора мутации для раздельной

модификации весов и структуры; для каждого весового коэффициента

вероятность мутации фиксирована. Структурные мутации увеличивают размер

генотипа за счет добавления новых генов. Они добавляют либо связь для двух

ранее не соединенных нейронов, либо новый нейрон: при этом существующая

связь разбивается на две – вход и выход нового нейрона. Замещаемая связь

помечается как не активная; вес входящей связи задается равным единице, а вес

исходящей приравнивается к весу замещаемой связи.

Оператор кроссинговера базируется на биологических понятиях

гомологичных генов (аллелей) и процесса синапсиса — выравнивания

гомологичных генов перед кроссинговером. Метод NEAT использует

инновационные числа - исторические маркеры, связанные с каждым геном для

отслеживания хронологии вносимых в него изменений. Перерасчет исторических

маркеров осуществляется следующим образом: при добавлении нового гена

значение глобального инновационного числа увеличивается на единицу и

присваивается данному гену. Ген одной из особей сформированной для

кроссинговера пары с инновационным числом, отличающимся от всех

инновационных чисел генов второй особи, называется обособленным. Гены,

возникшие в данной особи позднее, чем любой из генов второй особи,

называются добавочными. Гены с одинаковыми инновационными числами

выравниваются и формируют генотип для следующего поколения двумя

возможными способами: смешиванием случайным образом подходящих генов

либо усреднением весов связей. На этапе кроссинговера задается вероятность

повторной активации для неактивированных генов. Метод NEAT работает с

видами внутри популяции и раздельным вычислением приспособленности

каждого вида, что позволяет сохранять генетическое разнообразие. Популяция

делится на автономные виды с помощью введения метрики на пространстве

25

генотипов. Для кластеризации на отдельные виды вводится расстояние 𝛿 между

хромосомами – линейная комбинация количества E добавочных генов, количества

D обособленных генов и средней разности весов совпадающих генов ��:

𝛿 = 𝑐1𝐸+𝑐2𝐷

𝑁+ 𝑐3�� , (1.4)

где 𝑁 – количество генов в генотипе большей длины, необходимое для

нормализации; 𝑐1, 𝑐2, 𝑐3 – заданные заранее коэффициенты.

Разбиение на виды на основании метрики 𝛿 позволяет решить проблему

незащищенности инноваций. Алгоритм кластеризации популяции P на виды

состоит из шагов:

1. Нулевая эпоха эволюции 𝑡0. Инициализация списка видов, нумерация

которых осуществляется по мере добавления, начальным видом 𝑠0.

2. Выбор случайным образом генотипа-представителя 𝑠0 и определение

порога принадлежности к виду 𝛿𝑡, который может корректироваться в ходе

эволюции в большую или меньшую сторону в зависимости от оптимального

количества видов, заданного заранее.

3. Вычисление в эпоху 𝑡 для каждого генотипа 𝑔 ∈ 𝑃 расстояния 𝛿 до

представителей классов 𝑠𝑖 и создание при необходимости новых видов.

Внутривидовая приспособленность особи рассчитывается исходя из общего

значения ее приспособленности и расстояния до других особей:

𝑓𝑖′ =

𝑓𝑖

∑ 𝐵(𝛿(𝑖,𝑗))𝑛𝑗=1

, (1.5)

где B – функция принадлежности к виду:

𝐵(𝛿(𝑖, 𝑗)) = {1, 𝛿(𝑖, 𝑗) ≥ 𝛿𝑡

0, 𝛿(𝑖, 𝑗) < 𝛿𝑡. (1.6)

В зависимости от суммы значений приспособленности 𝑓𝑖′ особей внутри

вида 𝑘 определяется потенциально возможное количество потомков 𝑛𝑘,

принадлежащих данному виду:

𝑛𝑘 = 𝐹𝑘

𝐹𝐴 𝑃𝑠 , (1.7)

26

где 𝐹𝑘 – средняя приспособленность внутри вида k; 𝐹𝐴

= ∑ 𝐹𝑘

𝑘 – сумма средних

приспособленностей всех видов; 𝑃𝑠 – размер популяции.

Таким образом определяется внутривидовое разделение

приспособленности. Виды с наименьшей приспособленностью не переходят на

следующую эпоху; внутри оставшихся видов выбираются случайным образом

особи для создания новой популяции. Особи с наилучшей внутривидовой

приспособленностью переходят в следующее поколение, а при отсутствии таких

особей предыдущее поколение полностью замещается.

У метода есть несколько модификаций, к наиболее удачным из которых

относятся: rtNEAT (real-time NEAT), Phased Pruning (Поэтапное упрощение),

cgNEAT (Content-Generating NEAT), HyperNEAT (Hypercube-based NEAT) –

метод, использующий косвенное кодирование для настройки параметров

полносвязной ИНС при фиксированной структуре [50].

К достоинствам метода NEAT относятся защита инноваций историческими

маркерами и поддержание разнообразия популяции за счет специализации. Эти

два подхода решают проблемы преждевременной сходимости и незащищенности

инноваций. Тем не менее, эволюция путем последовательного усложнения,

реализованная в методе, является причиной таких недостатков как ограничение

пространства поиска и высокая ресурсоемкость.

1.3.3 Метод эволюционной модификации топологии нейронных сетей

EANT (Evolutionary Acquisition of Neural Topologies, эволюционное

модифицирование топологий нейронных сетей) – метод, использующий

гибридную схему кодирования CGE (common genetic encoding, обобщенная схема

кодирования генов) [76]. Метод был разработан в 2005 году Йохансом Кассауном

и Джеральдом Соммером в Университете имени Кристиана Альбрехтса, Киль,

Германия. Схема CGE предназначена для раздельного модифицирования

структуры и параметров ИНС. Она обладает двумя важными свойствами:

27

полнотой и замкнутостью. Благодаря использованию CGE в методе EANT

удалось избежать этапа декодирования хромосом. Схема CGE определяет генотип

ИНС как линейную последовательность генов, способных принимать одну из трех

различные форм (аллелей) [118]: вход, узел или джампер. Вход – это ген,

обозначающий входной нейрон. Узел – это ген, обозначающий нейрон, которому

соотнесены четыре параметра: весовой коэффициент, текущее значение функции

активации, глобальный уникальный идентификатор GUID (Global Unique

IDentifier) и количество входных связей. Джампер – ген синаптической связи,

хранящий ссылки на два узла, соединенных данной связью, и GUID нейрона, с

которым соединен джампер. Джампер добавляется в генотип в результате

применения оператора структурной мутации.

Данный способ представления генотипа может быть интерпретирован как

линейное представление префиксного дерева программы в предположении, что

все входы и джамперы – это терминальные символы, а нейроны – функции.

Представление в виде дерева может храниться в массиве (линейном генотипе),

при этом структура дерева (топология нейросети) косвенно представлена

индексами элементов массива. Процесс расчета выходных значений фенотипов не

требует их декодирования в генотипы и состоит из следующих шагов:

1. Инициализация. Процесс вычисления выходов нейронов идет справа

налево; на начальном этапе определяется самый правый элемент линейного

генома.

2. Проход справа налево по генотипу. Для каждого элемента генотипа

выполняются правила: если текущий элемент – это вход, его текущее значение и

вес заносятся в стек; если текущий элемент – это нейрон, из стека извлекаются l

связанных с ним входных значений и их весовые коэффициенты. Результат

вычисления функции активации нейрона и вес заносятся обратно в стек. Если

текущий элемент – это джампер, то для него определяется последнее значение

нейрона, чей GUID совпадает со значением GUID джампера. Значение веса,

хранящееся в джампере, заносится в стек. Если джампер представляет собой

28

прямую, а не рекуррентную связь, сначала происходит копирование участка

нейросети начиная с нейрона, чей GUID совпадает с GUID джампера. Для

определенной таким образом подсети вычисляется значение выхода. Данное

значение и соответствующий ему вес заносятся в стек.

3. Формирование выходного вектора ИНС. После полного прохода справа

налево по генотипу из стека последовательно извлекаются значения вычислений,

количество которых совпадает с количеством выходов ИНС. Описанный процесс

эквивалентен расчету выходов для соответствующей декодированной ИНС, в

которой функция активации нейрона имеет вид:

𝑎𝑖(𝑡) = 𝑟(∑ 𝑤𝑖𝑗𝑎𝑗(𝑡) + ∑ 𝑤𝑖𝑗𝑎𝑗(𝑡 − 1)𝑛𝑗=𝑛𝑓+1

𝑛𝑓

𝑗=1) , (1.8)

где 𝑟 – функция активации нейрона;

𝑛 – количество входов нейрона;

𝑛𝑓 – количество прямых связей. Количество рекуррентных связей вычисляется

как 𝑛 − 𝑛𝑓.

Процесс модификации генотипов, закодированных по схеме CGE, состоит

из двух этапов:

1. Исследование пространства топологий [118]. На данном этапе

применяются операторы структурной мутации для добавления и удаления

джамперов, а также добавления новой подсети. Данные три вида мутации

равновероятны. Количество нейронов 𝑚, которые должны подвергнуться

мутации, вычисляется по формуле

𝑚 = 𝑝𝑚𝑁, (1.9)

где 𝑝𝑚 ∈ [0, 1] – вероятность структурной мутации, определяемая случайным

образом; 𝑁 – общее количество нейронов.

2. Настройка параметров при фиксированной топологии: использование

эволюционной стратегии для настройки весовых коэффициентов. Для метода

разработана модификация EANT2, отличающаяся использованием стратегии

CMA-ES (Covariance Matrix Adaptation Evolution Strategy, эволюционная стратегия

29

адаптации на базе матрицы ковариации) для оптимизации параметров и решения

проблемы преждевременной сходимости.

К достоинствам метода EANT относятся компактность представления

генотипа, отсутствие этапа декодирования и, как следствие, высокая скорость

работы. Следует отметить, что данный метод целесообразно использовать в

системах с ограничением по времени на решение задач. Недостатком метода

EANT является отсутствие операторов кроссинговера и структурной мутации для

удаления нейронов, и, как следствие, ограничение пространства генетического

поиска.

1.3.4 Метод оптимизации нейронной сети

DXNN (Deus Ex Neural Network, оптимизация нейронной сети) –

меметичный метод для раздельной модификации топологии и весовых

коэффициентов ИНС [114]. Метод был предложен в 2011 году Джином Шер в

Центральном Университете Флориды, США. В зависимости от реализации метод

DXNN поддерживает прямой и косвенный способ кодирования хромосом. Для

эволюции топологии в методе предусмотрен этап глобального поиска, в то время

как на этапе локального поиска оптимизируются только синаптические веса.

Метод DXNN состоит из девяти шагов [115]:

1. Создание начальной популяции из генотипов ИНС с минимальным

количеством нейронов.

2. Циклическое выполнение шагов 3-9 до достижения критерия остановки

(достижение максимального числа эпох или желаемого значения функции

приспособленности, ограничение по времени):

3. Преобразование генотипов, составляющих популяцию, в фенотипы.

4. Для каждого фенотипа выполнение следующих действий до тех пор, пока

значение приспособленности перестанет возрастать K раз подряд: оценка

приспособленности; локальная оптимизация весовых коэффициентов.

30

5. Декодирование фенотипов в генотипы с оптимизированными весами и

соотнесенными им значениями приспособленности.

6. Ранжирование особей по значению приспособленности; при равных

приспособленностях приоритет отдается ИНС с меньшим количеством нейронов.

7. Удаление 50% особей с наименьшей приспособленностью.

8. Расчет для каждой из оставшихся ИНС количества потомков N, которое

пропорционально приспособленности i-ой ИНС 𝑓𝑖, сопоставленной с общей

приспособленностью популяции 𝑓avg, средним размером ИНС 𝐶avg и размером

данной ИНС 𝐶𝑖 по формуле 𝑁𝑖 =𝑓𝑖𝐶avg

𝑓avg𝐶𝑖.

Генерирование популяции потомков путем копирования родителя и

применения к копии T раз подряд операторов мутации. T – число, выбираемое

случайным образом на отрезке: 𝑇 ∈ [1, √𝑃𝑡], где 𝑃𝑡 – количество нейронов в

родительской ИНС. В методе DXNN реализовано четыре вида мутации:

добавление нейрона; разбиение связи между двумя нейронами с последующим

добавлением нового нейрона; добавление выходной связи к выбранному

случайным образом нейрону; добавление входной связи к выбранному случайным

образом нейрону.

Реализованная в методе DXNN меметичность [44] обладает рядом

достоинств. Последовательная модификация топологии и весов позволяет

определить, показывает ли данная особь низкую приспособленность из-за

неудачно сформированной топологии или неправильно подобранных весов.

Также в большинстве нейроэволюционных методов операторы, изменяющие

значения весов, применяются случайным образом ко всем нейронам нейросети.

При этом вероятность оптимизации новых или требующих донастройки нейронов

чрезвычайно низка. Меметичные методы, в частности DXNN, напротив,

оптимизируют весовые коэффициенты недавно измененных или добавленных

нейронов, не затрагивая при этом оптимизированную на предыдущих итерациях

структуру. В то же время, методу DXNN присущи недостатки: эволюция идет по

31

пути усложнения топологии ИНС и наращивания количества нейронов, так как в

методе не реализованы такие операторы мутации как удаление связи или

удаление нейрона; из всех параметров нейронов метод оптимизирует только веса.

В связи с этим время формирования оптимального решения растет

экспоненциально при линейном увеличении сложности задачи.

1.3.5 Метод динамической нейроэволюции с ограничениями

ICONE (Interactively Constrained Neuro-Evolution, динамическая

нейроэволюция с ограничениями) – метод, использующий прямое кодирование с

ограничениями на пространство решений для формирования ИНС требуемой

топологии [105, 106]. Метод разработан Кристианом Ремписом и Фрэнком

Паземаном в 2012 году в Университете Оснабрюк, Германия. Метод ICONE не

требует преобразований фенотипа в генотип: геномы представляют собой

полноценные ИНС, состоящие из простых элементов: нейронов, синапсов, групп

нейронов и нейромодулей. Каждый из таких элементов имеет ряд параметров,

предназначенных для оптимизации, таких как порог, функция активации, весовой

коэффициент. Помимо настраиваемых параметров каждому элементу соотнесен

список свойств, предназначенных для настройки процесса эволюции для данной

особи. Он имеет вид словаря в формате ключ-значение, содержащего флаги и

метки. В процессе эволюции нейроны и связи могут быть добавлены или удалены

из ИНС. Исключения составляют интерфейсные нейроны, к которым привязана

соответствующая метка (вход/выход).

Согласно ГА, применяющемуся в методе ICON, каждая эпоха t эволюции

состоит из шести этапов:

1. Вычисление приспособленности 𝐹𝑖𝑡 каждой особи i из популяции.

2. Отбор N особей 𝑆𝑗𝑡 , 𝑗 ∈ [1, 𝑁] для кроссинговера.

3. Кроссинговер особей 𝑆𝑗𝑡 и добавление N потомков 𝑆′

𝑗𝑡 в популяцию.

32

4. Применение с некоторой вероятностью PMT оператора мутации MT.

5. Вычисление приспособленности каждой особи из множества 𝑆′.

6. Отбор особей и составление из них повой популяции для следующей

эпохи t+1.

Достоинством метода ICON является механизм ограничения пространства

поиска: при помощи списка параметров могут быть описаны ограничения на

определенные виды синаптических связей и некоторые значения параметров ИНС

или сформированы специфичные правила, указанные конечным пользователем.

Процесс эволюции, реализованный в методе ICON, является интерактивным, то

есть требует вмешательства эксперта. Это свойство можно отнести как к

достоинствам, так и к недостаткам в зависимости от специфики задачи. Так,

вмешательство эксперта выполнимо при решении далеко не всех практических

задач, а успех эволюции при этом во многом зависит от опыта эксперта. Следует

отметить недостаток метода: эволюция может быть направлена только по пути

структурного усложнения особей.

1.3.6 Метод адаптивной симбиотической нейроэволюции

SANE (Symbiotic Adaptive Neuro-Evolution, адаптивная симбиотическая

нейроэволюция) – метод кооперативной коэволюции для генерирования

нейросетей прямого распространения с единственным скрытым слоем, решающих

задачи управления в динамической среде [94, 95]. Метод был разработан Дэвидом

Мориарти и Ристо Микклайненом в 1997 году в Университете Техаса, Остин. В

методе реализован ГА, оперирующий бинарными хромосомами с использованием

мутации и рекомбинирования [62]. В отличие от модели конкурирующей

коэволюции, кооперативная коэволюция основывается на декомпозиции

решаемой задачи оптимизации (множества параметров и целевой функции), что

упрощает решение задач, обладающих высокой вычислительной и структурной

33

сложностью. Каждая особь популяции представляет собой только часть решения

задачи, полное решение формируется из множества таких особей.

В отличие от большинства методов, оперирующих популяциями

нейросетей, каждая из которых является неделимой единицей эволюции, данный

метод работает с популяциями нейронов [119]. Целью создания отдельного

нейрона является установление связей с другими нейронами популяции для

формирования корректно функционирующей нейросети. Специализации

нейронов внутри популяции могут быть схожими или различаться.

Метод SANE единовременно оперирует двумя популяциями: популяцией

нейронов, содержащих информацию о синаптических связях с другими

нейронами, и популяцией шаблонов нейросетей [124], определяющих наборы

нейронов, из которых строятся различные конфигурации. Эволюция в популяции

нейронов предназначена для поиска жизнеспособных элементов ИНС, в то время

как эволюция шаблонов нейросетей направлена на формирование эффективных

комбинаций из имеющихся элементов.

Особи популяции нейронов закодированы в виде бинарных хромосом [120],

содержащих связи нейронов. Каждая хромосома состоит из 8-битного поля

заголовка связи и 16-битного поля для хранения дробного весового

коэффициента. Нейроны скрытого слоя соединяются с входным и выходным

слоями ИНС посредством связей c по следующему правилу:

𝑐 = {𝐷 𝑚𝑜𝑑 𝑂, 𝐷 > 127𝐷 𝑚𝑜𝑑 𝐼, 𝐷 ≤ 127

, (1.10)

где 𝐷 – десятичное значение поля заголовка связи; 𝑂 – количество нейронов в

выходном слое; 𝐼 – количество нейронов во входном слое.

Особи в популяции шаблонов представлены хромосомами, каждая из

которых содержит массив размера 휁 указателей на соответствующие нейроны. На

начальном этапе массивы случайным образом заполняются указателями на

нейроны. На последующих этапах субпопуляции нейронов выбираются в

соответствии со значениями указателей в массивах.

34

Метод SANE состоит из восьми основных шагов:

1. Инициализация начальными значениями приспособленности каждого

нейрона в популяции нейронов и каждого шаблона в популяции шаблонов.

2. Выбор 휁 нейронов в соответствии с указателями из массива шаблона.

3. Создание ИНС, состоящей из выбранных нейронов.

4. Оценивание эффективности решения задачи с помощью данной ИНС.

5. Соотнесение значения приспособленности ИНС данному шаблону.

6. Повторение шагов 2-4 для каждой особи в популяции шаблонов.

7. Сохранение для каждого нейрона значения приспособленности пяти

наиболее эффективных ИНС, структурным элементом которых он являлся.

8. Применение операторов кроссинговера и мутации внутри популяций

нейронов и шаблонов. При этом нейроны ранжируются в зависимости от

значений их приспособленности. Кроссинговер осуществляется внутри случайно

отобранных пар, формируемых из 25% наилучших особей.

Результатом являются два потомка: нейрон, полученный с применением

одноточечного кроссинговера, и копия одой из родительских хромосом. Новые

нейроны замещают наименее приспособленных особей в популяции. На каждой

эпохе эволюции замещается 50% популяции нейронов. Оператор мутации

применяется с вероятностью 0.1% для каждого бита в хромосоме.

Достоинством метода SANE является успешное решение проблем

преждевременной сходимости и локального оптимума за счет поддержания в

популяции выборки из видов специализированных нейронов. Недостатками

метода являются: ограничение на топологию ИНС, оптимизация только весовых

коэффициентов без изменений таких параметров как пороговые значения и вид

функции активации, что существенно сужает класс решаемых задач.

35

1.3.7 Метод усиления субпопуляций

ESP (Enforced SubPopulations, усиленные субпопуляции) – метод,

основанный на методе SANE и расширяющий его введением рекуррентных связей

между нейронами [56, 102]. Метод был разработан Фаустино Гомезом и Ристо

Миклайненом в 2002 году в Университете Техаса, Остин. Метод ESP изменяет

количество нейронов полносвязной ИНС, не затрагивая при этом топологию.

Популяция состоит из отдельных субпопуляций [57] нейронов. Нейроны-

представители субпопуляций обладают различной специализацией и в

совокупности формируют полноценную ИНС. Процесс эволюции в данном

методе состоит из четырех основных шагов:

1. Инициализация. На данном шаге задается количество скрытых нейронов

u и инициализируются начальные субпопуляции хромосом нейронов. В отличие

от метода SANE, ESP формирует субпопуляции на первом шаге, а не в ходе

процесса эволюции из единой популяции. Хромосома инициализирует веса

входных и выходных связей вектором случайных чисел.

2. Оценивание. Случайным образом осуществляется выборка u нейронов по

одному из каждой субпопуляции, которая формирует скрытый слой ИНС.

Производится оценка приспособленности ИНС; значение приспособленности

добавляется к совокупному значению приспособленности каждого нейрона.

Процесс повторяется до тех пор, пока каждый из нейронов в среднем не

поучаствует в 10 оценках.

3. Рекомбинирование. Средняя приспособленность 𝑓𝑎𝑣𝑔 каждого нейрона

популяции вычисляется по формуле

𝑓𝑎𝑣𝑔 = 𝑓𝑡𝑜𝑡𝑎𝑙

𝑁 , (1.11)

где 𝑓𝑡𝑜𝑡𝑎𝑙 – совокупное значению приспособленности нейрона;

𝑁 – суммарное количество оценок для данного нейрона.

36

Нейроны внутри каждой субпопуляции ранжируются в зависимости от

значений 𝑓𝑎𝑣𝑔. Лучшие 25% особей рекомбинируются операторами

одноточеченого кроссинговера и мутации, формируя новое поколение.

Метод ESP использует оператор мутации BM (burst mutation, «мутация

расширением») [58]: для наилучших особей оператор определяет оптимальные

изменения внесением «шума», сила которого формируется распределением Коши

𝑓(𝑥) = 𝛼

𝜋(𝛼2+𝑥2).

4. Цикл оценивания и рекомбинирования повторяется, пока погрешность

ИНС не достигнет заранее заданного значения.

Метод ESP решает проблему преждевременной сходимости и имеет

довольно высокую производительность [59]. Недостатком метода является

ограничение, накладываемое им на топологию: формируемые нейросети являются

полносвязными, что в ряде приводит к избыточности полученного решения. В

подавляющем большинстве случаев полносвязная структура может быть

существенно сокращена с целью повышения производительности ИНС и

снижения пространственной и временной сложности метода.

1.3.8 Стандартный метод нейроэволюции

CNE (Conventional NeuroEvolution, стандартная нейроэволюция) – метод,

модифицирующий весовые коэффициенты нейросети и не затрагивающий ее

структуру [52, 53]. Метод CNE - это одна из первых успешных реализаций

нейроэволюции, предложенная Ричардом Белю, Джоном Маккинри и Николасом

Шраудольфом и в 1990 году в статье «Evolving Networks: Using the genetic

algorithm with connectionist learning». Не смотря на простоту, CNE внес

значительный вклад в развитие методов нейроэволюционной оптимизации [115].

У «стандартной нейроэволюции» есть множество реализаций, но как правило под

данным термином понимается в первую очередь сам метод CNE. Структура ИНС,

37

количество нейронов и все параметры за исключением весовых коэффициентов

задаются в методе заранее. Для оптимизации как правило выбираются

полносвязные ИНС.

Метод CNE состоит из четырех основных шагов:

1. Генерирование случайным образом начальной популяции 𝑃(0) из

хромосом, формирующихся путем последовательной конкатенации значений

весов. Весовые коэффициенты могут быть представлены двумя способами:

действительными числами или в виде бинарного представления.

2. Оценка приспособленности ИНС. Преобразование закодированного

генотипа в фенотип с последующей оценкой ИНС. Остановка по достижению

условия оптимальности ИНС.

3. Рекомбинирование: селекция (отбор лучших особей в ранжированном

ряду), мутация, кроссинговер.

4. Формирование новой популяции 𝑃(𝑡 + 1) и переход на новую эпоху

эволюции 𝑡 + 1.

К достоинствам метода относятся: простота реализации преобразований

генотип-фенотип, высокая скорость работы за счет компактного представления

генотипов. У метода CNE также есть и недостатки. Так, существует высокая

вероятность сходимости метода к локальному оптимуму. Метод требует

предварительного задания топологии нейросети, количества нейронов и связей, а

также обладает низкой масштабируемостью и не предназначен для решения

сложных задач: количество параметров, которыми оперирует метод,

полиномиально возрастает в зависимости от размера нейросети.

1.3.9 Метод клеточного кодирования

CE (Cellular Encoding, клеточное кодирование) – метод косвенного

кодирования для эволюции последовательности использования правил,

управляющих делением клеток, из которых строится ИНС [60]. Метод изложен

38

Фредериком Грюау в 1994 году в докторской диссертации (Университет ENS

Lyon, Франция). Метод CE предназначен для параллельной модификации

топологии путем последовательного усложнения и настройки весов нейросети.

Каждая клетка имеет входной и выходной узлы, посредством которых она может

быть присоединена к другим клеткам. Клетка также содержит внутренние

регистры [61] – память, хранящую параметры ИНС и инициализируемую

начальными значениями: 1 – вес; 0 – порог; тождественное отображение –

функция активации; 1 – коэффициент, на которой умножается полученное

значение функции активации. При делении клетки значения параметров

дублируются. ГА последовательно усложняет структуру и оптимизирует

параметры ИНС. Это осуществляется посредством косвенного

эмбриогенетического кодирования с построением грамматического дерева и S-

выражений.

Метод CE в первую очередь ориентирован на построение модульных ИНС,

состоящих из иерархически связанных подсетей. Он также пригоден для

формирования паттернов и рекурсивных структур [127].

Метод CE состоит из двух основных шагов:

1. Формирование набора правил.

2. Процесс эволюционного поиска, направленного на генерацию

последовательности применения правил, приводящей к оптимальному

результату.

Достоинством метода является возможность изменения функции активации

нейронов. Также метод способен создать ИНС любой конфигурации без

ограничений на количество нейронов и топологию. При этом формируемые в

результате применения генетических операторов особи являются гарантированно

жизнеспособными. Недостатком метода CE является высокая ресурсоемкость, так

как каждая клетка хранит копию грамматического дерева, маркеры и внутренние

регистры. Так как метод реализует косвенное кодирование, то ему присуща также

39

низкая производительность, связанная с необходимостью осуществления

операций кодирования-декодирования грамматического дерева.

1.3.10 Метод обобщенного наращивания рекуррентных связей

GNARL (GeNeralized Acquisition of Recurrent Links, обобщенное

наращивание рекуррентных связей) – метод эволюционного программирования

для создания рекуррентных ИНС, способный направлять эволюцию как по пути

упрощения, так и усложнения структуры нейросети [29]. Метод был разработан

Питером Энжелин, Грегори Сондерсом и Джорданом Поллаком в 1994 году в

Университете Огайо, США. Метод GNARL модифицирует топологию нейросети

и весовые коэффициенты с помощью алгоритма имитации отжига (simulated

annealing) [78]. Данный алгоритм предназначен для решения задачи глобальной

оптимизации и основывается на имитации физического процесса, происходящего

при кристаллизации вещества (в частности, при отжиге металлов).

Кристаллическая структура представляет собой кодированное решение. Метод

GNARL состоит из основных шагов:

1. Создание n случайным образом сконфигурированных ИНС. Количество

входных узлов num-in и выходных узлов num-out нейросети фиксировано для

каждой решаемой задачи. Ограничений на скрытые узлы и связи не

накладывается, в том числе возможно рекуррентное соединение нейрона с самим

собой.

2. В каждую эпоху эволюции ИНС ранжируются функцией

приспособленности 𝑓, заданной заранее: 𝑓: 𝑁 → 𝑅. Репродукция лучших 𝑛/2

особей заключается в коррекции весовых коэффициентов и структуры для каждой

родительской нейросети 𝑁. Для этого вычисляется температура 𝑇(𝑁):

𝑇(𝑁) = 1 − 𝑓(𝑁)

𝑓𝑚𝑎𝑥, (1.12)

40

где 𝑓𝑚𝑎𝑥 – максимальное значение приспособленности в рамках решаемой задачи,

определяется заранее.

Температура 𝑇(𝑁) является мерой эффективности нейросети 𝑁 и

используется в алгоритме отжига для определения структурного и

параметрического сходства между предком и потомком следующим образом: чем

больше температура ИНС, тем более сильным мутациям она подвергается.

3. Мутация. Мутации параметров ИНС заключаются в возмущении

значений весовых коэффициентов Гауссовым шумом с дисперсией 𝑇(𝑁)2:

𝑤 ← 𝑤 + 𝑁𝑜𝑟𝑚𝑎𝑙(0; 𝑇(𝑁)), ∀𝑤 ∈ 𝑁 (1.13)

В методе реализовано четыре вида мутаций структуры ИНС:

– Добавление k1 скрытых узлов с вероятностью Padd-node.

– Удаление k2 скрытых узлов с вероятностью Pdelete-node.

– Добавление k3 синаптических связей с вероятностью Padd-link.

– Удаление k4 связей с вероятностью Pdelete-link.

Каждое из значений ki выбирается на заданном заранее интервале,

сформированном по формуле (1.12). При добавлении узла вместе с ним

добавляются требуемые связи, инициализирующиеся нулевыми весовыми

коэффициентами; при удалении узла удаляются и его связи.

4. Завершение эволюции по достижению заданного условия останова; если

условие не достигнуто, осуществляется переход к шагу 2.

Достоинством метода GNARL является решение проблемы локального

оптимума на этапе модификации топологии ИНС. Данная проблема свойственна

алгоритмам поиска восхождением на вершину, используемым во многих

реализациях нейроэволюции [99]. Алгоритм поиска восхождением на вершину

может быть неэффективным для пространств поиска, имеющих несколько

локальных оптимумов, плато и гребни. Тем не менее, метод не предназначен для

модификации таких параметров ИНС как пороги нейронов и параметры функций

активации, что ограничивает область его применения.

41

1.3.11 Метод эволюционного программирования нейросети

EPNet (Evolutionary Programming Network, эволюционное

программирование нейросети) – метод, единовременно оптимизирующий

топологию и весовые коэффициенты ИНС [79]. Метод был впервые предложен

Каер Ассадом в 2003 году в статье «On Comparison between Evolutionary

Programming Network-based Learning and Novel Evolution Strategy Algorithm-based

Learning». Метод оптимизирует только нейросети прямого распространения с

сигмоидными функциями активации и реализует пять операторов мутации для

корректировки топологии нейросетей: удаление скрытых узлов, удаление связей,

добавление узлов и связей, настройка весов. Метод EPNet состоит из десяти

основных шагов:

1. Генерирование случайным образом начальной популяции из M

нейросетей. Количество скрытых узлов, количество связей и исходные весовые

коэффициенты задаются случайно на определенных заранее интервалах.

2. Частичное обучение каждой из ИНС популяции методом обратного

распространения ошибки. Количество эпох обучения K0 фиксировано и задается

изначально. После частичного обучения рассчитывается ошибка вывода E,

формируемая на валидационном множестве:

𝐸 = 100 𝑜max− 𝑜min

𝑇 𝑛∑ ∑ (𝑑𝑖(𝑡) − 𝑦𝑖(𝑡))2𝑛

𝑖=1𝑇𝑡=1 , (1.14)

где 𝑜max, 𝑜min – максимальное и минимальное значения выходных

коэффициентов;

𝑛 – количество выходов;

𝑖 – индекс узла;

𝑡 – индекс образа в валидационной выборке.

В случае, если ошибка E перестает уменьшаться, делается предположение,

что нейросеть попала в локальный минимум. Такие особи маркируются как

неудачные.

42

3. Ранжирование особей популяции в соответствии со значениями ошибок

вывода E от наиболее приспособленных к менее приспособленным.

4. В случае, если ошибка вывода оказывается меньше заранее

установленного значения или достигнуто максимальное количество эпох, процесс

эволюции переходит на шаг 10 и считается завершенным. Иначе – переход к

шагу 5.

5. Отбор для воспроизведения лучшей ИНС на основании ранжированного

ряда. Если отобранная особь не помечена как неудачная, переход к шагу 6. Иначе

– к шагу 7.

6. Частичное обучение выбранной ИНС методом MBP (Multiple Back

Propagation, метод множественного обратного распространения ошибки) [107] на

протяжении K1 эпох с целью формирования ИНС – потомка. Параметр K1

фиксирован и задается до запуска процесса нейроэволюции. Полученная ИНС

помечается способом, описанным на шаге 2. Маркированный потомок замещает

собой родительскую особь в текущей популяции. Возврат к шагу 3.

7. Определение количества скрытых узлов Nhidden, подлежащих удалению.

Nhidden – это случайное число на отрезке [1, Nmax], где Nmax – целое фиксированное

число (как правило Nmax < 4). Удаление Nhidden нейронов, отобранных случайным

образом. Частичное обучение упрощенной ИНС методом MBP и получение ИНС-

потомка. В случае, если потомок показывает лучшие результаты, чем наихудшая

особь из ранжированного ряда, он ее замещает и осуществляется переход к шагу

3. Иначе полученный потомок далее не участвует в отборе и осуществляется

переход к шагу 8.

8. Вычисление приблизительной значимости связей между нейронами

ИНС-предка. Определение количества подлежащих удалению связей способом,

аналогичным способу удаления нейронов на шаге 7. Частичное обучение

сокращенной ИНС методом MBP и формирование потомка. Если потомок

оказывается более приспособленным, чем наихудшее решение в популяции, он

замещает данное решение.

43

9. Определение количества связей и узлов для добавления в ИНС способом,

описанным на шаге 7. Вычисление примерной значимости каждой

предполагаемой связи с нулевым весовым коэффициентом. Добавление

случайным образом в структуру ИНС-предка связей в соответствии с их

значимостью. Добавление нейронов реализовано посредством разбиения

случайно выбранного узла на два новых. Новая «расширенная» ИНС считается

вторым потомком. Далее осуществляется частичное обучение первого и второго

потомков методом MBP и определение особей, переходящих в следующее

поколение. Замещение наихудшей ИНС текущей популяции потомком и переход

на шаг 3.

10. После завершения процесса эволюции наилучшая особь обучается на

выборках данных до тех пор, пока процесс обучения не сойдется на оптимальном

или близком к оптимальному решении.

Данный метод задействует прямую схему генетического кодирования с

двумя матрицами, в которых содержатся связи между нейронами и весовые

коэффициенты. Матрицы имеют одинаковый размер (m+N+n)× (m+N+n), где m –

количество входов ИНС, N – максимальное количество скрытых узлов, n –

количество выходов.

Достоинством метода является компромисс между структурной сложностью

формируемых решений и временной сложностью работы. Метод предполагает,

что оператор мутации топологии ИНС задействуется только в случае, когда

ошибка вывода E перестает уменьшаться (нейросеть попадает в точку локального

оптимума). В первую очередь осуществляется удаление нейронов или связей, а в

случае неудачи –добавления данных структурных элементов.

Метод обладает и недостатками. Так как в качестве способа обучения EPNet

использует метод обратного распространения ошибки, на него распространяются

и свойственные градиентным методам проблемы паралича нейросети, локального

минимума и определения размера шага обучения. Также для обучения с учителем

методом обратного распространения ошибки требуется подготовить

44

качественную обучающую выборку. Кроме того, использование матриц для

реализации прямой схемы кодирования и нескольких вспомогательных векторов

делает метод ресурсоемким.

1.3.12 Метод новой эволюционной стратегии

NES (Novel Evolutions Strategy – новая эволюционная стратегия) – метод,

оптимизирующий параметры при фиксированной топологии ИНС [79]. Метод

NES был предложен Каер Ассадом в 2003 году в статье «On Comparison between

Evolutionary Programming Network-based Learning and Novel Evolution Strategy

Algorithm-based Learning». Метод использует два генетических оператора:

основанный на субпопуляциях арифметический оператор кроссинговера

(Subpopulation-Based Max-mean Arithmetical Crossover, SB MAC) и оператор

мутации, изменяющий свои параметры по функции Гаусса в зависимости от

продолжительности эволюции (Time-Variant Mutation, TVM).

Кроссинговер SB MAC предполагает, что популяция особей-предков Π(𝑡)

состоит из μ особей и на каждой эпохе t разбивается на l субпопуляций, по 𝜇

𝑙

особей каждая. Особь 𝜓𝑗,max𝑡 считается элитной, если обладает наибольшим

значением приспособленности 𝑓𝑡−1 в j-ой субпопуляции.

Особь-предок 𝜓𝑗𝑡 определяется в j-ой субпопуляции, из которой исключена

элитная особь. Оператор кроссинговера определяет пару потомков (𝜉1𝑡 , 𝜉2

𝑡) по

формулам

𝜉1𝑡 = 𝛼𝜓𝑗,max

𝑡 + (1 − 𝛼)𝜓𝑗𝑡 , (1.15)

𝜉2𝑡 = (1 − 𝛼)𝜓𝑗,max

𝑡 + 𝛼𝜓𝑗𝑡 , (1.16)

где 𝛼 ∈ [0, 1] – параметр, случайным образом выбирающийся для каждой пары

особей;

𝛼 = const, экзогенный параметр, определяющий степень зависимости между

популяциями.

45

Мутация TVM определяется для особи 𝜉𝑗𝑡 по формуле

𝜉𝑖′ = 𝜉𝑖 + 𝜎(𝑡)𝑁𝑖(0, 1) ∀𝑖 ∈ {1, … , 𝑛} , (1.17)

где 𝑁𝑖 – функция, определяющая случайное распределение по Гауссу; 𝑟 ∈ [0, 1] –

случайное число; 𝜎(𝑡) = [1 − 𝑟(1−𝑡

𝑇)𝛾

] ; T – максимальное количество

поколений; 𝛾 ∈ 𝑅 – экзогенный параметр, определяющий степень зависимости

между популяциями.

Метод NES состоит из пяти основных шагов:

1. Генерация случайным образом начальной популяции Π(0), состоящей из

μ особей.

2. Эволюция: кроссинговер SB MAC, формирующий следующее поколение

t. При этом для каждой субпопуляции создается 𝜇

𝑙 потомков. Применение

оператора мутации TVM.

3. Оценка популяции. Потомки 𝜉𝑡 оцениваются с помощью функции

приспособленности 𝜙𝑡.

4. Если условие остановки эволюции выполнено, процесс останавливается.

Иначе осуществляется переход на шаг 4.

5. Создание нового поколения t+1 и переход на шаг 2.

Достоинством метода является динамичность: многие параметры

генетических операторов корректируются в ходе эволюции. Недостатком метода

является невозможность модифицирования топологии ИНС.

1.3.13 Сравнение и классификация нейроэволюционных методов

Нейроэволюционные методы целесообразно классифицировать по пяти

основным характеристикам: по наличию входных ограничений, по виду

эволюции, модифицируемым свойствам ИНС, схеме кодирования и набору

генетических операторов. В таблице 1.1 представлено сравнение ключевых

характеристик описанных методов: способа модификации нейросетей (какие из

46

характеристик подлежат изменению, по какому пути идет эволюция), способов

кодирования хромосом, методов эволюции. Также в таблице кратко указаны

основные особенности методов.

Таблица 1.1 – Сравнительные характеристики нейроэволюционных методов

Метод

Последовательность

модификации

параметров и

топологии

Способ

кодиро-

вания

хромосом

Метод

эволюции Особенности

ENS3

Параллельно Прямой ЭА Коэволюция, стохастические

генетические операторы,

эволюция без кроссинговера

NEAT

Раздельно Прямой ГА Исторические маркеры

(инновационные числа), видовая

специализация, использование

синапсиса и гомологичных генов

EANT Раздельно Прямой и

косвенный

ЭП, ЭС Гибридная схема кодирования и

генетические операторы

DXNN

Раздельно Прямой и

косвенный

Мемети-

ческий

Ограничения на изменяемые

параметры, локальная

оптимизация

ICONE

Раздельно Прямой ЭА Ограничивающие маркеры,

отсутствие преобразований

фенотип-генотип

SANE

Раздельно Прямой ГА Кооперация, коэволюция,

специализация, популяции

нейронов и шаблонов ИНС

ESP

Только параметры Прямой ГА Кооперация, коэволюция,

специализация, популяции

нейронов и шаблонов ИНС

CNE

Только веса Прямой ГА Структура ИНС задается заранее,

классическая реализация

нейроэволюции

CE

Параллельно Косвен-

ный

ГП Эмбриогенетическое косвенное

кодирование, использование

грамматик и S-выражений

GNARL Параллельно Прямой ЭП Алгоритм имитации отжига,

динамичность направления

эволюции

EPNet Раздельно Прямой ЭП Использование метода обучения

нейросетей MBP

NES

Только параметры Прямой ГА Использование операторов

кроссинговера и мутации SB

MAC и TVM; настройка

параметров генетических

операторов в ходе эволюции

47

1. Классификация нейроэволюционных методов по наличию входных

ограничений:

– ограничения на параметры ИНС, в том числе на вид и фиксированные

параметры функций активации, пороговые коэффициенты;

– ограничения на топологию: на количество и структуру слоев,

допустимость обратных связей;

– отсутствие ограничений: обработка нейросетей любой топологии вне

зависимости от вида и параметров ИНС, позволяющая наиболее полно

исследовать пространство поиска и рассмотреть нейросети всех возможных

конфигураций для формирования оптимального решения поставленной задачи.

В таблице 1.2 представлено сравнение ограничений, которые

накладываются рассмотренными методами на параметры (весовые

коэффициенты, пороговые значения, вид и параметры функции активации) и

топологию ИНС.

Таблица 1.2 – Классификация методов по наличию ограничений

Метод Вид ограничения

Параметры Топология

ENS3 Вид функции активации Нет

NEAT

Нет Исходная популяция: только

полносвязные ИНС; количество

нейронов фиксировано.

EANT Нет Нет

DXNN Нет Нет

ICONE Нет Нет

SANE Вид функции активации ИНС прямого распространения с 1-м

скрытым слоем

ESP Вид функции активации Полносвязные ИНС

CNE Вид функций активации и пороги

фиксированы

Топология фиксирована и задается

вначале

CE Нет Нет

GNARL Вид функции активации Рекуррентные ИНС

EPNet Вид функции активации ИНС прямого распространения

NES Вид функции активации Топология фиксирована и задается

вначале

48

2. Классификация нейроэволюционных методов по направлению эволюции

и возможности его корректирования:

– Структурное усложнение. Конструктивный подход, обеспечивающий

пошаговое усложнение структуры и наращивание нейронов и синаптических

связей. К реализующим данный подход методам относятся NEAT, DXNN, ICONE,

CNE и CE.

– Структурное упрощение. Деструктивный подход, при котором в

начальную эпоху эволюции формируется популяция избыточных ИНС (как

правило, полносвязных) с максимально допустимым количеством нейронов и

связей, сокращающихся в последующие эпохи. К методам, реализующим

деструктивный подход, относятся EPNet, Phased Pruning (модификация NEAT).

– Управляемая эволюция. В отличие от конструктивного и деструктивного

подходов, данный подход не имеет таких недостатков как сходимость к

локальному оптимуму и накладывание дополнительных ограничений на

топологию ИНС. К методам, основанным на управляемой эволюции, относятся

ENS3, EANT, SANE, ESP, GNARL.

3. Классификация нейроэволюционных методов по модифицируемым

свойствам нейросетей:

– Оптимизация параметров. Метод модифицирует один или несколько

параметров ИНС: чаще всего – это весовые коэффициенты, и, в некоторых

реализациях, параметры функции активации.

– Модификация топологии. Метод оптимизирует топологию ИНС

посредством удаления и добавления связей, нейронов и других структурных

элементов, таких как слои и плоскости.

– Модификация совокупности свойств. Метод реализует глобальный поиск

(изменение топологии) и локальный поиск (подбор параметров).

В таблице 1.3 приведено сравнение методов по количеству и типу

модифицируемых параметров ИНС.

49

Таблица 1.3 – Классификация методов по модифицируемым свойствам

Метод Модифицируемое свойство

Параметры Топология

ENS3 Пороги, веса Да

NEAT Веса Да

EANT Веса Да

DXNN Веса Да

ICONE Вид функций активации, пороги, веса Да

SANE Веса Да

ESP Веса Нет

CNE Веса Нет

CE Вид функции активации, пороги, веса Да

GNARL Веса Да, ограниченно

EPNet Веса Да, ограниченно

NES Веса Нет

4. Классификация нейроэволюционных методов по способу кодирования

хромосом:

– прямое кодирование: NEAT, DXNN, SANE, ESP, CNE, GNARL, EPNet,

NES;

– косвенное кодирование: DXNN, CE;

– гибридное кодирование: EANT.

5. Классификация нейроэволюционных методов по комбинации

используемых генетических операторов, среди которых:

– селекция. Та или иная реализация оператора селекции присутствует во

всех нейроэволюционных методах;

– мутация. В методе ENS3 оператор мутации применяется с фиксированной

вероятностью. В методе NEAT реализованы два оператора мутации для

раздельной модификации топологии и параметров. Мутация для удаления

нейронов не реализована в методах EANT и DXNN (в DXNN также не

реализована мутация для удаления связей);

– кроссинговер [48]. Данный оператор отсутствует в методах ENS3, EANT.

В методе NEAT реализован кроссинговер на основании «инновационных чисел»;

– специфичные операторы.

50

На основании свойств методов, изложенных в пунктах 1.3.1 – 1.3.12, и

приведенной классификации, можно сделать следующие выводы:

1. Подавляющее большинство методов не модифицирует вид функции активации

и ее параметры.

2. Большинство методов накладывает ограничения на структуру ИНС.

3. Во многих методах эволюция направлена исключительно по пути усложнения

(в некоторых случаях – последовательного упрощения) структуры.

4. Некоторые методы используют подход обучения с учителем, что требует

наличия репрезентативной выборки прецедентов и дополнительных

ограничений на структуру ИНС.

Таким образом, ни один из существующих методов не сочетает в себе такие

свойства как отсутствие ограничений на оптимизируемую ИНС, динамичность

эволюции, модификация множества всех допустимых параметров ИНС.

1.4 Формулирование целей и задач исследования

Целью исследования является разработка метода, модели и алгоритмов на

базе аппарата нейронных сетей и эволюционного моделирования для

интеллектуализации принятия решений в условиях неопределенности.

Достижение поставленной цели реализуется как решение комплекса

взаимосвязанных задач:

1. Исследование, критический анализ и классификация систем поддержки

принятия решений, а также известных нейроэволюционных методов,

используемых для решения задач в условиях неопределенности.

2. Разработка нейроэволюционного метода для генерирования эффективной

топологии и автоматической настройки параметров нейросети в соответствии с

решаемой практической задачей.

51

3. Разработка алгоритмов глобального и локального генетического поиска

для оптимизации структуры и модификации параметров нейросетей

произвольной топологии.

4. Разработка методики расчета основных критериев оценки параметров

нейроэволюционного метода для исследования его эффективности на множестве

эталонных задач.

5. Построение модели системы принятия решений, инкапсулирующей

модуль для нейроэволюционной обработки данных в условиях неопределенности.

6. Разработка программного инструментария, обеспечивающего реализацию



7. Экспериментальное исследование работоспособности и эффективности

предложенной модели СППР в приложении к актуальным практическим задачам,

а также оценка качества полученных результатов.

В соответствии с поставленными задачами разработан новый

нейроэволюционный метод, обладающий оригинальной совокупностью

следующих свойств:

Адаптивность структуры особей. При изменении параметров решаемой

задачи исходная топология нейросети может оказаться не оптимальной. Для

корректного функционирования в нестационарной окружающей среде нейросеть

должна быть реконфигурирована. В соответствии с требованиями к устойчивости

вывода [121] оптимизируются не только параметры нейронов, но и

перестраивается структура ИНС. Это позволяет учесть специфику конкретной

задачи.

Поскольку сложности при выборе топологии зачастую препятствуют

применению ИНС на практике, то адаптивная самонастраивающаяся система

способна упростить и в определенной степени автоматизировать процесс

настройки и обучения ИНС, повысить универсальность нейроэволюционного

подхода в целом.

52

Динамичность эволюции. Реконфигурирование топологии и настройка

параметров нейросети осуществляются на протяжении всего процесса ее

функционирования. Направление эволюции зависит от изменений свойств среды:

качественные и количественные изменения могут идти как по пути усложнения,

так и упрощения.

Экспоненциальное снижение быстродействия нейросети с ростом

количества ее элементов препятствует широкому распространению больших и

сверхбольших ИНС; такие сети сложно проектировать и настраивать.

Эволюционное изменение количества нейронов и слоев упрощает поиск

компромисса между скоростью и надежностью вывода [103].

Возможность гибридизации [73]. Генетические операторы применительно к

нейросетям позволяют комбинировать нескольких нейросетей в одну с

сохранением их «жизнеспособности». Благодаря этому становится возможной

генерация «нестандартных», нерегулярных топологий и гибридных ИНС [122].

Низкая связность. Раздельное обучение и объединение относительно

небольших нейросетей в одну разбивает процесс обучения на независимые этапы,

а саму нейросеть – на отдельные функциональные блоки, среди которых может

выделяться особый блок – память, по необходимости расширяемый за счет

добавления новых структурных элементов.

Кроме того, разработанный нейроэволюционный метод лишен классических

недостатков, которым подвержено большинство известных реализаций

нейроэволюции [104]:

Конкуренция представлений (проблема перестановок) – это проблема,

связанная с отсутствием биекции «генотип – фенотип», при котором один и тот

же фенотип топологически может быть представлен в генотипе несколькими

способами. Применение оператора кроссинговера для двух схожих фенотипов с

большой вероятностью генерирует поврежденную ИНС с повторяющимися или

отсутствующими элементами.

53

Незащищенность инноваций – это явление отсеивания в ходе

нейроэволюции новых конфигураций нейросетей, которые являются удачными,

но первые несколько эпох демонстрируют низкую приспособленность из-за

ненастроенных весовых коэффициентов, порогов и параметров функции

активации.

Проблема начального размера и топологических инноваций во многих

нейроэволюционных подходах возникает из-за того, что начальная популяция

формируется набором случайных топологий. При этом затрачивается время на

отсеивание заведомо нежизнеспособных особей, а сформированные популяции

имеют тенденцию к преждевременной сходимости к не оптимальным решениям.

Преждевременная сходимость означает остановку генетического алгоритма

до достижения им глобального оптимума [109].

«Паралич» и переобучение нейросети – неконтролируемый рост значений

весовых коэффициентов нейронов в процессе обучения и, как следствие,

активизация нейронов только при очень больших входных значениях ИНС [110].

1.5 Выводы по первой главе

1. Проведен обзор систем поддержки принятия решений в условиях

неопределенности и областей их применения, на основании которого показана

необходимость в разработке новой модели СППР, реализующей

нейроэволюционный подход к задаче принятия решений.

2. Проанализированы возможности известных нейроэволюционных методов

интеллектуализации принятия решений, исследованы их ключевые свойства,

достоинства и недостатки. В результате анализа методов сделан вывод о

целесообразности применения нейроэволюции в задаче принятия решений в


3. На основании анализа и проведенной классификации

нейроэволюционных методов отмечено, что представляет особый научный и

54

практический интерес разработка нового метода, лишенного недостатков,

присущих известным методам.

4. На основе обсуждения проблем разработки нейроэволюционных методов

поддержки принятия решений в условиях неопределенности сформулированы

цель и задачи исследования.

55

ГЛАВА 2. РАЗРАБОТКА НЕЙРОЭВОЛЮЦИОННОГО МЕТОДА

И АЛГОРИТМОВ ДЛЯ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В

УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

2.1 Определение ключевых требований к реализации процесса


2.1.1 Определение схемы кодирования хромосом

Базой для любого метода эволюционного построения ИНС является выбор

схемы кодирования-декодирования хромосом, то есть способа генетического

представления ИНС. Схема кодирования определяет класс сетей, которые могут

быть построены с помощью данного метода и именно от нее зависит

эффективность процесса нейроэволюции. Принято выделять два класса методов

кодирования хромосом: прямое и косвенное (параметрическое,

слабосвязное) [46].

Прямое кодирование фиксирует взаимно-однозначное соответствие между

фенотипом, образующим структурные элементы ИНС, и соответствующими

участками хромосомы. Биекция фенотип – генотип удобна для реализации,

позволяет отслеживать изменения популяции и причины этих изменений, а также

применять к хромосомам аппарат генетического поиска. Из наиболее

существенных недостатков такой схемы следует отметить зависимость длины

генотипа от количества нейронов и связей и, как следствие, низкую

эффективность при увеличении пространства поиска для построения больших и

сверхбольших ИНС [55].

Косвенное кодирование размещает в генотипе только правила построения

фенотипа. Генетическое представление и, следовательно, пространство поиска

ГА, является более компактным, а сам генотип позволяет кодировать модульные

56

структуры. При определенных условиях это дает преимущества в адаптивности

полученных результатов [47].

Не смотря на свойственную косвенному кодированию биологическую

правдоподобность и компактность представления, в предлагаемом методе

реализована схема прямого кодирования. Это обусловлено следующими

недостатками косвенного кодирования: низкой производительностью и

медленной сходимостью; невозможностью отслеживания изменений генотипа,

являющихся причинами заданных изменений фенотипа; ограничениями,

накладываемыми на генетические операторы. Реализация прямого кодирования,

напротив, позволяет оперировать нейросетями произвольной топологии и с

максимальной точностью настраивать отдельные параметры нейронов и связей.

Для корректного решения некоторых практических задач принятия решений

в условиях неопределенности требуются многослойные нейросети с экстра-

большим, порядка сотен тысяч, количеством нейронов. При обработке таких ИНС

нейроэволюционными методами наблюдается экспоненциальное снижение

быстродействия с ростом количества элементов ИНС. Данная закономерность

препятствует широкому распространению больших нейросетей: такие сети

сложно проектировать и настраивать. Для эффективной обработки экстра-

больших нейросетей следует уделить особое внимание способу кодирования

связей разреженных ИНС. При этом структура хранения хромосом должна

удовлетворять следующим требованиям:

– биекция между множествами генотипов и фенотипов. Данное требование

определяет прямой метод кодирования хромосом;

– компактность кода хромосомы: хромосома должна занимать в памяти

меньше места, чем соответствующий ей набор разреженных матриц. При этом

длина кода должна уменьшаться при уменьшении связности ИНС, которую он

представляет;

– оптимизация кода хромосом для ресурсоемких операций кодирования и

декодирования.

57

2.1.2 Определение генетических операторов

От особенностей реализации генетических операторов во многом зависит

возможность корректировки направления эволюции. Также генетические

операторы определяют накладываемые на генотипы и фенотипы ограничения.

Большинство из известных методов нейроэволюции используют ограничения на

направление эволюции, которая может идти либо только по пути структурного

усложнения, либо только по пути структурного упрощения особей.

Оба этих подхода ограничивают пространство генетического поиска.

Эволюция ИНС путем постоянного усложнения структуры и наращивания

количества нейронов (увеличения избыточности сети) имеет существенный

недостаток, заключающийся в высокой вероятности появления тупиковых ветвей

эволюции и невозможности возврата к более простым и эффективным

конфигурациям ИНС. Эволюция ИНС путем упрощения с последовательным

сокращением количества нейронов и связей также сопряжена со сложностями. К

основным недостаткам такого подхода относятся: высокая ресурсоемкость

(временные затраты на работу алгоритма и расходуемая на хранение сложных

ИНС память) и избыточная сложность ИНС, отбирающейся в качестве

оптимального решения. Наиболее целесообразным вариантом организации

процесса эволюции является совмещение операторов для наращивания и

сокращения структурной избыточности.

Необходимость усложнения структуры ИНС в процессе нейроэволюции

обусловлена основными факторами:

1. Ограничение на нейросетевое обобщение (максимальное количество

образов, распознаваемых ИНС), заключающееся в том, что количество

запомненных образов не может превышать количества нейронов в наименьшем

слое. Превышение данного лимита повышает вероятность выработки неверных

выходных сигналов, воспроизводящих образы, которым сеть не обучена.

2. Повышение надежности нейросетевого вывода за счет увеличения

избыточности ИНС [121].

58

3. Сокращение времени обучения ИНС. Обучать нейросеть с минимальным

числом связей дольше, чем нейросеть с избыточностью.

Понижение избыточности ИНС в ряде случаев может улучшить

характеристики нейросетевого вывода за счет следующих преимуществ:

1. Снижение ресурсоемкости ИНС: сокращение числа элементов (и, как

следствие, объема потребляемых ресурсов) и повышение скорости вывода.

2. Снижение риска «переобучения» ИНС, заключающегося в излишне

точной подгонке реакций нейронов на примеры из обучающей выборки. При

переобучении теряется способность нейросети к обобщению. Наиболее часто

переобучение возникает в ИНС со сложной структурой, не соразмерной

масштабам конкретной задачи.

3. Упрощение трудоемкого процесса интерпретации результатов обработки

данных и извлечения знаний на основании нейросетевого вывода.

Таким образом, реализованные в методе генетические операторы должны

обеспечивать динамичность процесса эволюции и корректировать особи как по

пути структурного упрощения, так и по пути структурного усложнения. Стоит

отметить, что большинство известных нейроэволюционных методов применимы

только для нейросетей определенного типа. Например, метод GNARL [29]

работает только с рекуррентными ИНС, в методе ENS3 [100] заложены

ограничения на вид функции активации, HyperNEAT [108] не предназначен для

эволюции топологии. Ограничения, накладываемые на структуру ИНС в ходе

нейроэволюции, препятствуют применению данных методов к решению многих

классов задач.

Это определяет целесообразность и востребованность разработки

достаточно универсального метода, допускающего гибкую адаптацию к

решаемым задачам. Требования, выдвигаемые к реализации генетических

операторов, формулируются следующим образом:

– для выбранной схемы кодирования хромосом должен существовать

полный набор генетических операторов, такой, что для любых двух особей

59

существует последовательность применения операторов, переводящая одну особь

в другую;

– способ реализации генетических операторов не должен накладывать

ограничений на направление процесса эволюции: качественные и количественные

изменения могут идти как по пути усложнения, так и упрощения;

– особенности реализации генетических операторов не должны

ограничивать пространство поиска. В связи с чем операторы должны

реализовывать добавление и удаление нейронов и связей, корректировку

параметров ИНС при необходимом условии формирования жизнеспособных

особей.

В соответствии с данными требованиями в методе реализованы

генетические операторы кроссинговера и мутации. Оператор кроссинговера

необходим для совмещения генетического материала хромосом-предков и

формирования на его основе хромосомы-потомка. Так как хромосомы,

подвергающиеся кроссинговеру, предварительно проходят этап отбора,

целесообразно ожидать, что на каждой итерации ГА приспособленность

хромосом-потомков возрастает. Кроме того, кроссинговер привносит в

популяцию разнообразие, так как генерирует новые, ранее не встречавшиеся

решения.

Метод создания родительских пар оказывает существенное влияние на

процесс генетического поиска. Так, обсуждение вопроса об эффективности

генетического алгоритма невозможно вести в отрыве от реализуемого механизма

отбора при формировании нового поколения. Оператор мутации – это

диссипативный компонент эволюции, играющий важную роль в случае

изменяющейся среды. Однако и в сложной стационарной среде мутация

позволяет избегать проблем преждевременной сходимости к локальным

оптимумам и вырождения популяции за счет привнесения разнообразия и новой

информации в генофонд. Следует учитывать, что оператор мутации для

изменения вида и параметров функции активации оказывает большое влияние на

60

эффективность нейроэволюции. Мутация оперирует отдельными генами особи,

среди которых присутствуют числовые и номинальные признаки. В соответствии

с теоремой схем [65, 74], применение оператора мутации лишь в редких случаях

снижает приспособленность представлений меньшего порядка, а кроссинговер

редко снижает приспособленность представлений с меньшей определяющей

длиной. Эти факторы влияют на вероятность применения мутации и

кроссинговера. Вероятность сохранения наилучших особей в новой популяции,

зависящая от реализации операторов кроссинговера и мутации, обеспечивает

сходимость метода [67].

2.1.3 Определение этапов эволюции топологии и настройки параметров

особей

Принято выделять два подхода к эволюции топологии и параметров ИНС,

определяющие их последовательную и параллельную оптимизацию [112].

Подход последовательной оптимизации предполагает разграничение этапов

формирования топологии и обучения ИНС для настройки весов. На первом этапе

осуществляется только эволюция связей между нейронами. Затем, после

нахождения квазиоптимальной топологии, настраиваются весовые

коэффициенты.

Подход параллельной оптимизации обеспечивает одновременную

модификацию топологии и корректировку весов. Для метода раздельной

оптимизации топологии и изменения весов характерны сложности в точном

определении приспособленности особей и низкая эффективность процесса

эволюции. Как следствие данного недостатка вероятность создания при помощи

кроссинговера особей с высокой приспособленностью заметно снижается.

В связи с этим можно сформулировать следующие требования к этапам

нейроэволюции:

– параллельная модификация топологии и параметров особей;

61

– наличие этапа локальной оптимизации. При условии параллельной

совместной модификации топологии и параметров ИНС должен быть реализован

меметический этап, позволяющий полностью исследовать множество решений.

2.1.4 Определение дополнительных структур данных

Генетические алгоритмы, реализующие направленный перебор комбинаций

параметров ИНС, демонстрируют высокую скорость работы исключительно при

высоком качестве исходных данных. В противном случае число итераций

алгоритма быстро растет, и вычислительная сложность оказывается сопоставимой

с экспоненциальной сложностью полного перебора возможных решений.

ИНС склонна обучаться в первую очередь наиболее простым признакам. В

условиях сильной неопределенности и зашумленности входных данных это,

прежде всего, артефакты и явления «ложной корреляции». Отбор наиболее

информативных и значимых переменных в традиционных регрессионном и

таксономическом подходах [95] осуществляется путем взвешивания признаков с

использованием различных статистических критериев. Тем не менее, найти

решение данной проблемы в условиях неполных данных о решаемой задаче не

всегда возможно.

В связи с этим в данной работе предлагается автоматизированный подход к

проблеме подбора входных параметров нейросети. Он заключается в

использовании структуры данных (пула), содержащей множество всех

допустимых параметров задачи, из которых может быть сформирован входной

вектор ИНС. Таким образом, входной вектор различных особей может содержать

все параметры или определенное подмножество параметров из пула.

Использование пула входных параметров обеспечивает понижение

избыточности ИНС путем сокращения множества входных параметров, которое

является частным случаем контрастирования нейросети. Упрощение ИНС

62

контрастированием обладает следующими преимуществами: снижение

ресурсоемкости ИНС, снижение риска «переобучения» ИНС [107, 121].

2.2 Реализация нейроэволюционного метода поддержки


2.2.1 Описание структур данных нейроэволюционного метода

В соответствии с выдвинутыми в данной главе требованиями к схеме

кодирования хромосом в качестве структуры хранения данных для генетического

кодирования выбран список смежности. Размер занимаемой им памяти линейно

зависит от количества нейронов 𝑁 и количества синаптических связей 𝑆 как

𝑂(𝑁 + 𝑆). Компактность данной структуры открывает возможность оперирования

топологией глубоких ИНС с экстра-большим, порядка десятков тысяч,

количеством нейронов.

Емкость памяти, используемой альтернативными структурами для

генетического кодирования, зависит от параметров 𝑁 и 𝑆 в лучшем случае

полиномиально. Так, емкость памяти, занимаемой матрицей смежности, можно

оценить как 𝑂(𝑁2), а матрицей инцидентности – соответственно как 𝑂(𝑁 ∙ 𝑆).

Список смежности ставит в соответствие каждому 𝑖-ому

проиндексированному нейрону список пар вида {𝑠𝑖0, 𝑤𝑖0}, где 𝑠𝑖𝑗 – индекс

нейрона, связанного синапсом с 𝑖-ым нейроном, а 𝑤𝑖𝑗 – вес этой связи, 𝑖 ∈ [1, 𝑁].

Для входных нейронов этот список пуст. Также для каждого нейрона список

смежности хранит пороговое значение 𝜃, вид 𝑓type, и параметры

{𝑟0, … , 𝑟𝐾}, функции активации 𝑓. Каждый 𝑖-ый элемент списка смежности имеет

вид:

{𝑖, {{𝑠𝑖0, 𝑤𝑖0}, … , {𝑠𝑖𝑀, 𝑤𝑖𝑀}}, 𝜃, 𝑓type, {𝑟0, … , 𝑟𝐾}, 𝐼𝑁𝑖 , 𝑂𝑈𝑇𝑖} , (2.1)

63

где 𝐼𝑁𝑖– минимальное количество узлов ИНС, через которые должен пройти

входной сигнал, чтобы достигнуть 𝑖-го нейрона;

𝑂𝑈𝑇𝑖 – минимальное количество узлов ИНС, через которые должен пройти

сигнал, сгенерированный 𝑖-ым нейроном, чтобы достигнуть выхода.

Важным свойством описываемой структуры является избыточность.

Помимо перечисленных параметров она содержит дополнительные параметры:

минимальное количество узлов 𝐼𝑁𝑖, через которые должен пройти входной

сигнал, чтобы достигнуть 𝑖-го нейрона, и минимальное количество узлов 𝑂𝑈𝑇𝑖,

через которые должен пройти сигнал, сгенерированный 𝑖-ым нейроном, чтобы

достигнуть выхода. Хранение и пересчет этих параметров способствуют решению

проблемы конкуренции представлений, свойственной схеме прямого

кодирования.

При помощи данного универсального представления кодируются нейросети

любой топологии и размерности. Собственно, эволюционные алгоритмы или ГА с

неограниченным пространством поиска представляют на данный момент

наибольший научно-практический интерес.

На рисунке 2.1 приведен пример структуры простой рекуррентной ИНС с

контекстом и единственным скрытым слоем. Структуре такой нейросети может

соответствовать список смежности, представленный в таблице 2.1.

Рисунок 2.1 – Рекуррентная ИНС с единственным скрытым слоем

64

В данном списке смежности нейрону с индексом 𝑖 сопоставлены: вектор пар

{𝑠𝑖𝑗, 𝑤𝑖𝑗} индексов 𝑠𝑖𝑗 и весовых коэффициентов 𝑤𝑖𝑗, пороговое значение

𝜃, вид функции активации 𝑓type, вектор параметров �� , значения

𝐼𝑁𝑖 и 𝑂𝑈𝑇𝑖 соответственно для расчета минимального расстояния до входа и

выхода ИНС.

Таблица 2.1 – Список смежности рекуррентной ИНС

i {𝒔𝒊𝒋, 𝒘𝒊𝒋} 𝜽 𝒇𝐭𝐲𝐩𝐞 �� 𝑰𝑵𝒊 𝑶𝑼𝑻𝒊

1 — 0 mth 1.5, 3, 1.68, 2 0 2

2 — 0 mth 1.7, 2.5, 1.5, 2 0 2

3 {10, 0.45} 0 sigm 1.07 2 2

4 {11, 0.8} 0 sigm 2 2 2

5 {12, 0.91} 0 sigm 0.89 2 2

6 {1, 0.21} 0 g 2.01, 0.5 1 1

7 {1, 0.5}, {2, 0.42},

{3, 0.7}

-0.3 g 1.68, 0.93 1 1

8 {1, 0.1}, {2, 0.3},

{4, 0.8}

0 g 2, 0.93 1 1

9 {5, 1} 0 g 1.08, 1.1, 0.76 1 1

10 {6, 0.98} 0 th 2 2 0

11 {7, 0.54}, {8, 0.5} 0 th 1.3 2 0

12 {9, 0.75} 0 th 1.3 2 0

2.2.2 Реализация этапов нейроэволюционного метода

Исследование пространства поиска осуществляется на этапах локального и

глобального генетического поиска. Данные этапы определяют эффективность

процесса поиска решения и способности ГА избегать локальных экстремумов и

решают проблему преждевременной сходимости. Исследование пространства

поиска заключается в модификации топологии и параметров особей при помощи

генетических операторов. Алгоритм локального поиска, оперирующий особями

популяции и сохраненными «хорошими» решениями, предназначен для

итерационного улучшения имеющихся результатов от поколения к поколению на

основе уже найденных «промежуточных» решений. Отсутствие этапа локального

65

поиска может привести к тому, что эффективность ГА будет сравнима с

эффективностью случайного поиска на пространстве решений. Кроме того, оно

отрицательно сказывается на скорости поиска и качестве генерируемых особей.

Пусть необходимо применить оператор одноточечного кроссинговера [84] к

скрытым слоям двух ИНС, изображенных на рисунке 2.2: нейросети А и

нейросети B, скрытые слои которых соответственно состоят из нейронов с

индексами [4, 5, 6, 7] и [7, 4, 5, 6].

[4, 5, 6, 7][7, 4, 5, 6] = [4, 5, 5, 6] (2.2)

Одним из возможных результатов является комбинация [4, 5, 5, 6], в

которой недостает нейрона 7 и продублирован нейрон 5, то есть отсутствует один

из функциональных компонентов ИНС.

Рисунок 2.2 – Иллюстрация проблемы конкурирующих представлений

Данный пример иллюстрирует проблему конкурирующих представлений,

приводящую к появлению в популяции нежизнеспособных особей и

значительному снижению результативности работы нейроэволюционного

алгоритма. Индексация узлов ИНС и добавление в представление параметров

𝐼𝑁𝑖 и 𝑂𝑈𝑇𝑖 позволяют успешно решить проблему конкурирующих представлений.

Во-первых, новые узлы, добавляемые в ИНС операторами мутации и

кроссинговера, обладают большими индексами, чем узлы, присутствовавшие в

ИНС в предыдущее эпохи нейроэволюции. Во-вторых, наличие сведений о

66

кратчайшем пути к входным и выходным узлам препятствует скрещиванию

участков нейросети, несущих разную функциональную нагрузку. Например,

становится принципиально невозможным кроссинговер между C-плоскостями и

S-плоскостями неокогнитрона [85]; между слоями свертки и подвыборки в

сверточной ИНС [104] или слоями параллельных подсетей Сиамской ИНС [109].

Мутация в измененных за предыдущие эпохи участках ИНС менее вероятна, чем

в не эволюционировавших участках. Индексирование узлов снижает риск

удаления из популяции новых элементов, что решает проблему незащищенных

инноваций.

2.3 Реализация алгоритмов глобального и локального

генетического поиска

2.3.1 Генетический алгоритм глобального поиска

В реализованном методе нейроэволюции используются два пула:

1. Пул входных параметров, составляющих множество потенциальных

входов ИНС. В процессе эволюции на основе данного пула формируются входные

векторы особей. Пул входных параметров предназначен для оптимизации

производительности ИНС при сохранении качества вывода.

2. Пул доступных в процессе нейроэволюции функций активации, который

хранится в отдельном списке и содержит такие функции как сигмоида

𝑠𝑖𝑔𝑚(𝑆) =1

1+𝑒−𝛼𝑆, функция Гаусса 𝑔(𝑥) =

1

𝛿√2𝜋𝑒

−1

2(

𝑥−𝑐

𝛿)

2

, модифицированный

гипертангенс 𝑚𝑡ℎ(𝑆) =𝑒𝑠/𝑎− 𝑒−𝑠/𝑏

𝑒𝑠/𝑐+ 𝑒−𝑠/𝑑 и другие. Пул необходим для тонкой настройки

параметров каждого нейрона и, соответственно, повышения точности

нейросетевого вывода. На эффективность нейроэволюции непосредственно

влияют подбор генетических операторов и вид функции приспособленности,

67

описанные в рамках соответствующих этапов эволюционного алгоритма

(рисунок 2.3).

Рисунок 2.3 – Блок-схема организации процесса нейроэволюции

Рассмотрим эти этапы более подробно.

1. Инициализация. Формирование начальной популяции P0 с достаточным

разнообразием особей. Проблемы начального размера и топологических

Начало

Конец

Инициализация

Декодирование

Оценка приспособленности

Условие завершения

выполнено?

Селекция

Рекомбинирование

Локальная оптимизация

Формирование новой

популяции

Да

Нет

68

инноваций решаются ограничением на количество нейронов нейросетей нулевой

эпохи. Для списка смежности реализована операция удаления нейронов, а

функция приспособленности, накладывающая штраф на размер ИНС,

гарантирует, что в ходе эволюции количество узлов нейросети не будет строго

возрастающим.

2. Преобразование генотипа в фенотип: декодирование хромосом особей во

множество ИНС.

3. Оценка приспособленности. Для функции приспособленности 𝐹(𝑥) в

пространстве поиска 𝑋 требуется найти такое значение аргумента 𝑥∗, при

котором 𝐹(𝑥) достигнет своего наибольшего значения:

𝑥∗ = argmax𝑥∈𝑋

𝐹(𝑥). (2.3)

Приспособленность 𝐹𝑖𝑡 особи i в эпоху 𝑡, 𝑡 ∈ [0, +∞], рассчитывается

исходя из оценки работы ИНС, штрафа на размер ИНС, штрафа для схожих

генотипов и продолжительности существования особи в популяции.

Если в рамках решаемой задачи присутствует возможность составления

выборок данных, подающихся на вход ИНС, для которых известны требуемые

выходы, функция оценки рассчитывается на основании среднеквадратических

ошибок на обучающем и валидационном множествах прецедентов.

Среднеквадратическая ошибка на обучающем множестве 𝐸𝑖𝑡, необходимая для

расчета точности вывода ИНС, вычисляется следующим образом:

𝐸𝑖𝑡 = √∑ (𝑦𝑞

𝑖 − 𝑑𝑞)2𝑄

𝑞=1 , (2.4)

где 𝑦𝑞𝑖 – выход нейросети i при подаче на вход q-го образа обучающего

множества; 𝑑𝑞 – требуемое значение выходного сигнала; 𝑞 ∈ 1, 𝑄 .

Аналогичным образом определяется 𝑉𝑖𝑡 – среднеквадратическая ошибка на

валидационном множестве, характеризующая способность ИНС к обобщению:

𝑉𝑖𝑡 = √∑ (𝑧𝑞

𝑖 − 𝑔𝑞)2𝑄

𝑞=1 , (2.5)

69

где 𝑧 – выход нейросети i при подаче на вход q-го образа обучающего множества;

𝑔𝑞 – требуемое значение выходного сигнала; 𝑞 ∈ 1, 𝑄 .

Штраф на размер нейросети Φ𝑖𝑡 вычисляется исходя из количества ее

нейронов и связей:

Φ𝑖𝑡 =

𝑁𝑖𝑡

𝑁max𝑡 +

𝑀𝑖𝑡

𝑀max𝑡 , (2.6)

где 𝑁𝑖𝑡 – количество нейронов данной особи;

𝑁max𝑡 – максимальное количество нейронов особей эпохи t;

𝑀𝑖𝑡 – количество связей между нейронами данной особи;

𝑀max𝑡 – максимальное количество связей между нейронами.

Штраф для схожих генотипов 𝜌𝑖 рассчитывается на основании 𝜌min(𝑖, 𝑗) –

минимального расстояния между i-ой хромосомой и другими хромосомами

популяции:

𝜌𝑖 = 𝜌min(𝑖,𝑗)

1+ 𝜌min(𝑖,𝑗) (2.7)

Учет 𝜌𝑖 необходим для поддержания разнообразия популяции и

предотвращении преждевременной сходимости. На значение приспособленности

также влияет величина 𝜅𝑖, обратная продолжительности периода существования

особи в популяции:

𝜅𝑖 =1

1+𝑇𝑖 , (2.8)

где Ti – количество эпох эволюции данной особи.

Суммирование 𝜅𝑖 со значением приспособленности способствует решению

проблемы незащищенности инноваций за счет существенного снижения риска

удаления особи на начальных эпохах существования. При этом на последующих

эпохах 𝜅𝑖 не оказывает существенного влияния на приспособленность.

С учетом вычисленных данным способом среднеквадратических ошибок,

значений штрафов и продолжительности существования особи функция

приспособленности 𝐹𝑖𝑡 вычисляется по формуле

70

��𝑖𝑡 =

𝜛𝐸(1−𝐸𝑖𝑡)+ 𝜛𝑉(1−𝑉𝑖

𝑡)

Φ𝑖𝑡+𝜌𝑖

+ 𝜅𝑖 , (2.9)

где 𝜛𝐸 , 𝜛𝑉 – весовые коэффициенты, отражающие относительную значимость

среднеквадратических ошибок вывода на обучающем и валидационном

множествах и необходимые для контролирования способности ИНС к

запоминанию и обобщению:

𝜛𝐸 = 1−𝑉𝑖

𝑡

2− 𝑉𝑖𝑡−𝐸𝑖

𝑡 , 𝜛𝑉 = 1 − 𝜛𝐸 (2.10)

Таким образом, формулу (2.9) для расчета приспособленности можно

представить в развернутом виде:

��𝑖𝑡 =

1−𝑉𝑖𝑡

2− 𝑉𝑖𝑡−𝐸𝑖

𝑡 (1−√∑ (𝑦𝑞

𝑖 −𝑑𝑞)2𝑄

𝑞=1 )+ (1− 𝜛𝐸 )(1−√∑ (𝑧𝑞𝑖 −𝑔𝑞)

2𝑄𝑞=1 )

𝑁𝑖𝑡

𝑁max𝑡 +

𝑀𝑖𝑡

𝑀max𝑡 +

𝜌min(𝑖,𝑗)

1+ 𝜌min(𝑖,𝑗)

+ 1

1+𝑇𝑖 (2.11)

При решении задач, для которых невозможно сформировать множество

желаемых откликов нейросети на эталонные сигналы, вместо параметров 𝐸𝑖𝑡 и 𝑉𝑖

𝑡

строится функция оценки работы ИНС 𝑓c, отражающая качество полученного

решения в целом. Косвенная оценка 𝑓c необходима для решения

трудноформализуемых задач, где присутствуют неопределенность и сложность

формирования обучающего множества. Как правило, 𝑓c явно или неявно зависит

от выходного вектора ИНС. При использовании функции оценки функция

приспособленности имеет вид:

��𝑖𝑡 =

𝑓c

𝛷𝑖𝑡+𝜌𝑖

+ 𝜅𝑖 , (2.12)

где 𝑓c – функция оценки работы ИНС.

Для предотвращения преждевременной сходимости и ситуации, в которой

средние и наилучшие особи формируют примерно одинаковое количество

потомков, значение �� масштабируется [86] по формуле

𝐹 = (�� + ��avg − 𝑐𝜎)𝜗, (2.13)

где ��avg – средняя приспособленность популяции;

𝑐 = 𝑐𝑜𝑛𝑠𝑡 ∈ [1, 5];

71

𝜎 – среднеквадратичное отклонение приспособленностей по популяции;

𝜗 ∈ [1, 1.5] – коэффициент, подбираемый с учетом специфики задачи.

Отсутствие изменений приспособленности лучшей особи популяции

свидетельствует о стагнации поиска.

4. Проверка условия завершения эволюции. Независимыми друг от друга

условиями завершения могут быть следующие: по количеству эпох; по

исчерпанию времени эволюции (или количества обращений к функции

оптимизации); по достижению наилучшей комбинации генов; по выходу функции

приспособленности на «плато» - то есть по отсутствию ее изменения в течение

заданного количества эпох [70]. Если выполнено любое из условий, то алгоритм

завершает работу. Иначе выполняется следующий шаг.

5. Селекция. Стратегию поиска составляют механизмы селекции и

рекомбинирования. Это вероятностные процессы, лежащие в основе процесса

нейроэволюции [71].

Оператор отбора хромосом SL (selection) для новой популяции реализован

вероятностным методом [66] в сочетании с методом «элит» [68]: наиболее

удачные особи заносятся в пул «хороших» решений; остальные особи отбираются

для рекомбинирования с вероятностью 𝑃𝑆𝐿.

𝑃𝑆𝐿(𝑖) = 𝐹𝑖

∑ 𝐹𝑗𝑁𝑗=1

, (2.14)

где i, j – индексы особей.

Пул «хороших» решений необходим для поддержания разнообразия

популяции и предотвращения быстрой сходимости алгоритма к неоптимальному

решению (локальному оптимуму). Хромосома для фенотипа 𝑝∗ сохраняется в

пуле при выполнении условия

(∀𝑝 ∈ 𝑃)((𝜌(𝑝, 𝑝∗) = 𝜌max) ∩ (𝐹(𝑝∗) = 𝐹max)), (2.15)

где 𝜌max – максимальное в данную эпоху расстояние между особями;

𝐹max – максимальная приспособленность в данную эпоху.

72

6. Рекомбинирование – применение генетических операторов кроссинговера

и мутации к отобранным на предыдущем шаге особям [72].

Кроссинговер – генетический оператор, влияющий на размер популяции. В

данной реализации нейроэволюции предложен двухэтапный многоточечный

кроссинговер CR (crossingover) [4].

Первый этап кроссинговера заключается в определении количества 𝐷 и

координат 𝑑𝑘, 𝑘 ∈ [1, 𝐷] точек пересечения c последующим скрещиванием

исходных генотипов по заданным точкам. В общем случае для D точек

результатом скрещивания особей 𝑝𝑖𝑡 = {𝑎1, 𝑎2, … , 𝑎𝑛}, 𝑝𝑗

𝑡 = {𝑏1, 𝑏2, … , 𝑏𝑛} ∈ 𝑃𝑡

эпохи t являются два генотипа эпохи t+1:

𝑝𝑖𝑡+1 = {𝑎1, … , 𝑎𝑑1

, 𝑏𝑑1+1 , … , 𝑏𝑑2, 𝑎𝑑2+1, … , 𝑎𝑑𝐷

, … },

𝑝𝑗𝑡+1 = {𝑏1, … , 𝑏𝑑1

, 𝑎𝑑1+1 , … , 𝑎𝑑2, 𝑏𝑑2+1, … , 𝑏𝑑𝐷

, … } ∈ 𝑃𝑡+1 , (2.16)

где 𝑑𝑘, 𝑘 ∈ [1, 𝐷] – точки пересечения генотипов;

𝐷 – количество точек пересечения.

Количество точек пересечения определяется как случайное число на отрезке

[1, min {𝑁1, 𝑁2}], где 𝑁1 и 𝑁2 – соответственно количество нейронов в первом и

втором генотипе, отобранных для кроссинговера. Точки 𝑑𝑘 выбираются в

соответствии с условием:

𝑑𝑘 = 𝑗: (𝐼𝑁1(𝑗) = 𝐼𝑁2(𝑗)) ∪ (𝑂𝑈𝑇1(𝑗) = 𝑂𝑈𝑇2(𝑗)) , (2.17)

где 𝑗 – индекс, позиционирующий нейрон в первом и втором генотипах;

𝐼𝑁1(𝑗), 𝐼𝑁2(𝑗) и 𝑂𝑈𝑇1(𝑗), 𝑂𝑈𝑇2(𝑗) – соответственно значения параметров 𝐼𝑁 и

𝑂𝑈𝑇 для 𝑗-го нейрона в данных генотипах.

В случае, если индексов c равными значениями параметров несколько,

выбираются индексы с наиболее близкими значениями. Таким образом

индексация нейронов в генотипе в совокупности с использованием параметров 𝐼𝑁

и 𝑂𝑈𝑇 снижает риск конкуренции представлений и предотвращает скрещивание

участков генотипов, несущих различную функциональную нагрузку.

Второй этап кроссинговера состоит в корректировке синаптических связей

сформированных в результате применения оператора генотипов, а именно в

73

удалении и перераспределении связей, соотнесенных с отсутствующими в новой

конфигурации ИНС нейронами. Этап необходим для гарантии жизнеспособности

новых особей.

Мутация 𝑀𝑇 (mutation) – генетический оператор, в данном методе

реализованный в восьми модификациях. Вероятность применения мутации для

отдельного гена 𝑃𝑀𝑇(𝑔𝑖) в эпоху t рассчитывается по формуле

𝑃𝑀𝑇(𝑔𝑖) = √𝛼

𝐿

𝑒−

𝛽𝑡2

𝑁 , (2.18)

где 𝛼, 𝛽 = 𝑐𝑜𝑛𝑠𝑡; L – длина хромосомы; N – размер популяции.

Выбор формулы данного вида обусловлен тем, что для эффективной

эволюции вероятность мутации должна быть обратно зависима от размера

популяции. При этом вероятность мутации с течением времени понижается.

Одной из основных целей применения оператора мутации является поддержание

разнообразия особей, но в маленьких популяциях частые мутации негативно

сказываются на схождении к оптимуму. Хромосомы большой длины

обеспечивают вариативность популяции, поэтому значение 𝑃𝑀𝑇 тем выше, чем

меньше параметров содержит хромосома. Параметры 𝛼, 𝛽 формулы выбираются

до начала эволюции и необходимы для тонкой настройки процесса мутации.

Особенности модификаций оператора и вероятности применения каждой из

модификаций представлены в таблице 2.2. Индексирование узлов в генотипе

предотвращает риск удаления из популяции новых элементов: при выполнении

условия 𝑖 = 𝑖max, где 𝑖 – индекс данного узла, 𝑖max – индекс последнего

добавленного в генотип узла, вероятность использования операторов удаления

равна нулю. Введение данного условия позволяет решить проблему

незащищенности инноваций. Вероятностные коэффициенты, на которые

умножается вероятность для каждой модификации оператора, являются

фиксированными и выбраны исходя из требования более частого изменения

существующих параметров, чем добавления новых или удаления ранее

настроенных элементов.

74

Таблица 2.2 – Описание операторов мутации

Обозначение Описание Вероятность применения

𝑀𝑇𝑠_𝐴𝐷𝐷 Последовательное добавление

нейрона (serial addition) 𝑃𝑆_𝐴𝐷𝐷 = 0.1 𝑃𝑀𝑇(𝑔𝑖)

𝑀𝑇𝑃_𝐴𝐷𝐷 Параллельное добавление

нейрона (parallel addition) 𝑃𝑃_𝐴𝐷𝐷 = 0.1 𝑃𝑀𝑇(𝑔𝑖)

𝑀𝑇𝐷𝐸𝐿 Удаление нейрона (deletion) 𝑃𝐷𝐸𝐿 = {0, 𝑖 = 𝑖max

0.1𝑃𝑀𝑇(𝑔𝑖), 𝑖 ≠ 𝑖max

𝑀𝑇𝐿_𝐴𝐷𝐷 Добавление связи между

нейронами (link addition) 𝑃𝐿_𝐴𝐷𝐷 = 0.1 𝑃𝑀𝑇(𝑔𝑖)

𝑀𝑇𝐿_𝐷𝐸𝐿 Удаление связи между

нейронами (link deletion) 𝑃𝐿_𝐷𝐸𝐿 = {

0, 𝑖 = 𝑖max


𝑀𝑇𝐼_𝐴𝐷𝐷 Добавление входа,

соотнесенного параметру из

пула (input addition)

𝑃𝐼_𝐴𝐷𝐷 = 0.05 𝑃𝑀𝑇(𝑔𝑖)

𝑀𝑇𝐼_𝐷𝐸𝐿 Удаление входа, соотнесенного

параметру из пула

(input deletion)

𝑃𝐼_𝐷𝐸𝐿 = {0, 𝑖 = 𝑖max


𝑀𝑇𝐴𝐿𝑇

Изменение параметров

нейрона(alter): значения порога

𝜃, вида функции активации

𝑓(𝑆) и ее параметров

𝑃𝐴𝐿𝑇 = 0.2 𝑃𝑀𝑇(𝑔𝑖)

Описанные операторы селекции и рекомбинирования в совокупности с

функцией приспособленности и пулом «хороших» особей предназначены для

самоадаптации алгоритма к уровню сложности задачи.

7. Локальный поиск. Данный этап оптимизации особей популяции, наделяет

алгоритм свойствами меметичности [44] и обосновывает использование прямого

метода кодирования хромосом. Этап реализован при помощи алгоритма

локального поиска.

8. Генерирование популяции 𝑃𝑡+1 и переход на новую эпоху эволюции

𝑡 + 1:

𝑃𝑡+1 = 𝑀𝑇 (𝐶𝑅 (𝑆𝐿(𝑃𝑡 , 𝐹𝑡))) (2.19)

Далее описан локальный поиск, осуществляемый на этапе 7.

75

2.3.2 Генетический алгоритм локального поиска

Этап локального поиска состоит из следующих шагов: эволюционная

донастройка весов и параметров функций активации нейронов особей популяции,

на предыдущем шаге преобразованных в фенотипы; пересчет функций

приспособленности; возвращение к предыдущим значениям параметров в случае

снижения приспособленности. Данные шаги проиллюстрированы блок-схемой на

рисунке 2.4.

Рисунок 2.4 – Блок-схема этапа локальной оптимизации

Преимуществами эволюционной донастройки параметров ИНС являются

следующие:

– независимость от топологии сети и характеристик функций активации;

Начало

Конец

Сохранение значений функций

приспособленности и

параметров особей популяции

Изменение параметров ИНС

Пересчет для ИНС функций

приспособленности

Приспособленность

повысилась?

Возвращение к предыдущим

параметрам ИНС

Да

Нет

76

– возможность определения, показывает ли данная особь низкую

приспособленность из-за неудачно сформированной топологии или неправильно

подобранных весов;

– выборочная оптимизация параметров недавно измененных или

добавленных нейронов без затрагивания уже модифицированной на предыдущих

итерациях работы алгоритма структуры.

Таким образом, исследование пространства поиска осуществляется на

этапах 1-6, 8. На этапе 7 реализован алгоритм локального поиска, использующий

найденные «хорошие» решения.

Предложенный метод может использоваться для создания нейросетей

произвольной топологии, которые имеют различное назначение.

2.4 Оценка сходимости алгоритма

Сходимость любого метода оптимизации базируется на теореме

Вейерштрасса. Сходимость канонического ГА доказана в теореме схем (теореме

Холланда) [78], которая тем не менее не применима для его модификаций. В

связи с этим далее приведено исследование сходимости предложенной

реализации ГА, которая отличается от каноничного алгоритма.

Для получения оценки сходимости алгоритма в зависимости от размерности

и вида оптимизируемой функции предположим, что оптимизируемая функция

𝑓(𝑥) задана на множестве оптимизации 𝑋 размерности 𝑛: 𝑋 ≠ ∅, то есть

множество решений 𝑋 удовлетворяет условию ненулевой меры. При этом

структура 𝑋 настолько простая, насколько это необходимо для построения ГА.

Достаточно, чтобы 𝑋 было односвязным и являлось замыканием своей

внутренности. Второе условие гарантирует, что мера Лебега 𝑋 положительна [12].

Так как предложенный генетический алгоритм не накладывает ограничений

на количество особей в популяции и длину хромосомы, можно предположить, что

ГА оперирует популяцией с бесконечным количеством особей 𝑀 → +∞,

77

хромосомы которых состоят из бесконечного числа генов 𝑁 → +∞. Исходя из

этого, целесообразно утверждать, что любой вектор 𝑥 ∈ 𝑋 может быть

закодирован в хромосомах, состоящих из действительных чисел, со сколь угодной

точностью. Пусть оптимизируемая функция 𝑓(𝑥) имеет экстремум в точке 𝑥∗:

𝑥∗ = arg max𝑥∈𝑋

𝑓(𝑥) и задано некоторое значение ε > 0. Тогда множество всех

квазиоптимальных решений, полученных c заданной точностью решения задачи,

определяется как ε –окрестность 𝑥∗:

𝑈 (𝑥∗) = {𝑥 ∈ 𝑋 | ||𝑥 − 𝑥∗|| ≤ 휀} , (2.20)

где ||𝑥 − 𝑥∗|| – Евклидова метрика в пространстве ℝ𝑛.

Таким образом, для приближенного отыскания 𝑥∗ достаточно, чтобы

полученное решение 𝑥 принадлежало множеству 𝑈 (𝑥∗), для которого

справедливо неравенство [23]:

𝜆{𝑈 (𝑥∗)} ≤ 𝜆{𝑥 ∈ ℝ𝑛 | ||𝑥 − 𝑥∗|| ≤ 휀}, (2.21)

где 𝜆 – мера Лебега множества.

Неравенство (2.21) выполняется тогда и только тогда, когда шар {𝑥 ∈

ℝ𝑛 | ||𝑥 − 𝑥∗|| ≤ 휀} целиком лежит в 𝑋, то есть расстояние от 𝑥∗ до границы

множества 𝑋 меньше, чем 휀. Тогда для 𝜆{𝑈 (𝑥∗)} справедлива формула

𝜆{𝑈 (𝑥∗)} = 𝜋

𝑛2 𝑛

Γ(𝑛

2+1)

, (2.22)

где Γ(α) = ∫ 𝑡𝛼−1𝑒−𝑡 𝑑𝑡∞

0 – гамма-функция.

Пусть в начальную эпоху эволюции особи популяции распределены

равномерно, следовательно, плотность распределения вычисляется как

𝑝0(𝑥) = 1

𝜆{𝑋} , (2.23)

где 𝑝0(𝑥) – плотность распределения особей в нулевую эпоху эволюции.

Пусть сформировано квазиоптимальное решение задачи 𝑥𝑜𝑝𝑡,

закодированное в наиболее приспособленной хромосоме, сформировавшейся по

итогам работы ГА. Тогда вероятность того, что расстояние между 𝑥𝑜𝑝𝑡 и 𝑥∗

меньше или равно заданной точности 휀, вычисляется следующим образом:

78

𝑃0 {||𝑥𝑜𝑝𝑡 − 𝑥∗|| ≤ 휀} = 𝑃{𝑥𝑜𝑝𝑡 ∈ 𝑈 (𝑥∗)} = 𝜆{𝑈 (𝑥∗)}

𝜆{𝑋} ≤

𝜋𝑛2 𝑛

Γ(𝑛

2+1)𝜆{𝑋}

, (2.24)

где 𝑃0 – вероятность выполнения данного условия в 0-ую эпоху.

Очевидно, что в последующие эпохи эволюции процесс распределения

вероятностей изменяется и перестает быть равномерным. Он определяется

реализуемыми в методе генетическими операторами селекции и рекомбинации.

Тем не менее, для пропорционального отбора без учета воздействия со стороны

других генетических операторов известна зависимость

𝑝𝑖 = 𝑝𝑖−1(𝑥)𝑓(𝑥)

∫ 𝑝𝑖−1(𝑥)𝑓(𝑥)𝑑𝑥𝑋

, (2.25)

где 𝑖 – эпоха эволюции.

Вероятность 𝑃𝑖 того, расстояние между 𝑥𝑜𝑝𝑡 и 𝑥∗ меньше или равно

заданной точности 휀 в -ую эпоху эволюции, определяется формулой

𝑃𝑖 {||𝑥𝑜𝑝𝑡 − 𝑥∗|| ≤ 휀} = 𝑃{𝑥𝑜𝑝𝑡 ∈ 𝑈 (𝑥∗)} = ∫ 𝑝𝑖(𝑥)𝑑𝑥𝑈 (𝑥∗)

(2.26)

В случае малых 휀 в пределах множества 𝑈 (𝑥∗) плотность вероятности

можно считать постоянной, а интегрирование заменить умножением на меру

Лебега 𝑈 (𝑥∗):

𝑃𝑖 {||𝑥𝑜𝑝𝑡 − 𝑥∗|| ≤ 휀} ≈ 𝑝𝑖(𝑥𝑜𝑝𝑡) 𝜆{𝑈 (𝑥∗)} ≤ 𝜋

𝑛2 𝑛

Γ(𝑛

2+1)

𝑝𝑖(𝑥∗) (2.27)

С учетом вероятностей, определенных для нулевой и i-ой эпох эволюции,

можно рассчитать вероятность того, что минимальное расстояние между 𝑥𝑜𝑝𝑡 и

𝑥∗ не превышает 휀, для всего эволюционного процесса в целом:

𝑃{ min0≤𝑗≤𝑖

||𝑥𝑜𝑝𝑡𝑗

− 𝑥∗||≤ 휀} = 1 − ∏ (1 − ∫ 𝑝𝑖(𝑥)𝑑𝑥𝑈 (𝑥∗)

)𝑖𝑗=0 (2.28)

Для малых значений 휀 формула (2.28) может быть приведена к виду:



− 𝑥∗||≤ 휀} = 1 − ∏ (1 − 𝜋

𝑛2 𝑛

Γ(𝑛

2+1)

𝑝𝑖(𝑥∗) )𝑖𝑗=0 (2.29)

С помощью данных выражений решается обратная задача: по заданному

значению вероятности 𝑃{ min0≤𝑗≤𝑖


− 𝑥∗||≤ 휀} определить количество эпох

79

эволюции i, при котором минимальное расстояние между квазиоптимальным

решением 𝑥𝑜𝑝𝑡 и глобальным оптимумом 𝑥∗ не будет превышать заданной

точности 휀. Также при количестве эпох эволюции, стремящемся к бесконечности,

следует сделать два заключения о плотности и значении вероятности.

Во-первых, при 𝑖 → ∞ справедливо следующее: 𝑝𝑖(𝑥) → 𝛿(𝑥 − 𝑥∗), где

𝛿(𝑥) – это функция Дирака, по определению удовлетворяющая двум условиям:

𝛿(𝑥) = {+∞, 𝑥 = 0

0, 𝑥 ≠ 0 , (2.30)

∫ 𝛿(𝑥)𝑑𝑥 = 1+∞

−∞ (2.31)

Иными словами, последовательность плотностей вероятности сходится к

функции Дирака.

Во-вторых, при 𝑖 → ∞ справедлива формула



− 𝑥∗||≤ 휀} → 1. (2.32)

Исходя из полученной оценки сходимости ГА следует, что количество эпох

эволюции, необходимых для генерации решения задачи, находится в зависимости

от размерности и вида 𝑓(𝑥), а степень сложности задачи и сходимость процесса

поиска решения определяются свойствами оптимизируемой функции. Можно

сделать вывод, что алгоритм сходится при сильной зависимости скорости

сходимости от размерности n множества X.

2.5 Выводы по второй главе

1. Разработан новый нейроэволюционный метод, обладающий следующими

преимуществами:

1.1. Метод оперирует нейросетями произвольной топологии и не ставит

ограничений на количество слоев и нейронов в каждом слое, вид

синапитческих связей, вид функций активации нейронов. Это отличает его

от многих методов, оптимизирующих только ИНС заданной топологии

80

(например, полносвязные или нейросети прямого распространения). С

приемлемой скоростью метод оперирует сверхбольшими нейросетями и

нейросетями со сложной топологией: сверточными, полносвязными,

Сиамскими ИНС и т.д.

1.2. В отличие от большинства известных реализаций нейроэволюции,

оптимизирующих только топологию ИНС или весовые коэффициенты,

метод модифицирует все параметры ИНС: топологию, веса, пороговые

значения, вид функций активации и ее параметры для каждого нейрона.

1.3. В отличие от всех известных методов, данный метод автоматизирует

трудоемкий процесс подбора входных параметров ИНС при помощи

введения дополнительного пула характеристик.

1.4. Метод способен направлять нейроэволюцию как по пути структурного

упрощения ИНС, так и по пути структурного усложнения. Таким образом

соблюдается баланс между сложностью ИНС, скоростью эволюции и

оптимальностью нейросетевого вывода.

2. Предложены новые алгоритмы генетического поиска, обладающие

следующими преимуществами:

2.1. Разбиение процесса оптимизации на этапы локального и глобального

генетического поиска для последовательной модификации топологии и

параметров. Данный меметичный подход позволяет определить,

показывает ли данная особь низкую приспособленность из-за неудачно

сформированной топологии или неправильно подобранных весов, а также

выборочно оптимизировать параметры недавно измененных или

добавленных нейронов, не затрагивая при этом уже модифицированную на

предыдущих итерациях работы алгоритма структуру.

2.2. Реализованные генетические операторы и структура хромосомы в

совокупности позволяют комбинировать нескольких нейросетей в одну с

сохранением их «жизнеспособности». Благодаря этому становится

81

возможной генерация «нестандартных», нерегулярных топологий и

гибридных ИНС.

3. Проведены расчеты для: оценки сходимости алгоритмов, оценки удаленности

приближенного решения от оптимального и скорости сходимости процесса

поиска. На основании приведенных расчетов сделан вывод об эффективности

алгоритмов.

82

ГЛАВА 3. РАЗРАБОТКА МЕТОДИКИ ПОДБОРА КРИТЕРИЕВ

ОЦЕНКИ НЕЙРОЭВОЛЮЦИОННОГО МЕТОДА И

ЭМПИРИЧЕСКОЕ ИССЛЕДОВАНИЕ ЕГО ЭФФЕКТИВНОСТИ

3.1 Разработка методики расчета основных критериев оценки

параметров нейроэволюционного метода

Для корректной оценки эффективности нейроэволюционного метода

необходимо учитывать как отдельные, так и совокупные характеристики

конкретной реализации нейроэволюции. Рассмотрим совокупные свойства

процесса эволюции, генетических представлений и свойства особей популяции.

1. Свойства процесса эволюции, являющиеся косвенным критерием

определения скорости сходимости ГА и эффективности применяемых

генетических операторов:

– вычислительная сложность ГА. Временная и пространственная сложность

ГА определяют оперативность и ресурсоемкость процесса эволюции. Однако

оценка вычислительной сложности возможна только в случае упрощенной

постановки задачи. В качестве альтернативы было проведено исследование

стабильности работы и эффективности предложенного ГА на серии эталонных

задач (п. 3.2 диссертационной работы);

– сходимость процесса нейроэволюции – одна из ключевых характеристик

качества ГА, показывающая способность алгоритма приводить к результату за

конечное число эпох (п. 2.4 диссертационной работы);

– качество формируемого решения – свойство, определяющее близость

решения к глобальному экстремуму (п. 2.4 диссертационной работы);

– динамика средней приспособленности. Средняя приспособленность

популяции может определяться как среднее арифметическое или медиана

ранжированного ряда приспособленностей особей. Средняя приспособленность

83

популяции 𝐹avg в предложенном методе была вычислена эмпирически на

множестве эталонных задач (п. 3.2 диссертационной работы).

Экспериментальные данные показали, что она варьируется в пределах 𝐹avg ∈

[0.2, 0.9] в зависимости от решаемой задачи. Это свидетельствует об

эффективности эволюционного процесса.

2. Общие свойства генетических представлений, по которым следует

оценивать различные методы, выделялись многими авторами. Наиболее полный

набор свойств предлагают использовать К. Балакришнан и Б. Хонаван [60]. Далее

дано определение данных свойств.

Полнота. Представление R является полным, если каждой нейросетевой

топологии из множества решений может быть сопоставлен генотип:

(∀𝑝∗ ∈ 𝑃∗)(∃𝑔 ∈ 𝐺)((𝑝𝑖 = 𝐷(𝑔, 𝐸𝐷) ∩ (𝑝 = 𝐿(𝑝𝑖 , 𝐸𝐿))) , (3.1)

где P – пространство всех возможных в данном представлении фенотипов;

𝑔 ∈ 𝐺 – генотип, принадлежащий множеству генотипов 𝐺;

𝑃∗ ⊆ 𝑃 – множество решений: в нейроэволюционной системе с представлением R

существует решение в случае если 𝑃∗ ⊆ 𝑃 или хотя бы 𝑃∗ ∩ 𝑃 ≠ ∅;

𝐷(𝑔, 𝐸𝐷) – функция декодирования D генотипа 𝑔, соответствующего фенотипу 𝑝 в

среде 𝐸𝐷;

𝐿(𝑝𝑖 , 𝐸𝐿) – функция обучения, преобразующая под влиянием среды фенотип 𝑝𝑖 в

фенотип 𝑝.

Замкнутость. Представление полностью замкнуто, если каждому генотипу

соответствует фенотип:

(∀𝑔 ∈ 𝐺)((𝑝𝑖 = 𝐷(𝑔, 𝐸𝐷) ∩ 𝐿(𝑝𝑖 , 𝐸𝐿) ∈ 𝐴) , 𝑃 ⊆ 𝐴 (3.2)

где A – множество локально-оптимальных решений. В общем случае возможны

ситуации, когда 𝐴 ∩ 𝑃 = ∅, но для практического использования

нейроэволюционная система должна отвечать критерию: 𝐴 ∩ 𝑃∗ ≠ ∅.

Компактность. Если генотипы 𝑔𝑖 и 𝑔𝑗 (𝑖 ≠ 𝑗) декодируются в фенотип p, то

𝑔𝑖 более компактный по отношению к 𝑔𝑗, если:

84

(𝑝𝑖 = 𝐷(𝑔𝑖 , 𝐸𝐷)) ∩ (𝐿(𝑝𝑖 , 𝐸𝐿) = 𝑝) ∩ (𝑝𝑗 = 𝐷(𝑔𝑗 , 𝐸𝐷))

∩ 𝐿(𝑝𝑗 , 𝐸𝐿) = 𝑝) ∩ | 𝑔𝑖| < |𝑔𝑗| , (3.3)

где | 𝑔| - объем ресурса, отводимого для хранения генотипа 𝑔;

𝑝𝑗 = 𝐿(𝑝𝑖 , 𝐸𝐿) – функция обучения, преобразующая под влиянием среды фенотип

𝑝𝑖 в фенотип 𝑝𝑗.

Масштабируемость. Пусть 𝑛𝑁,𝐶 ∈ 𝐴 – фенотип ИНС из N нейронов и C

связей. Тогда представление является масштабируемым относительно узлов как

O(K), если добавление одного нейрона в фенотип влечет увеличение

соответствующего генотипа как O(K), где K = f(N, C).

Множественность. В представлении присутствует генотипическая

множественность, если между множествами генотипов и фенотипов установлено

отношение один-ко-многим. В представлении присутствует множественность

фенотипов, если один и тот же генотип может быть представлен различными

фенотипами.

Онтогенетическая приспосабливаемость. В представлении R присутствует

онтогенетическая приспосабливаемость, если параметры фенотипа зависят не

только от соответствующего генотипа, но и от окружающей среды.

Модульность. Пусть в структуре ИНС 𝑛𝑖 содержится несколько

экземпляров ИНС 𝑛𝑗. Тогда генотип 𝑛𝑖 является модульным, если кодирует 𝑛𝑗

только один раз.

Избыточность – свойство, важное для поддержания надежности системы в

случае сбоя. Генотипическая избыточность возникает при дублировании

отдельных генов в генотипе, фенотипическая избыточность – соответственно при

записи более одного раза генов в фенотипе.

В таблице 3.1 представлена оценка выполнимости данных свойств в

предложенном методе и даны краткие комментарии.

85

Таблица 3.1 – Оценка свойств генетического представления

Свойство Оценка Описание

Полнота Выполнено Между множествами генотипов и

фенотипов установлена биекция:

𝐺 ↔ 𝑃. Замкнутость Выполнено

Компактность Не выполнено В схеме прямого кодирования

функциональная и топологическая

компактность не могут быть

определены.

Временная

масштабируемость 𝑂(𝑊) W – количество элементов обучающей

выборки.

Пространственная

масштабируемость 𝑂(𝑄) Q – количество структурных

элементов фенотипа.

Множественность Не выполнено Каждому фенотипу сопоставлен

уникальный генотип.

Онтогенетическая

приспосабливаемость

Выполнено Среда оказывает влияние на

параметры фенотипа.

Модульность Не выполнено Генотип содержит связи между

нейронами, но не кодирует отдельные

модули.

Генетическая

избыточность

Выполнено Генотип содержит дополнительную

информацию, оптимизирующую

эволюцию и предотвращающую

ошибки декодирования.

Фенотипическая

избыточность

Выполнено Реализована за счет структурной

избыточности.

3. Свойства особей популяции, по которым можно судить о качестве

получаемых в ходе нейроэволюции частных решений. Они носят общий характер

и могут применяться для оценки ИНС любой топологии.

Устойчивость нейросетевого вывода – свойство, определяющее

чувствительность решения задачи при помощи ИНС к малым изменениям

входных данных.

Нейросетевой вывод является вычислительно неустойчивым, если малые

изменения входных данных приводят к сильным изменениям решения.

Вычислительная неустойчивость приводит к невозможности решения ряда задач с

небольшой погрешностью.

Способность к обобщению – свойство, показывающее способность ИНС

распознавать шаблоны, не содержащиеся в обучающей выборке прецедентов.

86

4. Косвенные показатели эффективности поиска решения при помощи

нейроэволюционного метода: количество эпох эволюции, потребовавшихся для

решения поставленной задачи, и количества неудачных запусков нейроэволюции,

по результатам которых не было сформировано ни одного оптимального или

близкого к оптимальному решения.

Количество эпох эволюции и количество неудачных запусков определяются

экспериментально при решении серий эталонных задач (п. 3.2 диссертационной

работы). Успешное прохождение серии эталонных тестов является

свидетельством стабильности работы метода.

Исходя из проанализированных свойств метода, следует отметить, что он

обладает требуемыми для практического применения качествами. Эмпирически

это подтверждается тестированием на разнотипных задачах.

3.2 Экспериментальное исследование сравнительных

характеристик метода на эталонных задачах

Для проверки эффективности предложенного метода был проведен

вычислительный эксперимент, в ходе которого сравнивались известные методы и

данный метод по двум ключевым показателям эффективности поиска решения:

количеству эпох эволюции и количеству неудачных запусков. Алгоритмические

возможности метода продемонстрированы его применением для решения

эталонных нейроэволюционных задач.

Эталонные задачи (benchmark, тестовые задачи) [112] используются в

области нейроэволюции для косвенного анализа производительности, надежности

и других параметров методов. Эталонные задачи являются критерием выбора того

или иного метода для его применения в различных практических областях.

87

3.2.1 Задачи адаптивного управления

В качестве задач адаптивного управления было выбрано три вариации

задачи об «обратном маятнике» теории автоматического управления. Обратный

маятник имеет центр масс выше своей точки опоры и находится на конце

жесткого стержня, точка опоры которого закреплена на тележке. В начальный

момент времени маятник на заданный угол отклоняется от положения равновесия.

Задача заключается в установлении устойчивого состояния маятника путем

перемещения тележки некоторым усилием. При этом концов отрезка следует

избегать. Было рассмотрено три варианта системы стабилизации.

1. Классическая постановка задачи: единственный обратный маятник и

тележка, перемещающаяся в одномерном пространстве [16]. Дан обратный

маятник, тележка с которым перемещается в интервале −4 < 𝑥 < 4 м. Начальная

координата тележки 𝑥0 задается случайным образом на интервале −2 < 𝑥0 <

2 м. Начальная скорость тележки 𝑣0 = 0 м/с. Начальный угол отклонения

маятника 𝜑0 рад задается случайным образом, а его начальная угловая скорость

равна нулю: 𝜔0 = 0 рад/с. Управляющий сигнал представляет собой силу F,

прикладываемую к тележке: -10 < F < 10 Н. Уравнения, описывающие данную

систему без учета силы трения, имеют вид [112]:

�� =𝑔 sin(𝜑)−

cos(𝜑)

𝑀+𝑚(𝐹−𝑚 𝑙𝜔2 sin(𝜑))

𝑙(4

3−

𝑚 𝑐𝑜𝑠2(𝜑)

𝑀+𝑚)

(3.4)

�� = 𝐹+𝑚𝑙(𝜔2 sin(𝜑)−�� 𝑐𝑜𝑠(𝜑)

𝑀+𝑚 , (3.5)

где 𝑔 = 9.81 – ускорение свободного падения, м/c2; 𝑀 = 1.0 – масса тележки, кг;

𝑚 = 0.1 – масса маятника, кг; 𝑙 = 0.5 – половина длины маятника, м; 𝐹 – сила,

прикладываемая к тележке, Н; �� – угловое ускорение; 𝑣 –ускорение тележки.

Начальный пул входных параметров для ИНС включает следующие

характеристики системы: текущую координату тележки 𝑥, угол наклона маятника

𝜑, скорость тележки 𝑣, угловую скорость маятника 𝜔. Каждая из них

88

масштабируется таким образом, что при использовании всех параметров из пула

входной вектор ИНС 𝑖𝑛𝑝𝑢𝑡1 имеет вид:

𝑖𝑛𝑝𝑢𝑡1 = {𝑥

4,

𝜑

𝜋,

𝑣

4,

𝜔

𝜋} (3.6)

Эффективность особей популяции определяется в зависимости от функции

оценки 𝑓𝑐, определяемой по формуле

𝑓𝑐 = 𝑘0𝐷𝜑 + 𝑘1𝐷𝑥 + 𝑘4𝐼𝐹 , (3.7)

где 𝑘𝑖 > 0, 𝑖 ∈ [1,3] - коэффициенты, направляющие эволюционный поиск. Они

могут корректироваться в ходе эволюции; 𝐷𝜑 – отклонение маятника от

положения равновесия; 𝐷𝑥 – отклонение тележки от начала координат; 𝐼𝐹 –

суммарное значение силы, прикладывавшейся к тележке за последние ∆𝑡 = 30 с.

Критерием остановки эволюции является ограничение по времени: 𝑡 > 𝑡max.

Для усложнения задачи количество параметров было сокращено и на вход

системы управления подавалась информация о текущем угле балансируемого

маятника 𝜑, но не о его угловой скорости 𝜔:


4,

𝜑

𝜋,

𝑣

4} (3.8)

Задача балансировки обратного маятника считается успешно решенной,

если ИНС удается удерживать его на протяжении 30 минут, при этом не

перемещая тележку за пределы заданного интервала.

2. Два обратных маятника, стержни которых имеют общую точку опоры на

тележке, перемещающейся вдоль прямой. Тележка с двумя обратными

маятниками, закрепленными на стержнях длины l1 и l2, перемещается в интервале

−4 < 𝑥 < 4 м. Начальная координата тележки 𝑥0 м задается случайным образом

в интервале −2 < 𝑥0 < 2 . Начальная скорость тележки 𝑣0 = 0 м/с. Начальные

углы отклонения обоих маятников 𝜑10 и 𝜑2

0 рад, задаются случайным образом, их

начальные угловые скорости равны нулю: 𝜔10 = 𝜔2

0 = 0 рад/с. Управляющий

сигнал – это сила F, прикладываемая к тележке: -10 < F < 10 Н. Начальный пул

входных параметров ИНС состоит из шести параметров: текущая координата

тележки 𝑥, углы наклона маятников 𝜑1 и 𝜑2, скорость тележки 𝑣, угловые

89

скорости маятников 𝜔1 и 𝜔2. После масштабирования пула параметров входной

вектор ИНС 𝑖𝑛𝑝𝑢𝑡1 имеет вид:


4,

𝜑1

𝜋,

𝜑2

𝜋,

𝑣

4,

𝜔1

𝜋,

𝜔2

𝜋} (3.9)


оценки 𝑓𝑐:

𝑓𝑐 = 𝑘0(𝐷𝜑1 + 𝐷𝜑2) + 𝑘1𝐷𝑥 + 𝑘2𝐼𝐹 , (3.10)


могут корректироваться в ходе эволюции; 𝐷𝜑1 – отклонение первого маятника от

положения равновесия; 𝐷𝜑2 – отклонение первого маятника от положения

равновесия; 𝐷𝑥 – отклонение тележки от начала координат; 𝐼𝐹 – суммарное

значение силы, прикладывавшейся к тележке за последние ∆𝑡 = 30 с.


Для усложнения задачи количество параметров было сокращено до четырех: на

вход системы управления подавалась информация о текущих углах

балансируемых маятников 𝜑1 и 𝜑2, но не об их угловых скоростях 𝜔1 и 𝜔2:


4,

𝜑1

𝜋,

𝜑2

𝜋,

𝑣

4} (3.11)

Задача балансировки двух обратных маятников считается успешно

решенной, если ИНС удается удерживать оба мятника на протяжении 30 минут,

при этом не перемещая тележку за пределы указанного интервала.

3. Обратный маятник на плоскости. Задача, в которой тележка с

закрепленным на ней обратным маятником перемещается не по прямой, а в

двумерном пространстве. Такая система имеет две степени свободы [98]; сила F

может прикладываться по как по оси абсцисс, так и по оси ординат и состоит из

двух компонент: 𝐹𝑥 и 𝐹𝑦. Состояние системы определяется через восемь

параметров: углы отклонения маятника по осям X и Y (𝜑𝑥, 𝜑𝑦), соответствующие

угловые скорости маятника (𝜔𝑥, 𝜔𝑦), координаты тележки на плоскости (𝑥, 𝑦) и

ее скорости по осям (𝑣𝑥, 𝑣𝑦). Начальные координаты (𝑥0, 𝑦0) задаются случайным

образом: 𝑥0 ∈ [−4, 4], 𝑦0 ∈ [−4, 4]. Поле, по которому перемещается тележка,

90

имеет размеры 20 × 20 м: 𝑥 ∈ [−10,10], 𝑦 ∈ [−10, 10]. Начальные угловые

скорости маятника равны нулю: 𝜔𝑥0 = 𝜔𝑦0 = 0. Начальные углы отклонения

𝜑𝑥0 и 𝜑𝑦0 задаются случайным образом. Управляющий сигнал – это сила F,

прикладываемая к тележке: -10 < 𝐹𝑥< 10 Н, -10 < 𝐹𝑦< 10 Н. Начальный пул

входных параметров ИНС состоит из шести параметров: текущие координаты

тележки (𝑥, 𝑦), углы наклона маятника (𝜑𝑥, 𝜑𝑦), скорости тележки (𝑣𝑥, 𝑣𝑦),

угловые скорости маятника (𝜔𝑥, 𝜔𝑦). После масштабирования пула параметров

входной вектор ИНС 𝑖𝑛𝑝𝑢𝑡1 имеет вид:


4,

𝑦

4,

𝜑𝑥

𝜋,

𝜑𝑦

𝜋,

𝑣𝑥

4,

𝑣𝑦

4,

𝜔𝑥

𝜋,

𝜔𝑦

𝜋} (3.12)


оценки 𝑓𝑐:

𝑓𝑐 = 𝑘0(𝐷𝜑𝑥 + 𝐷𝜑𝑦) + 𝑘1(𝐷𝑥 + 𝐷𝑦) + 𝑘3(𝐼𝐹𝑥+ 𝐼𝐹𝑦

) , (3.13)


могут корректироваться в ходе эволюции; 𝐷𝜑𝑥 – отклонение маятника от

положения равновесия по оси X; 𝐷𝜑𝑦 – отклонение маятника от положения

равновесия по оси Y; 𝐷𝑥 – отклонение тележки от начала координат по оси X; 𝐷𝑦

– отклонение тележки от начала координат по оси Y; 𝐼𝐹𝑥 – суммарное значение

силы, прикладывавшейся к тележке за последние ∆𝑡 = 30 с по оси X; 𝐼𝐹𝑦 –

суммарное значение силы, прикладывавшейся к тележке за последние ∆𝑡 = 30 с

по оси Y.


Для усложнения задачи количество параметров было сокращено до шести:


4,

𝑦

4,

𝜑𝑥

𝜋,

𝜑𝑦

𝜋,

𝑣𝑥

4,

𝑣𝑦

4} (3.14)

На рисунке 3.1 представлены два варианта траектории движения тележки по

плоскости из множества решений, полученные при помощи наиболее

приспособленной ИНС.

91

Рисунок 3.1 – Траектории движения тележки в задаче об обратном маятнике

на плоскости

Задача балансировки маятника на плоскости считается успешно решенной,

если ИНС удается удерживать маятник на протяжении 30 минут, при этом не

перемещая тележку за пределы заданной прямоугольной области.

3.2.2 Задача о классификации точек единичного гиперкуба

Для проверки эффективности предложенной нейроэволюционной модели в

качестве классификатора линейно-неразделимых образов [105] была выбрана

задача реализации функции XOR, являющаяся частным случаем задачи о

классификации точек единичного гиперкуба. Хотя сама по себе реализация

логических функций при помощи ИНС считается тривиальной, она была

использована для тестирования нейроэволюционной системы по двум

соображениям.

Во-первых, проверка оптимизации параметров: весовых коэффициентов,

вида функций активации и пороговых значений. Реализация функции XOR

92

наглядно продемонстрировала точность настройки весовых коэффициентов и

оптимальность выбора в качестве функции активации пороговой функции.

Во-вторых, проверка релевантности генерируемой структуры ИНС. Для

успешного решения задачи XOR многослойный персептрон должен иметь два

входа, скрытый слой из четырех нейронов и один выход. Сгенерированная в ходе

нейроэволюции ИНС обладает данной структурой, что является доказательством

эффективности процесса эволюции и правильности подобранных генетических

операторов. Как известно, однослойный персептрон в принципе не способен

классифицировать линейно-неразделимые входные образы [114].

Для успешного решения задачи XOR в ИНС должен быть сформирован

единственный скрытый слой, состоящий из двух нейронов с пороговыми

функциями активации. Обучающее множество для решения данной задачи при

помощи ИНС было сформировано на основании таблицы истинности функции

XOR [98].

Граф, иллюстрирующий структуру и процесс передачи сигнала ИНС,

показавшей наилучшие параметры в ходе нейроэволюции, изображен на

рисунке 3.2.

Рисунок 3.2 – Граф ИНС для решения задачи XOR

93

ИНС имеет два входа и один выход. Весовые коэффициенты и пороги для

двух скрытых нейронов и единственного выходного нейрона имеют значения:

𝑤11 = 𝑤12 = 1, 𝜃 = −1.5,

𝑤21 = 𝑤22 = 1, 𝜃 = −0.5,

𝑤31 = −2, 𝑤32 = 1, 𝜃 = −0.5. (3.15)

Среднее время поиска решения составило 1.1 с, что в совокупности с

точной настройкой параметров ИНС и оптимально подобранной структурой

позволяет говорить об эффективности предложенного метода. На основании

результатов проведенного эксперимента следует отметить, что метод, с одной

стороны, с достаточной точностью настраивает параметры нейронов, и с другой

стороны, позволяет определить оптимальную (или близкую к оптимальной)

структуру ИНС.

3.2.3 Задача восстановления поврежденных данных

Задачи восстановления поврежденных данных (зашумленных сигналов,

поврежденных изображений) за счет слабой формализуемости показательны при

испытании нейроэволюционных методов [117]. В качестве такой задачи было

выбрано восстановление поврежденного изображения размера не более 𝑅 × 𝐶 px,

X% пикселей которого неизвестны. Процесс восстановления [97] осуществляется

следующим образом: на вход обученной ИНС подается поврежденное

изображение, X% пикселей которого повреждены. После этого на выходе ИНС

формируется восстановленный образ. В нем X% пикселей замещены значениями

весов соответствующих нейронов. В ходе эксперимента использовались

изображения с глубиной цвета 16 бит и значениями параметров R=600, C=400.

Цифровой шум в виде наложенной на изображение маски из пикселей случайного

цвета и яркости генерируется при 𝑋 ∈ [10; 80].

Результаты работы алгоритма целесообразно оценивать величиной

восстановления изображения 𝜌, вычисляемой по трем параметрам: расстоянию от

94

поврежденного изображения до исходного 𝑑(𝐼𝑑𝑎𝑚𝑎𝑔𝑒𝑑 , 𝐼𝑠𝑜𝑢𝑟𝑐𝑒), расстоянию от

восстановленного изображения до исходного 𝑑(𝐼𝑟𝑒𝑐𝑜𝑣𝑒𝑟𝑒𝑑 , 𝐼𝑠𝑜𝑢𝑟𝑐𝑒) и расстоянию от

поврежденного изображения до восстановленного 𝑑(𝐼𝑑𝑎𝑚𝑎𝑔𝑒𝑑 , 𝐼𝑟𝑒𝑐𝑜𝑣𝑒𝑟𝑒𝑑). Данные

расстояния вычисляются по метрике Минковского:

𝑑(𝑈, 𝑉) = max𝑘,𝑙

∑|𝑈𝑘𝑙

𝑗−𝑉𝑘𝑙

𝑗|

𝐾

𝐾𝑗=1 , (3.16)

где 𝑈𝑘𝑙𝑗

, 𝑉𝑘𝑙𝑗 – значения цветов j-ых пикселей изображений U и V;

K – количество пикселей.

Каждое из изображений U и V при этом представлено в виде трех матриц

цветов, соответствующих модели RGB. Величина восстановления изображения

принимает значения на отрезке [0, 1] и рассчитывается по формуле:

𝜌 = 𝑑(𝐼𝑑𝑎𝑚𝑎𝑔𝑒𝑑,𝐼𝑠𝑜𝑢𝑟𝑐𝑒)−𝑑(𝐼𝑟𝑒𝑐𝑜𝑣𝑒𝑟𝑒𝑑,𝐼𝑠𝑜𝑢𝑟𝑐𝑒)

𝑑(𝐼𝑑𝑎𝑚𝑎𝑔𝑒𝑑,𝐼𝑟𝑒𝑐𝑜𝑣𝑒𝑟𝑒𝑑) (3.17)

В ходе эксперимента была исследована зависимость эффективности

предложенного метода от величины повреждения изображения,

проиллюстрированная графиком зависимости на рисунке 3.3.

Рисунок 3.3 – График зависимости величины восстановления изображения

от количества поврежденных пикселей

95

Как видно из рисунка 3.3, с ростом количества поврежденных пикселей

эффективность метода снижается довольно быстро. Тем не менее, даже при

X>60% метод показывает хорошие результаты восстановления изображения до

уровня, на котором различимы основные фрагменты. Для демонстрации работы

метода на рисунке 3.4 представлены результаты восстановления изображения

геометрических объектов, 80% пикселей которого были повреждены.

A - исходное изображение; B – поврежденное изображение; С –

восстановленное изображение

Рисунок 3.4 – Эксперимент по восстановлению изображения:

Рисунок 3.4 был подготовлен для эксперимента в соответствии с

требованием наличия четких границ у изображенных объектов, так как

восстановление такого класса изображений является наиболее показательным.

Рисунок демонстрирует, что изображение было восстановлено с минимальным

количеством искажений. Это говорит об эффективности применения данного

нейроэволюционного метода в сложноформализуемых задачах восстановления

зашумленных и поврежденных данных.

3.2.4 Сравнение эффективности нейэроэволюцонных методов

В ходе исследования эффективности предложенного метода были получены

результаты решения представленных эталонных задач при помощи

разработанного метода и методов, проанализированных в первом разделе

96

диссертационной работы. Для корректного сравнения эффективности методов

результаты решения задач каждым из них были усреднены по 100 запускам. На

рисунке 3.5 приведена столбчатая диаграмма сравнения эффективности методов

для решения задачи об обратном маятнике. Предложенный метод и метод ESP

показали равную эффективность, сформировав решение за 2 эпохи эволюции. Это

свидетельствует о том, что при должном разнообразии особей решение

тривиальной задачи может быть сформировано в первых поколениях

нейроэволюции.

Рисунок 3.5 – Сравнение эффективности нейроэволюционных методов для

решения задачи об обратном маятнике

На рисунке 3.6 приведено сравнение эффективности методов для решения

задачи о двух обратных маятниках. Данная задача на порядок сложнее задачи о

единственном обратном маятнике, в которой оптимальное решение

формировалось в первые эпохи эволюции. Предложенный метод оказался

эффективнее всех рассматриваемых методов за исключением GNARL. С одной

стороны, при помощи метода GNARL эффективное решение было сформировано

на одну эпоху раньше. С другой стороны, он проигрывает по количеству неудач.

97


решения задачи о двух обратных маятниках

На рисунке 3.7 приведена столбчатая диаграмма сравнения эффективности

методов для решения задачи об обратном маятнике на плоскости.


решения задачи об обратном маятнике на плоскости

Данная задача является более сложной, чем задача о двух обратных

маятниках Предложенный метод показал наилучшие результаты, сформировав

решение за 37 эпох при двух неудачных запусках. На рисунке 3.8 приведена

98

столбчатая диаграмма сравнения эффективности методов для решения задачи

классификации линейно-неразделимых образов (реализации функции XOR).

Наилучшие результаты показали методы NEAT, SANE, DXNN, EPNet и

предложенный метод (формирование решения соответственно за 8, 9, 9, 10 и 11

эпох). Результаты, продемонстрированные предложенным методом, не являются

самыми высокими, но, тем не менее, могут считаться хорошими.


решения задачи реализации функции XOR

На рисунке 3.9 изображена столбчатая диаграмма сравнения эффективности

методов для решения задачи восстановления изображения. Как видно из рисунка,

предложенный метод показал наилучшие результаты, сформировав решение за

146 эпох, что близко к результатам метода EANT – 148 эпох эволюции. Самые

низкие результаты показал метод NES (685 эпох). Анализ таблицы показывает,

что предложенный метод демонстрирует наилучшие результаты (в задачах об

обратном маятнике и восстановления изображений) или близкие к наилучшим

результатам (задача о двух обратных маятниках, об обратном маятнике на

99

плоскости, реализация XOR). Данный метод выигрывает у большинства

исследованных методов по количеству эпох и неудачных запусков.


решения задачи восстановления изображения

Таблица 3.2 – Сравнение эффективности нейроэволюционных

методов для различных типов задач

Задача

Метод

Количество эпох/неудач

Обратный

маятник

Два

обратных

маятника

Обратный

маятник

на

плоскости

XOR Восстановление

изображения

Предложенный

метод

2/0 25/1 37/2 11/0 146/2

CE 5/0 150/14 230/20 19/0 441/4

CNE 4/0 800/30 1312/27 31/2 659/0

DXNN 3/0 614/28 802/12 9/0 235/0

EANT 7/0 975/14 1040/1 14/0 148/23

ENS3 8/0 741/16 1021/5 15/1 360/0

EPNet 3/0 543/20 717/45 10/0 152/0

ESP 2/0 19/1 33/2 17/1 554/0

GNARL 4/0 591/13 719/34 16/0 408/7

ICONE 6/0 903/6 1452/14 12/0 415/0

NEAT 6/0 24/1 79/1 8/0 210/0

SANE 11/0 63/3 104/3 9/0 276/4

NES 9/1 692/8 834/17 22/3 685/5

100

Таким образом, данные, полученные в ходе экспериментального

исследования эффективности метода на эталонных нейроэволюционных задачах,

свидетельствуют о целесообразности применения метода на практике.

3.3 Реализация системы поддержки принятия решений на базе


3.3.1 Модель системы поддержки принятия решений на базе


Модель СППР определяет популяцию нейросетей, генерируемую

посредством нейроэволюционного метода, среду (обслуживаемый нейросетью

объект или его модель), источники данных и пользовательский интерфейс.

Нейроэволюционный метод инкапсулируется в модуль принятия решений.

Концептуальная модель СППР, включающая основные архитектурные

компоненты и учитывающая взаимосвязь между ними, представлена на

рисунке 4.1.

БДМодуль


Пользовательский интерфейс

ЛПР

DSS

Внешняя среда

Рисунок 4.1 – Архитектура СППР

Как видно из рисунка 4.1, ЛПР взаимодействует с СППР посредством

пользовательского интерфейса. База данных (БД) – это хранилище данных,

используемых в процессе принятия решений. В некоторых случаях БД может

101

объединять такие блоки как база знаний, база моделей, различные

конфигурационные файлы. Она может пополняться как при помощи ЛПР, так и

через дополнительные актуаторы значениями параметров внешней среды. Модуль

принятия решений осуществляет анализ данных в БД и вырабатывает решение в

рамках данной задачи. Функциональная схема модуля принятия решений

представлена на рисунке 4.2.

Входы

Выборки из БД

Характеристики ПараметрыЭкспертные

данные

Обработка

Выходы

Процесс принятия решений

Решения

Рисунок 4.2 – Функциональная схема модуля принятия решений СППР

В качестве входов для модуля принятия решений используются выборки из

БД, дополнительные характеристики (опционально), различные параметры и, в

случае необходимости участия ЛПР в процессе принятия решений, экспертные

данные.

Входные параметры проходят дополнительную обработку (различные

преобразования в соответствии с условиями задачи, масштабирование,

нормирование), и преобразуются в выходной вектор. На основании вектора

выходов осуществляется процесс принятия решений, результатом которого

является сформированное решение.

102

3.3.2 Программная реализация системы поддержки принятия решений

на базе нейроэволюции

Разработанное программное средство (ПС) реализует модель

нейроэволюционной СППР и инкапсулирует методы взаимодействия

пользователя с СППР. Программный код ПС представлен в виде библиотеки

классов DSS_PACK, основной функционал которой заключается в следующем:

организация взаимодействия СППР и пользователя (ЛПР); реализация модели

СППР; организация процесса нейроэволюции; создание, редактирование, экспорт

и импорт конфигурационных файлов настроек и выборок прецедентов в таких

форматах как xml, json, txt; визуализация нейроэволюции посредством графиков и

таблиц значений нейронов ИНС популяции. Для разработки базовых компонентов

ПС был использован мультипарадигмальный язык программирования C++

стандарта C++11 в совокупности с библиотеками STL, Boost и QWT. Данный

выбор обусловлен следующими причинами:

– сочетание высокой производительности языка C++ и простоты реализации

на нем паттернов проектирования, подходящих для задач приложения;

– поддержка языком C++ объектно-ориентированной парадигмы, которая

делает акцент на разработке новых типов данных, наиболее полно

соответствующих концепциям выбранной области исследований;

– простота масштабирования и поддержки проекта, разработанного в

объектно-ориентированном стиле;

– унификация исходного кода посредством стандартной библиотеки

шаблонов STL, предоставляющий единообразный интерфейс для множества

алгоритмов и контейнеров;

– поддержка многопоточности на базе библиотек классов Boost.

Распараллеливание работы генерируемых в ходе нейроэволюции особей-

нейросетей необходимо для более эффективного использования вычислительных

ресурсов, и, как следствие, повышения производительности СППР в целом;

103

– покрытие исходного кода unit-тестами при помощи инструментария

библиотек классов Boost, необходимое для проверки на корректность отдельных

модулей СППР и упрощения проведения рефакторинга.

Для программной реализации СППР также использовался

кроссплатформенный, полностью объектно-ориентированный инструментарий

разработки Qt. Он содержит базовые классы, необходимые для разработки СППР,

начиная от элементов графического интерфейса и заканчивая классами для

работы с БД, форматом XML и высокоуровневыми протоколами передачи

данных. В качестве системы управления базами данных (СУБД) была выбрана

встраиваемая реляционная СУБД SQLite, поддерживающая динамическое

типизирование и обеспечивающая хранение БД в единственном плоском файле.

Использование встраиваемой СУБД позволяет значительно уменьшить накладные

расходы на обработку данных за счет компоновки ее движка и самой программы

посредством API-вызовов библиотеки SQLite. В процессе разработки ПС для

описания архитектуры использовался унифицированный язык моделирования

UML. В соответствии с архитектурной схемой СППР на была спроектирована

UML-диаграмма основных классов СППР, собранных в единую библиотеку

DSS_PACK. Для каждого из классов в ней представлены наименования основных

методов и полей, а полные сигнатуры методов, конструкторы, деструкторы,

перегрузки и модификаторы доступа классов опущены. В UML-диаграмме

используются следующие обозначения ассоциаций (взаимосвязи классов):

– обобщение: отношение наследования между классами. Данный вид

ассоциации показывает, что один из классов представлен частной формой

родительского класса, который является его обобщением;

– реализация: отношение между двумя классами, при котором один из них

является интерфейсом, а другой класс реализует интерфейс;

– агрегация: вид ассоциации, при котором один из классов имеет более

высокий ранг и состоит из нескольких меньших по рангу элементов;

– использование: вид ассоциации, при котором один из классов

104

использует другой в качестве параметра метода, типа поля класса и т.д.

Как видно из UML-диаграммы на рисунке 4.3, для программной реализации

СППР была применена схема использования паттернов проектирования Model-

view-controller (MVC, модель-представление-контроллер). Модель приложения,

его интерфейс и методы взаимодействия с пользователем в рамках единого пакета

DSS_PACK разделены на слабосвязные компоненты таким образом, что

модификация одного из них оказывает минимальное влияние на остальные.

Модель приложения схемы MVC реализована в классе DSSModel. Он

предоставляет бизнес-логику, а именно: данные и методы работы с этими

данными, методы обработки запросов и изменения состояния СППР. Метод load()

необходим для получения, предварительной обработки и преобразования входных

данных; перегруженный метод solve() осуществляет непосредственно

нейроэволюционный процесс; метод export() отвечает за вывод сгенерированного

решения. Контроллер MVC реализован при помощи класса DSSController. Он

отвечает за взаимодействие пользователя и слоя бизнес-логики СППР: метод

validate() контролирует и проводит валидацию ввода данных; методы update() и

handle_event() отвечают за использование модели и представления для реализации

необходимых действий. Представление MVC реализовано в классах,

описывающих интерфейс DSSView и обеспечивающих визуализацию, экспорт и

импорт данных соответственно при помощи методов display(), attach(), detach().

Так, класс UI (user interface), реализующий DSSView, осуществляет построение

графиков с использованием вспомогательного класса DSSUtil. В классе DSSUtil

содержатся методы сохранения и восстановления конфигурации export_config() и

import_config(), экспорта и открытия файлов с данными в форматах JSON, XML,

txt (соответственно export_xml(), import_xml(), export_json(), import_json(),

serialize(), deserialize()), записи лог-файлов log(), генерации отчетов о

функционировании СППР gen_report() и графического представления

информации visualize().

Рисунок 4.3 – UML-диаграмма классов библиотеки DSS_PACK

Для иллюстрации работы метода render_plot() класса DSSView на рисунке

4.4 выбран контурный график, построенный при помощи библиотеки QWT и

визуализирующий ход эволюции популяции ИНС. График отображает на

плоскости трехмерные поверхности 𝑓(𝑥, 𝑦) – функции приспособленности

популяции. В целях наглядности была выбрана функция Швефеля, которая

наряду с функциями Растригина, Розенброка, Гривонка и Экли широко

используется для тестирования алгоритмов многомерной оптимизации. Функция

Швефеля от двух аргументов 𝑥 ∈ [0, 1200], 𝑦 ∈ [0, 1200] имеет вид

𝑓(𝑥, 𝑦) = 𝑥 sin (√|𝑥|) − 𝑦 𝑠𝑖𝑛(√|𝑦|) (3.18)

Рисунок 4.4 – Генерация графика эволюции при помощи метода

render_plot()

Черные точки на графике – координаты (𝑥, 𝑦) особей популяции, то есть

значения их приспособленности в заданную эпоху. По мере работы алгоритма

точки стягиваются к областям поверхности, являющихся локальными

оптимумами.

Класс Evolution реализует процесс нейроэволюции. Метод epoch_0()

предназначен для генерирования популяции нулевой эпохи, epoch_next() – для

107

перехода на новую эпоху. Внутри данных методов организован вызов

перегруженных методов, оперирующих хромосомами: mutation(), selection(),

recombination(), crossingover(). Глобальный и локальный генетический поиск

осуществляются при помощи методов global_step() и memetic_step(). Метод

calc_fitness() предназначен для расчета приспособленности особей.

Особи представлены в СППР при помощи классов GenericNN и

SupervisedLearningNN, реализующих интерфейс NN, в котором объявлены

базовые поля и методы нейросети. Класс Population описывает популяцию,

состоящую из списка нейросетей NN, дополнительных структур хранения

данных, предусмотренных нейроэволюционным методом – пула входных

параметров (поля ipPull – объекта класса InputPool) и пула «хороших» решений

(поля optPool – объекта класса QuasioptimalPool).

Класс UnitTests содержит unit-тесты для изолированной проверки и

подтверждения корректности функционирования каждого отдельного элемента

разработанного программного средства.

3.4 Выводы по третьей главе

1. Предложены унифицированные критерии оценки качества

нейроэволюционного метода для его применения к классу задач принятия

решений в условиях неопределенности. Проведен анализ основных

характеристик метода, в частности: общих свойств генетического

представления, по которым следует сравнивать различные методы; свойств

процесса эволюции, являющихся косвенным критерием определения скорости

сходимости ГА и эффективности генетических операторов; свойств особей

популяции, по которым можно судить о качестве получаемых в ходе

нейроэволюции частных решений. На основании представленного множества

свойств сформулированы критерии оценки нейроэволюционного метода для

его практического применения в качестве модуля СППР. Данные критерии

108

являются наиболее полными в сравнении с известными критериями для

аналогичных методов. Результаты проведенного анализа позволяют

утверждать о целесообразности применении метода на практике.

2. Проведена экспериментальная оценка характеристик метода на

эталонных задачах в сравнении с проанализированными в главе 1 известными

нейроэволюционными методами. Метод демонстрирует наилучшие результаты

(в задачах об обратном маятнике и восстановления изображений) или близкие

к наилучшим результатам (задача о двух обратных маятниках, об обратном

маятнике на плоскости, реализация XOR). Метод выигрывает у большинства

альтернативных методов по количеству эпох и неудачных запусков.

3. Представлена модель системы поддержки принятия решений на базе

нейроэволюции, включающая основные архитектурные компоненты и

учитывающая взаимосвязь между ними.


нейроэволюционного метода и модели системы поддержки принятия решений

в условиях неопределенности и позволяющий использовать его при решении

практических задач интеллектуализации обработки данных в качестве

встраиваемого или автономного модуля СППР.

109

ГЛАВА 4. ПРАКТИЧЕСКОЕ ПРИМЕНЕНИЕ

РАЗРАБОТАННОГО НЕЙРОЭВОЛЮЦИОННОГО МЕТОДА

В ходе диссертационного исследования решены три актуальные

практические задачи: защита корпоративного портала от DDoS-атак,

автоматическая обработка материалов, размещаемых в виртуальной среде работы

над проектами, и конструктивная модификация деталей 3D-принтера Prusa i2.

Данные эксперименты были проведены на основе реальных данных с

использованием разработанного программного инструментария,

обеспечивающего реализацию нейроэволюционного метода и модели системы

поддержки принятия решений в условиях неопределенности.

4.1 Система защиты корпоративного портала от DDoS-атак

Рассмотрим использование разработанного метода для защиты от DDoS-

атак корпоративного портала федерального государственного бюджетного

учреждения «Научно-исследовательский финансовый институт» (НИФИ).

DDoS-атака (Distributed Denial of Service) - распределенная атака типа

«отказ в обслуживании», организуемая для переполнения полосы пропускания

атакуемого сервера [46]. Как правило, организуется при помощи флуда -

большого количества не валидных запросов к серверу для исчерпания им

процессорных или сетевых ресурсов. Организуется при помощи ботнета –

совокупности узлов сети, участвующих в атаке. Данная атака создает условия,

при которых легитимные пользователи не могут получить доступ к

предоставляемым ресурсам. Существует несколько основных разновидностей

флуда, отличающихся типом используемого протокола: HTTP, ICMP, UDP, TCP.

Задача СППР для фильтрации трафика формулируется следующим образом.

Пусть множество альтернатив состоит из двух допустимых решений:

110

Α = {𝑎1, 𝑎2}, (4.1)

где 𝑎1 – зарегистрировать факт аномального трафика и запустить механизм

его обработки; 𝑎2 – классифицировать запрос как безопасный. Параметры

трафика, оказывающие влияние на выбор одного из решений, составляют

множество Ω = {𝜔1, … , 𝜔𝑇}, 𝑇 = 14. Задача заключается в выборе решения из

множества 𝐴 с учетом множества параметров Ω.

В задаче присутствуют три вида неопределенности:

1. Неизвестность. Данные о значениях таких параметров как Url источника

и User-Agent могут отсутствовать.

2. Недостоверность. Возможность неадекватности таких параметров как

значение заголовка referer, Ip клиента, значение поля User-Agent и т.д.

3. Неоднозначность входных данных. Такие параметры как клиентская

поддержка JavaScript и время поступления запроса являются косвенными и

недостоверными признаками атаки.

Одним из ключевых этапов решения задачи защиты сервера при помощи

нейроэволюционной системы является составление корректной и разнообразной

обучающей выборки. В качестве такой выборки были использованы файлы логов

веб-запросов сервера и находящиеся в открытом доступе базы сетевых атак. В

итоговых тестовых и валидационных наборах прецедентов для ИНС

присутствовали примеры логов перечисленных далее видов атак.

ICMP-флуд (ping-флуд) – атака, направленная на насыщение полосы

пропускания сервера с помощью пакетов типа ECHO REQUEST (ICMP-запросов

размером около 64 байт). Данный тип флуда эффективен для атак на небольшую

линию, но не на корпоративные сервера: атака может достигнуть успеха только в

том случае, если пропускной канал атакующего намного шире канала атакуемого

сервера.

Smurf-атака – наиболее эффективная разновидность ICMP-флуда.

Заключается в формировании широковещательных echo ICMP-пакетов, в

заголовках которых в качестве источника указывается адрес атакуемого сервера.

111

Пакеты поступают в «усиливающую» сеть, узлы которой отправляют серверу

ответ и тем самым приводят к отказу в обслуживании. Одним из средств защиты

от Smurf-атаки является настройка блокирования широковещательных ICMP-

пакетов.

UDP-флуд (Fraggle-атака) является аналогом Smurf-атаки и отличается от

нее протоколом: вместо ICMP-запросов на 7-ой порт сервера поступают пакеты

UDP.

TCP-флуд (SYN-флуд) – атака, основанная на трехступенчатой схеме

установления TCP-соединения. SYN-флуд заключается в отправке большого

количества TCP-пакетов с флагом SYN и недостижимым адресом источника. На

сервере происходит исчерпание очереди соединений полуоткрытыми

подключениями, ожидающими подтверждения от клиента. По истечении тайм-

аута 75 секунд (RFC) эти подключения сбрасываются, поэтому для исчерпания

ресурсов сервера пакеты поступают с меньшим интервалом.

HTTP-флуд – вид флуда, использующийся преимущественно для атаки на

мощные сервера. Заключается в генерировании небольшого HTTP-пакета, в ответ

на который сервер отправляет на подмененный ip-адрес пакет гораздо большего

размера. Даже если канал сервера в десять раз шире канала атакующего,

существует большой риск насыщения серверной полосы пропускания.

Таким образом, задача защиты корпоративного портала состоит в

обнаружении и защите от данных видов DDoS-атак средствами

нейроэволюционной системы. Для решения задачи использовались

вспомогательные программные средства:

– утилита перехвата TCP-соединений TCP Intercept, работающая как в

активном режиме перехвата, так и в пассивном режиме наблюдения. В режиме

перехвата утилита организует два отдельных соединения: с подключившимся

клиентом и с сервером. В случае если соединение с клиентом произошло

успешно, эти два соединения замыкаются в одно, но в случае TCP-флуда, при

112

котором указывается неверный обратный адрес клиента, соединение с сервером

не устанавливается;

– пакетный фильтр - вид межсетевого экрана, функционирующий на сетевом

уровне модели OSI и принимающий решение о разрешении прохождения трафика

в сеть на основании анализа заголовка пакета;

– средство сетевого распознавания приложений (Network-Based Application

Recognition, NBAR), необходимое для определения категории трафика потока

данных по первому переданному пакету;

– Фильтр ICMP-пакетов для ограничения трафика.

При помощи перечисленных программных средств и на основании целевых

видов атак было сформировано 14 входных параметров для анализа,

представленных в таблице 4.1.

Из параметров запросов был сформирован входной вектор ИНС, каждый

элемент которого проходил предобработку (в частности, масштабирование и

нормирование).

В процессе нейроэволюции количество параметров было сокращено до 11

(параметры с номерами 2, 3, 5 были отброшены как обладающие низкой

значимостью). К 117-ой эпохе эволюции в сетях прямого распространения были

сформированы обратные связи и контекст. Оптимальные результаты показала

рекуррентная ИНС со следующей структурой:

– входной слой;

– контекст;

– первый скрытый слой из 131 нейрона;

– второй скрытый слой из 42 нейрона;

– выходной слой (2 нейрона, выход которых поступает на контекст).

Данная ИНС относится к типу классификационных сетей, структурно схожа

с нейросетью Джордана и имеет два выхода: нет DDoS-атаки; есть атака.

113

Таблица 4.1 – Входные параметры нейроэволюционного метода

№ Параметр Описание

1 HTTP-метод Метод запроса принимает одно из значений, определенных

протоколом - GET, HEAD, POST, PUT и т.д. Используется для

определения атак типа HTTP GET (POST).

2 URI URI запрашиваемого ресурса в стартовой строке запроса.

3 Версия

протокола

Строка, содержащая наименование протокола и версию. Например,

HTTP/1.1.

4 Url источника Url источника запроса, который определяется по значению

заголовка referer и проходит валидацию.

5 User-Agent Информация о клиентском приложении, обрабатываемая парсером

для разбиения на отдельные признаки. Наибольший интерес

представляют следующие параметры: версия ОС и тип клиентского

приложения.

6 Корректность

заголовков

Значение данного двоичного параметра формируется парсером

заголовков.

7 Код состояния Статус сервера в ответе на запрос клиента. Особый интерес

представляют следующие значения статуса: 403 – forbidden, 404 –

not found, 503 – service unavailable.

8 Ip клиента Параметр необходим для фильтрации запросов по Ip-адресу, в том

числе по первому октету Ip, определяющему RIR (регионального

интернет регистратора).

9 Ответ на cookie Строка вида name=value в ответе клиента на присланный сервером

cookie (добавленный в HTTP-заголовок или установленный

сценарием JavaScript).

10 Поддержка

JavaScript

Ответ клиента на сценарий JavaScript, определяющий,

поддерживается ли он клиентским приложением.

11 Поддержка

Flash-контента

Ответ клиента на Flash-контент, отправленный сервером.

12 Время

поступления

запроса

Параметр был добавлен в выборку для снижения риска ошибок

второго рода: вероятность запроса от легитимного клиента в

нерабочее время ниже, чем ботнета.

13 Время,

прошедшее

между двумя

запросами

клиента

Параметр позволяет блокировать ботнеты, отправляющие большое

количество запросов за короткий промежуток времени.

14 Количество

подключений

клиента

Учет данного параметра при фильтрации клиентов повышает

вероятность блокирования клиентов со статическим Ip, но

оказывается полезным для фильтрации ботов, использующих

прокси.

В разработанной системе присутствует опция построения статистического

профиля [37] по сетевому трафику, что обеспечивает индивидуальную защиту от

атак разного типа и возможность анализа трафика. По результатам нейросетевого

вывода осуществляется накопление статистики о том, какой трафик считается

114

нормальным. Ситуация регистрирования аномального трафика классифицируется

как DDoS-атака. По факту фиксирования трафика, значительно отличающегося от

нормального, модифицируются правила файервола, оповещается системный

администратор и заносятся соответствующие записи в файлы логов. Системой

защиты от DDoS-атак можно воспользоваться заранее с целью предотвращения

атаки или после того, как она уже началась.

Внедрение данной системы позволило значительно снизить риск отказа

сервера из-за DDoS-атак: система способна с вероятностью 99.892% избежать

ошибок первого и второго рода при распознавании (дифференциации)

легитимных пользователей и атакующих машин.

Данная оценка формировалась в течение 18-ти месяцев по результатам

злонамеренных и тестовых DDoS-атак. Тестовые атаки организовывались с целью

оценивания работоспособности системы и закрепления навыков сотрудников

информационного отдела по оперативной обработке критических ситуаций.

Полученные практические результаты подтверждают эффективность

нейроэволюционного метода и доказывают целесообразность его внедрения в

систему защиты от DDoS-атак.

4.2 Сервис интегрированной оценки контента виртуальной

среды работы над проектами

Виртуальная среда работы над проектами [19, 43] – это средство для

управления коллективной работой, к основным задачам которого относятся

централизованное хранение и обработка документов на едином корпоративном

портале и предоставление площадки для совместной работы над проектами.

Виртуальная среда внедрена в Федеральном государственном бюджетном

учреждении «Научно-исследовательский финансовый институт» (НИФИ) [20, 21,

49] с целью оптимизации научной деятельности и ведения отчетности. В

115

виртуальной среде результаты работ над проектами формируются в форме

отчетов, публикаций, информационных баз и других видов ресурсов [13].

Количество размещаемых материалов постоянно растет по мере

выполнения научно-исследовательских работ, а также в связи с оцифровкой и

размещением в виртуальной среде результатов исследований за прошлые годы.

Лишь часть материалов (около 20%) является постоянно востребованной для

использования в текущей научной работе. В связи с этим появилась

необходимость в периодической реструктуризации контента виртуальной среды,

которая была реализована при помощи нейроэволюционной СППР для

автоматической обработки материалов [51]. Обобщенная архитектура

виртуальной среды представлена на рисунке 4.5.

Рисунок 4.5 – Архитектура виртуальной среды работы над проектами

СППР была разработана в качестве интегрированного в виртуальную среду

инструмента для анализа и интеллектуальной обработки данных,

116

взаимодействующего с различными компонентами среды. Пользователи

виртуальной среды работают с материалами, выложенными в открытой для них

части портала, комментируют, обсуждают на форуме. Документы проходят

цепочки последовательного и параллельного согласования, могут быть подписаны

электронно-цифровой подписью (ЭЦП), перенесены в хранилище или архив

(закрытые части портала).

Интегрированная система рейтингового оценивания материалов выполняет

следующие функции:

1) Автоматическое формирование закрытого хранилища материалов - сбор

и перенесение в хранилище контента, обладающего высокими показателями

качества. Формирование хранилища материалов необходимо для оптимизации

процессов обмена информацией, накопления и управления знаниями [27].

2) Ранжирование и рубрикация материалов. Данная функция необходима

для быстрого и результативного поиска контента.

3) Перенесение в архив контента, не востребованного для дальнейшей

работы над проектами. Обновление архива позволяет существенно снизить

нагрузку на сервер и сократить среднее временя поиска данных в виртуальной

среде.

4) Накопление статистики с целью выявления наиболее востребованной

информации, модификации состава и структуры информации на портале.

Реализация вышеперечисленных функций невозможна без определения

критериев оценивания материала. Особенностью информационного контента

является сложность количественного оценивания его характеристик, так как

универсального определения показателей качества контента не существует.

Это связано, во-первых, со спецификой виртуальной среды и

разнородностью накапливаемого контента, и, во-вторых, с отсутствием

достоверных количественно измеримых характеристик контента и показателей,

через которые эти характеристики выражаются. Для обработки материалов был

117

разработан сервис - СППР для классификации материалов, расчета рейтинговой

оценки материалов и осуществления на ее основе дальнейшей обработки.

Задача СППР для обработки контента формулируется следующим образом.

Пусть множество альтернатив состоит из четырех допустимых решений:

Α = {𝑎1, … , 𝑎6}, (4.2)

где 𝑎1 – перенести данный материал в хранилище;

𝑎2 – перенести материал в «закрытую» часть портала - архив;

𝑎3 – пересчитать рейтинг материала;

𝑎4 – отправить запрос на удаление материала;

𝑎5 – отправить запрос на перенесение материала в соответствующую рубрику.

𝑎6 – отложить обработку материала до следующего выполнения таймера службы

виртуальной среды, инициализирующего работу сервиса.

Параметры обрабатываемого материала, оказывающие влияние на выбор

одного из решений, составляют множество

Ω = {𝜔1, … , 𝜔𝑇}, 𝑇 = 15. (4.3)

Задача заключается в выборе решения из множества 𝐴 с учетом множества

параметров Ω.

В задаче присутствуют три вида неопределенности:

1. Неизвестность. Данные о значениях некоторых параметров материала

могут отсутствовать (например, пустые поля тегов, отсутствие рейтинга

материала).

2. Недостоверность. Возможность неадекватности таких параметров как

значение пользовательского рейтинга или рейтинга автора.

3. Неоднозначность входных данных. Само значение интегрированной

рейтинговой оценки материала является косвенным и не всегда достоверным

показателем его качества.

118

4.2.1 Подбор показателей, используемых для многокритериальной

оценки контента

Каждому материалу, хранящемуся в виртуальной среде, сопоставлен набор

разнотипных параметров, среди которых: автор, категория, множество ключевых

тегов, история просмотров, изменения и согласования, комментарии

пользователей, оценка модератора.

Теги являются структурированными характеристиками выкладываемых на

портале материалов и предназначены для их идентификации и поиска.

Результирующее решение об обработке контента строится на основании

совокупности критериев (коэффициент доверия для авторов, популярность

материалов и другие).

Оценки пользователей агрегируются в отдельный параметр –

пользовательский рейтинг контента Ru. Он рассчитывается на основании голосов

пользователей и модераторов с учетом порога голосов для включения и

исключения из рейтинга.

Интегрированная оценка контента является суммарным рейтингом,

зависящим от значений характеристик нижних уровней иерархии, и выглядит

следующим образом:

1. Суммарный рейтинг R: интегрированная оценка контента.

1.1. Пользовательский рейтинг Ru: характеризует, насколько данный материал

кажется пользователям полезным. Выявляется путем голосования и оценивания.

Оценивается по 5-балльной шкале [1, 5].

1.1.1. Количество голосов за материал.

1.1.2. Медиана всех голосов за данный материал с учетом рейтинга каждого

голоса.

1.1.3. Порог голосов, необходимый для расчета рейтинга.

1.1.4. Медиана рейтинга всех материалов на портале.

119

1.2. Популярность P: показывает, как часто пользователи обращаются к

материалу. Оценивается по 10-балльной шкале [1, 10].

1.2.1. Количество просмотров.

1.2.2. Обсуждаемость (количество комментариев).

1.3. Актуальность U. Параметр принимает значение из множества {«не

актуальный», «не потерявший актуальность», «актуальный»}.

1.4. Модераторская оценка M: модератор может пометить материал для

последующего перенесения в хранилище данных. В случае если материал оценен

модератором, эта оценка является решающей в принятии решения о его

обработке. Оценка модератора принимает одно из трех значений: {«удалить», «не

переносить в хранилище», «перенести в хранилище»}, но может и отсутствовать.

1.5. Рейтинг автора контента Ra: у каждого пользователя в системе есть свой

рейтинг. Рейтинг автора может принимать дробные значения и колеблется в

пределах шкалы [0, 1].

1.5.1. Базовый рейтинг пользователя данной категории.

1.5.2. Активность.

1.5.3. Качество обсуждений и выкладываемых материалов.

Нейроэволюционная система производит расчет рейтинговой оценки и на

основании ее значения принимает решение о дальнейшей обработке материалов:

1) Копирование материала в архив.

2) Удаление материала.

3) Пометка материала как недостоверного или не качественного.

4) Рекомендация к проверке модератором.

Нейроэволюционная система принятия решений оперирует трудно

формализуемыми понятиями («рейтинг ниже среднего», «очень высокая

популярность») [28], которые должны быть определенным образом пересчитаны и

масштабированы. При этом избегается большой разброс значений, принимаемых

параметрами, для того, чтобы каждый из них влиял на принятие решения в

зависимости от своей значимости, а не порядка величины.

120

Пересчет пользовательского рейтинга 𝑅𝑢 и обновление динамических

рейтинговых таблиц осуществляется при каждом новом оценивании. При этом

порог количества оценок для участия в рейтинге Ti и порог исключения из

рейтинга Te фиксированы, но подвергаются корректировке в зависимости от

общего количества пользователей m и медианы оценок материалов n.

Ti (порог включения) – доля голосов, не набрав которую, материал не может

участвовать в рейтинговой оценке: 𝑇𝑖 = 𝑛−1

𝑚𝑛 100% . Te (порог исключения) – доля

голосов, не набрав которую, материал, участвующий в рейтинговой оценке, будет

из нее исключен. Порог исключения рассчитывается по формуле: 𝑇𝑒 = 1

𝑚𝑛 100% ,

где m – количество пользователей системы; n – медиана количества оценок

материалов.

Каждому типу пользователей (модератор, автор, зарегистрированный

пользователь) соответствует весовой коэффициент w (базовые значения

рейтингов указаны в таблице 4.2), складывающийся из базового значения веса для

данного типа пользователя и величины k (шага изменения рейтинга),

варьирующейся в зависимости от активности в положительную и отрицательную

стороны: wi = w base ± k, 𝑤𝑖 ∈ [0,1; 1], k=const=0,1. Весовой коэффициент

модераторов фиксирован: wm = 1.

Таблица 4.2 – Базовый рейтинг по типам пользователей

информационной среды

Тип пользователя Базовый рейтинг

модератор 1

автор 0.5

пользователь 0.2

Для разных типов контента предусмотрены различные шкалы

оценивания: цифровые шкалы [𝑘1, 𝑘𝑛], словесные оценки из множества

значений {��1, …, ��n}, флаг «Да»/«Нет» - пометка материала как

рекомендованного к перенесению в хранилище.

121

Каждому материалу сопоставлена матрица голосов пользователей,

общий вид которой представлен в таблице 4.3, где c – количество оценок из

диапазона [1,5] c весом из диапазона [0,1, 1].

Таблица 4.3 – Матрица оценок материала

Оценка k= 𝟏; 𝟓 Вес оценки 𝒘 = 𝟎, 𝟏; 𝟏

0.1 0.2 … 1

1 𝑐1𝑤1 𝑐1𝑤2 … 𝑐1𝑤10

2 𝑐2𝑤1 𝑐2𝑤2 … 𝑐2𝑤10

… … … … …

5 𝑐5𝑤1 𝑐5𝑤2 … 𝑐5𝑤10

4.2.2 Реализация предварительной обработки данных

Каждому материалу, хранящемуся в виртуальной среде, соответствует

m-мерный вектор параметров:

�� = < 𝑦1, 𝑦2, … 𝑦𝑚 > (4.4)

Из векторов �� формируется матрица размерности n×m параметров контента

Y = ||𝑦𝑖𝑗|| (𝑖 = 1; 𝑛 ; 𝑗 = 1; 𝑚 ) , (4.5)

где n – количество всех материалов;

m – количество параметров (таблица 4.4).

Таблица 4.4 – Матрица характеристик материалов

Материал

(𝒊 = 𝟏; 𝒏 )

Характеристика

материала

( 𝒋 = 𝟏; 𝒎 )

1 2 … m

1 𝑦11 𝑦12 … 𝑦13

2 𝑦21 𝑦22 … 𝑦23

… … … … …

n 𝑦𝑛1 𝑦𝑛2 … 𝑦𝑛𝑚

Входной вектор параметров �� содержит разнородные значения. Например,

рейтинг материала 𝑦𝑗1 ∈ [1; 5] оценивается по пятибалльной шкале, а количество

122

его просмотров за месяц 𝑦𝑗2 ∈ [0; +∞) теоретически не ограничено. Так как

подобный дисбаланс между значениями признаков делает работу модели вывода

неустойчивой, необходима корректировка матрицы. С помощью методов

предварительной обработки (масштабирования и нормализации) проводится

преобразование исходных данных к виду, удобному для последующего анализа.

Цель масштабирования – адаптировать диапазон значений переменной 𝑦𝑖 для

корректного расчета и достижения однородности интерпретации входных

параметров. Чтобы правильно подобрать масштаб, к которому приводится

матрица Y, необходимо определить нижнюю и верхнюю границы отрезка,

которому принадлежат значения 𝑦𝑖 . Нижнюю границу отрезка удобно принять

равной нулю, то есть вычесть из всех значений матрицы значение ее

минимального элемента 𝑦min:

∀𝑦 ∈ 𝑌: 𝑦 = 𝑦 − 𝑦min (4.6)

Верхняя граница отрезка значений определяется как медиана значений

элементов матрицы. Медиана M(Y) делит ранжированную совокупность

параметров на две равные части.

На этапе масштабирования определяется отрезок [0, M(Y)], после чего

проводится нормализация данных. После процедуры нормализации значения

параметров приводятся к одному диапазону:

∀ y* ∈ [y1, ym] → x* ∈ [x1, xm], (4.7)

где y*, x* - значения оценки до и после нормализации соответственно; x1=0;

xm = M(Y).

Каждое новое значение из вектора параметров материала высчитывается по

формуле

𝑥∗ = [𝑦∗

𝑦𝑛 − 𝑦1+1(𝑥𝑚 − 𝑥1 + 1) + 𝑥1 − 1] , (4.8)

что при установленных границах отрезка равносильно равенству:

𝑥∗ = [𝑦∗

𝑦𝑛 +1(𝑀(𝑌) + 1) − 1] . (4.9)

123

4.2.3 Архитектура системы интегрированной рейтинговой оценки

На вход нейроэволюционной системы подается вектор нормированных и

масштабированных значений ��. В ходе нейроэволюции была получена ИНС,

состоящая из входного, двух скрытых и одного выходного слоя:

– входной слой, предназначенный для перераспределения входных сигналов

по соответствующим нейронам скрытых слоев. Количество нейронов входного

слоя равно количеству входных сигналов;

– скрытые слои, в которых осуществляется обработка входного вектора. В

том числе, регрессионный слой состоит из нейронов, необходимых для расчета

выходного значения. Каждый из скрытых слоев имеет индивидуальное

количество нейронов;

– выходной слой, формирующий отклик нейросети. Состоит из 6-ти

нейронов.

Логическая схема виртуальной среды, в которую интегрирована СППР для

автоматической обработки контента, представлена на рисунке 4.6.

Рисунок 4.6 – Логическая схема виртуальной среды

124

Внедрение в виртуальную среду работы над проектами нейроэволюционной

СППР позволило автоматизировать обработку контента и повысить показатели

качества функционирования виртуальной среды [8] с счет следующих улучшений:

1. Реструктуризация портала. Корректная рубрикация, обработка

невостребованного контента, перенесение в хранилище контента, обладающего

необходимыми характеристиками, позволили оптимизировать состав и структуру

виртуальной среды.

2. Сокращение среднего времени поиска материалов, полученное за счет

автоматической рубрикации материалов и обновления архива.

3. Оптимизация закрытых частей портала (хранилища и архива). При

помощи СППР была изменена внутренняя структура хранилища материалов.

Автоматическое перенесение в архив невостребованных материалов позволило

существенно увеличить объем данных, размещаемых в виртуальной среде.

4. Автоматизация обработки контента, в том числе повышение

коэффициента использования вычислительных ресурсов за счет автоматизации

рутинных задач (сортировка материалов, управление контентом).

5. Улучшение показателей основной деятельности организации в результате

внедрения данной СППР: снижение загруженности высококвалифицированного

персонала, занятого обслуживанием виртуальной среды; сокращение сроков

обучения и упрощение работы сотрудников в виртуальной среде за счет высокого

уровня ее эргономических характеристик.

4.3 Система конструктивной модернизации деталей

3D-принтера

Принципиально новой областью применения систем поддержки принятия

решений является модификация конструкции деталей 3D-принтеров [107]. Далее

приведено решение практической задачи модернизации пластиковых элементов

конструкции 3D-принтеров, разрабатываемых в рамках проекта RepRap, с целью

125

улучшения таких показателей качества принтера как материалоемкость,

прочность и максимальная скорость печати.

Проект RepRap (Replicating Rapid Prototyper, самовоспроизводящийся

механизм для быстрого прототипирования) [111] был организован Британским

инженером Адрианом Боуером для конструирования и распространения

3D-принтеров с открытыми спецификациями и общедоступными наработками

[49]. Под самовоспроизведением понимается возможность изготовления на

принтере максимально возможного количества элементов его конструкции для

сборки точной копии. Печать трехмерных объектов осуществляется методом

послойной экструзии филамента (FFF, Fused Filament Fabrication),

подразумевающей нанесение последовательных слоев материала в соответствии с

контурами модели-прототипа. В качестве расходных материалов чаще всего

выступают такие термопластики как ABS (АБС, акрилонитрилбутадиенстирол),

PLA (полилактид), TPE (термопластичный эластомер), HIPS (полистирол). Реже

применяются дюропластики, силиконы и другие менее доступные конечному

пользователю материалы.

Процесс изготовления детали состоит из трех ключевых шагов: подготовка

3D-модели, слайсинг (преобразование модели в g-код для принтера) и печать.

Одной из наиболее эффективных моделей 3D-принтеров, разрабатываемых в

рамках проекта RepRap, является модель Prusa, представленная в нескольких

«поколениях». Классическая модификация Prusa i2 имеет форму треугольной

призмы и состоит приблизительно из 40 пластиковых деталей, количество

которых незначительно варьируется в зависимости от реализации.

Без учета электроники и шаговых электродвигателей в данной модели

используются следующие обще конструкционные детали: стандартные резьбовые

шпильки, подшипники, зубчатые ремни, крепеж. Рама принтера состоит из

резьбовых шпилек, для крепления которых используются печатаемые детали.

Не смотря на широкую популярность принтера Prusa, в настоящее время

большинство его деталей имеет существенные недостатки: неоправданно

126

высокую материалоемкость и недостаточную прочность. Таким образом, важным

направлением разработок данной модели 3D-принтера является

совершенствование печатаемых элементов его конструкции по двум данным

параметрам. В связи с этим существует необходимость в разработке

модернизированных деталей с улучшенными характеристиками.

В качестве инструмента моделирования релевантных конструктивных

решений применяется описанный в главе 2 нейроэволюционный метод.

Целесообразность использования нейроэволюции для модификации элементов

конструкции 3D-принтера обуславливается, во-первых, тем, что

нейроэволюционные методы демонстрируют высокие показатели качества в

системах оптимизации, оперирующих неполными, трудноформализуемыми и

неточными данными. Во-вторых, данные методы не требуют ресурсоемких

расчетов и описания физических характеристик оптимизируемой системы [2, 3].

Задача формулируется следующим образом. Максимизация прочности

детали при ограничениях на ее материалоемкость и отсутствии поддержки

(конструкции для предотвращения деформации во время печати стенок детали,

имеющих угол наклона более 70°):

{

𝐹 = 𝑣max → 𝑚𝑎𝑥𝐿𝑀𝑃 ≤ 𝐿𝑃

𝐿𝑆 = 0 , (4.10)

где 𝑣max – максимальная скорость печати периметров объекта с использованием

принтера, в конструкцию которого включена модифицируемая деталь;

𝐿𝑀𝑃 – материалоемкость модифицированной детали;

𝐿𝑃 – материалоемкость исходной детали;

𝐿𝑆 – материалоемкость поддержки.

Критериями для оценки качества модифицированных деталей являются

материалоемкость и прочность. Материалоемкость детали напрямую зависит от ее

объема. Она измеряется в метрах расходом на изготовление детали методом FFF

филамента заданного диаметра.

127

При прочих равных условиях прочность конструкции принтера зависит от

конфигурации деталей, используемых в качестве крепежных узлов. Основным

показателем качества детали является жесткость: чем выше жесткость, тем

меньшим деформациям подвергается конструкция принтера в процессе

эксплуатации. Как следствие, снижаются вибрации рамы и погрешности при

печати объектов. Таким образом, одним из общепринятых способов оценки

прочности детали является косвенная оценка через параметр 𝑣max.

Процесс нейроэволюционного поиска рациональной конфигурации детали

состоит из четырех основных этапов:

1. Подготовка трехмерной модели детали, о модификации которой было

принято решение. Конвертирование модели в представление, подходящее для

нейросетевой обработки [4].

2. Этап нейроэволюции. Создание ИНС, приспособленной для решения

задачи обработки пространственных объектов. На вход ИНС поступает вектор

значений, полученных путем конвертирования модели детали в пространственное

представление для нейросетевой обработки. На выходе ИНС формируется

модифицированное пространственное представление.

3. Этап конструктивной модификации детали: последовательная

активизация наиболее приспособленной ИНС пространственными

представлениями модифицируемых деталей и обработка сгенерированного ИНС

результата.

4. Постобработка и проверка качества детали. Приведение выходного

вектора ИНС к формату, пригодному для печати (экспорт результата в формат stl).

Проверка качества полученной детали и, при необходимости, распечатывание

методом FFF.

1. Подготовка 3D-моделей деталей. На данном этапе подготавливаются

3D-модели деталей в формате stl. Далее приведен процесс модификации трех

важных элементов принтера Prusa i2:

A. Скоба (крепление) мотора оси X (X-motor bracket).

128

B. Держатель направляющей оси X (X-end idler).

C. Скоба (крепление) мотора оси Z (Z-motor mount).

На рисунке 4.7 показано расположение деталей A, B и C в конструкции

принтера.

Детали A и B составляют две соединенные направляющими полуосновы оси

X, перемещающиеся на линейных подшипниках вдоль оси Z. Деталь A служат

для крепления мотора, деталь B – для крепления натяжного шкива. На детали A и

B приходятся основные вибрационные нагрузки при перемещении каретки с

экструдером. Детали C являются парными основаниями для крепления двух

синхронно работающих Z-моторов, отвечающих за вертикальное перемещение

экструдера.

Рисунок 4.7 – Конструктивные элементы принтера Prusa i2

Для конвертирования 3D-модели в представление для обработки

нейросетью необходимо выбрать подходящий вид модели пространственного

объекта. Представление детали должно корректно и с необходимой точностью

передавать ее структуру при невысоких затратах вычислительных ресурсов. Для

обоснования выбора представления следует привести краткий обзор

129

математических моделей трехмерных объектов. Он был составлен на основе

логически непротиворечивых признаков представления трехмерных объектов:

топологии, формы описания и степени описывающей объект функции. При

классификации трехмерных объектов по топологическим свойствам модели

подразделяются на точечные, твердотельные, полигональные и каркасные [96].

Точечная модель содержит информацию только о координатах объекта и

используется исключительно для задания месторасположения. В связи с этим в

качестве представления деталей для ИНС не рассматривается.

Твердотельная модель представляет объект в виде множества всех точек

объема, занимаемого им в пространстве. Она оперирует объектами как

сплошными телами. К недостаткам модели относятся высокое потребление

вычислительных ресурсов и отсутствие данных о топологии объекта, на

основании чего можно сделать вывод, что твердотельная модель также не

подходит для представления деталей.

Полигональная модель содержит информацию об объекте в виде

совокупности точек его поверхности без учета внутренних точек. Такая

полигональная сетка чаще других моделей применяется в компьютерной графике.

Иерархическое описание полигональной модели включает три списка, хранящих

соответственно вершины, ребра и полигоны трехмерного объекта. На нижнем

уровне иерархии находится список вершин V:

𝑉 = {𝑣1, … , 𝑣𝑖 , … , 𝑣𝑁} , (4.11)

где 𝑣𝑖 = (𝑥𝑖 , 𝑦𝑖 , 𝑧𝑖) − пространственные координаты вершины;

N – количество вершин объекта.

На среднем уровне иерархии хранится список ребер E:

𝐸 = {𝑒1, … , 𝑒𝑗 , … , 𝑒𝑀} , (4.12)

где 𝑒𝑗 = (𝑣𝑗1∗ , 𝑣𝑗2

∗ ) – пара указателей на вершины ребра;

M – количество ребер объекта.

На верхнем уровне иерархии содержится список полигонов P:

𝑃 = {𝑝1, … , 𝑝𝑘 , … , 𝑝𝑅} , (4.13)

130

где 𝑝𝑘 = (𝑒𝑘1∗ , … , 𝑒𝑘𝐿

∗ ) – множество ссылок на ребра полигона;

L – количество ребер (как правило L=3 или L=4);

R – количество полигонов, из которых состоит объект.

Полигональная модель сложных поверхностей требует большого числа

полигонов и поэтому довольно ресурсоемка. С целью увеличения скорости

обработки трехмерных объектов целесообразно использовать либо модификации

полигональной модели, либо каркасную модель.

Каркасная модель описывает объект как совокупность принадлежащих ему

вершин V (1) и ребер E (2) - дискретных конструктивных элементов каркаса. Как и

полигональная модель, она не учитывает внутренние точки объекта. В модели

также отсутствует информация о точках поверхности, лежащих между

элементами каркаса, поэтому каркасная модель обладает высокой скоростью

обработки. Ее существенным ограничением является отсутствие возможности

распознания криволинейных граней [72]. Но оно преодолевается упрощением

(например, представлением поверхности цилиндра в виде множества отрезков).

Помимо топологического представления на структуру и сложность моделей

также оказывает влияние вид примитивов. Возможности примитивов зависят от

степени описывающих их многочленов. На практике нашли применение модели, у

которых описания примитивов имеют нулевую, первую, вторую и реже - более

высокие степени.

Рецепторные модели характерны для описания точек. Они определяются

функциями нулевой степени для описания примитивов и требуют большого

объема вычислительных ресурсов. В каркасных моделях поверхности объектов

описываются отрезками, а в полигональных – участками плоскостей. В

твердотельных моделях примитивы представляют собой полупространства,

ограниченные плоскостями.

Форма описания объектов – это признак, по которому модели

классифицируются на табличные, аналитические и кусочно-аналитические. В

табличных моделях для описания объектов используются множества

131

пространственных координат. Аналитические модели описывают объекты с

помощью уравнений и применяются для объектов простой формы, например,

ограниченных поверхностями второго порядка.

Кусочно-аналитические модели сочетают аналитическую и логическую

формы описания. Помимо этого, существуют такие виды моделей как

кинематические поверхности, поверхности свертки, фрактальные поверхности.

Из-за высокой ресурсоемкости они обладают в основном теоретическим

интересом. Классификация моделей пространственных объектов представлена на

рисунке 4.8.

Рисунок 4.8 – Классификация моделей трехмерных объектов

Из приведенного анализа следует вывод о целесообразности использования

каркасной модели с табличной формой описания граней для обработки деталей

при помощи ИНС. Данная модель наиболее эффективна для быстрой обработки

сложных пространственных объектов и содержит всю необходимую информацию

об их топологии.

132

Для того, чтобы конвертировать в каркасное представление модель детали,

представленную в одном из форматов хранения трехмерных объектов

(Stereolithography .stl, Wavefront OBJ .obj, Autodesk FBX .fbx, 3D Studio .3ds и

другие), была использована программа-конвертер Mesh Converter. С ее помощью

модель преобразовывается в каркасное представление формата Ascii

Stereolithography (.stl) либо Stanford Poligon Library (.ply). На рисунке 4.9

представлено каркасное представление скобы мотора оси X и приведена

выдержка из файла, в текстовом виде содержащего информацию о вершинах и

ребрах модели.

Рисунок 4.9 – Каркасное представление скобы мотора оси X

После преобразования каждой из деталей в каркасное представление следует

этап нейроэволюции: подбирается наилучшая топология нейросети, задача

которой заключается в модификации конструкции детали.

2. Этап нейроэволюции. На данном этапе популяции нейросетей обучаются

модифицировать структуру деталей из обучающей выборки. Оценка

приспособленности в рассматриваемом случае применения метода подразумевает

133

оценку эффективности модификации детали. Функция приспособленности iF

вычисляется, в том числе, в зависимости от качества вывода нейросети 𝐸𝑖𝑡. 𝐸𝑖

𝑡

рассчитывается исходя из объема детали 𝐿𝑀𝑃 , количества материала 𝐿𝑆,

израсходованного на поддержку и ее прочности: 𝐸𝑖𝑡 =

1

𝐿𝑆+1+

𝜑

𝐿𝑀𝑃+1.

3. Этап конструктивной модификации. С помощью описанного метода

было сгенерировано поколение сетей, имеющих структурное сходство с сетями

Хопфилда [24]. При наличии множества обратных связей в процессе

функционирования динамика такой сети конвергирует к положению равновесия

[43], что позволяет использовать ИНС для решения задачи модификации

структуры детали. Положение равновесия достигается при условии равенства

текущего и предыдущего состояний ИНС, при этом начальное состояние

поступает на вход сети, а текущее является ее выходом. Далее рассмотрены

модификации, внесенные в конструкции деталей на этапе 3. На рисунке 4.10

изображена деталь A для закрепления мотора оси X до модификации, на рисунке

4.11 – после модификации.

Рисунок 4.10 – Скоба мотора оси X до модификации

134

Рисунок 4.11 – Скоба мотора оси X после модификации

Из рисунков 4.10 и 4.11 видны несколько характерных различий. В

частности, растяжки, связывающие вертикальные элементы детали, в целом стали

более тонкими, но более пространственно-распределенными. Фланец крепления

мотора приобрел сложную форму: в ненагруженных местах понизилась его

толщина без потери прочности.

На рисунках 4.12 и 4.13 изображена деталь B - держатель направляющей оси

X соответственно до модификации и после модификации.

Рисунок 4.12 – Держатель направляющей оси X до модификации

135

Рисунок 4.13 – Держатель направляющей оси X после модификации

В результате нейросетевого преобразования конструкции монолитная

пластина крепления шкива была заменена на ажурный фланец, скрепляемый

растяжками с основной конструкцией. Тем не менее, в связи со сложностью

процесса модификации данной детали, фаски на узле крепления линейных

подшипников сформированы не были. Данный незначительный недостаток может

быть преодолен повторным запуском алгоритма для держателя направляющей

оси X.

В данном случае модификация растяжки является менее ресурсоемкой, чем

модификация пластины крепления шкива, и из рисунка 4.13 видно, что не занятые

ресурсы были израсходованы на коррекцию формы элемента крепления

вертикальных подшипников. Тем не менее, в местах с наибольшей слабиной

алгоритм нейроэволюции сформировал ребра жесткости, перераспределив

материал с других частей детали (рисунок 4.12).

На рисунках 4.14 и 4.15 изображена деталь C для закрепления мотора оси Z

соответственно до модификации и после модификации.

136

Рисунок 4.14 – Скоба мотора оси Z до модификации

Рисунок 4.15 иллюстрирует, что скоба крепления мотора из монолитной

преобразована в ажурную. Для сохранения жесткости были сформированы две

дополнительные растяжки.

Рисунок 4.15 – Скоба мотора оси Z после модификации

Приведенные примеры показывают характерные особенности нейросетевой

модификации конструкции деталей:

– снижение материалоемкости деталей;

137

– сохранение, а в некоторых случаях - существенное повышение жесткости

деталей.

Побочным эффектом нейросетевой обработки является устранение

технологических надписей на деталях (рисунки 4.12 и 4.13), что также привело к

незначительному снижению материалоемкости. Расчет расхода филамента

осуществлялся программой-слайсером. При помощи полученной в результате

нейроэволюции ИНС были спроектированы модернизированные варианты для 11-

ти из 15-ти деталей принтера Prusa i2. Экономия филамента при их

распечатывании достигла 27% по сравнению с исходными образцами. Экономия

времени печати деталей достигла 15%.

4. Постобработка и проверка качества детали. Приведение выходного

вектора нейросети к формату, пригодному для печати (Binary Stereolithography

.stl), осуществлялось программой-конвертером. Затем модель проходила

преобразование из формата stl в g-код для 3D-принтера. После распечатывания с

теми же параметрами печати, что и у исходных образцов (заполнение типа

«honeycomb 50%» пластиком ABS), модифицированные детали были

использованы как элементы конструкции 3D-принтера. Для сравнительной

оценки жесткости деталей были проведены измерения максимальной скорости

печати периметров 𝑣max 3D-принтера в двух конфигурациях: до и после

модификации. В качестве тестового объекта для печати выступала эталонная

модель - полый куб 1см3 с толщиной стенки в один слой. При проведении серии

тестов скорость печати последовательно увеличивалась с шагом 1 мм/с. Значение

𝑣max – это наибольшее значение скорости печати, при которой:

1) Для трех последовательных запусков процесс печати завершается успешно

без отрыва детали от рабочей поверхности.

2) Не происходит проскальзывания в ременно-зубчатых передачах

3D-принтера.

3) Геометрические искажения детали не превышают 0.3 мм.

138

Очевидно, при прочих равных более жесткая конструкция позволяет печатать

с более высокой скоростью при соблюдении вышеуказанных критериев. В

оригинальной конструкции достигнутая скорость maxv составляет 105 мм/с, в

модернизированной конструкции – 123 мм/с. При последовательных заменах

деталей A, B и C скорость составляла соответственно 114, 121 и 123 мм/с.

Полученные данные о возрастании максимальной скорости при соответствующих

модификациях принтера отражены на рисунке 4.16.

Рисунок 4.16 – График изменения maxv при последовательном включении в

конструкцию принтера модифицированных деталей

Сводная информация о материалоемкости деталей до и после модификации,

о приращении скорости при последовательном включении в конструкцию

принтера модифицированных деталей и экономии филамента при их печати дана

в таблице 4.5.

Таблица 4.5 – Сравнение характеристик деталей до и после модификации

Деталь

Материалоемкость, м Экономия

филамента,

%

Приращение

скорости

печати, мм/с

Не модифициро-

ванной версии

Модифицированной

версии

A 4.224 4.103 2.8 9

B 3.965 3.382 3.382 7

C 2.209 1.674 24.2 2

139

Материалоемкость исходной детали A составляет 4.224 м, ее

модифицированной версии – 4.103 м, экономия филамента при этом

незначительна и достигает 2.8%. Несмотря на низкую экономию филамента,

нейросетевая модернизация конструкции данной детали позволила существенно

увеличить скорость 𝑣max (на 9 мм/с). Для печати детали B требуется 3.965 м

филамента, для печати ее модификации – 3.382 м. Cнижение материалоемкости

достигает 14.7%. Вклад детали B в увеличение скорости составляет 7 мм/с.

Материалоемкость исходной детали C составляет 2.209 м, ее модификации – 1.674

м, экономия филамента при этом весьма значительна и достигает 24.2%. Но так

как в процессе эксплуатации 3D-принтера данная деталь не испытывает

значительных нагрузок, ее вклад в увеличение скорости составляет 2 мм/с.

Предложенный нейроэволюционный метод подтвердил свою эффективность

при решении задачи рациональной модификации пластиковых элементов

конструкции 3D-принтера Prusa, имеющих такие недостатки как высокая

материалоемкость и низкая прочность: он позволил снизить материалоемкость

деталей в среднем на 27% и сократить время их изготовления на 15%. За 230

часов эксплуатации модернизированного таким образом принтера было отмечено

снижение вибраций и улучшение качества печатаемых изделий.

4.4 Выводы по четвертой главе

1. Модель нейроэволюционной СППР была внедрена в качестве системы

защиты корпоративного портала от DDoS-атак. Внедрение системы позволило

значительно снизить риск отказа сервера из-за DDoS-атак: система способна с

вероятностью 99.892% избежать ошибок первого и второго рода при

дифференциации легитимных пользователей и атакующих машин.

2. Модель нейроэволюционной СППР была внедрена в сервис

интегрированной оценки контента, размещаемого в виртуальной среде работы над

проектами. Расчет интегрированной рейтинговой оценки позволил

140

оптимизировать работу портала и упростил реализацию ряда функций, в том

числе: обработку не востребованного контента, перенесение в хранилище

контента, обладающего необходимыми характеристиками, поиск и ранжирование

материалов, накопление статистики для модификации состава информации на

портале.

3. Модель нейроэволюционной СППР была внедрена в качестве системы

конструктивной модернизации деталей 3D-принтера Prusa i2. Данная система

позволила снизить материалоемкость деталей в среднем на 27% и сократить

время их изготовления на 15%. За 230 часов эксплуатации модернизированного

данным методом принтера было отмечено снижение вибраций и улучшение

качества печатаемых изделий.

141

ЗАКЛЮЧЕНИЕ

Согласно поставленным в настоящей работе цели и задачам получены

основные результаты:

1. Исследована предметная область поддержки принятия решений

в условиях неопределенности. Проведен подробный анализ и классификация

известных нейроэволюционных методов, определены критерии их оценки,

выявлены их достоинства и недостатки.

2. С учетом анализа наиболее эффективных методов нейроэволюции

разработан формализованный метод для генерирования эффективных нейросетей

произвольной топологии, все параметры которых автоматически настраиваются в

соответствии с решаемой задачей. Предложенный метод лишен основных

недостатков, присущих большинству исследованных подходов: конкуренции

представлений, незащищенности инноваций, проблемы начального размера и

топологических инноваций, преждевременной сходимости и «паралича»

нейросети.

3. Разработаны алгоритмы глобальной и локальной оптимизации топологии

и параметров ИНС, которые, в отличие от большинства известных реализаций

генетического поиска, способны направлять нейроэволюцию как по пути

усложнения, так и по пути упрощения структуры особей, что позволяет

генерировать жизнеспособные нейросети за приемлемое время работы алгоритма.

4. Предложены унифицированные критерии оценки качества

нейроэволюционного метода для его применения к классу задач принятия

решений в условиях неопределенности.

5. Построена комплексная модель адаптивной системы поддержки

принятия решений, реализующая нейроэволюционную обработку данных в


142




7. Получены практические результаты, подтверждающие эффективность

разработанного метода, алгоритмов и модели. Доказана целесообразность их

применения для решения актуальных практических задач. Разработанная СППР

используется в Информационной системе НИФИ в интеллектуальных модулях

документооборота и защиты от DDoS-атак. Также в рамках проекта RepRap

впервые применена СППР для модификации конструкции деталей 3D-принтеров

Prusa i2.

143

СПИСОК СОКРАЩЕНИЙ И УСЛОВНЫХ ОБОЗНАЧЕНИЙ

АБС – акрилонитрилбутадиенстирол.

БД – база данных.

ГА – генетический алгоритм.

ГП – генетическое программирование.

ИИ – искусственный интеллект.

ИНС – искусственная нейронная сеть.

ЛПР – лицо, принимающее решения.

СППР –система поддержки принятия решений.

СУБД – система управления базами данных.

ЭА – эволюционные алгоритмы.

ЭМ – эволюционное моделирование.

ЭП – эволюционное программирование.

ЭС – эволюционные стратегии.

CE – Cellular Encoding, клеточное кодирование.

CI – Computational Intelligence, вычислительный интеллект.

CNE (Conventional NeuroEvolution) – метод стандартной нейроэволюции.

COGANN (Combinations of Genetic Algorithms and Neural Networks) –

комбинирование генетических алгоритмов и нейронных сетей.

DDoS (Distributed Denial of Service) – распределенная атака отказа в

обслуживании.

DXNN (Deus Ex Neural Network) – метод оптимизации нейронной сети.

EANT (Evolutionary Acquisition of Neural Topologies) – эволюционное

модифицирование топологий нейронных сетей.

ENS3 (Evolution of Neural Systems by Stochastic Synthesis) – эволюция

нейронных систем путем стохастического синтеза.

EPNet (Evolutionary Programming Network) – эволюционное

программирование нейросети.

144

ESP (Enforced SubPopulations) – усиленные субпопуляции.

FFF (Fused Filament Fabrication) – последовательное нанесение филамента.

GNARL (GeNeralized Acquisition of Recurrent Links) – обобщенное

наращивание рекуррентных связей.

ICONE (Interactively Constrained Neuro-Evolution) – динамическая

нейроэволюция с ограничениями.

JSON (JavaScript Object Notation) – текстовый формат для представления

иерархичных данных.

NEAT (Neuro-Evolution by Augmenting Topologies) – нейроэволюционный

метод расширения топологий.

NES (Novel Evolutions Strategy) – новая эволюционная стратегия.

NFL (No Free Lunch theorem) – теорема о бесплатных обедах.

PLA (Polylactic acid) – полилактид.

SANE (Symbiotic Adaptive Neuro-Evolution) – адаптивная симбиотическая

нейроэволюция.

TPE (Thermoplastic elastomer) – термопластичный эластомер.

TWEANN (Topology and Weight Evolving Artificial Neural Network) –

нейроэволюционная модификация топологии и весов нейросети.

145

СПИСОК ЛИТЕРАТУРЫ

1. Андрейчиков, А.В. Построение моделей и информационной технологии

принятия решений для управления интеллектуальными ресурсами в виде

патентов на изобретения / А.В. Андрейчиков, О.Н. Андрейчикова // Cloud of

Science. – 2015. – Т. 2. № 2. – С. 216-235.

2. Андрейчиков, А.В. Экспертная система для прогнозирования стратегических

инноваций / А.В. Андрейчиков, О.Н. Андрейчикова, А.А. Хорычев // Качество.

Инновации. Образование. – 2011. – № 12. – С. 26-36.

3. Андрейчикова, О.Н. Интеллектуальная система для синтеза сценариев / О.Н.

Андрейчикова // Интеллектуальные продукты и системы. – 2002. – №2. –

С. 4-8.

4. Блюмин, С.Л. Модели и методы принятия решений в условиях

неопределенности / С.Л. Блюмин, И.А. Шуйкова. – Липецк: ЛЭГИ, 2001. –

138 с.

5. Борисов, В.В. Нечеткие модели и сети. / В.В. Борисов, В.В. Круглов, А.С.

Федулов. – М.: Горячая линия – Телеком, 2007. – 284 c.

6. Брумштейн, Ю. М. Анализ моделей и методов выбора оптимальных

совокупностей решений для задач планирования в условиях ресурсных

ограничений и рисков / Ю. М. Брумштейн, Д. А. Тарков, И. А. Дюдиков //

Прикаспийский журнал: управление и высокие технологии. – 2013. – №3. –

С.169-180.

7. Горяшко, А.П. Робастная оптимизация, как новый подход к решению задач с

неопределенностью / А.П. Горяшко, Е.В. Никульчев // Известия высших

учебных заведений. Проблемы полиграфии и издательского дела. – 2011. –

№ 1. – С. 77-86.

8. Громов, С.А. Интегрированнные интеллектуальные системы оперативного

планирования производства / С.А. Громов, В.Б. Тарасов // Известия Южного

Федерального университета. Технические науки. – 2011. – № 7. – С. 60-67.

146

9. Джонс, М.Т. Программирование искусственного интеллекта в приложениях /

М.Т. Джонс, пер. с англ. Осипов А.И. – М.: ДМК Пресс. – 2011. – 312 с.

10. Дик, В.В. Развитие методов представления знаний в системах поддержки

принятия решений / В.В. Дик, А.И. Уринцов, И.В. Павлековская. – М.: Вольное

экономическое общество России, 2014. – № 186. – С. 463-470.

11. Дик, В.В. Системы поддержки принятия решений / В.В. Дик // М.: ЕАОИ,

2011. – 368 с.

12. Жиглявский, А. А. Методы поиска глобального экстремума / А. А.

Жиглявский, А. Г. Жилинскас. – М.: Наука, 1991. – 248 с.

13. Заенцев, И.В. Нейронные сети: основные модели: учебное пособие / И.В.

Заенцев. – Воронеж: Вестник ВГУ, 1999. – 78 с.

14. Запрягаев, С. А. Распознавание речевых сигналов / С.А. Запрягаев, А.Ю.

Коновалов // Вестник ВГУ. Серия: системный анализ и информационные

технологии. – 2009. – №2 – С. 39-48.

15. Зунг, Н.Т. Распознавание объектов в системе технического зрения мобильного

робота: использование библиотеки FLANN и алгоритма SURF / Н. Т. Зунг,

И.А. Щербатов // Прикаспийский журнал: управление и высокие технологии. –

2014. – №4. – С. 65-76.

16. Карманов, В. Г. Математическое программирование / В.Г. Карманов. – М.:

ФИЗМАТЛИТ, 2004. – 264 с.

17. Кини, P. Принятие решений при многих критериях: предпочтения и

замещения / Р.Л. Кини, X. Райфа. – М.: Радио и связь, 1981. – 560 с.

18. Козлов, В. Н. Системный анализ, оптимизация и принятие решений: учебное

пособие / В. Н. Козлов. – М.: Проспект, 2014. – 174 с.

19. Комлева, Н.В. Интеллектуальные технологии в совершенствовании научно–

исследовательской работы в системе научных институтов и центров финансового

сектора / Н. В. Комлева // Научно–исследовательский финансовый институт.

Финансовый журнал. – 2013. – №3. – С.145-150.

147

20. Комлева, Н.В. Образование на основе компетенций в открытых информационных

средах: алгоритмы принятия решений / Н.В. Комлева, А.П, Горяшко // Высшее

образование в России. – 2011. – №8-9. – С. 78-84.

21. Комлева, Н.В. Технологии сохранения и развития знаний / Н.В. Комлева // М.:

Совершенствование подготовки IT-специалистов по направлению «Прикладная

информатика». – 2014. – С. 74-80.

22. Котомин, А. В. Предобработка звукового сигнала в системе распознавания

речевых команд / А.В. Котомин. – Переславль-Залесский: Университет города

Переславля, XV Молодежная научно-практическая конференция наукоемкие

информационные технологии SIT – 2011, 2011. – С. 25-38.

23. Лахман, К.В. Механизмы кратковременной памяти в целенаправленном

поведении нейросетевых агентов / К.В. Лахман, М.С. Бурцев // Математическая

биология и биоинформатика. – 2013. – Т. 8. – № 2. – С. 419-431.

24. Лисьев, Г. А. Технологии поддержки принятия решений / Г. А. Лисьев, И. В.

Попова. – М.: ФЛИНТА, 2011. – 133 с.

25. Могилев, А.В. Технологии поиска и хранения информации. Технологии

автоматизации управления / А.В. Могилев, Л.В. Листрова. – СПб: БХВ–

Петербург, 2012. – 320 с.

26. Никульчев, Е.В. Моделирование систем с нелинейной динамикой на

основании экспериментальных данных / Е.В. Никульчев // Мехатроника,

автоматизация, управление. – 2006. – № 5. – С. 6-14.

27. Одинцов, Б.Е. О классификации знаний с позиций интеллектуализации

информационных систем / Б.Е. Одинцов, А.Н. Романов // Вестник финансового

университета. – 2013. – № 1(73). – С. 124-132.

28. Одинцов, Б.Е. Советующие информационные системы в экономике: учебное

пособие / Б.Е. Одинцов, А.Н. Романов. – М.: Юнити-ДАНА, 2000. –487 с.

29. Орлов, А. И. Принятие решений. Теория и методы разработки управленческих

решений: учебное пособие / А.И. Орлов. – М.: Март, 2004. – 656 с.

30. Розен, В.В. Математические модели принятия решений в экономике: учебное

148

пособие / В.В. Розен. – М.: Книжный дом Университет, 2002. – 288 с.

31. Рутковская, Д. Нейронные сети, генетические алгоритмы и нечеткие системы /

Д. Рутковская, М. Пилиньский, Л. Рутковский. – М.: Горячая Линия – Телеком,

2006. – 452 с.

32. Саати, Т.Л. Принятие решений при зависимостях и обратных связях.

Аналитические сети / Т.Л. Саати. – М.: ЛКИ, 2008. – 360 с.

33. Самарин, Ю.Н. Алгоритм оценки уровня сформированности компетенций

студентов, обучающихся по направлениям, связанным с информационными

технологиями / Ю.Н. Самарин, М.С. Тигина // Полиграфист. В помощь

руководителю и главному бухгалтеру (Россия). – 2014. – № 2. – С. 13-22.

34. Станкевич, Ф.В. Нейросетевое распознавание музыкальных инструментов с

использованием мел‑частотных кепстральных коэффициентов / Ф.В.

Станкевич, В.Г. Спицын // Фундаментальные исследования. – 2014. – № 12-1. –

С. 51-56.

35. Талалаев, А.А. Анализ эффективности применения искусственных нейронных

сетей для решения задач распознавания, сжатия и прогнозирования / А.А.

Талалаев [и др.] // Искусственный интеллект и принятие решений. – 2008. –

№ 2. – С. 24-33.

36. Тарасов, В. Б. Моделирование взаимодействия робота с внешней средой на

основе пространственных логик и распространения ограничений / В.Б.

Тарасов, А. П. Калуцкая // Программные продукты и системы. – 2010. – № 2. –

С. 174-178.

37. Тарасов, В.Б. Когнитивные измерения в интеллектуальных системах

мониторинга объектов железнодорожной инфраструктуры / В.Б. Тарасов, М.Н.

Святкина // Вестник РГУПС. – 2013. – № 4 (52). – С. 106-115.

38. Тарасов, В.Б. О механизмах понимания и интерпретации в интеллектуальных

системах / В.Б. Тарасов // Научная сессия НИЯУ МИФИ-2015. – 2015. – Т. 3. –

С.157.

149

39. Терелянский, П. В. Системы поддержки принятия решений. Опыт

проектирования: монография / П. В. Терелянский. – Волгоград: ВолгГТУ,

2009. – 127 с.

40. Фурман, Я.А. Комплекснозначные и гиперкомплексные системы в задачах

обработки многомерных сигналов / Я.А. Фурман [и др.]. – М.: ФИЗМАТЛИТ,

2004. – 452 с.

41. Хайкин, С. Нейронные сети: полный курс, 2-е издание / С. Хайкин, пер. с англ.

Н.Н. Куссуль. – М.: Вильямс, 2006. – 1104 с.

42. Хемди, А. Введение в исследование операций / А. Хемди, пер. с англ. В.И.

Тюпти. – М.: Вильямс, 2005. – 912 c.

43. Хлопкова, О.А. Интеллектуализация сервисов онлайн-обучения на базе

технологий COGANN. / О.А. Хлопкова // Материалы Всероссийской научно-

практической конференции «Математические методы и интеллектуальные

системы в экономике и образовании». Ижевск: Удмуртский государственный

университет, 2013. – С. 36-48.

44. Хлопкова, О.А. Интеллектуализация сервисов открытого образования / О.А.

Хлопкова, Н. В. Комлева // Открытое образование, 2015. – № 2. – С. 56-62.

45. Хлопкова, О.А. Нейроэволюционный метод интеллектуализации принятия

решений в условиях неопределенности / О.А. Хлопкова // Прикаспийский

журнал: управление и высокие технологии, 2015. – № 3(51). – С. 114-129.

46. Хлопкова, О.А. Нейроэволюционный подход к защите информационной

системы от DDoS-атак / О.А. Хлопкова // Материалы Всероссийской научно-

практической конференции «Теоретические и практические аспекты развития

научной мысли в современном мире». – Уфа: РИО МЦИИ Омега сайнс, 2015. –

С. 19-25.

47. Хлопкова, О.А. Нейроэволюционный подход к проектированию

неокогнитрона / О.А. Хлопкова // Материалы Всероссийской научно-

практической конференции «Ценности и интересы современного общества». –

М.: МЭСИ, 2015. – № 1. –С. 57-65.

150

48. Хлопкова, О.А. Обработка контента в информационных средах на основе

нейро-нечеткой модели принятия решений / О. А. Хлопкова, Н. В. Комлева //

Экономика, статистика и информатика. Вестник УМО. – 2013. – № 5. – С.

188-192.

49. Хлопкова, О.А. Оптимизация конструкции деталей 3D-принтера на базе

аппарата нейронных сетей и эволюционного моделирования / О.А. Хлопкова //

Известия высших учебных заведений. Проблемы полиграфии и издательского

дела. – 2015. – №5. – С. 53-63.

50. Хлопкова, О.А. Технология мягких вычислений в автоматизации обработки

данных на примере информационно-аналитической системы НИФИ Минфина

России / О.А. Хлопкова, Н.В. Комлева // Материалы Международной научно-

практической конференции «Ценности и интересы современного общества».

Часть 2. – М.: МЭСИ, 2013. –С. 90-95.

51. Чернодуб, А.Н. Обзор методов нейроуправления / А.Н. Чернодуб, Д.А. Дзюба

// Проблемы программирования. – 2011. – № 2. – С. 79 – 94.

52. Черноруцкий, И. Г. Методы принятия решений: учебное пособие / И. Г.

Черноруцкий. – СПб.: БХВ-Петербург, 2005. – 416 с.

53. Щербина, Ю.В. Проектирование систем автоматизации и управления методами

теории нечетких множеств / Ю.В. Щербина, К.В. Смыкова // Вестник МГУП

имени Ивана Федорова. – 2011. – №1. – С. 192-196.

54. Энгель, Е.А. Метод интеллектуальных вычислений для управления

конфигурацией манипуляционного робота / Е.А. Энгель // Вестник Северо-

Восточного федерального университета им. М.К. Аммосова. – 2015. – № 3 (47). –

С. 127-137.

55. Angeline, P. An Evolutionary Algorithm that Constructs Recurrent Neural

Networks / P. Angeline, G. Saunders, J. Pollack // IEEE Transactions on Neural

Networks and Learning Systems. – 1994. – Vol 5. – № 1. – pp. 27-54.

56. Arbib, M. A. The handbook of brain theory and neural networks / M. A. Arbib. –

Cambridge: The MIT Press, 2002. – 1309 p.

151

57. Ashlock, D. Evolutionary Computation for Modeling and Optimization / D.

Ashlock. – Guelph: Springer & Business Media, 2005. – 572 p.

58. Baeck, T. Evolutionary Algorithms in Theory and Practice / T. Baeck. – N.Y.:

Oxford University Press, 1996. – 328 p.

59. Baeck, T. Evolutionary Computation: An Overview / T. Baeck, H.-P. Schwefel //

Nagoya: Conference on Evolutionary Computation (ICEC 1996). – pp. 20-29.

60. Barnett, L. Evolutionary search on fitness landscapes with neural networks: PhD

thesis / L. Barnett. – Sussex: University of Sussex, 2003. – 199 p.

61. Beyer, H.-G. How to analyze evolutionary algorithms / H.-G. Beyer, H.-P.

Schwefel, I. Wegener // Theoretical Computer Science. – 2002. – № 1. – pp. 101-

130.

62. Bhanu, B. Evolutionary Synthesis of Pattern Recognition Systems / B. Bhanu, Y.

Lin, K. Krawiec. – N.Y.: Springer, 2005. – 314 p.

63. Bramer, M. Artificial Intelligence Applications and Innovations / M. Bramer,

V. Devedzic. – N.Y.: Kluwer, 2004. – 499 p.

64. Cardamone, L. Evolutionary Learning and Search–Based Content Generation in

Computer Games: PhD thesis / L. Cardamone. – Milano: Politecnico di Milano,

2012. – 199 p.

65. Chen, X. Multi–Facet Survey on Memetic Computation / X. Chen, Y.S. Ong //

IEEE Transactions on Evolutionary Computation. – 2011. – № 5. – pp. 591-607.

66. Clune, J. On the performance of indirect encoding across the continuum of

regularity / J. Clune, K. O. Stanley // IEEE Transactions on Evolutionary

Computation. – 2011. – pp. 5–27.

67. De Jong, K. A. Generation gaps revisited / K.A. De Jong, J. Sarma // Whitley:

Foundations of Genetic Algorithms. – 1993. – № 2. – pp. 19-28.

68. Deb, K. Self–adaptive genetic algorithms with simulated binary crossover / K. Deb,

H.-G. Beyer // Evolutionary Computation. – Vol 9. – № 2. – 2001. – pp. 197-221.

69. Dolson, E. Applying neural pruning to NEAT / E. Dolson, D. Park // Lansing:

Adaptive Robotics Spring 2012. – 2012. – pp. 305-322.

152

70. Floreano, D. Neuroevolution: from architectures to learning / D. Floreano, P. Durr,

C. Mattiussi // Evolutionary Intelligence. – 2008. – Vol 1. – № 1. – pp. 47-62.

71. Forsyth, D. Computer Vision: A Modern Approach / D. Forsyth, J. Ponce. – New

Jersey: Prentice Hall. – 2002. – 720 p.

72. Fulcher, J. Advances in applied artificial intelligence / J. Fulcher. – Hershey: Idea

Group Publishing, 2006. – 309 p.

73. Gauci, S. Generating Large–Scale Neural Networks Through Discovering

Geometric Regularities / S. Gauci // N.Y.: Proceedings of the Genetic and

Evolutionary Computation Conference (GECCO–2007), 2007. – 18 p.

74. Gomez, F. Efficient Non–Linear Control through Neuroevolution / F. Gomez, J.

Schmidhuber, R. Miikkulainen // Berlin: Proceedings of the European Conference on

Machine Learning, 2006. – pp. 654-662.

75. Gomez, J. Solving non–markovian control tasks with neuroevolution / J. Gomez, R.

Miikkulainen // SanFrancisco: Proc. of the International Joint Conference on

Artificial Intelligence, 1999. – pp. 1356-1361.

76. Gomez, J. Self adaptation of operator rates in evolutionary algorithms / J. Gomez //

Washington: Proc. of Genetic and Evolutionary Computation Conference 2004

(GECCO 2004), 2004. – pp. 1162-1173.

77. Gruau, F. A Comparison between Cellular Encoding and Direct Encoding for

Genetic Neural Networks / F. Gruau, D. Whitley, L. Pyeatt // San Francisco:

Proceedings of the First Annual Conference, 1996. – pp. 81-89.

78. Hausknecht, M. Neuroevolution Approach to General Atari Game Playing / M.

Hausknecht, J. Lehman // Nottingham: Computational Intelligence and AI in Games,

IEEE, 2014. – № 4. – pp. 355-366.

79. Hinterding, R. Adaptation in evolutionary computation: A survey / R. Hinterding, Z.

Michalewicz, A. Eiben // Indianapolis: Proc. of the 4th IEEE International

Conference on Evolutionary Computation, 1997. – pp. 65-69.

153

80. Hinterding, R. Gaussian mutation and self–adaptation in numeric genetic algorithms

/ R. Hinterding // Cambridge: IEEE Press: IEEE International Conference on

Evolutionary Computation, 1995. – pp. 384-389.

81. Hofland, M. Combining Manual Training and Enforced Sub–Populations to Control

Forest Fires: Master thesis / M. Hofland. – Utrecht: Utrecht University, 2007. –

163 p.

82. Holland, J.H. Building blocks, cohort genetic algorithms and hyperplane–defined

functions / J.H. Holland // Massachusetts: Massachusetts Institute of Technology:

Evolutionary computation. – 2000. – № 4. – pp. 373-391.

83. Igel, C. Evolutionary optimization of neural systems: The use of strategy adaptation

/ C. Igel, S. Wiegand, F. Friedrichs // Bochnm: Birkhäuser Basel, Trends and

Applications in Constructive Approximation. International Series of Numerical

Mathematics, 2005 – 23 p.

84. Igel, C. Neuroevolution for reinforcement learning using evolution strategies / C.

Igel // Bochum: Proc. of Congress on Evolutionary Computation (CEC 2003), 2003.

– pp. 2588-2595.

85. James, D. A comparative analysis of simplification and complexification in the

evolution of neural network topologies / D. James, P. Tucker // Genetic and

Evolutionary Computation Conference (GECCO–2004), 2004. – pp. 441-459.

86. Janghel, R.R. Breast cancer diagnostic system using Symbiotic Adaptive Neuro–

evolution / R.R. Janghel, A. Shukla, R. Tiwari, R. Kala // Paris: Soft Computing and

Pattern Recognition. – 2010. – pp. 326-329.

87. Jorgensen, T. D. Pruning artificial neural networks using neural complexity

measures / T. D. Jorgensen, B. P. Haynes, C. Norlund // International journal of

neural systems. – 2008. – Vol 18. – № 5. – pp. 389-403.

88. Karkavitsas, G. Automatic Music Genre Classification Using Hybrid Genetic

Algorithms // G. Karkavitsas, G. Tsihrintzis // Intelligent Interactive Multimedia

Systems and Services, 2011 – 335 p.

154

89. Kassahun, Y. Efficient reinforcement learning through evolutionary acquisition of

neural topologies / Y. Kassahun, G. Sommer // 13th European Symposium on

Artificial Neural Networks, 2005. – pp. 259-266.

90. Kenneth, O. Evolving Neural Networks through Augmenting Topologies / O.

Kenneth, R. Miikkulainen // Evolutionary Computation, 2002. – Vol 10. – № 2. – pp.

99-127.

91. Khlopkova, O.A. Application of combinations of genetic algorithms and neural

networks in online learning services / O.A. Khlopkova // 5th International Scientific

Conference Science and Society. – London: SCIEURO, 2013. – pp. 78-83.

92. Kita, H. A comparison study of self–adaptation in evolution strategies and real–

coded genetic algorithms / H.A. Kita // Evolutionary Computation, 2000. – Vol 9. –

№ 2. – pp. 223-241.

93. Kitano, H. Designing neural network using genetic algorithm with graph generation

system / H. Kitano // Pittsburgh: Complex Systems. – 1990. – № 4. – pp. 461-476.

94. Komleva, N. Development of business models of open education based on new

intellect technologies / N. Komleva, N. Tikhomirova // Zermatt: The EADTU's annual

conference 2010, Proceedings of Strategies and Business Models for Lifelong

Learning/Networking Conference, 2010. – pp. 409-415.

95. Koza, J. Genetic programming: a paradigm for genetically breeding computer

population of computer programs to solve problems / J. Koza. – Cambridge: MIT

Press, 1992. – 315 p.

96. Liles, W. Introduction to Schema Theory: a survey lecture of pessimistic & exact

schema theory / W/ Liles, P. Wiegand. – Virginia: George Mason University EC lab

Activities, 2002 – 114 p.

97. Lubberts, A. Co–evolving a go–playing neural network / A. Lubberts, R.

Miikkulainen // San Francisco: Process of Coevolution: Turning Adaptive

Algorithms upon Themselves, Birds–of–a–Feather Workshop, Genetic and

Evolutionary Computation Conference (GECCO–2001), 2001. – pp. 14-19.

155

98. Luger, G. F. Artificial intelligence: structures and strategies for complex problem

solving. Reading / G.F. Luger. – Wesley: Pearson, 1998. – 824 p.

99. Maniezzo, V. Genetic evolution of the topology and weight distribution of neural

networks / V. Maniezzo // Transactions of on Neural Networks. – 1994. – Vol 5. –

№ 1. – pp. 39-53.

100. Mohammadian, M. Computational Intelligence in Control / M. Mohammadian, R.

A. Sarker, X.Yao. – Hershey: Idea Group Inc, 2003. – 346 p.

101. Moriarty, D. Forming neural networks through efficient and adaptive coevolution /

D. Moriarty, R. Miikkulainen // Evolutionary Computation, 1997. – № 5. – pp.

373-399.

102. Nguyen, T. C. Evolvable 3D modeling for model–based object recognition

systems / T.C. Nguyen, T.S. Huang, K. Kinnear // Cambridge: Advances in Genetic

Programming. – 1994. – pp. 459-475.

103. Nixon, M. Feature Extraction and Image Processing / M. Nixon, A. Aguado. –

Oxford: Newnes, 2002. – 350 p.

104. Pal, S. Foundations of soft case– based reasoning / S. Pal, S. Shiu. – New Jersey:

John Wiley & Sons, 2004. – 300 p.

105. Pasemann, F. Balancing rotators with evolved neurocontroller / F. Pasemann, U.

Dieckmann. – Leipzig: Max–Planck–Institute for Mathematic in Sciences, 1997 –

pp. 36-43.

106. Pasemann, F. Evolving Structure and Function of Neurocontrollers / F.

Pasemann, U. Steinmetz, U. Dieckmann // Washington: CEC 99: Proceedings of the

1999 Congress on Evolutionary Computation, 1999. – pp. 22-29.

107. Perez–Bergquist, A. S. Applying ESP and region specialists to neuroevolution for

go: Technical Report CSTR01–24 / A.S. Perez–Bergquist. – Austin: The University

of Texas at Austin, 2001. – 274 p.

108. Rabunal, J.R. Artificial neural networks in real–life applications / J. R. Rabunal, J.

Dorrado // Hershey: Idea Group Publishing, 2005. – 375 p.

156

109. Rempis, C. W. An Interactively Constrained Neuro–Evolution Approach for

Behavior Control of Complex Robots / C. W. Rempis, F. Pasemann // Osnabruck:

Springer. – 2012. – pp. 305-41.

110. Rempis, C. W. Evolving Complex Neuro–Controllers with Interactively

Constrained Neuro–Evolution : PhD thesis / C.W. Rempis. – Osnabruck: Osnabruck

University, 2012. – 240 p.

111. Riessen, G.A. PEPNet: parallel evolutionary programming for constructing

artificial neural networks / G. A. Riessen, G. J. Williams, X. Yao // Berlin: 6th

International Conference on Evolutionary Programming, 1997. – pp. 35-45.

112. Risi, S. An Enhanced Hypercube–Based Encoding for Evolving the Placement,

Density and Connectivity of Neurons / S. Risi, K. O. Stanley // Journal Cambridge

MA. – 2012. – pp. 32- 54.

113. Rudolph, G. Self–adaptive mutations may lead to premature convergence / G.

Rudolph // IEEE Transactions on Evolutionary Computation, 2001. – Vol 5. – № 4.

– pp. 410-414.

114. Sher, G. I. Evolving Chart Pattern Sensitive Neural Network Based Forex Trading

Agents / G. I. Sher // Neural and Evolutionary Computing, Computational

Engineering, Finance, and Science. – 2011. – pp. 47-68.

115. Sher, G. I. Handbook of Neuroevolution Through Erlang / G.I. Sher. – N.Y.:

Springer, 2013. – 851 p.

116. Siebel, N. T. Creating Edge Detectors by Evolutionary Reinforcement Learning /

N. T. Siebel, S. Grünewald, G. Sommer // Hong Kong: IEEE Congress on

Evolutionary Computation, 2008. – pp. 3552-3559.

117. Siebel, N.T. Evolutionary reinforcement learning of artificial neural networks /

N.T. Siebel, G. Sommer // International Journal of Hybrid Intelligent Systems. –

2007. – Vol 4. – № 3. – pp. 171-183.

118. Stanley, K. O. Evolving neural networks through augmenting topologies / K.O.

Stanley, R. Miikkulainen // Evolutionary Computation, 2002. – Vol 10. – № 2. – pp.

99-127.

157

119. Thierens, D. Non–redundant genetic coding for neural networks / D. Thierens //

Utrecht: International Conference on Evolutionary Computation, 1996. – pp.

571-575.

120. Valsalam, V. Constructing good learners using evolved pattern generators / V.

Valsalam, J. Bednar, R. Miikkulainen. // Washington: Genetic and Evolutionary

Computation Conference (GECCO), 2005. – pp. 189-203.

121. Wang, J. Computational intelligence in manufacturing handbook / J. Wang, A.

Kusiak // Boca Raton: CRC Press LLC. – 2001. – 560 p.

122. Whitley, D. Cellular Encoding Applied to Neurocontrol / D. Whitley, F. Gruau, L.

Pyeatt // San Francisco: Sixth International Conference on Genetic Algorithms,

1995. – pp. 460-469.

123. Wong, M.L. Data mining using grammar based genetic programming and

applications / M.L. Wong, K.S. Leung // N.Y.: Kluwer Academic Publishers. – Vol

3. – 2002. – 228 p.

124. Yamamichi, T. Synthesis of binary cellular automata based on binary neural

networks / T. Yamamichi, T. Saito // Tokyo: International Joint Conference on

Neural Networks, 2005. – Vol 3. – pp. 1361-1365.

125. Yao, X. volving artificial neural networks / X. Yao // Tokyo: Proceedings of the

IEEE, 1999. – Vol 87. – № 9. – pp. 1423-1447.

126. Yong, C. H. Cooperative coevolution of multi–agent systems: Technical Report

AI01 / C. H. Yong, R. Miikkulainen. – Austin: The University of Texas at Austin,

2000. – 287 p.

127. Yu, T. Online population size adjusting using noise and substructural

measurements: Illigal Report № 2005017 / T. Yu, K. Sastry, D. E. Goldberg. –

Chicago: The University of Illinois, 2005. – 176 p.

oлопкова hльга ндреевна МЕТОДЫ И АЛГОРИТМЫ...

Documents