Конференция по программным решениям hpe 2016

Post on 13-Apr-2017

426 Views

Category:

Data & Analytics

5 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Конференция по программным решениям HPE

14 апреля 2016 г.

Стратегия HPEАндрей КутуковДиректор департамента программных решений HPE в России

14 Апреля, 2016

Партнерство

Приверженность действию

Инновации

Новый стиль бизнеса на основе ИТ

Трансформацияв гибридную

инфраструктуру

Продуктивность

Защитацифровых активов

Решенияна основе данныхпредприятия

7Устройств на человека используемых ежедневно к 2020 г.

Enterprise Agile и DevOps Цифровая революция

Меняющийся мир доставки приложенийПотребность в методологии DevOps

7

30-кратное

увеличение релизовприложений

42 %предприятийавтоматизируют мобильные развертывания

46%организаций, использующихagile

78%Считают 2 месяца на внедрениеслишком долгим

1триллионприложенийк 2020 г.

100миллиардов подключенныхустройствв 2020 г.

89%Считают 2 месяца на доставку обновленияслишком долгим

37%организаций размещаютприложенияна внешниххостингах

50%нового кодабудет облачным

Новый стиль ИТ

Новая реальность ИТ

ИТ как сервис

Повышение гибкости

Фокус на создании инновационных

продуктов

Мобильность и новая модель

потребления

Короткий жизненный цикл

Традиционное ИТ

Фокус на стабильность и непрерывность

Стандартные приложения и потребление

Длинный жизненный цикл

Снижение затрат

Gartner называет это

«Bimodal IT»

Продуктивность

Защитацифровых активов

Решенияна основе данных предприятия

Трансформацияв гибридную

инфраструктуру• Service broker

• Automation

• Agile and DevOps

• Hybrid infrastructure

Cпасибо!

10

Автоматизированные ИТ-услуги как необходимая составляющая современного бизнесаКонстантин ВасильевТехнический консультантSoftware EMEA

14 Апреля, 2016

Какие тренды мы видим сегодня и почему это важно

Быть быстрее Быть эффективнее Быть дешевле

Время

КоличествоУскорить

предоставление новых услуг

Сегодня

2020

Время

Количество

запросов от

бизнесаВремя отклика

Количество

Облака или

внешние

провайдеры

Собственные ИТ

Время

Количество

Три шага на пути трансформацииАвтоматизируйте, «оркестрируйте», трансформируйте

13

Традиционные

ИТ

Цифровое

предприятие

Трансформируйте

предоставление

услуг

«Оркестрируйте»

процессы»

Автоматизируйте

задачи

Программа:

• Автоматизация процесса перевода транспортного сервиса между географически

распределенными площадками, Шибаев Александр, Заместитель директора

Межрегионального центра обработки информации Банка России

• Автоматизация сервисов: быстрее, надежнее и дешевле. Пример банка Societe

Generale, Франция, Васильев Константин, технический консультант, HPE в EMEA

• Тестовые среды как услуга: создание и сопровождение, Шубин Александр, архитектор

решений, компания Техносерв

• Дискуссия

Автоматизированные ИТ-услуги как необходимая составляющая современного бизнеса

Спасибо!

15

Автоматизация процесса перевода транспортного сервиса между географически распределенными площадками Александр Шибаев,Заместитель директора Межрегионального центра обработки информации Банка России

14 Апреля, 2016

Транспортная система электронных расчетов

ТСЭР предназначена для

предоставления услуг гарантированной

передачи электронных сообщений

между участникам электронного

обмена

в платежной системе Банка России

Модель ТСЭР

Региональные

узлы

Узлы расчетных

систем

Центральный узел

Клиенты

Банка России

Шлюз

Расчетные системы

Банка России

ШлюзШлюз

Информационно-аналитические

системы Банка РоссииТ

СЭ

Р

Каталог сервисов ТСЭР

Каталог сервисов ТСЭР:• одноадресная доставка электронных сообщений (ЭС);

• рассылка ЭС по списку/многоадресная рассылка;

• логическая маршрутизация ЭС на основании адреса прикладного служебного SOAP-конверта

• On-line контроль прохождения сообщений

• ведение оперативной базы ЭС с возможностью повторной отправки (время жизни ЭС воперативной базе – 48 часов);

• ведение базы данных с информацией о переданных ЭС и результатах их обработки наузлах ТСЭР (время хранения информации об ЭС в архивной базе – в течение 3-х лет);

• криптографическая защита ЭС, передаваемых по каналам ТСЭР

Подключение клиентов

Банка России

осуществляется через

отдельные АПК СВК ТУ,

функционирующих во всех

ГУ/Отделениях Банка

РоссииКО

КО

КЦОИ МР

КЦОИ-1

ЦОиР БЭСП

. . .

ТСЭР

82 СВК ТУ

КО

КО

. . .

.

.

.. . .

.

.

.

Расчетные центры

ТУз ТУ1

ТУз ТУN

СВК ТУN

СВК ТУ1

ЦОС СПФС

ЦС1

ЦС3

ЦС2

Структурная схема взаимодействия программных комплексов через ТСЭР

ЦТУ ТСЭР – сложная структура

АРМ АДМ ЦТУ ТСЭР

(СУ ТСЭР)

Cisco MDS9124

рез. (ЛВС СХД)

Накопитель ленточный

IBM TotalStorage Tape 3100

Управляющая станция HMC

Cisco MDS9124

осн. (ЛВС СХД)

Eth1 (осн)

Eth2 (рез)

System p5

АРМ АДМ ТСЭР

(СУ ТСЭР)

FC1_1

FC1_2

FC2_1

FC2_2

p5

АРМ АДМ ЦТУ ТСЭР

(СУ ТСЭР)

упр (осн)

ЦС1_2 (AIX)

Cisco MDS9124

рез. (ЛВС СХД)

Eth1-Eth4 (осн)

объект 1

p5

Управляющая станция HMC

ЦС1_1 (AIX) Cisco MDS9124

осн. (ЛВС СХД)

МТБС МР

HBA2 (рез) – 4 шт

HBA1 (осн)– 4 штEth5-Eth8 (рез)

Cisco Catalyst

3750 осн.

(ЛВС СХД)Eth1 (осн)

Eth2 (рез)

System p5

System p5

АРМ АДМ ТСЭР

(СУ ТСЭР)

FC1_1

FC1_2

FC2_1

FC2_2

СХ 1 (осн)IBM TotalStorage DS3950

System p5

объект 2ЦТУ ТСЭР (ЦС1)

ГУ БР по Нижегородской области

System p5

TotalStorageDS4100

1 2 3 4 5 6 7 8 9 10 11 12 13 14

System p5

Eth1 (осн)

Eth2 (рез)

Eth1 (осн)

Eth2 (рез)

Eth2 (рез)

Eth1 (осн)

Eth2 (рез)

Eth1 (осн)

SSPC

Накопитель ленточный

IBM TotalStorage Tape 3100

КЛМ

IBM DataPower XI50

КЛМ

IBM DataPower XI50

Eth1-Eth4 (осн)

Eth5-Eth8 (рез)

Eth1-Eth2 (осн)

Eth3-Eth4 (рез)

Eth1-Eth2 (осн)

Eth3-Eth4 (рез)

КС ПТС

ЦТУ ТСЭР и ТУз

КЦОИ-1/БЭСП

HBA2 (рез) – 4 шт

HBA2 (осн) – 4 шт HBA (осн) – 2 шт

HBA (рез) – 2 шт

HBA (рез) – 2 шт

HBA (осн) – 2 шт

HBA1

p5

HBA2

HBA (рез) – 2 шт

HBA (осн) – 2 шт

SVC1

SVC2

Eth2 (рез)

Eth1 (осн)HBA (осн) – 2 шт

HBA (рез) – 2 шт

SSPC

HBA1

HBA2

p5

SVC1

HBA (осн) – 2 шт

HBA (рез) – 2 шт

SVC2

HBA (осн) – 2 шт

HBA (рез) – 2 шт

Eth1 (осн)

Eth2 (рез)

ЦС2_1 (AIX)

ЦС2_2 (AIX)

Cisco Catalyst

3750 рез.

(ЛВС СХД)

Cisco Catalyst

3750 осн.

(ЛВС СХД)

Cisco Catalyst

3750 рез.

(ЛВС СХД)

ТЕЛЕКОМ

TotalStorageDS4100

1 2 3 4 5 6 7 8 9 10 11 12 13 14

упр (осн)Eth1 (осн)

Eth2 (рез)

СХ (рез)IBM Storwize V7000

FC2_2

FC2_1

TotalStorageDS4100

1 2 3 4 5 6 7 8 9 10 11 12 13 14

FC1_2

FC1_1

СХ (рез)IBM Storwize V7000

Eth2 (рез)

Eth1 (осн)

FC2_2

FC2_1

FC1_2

FC1_1

СХ 2 (осн)IBM TotalStorage DS3950

TotalStorage DS4100

1234567891011121314

TotalStorage DS4100

1234567891011121314

ЦС3

ЦТУ ТСЭР (ЦС2)

КС ПТС

СУ ТСЭР предназначена для автоматизации процедур управления и контроля

состояния Транспортной системой электронных расчетов Банка России (ТСЭР).

Задачи СУ ТСЭР:

• Автоматизация деятельности эксплуатирующего персонала по контролю и

управлению ТСЭР;

• Обеспечение оперативного обнаружения, диагностирования и устранения

нештатных ситуаций при эксплуатации ТСЭР в целом и отдельных ее подсистем;

• Обеспечение централизованного управления ресурсами ТСЭР;

• Автоматизация контроля состояния и эффективности функционирования ТСЭР;

• Контроль процесса доставки сообщений

• Предоставление информации о работе ТСЭР внешним системам

Система управления ТСЭР (СУ ТСЭР)

Одна из задач СУ ТСЭР – автоматизация эксплуатации

• Автоматизация процесса перевода функционирования транспортного сервиса на резервную площадку при возникновении сбоев для обеспечения непрерывности бизнес-процессов и быстрого восстановления их работоспособности

• Формулировка из ТЗ:

• Подсистема автоматизации процедуры перевода обработки ЭС между центральными серверами ЦТУ ТСЭР должна обеспечить автоматизацию процедуры перевода обработки ЭС между центральными серверами ЦТУ ТСЭР. При этом должно быть обеспечено:

• Минимизация неконтролируемого участия эксплуатирующего ТСЭР персонала в процедуре перевода обработки ЭС между центральными серверами ЦТУ ТСЭР;

• Визуализация хода выполнения данной автоматизируемой процедуры

Основные работы

Анализ и формализация существующего процесса

Выбор программной платформы для автоматизации перевода обработки – HPE Operations Orchestration

Реализация - создана специализированная подсистема СУ ТСЭР

Предоставлять сервис – значит контролировать время на всех этапах

Чтобы нести ответственностьза качество предоставляемогосервиса, необходимо егоконтролировать.

ПК УОС КЦОИ

ТСЭР

ЕТКБС

SLA

SLA

Мониторинг доставки ЭС

– Входная точка обработки – СВК

– Конечная точка обработки – Транспортный узел КЦОИ

КБРСервер доступа

СВК

Серверавторизации

ПСВА

Сегмент управления ЛВС

МСЭ

МСЭ с сенсором

атак

ПМ СВКСеть администраторов

ТУз ТСЭР

ЛВС ДМЗ WMQ

ЦТУ ТУз КЦОИ/БЭСПКЦОИ /

ЦОиР БЭСП/СПФС

WMQ

Агент ПМДЭС

ТШ

WebSphere MQ

BizTalkEventLog

ТСЭР

Серверный комплекс

БД

Агент ПМДЭС

WMQ

АПКШ«Континент»

АПКШ«Континент»

WMQ Over VPN

WMQ

АПКШ«Континент»

АПКШ«Континент»

WMQ Over VPN

WMQ

Агент ПМДЭС

Агент ПМДЭС

ТСЭР

КБР

ПМДЭС

Системы Банка России

Контроль транзакций

Новая консоль

ЦТУ

ТУз ТУ (КЦОИ 1)

ТУз КЦОИ МР

ТУз КЦОИ 1

.

.

.

ТУз ПБР

ТУз ПБР

ТУз МЦОИ

.

.

.

ТУз ПБР

.

.

.

ТУз ПБР

ТУз ТУ (КЦОИ МР)

.

.

.

ТУз ПБР

.

.

.

ЦС3 (Н. Новгород)

Тушино Нудоль

ТУз ЦА,

ГУ ЦФО

ЦС1 (Тушино)

ЦС2 (Нудоль)

ТУз КЦОИ МР

Передача электронных сообщений

При выходе из строя

центрального сервера

ЦТУ...

... второй ЦС

принимает на себя все

функции вышедшего

из строя

Подсистема автоматизации процедуры перевода обработки ЭС между центральными серверами ЦТУ ТСЭР (ПАПО)

ПАПО решает следующиезадачи:

– Автоматизация критичных процедур;

– Визуализация хода выполненияавтоматизируемой процедуры;

– Автоматизация отслеживания ошибокпри выполнении процедуры;

– Автоматизация диагностированияошибок;

– Автоматизация устранения ошибок.

Достигнутые цели:• За счет автоматизации большого количества

рутинных операций при переводе обработки ЭСмежду центральными серверами ЦТУ ТСЭРпринципиально уменьшено время переводаобработки;

• За счет снижения влияния человеческогофактора при большом количестве рутинныхопераций резко снизились риски потери сервисаТСЭР для части ТУ;

• Снизились требования к квалификацииперсонала – перевод проводит оператор.

Архитектура ПАПО

– Созданы операционные потоки которые

включили в себя действия

администраторов в процессе перевода

обработки ЭС между ЦС ТСЭР с учетом

возможных вариантов

– Оператор в едином интерфейсе может

выполнить перевод в режиме достаточно

простого интерактивного интерфейса

Схема процесса

Консоль администратора ПАПО

Остановка RDF на CTU01

Подготовка RDF На ЦС2

Настройка RDF на ЦС2

Запуск RDF на ЦС2

Стоп менеджера

CTU01 на ЦС1

Настройка RDF

Старт менеджера

CTU01 на ЦС2

Переключение и сброс

счетчиков каналов в

ТУ и КЦОИ-22

Сброс счетчиков и

старт каналов менеджера

CTU01 на ЦС2

Stopmq1_1.ttl

Rdf.html

stoprdf1.ttl

newrdf1_2.ttl

newrdf2_2.ttl

startrdf2.ttl

prestart1r.ttl

\\MZ.TO.CTU02\

!switch.bat

\\CTU01\

reset.bat ' +

m_CTU01R \\

CTU01\start.bat '

+ m_CTU01R

RDF Скрипты

Диаграмма перехода CTU01 на ЦС2

Описание шагов процедуры перевода обработки1. Определение текущего состояния

HP OO опрашивает серверы и сетевые устройства (по протоколам telnet, ssh), функционирующие на каждой из географически распределенных площадок и

выводит полученную информацию дежурному инженеру в диалоговом окне. На основании данной информации дежурный инженер принимает решение о том,

на какую площадку необходимо осуществить перевод функционирования сервиса в случае сбоя.

2. Остановка обработчиков на устройстве IBM DataPower

Процесс HP OO останавливает обработчики на устройстве IBM DataPower, размещенном на площадке, с которой осуществляется перевод. В случае

недоступности устройства – дежурному инженеру предоставляется возможность повторить или пропустить этот шаг процесса.

Перевод ресурсных групп кластера на резервную площадку:

3. Остановка ресурсных групп кластера

Останавливаются ресурсные группы кластера на площадке, с которой осуществляется перевод. *)

4. Перенаправление репликации

Выполняется перенаправление репликации между дисковыми массивами, размещенными на площадках. *)

5. Запуск ресурсных групп кластера

Ресурсные группы кластера запускаются на резервной площадке. *)

6. Запуск обработчиков на устройстве IBM DataPower

Процесс HP OO запускает обработчики на устройстве IBM DataPower, размещенном на резервной площадке, на которую осуществляется перевод. *)

7. Переключение каналов WebSphere MQ

Запускаются скрипты, выполняющие соответствующие изменения в каналах WebSphere MQ, необходимые для возобновления взаимодействия с сервисом,

функционирование которого было переведено на резервную площадку.

8. Завершение - вывод журнала процесса перевода в диалоговом окне

После завершения всех шагов процесса – дежурному инженеру в диалоговом окне выводится подробный отчет, содержащий информацию обо всех

выполненных командах на устройствах и о результатах их выполнения.

*) В случае недоступности серверов, к которым происходит обращение на данном шаге – дежурному инженеру предоставляется возможность пропустить этот

шаг, повторить или остановить процесс перевода (выбор действия необходим для возможности продолжения процесса перевода, даже в случае сбоя

компонентов, расположенных на площадке, на которую осуществляется переход).

ЦТУ

ТУз ТУ (КЦОИ2)

ТУз КЦОИ МР

ТУз КЦОИ2

.

.

.

ТС УБР

ТС УБР

СТС МР

.

.

.

ТС УБР

.

.

.ТУз КЦОИ1

ТС УБР

ТУз ТУ (КЦОИ1)

.

.

.

ТС УБР

.

.

.

ЦС3 (Н. Новгород)

Тушино Нудоль

ТС ЦА,

МГТУ

ЦС1 (Тушино)

ЦС2 (Нудоль)

ТУз КЦОИ МР

Схема планового перевода обработки электронных сообщений

• Перевод

осуществляется

администратором

ТСЭР без

привлечения ТУ

• Контур репликации

между ЦС1 и ЦС2

сохраняется

Результат

• Оперативность процедуры перевода на резервную площадку была значительно повышена: процесс перевода занимает около 5 минут вместо 30 и более до использования HPE OO;

• За счет автоматизации процедуры перевода и связывания воедино решаемых задач требования к квалификации задействованного в переводе персонала снижены;

• За счет автоматизации рутинных операций уменьшено влияние человеческого фактора;

• Визуализация процесса и повышение качества обслуживания инфраструктуры;

• Автоматизация обработки ошибок с фиксацией и контролем результатов, возможность пошагового выполнения перевода.

Спасибо

Техносерв

Автоматизация процессов управленияОпыт построения систем автоматизации для сред тестирования на базе программных продуктов HPE

Александр Шубин, архитектор решений, Техносерв

14 Апреля, 2016

Техносерв

Предпосылки – почему необходима автоматизация?

38

Техносерв

При внесении изменений классическим способом от 3 до 6 месяцев

При внесении изменений в бизнес за 1 день

39

Предпосылки – почему необходима автоматизация?

Возможность

определена

Возможность

реализована

Сбор

бенефитовTime to

market - 6

месяцев

t t

Возможность определена

и реализована

Сбор

бенефитов

Конкурент

реализовал

возможность

Техносерв

Дешевле подготовка и поддержка

Сокращение затрат на ИТ

Бизнес и эксплуатация

Техносерв

БизнесЭкономия

Повысить

управляемость

ИТ

Сокращение time-to-marketСкорость

Больше времени на новые продукты

Меньшие требования к квалификации

Уменьшение TCO

Сократить количество

рутины

Уменьшить количество

ошибок

Эффективность

использования

4

Техносерв

Бизнес-кейс системы управления тестовыми средами

41

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

До автоматизации ТС После внедрения автоматизации ТС

После внедрение автоматизации и

управление ЖЦ ТС

19%

1% 1%

81% 81%

56%

0%

18%

43%

Сто

им

ость

вл

ад

ен

ия

Затраты на инфраструктуру ТС

Стоимость вычислительных ресурсов при развертывании

Стоимость вычислительных ресурсов при тестировании

Экономия на стоимости вычислительных ресурсов

Техносерв

Процесс создания тестового контура раньше

Техносерв

Планирование

Регистрация заявки

Создание Тестирование

Согласование Подготовка Создание среды

Согласование:

• Почта

• Телефон

• Система заявок

Доступность:

• Инфраструктуры

• исполнителей

Ресурсы предоставлены

Ресурсы предоставлены, но не используются

Удаление

Выполнение

задач• Сеть

• СХД

• Данные

• Создание серверов

• Установка ППО

• Загрузка данныхФактическое начало тестирования

Тестирование окончено

Ресурсы все еще не освобождены

6

Техносерв

Процесс создания тестового контура сейчас

Техносерв

Планирование

Регистрация заявки

Создание Тестирование

ЗаявкаСоздание

средыРесурсы предоставлены

Ресурсы предоставлены

Автоматизированное:

• Создание серверов

• Установка ППО

• Подготовка и загрузка данных

Ресурсы

освобождены

Тестирование окончено

Доступность ресурсов

контролируется системой

Выполнение задач

Простота

Сокращение

времени

Сокращение

времениБольше времени на тестирование

7

Техносерв

Проект по созданию системы управления тестовыми средами

44

Техносерв

Использование системы управления тестовыми средами

Продуктивная

инфраструктура

Тестовая

инфраструктура

GOLD копия

продуктивной

среды

Платформа

управления

тестовыми

средами

Портал управления

тестовой инфраструктурой

Подсистема

обезличивания и

управления

тестовыми данными

ИТ системы

● ITSM

● Учет дефектов

● Деплоймент и

контроль версий

● Инвентаризация

● Мониторинг

Сотрудники ИТРуководитель Пользователь

9

Техносерв

Архитектура решения

46

Портал TE-Cloud

HP CSA

Управление заявками

Автоматизация сценариев развертывания ТСАвтоматизация операций изменения и

сопровождения ТС

АСУТС

Служба эксплуатации

тестовых сред

Управление АСУТСУправление ресурсами

Заказчики тестовых сред

X86 (Вирт.инфр.) IBM PowerOracle SPARC СХД

Инфраструктура тестовых сред

Подача заявки на создание/изменение ТСКонтроль статуса заявки

Планирование и управление ТС и ресурсамиКонтроль и управление операциями

Используются продукты Техносерв

Используются продукты HPE Data Center Automation

Техносерв

Функциональные возможности 1/4

Управление заявками на создание и изменение тестовых сред:

– Регистрация заявок

– Планирование работ на основе шаблонов

– Согласование заявок, выявление и анализ ресурсных конфликтов

– Контроль исполнения работ

– Интеграция с существующими системами ITSM

Техносерв

Используются продукты Техносерв

11

Техносерв

Функциональные возможности 2/4

Управление инфраструктурными ресурсами:

– Информация о доступных ресурсах

– Плановая загрузка в целом и по каждой тестовой среде

– Контроль фактического использования ресурсов

– Выявление ресурсных конфликтов

– Интеграция с существующими источниками информации (мониторинга, управления, оповещения…)

Техносерв

Используются продукты Техносерв

12

Техносерв

Функциональные возможности 3/4

Автоматизация операций:

– Развертывание и настройка серверов с установленными ОС, системным ПО и СУБД

– Настройка SAN и LAN

– Установка и настройка middleware и прикладного ПО

– Интеграция компонентов в единую тестовую среду

– Интеграция тестовой среды с другими системами

– Изменение конфигурации тестовых сред

Техносерв

Автоматизированные сценарии HPE Operations Orchestration

Используются продукты HPE Data Center Automation

13

Техносерв

Функциональные возможности 4/4

Управление загрузкой персонала:

– Уровень загрузки персонала

– Структура загрузки по задачам, тестовым средам

– Контроль плановой и фактической загрузки персонала

Техносерв

Используются продукты Техносерв

14

Техносерв

Результаты проекта

51

Техносерв

Итоговые показатели

45% сокращениепотребления инфраструктурных ресурсов

65% в среднем уменьшение времени на создание тестовых сред

70% сокращение трудозатрат на создание тестовых сред

52

Спасибо!

Техносерв

DevOpsНовые реалии –новая скоростьАндрей КосыгинВедущий архитектор решений

14 Апреля, 2016

Что такое DevOps

55

Сдвиг приоритетов бизнеса требует DevOps

Единая команда !

- Единые цели

- Единые задачи

- Единая ответственность

Test

Dev QA

Dev Ops

Dev

QAИтераци

и Agile 0 1 2 3 4

Dev +Test Ops

До DevOps После DevOps

Dev OpsTest

Prod

Prod

- это подход, который позволяет

подразделениям разработки,

тестирования и эксплуатации

реализовывать текущие

требования бизнеса по

постоянному выпуску ПО и

сервисов путем организации

взаимодействия этих групп

Составляющие DevOps

58

Люди

Требует постоянных усилий

•Совместные усилия

•Это не продукт или должность

•Нет универсальных рецептов

•Нет единого источника

Процессы Технологии

DevOps Continuous Everything

Найдена

проблема. RFC

создан

Код изменен,

развернут и

оттестирован

Билд передан в

тестирование,

развернут и

оттестирован

Билд

согласован и

развернут в

продуктиве

Continuous Everything

Изменение

спланировано и

согласовано

Билд передан в

препродуктив,

развернут и

оттестирован

Continuous Assessment

ST – PRDV – QA

Непрерывная интеграция и тестированиеНепрерывный выпуск и

внедрение

Непрерывная доставка

Непрерывная

эксплуатацияНепрерывная оценка

Плани-рова-ние

СборкаРазра-ботка

Специ-фика-ция

Тести-рова-ние

Развер-тывание

(ST, PR)

Тести-рова-ние

Развер-тывание(Dev, QA)

Эксплу-атация

Выпуск

Пр

оц

есс

Ре

ше

ни

яH

PE

So

ftw

are

3P

To

ols

/

Op

en

So

urc

e

HPE SW DevOps технологический обзор

Continuous Assessment

ST – PRDV – QA

Непрерывная интеграция и тестирование Непрерывный выпуск и внедрение

Непрерывная доставка

Непрерывная

эксплуатацияНепрерывная оценка

AGM ALM/ALI SM/UCMDB

UFT NA/SA

OO/ SiteScope

SM Sitescope UCMDB

Fortify (SCA)

Fortify WebInspect AppView AppDefender

HPE hellion Development Platform (HDP)

Git*

* Used in Build Phase for Get Code

TFS*

Subversion*

VS

Eclipse

MS WDT

MS Build

Maven

SSH

vCenter

Chef

Nexus

Jenkins

SSH

vCenter

Chef

Nexus

Big Data (ITBA)

CODAR/CSA ALM/PC

UFT

SA NV

OO UFT

CODAR/CSA ALM/PC

OO UFT

SA NV

ALM SV

PPM NV

Current Release

Planned

3P Supported

Legend

Плани-рова-ние

СборкаРазра-ботка

Специ-фика-ция

Тести-рова-ние

Развер-тывание

(ST, PR)

Тести-рова-ние

Развер-тывание(Dev, QA)

Эксплу-атация

Выпуск

Решения в области DevOps

61

Решения и услуги HPE SWS

Услуги по внедрению

• Уникальная методика

внедрения DevOps,

основанная на продуктах

НРE и других решениях

• Услуги по оценке,

тестированию,

интеграции,

развертыванию и

предоставлению

Семинары

• Семинары преобразования

(Transformation Experience

Workshop)

• Семинары разработки

решения (Solution Discovery

Workshops)

• Составление планов

развития

• Оценка зрелости

Процессы и лучшие

практики

• Экспертиза, IP и

методология, основанная

на лучших практиках НРE

• Управление

организационными

изменениями

• Solution Management

Services

• on Premise, Hosted,

Remote

Услуги по управлению

Continuous Assessment

ST – PRDV – QA

Непрерывная интеграция и тестирование Непрерывный выпуск и внедрение

Непрерывная доставка

Непрерывная

эксплуатацияНепрерывная оценка

Непрерывная оценка Непрерывная интеграция

Создание

проекта и

заданий

Создание

кейсов

Создание

CI и RFC

AGM SM/ UCMDBPPM

Написание

кода

Сохране-

ние кода

Сборка

кода

Оценка

безопас-

ности

кода

Выбор

кейсов в

IDE

FortifyGitEclipse Nexus

Jenkins

Непрерывное тестирование Непрерывный выпуск

Уничтоже-

ние среды

Функцио-

нальное

тестиров

ание

Разверты-

вание

среды QA

Chef

CODAR

ALM/PC/SV

UFT CODAR

Chef

Уничтоже-

ние среды

Разверты-

вание на

PRD

Chef

Jenkins

OO/SACODAR

Chef

Обновле-

ние CI,

закрытие

RFC

SM UCMDB

Функцио-

нальное

тестиров

ание

Разверты-

вание

среды STG

Chef

CODAR

ALM/PC/VC

UFT

Непрерывное внедрение

ALM/ALI

Оценка

безопас-

ности

кода

Fortify

Пример интегрированой среды, реализующей концепцию DevOps

Плани-рова-ние

СборкаРазра-ботка

Специ-фика-ция

Тести-рова-ние

Развер-тывание

(ST, PR)

Тести-рова-ние

Развер-тывание(Dev, QA)

Эксплу-атация

Выпуск

Continuous Assessment

ST – PRDV – QA

Непрерывная интеграция и тестирование Непрерывный выпуск и внедрение

Непрерывная доставка

Непрерывная

эксплуатацияНепрерывная оценка

Непрерывная интеграция

Написание

кода

Сохране-

ние кода

Создание

контей-

нера DEV

Выбор

кейсов в

IDE

ALM/ALI

GitEclipse Maven

Удаление

контей-

нера DEV

Сохране-

ние

образа

DEV

ALM/PC/SV

UFT Docker

Пример интегрированой среды, реализующей концепцию DevOps, и Docker

Тестиро-

вание

контей-

нера DEV

Nexus

Docker

Jenkins

Docker

Непрерывное тестирование

Создание

контей-

нера QA

Удаление

контей-

нера QA

Сохране-

ние

образа

QA

ALM/PC/SV

UFT Docker

Тестиро-

вание

контей-

нера QA

Nexus

DockerDocker

Непрерывный выпуск

Создание

контей-

нера STG

Удаление

контей-

нера STG

Сохранен

ие

образа

STG

ALM/PC/SV

UFT Docker

Тестиров

ание

контей-

нера STG

Nexus

Docker

Jenkins

Docker

Создание

контей-

нера

PRD

Обновле-

ние CI,

закрытие

RFC

SM UCMDB

Непрерывное внедрение

Docker

Плани-рова-ние

СборкаРазра-ботка

Специ-фика-ция

Тести-рова-ние

Развер-тывание

(ST, PR)

Тести-рова-ние

Развер-тывание(Dev, QA)

Эксплу-атация

Выпуск

Cпасибо!

Андрей Косыгин – andrey.kosygin@hpe.com

65

Управление ИТ-активами

Александр Павловтехнический консультант

14 Апреля, 2016

Вызов и основные драйверы

Максимизация экономической эффективности ИТ подразделения• Расчет стоимости владения ИТ услугой/системой• Биллинг услуг и разнесение общих затрат по потребителям• Оптимизация и управление лицензионным парком• Применение лучших практик в вопросе управления активами• Актуальная отчетность

Расчет стоимости владения ИТ услугой/системой

Учёт виртуальных сред

Биллинг услуг и разнесение общих затрат по потребителям

Оптимизация ПО

Консолидация лицензий ПО

Оптимизация поддержки ПО

Обновления лучших практик

Актуальная отчетность

Использование мастеров для настройки

Спасибо за внимание!

14 Апреля, 2016

Опыт внедрения процесса управления программными активами в Райффайзенбанке

Максим Качёлкин, руководитель, вице-президентГруппы централизованного контроля систем и сервисов

АО «Райффайзенбанк»

является дочерним банком Райффайзен Банк Интернациональ АГ

работает в России с 1996 года и оказывает полный спектр услуг

частным и корпоративным клиентам

входит в состав системно значимых кредитных организаций

на логотипе Райффайзенбанка изображены две перекрещенные

лошадиные головы. Этот символ использовался западноевропейскими

народами с давних времён. Люди прикрепляли этот знак к фронтонам

своих домов, чтобы уберечь семьи от зла и несчастий. В некоторых

отдалённых деревнях Европы традиция до сих пор жива

Software Asset Management (SAM) как решение

Задача проекта: обеспечить непрерывный контроль за лицензиями внедрив процесс

управления программными активами и средства его автоматизации, модифицировать

существующие процессы для предоставления необходимой информации.

ISO/IEC19770-1

Information Technology -

Software Asset Management

Full ISO/IEC SAM Conformance

Achieving best-in-class strategic SAM

Operational Integration

Improving efficiency and effectiveness

Practical Management

Improving management controls & driving immediate benefits

Trustworthy Data

Knowing what you have so you can manage it

Контроль лицензионного

соответствия требует

огромной ручной работы

Процесс управления

закупками ПО

неэффективен

Риск приобретения

избыточных лицензий и

необоснованных трат

Техническая архитектура и процесс SAM

Oracle iProcurement

DataBase Server

HP Asset Manager 9.5

DB on MS SQL 2012

Application Server

HP Asset Manager 9.50

Web-Tier

ODBC

SAP Business Object Enterprise

Citrix Receiver

HP Asset Manager

Windows-client

HP Asset Manager

Web-client

HTTP/HTTPS

Integration Server

HP Automated

Process

Manager

ODBC

Oracle iP

rocu

remen

t Integratio

nH

P C

on

nect-IT Scen

ario

Map

pin

g Ru

lesA

MC

on

necto

rD

atabase

Co

nn

ector

ODBC

ODBC

Atlassian

JIRA

Integratio

nH

P C

on

nect-IT Scen

ario

Map

pin

g Ru

lesA

MC

on

necto

rD

atabase

Co

nn

ector

ODBC

ДИ

Ц «

Тур

бо

9 М

акс

» Integratio

nH

P C

on

nect-IT Scen

ario

Map

pin

g Ru

lesA

MC

on

necto

rD

atabase

Co

nn

ector

MS SC

CM

Integratio

nH

P C

on

nect-IT Scen

ario

Map

pin

g Ru

lesA

MC

on

necto

rSC

CM

C

on

necto

r

Wyse D

esktop

Man

ager Integratio

nH

P C

on

nect-IT Scen

ario

Map

pin

g Ru

lesA

MC

on

necto

rD

atabase

Co

nn

ector

ODBC

OD

BC ODBC

JIRA-ConfluenceIBM Lotus Domino

Mail Server

ODBC

Turbo Accountant

ODBC

Wyse Desktop Manger

ODBC

MS SCCM

ODBC

AM Push-adapter

HP

UC

MD

BSC

CM

Federatio

n ad

apter

UD

for O

LMS

Microsoft ForefrontIdentity Manager

FIMExtensible-connector

OracleInstances

Citrix

HP Asset Manager

Windows-clientODBC

SMTP

HP Asset Manager 9.50

Web-service

Web UI

Web UI

BigFix Server

ILMT Server

BigFix agent on

server with IBM

Software

UD Inventory

Scanner

Результаты проекта

HP Asset Manger внедрён как средство автоматизации SAM и интегрирован с

существующими системами банка

Запущен процесс SAM и люди осваиваются в новых для себя ролях

Сотрудники ИТ освободились от ручной работы по учёту лицензий и

переключились на творческие задачи

Планирование будущих расходов на лицензии и поддержку стало прозрачным для ИТ и бизнес-заказчиков

Мы можем эффективно управлять имеющимся пулом лицензий в условиях

динамично изменяющегося бизнеса (повторное использование, оптимизация)

Риск использования нелицензионного ПО поставлен под непрерывный

автоматический контроль

Спасибо за внимание!

ТСО проектов и задач в Банк ВТБ (ПАО)Владислав Плетнев, руководитель службы поддержки систем отчетности и рисков

14 Апреля, 2016

Группа ВТБВедущая международная финансовая группа российского происхождения

Группа ВТБ — это банк ВТБ, его дочерние (доля ВТБ — более 50% голосующих акций/долей) кредитные и финансовые организации

Обладает уникальной для российских банков международной сетью, которая насчитывает более 30 банков и финансовых компаний более чем в 20 странах мира

Предоставляет своим клиентам комплексное обслуживание в странах СНГ, Европы, Азии и Африки

На российском банковском рынке группа ВТБ занимает второе место по всем основным показателям

85

AnyCorp

Программа проектов по управлению ИТ-активами

– Последовательно реализуется в банке с 2012 г.

– Каждая фаза нацелена на получение конкретных

результатов и длится не более 6 месяцев

– Постепенно наращивается функциональный охват и

охват учитываемых элементов

– Основные цели:

1. Получение точной и достоверной информации об ИТ-активах на

протяжении всего жизненного цикла из единой точки в любой

момент времени

2. Определение совокупной стоимости владения ИТ-активами,

программно-аппаратными комплексами, задачами, проектами и

ИТ-услугами банка

– Средство автоматизации: HP Asset Manager 9.x

Фаза 1Цели:

Формирование единого информационного пространства в рамках жизненного

цикла ИТ-активов

Учет ИТ-активов в качестве ресурсов проектов и объектов договоров

Отслеживание затрат ДИТ в соответствии со статьями бюджета

Накопление статистических данных по ИТ-активам для принятия

управленческих решений

Охват учитываемых элементов:

Серверы, АРМ

Фаза 2Цели (расширение функционального охвата):

Учет балансовой стоимости и срока амортизации ИТ-активов

Отслеживание ТСО ИТ-активов и проектов ДИТ

Расширение охвата учитываемых элементов

Виртуальные серверы, Сетевое оборудование, Лицензии ПО

Фаза 3Цели (расширение функционального охвата):

Отслеживание ТСО комплексов (СХД), задач и ИТ-услуг Банка

Оценка эффективности использования лицензий (организация необходимых

процедур SAM)

Расширение охвата учитываемых элементов

СХД, Диски, Экземпляры ПО

AnyCorp

Учет и распределение затрат, методика расчета ТСО

– Разработана политика учета и распределения затрат,

методика расчета ТСО

– Политика и методика согласованы с финансовым

департаментом банка

– Политика описывает виды затрат, единицы учета,

область применения, правила расчета и

автоматической генерации строк затрат и т.д.

– Разработана система связей с финансовым влиянием

между ИТ-активами (финансово-ресурсная модель) в

контексте программно-аппаратных комплексов, задач

и проектов банка

AnyCorp

Финансово-ресурсная модель для задач и направлений банка

AnyCorp

Учет ИТ-активов в качестве ресурсов задач (ФРМ)

AnyCorp

Финансово-ресурсная модель для проектов банка

AnyCorp

Учет ИТ-активов в качестве ресурсов проектов

AnyCorp

Текущее состояние бюджета проекта

AnyCorp

Информация по связанным с проектом договорам

AnyCorp

Единое информационное пространство

Спасибо за внимание!

95

14 апреля 2016 г.

Мониторинг как ИТ-искусствоЯков Керанчук, архитектор решений НРЕ

Цель #1 – обеспечение потребностей бизнеса

Связывание производительности бизнеса и

ИТ

Предсказание проблем

Автоматизация задач и процессов

Рост прибыли

Исключительный сервис для клиентов

Улучшенная эффективность, гибкость и качество

“Перед руководителями Операционного управления ИТ стоит задача показать, как услуги, которые они предоставляют, связаны с ценностями бизнеса и двигают

организацию вперед.”1

1- Gartner group Special Report – 24th September 2014

Основные требования

• Умение разбираться в большом объеме

информации, быстро находить корень проблемы

• «Чувствовать и понимать пользователя»

• Оперативно разрешать проблемы, прикладывая

минимум усилий

• Уметь четко и ясно выразить свою мысль

Навыки успешной работы

98

Текущие тренды

• Big Data

• Визуализация

• Управление производительностью приложений

• Автоматизация

Сбор данныхвсего в реальном времени

• Обнаружение проблем

прежде чем они затронут

сервис

• Корреляция по времени,

топологии и др.

• Расчет шаблонов

поведения и корневых

причин

Анализдля прогнозирования и решения

• Автоматизация

масштабирования

систем

• Ускорение

выполнения задач

• Автоматизация

процессов

Адаптацияточная и быстрая

Универсальный подход

• Заказчики, бизнес и

ИТ

• Реальные

пользователи

• Транзакции

Strategic Outcomes

Sustained Benefits

Rapid ROI Benefits

Quick Value Benefits

Модель зрелости

Возм

ожности

Время/зрелость

Базовый Продвинутый Зрелый

Stage 1

Stage 2

Stage 3

Stage 4

Stage 5Stage 1 Stage 2 Stage 3 Stage 4 Stage 5Реактивный Прикладной Управляемый Проактивный Предиктивный1 2 3 4 5

Actions

Network Management

Systems Management

Event Management

Network Management

Systems Management

Event Management (Correlated)

Configuration Management

Application Performance Mgmt

Service Modeling

Integrated Process

Automation

Service Level Management

Capacity Management

Service Analytics

Analy

tics &

Auto

mation

Network Management

Systems Management

Event Management (Correlated)

Configuration Management

Application Performance Mgmt

Service Modeling

Process Automation

Active

Auto

mation

Network Management

Systems Management

Event Management (Consolidated)

Configuration Management

Application Performance Mgmt

Passiv

e A

uto

mation

Network Management

Systems Management

Event Management (Correlated)

Configuration Management

Application Performance Mgmt

Service Modeling

Integrated Process

Automation

Service Level Management

Capacity Management

Service Analytics

Lig

hts

Out

IT

УнификацияСтандартизация Предсказание

Мониторинг сервисов «сверху-вниз»

Управление доступностью и производительностью приложений

Мониторинг ОС / инфраструктуры

Мониторинг СУБД / серверов приложений

Мониторингинфраструктурного ПО

ARIBA ORACLE SIEBEL

SAP BroadVision PeopleSoft BlackBerry

ORACLEMS SQL

ServerInformix DB2

Internet Info

Server 3.0Portal

MS Exchange

ServerLotus

IBM Check Point TIBCOInternet Security

Systems

webMethods Apache SOAP Sun

MQSeries

Family

MS Windows HP IBM Solaris Linux

3D IMAX

Experience

Управление производительностью приложений

• Мобильные, облачные и

инфраструктурные решения

• Мощные аналитические возможности

и средства диагностики

• Широкое покрытие программных сред

“Мы можем определить проблему за 1-2

часа до того как она повлияет на

производодительность приложения”Raphael Aquino, Sentara Healthcare

База данных конфигурационных элементов

– Автоматическое обнаружение и представление взаимосвязей объектов управления (КЕ) от сетевого до прикладного уровня (С-Р Модель)

Серверные платформыHP-UX Solaris

Бизнес сервис

Системы хранения данных

Сеть

Клиенты

Почта

Unix LinuxWindows

Уровень управления услугами

104

Автоматизация

105

Продвинутая аналитика ИТ HAVEn

Продвинутая аналитика ИТ - прогнозирование HAVEn

Продвинутая аналитика ИТ - корреляция HAVEn

Визуализация

Визуализация

Спасибо!Спасибо за внимание!

Централизованная

система мониторинга

ИС ПАО МТС

Департамент оперативного мониторинга ИСНачальник ОИТО Константин Ризен

14.04.2016

113

Тезисы о мониторингеМониторинг — непрерывный процесс наблюдения и регистрации параметров объекта, в сравнении с заданными критериями.Цель - выявление возможных не штатных ситуаций в работе ИС до момента возможных аварий.Задачи – контроль и предупреждение, оперативное реагирование и устранение, анализ, донастройка мониторингаСистема мониторинга – представляет собой интеграционное решение, позволяющее контролировать доступность и качество функционирования бизнес-процессов, сервисов и систем компании на основе единого поля событий и данных.

Мониторинг

РеагированиеАнализ

Тюнинг

Большинство проблем не возникает мгновенно, а постепенно накапливаются, либо появляются косвенные признаки, по которым их можно предсказать и предотвратить. Постоянный контроль объектов IT-инфраструктуры и компонентов ИС системой мониторинга с консолидацией данных в едином центре позволяет выявлять признаки проблемы до того, как они скажутся на работе всей системы или сервиса и затронут конечных пользователей. Если же инцидент все-таки случился, анализ информации от системы мониторинга помогает оперативно выявить его источники и причины, благодаря чему проблема устраняется в максимально сжатые сроки.

114

Предпосылки внедрения системы Необходимость внедрения эффективных средств ранней диагностики событий и предсказания влияния

событий на абонентские сервисы и бизнес процессы компании.

Необходимость внедрения ресурсно-сервисной модели и механизмов для оперативного выявления корневых причин влияющих на снижение качества бизнес-процессов оказываемых абонентам и конечным пользователям.

Фрагментарный сбор информации с необходимостью анализа дискретных событий специалистами, необходимость единой базы знаний для такого анализа.

Необходимость средств автоматического восстановления сервиса при повторяющихся аварийных ситуациях с использованием запланированных сценариев.

Необходимость автоматизации выполнения регламентных процедур.

Необходимость средств фильтрации информации с обслуживаемых систем, необходимость обработки ложных сообщений об аварийных ситуациях и предпосылок к таковым.

Ручная регистрация инцидентов, приводящая к задержкам во времени и потере информации.

Необходимость снижения количества аварий и улучшения качества бизнес-процессов влияющих на абонентов и конечных пользователей.

Создание Департамента оперативного мониторинга информационных систем (далее - ДОМИС) который осуществляет централизованный мониторинг информационных систем ОАО «МТС».

Система мониторинга устарела и не соответствует современным технологическим требованиям.

Необходимость оперативного определения корневых причин

при деградации бизнес–процессов необходимо время

на диагностику и их определение.

115

Цели и продукт проектаЦель проекта - внедрение системы мониторинга ИС класса MISSION и BUSINESS CRITICAL * для повышения качества и доступности бизнес-сервисов.

Основные критерии успешности проекта: Сокращение времени ликвидации неисправностей и сбоев на информационных системах в случае их возникновения за счет

оперативного выявления корневой причины нештатной работы компонентов инфраструктуры ИТ и прикладного ПО с использованием ресурсно-сервисной модели;

Улучшение качества сервисов бизнес – заказчику предоставляемых за счет проактивного мониторинга Эффективное управление событиями на ИС за счет уменьшения времени на их обработку.

Продукт проекта:

Внедрена промышленная системы мониторинга ИС класса MISSION и BUSINESS CRITICAL

Выполнена интеграция с базой CMDB – ядром системы управления знаниями об ИТ инфраструктуре

Формализован процесс мониторинга и управления событиями: выполнена доработка существующих / создание новых регламентов процесса мониторинга и управления событиями. Реализованы процедуры управления событиями, проработаны интерфейсы между процессом мониторинга и процессом управления инцидентами.

Построена ресурсно-сервисная модель (РСМ): разработаны унифицированные правила формирования и управления РСМ, которая будет являться эталоном для описания всех информационных систем и использоваться для мониторинга и выявления степени влияния обнаруженных событий на сервисы и бизнес-процессы.

Выработаны механизмы и настроен инструментарий для выявления корневой причины снижения качества бизнес-процессов.

Выполнена интеграция с системой управления инцидентами и графиком дежурств

Внедрен инструментарий автоматизации выполнения регламентных процедур и устранения аварий.

Приведено в соответствие наличие и потребность лицензий программного обеспечения.

Получен инструмент генерации статистической отчетности по событиям на информационных системах класса MISSION и BUSINESS CRITICAL для использования в улучшении качества их эксплуатации.

Повышена эффективность выполнения регламентных процедур за счет уменьшения времени выполнения и влияния на сервисы. Выполнена модернизация промышленного решения, позволяющего контролировать доступность и качество функционирования бизнес-процессов, сервисов ИТ систем компании на основе единого поля событий и данных*.

116

Критерии эффективности проекта№ Название показателя Значения показателя до

проектаЗначения показателя после реализации проекта

1 Оперативный мониторинг Частично

Только для ТМ определенного типа

Расширенные возможности

За счет большего количество специализированных агентов и пробников для различных ИТ систем, сред,

ОС, СУБД и приложений.

2 Инженерный мониторинг Частично

Для ТМ с агентами системы.

Расширенные возможности

Возможность расширения за счет разработки собственных модулей и пробников.

3 Мониторинг качества бизнес-

сервисов предоставляемых

бизнес заказчику

подразделениями ИТ (KPI)

- Отсутствует

Собственная разработка.

Штатное средство

Обеспечивает требуемый уровень отказоустойчивости, содержит механизмы корреляции с событиями

генерируемых ИТ инфраструктурой, предоставляет наглядные средства представления для сотрудников

любого уровня.

4 Управление событиями (Event

management)

- Отсутствует

Необходима интеграция с системой

управления инцидентами.

Штатное средство

Основа построения процесса управления событиями. Расширенные функции по работе с одиночными и

группами событий, интеграция с системой управления инцидентами. Единая точка сбора и обработки

событий от всех ТМ. Поддержка открытых интересов и протоколов.

5 Управление отказами и

неисправностями (Fault

management)

- Отсутствует Штатное средство

Основа построения процесса управления отказами и неисправностями.

Возможность группировки, приоритезация и корреляция событий в соответствии с существующим

набором ИТ систем и топологий ИТ инфраструктуры. Создание сервисных окон для проведения работ

на ИТ системах.

6 Наличие Ресурсно – сервисной

модели (РСМ)

- Отсутствует Штатное средство

Позволяет эффективно выявлять корневую причину снижения бизнес-сервисов предоставляемых

бизнес-заказчику подразделениями ИТ. Предоставляет проактивные средства прогнозирования и

предупреждения возникновения аварий.

7 Подсистема выполнения

регламентных процедур

(Orchestration subsystem)

- Отсутствует

Частично собственная разработка

Штатное средство

Гибко настраиваемый инструмент с возможностью управления многоэтапными процедурами любой

сложности, интегрировано с основной консолью системы.

8 Количество точек мониторинга

(ТМ)

18 000 Свыше 100 000 включая кластеры LAN\WAN, SAN и СХД.

117

Централизованная

функция мониторинга ИС Функции Эксплуатации

ForisАдминистрирование инфраструктуры

Северо-Запад

Центр

Поволжье

Урал

Сибирь

Дальний востокМосква

Урал

Сибирь

Юг

Поволжье

Дальний восток

ДОМИС

Северо-Запад

Москва

Централизованная

Функция выполнения РП и

Контроля выполнения RFC

Функции ДОМИС

118

Централизованная система мониторинга с модульной архитектурой

Централизация мониторинга позволяет решать задачи:• Обеспечить контроль системы силами небольшой дежурной смены.• Благодаря контролю объектов любых типов ускоряется процесс выявления причин

возможных аварий и соответственно ускорение восстановления работоспособности системы.

Для обеспечения возможности масштабирования под любую сложность ИС, используется принцип модульности. ЦСМИС представлен рядом таких модулей:• Ядра (HP BSM) - цель которого выполнение функций централизации мониторинга.• Модули мониторинга(SiteScope, NNM, BPM, Integ) – цель которых осуществлять не

посредственно мониторинг ТС ИС и отправку контрольных данных в ядро системы• Модуль управления(OO) – цель автоматизация выполнения регламентных процедур в

ИС

119

ДОМИС, г. Краснодар

Контур ИТ-инфраструктуры одного МР

ПРПр (HP OO)

ITOO

ПУО (HP Reporter + PM)

ITREPPM

Сервер интеграцииITINTEG

БД ПМСП (SQL)

ITOMSQL

БДКЕ (HP UCMDB)ITCMDB

ПМСП (безагентский мониторинг, HP SiteScope)ПМТП (HP BPM)

ITSSBPMСетевые устройства

Серверы

111

СХД

Remedy ITSM

fCMDB (Москва)

fcmdb05

HP BSM ФронтендBSMGW1

HP BSM ФронтендBSMGW2

Cisco Balancer 1

Cisco Balancer 2

ПСМ (HP NNM)Агент ПРПр (HP OO RAS)

ITNNM

BSMvirt.GW

ПМСП (агентский, HP OM)

ITOM

ПСХД (HP SE)

ITSE

БД Oracle (BSMDB)With StandBy

HP BSM БэкендBSMDP1

0600hpbsm0600hpbsmapp

HP BSM БэкендBSMDP2

ЦСМИС – модульная архитектура

120

Заказ на мониторингСистема является эффективным средством взаимодействия бизнес-подразделений и сервисного подразделения мониторинга.Заказ на мониторинг IT объекта, созданный в данной системе, является поручением понастройке монитора, содержит полную информацию для конфигурирования средствмониторинга, координации событий от системы мониторинга и реакции дежурных на ихпоступление.

121

Модуль загрузки объектов мониторинга (МЗОМ)

Система заказов на мониторинг Модуль загрузки объектов мониторинга (МЗОМ)

Модули мониторинга (SiteScope, NNM)

МЗОМ на основании данных «Системы заказов на мониторинг» выполняет изменения в конфигурациях«Модулей мониторинга ЦСМИС» (SiteScope, NNM) и сохраняет текущую конфигурацию в своем хранилище,из которого могут получать информацию другие системы. Автоматизация процесса позволяет значительноповысить оперативность настройки мониторинга объектов IT различного типа, исключает возможные принастройке вручную ошибки описания конфигурации средств мониторинга, поддерживает в согласованномсостоянии централизованное хранилище конфигурации модулей мониторинга для оперативного получениярасширенных данных об их состоянии, на основании данных заказов на мониторинг формирует базу дляобогащения и управления событиями от модулей мониторинга.

122

Управление простоями в HP BSM (DownTime)

Управление простоями в HP BSM

позволяет временно снять выбранные

ТМ с мониторинга на время выполнения

обслуживания как самих ТМ, так и

оборудования или сервиса, которые

могут повлиять на корректность

мониторинга данной ТМ

Простои позволяют исключить возможность регистрации не качественных инцидентов, по событиям, полученным в ходе выполнения технических работ с оборудованием или сервисом

События, поступившие во время простоя, скрываются от взора дежурных. Как следствие:

От дежурных не ускользнут действительно значимые, аварийные, события

Не будут зарегистрированы инциденты по санкционированным событиям

Простои бывают трех видов:

Созданные на время проведения работ с использованием функционала HP BSM

Полученные из настроек расписания мониторинга ТМ

Созданные во время регистрации RFC в Remedyпосредством интеграции с CMDB

123

Обогащение и автоматизация обработки событий

Настройка правил пересылки событийна подключенные

серверы

Создание правил сопоставления событий

с индикаторами производительности

РСМ

Настройка правил обработки событий,

полученных во время простоя (downtime)

элементов конфигурации

Настройка правил для автоматического

выполнения стандартной процедуры или

последовательности стандартных процедур в контекс

те события

Например: выполнить рестарт службы при получении события

Мощнейший механизм настройки обработки событий на основе

сценария, написанного на языке

программирования Groovy, позволяющий

сделать с событием все, что угодно

Настройка правил подавления событий по

заданным критериям

Настройка способа обработки событий во время штормов

событий, позволяющая увеличить устойчивость HP BSM

к сильным

внешним воздействиям

Разработка правил корреляции на

основе поступления, не поступления или

порядка поступления событий

Настройка корреляции событий на осн

ове привязки событий к

конфигурационным элементам РСМ и влияния на них

Настройка правил для автоматического

выполнения действий в контексте событ

ия через указанное время

Например: отметить события,

не взятые в работу, через 5 мин

Настройка автоматического

назначения новых событий для группы

пользователей

Настройка отправки уведомлений

по почте, SMS или на пейджер

124

Модуль безагентского мониторинга широкого назначения SiteScope

Мониторинг самого широкого спектра объектов: различные виды и метрик ОС, СУБД, WEB серверов, приложений и прикладных метрик, виртуализация, URL и Cert, LanWan, инфраструктурные службы, SNMP, BigData, универсальные скрипты (Bash, PowerShell, WMI, Java, C++)

125

Управление сетями. Network Node Manager i

Это функции контроля за ошибками, доступностью и производительностью.Позволяют увеличить период работоспособности, а также повысить производительность и быстроту решений задач бизнеса.

126

Контроль качества пользователей.BPMЭто активный мониторинг приложений для выявления проблем с доступностью и производительностью, прежде чем они повлияют на работу пользователей. Система имитирует бизнес-транзакции и фиксирует проблемы независимо от деятельности реальных пользователей.

127

Интеграция с внешними системами. BSM Connector

Выполнена интеграция с платформами и оборудованием различных производителей. Порядка 20-ти коллекторов обрабатывают поступающие аварийные и сервисные события.

128

Модели здоровьяМодели здоровья (МЗ) – это набор шаблонов сервисов мониторинга для IT объектов различного типа, позволяющих выполнятьопрос контролируемых параметров (метрик) объектов и диагностировать их состояние, сравнивая текущие значения метрики спороговыми значениями рекомендованными, как норма здоровья, для объектов данного вида. Нормы здоровья определяютсятаким образом, чтоб состояние объекта не влияло на производительность систем и не создавало проблем в работепользователей. Информирование от системы мониторинга о выходе метрики за границы этой нормы позволяет своевременноустранить проблему, что улучшает продуктивность работы и производительность систем в целом.Модуль

мониторинга

Типы объектов Количество

МЗ

Количество

метрик

Количество

мониторов

BPMИТОГО 1 2 140

Бизнес и Web приложения 1 2 140

INTEG

ИТОГО 19 31 790

SAN, СХД 3 5 335

SUPS, SPA, MSCP, OCC,

Nagios, DSA, ЕСПП

9 19 283

Инженерное оборудование 3 3 144

Самомониторинг 4 4 28

MSMQИТОГО 1 1 1120

MSMQ-очереди 1 1 1120

NNM

ИТОГО 3 27 4933

Сервера сеть 1 1 1631

Сетевые устройства 2 26 3302

SiteScope

ИТОГО 181 263 28830

KPI 1 14 39

URL+certificate 11 12 449

VMWare 11 21 1755

Инженерное оборудование 1 1 132

Инфраструктурные сервисы 16 42 477

Сервера прикладная часть 78 92 10222

Сервера сеть 3 3 3153

Сервера системная часть 42 56 11687

СУБД 18 22 916

Общий итог 206 325 35814

129

Ресурсно сервисная модельИспользование РСМ позволяет получить наглядное визуальное представления о влиянии элементов инфраструктуры ИС на бизнес сервис предоставляемый этой ИС. Механизм поиска корневой причиныдает возможность сразу получить информацию вплоть до аварийных метрик и немедленно приступить к решению аварии.

Представление “360 View”

Представление “Topology Map”

Представление “Top View”

130

Подсистема выполнения регламентных процедур

Регламентные процедуры это операции по эксплуатации ИС носящие регулярный характер и выполняемые в автоматическом режиме. Использование для целей автоматизации HP Operations Orchestration:• Уменьшить нагрузку на дежурную

смену, и позволить ей заниматься более критичными задачами,

• Снизить или исключить вероятность ошибки при выполнении РП,

• Увеличить скорость выполнения РП, без уменьшения качества.

Спасибо!

132

Мониторинг показателей качества БИТ МТС Россия

Функциональная схема решения для единой системы мониторинга

Система мониторинга физических и

логических компонент ИТ систем

Без

агентский

модуль

Без агентский

модуль

Система управления

инцидентами Remedy

Система мониторинга

отклика приложений (транзакций)

Мониторинг состояния, оценка событий

Аналитическая обработка,

проактивные события

Оценка влияния событий,

мониторинг бизнес-процесов

CMDB

SNMP Traps

Приоритезация, корреляция, нормализация, группировка

Создание правил обработки Событий

Самообучение, анализ, проактивность

Поиск корневой причины

Сбор данных, метрик

Система управления серверами

и сетевым оборудованием

Подсистема отчетности и отображения

Различные представления для

просмотра событий, включая уровень

сбора данных

Dashboards,

типовые графики и отчеты

Предпологается, что все подсистемы изображенные на схеме имеют специальные средства для их администрирования и настройки

Уровень сбора данных

Бизнес-процессы ИТ-сервисыПрограммное

обеспечениеБазы данных Операционные системы

Сервера Сетевая инфраструктура ХранилищаИнформационные

системы

Без-

агентский

модульСкрипты

Данные

Система администрирования

Хранилище

событий

Адаптеры для получения

событий от внешних систем

Интерфейсы для специалистов,

администраторов, бизнес

пользователей, руководства

Данные

Данные

События События

База ЗнанийГрафик дежурств

Система заказа

на мониторинг

Системы MISSION CRITICAL и BUSINESS CRITICAL

Уровень обработки и

управления

Уровень интеграции

Модуль автоматизации

выполнения регламентных

процедур и запуска

исполняемых сценариев

133

Динамика показателей системы 1

100000

150000

200000

250000

300000

350000

Количество объектов мониторинга в uCMDB

134

Динамика показателей системы 2

200

220

240

260

280

300

320

340

360

Количество разработанных шаблонов

мониторинга

135

Динамика показателей системы 3

100

110

120

130

140

150

160

170

180

дек.14 янв.15 фев.15 мар.15 апр.15 май.15 июн.15 июл.15 авг.15 сен.15 окт.15 ноя.15 дек.15 янв.16 фев.16 мар.16 апр.16

Количество пользователей системы

136

Динамика показателей системы 4

20000

25000

30000

35000

40000

45000

Количество подключенных метрик мониторинга

137

Динамика показателей системы 5

50000

100000

150000

200000

250000

300000

Количество событий

138

Возможности SiteScope в ЦСМИСHP SiteScope является одним из множества модулей мониторинга ЦСМИС.Мониторинг средствами HP SiteScope осуществляется безагентским способ.HP SiteScope своими средствами покрывает следующие элементы инфраструктуры:- Сервер Windows по протоколам NetBIOS и WMI в части:

Счетчиков производительности Состояния служб Наличия событий в системных журналах

- Сервер Unix по протоколу SSH в части различных ресурсов ОС

- Кроме того, для обоих типов ОС покрывается мониторинг: Доступности сервера или порта Загруженности CPU, памяти Доступности свободного места на дисках или файловых системах Информации, содержащейся в лог-файлах, запущенного на серверах, программного

обеспечения Наличия на сервере файлов и каталогов, а так же их состояние (дата создания /

изменения, размер и т.д.)

- Сервера баз данных, таких как: Microsoft SQL Server База данных Oracle DB2 JDBC

Кроме того, возможен мониторинг прочих серверов баз данных при условии наличия JDBC-драйвера, поставляемого с ней, либо доступной для загрузкиТак же возможен мониторинг логической составляющей сервера баз данных, а так же приложений, посредством SQL-запросов. В том числе, различных KPI приложений и сервисов

- Веб-сервера и сервера приложений:Сервер ApacheмHP SiteScope является одним из множества модулей мониторинга ЦСМИС.

Мониторинг средствами HP SiteScope осуществляется безагентским способ.HP SiteScope своими средствами покрывает следующие элементы инфраструктуры:- Веб-сервера и сервера приложений:

Сервер Apache Oracle Application Server 10g Oracle 9i Application Server Сервер Microsoft IIS Сервер приложений WebSphere Application Server Сервлет производительности WebSphere Сервер приложений WebLogic Сервер приложений BroadVision Веб-сервер SunONE UDDI-сервер

- Универсальный Составной Составной с формулой Сценарий Настраиваемый

- Приложение RADIUS Cisco Works Сервер ColdFusion Check Point Прокси-сервер высокой доступности Сервер Microsoft ASP Citrix Почта F5 Big-IP Статистика Memcached Новости Запрос к базе данных Настраиваемый для базы данных JMX (динамический) JMX

- Виртуализация и облако Хранилище данных VMware Производительность VMware Состояние хоста VMware Сеть хоста VMware ЦП хоста VMware Хранилище хоста VMware Память хоста VMware Amazon Web Services Microsoft Hyper-V KVM Универсальный гипервизор Зоны Solaris

- Интернет URL Проверка ссылок Список URL-адресов Последовательность URL-адресов Содержимое URL-адреса Транзакция e-Business

- Сеть DHCP DNS LDAP FTP Пропускная способность сети SNMP SNMP-ловушка SNMP по MIB

-Большие данные Hadoop HP Vertica JDBC

Отдельно хочется отметить мониторинг с помощью сценария. Он позволяет выполнять мониторинг объектов с помощью, как скриптов (bash, PowerShell), так и с помощью скомпилированных программ, написанных на различных языках (C++, Java и т.д.)Кроме того, запуск сценария возможен, как локально на сервере SiteScope, так и удаленно, на целевом сервере (по протоколу SSH).

Внедрение HP OA в Альфа- Банке

Руководитель направления мониторинга ИТ систем

Алексей Голтыхов

Оценка: источники данных мониторинга ИТ компонент

Логи

Центральная

Система

Мониторинга

Специальный

и уникальный

мониторинг

Тип

мониторинга

Системы мониторинга и их возможности.

Уровень

инфраструктуры

и OS

Агент

Уровень

приложений

Уровень

бизнес - задач

Событийный

Статистический

Событийный

Статистический

БЕЗ агентно

Событийный

Статистический

Система

HP

Op

era

tio

ns

HP

Site

Sco

pe

HP

OV

PM

HP

Dia

gn

ostics

HP

RU

M

IBM

Tiv

oli

Whats

Up

Utils

HP

BP

M

AnyCorp

=+ +

Необходимо получить тенденцию изменения параметра нагрузки

ИТ систем за большой период времени и с максимальной

детализацией.

Попытка сбора графиков и данных за разные промежутки

времени «вручную» не дают истинное представление об

изменении параметра.

Почему нужно хранить данные

1. 2.

Оперативный мониторинг хранит данные глубиной

2 суток. Для разбора аварий требуются исторические

данные.

AnyCorp

Использование данных логов

1.

3.

+ +

0. =>

2.4.

--->

AnyCorp

Цель внедрения HP OA :

• Снижение использования ресурсов серверов ИТ систем высокой

критичности за счет переноса данных мониторинга из локальных файлов,

расположенных на серверах, в удаленную центральную базу.

• Получение доступа к данным мониторинга ИТ систем высокой критичности

в случае аварий дисковых систем, а так же других аварий, сопровождаемых

потерей данных для расследования их причин.

• Увеличение частоты и глубины мониторинга параметров без использования

ресурсов промышленных систем.

• Повышения качества анализа функционирования и прогнозов нагрузки ИТ

систем за счет увеличения объема анализируемых данных.

• Опыт тестирования решения для нескольких разнородных источников

данных (Big Data for IT).

• Опыт получения данных логгирования.

AnyCorp

HP OA. Опыт применения

2.

1.

Промышленная системаСбор логов Оперативный мониторинг HP Operation Analytics

HP OA

Internet Log stream

HP OA

SMS

«Информационный шторм», «Память добавили»

AnyCorp

Архитектура HPOA в Альфа-Банке

AnyCorp

Тенденции мониторинга

Сегодня +10 лет Реальность АБ

• Специализированные системы

объединены централизованными

надстройками.

•Каждая система использует

локальный репозиторий для

сбора данных.

•Объединение данных

производится на уровне linked

data или на уровне UI.

•Сбор данных производится с

интервалом в 5-15 минут.

•Требуется установка агентов

локально для сбора расширенных

показателей.

•Сбор расширенных данных

требует ресурсов промышленной

системы.

•Единая шина для обмена данными.

Шина обеспечивает гарантированную

доставку логов, конфигураций и данных

о производительности.

•Отсутствуют жесткие связи –любое

количество производителей и

потребителей данных.

•Специализированные системы

заменяются драйверами,

встраиваемыми в объекты мониторинга.

•Драйверы непрерывно отправляют в

шину данные: логги, показатели. Отказ от

локального хранения данных.

•Нереляционные специализированные

СУБД заменяют традиционные базы в

части хранения истории

•Единая система мониторинга

подсоединяется к шине и анализирует

все данные для мониторинга в

автономном режиме

•Разработчиками предложена схема

хранения логов в шине передачи

данных Kafka + LogStash + DB как

минимум для 3-х ключевых систем

банка.

• Минимум в трех крупных

подразделениях имеется

необходимость сбора и анализа

логов. Средний объем – 5 Gb/день.

• Объективная реальность

потребовала ввести новый KPI –

доступность компонент

мониторинга.

• Начата эксплуатация VERTICA

для сбора логов и хранения истории

событий и статистики ИТ.

• Начат процесс накопления опыта

по сбору и корреляции событий.

AnyCorp

Благодарю за внимание.

agoltykhov@alfabank.ru

top related