zabbix и миллионы метрик: наилучший опыт масштабного...
TRANSCRIPT
Zabbix и миллионыметрик Алексей Владышев
Обо мне
Алексей Владышев
Автор Zabbix
CEO и Архитектор
Twitter: @avladishev
Мониторинг Начало
История
Сбор данных
Zabbix server
История
Анализ
Сбор данных
Zabbix server
История
Анализ
Сбор данных
Оповещения
Zabbix server
Zabbix агент?
Zabbix агент?Минусы
- Установка
Плюсы+ Доступ к любым метрикам доступным OS
+ Гибкость на уровне коммуникаций (пассивные и активные проверки)
+ Очень маленький и быстрый, нет влияния на саму систему
+ Легко расширить функциональность модулями и скриптами
…много ещё…
Zabbix агент?Минусы
- Установка
Плюсы+ Доступ к любым метрикам OS
+ Гибкость на уровне коммуникаций (пассивные и активные проверки)
+ Очень маленький и быстрый, нет влияния на саму систему
+ Легко расширить функциональность модулями и скриптами
…много ещё…
95% используют Zabbix агента
Метрики
CPU load
Free disk space
WEB server state
Анализ в режиме реального времени
Анализ в режиме реального времени
Метрики
CPU load
Free disk space
WEB server state
Триггеры
CPU load > 5
Free disk space < 10%
WEB server state = 0 (down)
100 хостов
500 хостов
1000 хостов
Как управлять конфигурацией?
Шаблон - это набор параметров для мониторинга
Шаблон - это набор параметров для мониторинга
Linux сервер? Используем Template Linux
Процессор, диски, сеть, память
MySQL? Используем Template MySQL
Доступность, TPS, статус репликации
Шаблон - это набор параметров для мониторинга
Linux сервер? Используем Template Linux
Процессор, диски, сеть, память
MySQL? Используем Template MySQL
Доступность, TPS, статус репликации
Linux серверы
Сервер 1
Сервер 2
Сервер 3
Одинаковые, но разные
Одинаковые, но разные
Linux серверы
/ /data /tmp
/ /tmp
/ /home /data /tmp
Сервер 1
Сервер 2
Сервер 3
Одинаковые, но разные
Linux серверы
/ /data /tmp
/ /tmp
/ /home /data /tmp
Template Linux 1
Template Linux 2
Template Linux 3
Сервер 1
Сервер 2
Сервер 3
Низкоуровневое обнаружение
Один шаблон
Template Linuх
с одним правилом
обнаружения
Сервер 1
Сервер 2
Сервер 3
Низкоуровневое обнаружение
Один шаблон
Template Linuх
с одним правилом
обнаружения
Сервер 1
Сервер 2
Сервер 3
//data/tmp
//tmp
//home/data/tmp
Один шаблон мониторинга для разных устройств!
Сервер
Сервер
Сервер
Сервер
Сервер
Сервер
Сервер
Сервер
Сервер
Сервер
Сервер
Сервер
Сервер
Сервер
Сервер
Сервер
Масштабирование
11 terabits на выходе 80 точек присутствия
25.000 хостов
6.000.000 метрик 3.000.000 триггеров 90 прокси
Производительность Zabbix
7.510 проверок в секунду (NVPS)
25.000 хостов
Результат проверки = 50 байт
Limelight: 26ГБ в день
2TB история, максимум 6 месяцев
Размер базы данных
Что выбрать?
Что выбрать?
VS
Более 1.000.000 метрик и объём данных от 1TB
Более 1.000.000 метрик и объём данных от 1TB
1 место:
2 место:
3 место: Oracle & DB2 5 %
Более 1.000.000 метрик и объём данных от 1TB
1 место: MySQL 80 %
2 место: PostgreSQL 15 %
3 место: Oracle & DB2 5 %
Управление
Zabbix server
Управление
Zabbix server
Сентябрь
Октябрь
Ноябрь
Zabbix server
Партиционирование
А если хостов ещё больше?
60.000 хостов
60.000 хостов2.000.000 метрик 20.000.000 триггеров 6TB история 40 прокси
Производительность Zabbix
21.000 проверок в секунду (NVPS)
Автоматизация
Сетевое обнаружение
Сеть
Обнаружен DNS
Обнаружен Zabbix Agent
ZabbixОбнаружен HTTP сервер
Авторегистрация
Я - новый сервер Metadata: Linux/MySQL
Zabbix
Сеть
Агент
Управление агентами
Управление конфигурацией
Привязка к шаблонам, добавление хостов
Распределённый мониторинг
200.000 хостов
200.000 хостов5.000.000 метрик 2.000.000 триггеров Минимум 5ТB история 11.000 прокси
Производительность Zabbix
20.000 проверок в секунду (NVPS)
Новый магазин!
Реестр
Прокси
Новый магазин!
Реестр
ZabbixПрокси
Новый магазин!
Zabbix API
Реестр
Так, а теперь переходим на Zabbix 3.0!
Проще, чем кажется
Обратная совместимость с агентами
Но не с прокси!
Автоматическое обновление структуры базы
Таблицы с историей не трогаем
Не ломаем API
Hosts Metrics Triggers Proxy DB
25К 6М 3М 45
60К 2М 20М 40
200К 5М 2М 11К
Итог
ИтогНе надо бояться
200.000 хостов
6.000.000 метрик, 20.000.000 триггеров
Терабайты истории
11.000 прокси
Автоматизация и HA
Не забываем о выборе правильного железа для Zabbix
ИтогНе надо бояться
200.000 хостов
6.000.000 метрик, 20.000.000 триггеров
Терабайты истории
11.000 прокси
Автоматизация и HA
Не забываем о выборе правильного железа для Zabbix