201505 monitoring

21
Monitoring à la Mairie de Nouméa Description de l’architecture de monitoring mise en œuvre à la Mairie de Nouméa

Upload: ville-de-noumea-noumea-city

Post on 08-Aug-2015

185 views

Category:

Technology


4 download

TRANSCRIPT

Monitoring à la Mairie de Nouméa

Description de l’architecture de

monitoring mise en œuvre à la Mairie

de Nouméa

Monitoring à la Mairie de Nouméa

Plan

Description des besoins

Architecture prévue

Situation en cours

Besoins fonctionels

Sur une plateforme hétérogène (linux,

windows, appliance, routeurs, clims, …)

De gestion de capacité

De gestion d’alertes

De gestion de logs

D’être proactif

De métriques et alertes techniques et métier

Dashboards évolutifs et personnalisables

3

Besoins Techniques

Que tout soit automatisé

D’une plateforme scalable horizontalement

D’utilisation de standards

D’interopérabilité

De modularité

De simplicité d’administration/maintenance

Opensource à privilégier

4

Monitoring à la Mairie de Nouméa

Plan

Description des besoins

Architecture prévue

Situation en cours

Architecture Prévue

6

Architecture Prévue

7

Les outils choisis sont assez simplement

interchangeables

Respect des standards (REST, SNMP, …)

Communauté riche et réactive

Intégration aux outils d’automatisation

On peut facilement enrichir la stack (ajout

de OSSSec : 1h, ajout de logs : 5 minutes,

ajout de checks : 5 minutes…)

Monitoring à la Mairie de Nouméa

Plan

Description des besoins

Architecture prévue

Situation en cours

Situation Actuelle

9

Réalisé

10

Installation des outils et socles de base +2000 services monitorés

~300 hosts

200 Go de logs gérés (+5Go / jour)

Modules Puppet pour nos besoins 1 nouveau check = juste 5 lignes dans puppet

1 nouvel host = rien à faire pour qu’il soit monitoré

Dashboards système et réseau Dashing maison

Dashboards kibana et grafana

Reste à faire

11

Renforcer les liens inter-applications : Compter certains types de logs avec logstash pour

des métriques collectd à conserver

Envoyer les alertes icinga2/logstash vers redmine (attente de la gestion des fausses alertes)

Mise en place d’un syslog centralisé pour les équipements ne supportant pas l’agent logstash

Enrichissement des checks et métriques

Enrichissement des dashboards

Questions ?

13

Screenshots

14

Screenshots

15

Screenshots

16

Screenshots

17

Screenshots

18

Screenshots

19

Screenshots

20

Screenshots

21