Download - Markus Schmidt - DOAG
Datenbanküberwachung mit
Open Source-Mitteln
Markus Schmidt
Markus Schmidt 2 26.10.2011
DB Struktur Dienste Sicherheit Verfügbarkeit
Implementierung
Prozesse DB Struktur Zukunfts- sicherheit
Strategische Beratung
Wartung & Support
Wartung Aktualisierung Administration Support
Projektmanagement
Planung Koordination Ausführung Test & Freigabe
Analyse Konsolidierung Management
Oracle Lizenzmanagement
Markus Schmidt 3 26.10.2011
Agenda
o Monitoring
o Open Source Tools
o Icinga
o Fragen
Monitoring
Markus Schmidt 5 26.10.2011
Warum Überwachung ?
o Administrative Sicht
o Komplexität der Infrastruktur gestiegen
o Überblick behalten
o Besseres Verständnis für Zusammenhänge schaffen
o IT steht unter Kostendruck
o Konzentration auf die Kernaufgaben, Zeitgewinn
o Keine Zeit investieren, um funktionierende Systeme zu prüfen
o Minimieren der Routinetätigkeiten
o Gezielte Eingriffe bei Problemen durch Benachrichtigung
o Vertrauen in die IT schaffen oder zurückgewinnen
o Wiederkehrende Probleme erkennen, dokumentieren,beheben
und zukünftig vermeiden
Markus Schmidt 6 26.10.2011
Warum Überwachung ?
o Organisatorische Sicht
o Praktisch alle Prozesse IT-gestützt oder IT-getrieben
o IT-Prozesse sind zunehmend mission critical
o Investitionsplanung, Schaffung von Planungssicherheit
o Ermittlung von Kennzahlen
o Störhäufigkeiten
o Ausfälle
o Einhalten von Vereinbarungen (SLAs)
o Vermeidung von Eskalationen und Unzufriedenheit
o Häufig subjektives Empfinden
o Unterstützung aller Phasen
o Change, Operate, Support, Optimize
Markus Schmidt 7 26.10.2011
Was ist Überwachung nicht ?
o Überwachung löst Probleme nicht
o Liefert aber Hinweise auf die Probleme
o Infrastruktur wird nicht automatisch zuverlässig
o Zeigt aber Möglichkeiten für gezielte Verbesserungen
o Ausfälle werden durch Überwachung nicht automatisch
verhindert
o Aber zeitnahe Erkennung ist möglich
o Trend zu instabilem Systemverhalten wird aufgedeckt
Markus Schmidt 8 26.10.2011
Was kann überwacht werden ?
o Server
o Storage
o Netzwerkkomponenten
o Sensoren Bsp: Temperatur
o USV
o Drucker
o Anwendungen
o Datenbanken
o Logfiles
o …
Open Source
Monitoring Systeme
Markus Schmidt 10 26.10.2011
Auswahlkriterien: technische Sicht
o Leichte Administration o Gute Dokumentation, Community
o Konzentration auf das Wesentliche
o Flexibilität bei Überwachungsmöglichkeiten
o Alarmierung
o Stabiler und skalierbarer Betrieb o Modularer Betrieb
o Wissen von Abhängigkeiten
o Minimieren der Routinearbeiten o Logfileanalyse
o Keine Statusüberprüfungen
Markus Schmidt 11 26.10.2011
Auswahlkriterien: organisatorische Sicht
o Planungssicherheit
o Möglichkeit zur Investitionsplanung durch Trendanalyse
o Kennzahlen
o Störungsanfälligkeit
o Häufigkeit von Eskalationen
o Benachrichtigungen
o Eskalationsmechanismus
o Auswertungen
o Historische Betrachtung
o Trendanalyse
o Integrationsmöglichkeiten
o Rechtliche Aspekte
Markus Schmidt 12 26.10.2011
Systeme
Beispielhaft:
o GroundWork Monitoring
o OpenNMS
o Zenoss
o Nagios / Icinga
Markus Schmidt 13 26.10.2011
GroundWork
Überwachungssystem aus vielen OpenSource Programmen
wie z.B. Nagios
Einfache Installation
Autodiscovery
Chartbasierte Auswertungen
+ Notification Email
- Custom Script
Markus Schmidt 14 26.10.2011
OpenNMS
Enterprise Network Management System auf Basis von Open
Source
Chart basierte Auswertungen
- Ressourcenintensiv
- Komplexe Administration
+ Notification Email
+ Custom Script
Markus Schmidt 15 26.10.2011
Zenoss
kommerzielles OpenSource-Projekt mit freiem Kern
Chart basierte Auswertungen
- Aufwändige Nacharbeiten
- Eigeschränkte Templates
+ Notification Email
+ Custom Script
Markus Schmidt 16 26.10.2011
Nagios / Icinga
Einsatzbereich:
Neuinstallation:
Hardware und Betriebssystem
Detaillierte Überwachung von
Applikationen und Datenbanken
Standardmäßig einige wenige
Plugins
Durchführung grundlegender
Überwachungs-Checks
Viele Plugins online frei verfügbar
Markus Schmidt 17 26.10.2011
Verbreitung
Markus Schmidt 18 26.10.2011
Nagios / Icinga
Markus Schmidt 19 26.10.2011
Markus Schmidt 20 26.10.2011
Funktionsweise
o Hosts / Services werden aktiv überwacht
o Server initiiert o Prüfung der Hosts
o Ausführung der Prüfskripte auf den Hosts
o Statusmeldungen mit Prüfergebnissen werden ausgewertet
o Gezielte Benachrichtigung der Administratoren bei Überschreiten der Schwellwerte per Mail, SMS, …
o Aufzeichnung der Performancedaten zur späteren Auswertung
o Eskalationsmanagement
Markus Schmidt 21 26.10.2011
Addons
Benutzeroberfläche erweiterbar
Visualisierung
Konfiguration
Markus Schmidt 22 26.10.2011
Modulkonzept
Eigene Checks mit minimalem Aufwand zu erstellen
Aufbau auf kleinen Modulen in C, C++, C#, Java, Perl,
PHP, Python, …
Beispiel für Festplattenkapazitätscheck
Modul überprüft Speicherplatz mit 3 Parametern
Bei Überschreitung des Warning-Schwellwertes Anzeige auf der
Oberfläche
Markus Schmidt 23 26.10.2011
Icinga & Oracle
Abdeckung: o Betriebsparameter
o Aktueller Zustand
o Verfügbarkeit, Auslastung, Antwortzeiten
o Konformität mit Firmenrichtlinien
o Trendanalysen
o Füllgrad / Wachstum Tablespaces
o Last
Ziel: Überwachung der gesamten Datenbank o in unterschiedlichen Zeitabständen
o mit unterschiedlichem Detaillierungsgrad
o Frühzeitige Reaktion auf kritische Zustände
Markus Schmidt 24 26.10.2011
Oracle Monitoring
Aktueller Zustand
1. Listener, Connectversuch, TNS-Ping
2. Antwortzeiten
3. Oracle Prozesse
4. Last auf Datenbank, CPU, IO
5. angemeldete Benutzer
6. Alert-Log Prüfung
7. Deadlocks
8. Blockierte und blockierende Sessions
9. Backup
Markus Schmidt 25 26.10.2011
Oracle Monitoring Performancedaten / Trends
Füllgrad und Wachstum
1. Filesystems
2. Tablespaces
3. Datafiles
4. Archivelogs
Plattenzugriffe, Durchsatz und Peaks
Markus Schmidt 26 26.10.2011
Konformität
1. Foreign-Key-Spalten
2. Ungültige Objekte
3. Offline Tablespaces
4. Nicht wiederherstellbare Objekte
5. Integritätsprüfung des Backups
6. Rollen und Benutzerrechte
7. Systemprivilegien
8. Anmeldung als privilegierter Benutzer
9. OFA-Standards eingehalten
10. Firmenstandards eingehalten
Die Checks decken einen großen Informationsumfang ab.
Der Administrator muss nur an einer Stelle analysieren um Probleme und
Schwächen der Datenbank zu finden.
Markus Schmidt 27 26.10.2011
Oracle Enterprise Manager
o Klar – auch eine Möglichkeit
o Datenbank nötig
o Agenten nötig (Ressourcen!)
o Netzwerküberwachung ?
o Komplette Infrastruktur ?
Fragen ?
Essential Bytes GmbH & Co. KG
Markus Schmidt
Steinebühlstraße 30
77749 Hohberg
http://www.essential-bytes.de
Kontakt