ClusterLion
Robert Graf | CEOMobil +43 664 1314403Email: [email protected]
Übersicht
1. ProLion-NetApp Allianz
2. Hochverfügbarkeit
3. MetroCluster Herausforderungen
4. ClusterLion Lösung
5. ClusterLion vs. konventionelle Lösungen
6. ClusterLion Technologie
7. Vorteile für Kunden
8. Referenzen
NetApp Allianz
ProLion Geschäftsführer Robert Graf: frührer NetApp Country Manager in Österreich, 7 Jahre @ NetApp
ClusterLion exklusiv für NetApp MetroCluster NetApp Alliance Partner EU Distributionspartner: Arrow ECS
Hochverfügbarkeit der IT
Unternehmenskritische Applikationen müssen heute jeder Zeit verfügbar sein.
Daher ist permanente IT Verfügbarkeit “Always-ON” für viele Unternehmen eine Grundvoraussetzung und keine Option mehr.
Jeder Ausfall kostet Geld und Image. Die meisten Branchen sind heute von einer
funktionierenden IT abhängig.
Downtime-Kosten
Die Werte der Branchen und Studien variieren, doch fest steht, IT Downtime verursacht beträchtlichen Schaden.
Split-Brain Syndrome Wikipedia: Split Brain ist in der Informatik
ein unerwünschter Zustand eines Computerclusters, bei dem alle Zwischenverbindungen zwischen den Clusterteilen gleichzeitig unterbrochen sind.
Zur Koordination der Transaktionen im Cluster wird in der Regel ein Cluster Interconnect verwendet. Wird die Verbindung zwischen einem oder mehreren Teilen des Clusters über diesen Weg unterbrochen, kann keines noch unterscheiden ob es sich um einen partiellen Ausfall oder eine Trennung handelt. Alle diese (nun isolierten) Clusterfragmente arbeiten für sich weiter, um die Bereitstellung des Dienstes aufrechtzuerhalten.
Herausforderung jedes Storage Clusters
Jeder Storage-Anbieter am Markt benötigt ein Quorum, einen Witness oder Tiebreaker um einen automatischen Switchover im Fall einer Site-Failure durchzuführen.
In der Regel werden teure Infrastrukturinvestiotionen für einen 3. Standort und hochredundante Interconnects von den primären Standorten zum Quorum-Standort benötigt.
Mit ClusterLion fallen keine zusätzlichen Infrastrukturinvestitionen an, was zu geringst möglichen Gesamtbetriebskosten für einen automatischen Switchover führt.
ClusterLion ist exklusiv für NetApp MetroCluster verfügbar.
7 Mode or cDOT 2-Pack MetroCluster
Srvc (b)
cf giveback
Srvc (a)
system01 failed !takeover!
stretched HA
A/A Controller Failure Scenario1. 1st Controller fails2. Identity „moves“ to 2nd controller3. I/O passes through 2nd controller4. After repairing1st controller,
issue „cf giveback“5. Identity „moves“ back to 1st controller6. Normal operations continue
7 Mode or cDOT 2-Pack MetroCluster
Srvc (a) Srvc (b)
SiteA down orsite-connection broken?cf takeover -dcf giveback
stretched HA
MC Site Failure Scenario1. Entire Site A fails2. 2nd controller checks heartbeat, disk-
connections and IP connection while still serving its data
3. Human or process on 3rd Site identifies site-failure
4. Issue „cf takeover –d“5. Identity „moves“ to second controller
cDOT 4-Pack MetroCluster / lokale HA
MC Fabric
Srvc(b)Srvc(a)
NO AUTOMATIC SWITCHOVER BETWEEN DATA CENTERS
stretched HAlocal HA local HA
ONTAP 8.3 MetroCluster DR Guide
Source: http://mysupport.netapp.com/documentation/docweb/index.html?productID=62093&language=en-US
ClusterLion – Die Lösung
UPSGrid100m
2x Ethernet
2x RS232
QRemote Quorum
100m
2x Ethernet2x RS232
Monitoring:• Power Supply• Storage Controller • Partner Status • Heart-Beat
1. Reporting:• A2: Active Controller Heartbeat• A1: Lost Cluster Partner, NVRAM
etc.• B2: No Controller Heartbeat• B1: Controller Error and Power
Alarm
2. Action:• B2: Power Off• B1: Power Off• A2: Active Controller Heartbeat• A1: Force Takeover• Q: Open Helpdesk Ticket
Switchover
ClusterLion
Open TicketPartner Helpdesk
Customer Support during Giveback
Telco BTelco A
Use Case: Power Outage
UPSGrid
MC Fabric
“Switchback”
A2 A1 B2 B1
Srvc(b)Srvc(a)
Srvc(b)
SRV1
Ethernet / SAN
SRV2
ClusterLion Technologie
MetroCluster Switchover
TieBreaker Manual Switchover ClusterLion
Support von 7-Mode und cDOT MC Konfigurationen ✔ ✔ ✔
Unterbrechungsfreier Betrieb selbst bei Standort Ausfall ✔ X ✔
Für den Betrieb werden nur zwei Rechenzentren benötigt X ✔ ✔
Höchste Sicherheit gegen Split-Brain und Datenverlust X ✔ ✔
Unabhängige Sicht auf den MetroCluster Status X X ✔
Einfach zu installieren (> 3h) und einfach zu betreiben X ✔ ✔
Mögliche Lösungen für NetApp MetroCluster Switchover:
ClusterLion ohne Frontblende „Hot Swap“ Batterie
ClusterLion Technologie
4x Power Input 4x Power Output 2x Cooling Fans 2x 24V Output for UMTS
Gateways
Reset Button 2x Serial Consol Port 6x Ethernet Connectivity
ClusterLion Technologie
Premium Support: 24x7 Telefon-Support Proaktive benachtrichtigung des Kunden Automatisches Support-Ticket beim Storage
Vendor Unterstützung während Cluster-Giveback Europäischer Service-Partner: Econocom
Osiatis
ClusterLion Premium-Support
Vorteile durch ClusterLion
ClusterLion erhöht die Verfügbarkeit eines zwei-Standorte Storage Clusters!
Selbst bei einem Site Desaster (K-Fall) an einem Standort werden die Cluster Services ordnungsgemäß übergeben und alle Applikationen bleiben verfügbar.
Deutlich geringere Kosten im Vergleich zu einem traditionellen Quorum Standort (Leitungskosten, Betriebskosten, Administration)!
Ein Quorum wird von ProLion ohne zusätzliche Kosten zur Verfügung gestellt.
Durch lokales Abschalten wird eine Dateninkonsistenz aufgrund eines Split Brain Syndroms durch ClusterLion ausgeschlossen!
ClusterLion kann an jedem bestehenden NetApp MetroCluster unterbrechungsfrei nachgerüstet werden.
...ob man sich einen IT-Betrieb ohne
ClusterLion leisten kann.
Die Frage ist nicht, ob man sich ClusterLion
leisten kann, sondern...Vielen Dank!