Tags: vSphere, Hochverfügbarkeit, Cluster
Eine wesentliche Funktion von ESXi-Clustern besteht darin, die Hochverfügbarkeit von virtuellen Maschinen zu gewährleisten. Diesem Zweck dient das Feature vSphere HA, welches VMs beim Ausfall eines Hosts auf einem anderen startet. Die Aktivierung von HA bewirkt den automatischen Start der Host-Überwachung.
Die Inbetriebnahme von vSphere-HA ist einfach. Ist noch kein Cluster-Objekt in vCenter vorhanden, dann genügt ein Rechtsklick auf das Datacenter, um einen ESXi-Verbund zu erstellen. Hierbei kann der Nutzer dann wahlweise die Cluster-Funktionalitäten HA, DRS, EVC oder vSAN (auch parallel) aktivieren.
Start von Host-Überwachung und Zugangssteuerung
Danach muss man nur noch die Hosts per Drag & Drop in den Cluster ziehen. Wer schon ein Cluster-Objekt hat, kann HA auch nachträglich aktivieren oder deaktivieren, etwa bei Wartungsaufgaben im Netzwerk oder beim Herunterfahren eines Hosts. Im Gegensatz zum Deaktivieren von DRS funktioniert das jederzeit auch ohne Umschalten in den Wartungsmodus.
Wie die Abbildung zeigt, aktiviert der HA-Assistent per Default die Host-Überwachung, die auch ohne weitere Detail-Konfiguration gut und weitgehend wartungsfrei funktioniert (der Standard-Response auf Ausfälle ist dann "VMs neu starten").
Die Aktion schaltet zudem die Zugangssteuerung an, welche das Berechnen bzw. Überwachen der Failover-Kapazität gestattet. Die VM-Überwachung bleibt per Vorgabe jedoch ausgeschaltet.
Master-Slave-Modell
Beim Aktivieren von vSphere-HA wird automatisch ein einzelner Host zum Master-Host bestimmt. Der Master-Host kommuniziert mit dem vCenter-Server und überwacht den Zustand aller geschützten virtuellen Maschinen und der Slave-Hosts.
Hat man HA erfolgreich aktiviert, dann werden auf dem Master-Host und den Slave-Hosts die HA-Agenten gestartet und der vom Master initiierte Austausch der primären Taktsignale über das Management-Netzwerk sowie der Datastore-Taktsignale beginnt. Slaves tauschen untereinander keine Taktsignale aus. Fällt der Master selbst aus, wird ein neuer Master gewählt.
Die Grafik zeigt, dass ein vCenter zwar für das Erstellen und Verwalten des HA-Clusters benötigt wird, wozu wie gehabt der vpxd-Daemon und die vpxa-Agenten miteinander kommunizieren. Dagegen bleibt die HA-Funktionalität auf den Hosts auch ohne vCenter erhalten.
Sie wird über den FDM (Fault Domain Manager) erbracht, der direkt mit dem Host-Daemon kommuniziert und - sofern er der Master-Agent ist - auch die sekündlich ausgetauschten Takt-Signale über das Management-Netzwerk initiiert. Den aktuellen Betriebszustand und/oder Fehler-Status von vSphere HA erkennt der Admin jederzeit bei markiertem Cluster im Reiter Übersicht im Abschnitt HA Status.
Ausfallszenarien
Aus der Sicht von vSphere HA sind verschiedene Ausfall-Szenarien vorstellbar, die der Master-Host erkennen und mit denen er angemessen umgehen soll. So muss er zum Beispiel zwischen einem ausgefallenen Host und einem Host unterscheiden, der sich in einer Netzwerkpartition befindet oder der netzwerkisoliert ist. Dazu verwendet er die beschriebenen Netzwerk- und Datenspeicher-Taktsignale.
Der Administrator kann für Host-Isolierungen sowie Netzwerkfehler, VM-Ausfälle oder Storage-Fehler jeweils eigene Standard-Responses konfigurieren, mit denen HA auf diese Ereignisse reagiert. Außerdem erfordern mehrschichtige Anwendungen, die sich über mehrere VMs erstrecken, häufig einen orchestrierten VM-Restart. Auch dieser lässt sich konfigurieren.
Täglich Know-how für IT-Pros mit unserem Newsletter
Thomas Drilling arbeitet ist seit fast 30 Jahren selbständig in der IT-Welt sowohl als Consultant, als auch als Redakteur, Buchautor und Journalist für viele ehemalige und aktuelle IT-Magazine sowie Blogs.
Aktuell bestätigt sich Thomas schwerpunktmäßig als IT-Trainer für Cloud-Computing in den Bereichen Microsoft Azure, Amazon Web Services und VMware.
Thomas ist zertifizierter Microsoft-Trainer für nahe das gesamte Portfolio an Microsoft Azure Trainings. Thomas ist außerdem zertifizierter Microsoft Azure Solutions Architect Expert sowie VMware Certified Professional und wurde von VMware in den Jahren 2016 bis 2022 mit dem Blogger-Status vExpert ausgezeichnet.
Thomas führt aktuell jeden Monat zwei selbstkonziperte 4-tägigen Grundlagenkurse in Cloud Computing mit Azure durch, die sich inhaltlich bewusst von den Microsft-Kursen abheben und vorzuweise als Bootcamp in eine besonderen Lokation stattfinden. Optional kann aber aber auch remote via Microsoft Teams teilgenommen werden.
Das aktuelle Trainingsprogramm findet sich unter Azure-Trainings. Weitere Informationen und Anmeldung über sein Azure-Blog.
Verwandte Beiträge
- VMs bei Absturz des Gast-OS über vSphere HA Application Monitoring neu starten
- VMware vSphere DRS: Affinitätsregeln
- vSphere-HA: Antworten auf Fehler im Cluster konfigurieren
- vSphere-Hochverfügbarkeit: Fehlertypen für Host-Protection erkennen
- Hochverfügbarkeit für virtuelle Maschinen: Was ist vSphere HA?
Weitere Links
2 Kommentare
Toller Artikel und sehr ausführlich beschrieben!
Wie würden Sie ein Ausfallszenario monitoren und erkennen?
Danke für den guten Artikel.
Ich hätte eine Frage. Wenn man bereits 3 laufende Hosts in VCenter hat und jetzt nachträglich einen Cluster erstellt und dann die Hosts hinzufügen will bekommt man eine Wartung aufgrund der aktuell laufenden VMs.
Heißt das, dass man alle VMs herunterfahren muss um die Hosts nachträglich einem Cluster hinzuzufügen?
Wenn Sie das wüssten würde mir das aktuell sehr helfen.