Anleitung: Cluster für High Availability (HA) in VMware vSphere erstellen


    Tags: , ,

    Funktionsweise eines HA-Clusters in vSphereEine wesent­liche Funktion von ESXi-Clustern besteht darin, die Hoch­verfüg­barkeit von virtuellen Maschinen zu gewähr­leisten. Diesem Zweck dient das Feature vSphere HA, welches VMs beim Ausfall eines Hosts auf einem anderen startet. Die Akti­vierung von HA bewirkt den auto­matischen Start der Host-Überwachung.

    Die Inbetrieb­nahme von vSphere-HA ist einfach. Ist noch kein Cluster-Objekt in vCenter vorhanden, dann genügt ein Rechtsklick auf das Datacenter, um einen ESXi-Verbund zu erstellen. Hierbei kann der Nutzer dann wahlweise die Cluster-Funktio­nalitäten HA, DRS, EVC oder vSAN (auch parallel) aktivieren.

    Start von Host-Überwachung und Zugangssteuerung

    Danach muss man nur noch die Hosts per Drag & Drop in den Cluster ziehen. Wer schon ein Cluster-Objekt hat, kann HA auch nachträglich aktivieren oder deaktivieren, etwa bei Wartungs­aufgaben im Netzwerk oder beim Herunter­fahren eines Hosts. Im Gegensatz zum Deaktivieren von DRS funktioniert das jederzeit auch ohne Umschalten in den Wartungsmodus.

    Der Assistent zum Erstellen eines HA-Cluster aktiviert automatisch die Host-Überwachung.

    Wie die Abbildung zeigt, aktiviert der HA-Assistent per Default die Host-Überwachung, die auch ohne weitere Detail-Konfiguration gut und weitgehend wartungsfrei funktioniert (der Standard-Response auf Ausfälle ist dann "VMs neu starten").

    Die Aktion schaltet zudem die Zugangs­steuerung an, welche das Berechnen bzw. Überwachen der Failover-Kapazität gestattet. Die VM-Überwachung bleibt per Vorgabe jedoch ausgeschaltet.

    Master-Slave-Modell

    Beim Aktivieren von vSphere-HA wird automatisch ein einzelner Host zum Master-Host bestimmt. Der Master-Host kommuniziert mit dem vCenter-Server und überwacht den Zustand aller geschützten virtuellen Maschinen und der Slave-Hosts.

    Hat man HA erfolgreich aktiviert, dann werden auf dem Master-Host und den Slave-Hosts die HA-Agenten gestartet und der vom Master initiierte Austausch der primären Taktsignale über das Management-Netzwerk sowie der Datastore-Taktsignale beginnt. Slaves tauschen unter­einander keine Taktsignale aus. Fällt der Master selbst aus, wird ein neuer Master gewählt.

    Funktionsweise des Fault Domain Manager

    Die Grafik zeigt, dass ein vCenter zwar für das Erstellen und Verwalten des HA-Clusters benötigt wird, wozu wie gehabt der vpxd-Daemon  und die vpxa-Agenten miteinander kommunizieren. Dagegen bleibt die HA-Funktionalität auf den Hosts auch ohne vCenter erhalten.

    Sie wird über den FDM (Fault Domain Manager) erbracht, der direkt mit dem Host-Daemon kommuniziert und - sofern er der Master-Agent ist - auch die sekündlich ausgetauschten Takt-Signale über das Management-Netzwerk initiiert. Den aktuellen Betriebs­zustand und/oder Fehler-Status von vSphere HA erkennt der Admin jederzeit bei markiertem Cluster im Reiter Übersicht im Abschnitt HA Status.

    Die Übersicht zu vSphere HA liefert alle wichtigen Statusinformationen.

    Ausfallszenarien

    Aus der Sicht von vSphere HA sind verschiedene Ausfall-Szenarien vorstellbar, die der Master-Host erkennen und mit denen er angemessen umgehen soll. So muss er zum Beispiel zwischen einem ausgefallenen Host und einem Host unterscheiden, der sich in einer Netzwerk­partition befindet oder der netzwerk­isoliert ist. Dazu verwendet er die beschriebenen  Netzwerk- und Datenspeicher-Taktsignale.

    Der Administrator kann für Host-Isolierungen sowie Netzwerkfehler, VM-Ausfälle oder Storage-Fehler jeweils eigene Standard-Responses konfigurieren, mit denen HA auf diese Ereignisse reagiert. Außerdem erfordern mehrschichtige Anwendungen, die sich über mehrere VMs erstrecken, häufig einen orchestrierten VM-Restart. Auch dieser lässt sich konfigurieren.

    Täglich Know-how für IT-Pros mit unserem Newsletter

    Wir ver­wenden Ihre Mail-Adresse nur für den Ver­sand der News­letter.
    Es erfolgt keine per­sonen­be­zogene Auswertung.

    Bild von Thomas Drilling

    Thomas Drilling arbeitet ist seit fast 30 Jahren selb­ständig in der IT-Welt sowohl als Consultant, als auch als Redakteur, Buchautor und Journalist für viele ehe­malige und aktuelle IT-Magazine sowie Blogs.

    Aktuell bestätigt sich Thomas schwerpunktmäßig als IT-Trainer für Cloud-Computing in den Bereichen Microsoft Azure, Amazon Web Services und VMware.

    Thomas ist zertifizierter Microsoft-Trainer für nahe das gesamte Portfolio an Microsoft Azure Trainings. Thomas ist außerdem zerti­fi­zierter Microsoft Azure Solutions Architect Expert sowie VMware Certified Professional und wurde von VMware in den Jahren 2016 bis 2022 mit dem Blogger-Status vExpert ausge­zeichnet.

    Thomas führt aktuell jeden Monat zwei selbstkonziperte 4-tägigen Grund­lagenkurse in Cloud Computing mit Azure durch, die sich inhaltlich bewusst von den Microsft-Kursen abheben und vorzuweise als Bootcamp in eine besonderen Lokation stattfinden. Optional kann aber aber auch remote via Microsoft Teams teilgenommen werden.

    Das aktuelle Trainingsprogramm findet sich unter Azure-Trainings. Weitere Infor­mationen und Anmel­dung über sein Azure-Blog.

    Verwandte Beiträge

    Weitere Links

    2 Kommentare

    Toller Artikel und sehr ausführlich beschrieben!
    Wie würden Sie ein Ausfallszenario monitoren und erkennen?

    Danke für den guten Artikel.

    Ich hätte eine Frage. Wenn man bereits 3 laufende Hosts in VCenter hat und jetzt nachträglich einen Cluster erstellt und dann die Hosts hinzufügen will bekommt man eine Wartung aufgrund der aktuell laufenden VMs.

    Heißt das, dass man alle VMs herunterfahren muss um die Hosts nachträglich einem Cluster hinzuzufügen?

    Wenn Sie das wüssten würde mir das aktuell sehr helfen.