Hyperkonvergente Windows-Cluster mit Azure Monitor überwachen

    Azure MonitorMit Hilfe des Azure Monitor können hyper­konver­gente Cluster auf Basis von Windows Server und Storage Spaces Direct aus der Cloud über­wacht werden. Diese dürfen welt­weit ver­teilt sein. Micro­soft sieht hier eine hyb­ride Lösung vor, welche Knoten in einem lokalen WAC für das Moni­toring konfi­guriert.

    Azure Monitor sammelt Metriken und Logs der lokalen Knoten per Agent ein und lässt Auswertungen zu. Die Daten lassen sich dann visualisieren und über Abfragen analysieren. Zusätzlich können Alerts definiert werden, welche den Systemverwalter per E-Mail erreichen.

    Speziell für die relativ komplexen und hoch­verfügbaren Windows-Systeme basierend auf Hyper-V und Storage Spaces Direct (Azure Stack HCI) ist es wichtig, alle wesentlichen Daten ständig im Blick zu haben. Dafür kann man natürlich SCOM und sein Management Pack für S2D nutzen, doch das kostenlose Windows Admin Center in Verbindung mit Azure als Erweiterung erweisen sich als flexibler.

    Azure Monitor im Azure Portal

    Windows Admin Center mit Azure verbinden

    In Windows Admin Center (WAC) lassen sich diverse Azure-Dienste einbinden. Auch kann man die On-prem-Verwaltungslösung für hyperkonvergente Windows-Systeme um ein Azure-Monitoring erweitern. Nach dem Aufrufen des Cluster-Managers lässt sich auch hier Azure Monitor als Tool auswählen.

    Windows Admin Center bei Azure registrieren

    Hat man die einmalige Registrierung für Azure noch nicht durchlaufen, dann startet dieser Vorgang automatisch. Am Ende des selbsterklärenden Wizards (rechts oben) müssen dem WAC Zugriffsrechte unter Azure gewährt werden.

    Zugriffsrechte für das WAC in Azure erteilen

    Agents auf Azure Stack HCI-Cluster verteilen

    Für das Onboarding der Knoten sieht die WAC-GUI unter Azure Monitor (aktuell als Preview, Stand: Ende März 2020) den Button Onboard cluster vor. Mein überschaubarer Lab-Cluster aus zwei Knoten wird davor als disconnected angezeigt. Ein Klick auf Onboarding cluster öffnet den hierfür vorgesehenen Wizard (rechts).

    Onboarding des hyperconverged Cluster in Windows Admin Center 

    Die Azure Ressourcen-Gruppe (hier: kueppers.lab) bestand schon im Vorfeld und ich konnte sie dement­sprechend auswählen. Neu erstellt wird hierbei der erforderliche Log analytics workspace. Unter der Haube passiert beim onboarding einiges, dazu zählt auch die Installation der Monitoring- und Dependency Agents auf jedem Knoten.

    Der Monitoring Agent wird automatisch auf den Knoten installiert und konfiguriert.

    Wer sich noch an die Operations Management Suite (OMS) erinnert, erkennt hier Parallelen.

    Für die erfolgreiche Kommunikation der Agents mit dem Azure-Workspace hinter einem Proxy und einer Firewall sind gegebenenfalls Anpassungen notwendig, die Microsoft hier beschreibt. Sprechen Sie sich dazu am besten mit Ihrer Netzwerk -und Sicherheitsabteilung ab!

    Nach dem Onboarding werden die Cluster-Knoten als 'Connected' ausgewiesen.

    Azure Log Analytics Workspace

    Beim Wechsel in das Azure-Portal und zum Tenant gelangt man über die Ressourcen-Gruppe zum Log Analytics Workspace. In der Übersicht konfiguriert man unter Punkt 1 die Verbindung der Datenquelle. Da das WAC bereits die Agenten installiert hat, sollten die beiden Knoten hinter diesem Link als connected auftauchen.

    Azure Monitor ist mit Windows als Datenquelle verbunden

    Wenn Sie Ihren Blick anschließend schweifen lassen, erkennen Sie die Möglichkeit zum manuellen Download dieser Agenten. Auch die nötige Workspace-ID und die zugehörigen generierten Keys werden hier angezeigt.

    Mit Azure Monitor verbundene Windows-Hosts

    Wenn wir auf der linken Seite auf Data wechseln, gelangen wir zum interessanten Teil der Einstellungen für unsere HCI-Umgebung. Sie bestimmen hier nämlich, welche Event-Logs und welche Performance-Counter angezapft werden. Der seit Server 2016 automatisch aktivierte Health Service des S2D-Clusters dient on-prem als Grundlage.

    Eventlog-Quelle der hyperkonvergenten Hosts

    Standardmäßig sind bereits einige hinterlegt und können auch angepasst werden.

    Aktivierte Performance-Counter

    Bleiben wir im Azure-Portal und schalten uns in den Log Analytics Workspace, dann lässt sich hier eine Vielzahl von Log-Daten über Queries auswerten. So bekommt man ein immer besseres Verständnis für den Gesundheitsstatus seiner S2D-Knoten.

    Log-Analyse unter Azure

    Alarm-Regeln unter WAC und Azure

    Interessant ist nicht nur die On-Demand-Analyse via Abfragen, sondern auch die Alarmierung, wenn Schwellenwerte überschritten werden.

    Alarm für die On-prem-Knoten unter Azure konfigurieren

    Der Verwalter kann an dieser Stelle Bedingungen inklusive Schwellen­werte festlegen und sich über E-Mail oder SMS benachrichtigen lassen. Wichtig, das Windows Admin Center erlaubt die Konfiguration vordefinierter Regeln, Alarme und Benachrichtigungen über Edit alert rule:

    • CPU Auslastung (10 Minuten im Mittel über 85%)

    • Disk Kapazität (Über 80% für 10 Minuten)

    • RAM Nutzung (Über 95% für 10 Minuten)

    • Heartbeat (Weniger als 5 beats in 5 Minuten)

    • Kritische Systemfehler

    • Alarme des Health Service

     

    Keine Kommentare