Integrität und Leistung von VMware vSAN mit vRealize Operations Manager prüfen

    Health-Monitoring für VMware vSANOperations Manager ist eine komplexe Software, deren Beherrschung einen gewissen Lern­aufwand er­fordert. Dank der guten Inte­gration mit vCenter und der Arbeits­weise, die auf der Er­kennung von Verhaltens­mustern basiert, kann man sich für den Anfang auf eine Standard­konfiguration be­schränken.

    Der erste Schritt, um vSAN-Cluster mit dem Operations Manager (vRops) zu überwachen, besteht darin, unter Administration einen neuen Adapter für vSAN zu konfigurieren. Standard­mäßig ist vRops bereits mit vSphere integriert, wobei der vSphere-Adapter bei der Bereitstellung des Operation Manager konfiguriert wird.

    Folgende Abbildung zeigt die vier Solutions VMware vSphere, VMware vSAN, VMware vRealize Log Insight und VMware vRealize Assessments, von denen drei bereits konfiguriert sind und daher Daten empfangen.

    In vRops sind standardmäßig bereits drei Solution vorkonfiguriert und beziehen Daten von den jeweiligen Quellen.

    Zum Konfigurieren des vSAN-Adapters klickt man unter Solutions bei markiertem vSAN-Adapter im Abschnitt Configured Adapter Instances auf das Zahnrad­symbol. Das Einrichten erfordert die Angabe des vCenter-Servers, der das zu über­wachende vSAN verwaltet, sowie passende Anmeldedaten.

    Diese können zum Beispiel ein administrativer SSO-User auf dem vCenter sein oder ein administrativer User einer anderen im vCenter-Server korrekt konfigurierten Identitäts­quelle.  Ein ab­schließender Klick auf "TEST CONNECTION" bringt Gewissheit, ob die Verbindung funktioniert.

    Konfiguration des vSAN-Adapters im Operations Manager. Die Verbindung kann man gleich aus diesem Dialog testen.

    In den erweiterten Einstellungen kann man unter Collectors => Groups noch einstellen, welcher Collector von vRealize Operations Manager zum Verwalten des Adapter­prozesses verwendet wird.

    Der Wert bei Auto Discovery hingegen legt fest, ob neue Objekte, die man dem überwachten System künftig hinzufügt, nach der Erst­konfiguration des Adapters automatisch erkannt werden. Mit Enable SMART data collection auf True aktiviert man die SMART-Datenerfassung für physische Festplattengeräte. Die vCenter ID ist ein global eindeutiger Bezeichner, der dieser vCenter-Instanz zugeordnet ist (VC-UUID).

    War die Konfiguration des Adapters erfolgreich, dann taucht im vCenter vSphere Client unter Verwaltung => Lösungen => Client-Plugins das VMware vRops Client Plugin auf, das im Normalfall auch bereits aktiviert ist, bzw. hier aktiviert und deaktiviert werden kann.

    Nach der erfolgreichen Konfiguration des vSAN-Adapters erscheint das vRops-Plugin im vSphere Client.

    Der wichtigste Lohn der Mühe aber ist, dass vRops nun im Menü vRealize Operations unmittelbar eine Reihe von Dashboards mit den wichtigsten operativen Daten zu vSphere einblendet.

    vRops-Dashboards im vSphere Client

    Jetzt genügt ein Klick auf Quick-Links oben rechts, um an die wichtigsten vSAN-Betriebsdaten zu gelangen. Die folgende Abbildung zeigt das Dashbard Überblick.

    vSAN-Übersicht im vRealize Operations Manager

    Ebenfalls unter Quicklinks => vSAN findet sich die Cluster-Ansicht.

    Übersicht für vSAN-Cluster in vRops

    Diese verrät bereits an dieser Stelle, dass der vSAN-Cluster aus 3 Hosts besteht, demzufolge 3 Cache-Datenträger vorhanden sind, 11 VMs im vSAN-Datastore liegen, die Deduplizierung aktiviert ist, dass noch rund 2, 5 TB Kapazität frei ist und dass keine kritischen Warnungen vorliegen.

    Außerdem findet sich unter Quick-Links eine direkte Abkürzung zur vRops-Oberfläche. Meldet man sich an dieser mit den konfigurierten Nutzerdaten an (unterstützt werden die Identitäts­quellen Local Users oder vCenter-SSO), dann könnte man beispiels­weise zuerst zur Envrionment-Ansicht wechseln und sich überzeugen, dass es für die vSAN World keine Health-, Risk- oder Efficiency-Warnungen gibt.

    Indikatoren zu Health, Risk und Efficiency für diverse vSphere-Komponenten

    Anschließend klappt man links im Navigations­bereich beispielsweise den Knoten VMware vSAN auf. Der Teilbaum unter vSAN präsentiert dann die vSAN-Cluster-Ansicht.

    vSAN-Cluster-Ansicht im Operations Manager

    Ein Klick auf more … => Reports würde uns dann zur Ansicht Report Templates führen. Hier könnte man dann das Template Optimize Performance auswählen und dann auf das Symbol für Run Template klicken, um einen ausführlichen Performance-Optimierungs-Report zu generieren.

    Vorkonfigurierte Reports in vRealize Operations Manager

    Dieser lässt sich dann bequem als PDF herunterladen.

     Performance-Optimierungs-Report als PDF herunterladen

    Der Report bietet unter anderem ein Ranking der VMs mit den höchsten Lese- und Schreib­latenzen auf Strorage-Ebene. Natürlich gibt es in einer komplexen Software wie dem Operations Manager viele Möglich­keiten, an ähnliche oder gleiche Informationen zu gelangen. Der direkte Weg zu den Berichten führt über das Hauptmenü unter Reports.

    Reports sind nur ein Weg, um an Betriebsdaten von vSAN zu gelangen. Eine weitere Methode, vom Start weg sinnvoll mit der Software zu arbeiten, ohne sich Custom-Dashboards zu bauen, ist die Ansicht Views im Dashboards-Menü. Hier finden sich zahlreiche vorkonfigurierte Ansichten wie etwa Cluster IOPS vSAN.

    Vorkonfigurierte Ansichten in vRops, hier für IOPS von vSAN-Cluster

    Ebenfalls nicht schaden kann es, im Home-Menü die Ansicht Troubleshoot für vSAN zu öffnen.

    vRops-Ansicht für das Troubleshooting von vSAN

    Diese offenbart zum Beispiel, dass zwei virtuelle Maschinen noch nicht aufgelöste Snapshots haben und einer weiteren virtuellen Maschine der Plattenplatz ausgeht. Da dieser Umstand kritisch ist, lohnt es sich dem Link zu den Details zu folgen, um dort weiterzuforschen.

    Alerts für Objekte eines vSAN-Clusters

    Dies ist jetzt zwar kein spezifisches vSAN-Thema mehr, demonstriert aber die Mächtigkeit von vRops. Die Empfehlung lautet hier, die betroffene virtuelle Disk in der VM zu vergrößern.

    Da die Funktionalität von vRealize Operations Manager zu einem großen Teil auf Machine Learning und der Erkennung von Anomalien basiert, könnte man das Setup nun so ohne weitere Maßnahme zwei bis drei Wochen laufen lassen.

    Keine Kommentare