Performance und Health von VMware vSAN mit Bordmitteln überwachen

    Diagramm zur vSAN-Performance im vSphere ClientWaren die Über­wachungs­möglich­keiten für vSAN in den frühen Versionen noch ziem­lich rudi­mentär, so ist die Lösung für hyper­konvergente Infra­strukturen in­zwischen so popu­lär, dass VMware ent­sprechende Funk­tionen ausgebaut hat. Der folgende Beitrag kümmert sich primär um die Inte­grität und Leistungs­analyse.

    Erste Anlaufstelle für das Überwachen von vSAN ist im deutschen vSphere Client der Abschnitt vSAN im Tab Überwachen, nachdem man im Navigator das betreffende Cluster-Objekt markiert hat. Hier sind die Untermenüs Integrität, Kapazität, Leistung und Leistungs­diagnose von Interesse.

    Integritätsprüfung

    Auch wenn die Leistungs­diagnose im Vordergrund steht, ist es von Zeit zu Zeit sinnvoll, die Integritäts­prüfung für vSAN zu wiederholen. Hierzu klickt man unter vSAN => Integrität rechts oben auf die Schaltfläche "ERNEUT TESTEN".

    Aktuelle vSAN-Versionen erlauben das Testen mit und ohne "Online-Integrität". Letztere dauert maximal 2 Minuten und vergleicht die bestehende Konfiguration mit der VMware Online-Datenbank.

    Der Online-Integritätstest prüft die vSAN-Konfiguration anhand einer VMware-Datenbank.

    Der Funktion liegt der vSAN-Integritäts­dienst zugrunde. Dieser überwacht den Status von Cluster-Komponenten, diagnostiziert ggf. Probleme und empfiehlt Maßnahmen zur Fehler­behebung.

    Die Prüfungen umfassen die Hardware-Kompatibilität (HCL), die Konfiguration und den Betrieb des Netzwerks, erweiterte vSAN-Einstellungen und die Integrität der Speichergeräte sowie von VM-Objekten.

    Das Ergebnis könnte aussehen wie in folgender Abbildung:

    Ergebnis der vSAN-Integritätsprüfung im vSphere Client

    Wie unschwer zu erkennen ist, sind die Integritäts­prüfungen in Kategorien wie Cluster, Hardwarekompatibilität, Leistungsdienst, Netzwerk, Physische Festplatten, Daten, Stretched Cluster, Kapazitäts­nutzung, Onlineintegrität und vSAN-Build-Empfehlung unterteilt, und jede enthält eigene Prüfroutinen.

    Die Integritäts­prüfung umfasst eigene Test für viele Komponenten eines vSAN-Clusters.

    Klickt man auf eines der uner­wünschten Resultate (gelb oder rot), zeigt der vSphere Client die Ursache für die Beanstandung.

    Bei Warnungen oder Fehlern kann man sich die Ursache für das Problem anzeigen lassen.

    In der obigen Abbildung hat der Test festgestellt, dass  der Netzwerk­diagnose­modus unnötiger­weise länger als 24 Stunden aktiviert war. Dieser wird von VMware nur zur Fehlersuche empfohlen, da er im Normal­betrieb unnötige Netzwerklast erzeugt.

    Überwachen der vSAN-Leistung

    Der Leistungsdienst erfasst und analysiert Statistiken im vSAN-Cluster, um die Daten zu visualisieren.

    Grafische Darstellungen der vSAN-Leistungsstatistiken

    Angezeigt werden die Leistungs­diagramme bei markiertem Cluster-Objekt im Tab Überwachen unter vSAN => Leistung. Ist der vSAN-Leistungs­dienst eingeschaltet, zeigt die Cluster-Übersicht eine Zusammen­fassung der vSAN-Performance inklusive IOPS, Durchsatz und Latenz für VM, BACK-END und (falls aktiviert) iSCSI.

    Der Anzeige­zeitraum kann zwischen 1 und 24 Stunden oder benutzer­definiert ab einem gewünschten Startdatum festgelegt werden. Hat man übrigens den vSAN-Cluster im vSphere-Client erstellt, dann ist der Leistungs­dienst automatisch aktiv. Das gilt aber nicht für den Flash-basierten Web Client.

    Darüber hinaus müssen alle Hosts im vSAN-Cluster mindestens auf Version 6.5 sein. Dann kann man bei aktiviertem vSAN-Leistungsdienst jederzeit detaillierte Statistiken nicht nur für den Cluster anzeigen, sondern auch für Hosts, Festplatten­gruppen und Laufwerke im vSAN-Cluster. Außerdem lassen sich Leistungs­diagramme für virtuelle Maschinen und virtuelle Festplatten konfigurieren.

    Folgende Abbildung zeigt die verfügbaren Metriken auf Host-Ebene (VM, Back-End, Festplatten, Physische Adapter, Hostnetzwerk).

    Metriken für das vSAN-Hostnetzwerk

    Darüber hinaus lässt sich selbstver­ständlich auch der vSAN-Datastore im vSphere Client überwachen, und zwar unterteilt in Nutzung nach Dateityp und Speicherplatznutzung nach VMs.

    Dashboard zur vSAN-Nutzung

    Überwachen der Kapazität

    Darüber hinaus gibt es bei markiertem vSAN-Cluster im Tab Überwachen unter vSAN => Kapazität noch die detaillierte vSAN-Kapazitäts­überwachung.

    Übersicht zur genutzten und verfügbaren vSAN-Kapazität mit Daten zu Dedup und Komprimierung.

    Die Anzeige KAPAZITÄTSNUTZUNG umfasst den gesamten, den verwendeten, den freien und reservierten Speicher sowie jenen, der auf den vSAN-Festplatten tatsächlich beschrieben oder physisch verbraucht wird.

    Sind in einem vSAN-Cluster mit Enterprise-Lizenz Deduplizierung und Komprimierung aktiviert, lassen sich auf diese Weise auch die dadurch erzielten Einsparungen und die Kompressionsrate anzeigen. Im Bereich Analyse der nutzbaren Kapazität können Anwender den verfügbaren freien Speicher auf Basis der Speicherrichtlinie schätzen, die man unter Beibehaltung der Deduplizierungsrate von 1 ausgewählt hat.

    Der dritte Abschnitt Nutzungs­aufschlüsselung vor Deduplizierung und Komprimierung segmentiert hingegen die Daten über die Kategorien VM-Nutzung, Benutzerobjekte und Systemnutzung.

    Aufschlüsselung der vSAN-Datennutzung nach Kategorien

    Schließlich können Nutzer die Anzeige der Kapazitäts­nutzung mit der Schaltfläche KAPAZITÄTS­VERLAUF auch auf eine zeitliche Darstellung für einen bestimmten Datumsbereichs umstellen.

    Zeitlicher Verlauf der Kapazitätsnutzung, bei Bedarf nach individuellen Datumsbereichen

    Nicht unterstütztes Diagnose-Tool

    Schließlich gibt es bei markiertem vSAN-Cluster im Tab Überwachen unter vSAN => Leistungs­diagnose noch ein von VMware mitgeliefertes Diagnose­werkzeug. Es analysiert vom vSAN-Leistungs­dienst zuvor erfasste Benchmarks.

    Das Tool kann Probleme erkennen und Schritte zur Fehler­behebung vorschlagen. Die gewünschten Benchmarks wählt man im Menü Benchmark-Ziel aus, dazu zählen Max. IOPS, Max. Durchsatz oder Max Latenz. VMware rät aber selbst davon ab, diese Funktion für eine allgemeine Auswertung der Leistung auf einem produktiven vSAN-Cluster einzusetzen.

    Keine Kommentare