Diagnosedaten eines Azure Stack HCI-Clusters automatisch erfassen

    HCI-Diagnoseinformationen einsammeln mit PowerShellKommt es zu Problemen in einem Cluster, sollte ein Trouble­shooting schnell erfolgen. Die Fehler­suche in einer hyper­konvergenten Infra­struktur ist aufgrund ihrer Komple­xität meist nicht einfach. Ein eigenes PowerShell-Modul sowie das Windows Admin Center helfen beim Sammeln aller Diagnose­daten.

    Microsoft empfiehlt, für Azure Stack HCI zertifizierte Hardware einzusetzen, doch die Freiheit zur eigen­ständigen Konfiguration unter Windows bleibt weiter bestehen. Aber selbst wenn Cluster mit aktivem Storage Spaces Direct (S2D) auf einem soliden technischen Fundament stehen, kann es irgend­wann zu Problemen kommen.

    Mit einem Cmdlet alle wichtigen Daten erfassen

    Steht man vor der Herausforderung, einen Fehler in einem HCI-Cluster zu diagnostizieren, dann existieren dafür mehrere Möglich­keiten. Wie immer gilt bei Windows, dass viele Wege zum Ziel führen können. Erster Einstiegspunkt ist für die meisten Administratoren sicher das Eventlog.

    Doch welche Bereiche sind für ein Cluster-Troubleshooting mit Hyper-V und S2D (hyper-converged) relevant? Ein PowerShell-Cmdlet soll uns dabei helfen: Get-SDDCDiagnosticInfo. Es dient nicht nur der selbstständigen Suche nach Fehlern, sondern kann auch von Microsoft Support Engineers angefordert werden.

    Get-Help liefert alle Infos zur Verwendung des Cmdlets Get-SddcDiagnosticInfo.

    Daten für verschiedene Systemkomponenten

    Das Cmdlet Get-SDDCDiagnosticInfo sammelt unter­schiedlichste Daten ein. Dazu zählen auch Logs und Health Checks. Für Cluster berücksichtigt es dabei:

    • Cluster-Ressourcen
    • Netzwerke
    • die einzelnen Knoten

    Und bei Storage Spaces:

    • Physische Datenträger
    • Virtual Disks
    • Enclosures

    Außerdem noch:

    • Cluster Shared Volumes (CSVs)
    • SMB File Shares
    • Deduplizierung

    Installation auf allen Knoten

    Für die erfolgreiche Diagnose mit PowerShell oder im WAC muss das PrivateCloud.DiagnosticInfo-Modul auf allen Nodes installiert und importiert werden. Dafür füge ich zunächst den NuGet-Provider hinzu:

    Install-PackageProvider NuGet -Force

    NuGet-Provider in PowerShell installieren

    Anschließend kann das Modul installiert und mittels Import-Module importiert werden.

    Install-Module PrivateCloud.DiagnosticInfo -Force
    Import-Module PrivateCloud.DiagnosticInfo -Force

    Installation und Import des Modules PrivateCloud.DiagnosticInfo

    Ein Aufruf von Get-Module zeigt den erfolgreichen Import. Das Modul liegt in Version 1.1.20 vor und ist demnach aktuell (Stand: 26. 01. 2020). Auf PowerShell Gallery können Sie hin und wieder verfolgen, welche Versionierung das Modul durchläuft.

    Über Get-Command lasse ich mir alle Funktionen dazu ausgeben. Interessant in diesem Zusammen­hang ist auch der Alias gsddcdi für Get-SddcDiagnosticInfo.

    Ein Get-Command macht die Funktionen des Moduls sichtbar

    Remote Datenerfassung starten

    Da ich die Diagnosedaten von meinem Remote-Management-Server sammeln möchte, braucht dieser zuvor die Failover Clustering Tools, darunter die Module für PowerShell.

    Um die Diagnosedaten remote erfassen zu können, muss man erst das PowerShell-Modul für das Cluster-Management installieren.

    Erst danach können wir über das Cmdlet Get-SddcDiagnosticInfo die Daten­sammlung und die Health-Checks starten. Mein hyper­konvergenter Cluster mit Hyper-V und S2D heißt hier StackHCI (Cluster Name Object, CNO).

    Datenerfassung mit Get-SddcDiagnosticInfo starten

    Das Abrufen aller nötigen Logs, Konfigurationen, System­informationen und Gesundheits­daten dauert natürlich ein paar Minuten.

    Auch Gesundheitsdaten werden via PowerShell-Cmdlets abgefragt.

    Diagnose-Daten auswerten

    Alle erfassten Daten werden am Ende in einer ZIP-Datei zusammen­gepackt, und wir können mit der Auswertung der Diagnoseinformationen beginnen.

    Das Cmdlet speichert alle gesammelten Daten in einem ZIP-Archiv.

    Innerhalb des ZIPs finden sich EventLogs, Textdateien, XMLs und auch Files für den Performance-Monitor. Die Auswertung bis zum Augenblick der Ereignisse erfordert wie immer Zeit, die gesammelten Daten liefern jedoch alle nötigen Hinweise.

    Diagnose über das Windows Admin Center

    Auch innerhalb des Windows Admin Center (WAC) lassen sich diese Daten erfassen. Unter Cluster Manager befindet sich der Punkt Diagnostics. Hier wird auch die Aktualität des Modules überprüft.

    Auch das Windows Admin Center kann die Diagnosedaten eines HCI-Clusters erfassen.

    Zudem kann man die Diagnos­einformationen regelmäßig einmal pro Tag automatisch erfassen lassen. Das hilft, um Daten vergleichen können und Hinweise auf problematische Ereignisse zu erhalten.

    Keine Kommentare