VMware vSAN 6.2: Dedup, Komprimierung, RAID 5 und 6, QoS, Prüfsummen

    Architektur von VMware vSANRund zwei Jahre nach der Einführung von Virtual SAN (vSAN) stellte VMware bereits die vierte Version des verteilten Speichersystems vor. Dennoch bestehen viele Neuerungen von vSAN 6.2 in Features, die zur Standard­ausstattung von Enterprise Storage gehören, wie etwa die Deduplizierung und Komprimierung der Daten.

    Virtual SAN fasst die lokalen Laufwerke von ESXi-Hosts zu einem Pool zusammen, auf dessen Basis es Policy-basierte Speicherdienste zur Verfügung stellt. Die Knoten eines vSAN-Clusters dienen gleichzeitig zur Ausführung von virtuellen Maschinen, so dass sie Compute und Storage auf der gleichen Hardware integrieren. vSAN ist somit für VMware ein zentraler Baustein zur Einrichtung einer Hyper-converged Infrastructure.

    Ineffiziente Nutzung von Speicherplatz

    Nach der anfänglichen Positionierung von vSAN als Speicher zweiter Klasse, der sich nicht für kritische Anwendungen eignete, baute VMware seine Software für anspruchsvollere Aufgaben aus. So erlaubt sie seit der Version 6.0 eine Skalierung auf bis zu 64 Knoten und unterstützt All-Flash-Konfigurationen, mit 6.1 kamen der Support für Stretched Cluster und Fault Tolerance hinzu.

    Ein wesentliches Manko von vSAN war bis dato die relativ ineffiziente Nutzung von Speicherplatz. Um bestimmte VMs redundant vorzuhalten, stand nur RAID-1 (Mirroring) zur Verfügung. Sollte eine Applikation gegen den Ausfall von  Knoten geschützt werden, dann erforderte dies drei Spiegel der VM. Der Höchstwert lag bei der Absicherung gegen 3 Ausfälle mit 4 Kopien.

    RAID-5 und 6 im Cluster

    Dies ändert sich nun unter vSAN 6.2, wo die Daten zusammen mit den Parity-Informationen über mehrere Knoten verteilt werden ("Erasure Coding"). Für eine RAID-5-Konfiguration sind mindestens 4-Node-Cluster erforderlich, bei RAID-6 benötigt man 6 Knoten. RAID-5 kann den Ausfall eines Knotens und RAID-6 den von zwei Knoten kompensieren. Soll eine Anwendung den Defekt von 3 Knoten überstehen, dann muss man weiterhin auf RAID-1 zurückgreifen.

    Neben RAID-1 unterstützt vSAN 6.2 auch RAID-5 und RAID-6 (Erasure Coding)

    Während also vSAN in der Vergangenheit für eine zwei- oder dreifache Redundanz 200 bzw. 300 Prozent des Speicherplatzes benötigte, kommt RAID-5 bei 3 + 1 Knoten mit zusätzlichen 33 Prozent für die Parity-Informationen aus. RAID-6 speichert diese doppelt und benötigt 50 Prozent extra bei einer Konfiguration von 4 + 2.

    Bei RAID-5 und RAID-6 werden Daten und Parity-Informationen über alle Cluster-Knoten verteilt.

    Dedup und Kompression

    Für eine effiziente Nutzung von Speicherplatz sollen nun auch die Deduplizierung und die Komprimierung der Daten sorgen. Beide Mechanismen arbeiten Hand in Hand, so dass sie nur zusammen aktiviert werden können.

    Solange Anwendungen laufend auf bestimmte Daten zugreifen und diese verändern, bleiben sie unmodifiziert im Cache. Erst wenn sie als "kalt" eingestuft werden, gelangen sie auf den permanenten Speicher. Bei diesem Übergang erfolgt die Deduplizierung, so dass VMware sie als "near-line" bezeichnet.

    Die Deduplizierung erfolgt erst, sobald Daten aus dem Cache entfernt werden.

    vSAN berechnet für jeden Block zuerst einen eindeutigen Hash-Wert. Ist dieser bereits vorhanden, dann legt die Dedup-Routine nur einen Zeiger auf den existierenden Block an. Gibt es ihn jedoch noch nicht, dann werden die Daten im nächsten Schritt komprimiert.

    Die Komprimierung arbeitet auf Basis von 4KB-Blöcken. Schafft sie es, die Größe der Daten um mehr als 50 Prozent zu reduzieren, dann erfolgt die Speicherung in komprimierter, andernfalls in unkomprimierter Form.

    Dedup und Komprimierung nur für All-Flash-Storage

    Die wichtigste Einschränkung für die neuen Features zur effizienteren Nutzung von Storage besteht darin, dass sie nur All-Flash-Konfigurationen unterstützt. Hybride Umgebungen, die eine Kombination aus Disks und SSD verwenden, bleiben damit außen vor. Sie war ursprünglich die einzig zulässige Konstellation, die von vSAN unterstützt wurde.

    Von VMware gibt es keine offizielle Begründung für die Entscheidung, solche fundamentalen Features auf Flash-Storage zu beschränken. Klar ist indes, dass Anwender von Software-defined Storage einen sparsamen Umgang mit Speicherplatz auf diesen teuren Medien erwarten.

    Außerdem dürfte eine Rolle spielen, dass die Wiederherstellung der Daten nach einem Hardware-Defekt eine große Zahl an I/O-Operationen verursacht, wenn Dedup und Komprimierung aktiviert sind. Damit kommen All-Flash-Konfigurationen gut zurecht, während Plattenlaufwerke überfordert sein könnten.

    QoS, Prüfsumme, Wizards

    Neben diesen zentralen Neuerungen bringt vSAN eine Reihe weiterer Verbesserungen:

    • I/O-Beschränkung pro VM: Dieses QoS-Feature soll verhindern, dass eine bestimmte Applikation andere VMs auf dem gleichen Datastore beeinträchtigt, indem sie eine übermäßige Zahl an Ein- und Ausgabe­operationen verursacht. Dieses Feature eignet sich auch für Service Provider, um bestimmte Service Levels zu konfigurieren.
    • Anwender können in vSAN 6.2 eine Prüfsumme pro VM erzeugen. Sie wird nach jedem Schreibvorgang aktualisiert und bei nachfolgenden Lesevorgängen verifiziert. Treten dabei Diskrepanzen auf, die auf defekte Blöcke hinweisen, dann stellt die Storage-Software den korrekten Zustand mit Hilfe eines Mirrors oder der Parity-Informationen wieder her.
    • Performance Service: Der vSphere Web Client enthält künftig eine Reihe von Metriken, die Aufschluss über die Leistung von vSAN geben. Das Virtual SAN speichert diese Daten selbst, so dass sie nicht den vCenter Server belasten.
    • Capacity Views: Dieses Tool liefert eine Reihe von Informationen zur Belegung des Speicherplatzes. Dazu zählen die Größe von virtuellen Laufwerken, Swap-Files, Replicas oder der Parity-Informationen in einer RAID-5/6-Konfiguration.
    • Konfiguration mittels Wizard: VMware positioniert vSAN auch für Zweigstellen oder kleine Umgebungen, da es seit der Version 6.1 auch Cluster mit 2 Knoten unterstützt. In diesem Kontext erwarten Anwender eine einfache Konfiguration, die nun mit Hilfe eines Wizards erfolgt. Solche existieren nun auch für andere Features wie Fault Domains und Stretched Cluster.

    Die Capacity Overview gibt Auskunft über die Speicherbelegung auf einem vSAN.

    Verfügbarkeit

    Virtual SAN 6.2 ist wie seine Vorgänger Bestandteil von vSphere, muss aber separat lizenziert werden. Es wird zum Lieferumfang von vSphere 6.0 Update 2 gehören.

    Wie bereits beim Wechsel auf vSAN 6.0, in welches VMware das Dateisystem von Virsto integriert hatte, ändert sich in der Version 6.2 erneut das On-Disk-Format. Daher muss beim Upgrade eine Disk Group nach der anderen neu aufgebaut werden, was ausreichende freie Speicherkapazität voraussetzt.

    Ist diese nicht vorhanden, dann kann dieser Prozess vorübergehend redundante Daten entfernen, was unter Umständen zu einer eingeschränkten Ausfall­sicherheit während des Upgrades führt.

    Keine Kommentare