Controller, Cache, Laufwerkstypen: Speicher für Storage Spaces Direct planen

    Storage Spaces Direct Disk LayoutStorage Spaces Direct (S2D) fasst die Laufwerke von Cluster-Knoten zu einem hoch­ver­fügbaren Pool zu­sammen. Bevor man dieses Storage bil­det, sollte man die zuläs­sigen Lauf­werks­typen für den Fest- und Zwischen­speicher ver­gleichen sowie die resul­tierende Kapa­zität berechnen.

    Storage Spaces Direct-Cluster in Windows Server 2016 Datacenter, ob con­verged oder hyper-converged, lassen sich relativ flexibel gestalten, um dem vorhandenen Budget, der benötigen Leistung oder SLAs zu genügen. Bei der Auswahl des Laufwerktyps, seiner Kapazität oder Performance und des vorgelagerten Cache bietet Microsoft mehrere Optionen. Um jedoch die nötigen IOPS und Kapazität zu erzielen, sind Voraussetzungen und Berechnungen notwendig.

    Controller für den Storage Spaces Direct-Verbund

    Die Auswahl des Controllers ist essentiell und Microsoft sieht für seine Software-defined Speicherlösung die Verwendung eines einfachen SAS-Hostbusadapters (HBA) vor, welcher Enterprise SAS- und SATA-Laufwerke unterstützt. Erfahrungsgemäß ist Dell´s HBA330 in einem R730xd ein fähiger Kandidat. RAID-Controller sind nicht zulässig und werden nicht unterstützt.

    Wichtig dabei ist der Support für das SES-Protokoll (SCSI Enclosure Services), die aktuelle Cluster-Validierung fragt diese Bedingung jedoch ab. Hintergrund dabei ist, dass S2D dann Enclosures erkennt und die Daten in 256 MB "Slabs" über die Fault Domains (Beispiel hier: Knoten) verteilt, um resiliency zu gewährleisten. SES hilft bei der richtigen Platzierung dieser Slabs. Spätere Volumes werden also bei Erstellung in Slabs unterteilt und verteilt.

    Ob der gewünschte HBA von Microsoft für Windows Server 2016 und S2D zertifiziert ist, lässt sich im Server Catalog verifizieren.

    Mögliche Laufwerkstypen bei S2D

    Die Server im Verbund, das sind 2 bis 16 mögliche Knoten, müssen immer eine identische lokale Laufwerks­ausstattung aufweisen. Mögliche Laufwerks­typen können dann SATA- oder SAS-HDD, SSD und auch PCIe-NVMe-Datenträger (AIC oder M.2) mit niedrigen Latenzen sein.

    Eine Ausstattung, die vollkommen auf HDDs basiert, ist aus Gründen der mangelhaften Leistung unzulässig. Mögliche Konfigurationen bestehen somit aus All-Flash oder einem Hybrid-Design. Vorgeschaltete performante Flash-Speicher eines Hybrid-Entwurfes werden automatisch für ein Lese-/Schreib-Caching verwendet und sind generell nicht Teil des späteren Pools.

    Cache-Datenträger

    Ein performanter Zwischenspeicher dient bekannter­maßen als Beschleuniger bei nachgelagerten günstigeren Speichern, ein Cluster für Storage Spaces Direct kann mit oder ohne eines solchen konfiguriert werden. In einer All-Flash-Konfiguration sind Cache-Laufwerke (Journal Devices) nicht unbedingt erforderlich.

    Hybride Entwürfe hingegen, bei denen beispiels­weise konventionelle Festplatten als Kapazitäts­speicher dienen, müssen mindestens zwei Cache-Datenträger vorgeschaltet haben. Eine redundante Anzahl dient vor allem der Ausfall­sicherheit, der Software Storage Bus Cache berücksichtigt automatisch die schnellen Datenträger für die Pufferung.

    Get-ClusterS2D zeigt die aktuelle Lab Cache Konfiguration.

    Cache-Laufwerke, hier SSD, sind naturgemäß dann größeren Belastungen ausgesetzt, und die nötige Stand­haftigkeit (Endurance) für die ständigen Schreibzyklen wird in DWPD (Drive writes per day) und TBW (Terrabyte written) angegeben. DWPD bezeichnet die Häufigkeit mit der die komplette Datenträger­kapazität einmal pro Tag wiederholt geschrieben werden kann.

    Hat der SSD-Datenträger eine Kapazität von 800 GB und einen DWPD von 3, können diese 800 GB in seiner angegebenen Garantiezeit 3 x pro Tag neu geschrieben werden. Bei Angabe des Wertes für TBW = 4380 leitet sich der DWPD folgendermaßen ab:

    4380 TBW x 1000 / (5 Jahre x 365 Tage x 800 GB) = 3 DWPD

    Microsoft empfiehlt für S2D hier Werte von min. 3 DWPD oder ein TBW = 7300 bei 5 Jahren Garantie. Als Faustregel für die Größenberechnung des Caches gilt 10 Prozent der reinen Speicher­kapazität (Raw Capacity) pro Knoten, genauere Aussagen vom Hersteller gibt es nicht. Bei 15 TB pro Knoten ergibt das 1,5 TB für den Puffer. Hybrid-Konfigurationen lassen sich später mit Perfmon analysieren (Cash Miss Reads/sec des Counters Cluster Storage Hybrid Disks) und danach ggf. Cache-Laufwerke nachschieben.

    Links: Hybrid Layouts und rechts: All-Flash Designs

    Anzahl der Laufwerke

    Kommen also Cache-Datenträger zum Einsatz, dann beträgt deren minimale Anzahl zwei und jene der dahinter liegenden Kapazitäts­laufwerke vier. Untere Grenzwerte für den Zwischenspeicher und die reine Kapazität werden durch die Cluster-Validierung nicht gezählt, d.h. Ihr Hardware-Partner und Sie sollten hier Bescheid wissen. Partner sind DataON, Dell EMC, HPE, Lenovo, Fujitsu und Supermicro. Folgende Tabelle liefert die unteren Grenzwerte bei der Laufwerks­zusammen­setzung:

    LaufwerkstypMinimum erforderlichZwischenspeichernutzung
    Nur NVMe (gleiches Modell) 4 Kein Cache (nur optional)
    Nur SSD (gleiches Modell) 4 Kein Cache (nur optional)
    NVMe + SSD 2 NVMe + 4 SSD Schreib-Cache
    NVMe + HDD 2 NVMe + 4 HDD Lese/Schreib-Cache
    SSD + HDD 2 SSD + 4 HDD Lese/Schreib-Cache
    NVMe + (SSD + HDD) 2 NVMe + 4 Andere Lese/Schreib-Cache für HDD, nur Schreib-Cache für SSD

    Dabei ist auf eine symmetrische Anordnung in einem bestimmten Verhältnis zu achten, beispielsweise 1:2 = 2 Cache-Datenträger und 4 Kapazitätslaufwerke oder 1:3 usw.

    Nutzbaren Speicher für Storage Spaces Direct berechnen

    Hilfe bei der Berechnung unserer finalen nutzbaren Kapazität bietet Microsofts Storage Spaces Direct Calculator (seit längerer Zeit nur als Preview verfügbar). Im Beispiel wähle ich für meine minimale hybride Ausstattung des 3-Knoten-Clusters folgende Werte:

    Zusammenstellung der Laufwerkstypen- und Kapazitäten

    Die performanten NVMe fließen nicht in eine Kalkulation für die reine Speicher­kapazität ein, sondern werden als Cache-Datenträger berücksichtigt. Weiter lässt sich die Größe des Verbundes bestimmen, je nach Anzahl der Knoten dann auch die Resilienz (2/3-Way-Mirror oder Dual-Parity). Am Ende zeigt der Kalkulator die nutzbare Speicher­kapazität und stellt die Beanspruchung des Pools (max. Größe 1000 TB und max. Laufwerke 416) dar:

    Ergebnis für die angestrebte Konfiguration

    Interessant dabei ist auch eine Empfehlung für die Reserve-Kapazität des Verbundes, welche pro Knoten im Beispiel ein Laufwerk ähnlich eines "Hot-spare" vorsieht, damit Reparaturen unmittelbar und automatisch nach Ausfall eines Datenträgers eingeleitet werden können. Ähnlich deswegen, da hier beliebige Laufwerke des Pools herangezogen werden. Reserve bedeutet dann, spätere Volumes nicht über die gesamte Pool Kapazität zu planen, der Speicher wird nicht komplett allokiert. Durch den 3-Wege Spiegel bieten sich zur Speicherung von Daten letztlich 6 TB (33%) netto.

    Keine Kommentare