Pascal Slijkerman

Tijd voor datacenter vernieuwing en op zoek naar iets anders dan een Storage Area Network (SAN) oplossing? Gebruik maken van de voordelen van HyperConverged? Dan kan Storage Spaces Direct (S2D) wel eens dé oplossing zijn. Met Storage Spaces Direct (S2D) bouw je aan een schaalbare, betrouwbare en snelle HyperConverged en Software Defined infrastructure voor een mogelijk lagere prijs dan een traditionele Hyper-V of VMWare oplossing met SAN. Haal meer snelheid uit traditionele harde schijven, door deze met Solid State Drives (SSD) te combineren, of kies voor de extreem snelle Non-Volatile Dual In-line Memory Module (NVDIMM) en Non-Volatile Memory Express (NVME) disk drives, om over miljoenen IOPS te kunnen beschikken. Door gebruik te maken van standaard hardware met lokale schijven van onder andere HPE, Dell, Lenovo, DataOn en Fujitsu, krijg je meer voor een fractie van de prijs.

Disaggregated model

In de wereld van de virtualisatie wordt veel gebruik gemaakt van een traditionele setup met een SAN. Middels fibre channel of Internet Small Computer Systems Interface (ISCSI), wordt capaciteit vanaf het SAN ontsloten aan de Hypervisors in de vorm van disks. Deze disks worden gebruik door de Hypervisor om de VMs op te kunnen plaatsen. Dit model wordt vaak het disaggregated model genoemd waarbij storage en compute los staan van elkaar.

Blog Hyper V InSpark 1

 

Sinds Windows Server 2012, ondersteund Microsoft naast Fiber channel of ISCSI een 3e optie, namelijk het gebruik van SMB3. Over Server Message Block versie 3 (SMB3) kunnen VM’s vanaf shares op een File Server gehost worden. De File servers zijn verbonden met een SAN, NAS (Network Attached Storage) of DAS (Direct Attached Storage), in combinatie met Storage Spaces waar de Hyper-V omgevingen de VM’s vanaf draait.

SMB3 heeft zich inmiddels bewezen als een snel, betrouwbaar en dynamisch protocol wat makkelijker te beheren is dan ISCSI en Fiber varianten. SMB3 en Storage Spaces zetten de deur open naar nieuwe mogelijkheden.

HyperConverged model

Met de komst van Windows Server 2016, is de functie Storage Spaces Direct beschikbaar gekomen en kan je met Hyper-V voor een HyperConverged model gaan. Waar in een disaggregated scenario de storage (SAN) en compute (Hyper-V Hosts) los staan van elkaar, zijn deze bij het HyperConverged model volledig geïntegreerd. Dat wil zeggen dat de node zorgt voor de compute en storage. Plaats je nodes bij, resulteert dat in extra capaciteit en daarmee stijgt de capaciteit op meerdere vlakken. Extra rekenkracht, extra geheugen, extra opslagcapaciteit maar ook extra snelheid van de storage door meer disks.

Wat is Storage Spaces Direct

In een tijd waar veel bedrijven denken aan zogenaamde Software Defined technologie, kan ook Storage niet achter blijven. Met de Storage Spaces feature virtualiseer je eigenlijk de storage. Storage Spaces geeft je de mogelijkheid om schijven in een systeem te bundelen tot een grote opslagpool. Over deze pool kan je virtuele volumes aanmaken op basis van een software RAID, die over de hele pool van alle schijven een stukje capaciteit en I/O gebruikt. Hiermee gebruik je dus alle schijven in de pool om lees of schrijf acties uit te voeren, wat de snelheid bevorderd. Een algemeen bekende storage regel geldt ook hier; meer spindels (schijven) is meer snelheid. Omdat we uiteraard een stuk resiliency willen, wordt standaard een three-way mirror principe gebruikt voor de virtuele volumes. Elk block wordt 2x extra weggeschreven (totaal 3 keer). Microsoft adviseert een three-way mirror omdat Hard Disk Drive (HDD) ruimte relatief goedkoop is en de klantdata uiterst belangrijk. Hiermee houdt Microsoft het voor S2D gelijk aan de Azure Storage principes, waarbij alle data ook minimaal 3 keer opgeslagen wordt.

Waar het bij Storage Spaces bleef bij een enkel systeem, gekoppeld aan disk enclosures met een Scale Out File Server cluster, kan je met de Storage Space Direct feature de storage pool over meerdere systemen bouwen. Zo genereer je meer snelheid, capaciteit en hogere beschikbaarheid. Op het moment van schrijven kun je tot 16 systemen in een Storage Space Direct cluster plaatsen

All flash en hybride systemen

Welke disks in de disk pool gezet worden, kan variëren op basis van de behoefte van de workload. Het wordt niet ondersteund om enkel te draaien met traditionele HDD’s. Daarmee is de instap eigenlijk een hybride variant met HDD’s en SSD’s. Hierbij functioneren de SSD’s als cache en de HDD’s als capaciteit. Er zijn verschillende combinaties mogelijk op basis van de verschillende type storage: SSD en HDD, NVME en HDD, all flash met NVME en SSD of Storage Class Memory (SCM) met of NVME of SSD of HDD. Genoeg combinatie mogelijk die allemaal hun eigen prijs en performance verhoudingen hebben.

 

Redundantie en hoge beschikbaarheid

Net als in traditionele storage oplossingen, moet ook bij Storage Spaces Direct rekening gehouden worden met uitval van componenten. Elke node kan de uitval van schijven opvangen zonder downtime. Wordt de schijf gebruikt voor cache, valt S2D terug op minder cache capaciteit, valt er een capaciteit-disk uit, dan zal naar verloop van tijd de data ergens anders herschreven worden. Als er een hele node uitvalt, kan de omgeving nog door draaien op de andere kopieën van de data, die verspreid staan over de andere nodes in het cluster. Middels Fault domains kan data bewust ergens weggeschreven worden, om uitval van een fault domain op te kunnen vangen zoals een rack of een site.

Netwerk en Remote Direct Memory Access (RDMA)

Bij Storage Spaces Direct worden disks uit meerdere systemen bij elkaar in een pool gezet, zoals eerder beschreven. Hier bovenop wordt een volume geplaatst, die middels een two-way of three-way mirror zorgt voor data reciliency. Het overbrengen van deze datakopieën, moet met de hoogst mogelijke snelheid gerealiseerd worden. Pas als alle kopieën van de block zijn weggescheven, krijgt de applicatie namelijk pas akkoord voor de volgende transactie. Deze synchrone replicatie van data vereist een zeer lage latency, ook bij hoge doorvoer snelheden. Het advies is daarom om gebruik te maken van RDMA. RDMA zorgt voor lage latency met een lage CPU belasting, omdat de data rechtstreeks van en naar het RAM geheugen word gezet. Het juist inrichten van de netwerk stack om correct gebruik te maken van RDMA is cruciaal om een snelle en betrouwbare werking te garanderen.

Gevalideerde hardware

Software-Defined Datacenter (SDDC) is een algemene term die doorgaans verwijst naar een datacenter waarin hardware, zoals compute, networking en storage, wordt beheerd door een software laag en een soort virtualisatie. Virtualisatie is de sleutel en het betekent simpelweg dat de hardware en software in het datacenter verder gaan dan een traditionele één-op-één-verhouding. Het gebruik van jouw Windows Server Software-Defined Datacenter, vereist en goede samenwerking tussen hardware en software. Het kiezen van de juiste hardware-infrastructuur is een cruciale eerste stap naar succes. Microsoft werkt samen met diverse hardware leveranciers om een door Microsoft gevalideerde SDDC oplossingen samen te stellen voor verschillende technologieën. Microsoft-partners bieden een reeks Windows Server Software Defined (WSSD) -oplossingen die werken met Windows Server 2016, om high-performance, hyperconverged, opslag- en netwerkinfrastructuur te leveren.

Disaster Recovery

Ook al zijn er verschillende vormen van bescherming tegen uitval van componenten, kan het voorkomen dat een hele omgeving onbeschikbaar wordt door wat voor reden dan ook. De Storage Replica feature biedt de mogelijkheid data ook naar andere datacenters of clusters te repliceren, voor bijvoorbeeld disaster recovery. Storage Replica kan gebruikt worden boven op Storage Spaces Direct om bepaalde volumes synchroon of Asynchroon te repliceren en in geval van disaster op een andere locatie te kunnen importeren.

Kosten

De Storage Spaces Direct feature zit in de Windows Server 2016 Datacenter editie, vrijwel alle Hyper-V hosts worden met deze licentie uitgerust. Daarmee is Storage Spaces direct licentie technisch gratis in het HyperConverged scenario. Bij een disaggregated scenario worden de hosts enkel gebruikt voor storage en moeten er extra Windows Server Datacenter Licenties afgenomen worden.

De belangrijkste voordelen

Ongeëvenaarde prestaties: Of het nu all-flash of hybride spaces direct oplossingen is, de snelheden gaan ver boven 150.000 mixed 4k random IOPS per server met consistente, lage latency. Dankzij de embbeded Hyper-V architectuur zorgt de ingebouwde lezen/schrijven-cache en ondersteuning voor NVME en Storage Class Memory voor ongeëvenaarde snelheden bij microseconden latency.
Fout tolerantie: Ingebouwde fout tolerantie voor disks-, servers- of andere componenten met hoge beschikbaarheid. Grotere omgevingen kunnen ook gebruik maken van fout toleranties op basis van chassis, rack of site. Als de hardware defect gaat, is het een kwestie van wisselen en de software zorgt automatisch voor herstel, zonder complexe beheertaken.
 Beheerbaarheid: Gebruik Quality of Service (QoS) om extreem drukke VM’s te beperken, zodat andere VM’s hier niet onder leiden. De Health Service biedt continue ingebouwde bewaking en waarschuwingen en door nieuwe API’s kun je eenvoudig uitgebreide, cluster-brede prestaties en capaciteitmetrische gegevens verzamelen.
Schaalbaarheid: Breid uit naar 16 servers per cluster en meer dan 400 drives voor maximaal 1 petabyte (1000 terabytes) aan opslag per cluster. Als je wil uitbreiden, kun je gewoon stations of meer servers toevoegen. Storage Spaces Direct zorgt automatisch dat de beschikbare drives in gebruik genomen worden. Opslagefficiëntie en prestaties verbeteren bij elke uitbreiding.

More to come!

Microsoft werkt hard aan nieuwe features voor S2D. Storage Spaces Direct is in zijn eerste generatie en aangezien Azure Stack leunt op dezelfde techniek, zullen nieuwe features snel beschikbaar komen. Storage Spaces Direct in combinatie met Project Honolulu gaat veel management functionaliteit en biedt near realtime performance weergaven bieden. Bij InSpark zitten we erg dicht op het vuur en kennen we inmiddels veel ins en outs van Storage Spaces Direct. Overal komen geluiden over Storage Spaces Direct vandaan.

SHARE
Pascal Slijkerman

Consultant Hybrid Datacenter

Ook interesse gekregen?
Ik kan je in een vrijblijvend gesprek meer vertellen over Storage Spaces Direct en de mogelijkheden voor jouw organisatie
Altijd up to date?
Blijf op de hoogte van de laatste innovaties. Geef aan welke mailings jij maandelijks wil ontvangen. Schrijf je nu in!
  • Dit móeten we mededelen:
    Wanneer je op aanmelden drukt ga je akkoord met ons privacy policy.