|
Die Zeit ist reif für Clustered Storage
Date: Wednesday 1 October 2008
Author: Peter Kistner, Direktor Zentraleuropa, Isilon Systems


Leistungsstärke, Kapazität und Verfügbarkeit von Servern durch den Einsatz von Cluster-Technologien zu skalieren ist wahrlich nichts Neues. Anders verhält es sich hingegen mit Clustered Storage. In der Vergangenheit häufig in die Nische High-Performance-Computing gedrängt, sind auf entsprechenden Architekturen aufbauende Lösungen jedoch bereits heute aus vielen Unternehmen nicht mehr wegzudenken. Still und heimlich traten sie ihren Siegeszug zunächst in Branchen an, in denen die Verarbeitung und Speicherung von Unmengen unstrukturierter Daten zum Tagesgeschäft gehört. Hierzu zählt zweifelsohne die Film-, Medien-, Unterhaltungs- und Internetindustrie, dicht gefolgt von den Segmenten Life Sciences und Engineering. Nun schickt sich die schnell aufstrebende neue Speicherarchitektur an, sich auf breiter Basis zu etablieren.
Paradigmenwechsel in der Welt der Datenspeicherung
Die Clustered-Storage-Idee scheint angekommen zu sein. Bestes Indiz hierfür ist sicherlich, dass inzwischen große Player in den Markt drängen, in dem sich bislang ausschließlich die Pioniere auf diesem Gebiet, allesamt innovative Start-ups, tummelten. Es scheint also etwas dran zu sein an dem Konzept, ein Paradigmenwechsel bevorzustehen. Rückblickend kaum verwunderlich, ließen doch verschiedene Entwicklungen schon frühzeitig den Schluss zu, dass neue Speicherarchitekturen gefragt sind.
Entwicklung 1: Datenberge
Geht es um den Anstieg der Datenmengen in den kommenden Jahren, sind sich die Experten einig. Explosionsartig soll es sein; astronomisch sind die Zahlen, die diese Entwicklung belegen. Das US-amerikanische Analystenhaus IDC spricht von einer Steigerungsrate, die im Schnitt bei 60 Prozent jährlich liegt. Ausgehend von dem im Jahr 2007 bereits mit 281 Exabyte (281 Milliarden Gigabyte) bezifferten Gesamtvolumen hieße das hochgerechnet, dass wir im Jahr 2011 rund 1.800 Exabyte (1,8 Zettabytes oder 1,8 Milliarden Terabytes) an Informationen erzeugen – eine kaum fassbare Summe. Übereinstimmung herrscht auch dahingehend, dass die Flut an unstrukturierten Daten – hierzu zählen unter anderem E-Mails und Texte aber auch Bild-, Video- und Autodateien – althergebrachte Speichersysteme an die Grenzen ihrer Leistungsfähigkeit treiben. Denn diese sind auf die Verarbeitung strukturierter Informationen – Einheiten mit kleiner, gut verdaulicher Dateigröße – und die Abwicklung einer großen Zahl an Transaktionen ausgelegt. Geht es jedoch darum, große Dateivolumen zu bewältigen, die hohe Anforderungen an die Durchsatzrate stellen, und mit neuen Zugriffsmustern zurecht zu kommen, sind diese Lösungen überfordert. Nach dem „Scale-up"-Prinzip vorzugehen mag zwar ein Ansatz ein, um auf die Schnelle die Performance und Kapazität der bestehenden Lösung auszubauen. Dies führt jedoch zu monolithischen Systemen, die neue Probleme aufwerfen. Denn selbst die modernsten NAS- und SAN-Produkte unterliegen architektonischen Einschränkungen. Hervorzuheben ist hier vor allem, dass „Speicherinseln" durch eine begrenzte Skalierbarkeit sowie durch Performance- und Verfügbarkeitsengpässe den Verwaltungsaufwand und die Kosten in die Höhe schrauben.
Entwicklung 2: Clustered Computing
Servercluster sind aus Rechenzentren kaum noch wegzudenken. Proprietäre Mainframes und symmetrische Multiprozessorsysteme sind längst von kleineren Rechnern abgelöst worden, die auf Standard-Hardware basieren und mit Linux oder Windows arbeiten. Dies lässt sich leicht an den weltweit erzielten, beständig zunehmenden Serverumsätzen ablesen. Die Gründe für die Umstellung liegen auf der Hand: Die Vernetzung handelsüblicher Systeme bietet Vorteile in punkto Skalierbarkeit, Performance und Ausfallsicherheit, außerdem kann die Arbeitslast besser verteilt werden. Und dies alles zu einem Bruchteil der Kosten. Clustered Storage überträgt die Clusteridee in die Welt der Datenspeicherung und bestimmt daher, analog zum Wandel in der Serverwelt, die Storage-Architekturen der Zukunft.
Entwicklung 3: Schnellere, günstigere Standardhardware
Die Entwicklungszyklen im Hardwaresektor verkürzen sich seit Jahren dramatisch. Ergebnis sind immer leistungsfähigere Standardsysteme bei gleichzeitig abnehmenden Preisen. Hersteller von Clustered Storage profitieren ebenso wie Unternehmen von dieser Tendenz. Denn die fallenden Preise für Prozessoren, Hauptspeicher und Bandbreite ermöglichen ersteren, erschwingliche auf handelüblicher Hardware aufsetzende Systeme anzubieten. Letzeren stehen hochskalierbare und zuverlässige Lösungen zur Verfügung, mit denen sie die beständig wachsende Flut an unstrukturierten Daten in den Griff bekommen können. Und dies zu einem attraktiven Preis-Leistungsverhältnis.
Clustered Storage: Vor- und Nachteile der verschiedenen Lösungsansätze
Mit Clustered Storage betritt also neben Direct Attached Storage (DAS), Storage Area Networks (SANs) und Network Attached Storages (NAS) eine weitere Architektur die Bühne. Grundprinzip ist, zwei oder mehr Storage-Komponenten zu einer Einheit zusammenzuschließen. Derzeit werden drei verschiede Formen unterschieden: Das einfache Zwei-Wege-Clustering, die Virtualisierung und Distributed Clustered Storage.
2-Wege-Clustering Das 2-Wege-Clustering sollte architektonische Schwachstellen traditioneller Ein-Kopf-Speicher wie beispielsweise eine geringe Fehlertoleranz und eine mangelnde Redundanz ausmerzen. Hierbei kommt ein reines Failover zwischen redundanten Server-/Controller-Heads zum Tragen. In der Praxis ist dieser Lösungsansatz allerdings kaum umgesetzt worden. Ursachen hierfür sind vor allem in der von Hause aus eingeschränkten Performance und Skalierbarkeit zu sehen. Weitere Faktoren sind sicherlich die ausschließliche Unterstützung kleiner Dateisystemgrößen, die komplexe Verwaltung und die vergleichsweise hohen Kosten für Hochverfügbarkeit. In Verbindung mit dem raschen Anstieg unstrukturierter Daten erfüllen diese Lösungen nicht die künftigen Anforderungen von Unternehmen.
Speichervirtualisierung
Bei diesen Clustered-Storage-Lösungen, die sich oftmals aus einer Kombination von Soft- und Hardware sowie Switches zusammensetzen, treten die Systeme gegenüber den zu einzelnen Gruppen zusammengeführten Platten als eine virtuelle Einheit auf. Sie erzeugen einen einzigen Speicher-Adressraum, dies erleichtert das Management. Typischerweise erfolgt die Darstellung in Form von „künstlichen Baumstrukturen", die einen Cluster von NAS-Servern oder Speichergeräten umfassen. Dem Anwender erscheinen diese Silos als Gesamtheit, in denen sich Daten beliebig ablegen lassen und auf die zentral zugegriffen werden kann. Solche Lösungen mögen auf Grund der Anschaffungskosten auf den ersten Blick reizvoll erscheinen. Dennoch stellt sich das Problem, dass keine einheitliche Architektur sondern „Speicherinseln" das Bild bestimmen – allerdings nun mit einer zusätzlichen Virtualisierungsebene. Ausbau, Konfiguration und Management gestalten sich komplex; dies führt auf langfristige Sicht zu hohen Betriebskosten.
Distributed Clustered Storage
Als am fortgeschrittensten und leistungsstärksten gelten heute Distributed-Clustered-Storage-Lösungen wie sie Isilon Systems in der fünften Generation anbietet. Die Produkte der IQ X-Serie arbeiten mit einem einheitlichen Filesystem und setzen momentan den Standard für Scale-out File-Storage-Architekturen am Markt. Der Einsatz der Produkte ermöglicht, unternehmensweit verteilte Datenbestände in Speicherpools zusammenzuführen und Anwendern den gemeinsamen und direkten Zugriff auf die digitalen Informationen einzuräumen. Die hierfür nötigen intelligenten Funktionen werden über das Dateisystem OneFS bereitgestellt; dieses verbindet traditionelle Storage-Architekturen wie File-System, Volume-Manager und RAID sinnvoll in einer Softwareschicht miteinander. Ein Höchstmaß an Datensicherheit und ein effizientes Management gewährleisten der Einsatz der zusätzlich angebotenen Anwendungen SnapshotIQ, SmartConnect, SmartQuotas und SyncIQ.
Auch in Sachen Skalierbarkeit sind kaum Grenzen gesetzt. Durch das Hinzufügen oder die Kombination in sich geschlossener Nodes, die jeweils mit CPU, Cache und Speicher ausgestattet sind, lässt sich das Distributed-Clustered-Storage-System nahezu unbegrenzt erweitern. Zu den weiteren Stärken zählen hohe
Verfügbarkeit, Zuverlässigkeit und Gesamtdurchsatz sowie eine einfache Handhabung angefangen von der Installation bis hin zum Management. Leistungsdaten wie 2,3 PByte in einem einzigen Filesystem, mehr als 20 GByte/s aggregierter Schreib- und Lesedurchsatz sowie die Möglichkeit, durch einfache Erweiterung 10-GBit-Netzwerktechnologie mit extrem hohen Durchsatzraten einzuführen, erschließen hier völlig neue Dimensionen.
Fazit
Obwohl die Zeichen gut stehen, dass sich Distributed-Clustered-Storage-Systeme durchsetzen, wäre der „One-size-fits-all"-Ansatz der Falsche. Nach wie vor und wie bei der Auswahl aller IT-Lösungen bestimmt der Anwendungsbereich die Entscheidung für oder gegen ein Produkt. Unstrukturierte Daten mit hohem Wachstumsraten, und/oder großen Anforderungen an die Bandbreite, dies ist der perfekte Anwendungsfall für Clustered Storage.
|