StorNext ist prädestiniert für den Job

Drei Milliarden DNS-Bausteine? Kein Problem für StorNext.

Die menschliche DNS setzt sich aus 24 Chromosomen zusammen, die wiederum aus drei Milliarden Basenpaaren bestehen. Es gibt nur wenige datenintensivere Aufgaben als die Sequenzierung dieser chemischen Bausteine. Die Verwaltung dieser riesigen Datenmengen stellte eine gewaltige Herausforderung dar, bis das Human Genome Sequencing Center (HGSC) des Baylor College of Medicine auf StorNext-Lösungen von Quantum umgestiegen ist. Das Resultat: kosteneffektives Datenmanagement mit gemeinsamem Sofortzugriff auf extrem umfangreiche Forschungsdaten. 

Zu hohes Datenvolumen für das bisherige Speichersystem

Das HGSC gehört zu den drei führenden US-Forschungszentren, die sich mit dem Einfluss menschlicher Gene auf die Entstehung von Krankheiten beschäftigen. Dutzende Wissenschaftler analysieren hier DNS-Sequenzierungsdaten. Für ihre Forschungsarbeit ist es wichtig, dass sie über eine Speicherinfrastruktur verfügen, die die riesigen Mengen der täglich generierten Daten bewältigt und ihnen zu jeder Zeit Zugriff auf die Hunderte von TB archivierter Daten für Analysezwecke bietet.

Als Geraint Morgan 2008 zum Director of Information Systems ernannt wurde, stellte das Datenvolumen bereits eine große Belastung für das vorhandene Speichersystem dar – und sollte in den folgenden zwei Jahren um voraussichtlich mehr als 20 PB ansteigen. Ein weiteres Problem war die zentrale Verwaltung einer komplexen, heterogenen Umgebung mit unterschiedlichen Server-, Netzwerk- und Storage-Technologien.

StorNext – die bewährte Lösung für Big Data

Ein Name tauchte immer wieder auf, als Morgan sich die Lösungen anderer Firmen zum Thema Big Data ansah: Quantum StorNext.

„StorNext bot die Skalierbarkeit, die wir brauchten. Es unterstützt vorhandene Speicher-Hardware, sodass wir nicht mit signifikanten Investitionen in zusätzliche Hardware rechnen mussten, und es ist ein einfach zu verwaltendes System“, erklärt Morgan.

Das HGSC entschied sich für StorNext File System und StorNext Storage Manager, um den gemeinsamen Zugriff auf Dateien über mehrere Betriebssysteme hinweg und die automatische Verschiebung von Daten in verschiedene Speicherebenen zu ermöglichen.

Mit der neuen Lösung werden Daten nach der Einspeisung mit lokalen Genom-Scannern in ein zentralisiertes StorNext File System kopiert. Mehrere Anwendungen zur Genomanalyse werden auf einem StorNext Distributed LAN Client ausgeführt, der mit dem zentralisierten Speicher verbunden ist, sodass Daten parallel verarbeitet werden können. Zur kosteneffektiven Datenhaltung verschiebt StorNext Storage Manager Daten automatisch zwischen verschiedenen Disk-Systemen und einer Quantum Scalar-Tape Library.

Morgan ist mit der neuen StorNext-Lösung sehr zufrieden.

„In der Genomforschung sind die Daten, die in der Gegenwart generiert werden, nicht immer von unmittelbarem Nutzen, doch in der Zukunft könnten sie zu wichtigen Erkenntnissen führen. Daher archivieren wir sämtliche Daten, die am HGSC generiert werden“, so Morgan. „Das Archiv wird somit immer größer, und StorNext wird uns maßgeblich dabei helfen, die wachsenden Datenbestände zu verwalten. Das exponentielle Datenwachstum ist auch einer der Gründe, warum wir die Daten-Deduplizierung von StorNext nutzen möchten. Damit erhalten wir die optimalen Speicherkapazitäten, die wir zur Archivierung benötigen.“