StorNext tiene el ADN ideal para el trabajo

¿3000 millones de pares de bases de ADN? Para StorNext, no hay problema

Pocas tareas requieren un tráfico y procesamiento de datos más intenso que secuenciar los 3000 millones de bloques químicos que conforman el ADN de los 24 cromosomas de la especie humana. Administrar esos datos resultaba un desafío verdaderamente frustrante, hasta que el Centro de secuenciación del genoma humano (HGSC) de la Facultad de Medicina de la Baylor University optó por implantar la tecnología StorNext de Quantum. El resultado: Administración de datos rentable con acceso instantáneo compartido a gigantescos volúmenes de contenido de investigación. 

Volumen excesivo de datos para la capacidad del sistema previamente instalado

Puesto que se trata de uno de los tres centros de Estados Unidos a la cabeza de la investigación sobre la influencia de la genética sobre las enfermedades, en el HGSC trabajan docenas de científicos, que se encargan de analizar los datos de la secuenciación del ADN. Diariamente se generan cantidades elevadísimas de datos y es necesario que cientos de terabytes permanezcan accesibles para el análisis en todo momento. Con estos factores, la infraestructura tecnológica que había instalada en el HGSC se estaba convirtiendo en un obstáculo para investigaciones de gran importancia.

En 2008, cuando Geraint Morgan fue nombrado director de sistemas de información, el volumen de los datos ya se acercaba al límite de la capacidad de almacenamiento del HGSC. Además, se preveía que creciese en 20 petabytes aproximadamente a lo largo de los dos años siguientes. Por si no fuese suficiente, otro reto lo planteaba la necesidad de administrar de forma centralizada un completo entorno heterogéneo, en el que cohabitaban servidores, redes y tecnologías de almacenamiento.

StorNext, una solución triunfadora en el campo de los Big Data

Morgan no tardó en percatarse de cuál era el nombre que destacaba siempre que se fijaba en cómo abordaban estos desafíos otras empresas e instituciones que trabajaban con Big Data: StorNext, de Quantum.

"StorNext ofrecía la escalabilidad que necesitábamos, era compatible con el hardware de almacenamiento ya existente y no requería una inversión significativa en más equipos de hardware. Además, era un sistema fácil de administrar", explica Morgan.

Para que fuese posible compartir archivos entre diversos entornos operativos y para contar con la oportunidad de mover los datos de forma automatizada entre los distintos niveles de almacenamiento, HGSC adquirió el sistema de archivos StorNext File System y también el administrador de almacenamiento Storage Manager.

Actualmente, después de que los dispositivos locales de escaneado del genoma procesen los datos, se copian en un sistema de archivos StorNext centralizado. Diversas aplicaciones de análisis genómico funcionan sobre la base del cliente de LAN distribuido de StorNext, que se pone en conexión con el almacenamiento centralizado para procesar los datos en paralelo. StorNext Storage Manager traslada automáticamente los datos entre los distintos sistemas de disco y una biblioteca de cintas Quantum Scalar, protegiendo así el contenido a costos más reducidos.

Desde la implementación de StorNext, Morgan afirma estar encantado con los beneficios.

"Debido a la naturaleza de la investigación en genómica, tenemos que preservar todos los datos que se generan en el HGSC. Tal vez los datos generados hoy no tengan un valor obvio, pero podrían desencadenar hallazgos muy importantes en el futuro", explica. "Por este motivo se crea un archivo que crece sin cesar y StorNext desempeñará una función clave, ayudándonos a administrar esa expansión. El crecimiento exponencial de los datos es una de las razones por las que hemos pensado en aprovechar las posibilidades de la función de deduplicación de datos que StorNext ofrece. Nos permitirá optimizar el espacio de almacenamiento necesario para el archivado".