StorNext, un acelerador de descubrimientos científicos

StorNext ayuda al CERN a acelerar en la investigación de partículas

A la hora de explorar los orígenes del universo, nos enfrentamos al reto de gestionar volúmenes de datos masivos, lo que puede suponer una tarea de proporciones galácticas. Tras mucho investigar, probar y comparar, el CERN, el laboratorio puntero a nivel mundial en la investigación de física de partículas, eligió el software de StorNext para la administración de los datos. El resultado: Un sistema que permite acceder a un vasto repositorio de datos y compartirlo en un entorno de computación de alto rendimiento. 

Miles de millones de bits de datos por segundo

El CERN es la organización europea dedicada a la investigación en física nuclear y tiene su sede central en Suiza. Uno de los experimentos que allí se desarrollan se denomina ALICE (acrónimo en inglés de Un gran experimento de colisionador de iones). Este proyecto tiene como fin investigar la física de la materia. Para ello se procede a acelerar partículas y a hacerlas colisionar unas contra otras. ALICE es fruto de la colaboración internacional de más de 1000 físicos, ingenieros y técnicos, procedentes de 30 países. Juntos cooperan y contribuyen a resolver uno de los desafíos clave de la física fundamental: averiguar el origen de la materia.

Por medio de detectores, ALICE recopila vastísimas cantidades de datos, generados por las colisiones entre partículas. Pierre Vande Vyvre, jefe de proyecto de adquisición de datos de ALICE, fue la persona responsable de diseñar un sistema de administración de la información robusto que comprendiese la adquisición, la selección, la transferencia, el almacenamiento y la gestión de datos para administrar esos miles de millones de bits de datos que se generan cada segundo.

Por si los requisitos no eran suficientemente complicados ya, el experimento ALICE se desarrolla a tres kilómetros de distancia del principal centro de computación del CERN, donde residen los datos, alojados en sistemas de almacenamiento masivo. Otro desafío para el proceso de adquisición de datos radicaba en el sistema de archivos Linux instalado, que no era suficiente para compartir datos entre nodos con la facilidad y rapidez necesarias.

Ventaja: Adquisición de datos rápida y eficaz

El equipo del CERN analizó y sopesó varias opciones disponibles para conformar un sistema de archivos agrupados en clústeres (CFS). Los principales requisitos para el CFS eran: máximo rendimiento de ancho de banda agregado, mínimo impacto en el equipamiento de hardware (la sala de adquisición de datos de ALICE era bastante pequeña), escalabilidad para administrar el volumen de clientes (hasta 100 nodos de usuarios) y, por último, lo más importante, independencia entre el CFS y el hardware subyacente.

Tras varias semanas de pruebas a fondo, el equipo se decidió por StorNext. Durante la fase inicial de implementación, el equipo comenzó con un servidor, un cliente y una matriz de discos. Actualmente, el sistema consta de 180 puertos 4G de Fibre Channel y 75 matrices de almacenamiento de datos transitorios. Hay 105 nodos que acceden a los datos a través de Fibre Channel. La arquitectura de almacenamiento de ALICE también cuenta con 90 clientes LAN distribuidos por StorNext, que acceden a los datos a través de IP.

Una de las ventajas clave de StorNext deriva de su funcionalidad Affinity. Esta característica permite que el personal dirija los datos a discos primarios específicos escribiendo el punto de relación asociado con las afinidades. Ello conlleva que todos los equipos informáticos pueden cooperar a máximo rendimiento en todo momento.

"StorNext nos ofrece alta velocidad, operaciones con flujos de trabajo compartidos y archivado por varios niveles a gran escala, justo lo que ALICE requería", explica Vande Vyvre.