C'est dans l'ADN de StorNext
Les trois milliards de paires de base de l’ADN ne font pas peur à StorNext
Rares sont les travaux plus gourmands en données que le séquençage des trois milliards de blocs constitutifs de l’ADN des 24 chromosomes humains. Gérer ces données se révélait bien souvent compliqué et décourageant au sein du centre de séquençage du génome humain (HGSC) de la faculté de médecine de l’université Baylor, jusqu’à ce que celui-ci déploie Quantum StorNext. Résultat ? Une gestion des données économiques avec un accès partagé instantané à des volumes colossaux de contenus de recherche.
Un système hérité débordé
Le HGSC est l’un des trois centres qui, aux États-Unis, pilotent les recherches relatives à l’influence des facteurs génétiques sur les maladies, et accueille des dizaines de scientifiques qui analysent les données de séquençage de l’ADN. Il génère quotidiennement des volumes de données considérables et doit permettre d’accéder à tout moment à des centaines de téraoctets à des fins d’analyses. Son importante infrastructure technologique hétérogène devenait un frein à d’importantes recherches.
En 2008, quand Geraint Morgan avait été nommé directeur informatique, le volume des données mettait déjà les fonctionnalités de stockage de HGSC à rude épreuve et, selon les prévisions, devait encore augmenter de 20 pétaoctets dans les deux années à venir. À cela s’ajoutait la difficulté d’assurer la gestion centralisée d’un environnement hétérogène complexe de serveurs, de réseaux et de technologies de stockage.
Le Big Data est inscrit dans les gènes de StorNext
Lorsqu’il s’est intéressé à ce que faisaient les autres sociétés confrontées aux défis du Big Data, Geraint Morgan s’est vite rendu compte qu’un nom revenait souvent, celui du logiciel StorNext de Quantum.
« StorNext proposait l’évolutivité que nous recherchions, la prise en charge du matériel de stockage existant sans investissement majeur dans de nouveaux équipements physiques et un système facile à gérer », se souvient Geraint Morgan.
HGSC s’est équipé du système de fichiers StorNext et de StorNext Storage Manager pour pouvoir partager des fichiers entre des systèmes d’exploitation différents et transférer automatiquement des données entre plusieurs niveaux de stockage.
Aujourd’hui, après avoir été ingérées sur les dispositifs locaux de numérisation, les données du génome sont copiées vers un système de fichiers centralisé StorNext. Plusieurs applications d’analyse du génome s’exécutent au-dessus du client LAN distribué StorNext, qui se connecte au système de stockage centralisé pour traiter les données en parallèle. StorNext Storage Manager transfère automatiquement les données entre les différents systèmes de disques et une librairie Quantum Scalar, ce qui permet de protéger le contenu pour un coût plus faible.
Geraint Morgan est très satisfait des avantages liés au déploiement de StorNext.
« La nature des recherches sur le génome — les données générées aujourd’hui n’ont pas forcément de valeur pour l’instant mais pourraient conduire à des découvertes importantes à l’avenir — nous amène à préserver toutes les données générées au HGSC », indique Geraint Morgan. « Cela crée une archive toujours plus volumineuse, et l’aide de StorNext sera essentielle pour nous aider à gérer cette croissance. L’augmentation exponentielle du volume des données est aussi l’une des raisons pour lesquelles nous prévoyons d’exploiter la fonctionnalité de déduplication de données de StorNext ; celle-ci nous permettra d’optimiser la capacité de stockage dont nous avons besoin pour l’archivage. »