Institut Suisse de Bioinformatique (ISB)
Pour aller plus loin, les chercheurs doivent disposer d’un jeu d’outils approprié. La plate-forme de stockage multiniveau StorNext® accélère l’ingestion des données ainsi que leur déplacement vers une archive, tout en les tenant à la disposition des bioinformaticiens afin qu’ils puissent poursuivre leurs travaux.

 

- Professeur Ioannis Xenarios
Directeur du groupe Vital-IT, Institut Suisse de Bioinformatique (ISB)

Eureka ! Craquage du code « omique » avec StorNext à l’Institut Suisse de Bioinformatique (ISB)

L’Institut Suisse de Bioinformatique (ISB) est en première ligne de la prochaine grande révolution qui va bouleverser les sciences de la vie, à savoir l’application de méthodologies informatiques à diverses sciences bioinformatiques comme la génomique et la protéomique. L’ISB axe de plus en plus ses recherches sur la génomique appliquée afin d’améliorer la qualité de vie.

« L’ISB a récemment travaillé sur un algorithme destiné au dépistage prénatal de maladies telles que le syndrome de Down », explique le Professeur Ioannis Xenarios, directeur du groupe Vital-IT. « Un simple prélèvement sanguin effectué sur la mère à la onzième semaine de grossesse nous permet de procéder au séquençage du matériel génétique du fœtus in utero. Cette technique est moins invasive et beaucoup moins risquée qu’une amniocentèse traditionnelle. Elle démontre par ailleurs l’impact croissant de la génomique dans nos vies quotidiennes. »

Défis liés à la gestion d’un volume hebdomadaire de plus de 30 To de données

L’ISB dirige six centres de séquençage et quelque 300 équipes de recherche, avec jusqu’à 30 To de données générés chaque semaine.

« Au cours des dernières années, la vitesse de séquençage s’est nettement accélérée », déclare Roberto Fabbretti, chercheur principal et responsable informatique au Vital-IT. « Nous traitons par conséquent plus de projets que jamais auparavant, ce qui entraîne une croissance très rapide des volumes de données. »

Préservation des données associées aux travaux de recherche à long terme

« La recherche dans des domaines comme la cancérologie ou l’immunothérapie implique la collecte d’importants volumes de données séquencées pour chaque patient », souligne M. Xenarios. « Si le patient revient toutes les semaines ou tous les mois, les chercheurs doivent bénéficier d’un accès fiable et ultrarapide à l’ensemble des données des analyses précédentes. Pour étendre nos efforts en bioinformatique à des dizaines de milliers de patients, nous devons trouver un moyen économique de conserver les données génomiques pendant 20, 30 ou 40 ans en vue d’un suivi efficace du parcours du patient, de sa vie prénatale à sa mort. »

Stockage hautes performances à l’échelle du pétaoctet

Aujourd’hui, Vital-IT s’appuie sur la plate-forme de stockage en mode « scale-out » StorNext de Quantum pour son infrastructure de recherche. Quatre systèmes StorNext distincts assurent aux chercheurs un séquençage et une analyse rapides des données. Cela représente près de 1 Po de stockage primaire et 4 Po d’archives économiques sur bande. StorNext garantit un traitement hautes performances via le protocole IP sur Infiniband, conserve les données actives sur le stockage primaire à des fins d’analyse et transfère automatiquement les fichiers vers une archive sur bande AEL à mesure qu’elles vieillissent. Plus de 600 utilisateurs accèdent aux données directement depuis l’un des datacenters, ou à distance par le biais d’une interface CIFS.

Disponibilité continue des données génomiques pour les recherches grâce à un accès en libre-service

« Les données recueillies et analysées par nos chercheurs nous fournissent aujourd’hui de précieux renseignements, mais peuvent également s’avérer utiles plusieurs mois ou années après avec la sortie de nouvelles applications d’analyse à même d’extraire davantage d’informations de ces mêmes séquences brutes », explique M. Fabbretti. « StorNext nous permet d’archiver tous nos projets de manière économique, quelle que soit leur durée. »

Les fichiers archivés sont toujours visibles aux chercheurs, à l’endroit du système de fichiers où ils s’attendent à les trouver, si bien qu’ils sont facilement accessibles sans l’aide du département informatique.

« Pour aller plus loin, les chercheurs doivent disposer d’un jeu d’outils approprié », confie M. Xenarios. « La plate-forme de stockage multiniveau StorNext® accélère l’ingestion des données ainsi que leur déplacement vers une archive, tout en les tenant à la disposition des bioinformaticiens afin qu’ils puissent poursuivre leurs travaux. »

Protection automatisée des données les plus précieuses au monde

« StorNext ne se contente pas d’accélérer la capture des données : il automatise l’archivage et en réduit le coût pour nous aider à remplir notre rôle de dépositaires des données », explique M. Fabbretti. « Nous effectuons systématiquement deux copies des fichiers sur bande. L’une d’elles reste disponible dans l’archive, tandis que l’autre est externalisée en vue d’une protection renforcée en cas de panne matérielle ou de sinistre d’un site. »

« Les données que nous traitons comptent parmi les plus précieuses au monde », ajoute M. Fabbretti. « StorNext nous offre une capacité d’archivage de plusieurs pétaoctets, une protection des données à long terme et la possibilité de revenir à une version antérieure des fichiers. Autant de facteurs essentiels à notre stratégie. »

L’ISB paré à affronter l’avenir grâce à une solution évolutive

« StorNext accompagne notre croissance depuis plus de six ans. Nous pouvons désormais ajouter des disques et augmenter la capacité en toute simplicité chaque fois que nécessaire. En fait, nous sommes allés au-delà de la génomique en stockant et en protégeant des données de recherche médicale générale. La capacité de StorNext à intégrer aisément des niveaux de stockage supplémentaires, de type objets ou Cloud par exemple, dans notre workflow de stockage à mesure que nos besoins augmentent est cruciale pour nous. »

Principaux avantages

  • Ingestion hautes performances accélérant les workflows de recherche génomique
  • Performances et capacité facilement extensibles pour gérer une croissance hebdomadaire des données de 30 To
  • Données de recherche prêtes à être réutilisées grâce à des niveaux de stockage primaire et d’archivage garantissant un parfait équilibre entre coûts et performances
  • Protection automatique des données génomiques les plus précieuses à l’aide de plusieurs copies d’archive
  • Prise en charge des niveaux de stockage objets et dans le Cloud de nouvelle génération de Quantum pour une grande facilité d’évolution

À propos de l’Institut Suisse de Bioinformatique et du groupe Vital-It

L’Institut Suisse de Bioinformatique (ISB) est une fondation universitaire à but non lucratif créée en 1998 qui fédère quelque 60 groupes de recherche et de services en bioinformatique, et environ 700 scientifiques issus des plus grands établissements d’enseignement supérieur et instituts de recherche suisses. L’ISB coordonne la recherche et l’enseignement en bioinformatique dans toute la Suisse, et offre des services de bioinformatique à la communauté nationale et internationale de chercheurs en sciences de la vie. Le groupe Vital-IT de l’ISB fournit les ressources de calcul, l’infrastructure de stockage, l’aide au développement et l’expertise en bioinformatique dont la communauté scientifique de l’ISB a besoin pour mener à bien ses projets de recherche. Il soutient en outre les pratiques cliniques des établissements médicaux partenaires.