発見!Swiss Institute of Bioinformatics(SIB)がStorNextでオーミクス・コードを解析

SIBは、将来の生命科学における革命の最前線におり、ゲノミクスやプロテオミクスなどの生物情報科学に数理手法を適用しています。SIBでの仕事は、生活の質を改善するための応用ゲノミクスに焦点が当てられています。

Vital-ITグループのディレクタを務めるIoannis Xenarios博士は次のように述べています。「SIBでは最近、ダウン症などの条件を調べる出生前診断テストのアルゴリズムの研究を行っています。妊娠11週目の母親から採血するだけで子宮内の胎児の遺伝子配列を決定することができます。これは低侵襲性であり、従来の羊水検査よりもリスクがはるかに少ない方法です。つまり、これは、ゲノミクスが私たちの日常生活でより身近なものになってきていることを示しています」

週に30TB以上のデータ増加がデータ管理にもたらす固有の課題

SIBでは、6つの解析センターを運営し、週に30TBものデータを生成する約300の研究チームをサポートしています。

Vital-ITグループの主任研究員兼ITマネージャであるRoberto Fabbretti氏は次のように述べています。「過去数年の間に、配列決定は以前よりもはるかに高速になってきています。つまり、かつてないほど多くのプロジェクトが動いており、データも急増しているということです」

長期的な研究では、データの管理能力が要求される

Xenarios博士は次のように述べています。「癌や免疫療法などの分野の研究のために、私たちは患者ひとり一人の配列決定データを大量に取得しています。そうした患者が週単位または月単位で次々に現れる場合、先行するテストのすべてのデータを迅速かつ正確に研究者が短時間で利用できるようにする必要があります。生物情報科学の研究成果を数万人の患者に適用するために、ゲノム・データを20年、30年、あるいは40年間保存するための費用対効果の高い方法を見つけ出し、誕生前から死に至るまでの患者の推移を効果的に作成する必要があります」

ペタスケールの高性能ストレージ

Vital-ITグループの研究インフラストラクチャは、現在、クアンタムのStorNextスケールアウト・ストレージでサポートされています。研究者らは、4つのStorNextシステム(ほぼ1ペタバイトのプライマリ・ストレージと4ペタバイトの低コストのテープ・アーカイブ)を使用して遺伝子の配列決定と解析を高速で処理します。StorNextは、IP over Infiniband(IPoIB)通信による高速処理をサポートし、プライマリ・ストレージにアクティブな分析用のデータを保持し、古くなったファイルを自動的にAELテープ・アーカイブに移動します。600人を超えるユーザーが、データセンターの1つにあるデータ、またはCIFSインターフェースを介してリモートにアクセスします。

ゲノミクス・データをいつでも研究に使用できる状態にするセルフサービスのアクセス

「研究者が取得して分析するデータは今日において重要な解答となりますが、また数か月後または数年後に、新しい分析アプリケーションで同じ生の配列から情報を抽出する際にも役立つことが考えられます。StorNextにより、計画されているプロジェクトの期間には関係なく、あらゆるプロジェクトのために費用対効果の高い長期保存を実現できます」と、Fabbretti氏は述べています。

研究者が期待するファイル・システムの場所にアーカイブされたファイルがまだ残っている場合には、ITの力を借りずに直接ファイルにアクセスすることができます。

Xenarios博士は次のように説明します。「研究者に適切なツール・セットを提供しておけば、自分たちで解決します。StorNextの階層型ストレージにより、データをすばやく取得し、迅速にアーカイブに移し、研究者が仕事を継続できるよういつでもデータを利用できる状態にできます」

地球上で最も貴重なデータ・セットを自動保護

Fabbretti氏は次のように述べています。「StorNextは、データをすばやく取得できるようにするだけでなく、自動化された費用対効果の高いプロセスのアーカイブを実現することで、私たちはデータ管理者としての役割を果たすことができるようになります。常に2つのファイル・コピーをテープに作成し、一方はいつでも利用できるようアーカイブに保存し、もう一方はサイトへのハードウェアの障害などに備えた追加の保護レイヤとして保管します」

Fabbretti氏は説明します。「当研究所は、地球上で最も貴重なデータ・セットを扱っています。StorNextにより、マルチペタバイトのアーカイブ体制と長期的なデータ保護が実現され、この戦略の非常に重要な部分である、ファイル・バージョンを簡単にロールバックできる機能が提供されます」

将来に備えたスケーラビリティ

「StorNextは、6年以上にわたって当研究所の成長を支えてきました。ディスクと容量は必要に応じて簡単に追加できることも分かっています。実際、ゲノミクスに留まらず、一般的な医学研究のデータ・セットを格納し保護してきました。ワークフローが拡大する際に、StorNextによって、クラウドやオブジェクト・ストレージなどのレイヤをストレージのワークフローに容易に追加できることは重要です」