StorNextで科学的な発見を促進

StorNextがCERNの素粒子研究を促進

宇宙の起源を探求するような場合、大量のデータの管理は膨大な作業になることがあります。世界をリードする素粒子物理学研究所であるCERNは、データ管理ソフトウェアについて多くの調査と試験を行った後、StorNextソフトウェアを選択しました。その結果、高性能のコンピューティング環境で大量のデータにアクセスし、共有できるシステムが生まれました。

毎秒数10億データ・ビット

スイスに本部があるヨーロッパ共同原子核研究機構CERNでは、ALICE (A Large Ion Collider Experiment)と呼ばれる実験が行われています。素粒子を加速し、衝突させることによる物質の物理学の研究専用の実験であるALICEでは、30か国から集まった1,000人以上の物理学者、エンジニア、技術者による国際的な共同研究が行われています。彼らは共同で基礎物理学の最初期からの課題の1つである、物質の誕生の解明に取り組んでいます。

ALICEでは検出器を使って、素粒子衝突によって生成される大量のデータを収集します。ALICE Data Acquisitionのプロジェクトリーダー、Pierre Vande Vyvre氏は、毎秒何10億ビットも生成されるデータを管理するための強固なデータ取得、選択、転送、保管、および処理機能を備えた情報管理システムの設計を請け負いました。

さらに複雑な要件として、ALICEの実験はデータが大容量ストレージ・システムに置かれているCERNの基幹コンピュータ・センターから3 km離れた場所で行われています。 データ取得プロセスのもう1つの課題は、導入されていたLinuxファイル・システムでは、ノード間でデータをすばやく簡単に共有するには、十分ではなかったことでした。

メリット: 高速、効率的なデータ取得

CERNチームでは、クラスタ化されたファイル・システム(CFS)で利用できるものがないか、いくつかのオプションを調査しました。CFSの主な要件は、最大の集約帯域幅のパフォーマンス、ハードウェア機器向けの最小のフットプリント(ALICE Data Acquisitionの実験室は本当に小さな部屋でした)、膨大なクライアント数に対応できるスケーラビリティ(最大100ユーザーノード)、および最重要事項として、CFSとその基盤となるハードウェア間の独立性でした。

数週間、詳細な試験を実施した後、チームはStorNextを選びました。導入の初期段階で、チームは1台のサーバー、1台のクライアントおよび1台のディスク・アレイで開始しました。このシステムは現在180基のファイバー・チャネル4Gポートと75台の過渡データ・ストレージ・アレイで構成されています。105ノードがファイバー・チャネル経由でデータにアクセスしています。また、ALICEストレージ・アーキテクチャには、IP経由でデータにアクセスする90台のStorNext分散LANクライアントもあります。

StorNextの主要なメリットの1つはアフィニティ機能から生まれるものです。この機能を利用すれば、チームはアフィニティに関連する関係ポイントに書き込むことにより、特定のプライマリ・ディスクに直接データを書き込むことができます。つまり、すべてのマシンが常時、最大のパフォーマンスで動作できます。

「StorNextは、ALICEで要求される高速の共有ワークフロー処理と大規模な階層型アーカイブを提供します」とVande Vyvre氏は述べています。