借助 StorNext 加快科学发现

StorNext 帮助 CERN 加快粒子研究

对于探索宇宙起源而言,管理海量数据可能是一项极其艰巨的任务。经过多次研究和测试,全球首屈一指的粒子物理实验室 CERN 选择 StorNext 软件来进行数据管理。成效: 可在一个高性能计算环境中访问和共享海量数据的系统。 

每秒数十亿比特的数据

CERN(欧洲粒子物理研究所)总为位于瑞士,其正在进行的一项实验名为 ALICE(大型粒子对撞机实验)。ALICE 是一项旨在通过加速粒子运行使其发生碰撞而达到研究物质物理的目的的实验,这是一项国际合作实验,由来自 30 个国家和地区的 1000 多位物理学家、工程师和技术人员合作完成。他们强强联手,共同解决基础物理学中的一个最原始问题: 追叙物质的起源,

ALICE 使用探测器收集了粒子碰撞生成的海量数据。ALICE 数据收录项目负责人 Pierre Vande Vyvre 承担着两项任务,一是设计一套能够可靠收录、选择、转移和存储数据的信息系统,二是负责管理每秒数十亿比特的数据。

使情况更加复杂的是,ALICE 实验是在离 CERN 主计算机中心 3 公里以外的地方开展,而数据都存储在该计算机中心的大量存储系统上。数据收录工作的另一项挑战是,所用的 Linux 文件系统不够,无法在节点之间快速便捷地共享数据。

优势:高效的数据获取

CERN 团队研究了组建集群文件系统 (CFS) 可用的数个不同备选项。CFS 的主要必备条件包括最高的聚合带宽性能,硬件设备的空间占用最小(因为 ALICE 数据收录作业室空间狭窄),可扩展性足以管理大量客户端(最多 100 个用户节点), 最后一个,也是最为重要的一个,在 CFS 和下层硬件之间保持独立性。

在经过数周的精细测试后,该团队选择了 StorNext。在实施初始阶段,该团队从一个服务器、一个客户端和一个磁盘阵列开始。现在,该系统包含 180 个光纤通道 4G 端口和 75 个过渡数据存储阵列。有 105 个节点通过光纤通道访问数据。ALICE 存储基础架构上还有 90 个通过 IP 访问数据的 StorNext 分布式 LAN 客户端。

StorNext 的其中一个关键优势来自于它的“相关性”功能。借助此功能,该团队只需将数据写入相关性的关联关系点,即可将数据导向至特定的主磁盘。这就意味着所有计算机将永远以最佳性能性能运行。

Vande Vyvre 表示:“StorNext 提供了 ALICE 所需的高速、共享工作流操作和大规模、多层归档。”