StorNext로가속화되는 과학적 발견

StorNext는 CERN의 입자 연구를 가속화합니다.

우주의 기원을 밝혀내는 데 있어서 방대한 양의 데이터를 관리하는 것은 엄청나게 큰 작업입니다. 입자 물리학 분야를 선도하고 있는 연구소인 CERN은 많은 연구 및 테스팅을 거친 후 데이터 관리를 위해 StorNext 소프트웨어를 선택했습니다. 이에 따른 결과는 다음과 같습니다. 고성능 컴퓨팅 환경에서 다량의 데이터를 액세스 및 공유할 수 있는 시스템. 

매초 수십 억의 데이터 비트

스위스에 본사를 두고 있는 유럽 핵 연구 기관인 CERN에서 진행 중인 실험 중 하나는 ALICE(A Large Ion Collider Experiment)라고 알려져 있습니다. 입자를 가속하여 충돌시킴으로써 물질 물리학을 연구하는 데 전념하고 있는 ALICE에서는 30개 국가에서 모인 1,000명 이상의 물리학자, 엔지니어, 기술자가 협력하고 있습니다. 이들은 모두 함께 힘을 모아 기본 물리학의 가장 오래된 도전 과제 중 하나인 물질의 탄생과 관련된 문제를 해결하는 데 헌신하고 있습니다.

ALICE는 탐지기를 사용하여 입자 충돌을 통해 발생하는 막대한 양의 데이터를 수집합니다. ALICE 데이터 획득 프로젝트 리더인 피에르 번데 비브르(Pierre Vande Vyvre)는 매초 생성되는 수십억 비트의 데이터를 관리하기 위해 상당히 견고한 데이터 획득, 선택, 전송, 스토리지 및 취급 능력이 있는 정보 관리 시스템을 만들어 낼 임무를 부여받았습니다.

설상가상으로, ALICE 실험은 대용량 스토리지 시스템에 데이터가 모여 있는 CERN의 메인 컴퓨터 센터에서 3km 떨어져 있는 곳에서 이루어 집니다. 데이터 획득 과정에서 직면한 또 다른 문제는 현지의 Linux 파일 시스템이 다수의 노드에서 데이터를 신속하고 쉽게 공유할 수 있을 정도로 충분하지 않다는 점이었습니다.

도입 효과 빠르고 효과적인 데이터 획득

CERN 팀은 클러스터 파일 시스템(CFS)으로 사용할 수 있는 다양한 옵션을 조사해 보았습니다. CFS의 주요 요건은 최대 대역폭 성능, 하드웨어 장비의 최소 설치 공간(ALICE 데이터 획득 공간은 상당히 작았음), 대량의 클라이언트를 관리하기 위한 확장성(최대 100개의 사용자 노드), 그리고 가장 중요한 것은 CFS와 기반 하드웨어 사이의 독립성이었습니다.

수주 동안 철저한 테스트를 진행한 후, StorNext가 선택되었습니다. 처음에는 하나의 서버, 하나의 클라이언트, 하나의 디스크 어레이로 시작했습니다. 현재 시스템은 180개의 파이버 채널 4G 포트와 75개의 임시 데이터 스토리지 어레이로 구성되어 있습니다. 파이버 채널에서 데이터를 액세스하는 노드는 105개입니다. ALICE 스토리지 구조는 IP에서 데이터에 액세스하는 StorNext 배포 LAN 클라이언트 90개를 보유하고 있기도 합니다.

StorNext의 주요 도입 효과 중 하나는 친화력(Affinity) 기능에서 나옵니다. 이 기능을 통해 팀은 친화력(affinities)의 연합 관계 포인트에 쓰기를 시행함으로써 데이터를 특정 1차 디스크로 돌릴 수 있습니다. 이는 모든 기기를 항상 최대 성능으로 운영할 수 있다는 의미입니다.

“StorNext는 ALICE에서 필요로 하는 빠른 속도, 공유 워크플로우 운영 및 대규모, 다계층 아카이빙을 전달하고 있습니다.”라고 반데 비브르가 말합니다.