유레카! 스위스 생물정보공학 연구소(SIB), StorNext로 오믹스(Omics) 코드 암호 해독

스위스 생물정보공학 연구소(SIB)는 생명 과학 부문의 차세대 대혁명의 선두에 서서 유전체학, 단백체학 및 기타 생물정보학에 컴퓨터 연산 방법론을 적용합니다. SIB의 연구는 삶의 질을 개선시키기 위해 유전체학을 적용하는데 점점 더 초점을 맞추고 있습니다.

Vital-IT 그룹 디렉터인 Ioannis Xenarios 교수는 “SIB는 최근 다운 증후군 같은 조건에 대한 태아 진단 시험을 위한 알고리즘에 대해 연구했습니다. 11주차 산모의 혈액을 채취하여 자궁 내 태아의 유전 형질을 배열할 수 있습니다. 기존의 양수진단에 비해 외과적 시술은 줄고, 위험성도 훨씬 낮습니다. 또한, 이는 유전체학과 우리 일상의 밀접성이 얼마나 커지는 지를 보여줍니다."라고 설명합니다.

주당 30TB씩 증가하는 데이터를 관리하는 이슈가 대두되었습니다.

SIB는 6개의 염기서열분석 센터를 운영하며, 주당 최대 30TB씩 증가하는 데이터를 관리하여 약 300개의 연구팀을 지원하였습니다.

Vital-IT의 선임 연구원겸 IT 관리자인 Roberto Fabbretti는 "지난 몇 년간, 염기서열분석은 훨씬 빨라졌습니다. 즉, 우리는 그 언제보다 많은 프로젝트를 수행하고 있으며, 우리의 데이터는 매우 빠르게 증가하고 있습니다."라고 설명합니다.

연구소가 지속적으로 발전하기 위해서는 데이터 관리가 매우 중요합니다.

Xenarios 교수는 "암이나 면역 요법 같은 영역에 들어가면, 연구소는 각 환자에 대한 염기서열 데이터를 대량으로 처리해야 합니다. 만약 환자가 주 단위 또는 월 단위로 진료를 받으러 올 경우, 연구원들은 짧은 시간 안에 이전 테스트의 모든 데이터를 빠르고 정확하게 확인할 수 있어야 합니다. 수만 명의 환자들을 지원할 수 있도록 생물 정보학 업무를 확대하기 위해서는 환자의 출생 이전부터 사망까지의 일생을 효과적으로 보여주는 게놈 데이터를 20년, 30년, 40년 동안 보존할 수 있는 비용 효과적인 방법을 찾아야 합니다.

페타급 고성능 스토리지

현재 Vital-IT는 퀀텀의 StorNext 스케일 아웃 스토리지로 연구 IT 인프라를 지원하고 있습니다. 연구원들은 약 1PB의 주 스토리지와 4PB의 경제적 테이프 아카이브 등 4대의 별도 StorNext 시스템으로 빠르게 염기서열을 분석할 수 있게 되었습니다. StorNext는 IPoIB(IP over Infiniband)를 이용하여 고성능 처리를 지원하고, 액티브 데이터를 분석하기 위해 주 스토리지에 보관하며, 파일이 오래되면 자동으로 AEL 테이프 라이브러리로 이동시켜줍니다. 600명 이상의 사용자가 데이터 센터 중 하나에 있는 데이터에 액세스하거나 CIFS 인터페이스를 통해 원격으로 액세스할 수 있습니다.

셀프 서비스 액세스 권한으로 유전체학 데이터 항시 이용

Fabbretti는 "우리 연구원들이 캡처하고 분석하는 데이터는 오늘날 중요한 해답을 주기도 하지만, 몇 달 혹은 몇 년 후 새로운 분석 애플리케이션이 동일한 원시 염기서열에서 정보를 추출할 수 있을 때에도 도움이 될 가능성이 있습니다. StoreNext를 통해 프로젝트 기간이 계획보다 지연되어도 지속되는 기간에 관계 없이 모든 프로젝트를 비용 효과적으로 장기간 아카이브할 수 있게 되었습니다."라고 말합니다.

아카이브된 파일은 연구원들이 파일 시스템에서 어디에 있는지 예상할 수 있는 곳에 있기 때문에 IT 지원 없이 쉽게 직접 액세스할 수 있습니다.

Xenarios는 "연구원들에게 정확한 툴 세트를 제공하면, 그들은 한계를 초월합니다. StorNext 계층 스토리지는 데이터를 신속하게 아카이브로 옮기고 이용 가능한 상태로 유지하여 생물정보공학자들이 작업을 지속할 수 있게 해 줍니다."라고 말합니다.

지구상에서 가장 귀중한 데이터세트 자동 보호

Fabbretti는 "StorNext는 데이터를 빠르게 액세스할 수 있도록 해 줄 뿐 아니라, 아카이브를 비용 효과적인 자동 프로세스로 만들어 데이터 관리자의 임무를 수행하는데 도움이 됩니다. 우리는 항상 테이프의 파일 사본을 두 개 만들어, 하나는 아카이브에 다른 하나는 볼팅되어 다른 곳에 보관하여 하드웨어 고장 또는 사이트 손상으로부터 보호할 수 있는 추가적 계층을 만듭니다."라고 말합니다.

Fabbretti는 또 "우리는 지구상에서 가장 귀중한 데이터를 다루고 있습니다. StorNext는 몇 페타바이트의 아카이브 용량, 장기 데이터 보호, 쉽게 롤백할 수 있는 파일 버전을 제공하며, 이는 그러한 전략에서 매우 중요한 역할을 합니다."라고 설명합니다.

SIB의 미래 대비의 관권은 확장성

"StorNext는 지난 6년 간 우리의 성장을 뒷받침해 주었습니다. 필요할 때 쉽게 디스크와 용량을 추가할 수 있다는 사실을 알고 있습니다. 사실, 우리는 유전체학을 뛰어 넘어 일반적인 의료 연구 데이터를 저장하고 보호하고 있습니다. 확장이 필요한 시기에 우리의 스토리지 워크플로우에 StorNext가 클라우드나 오브젝트 스토리지 같은 추가적인 계층을 쉽게 포함시킨다는 점은 우리에게 중요합니다.