Quantum: Back up, Recovery, Archive  

   

Request more informationPrint this pageE-mail this pageBookmark this page
데이터 중복제거에 대한 10가지 질문과 답변
 

1. "데이터 중복 제거"의 실제 의미는 무엇입니까?
실제로 업계 표준 정의는 없지만 Quantum은 표준에 가깝게 정의하고 있습니다. 모든 사람들이 이중화 데이터를 저장할 필요성을 없애기 위한 시스템이라는 데 동의하며 대부분의 사람들은 파일 수준이 아니라 블록 수준에서 중복 데이터를 찾는 시스템으로 한정하고 있습니다. 이것이 중요한 특징입니다. 서로 다른 제목 페이지를 가진 20개의 프레젠테이션이 있다고 가정할 경우, 파일 수준 데이터 절감 시스템은 20개의 완전히 다른 파일로 봅니다. 블록 수준 접근법은 이들 사이의 공통성을 찾아 스토리지를 더 적게 사용합니다.

가장 강력한 데이터 중복 제거에서는 가변 길이 블록 접근 방법을 사용합니다. 이 접근 방법을 사용하는 제품은 데이터 수열을 보고 가변 길이 블록으로 분할한 다음 반복된 블록이 보일 경우 블록을 다시 저장하지 않고 처음 발견된 블록에 대한 포인터를 저장합니다. 포인터는 블록보다 공간을 덜 사용하기 때문에 공간을 절약할 수 있습니다. 백업에서 동일 블록이 몇 번이고 나타날 경우 사용자는 일반적으로 기존 디스크에서 보다 10배내지 50배 많은 데이터를 저장할 수 있습니다.

2. 데이터 중복 제거가 어떻게 복제에 적용될 수 있습니까?
복제는 중복 데이터를 원본으로부터 대상으로 전송하는 프로세스입니다. 모든 백업 데이터를 복제할 경우 작업을 완료하기 위해 상대적으로 높은 성능의 네트워크가 필요합니다. 그러나 중복 제거를 이용하면 원본 시스템(데이터를 전송하는 시스템)은 복제 스트림에서 중복 블록을 찾습니다. 이미 블록이 대상 시스템으로 전송된 경우 다시 전송할 필요가 없으며 단순히 포인터만 전송합니다. 포인터는 블록보다 훨씬 작기 때문에 복제를 위해 필요한 네트워크 대역폭이 줄어듭니다.

3. 데이터 중복 제거는 어떤 응용 프로그램에서 사용합니까? 작동하지 않는 응용 프로그램이 있습니까?
백업에 사용되는 경우 전자 메일, 데이터베이스, 인쇄 및 파일 응용 프로그램 등 모든 응용 프로그램 및 모든 인증된 백업 패키지를 지원합니다. 가변 블록 길이 중복 제거는 백업 스트림에서 모두에 대해 이중화 블록을 찾을 수 있습니다. 특정 파일 유형(예: 일부 리치 미디어 파일)은 이 파일에 쓰는 응용 프로그램이 이미 중복성을 제거하기 때문에 처음에 중복 제거를 통해 전송될 때는 이러한 이점을 활용할 수 없습니다. 그러나 이러한 파일이 여러 번 백업되거나 약간 변경하고 백업할 때 중복 제거가 매우 강력한 용량상 이점을 제공할 수 있습니다.

4. 우리 회사의 데이터에서 중복 제거의 이점을 얼마나 많이 활용할 수 있는지 확인할 수 있는 방법이 있습니까?
실제로 4개의 주요 변수가 있습니다. 데이터 변경 정도(즉, 새 블록이 생성된 수), 압축 정도, 백업 방법(예: 풀 백업 또는 증분 백업) 및 데이터 보존 기간. 퀀텀을 포함한 일부 공급업체는 디듀플리케이션의 효과를 예측하기 위해 사이징 툴 (SizingTool) 을 사용하기도 합니다.

5. 데이터 중복 제거 사용의 실질적인 이점은 무엇입니까?
실제로 두 가지 이점이 있습니다. 1) 데이터 중복 제거 기술을 이용하면 기존의 디스크 백업 시스템보다 더 많은 백업 데이터를 디스크에 저장할 수 있으며 이는 더 많은 데이터를 빠르게 복원할 수 있다는 의미가 됩니다. 2) DR 보호를 위해 표준 WAN 및 복제를 실제로 사용할 수 있으며 이는 사용자가 테이프 처리를 줄일 수 있다는 의미입니다.

6. 가변 블록 길이 데이터 중복 제거란 무엇입니까? 어떻게 가변 길이 블록을 가져오며 왜 이것이 필요합니까?
대안을 생각하는 것이 가장 쉬운 방법입니다. 데이터 스트림을 고정 길이 세그먼트로 나눌 경우 하나의 지점에서 약간의 변경이 발생할 때마다 모든 블록 다운스트림도 변경됩니다. 가변 길이 블록 시스템을 이용하면 일부 세그먼트가 늘어나거나 줄어들 수 있어서 다운스트림 블록이 변경되지 않고 시스템이 중복 데이터 세그먼트를 쉽게 찾을 수 있어 공간을 크게 절약합니다.

7. 데이터가 블록으로 나누어질 경우 안전합니까? 어떻게 복원합니까?
데이터 세그먼트의 수열에 대한 참조 포인터를 사용하는 기술은 수 십년 동안 업계 표준이며 매일 이를 사용하므로 안전합니다. 큰 파일을 디스크에 쓸 때마다 이 파일은 공간 가용성에 따라 정해진 순서대로 다른 디스크 섹터에 블록으로 저장됩니다. 파일을 "읽을" 때 실제로는 여러 섹터를 정확한 순서로 가리키는 파일 메타 데이터의 포인터를 읽는 것입니다. 블록 기반 데이터 중복 제거는 비슷한 종류의 기술을 적용합니다. 그리고 중복 제거 공급업체는 일반적으로 다양한 데이터 무결성 확인 방법을 구축하여 시스템이 손상되지 않았는지 그리고 데이터가 가용한 상태로 있는지 확인합니다.

8. 백업 과정 중 데이터 중복 제거가 발생하는 곳은 어디입니가?
실제로 두 가지 선택사항이 있습니다. 모든 백업 데이터를 백업 대상으로 전송하고 거기서 중복 제거를 수행하거나 백업 중 호스트에서 중복 제거를 수행할 수 있습니다. 두 시스템 모두를 이용할 수 있으며 두 가지 모두 이점이 있습니다. 백업 중 호스트에서 중복을 제거할 경우 백업 연결 상태에서 데이터를 적게 전송하지만 모든 보호된 호스트에서 소프트웨어를 관리해야 하며 중복 제거 작업이 오버 헤드를 추가하기 때문에 백업이 느려지고 호스트 서버에서 실행 중인 다른 응용 프로그램도 느려질 수 있습니다. 백업 대상에서 중복을 제거할 경우 연결 상태에서 더 많은 데이터를 전송하지만 모든 백업 소프트웨어를 사용할 수 있고 단일 대상만 관리하면 되며 하드웨어 시스템이 중복 제거를 위해서만 구축되기 때문에 성능이 훨씬 더 높습니다.

9. 중복 제거 기술을 테이프에 사용할 수 있습니까? 
데이터 중복 제거는 쓰기 및 읽기를 위해 데이터 블록에 랜덤 액세스가 필요하기 때문에 디스크 기반 시스템에 구현되어야 합니다. 그러나 테이프는 중복 제거 데이터 저장으로부터 쉽게 쓸 수 있기 때문에 사실상 일반적으로 사용됩니다. 대부분 중복 제거 고객은 몇 주 또는 수 개월의 백업 데이터를 디스크에 보관하려고 계획하며 장기 저장을 위해서는 테이프를 사용합니다. 중복 제거된 데이터로 테이프를 작성할 경우 중복제거된 데이터는 중복이 해제되어 직접 테이프 드라이브에서 읽을 수 있으므로 디스크 시스템에 먼저 쓸 필요가 없습니다.

10. 데이터 중복 제거 솔루션의 비용은 실제로 얼마나 됩니까?
비용은 매우 다양하지만 일반적으로 데이터 중복제거 솔루션의 비용은 기존의 디스크에서 동일한 크기의 데이터를 보호하는 경우와 비교할 때 훨씬 낮은 비용입니다. 자세한 내용은 퀀텀코리아 영업사원에게 연락 주시면 친절히 안내해 드리겠습니다. 참고: 옵션에 따라 가격은 올라가며 리셀러나 공급업체의 할인으로 가격이 낮아질 수 있습니다.