Quantum: Back up, Recovery, Archive  

    Início

Request more informationPrint this pageE-mail this pageBookmark this page
As dez perguntas mais feitas (e suas respostas) sobre a eliminação de
 
 DUPLICAÇÃO DE DADOS

1. O que o termo "eliminação de duplicação de dados" significa realmente?
Ainda não existe uma definição padrão da indústria, mas estamos chegando perto. Todos concordam em que é um sistema para eliminar a necessidade de armazenar dados redundantes, e a maioria das pessoas limita isso a sistemas que procuram dados duplicados em nível de blocos, não de arquivos. Essa é uma característica importante. Imagine 20 cópias de uma apresentação que tenham páginas de títulos diferentes – para um sistema de redução no nível de arquivo, elas parecerão 20 arquivos completamente diferentes. As abordagens no nível de bloco veriam o que há em comum entre elas e usariam muito menos espaço de armazenamento.

A eliminação de duplicação de dados mais poderosa utiliza uma abordagem de bloco de comprimento variável. Os produtos que usam essa abordagem procuram uma seqüência de dados, a segmentam em blocos de comprimento variável e, quando encontram um bloco repetido, armazenam um ponteiro para o original em vez de armazenar o bloco novamente. Como o ponteiro ocupa menos espaço que o bloco, economiza-se espaço. Em backup, onde os mesmos blocos aparecem diversas vezes, os usuários tipicamente podem armazenar de 10 a 50 vezes mais dados que em disco convencional.

2. Como a eliminação de duplicação de dados pode ser aplicada à replicação?
Replicação é o processo de enviar dados duplicados de uma origem para um destino. Se você replicar todos os dados de backup, precisará de uma rede de desempenho relativamente alto para executar o trabalho. Mas, com a eliminação de duplicação, o sistema de origem – aquele que envia os dados – procura blocos duplicados no fluxo da replicação. Se ele já houver transmitido um bloco para o sistema de destino, não precisará transmiti-lo novamente – simplesmente, enviará um ponteiro. Como o ponteiro é muito menor que o bloco, precisaremos de redes com largura de banda muito menor para a replicação.

3. Com que aplicativos a eliminação de duplicação de dados funciona? Existem aplicativos com os quais ela não funciona?
Quando está sendo usada para backup, ela suporta todos os aplicativos – e-mail, bancos de dados, aplicativos de impressão e arquivos etc – e todos os pacotes de backup qualificados. A eliminação de duplicação de comprimento de bloco variável pode encontrar blocos redundantes no fluxo de backup para todos eles. Certos tipos de arquivos – alguns arquivos de mídia avançados, por exemplo – não vêem muita vantagem na primeira vez em que são enviados por meio da eliminação de duplicação de dados porque os aplicativos que gravam os dados já eliminam a redundância. No entanto, se for feito backup desses arquivos muitas vezes ou depois que pequenas alterações forem feitas, a eliminação de duplicação de dados pode ter grandes vantagens de capacidade.

4. Existe alguma maneira de saber quanta vantagem terei pela eliminação de duplicação de meus dados?
Existem realmente quatro variáveis principais. Quanto os dados mudam (ou seja, quantos novos blocos são introduzidos), quão bem eles podem ser comprimidos, qual é sua metodologia de backup (completo x incremental, por exemplo) e por quanto tempo você pretende reter os dados. Alguns fornecedores – a Quantum é um deles – oferecem calculadoras de dimensionamento para estimar os efeitos.

5. Qual é o benefício real de usar a eliminação de duplicação de dados?
Na verdade, existem dois. 1) A tecnologia de eliminação de duplicação de dados permite manter mais dados de backup no disco que com qualquer sistema convencional de backup em disco – o que significa que é possível restaurar mais dados com mais rapidez. 2) Ela torna prático utilizar WANs padrão e replicação para proteção de recuperação de desastres – o que significa que os usuários podem reduzir o manuseio de fitas.

6. O que é eliminação de duplicação de dados de comprimento de bloco variável? Como são obtidos os blocos de comprimento variável e por que eu os quereria?
É mais fácil pensar na alternativa. Se você dividisse um fluxo de dados em blocos de comprimento fixo, todas as vezes que algo mudasse em um ponto, todos os blocos além desse ponto também mudariam. O sistema de blocos de comprimento variável permite que alguns dos segmentos sejam aumentados ou diminuídos, mantendo os blocos além deles inalterados – isso aumenta a capacidade do sistema de encontrar segmentos de dados duplicados, portanto, economiza significativamente mais espaço.

7. Se os dados são divididos em blocos, eles estão seguros? Como é possível restaurá-los?
A tecnologia de usar ponteiros para referenciar uma seqüência de segmentos de dados tem sido padrão na indústria há décadas, você a usa todos os dias e ela é segura. Sempre que você grava um arquivo grande em disco, ele é armazenado em blocos em diferentes setores do disco em uma ordem determinada pela disponibilidade de espaço. Quando você "lê" um arquivo, está na verdade lendo ponteiros em metadados do arquivo que apontam para os diversos setores na ordem correta. A eliminação de duplicação de dados baseada em blocos aplica um tipo semelhante de tecnologia. E os fornecedores de eliminação de duplicação geralmente se baseiam em uma variedade de verificações de integridade dos dados para verificar se o sistema está funcionando corretamente e se os dados continuam disponíveis.

8. Onde ocorre a eliminação da duplicação de dados durante o processo de backup?
Na verdade, existem duas opções. Você pode enviar todos seus dados de backup para um destino de backup e executar a eliminação da duplicação lá, ou pode executar a eliminação da duplicação no host durante o backup. Ambos os sistemas estão disponíveis e ambos têm vantagens. Se você eliminar a duplicação no host durante o backup, enviará menos dados pela conexão de backup mas precisará gerenciar o software em todos os hosts protegidos, o backup será mais lento porque a eliminação de duplicação aumenta a carga e isso poderá tornar mais lentos outros aplicativos em execução no servidor host. Se você eliminar a duplicação no destino do backup, enviará mais dados pela conexão mas poderá usar qualquer software de backup, somente precisará gerenciar um único destino e o desempenho normalmente será muito mais alto porque o sistema de hardware é construído especialmente somente para a eliminação de duplicação.

9. A tecnologia de eliminação de duplicação pode ser usada com fita?
Não e sim. A eliminação de duplicação de dados necessita de acesso aleatório a blocos de dados para gravação e leitura, portanto, precisa ser implementada em um sistema baseado em disco. Porém, é possível gravar facilmente em fita a partir de um armazém de dados de eliminação de duplicação, e de fato essa é a norma. A maioria dos clientes de eliminação de duplicação planejam manter algumas semanas ou meses de dados de backup em disco e depois utilizar fita para armazenamento de longo prazo. Ao criar uma fita a partir de dados da eliminação de duplicação, os dados são expandidos novamente para que possam ser lidos diretamente em uma unidade de fita e não precisarão ser gravados primeiro em um sistema de disco.

10. Qual é o custo real de soluções de eliminação de duplicação de dados?
Isso varia muito, mas existe um ponto inicial para uma boa regra prática. Supondo uma vantagem média da eliminação de duplicação de 20 para 1 – este é um número amplamente usado na indústria – temos visto preços de lista na faixa de um dólar por GB. Portanto, um sistema que pudesse reter 20 TB de dados de backup teria um preço de lista de aproximadamente 20.000 dólares – isso é muito menos do que se você protegesse os mesmos dados usando disco convencional. Uma observação: opcionais poderiam aumentar esse preço – e descontos de revendedores poderiam reduzi-lo.