Deduplicación de longitud variable

La deduplicación de datos ha revolucionado el centro de datos, mejorando la protección de los datos y reduciendo los costes de almacenamiento. Ahora más que nunca existen más formas de aprovechar la tecnología de deduplicación de datos; desde matrices flash hasta aplicaciones de backup y, por supuesto, dispositivos de backup en disco. Por tanto, ¿cuáles son las consideraciones clave a la hora de escoger la tecnología de deduplicación?

¿Qué es la deduplicación de longitud variable?

El objetivo de la deduplicación es aumentar la cantidad de información que se puede almacenar en matrices de discos e incrementar la cantidad eficaz de datos que se pueden transmitir a través de las redes. Existen muchos algoritmos diseñados para reducir los datos, desde algoritmos de compresión hasta distintas formas de deduplicar bits o bloques de datos redundantes para reducir los datos grabados en disco. Los métodos principales están basados en archivos o pueden utilizar segmentos de datos de longitud fija o deduplicación de longitud variable.

La deduplicación de datos utilizada e implementada por Quantum es el enfoque específico para la reducción de datos basados en una metodología que sustituye de forma sistemática los puntos de referencia para bloques redundantes de longitud variable (o segmentos de datos) en un conjunto de datos específico.

La tecnología de deduplicación de Quantum divide el flujo de datos en segmentos de datos de longitud variable mediante el uso de una metodología dependiente de los datos que puede encontrar los mismos límites de bloque en distintas ubicaciones y contextos. Este proceso de creación del bloque permite a los límites "flotar" en el flujo de datos para que los cambios en una parte del conjunto de datos apenas afecten a los límites en otras ubicaciones del conjunto de datos. A través de este método, los segmentos de datos deduplicados pueden encontrarse en distintas ubicaciones dentro de un archivo, dentro de diferentes archivos, dentro de archivos creados por distintas aplicaciones y dentro de archivos creados en diferentes momentos.

La diferencia de la reducción de datos

LA MEJORA DE LA DEDUPLICACIÓN REDUCE CUATRO VECES MÁS LOS COSTES DE ALMACENAMIENTO, DE RED Y DEL CLOUD

En definitiva, la cantidad de reducción de datos puede variar drásticamente en función del algoritmo de deduplicación y las características de los datos a partir de una reducción del 50% (ratio de 2:1) o una reducción de hasta el 99% (ratio de 100:1) en todos los niveles mediante el uso de una deduplicación de longitud variable. Por tanto, la ventaja de la deduplicación es doble: (1) reduce los datos almacenados en disco y (2) reduce el tráfico de redes (LAN o WAN). Una diferencia dos o diez veces mayor en la reducción de datos puede tener un gran impacto en los costes de almacenamiento, de red y del Cloud.

El método de longitud variable patentado por Quantum es la forma más eficaz de deduplicar los datos comunes de un centro de datos; es de cuatro veces más eficaz que los enfoques de bloque fijo.

Cuando la deduplicación está basada en segmentos de datos de longitud variable, la deduplicación de datos tiene la capacidad de ofrecer una mayor granularidad que las tecnologías de almacenamiento de una sola instancia, ya que identifica y elimina la necesidad de almacenar instancias repetidas de archivos totalmente idénticos. De hecho, la deduplicación de longitud variable puede combinarse con sistemas de reducción de datos basados en archivos para aumentar su rentabilidad.

90% = 10:1 = "Almacene 100 TB de datos como 10 TB en disco"

73% = 3,75:1 = "Almacene 100 TB de datos como 27 TB en disco"

% DE AHORRO EN DISCO
Backup en Exchange Longitud variable DXi Bloque fijo
1 33% 48%
2 62% 61%
3 73% 60%
4 78% 65%
5 82% 70%
... ... ...
18 90% 73%

El cuadro anterior ilustra la diferencia. Este cuadro muestra los resultados de completar 18 backups secuenciales de un entorno Microsoft Exchange y muestra el % de ahorro en disco sobre estos 18 backups para la deduplicación de longitud variable DXi® y el algoritmo de deduplicación de bloque fijo. Los resultados muestran que, tras 18 backups, la deduplicación de longitud variable reduce los requisitos de disco en un 90%, mientras que el bloque fijo solo reduce los datos en un 73%. En términos del mundo real, esto implica que la deduplicación de longitud variable almacena los mismos datos en un tercio de capacidad de disco de un enfoque de bloque fijo.

Replicación basada en la deduplicación

MOVIMIENTO DE DATOS EN SITIO REMOTO Y EN EL CLOUD

La deduplicación se diseñó inicialmente como una tecnología para backup y recuperación de desastres, una tecnología que reduciría o eliminaría el uso de cintas para el backup. De hecho, es una gran tecnología de backup, puesto que los datos del backup contienen una gran cantidad de conjuntos de datos redundantes a lo largo del tiempo. Sin embargo, la deduplicación ha hecho posible mucho más que una simple reducción de datos; se está convirtiendo en una tecnología en el Cloud fundamental.

La deduplicación de datos hace que el proceso de replicar los datos de backup sea práctico al reducir el ancho de banda y el coste necesario para crear y mantener los conjuntos de datos deduplicados sobre las redes. A nivel básico, la replicación basada en la deduplicación es similar a los almacenamientos de datos basados en la deduplicación. Una vez que se crean dos imágenes de un almacenamiento de datos de backup, todo lo que se requiere para mantener la réplica o el destino idéntico al de origen es la copia periódica y el movimiento de los nuevos segmentos de datos agregados durante cada evento de backup, junto con su imagen de metadatos o espacios de nombres.

La deduplicación de longitud variable reduce el almacenamiento en disco, pero también reduce drásticamente las necesidades de ancho de banda, debido a que solo se replican los datos deduplicados. Esto implica que los datos pueden replicarse entre sitios y hacia y desde el Cloud de un forma muy eficaz, una forma que reduce al mínimo el tráfico de redes y los costes.

Aspectos de la ubicación: Dónde deduplicar

CÓMO AFECTA LA DEDUPLICACIÓN A LOS RECURSOS INFORMÁTICOS

Todos los algoritmos de reducción de datos tienen en común lo siguiente: Usan la potencia informática / de procesamiento para realizar el algoritmo y para mantener un registro de las distintos bits de datos. Por tanto, si los usuarios activan la deduplicación en almacenamiento primario, en memoria flash o SSD, ese dispositivo consumirá una potencia de procesamiento realizando una deduplicación que no estará disponible para otras tareas, como el servicio a clientes, aplicaciones y usuarios de ese almacenamiento. Y no solo es la potencia de procesamiento utilizada durante el momento en que los datos se empiezan a deduplicar, sino con todos los algoritmos de algún proceso de desfragmentación o reclamación de espacio en disco que debe ejecutarse para mejorar el conjunto de bits y bloques. Esto también lleva a una potencia de procesamiento, y de nuevo cuando el dispositivo está realizando esta función, tiene menos capacidad disponible para realizar otras tareas. En resumen, no hay sale gratis. La potencia de la CPU, el RAM y el almacenamiento requerido para realizar la deduplicación tiene que venir de otro lugar.

Por esta razón, la que la deduplicación es la tecnología especializada de backup más adecuada y el dispositivo mejor implementado. El backup ha evolucionado con el paso del tiempo hasta ser un proceso que se produce durante una ventana específica en el centro de datos; durante ese momento en que los servidores del backup y de almacenamiento están "ocupados", p. ej. durante la ventana de backup, por la noche o durante el fin de semana. Sin embargo, el almacenamiento de backup puede permitirse quedar inactivo fuera las ventanas de backup. Este es un momento ideal para que los dispositivos de backup realicen las tareas de backup asociadas a la deduplicación, y hacerlo durante el momento en que no afectarán a las aplicaciones de backup o de producción.

Soluciones Quantum, eficacia probada para deduplicación y replicación

Solicite más información en línea
TELÉFONO +34.608.037.797 | CORREO ELECTRÓNICO INFO-SPAIN@QUANTUM.COM
Necesito Una Solución SimilarPEDIR MÁS INFORMACIÓNCONTÁCTENOS