Deduplicación más eficaz para el almacenamiento en la nube

  • Noticias y Actualidad

Investigadores indios han desarrollado un esquema de deduplicación específicamente diseñado para la nube, con el que quieren optimizar el espacio de almacenamiento en estos entornos. Afirman que su enfoque supone una mejora con respecto al esquema DARE, para lo que aplican una tecnología avanzada de detección de semejanza, más efectiva que la de propuestas DupAdj anteriores.

Aprovechar al máximo la capacidad de almacenamiento en la nube es fundamental para los proveedores cloud, que necesitan estrategias que les permitan optimizar al máximo el espacio disponible. Una de las más efectivas para el almacenamiento empresarial es emplear la técnica de deduplicación, pero en el contexto de la nube esta tecnología tiene limitaciones y afecta al rendimiento en el trabajo con datos.

Para solucionar estos problemas los expertos en tecnologías de almacenamiento han desarrollado esquemas de deduplicación específicos para los entornos de la nube, como DARE (Deduplication-Aware Resemblance Detection and Elimination). Se trata de un sistema que permite identificar los datos duplicados con un coste muy bajo, ideal para los grandes volúmenes de datos alojados en la nube. Para ello se basa en la técnica DupAdj (Duplicate-Adjacency based Resemblance Detection).

Esta tecnología data de 2015, cuando se publicó en un trabajo académico elaborado por un equipo de investigadores de la Universidad de Ciencia y Tecnología de Wuhan (China) y de la Universidad de Nebraska-Lincoln. Ahora, investigadores del Instituto de Tecnología de Sachdeva, en Mathura Fareh (India), han publicado una propuesta que pretende mejorar el desempeño de esta tecnología, acelerando aún más el funcionamiento de a deduplicación en los entornos de almacenamiento en la nube.

Esta tecnología selecciona algunos de los dos bloques de datos susceptibles de estar duplicados y analiza los bloques adyacentes para determinar si también están duplicados, lo que acelera la identificación de datos idénticos. LA mejora que proponen estos científicos se basa en lo que denominan un método de superfuncionalidad mejorado, que potencia las capacidades de la técnica DupAdj propuesta anteriormente.

En el artículo que han publicado en la Revista Internacional de Investigación en Ciencias de la Ingeniería y Gestión (IJRESM), explican que en sus pruebas la metodología DARE solo consume entre un 25% y un 50% de los recursos de sistemas convencionales de deduplicación. Con este coste logra eliminar entre el 2% y el 10% de la redundancia total de los datos, una cifra más que aceptable para estos escenarios de almacenamiento, teniendo en cuenta el constante movimiento de datos en la nube.

Más información

¿Cuál es el futuro del mercado de almacenamiento? ¿Qué tecologías son las más adecuadas? Si quieres obtener más información sobre un segmento en crecimiento puedes visitar las páginas de nuestros colaboradores NetApp y Synology