Deduplicación de datos cifrados para el almacenamiento en la nube

  • Noticias y Actualidad

Deduplicación de datos cifrados para el almacenamiento en la nube

Investigadores de India y Australia han desarrollado un nuevo marco de deduplicación para el almacenamiento en la nube que resuelve los problemas relacionados con los datos cifrados provenientes de múltiples fuentes. Se trata de una mejora del sistema DupLESS que están aplicando algunos proveedores de almacenamiento en la nube, que pretende aportar una mayor confiabilidad y rendimiento.

Para optimizar el espacio de almacenamiento en la nube los proveedores aplican técnicas de deduplicación, que eliminan los datos duplicados para aprovechar mejor el espacio. Pero la identificación de los datos duplicados se complica cuando los clientes suben datos cifrados a los que el operador no puede tener acceso sin la clave correspondiente. Pero el cifrado es una estrategia fundamental de seguridad para muchas organizaciones, ya que limita la exposición de la información ante posibles violaciones de seguridad.

Para aportar soluciones a este desafío se han propuesto esquemas de deduplicación como DupLESS (Duplicateless Encryption for Simple Storage), pero este plantea problemas de confiabilidad por la posibilidad de pérdida de datos en entornos de almacenamiento remoto. DupLESS mantiene tanto la clave como los datos en un solo servidor de almacenamiento, y si este se cae los datos podrían perderse.

En cualquier caso, esta técnica es un buen punto de partida, y un equipo de investigadores del Instituto Indio de Tecnología de Roorkee y de la Universidad de Melbourne ha trabajado para mejorarla. En un artículo pubicado recientemente en la revista Journal of Information Security and Applications describen un nuevo marco de deduplicación, denominado dualDup, que pretende aportar un mecanismo capaz de proteger tanto los datos como las claves de descifrado ante actividades maliciosas, aumentando la confiabilidad del sistema.

El marco dualDup promete optimizar el almacenamiento eliminando los datos cifrados duplicados de múltiples usuarios, extendiendo el concepto de DupLESS y distribuyendo de forma segura los datos y los fragmentos de las calves de acceso. Con ello se logra mejorar las condiciones de privacidad de los clientes y la confiabilidad del sistema, para lo que se emplea un esquema de codificación de borrado.

Los investigadores han probado su tecnología implementándola en Phyton en el centro de datos de Dropbox, y afirman que han logrado resultados muy convincentes en un entorno real. Sus pruebas indican que dualDup logra una alta confiabilidad con una sobrecarga de almacenamiento promedio del 66,66%, correspondiente a los códigos Reed-Salomon.

Han llevado a cabo análisis de seguridad frente a intentos de violación de datos internos y externos para validar sus resultados preliminares, confirmando sus cifras. También destacan que su marco ofrece todas las características fundamentales de la deduplicación, la mitigación de ataques, la seguridad y gestión de claves, la confiabilidad y funciones de QoS igualando y, en algunos casos, superando a otras técnicas de deduplicación de última generación.

Más información

¿Cuál es el futuro del mercado de almacenamiento? ¿Qué tecnologías son las más adecuadas?  Conoce más sobre el software FUJIFILM Object Archive, el almacenamiento sostenible, las tecnologías de soporte de almacenamiento de datos o las cintas LTO de FUJIFILM para estar al día de un sector en crecimiento.