Deduplicación de datos de IoT en el almacenamiento en la nube

  • Noticias y Actualidad

Cloud datos

Expertos en computación de una universidad de India proponen un método dinámico para eliminar los datos de dispositivos IoT duplicados que se acumulan en el almacenamiento en la nube. Mediante su técnica de deduplicación afirman que se puede mejorar la capacidad de la memoria caché y mantener el nivel adecuado de redundancia de datos para adaptarse a fallas no críticas.

Uno de los desafíos que genera el progresivo avance de las tecnologías IoT es la gran acumulación de datos, entre ellos muchos de ellos duplicados que ocupan espacio innecesariamente y merman el rendimiento de los sistemas. Al igual que sucede con otros ámbitos del almacenamiento, la respuesta a este problema puede estar en las técnicas de deduplicación que se aplican en las plataformas tradicionales de almacenamiento y copia de seguridad de los datos empresariales.

Este es el enfoque que ha seguido un equipo de expertos en tecnología y computación del Colegio de ingeniería Sree Vidyanikethan de Tirupathi, del Instituto Nacional de Tecnología de Silchar y de la Universidad Shivaji, en Kolhapur (India). En un trabajo publicado en la revista Machine Learning and Internet of Things for Societal Issues describen lo que denominan un método dinámico de eliminación de duplicados para el almacenamiento distribuido de datos de IoT.

En su artículo explican cómo la computación distribuida está encontrando un lugar de aplicación perfecto dentro del ámbito de IoT, con sensores que transmiten constantemente información a través de la red. En muchos casos estos datos se almacenan en la nube, lo que permite acceder a ellos desde cualquier lugar convenientemente conectado.

Muchos clientes de servicios enfocados a IoT prefieren el almacenamiento distribuido, pero se enfrentan a una capacidad que no para de crecer, a medida que escala la infraestructura IoT. Pero las tareas de computación asociadas a estos datos, como el aprendizaje automático, se vuelven excesivamente complejas por la gran cantidad de información acumulada, lo que eleva el consumo de energía. Para reducirlo los proveedores de la nube pueden emplear más caché de almacenamiento, liberando la memoria disponible y descartando los procesos de deduplicación para mejorar el rendimiento de la caché.

Esto puede limitar la congruencia de unos datos que se actualizan constantemente con información que no deja de llegar de los sensores, y que no se filtra adecuadamente para detectar y descartar los datos duplicados. Para resolverlo, estos investigadores proponen un método de deduplicación dinámica enfocado al almacenamiento de datos IoT en la nube, que promete mejorar la potencia de la memoria caché y mantener la redundancia de información que se necesita para adaptarse a fallas no críticas en los sistemas.

Más información

¿Cuál es el futuro del mercado de almacenamiento? ¿Qué tecologías son las más adecuadas? Si quieres obtener más información sobre un segmento en crecimiento puedes visitar la página de nuestro colaborador Synology