Tres aspectos clave para lograr un almacenamiento de objetos a gran escala

  • Noticias y Actualidad

datacenter hiperescala

La tecnología de almacenamiento de objetos ha ido posicionándose en los entornos empresariales como tecnología preferida para al archivado de datos y la copia de seguridad. Pero trasladar esta tecnología a entornos masivos plantea una serie de retos, y los expertos destacan tres factores que son fundamentales para lograr el rendimiento y el equilibrio coste-capacidad que exige el almacenamiento a escala.

El almacenamiento de objetos es la tecnología que prefieren muchas empresas, ya que ofrece ventajas y una buena rentabilidad para el archivado de datos y la copia de seguridad. Su popularidad ha ido creciendo y están surgiendo nuevos casos de uso para esta modalidad de almacenamiento, pero todavía quedan retos por superar. Un ejemplo está en los entornos de almacenamiento a escala, donde las ventajas de esta tecnología tienden a diluirse, porque se plantean dificultades para cumplir con los requisitos de rendimiento y de relación entre capacidad y precio.

En un reciente artículo publicado por DCIG (Data Center Intelligence Group), los expertos destacan que el almacenamiento de objetos va a aplicarse a nuevos campos como las aplicaciones que generan archivos de registro, sensores de máquinas que capturan daos ambientales y de rendimiento, o para la videovigilancia. En estos entornos el almacenamiento de objetos puede ser una excelente opción, pero es necesario salvar algunos escollos que dificultan el uso de esta tecnología.

El problema está en el difícil equilibrio que existe entre el coste, el rendimiento y la capacidad en el almacenamiento de objetos. Por muy rentable que pueda ser el almacenamiento de objetos, las organizaciones necesitan acceder rápidamente a los datos para analizarlos, incluso en tiempo real, y esto supone que se debe adoptar un enfoque que proporcione mucha más disponibilidad. Esto no es propio del almacenamiento de objetos tradicional, donde se producen tiempos de espera en las búsquedas de datos, que son inasumibles para aplicaciones de alto consumo de datos, que exigen tiempos de espera (muy) inferiores a un segundo.

Como explica en su artículo Jerome M. Wendt, presidente y fundador de DCIG, para lograrlo la industria de almacenamiento está recurriendo a tres estrategias principales, que podrían habilitar la aplicación del almacenamiento de objetos a escala. Por ahora estos enfoques plantean retos, como un inevitable aumento del coste, pero según Wendt son los tres frentes de batalla en los que se debe seguir trabajando para ampliar los casos de uso del almacenamiento de objetos, sobre todo de cara a implementaciones a gran escala.

Almacenamiento SSD para los metadatos

Una forma de acelerar el acceso a los datos en el almacenamiento de objetos es almacenar los metadatos de estos objetos en soportes de estado sólido como discos SSD NVMe o, en su defecto, SAS. Esto permite acelerar las consultas y redirigir instantáneamente a los datos que se buscan, reduciendo mucho los tiempos de espera sin elevar excesivamente los constes en infraestructura. Aunque en los casos en que se trabaje con grandes bases de datos de metadatos, seguirá habiendo costes superiores a los de un enfoque convencional de almacenamiento de objetos.

Los fabricantes de sistemas de almacenamiento de objetos ya han comenzado a implementar medios SSD para la caché y/o el almacenamiento de las bases de datos de metadatos, mejorando el rendimiento de sus soluciones. Pero todavía hay que evolucionar más estas plataformas para lograr una relación más óptima de coste-capacidad-rendimiento.

Escalamiento independiente del rendimiento y la capacidad

Siguiendo el mismo precepto que llevó al desarrollo de las infraestructuras TI convergentes e hiperconvergentes, al desagregar la capacidad de almacenamiento y el rendimiento, se pueden escalar por separado, reduciendo el coste cuando hay que aumentar alguno de estos recursos. Pero las soluciones de almacenamiento de objetos generalmente escalan de forma simultanea la capacidad y el rendimiento cada vez que se añade un nuevo nodo al clúster, algo que no conlleva necesariamente un incremento del rendimiento a la altura de las expectativas.

Los expertos afirman que para abordar esta situación hay dos caminos; uno es el de añadir más nodos, lo cual puede no ser suficiente o poco rentable; otro es buscar soluciones en las que el rendimiento y la capacidad no estén completamente vinculados. Se trata de soluciones que permiten introducir nodos basados entera o parcialmente por unidades SSD o HDD, según sea necesario, lo que permite encontrar el equilibrio más adecuado para las necesidades de escalamiento que se plantean en cada momento.

Procesamiento paralelo y fragmentación para grandes objetos

Una de las características que tiene el almacenamiento de objetos es que estos pueden adquirir tamaños enormes, incluso a una escala de terabytes, lo que hace muy costoso almacenar los datos en objetos empleando discos SSD de alto rendimiento, que son muy caros. Pero esto afecta mucho al rendimiento, ya que acceder a los datos de objetos de ese tamaño que estén alojados en discos duros HDD conlleva una gran merma de rendimiento, sobre todo si solo se utiliza un proceso para leer estos objetos.

Para responder a este desafío, a la luz del gran crecimiento imparable de los datos en las organizaciones, en DCIG explican que se pueden seguir dos caminos principales. Uno es dividir los objetos en fragmentos más pequeños, que se puedan almacenar en unidades de almacenamiento separadas, incluso en diferentes nodos. A esto acompaña una segunda estrategia, que es la de llevar a cabo un procesamiento paralelo de los diferentes fragmentos de estos objetos, aprovechando que se encuentran en una unidad física diferente, con sus propios recursos.

Esto permite acelerar mucho las consultas realizadas a los sistemas de almacenamiento de objetos, especialmente cuando estos son muy voluminosos, y los fabricantes de plataformas de almacenamiento de objetos están evolucionando para facilitar que las organizaciones puedan adoptar este enfoque. Y lo mismo sucede con las otras dos estrategias, cuyo éxito depende de que todos los integrantes del ecosistema de almacenamiento de objetos trabajen para ampliar la escalabilidad y los casos de uso de esta tecnología.

Más información

¿Cuál es el futuro del mercado de almacenamiento? ¿Qué tecologías son las más adecuadas? Si quieres obtener más información sobre un segmento en crecimiento puedes visitar la página de nuestro colaborador Synology