Las soluciones inteligentes de archivo activo basadas en cinta resuelven los desafíos del crecimiento de datos exponencial

  • Opinion

Fujifilm cinta

La cantidad de datos generados sigue aumentando en todos los niveles, incrementando las necesidades de cómputo y almacenamiento de todas las organizaciones para obtener valor de estos grandes volúmenes de información.

La mayor parte de este nuevo crecimiento de información está siendo impulsada por datos no estructurados. El informe de mayo de 2022 de IDC llamado “Worldwide Global Storage Sphere Forecast, 2022-2026”, estima que para 2026, hasta el 60% de todos los datos empresariales serán inactivos y no estructurados. El creciente uso de la IA y el IoT hace que los datos se generen esencialmente en el “Edge”, antes de migrarlos de nuevo a un entorno de centro de datos más tradicional para realizar copias de seguridad y retención de archivos a largo plazo.

Las soluciones inteligentes de archivo activo basadas en cinta están pasando a primer plano a medida que las empresas se enfrentan al desafío de gestionar esta colosal cantidad de información a lo largo de su ciclo de vida.

Si nos centramos en el archivo, con demasiada frecuencia, las opciones existentes se presentan como un dilema entre distintas tecnologías de almacenamiento. Pero, en realidad, hay que tenerlas todas en cuenta para aprovechar al máximo el potencial de los datos en la era zettabyte.

La clave reside en crear un archivo activo que cuente con infraestructuras tecnológicas seguras y flexibles, adaptadas a las nuevas demandas de sostenibilidad para reducir su impacto medioambiental apoyándose en softwares inteligentes de gestión y archivo de datos compatibles con el almacenamiento en cinta. Eliminando los silos de datos aislados, vinculándolos entre sí para lograr una mayor eficiencia y una reducción de costes.  

Un archivo activo es una solución de almacenamiento por niveles que brinda a los sistemas de TI acceso a los datos a través de un sistema de archivos común y unificado que recupera y coloca automáticamente esos datos en el nivel de almacenamiento adecuado según su uso. Como un todo.

Los archivos activos combinan varios tipos de almacenamiento, disco (SSD y/o HDD), cinta magnética (LTO y/o 3592), almacenamiento en la nube (pública, privada y/o híbrida) y distintas arquitecturas (sistemas de ficheros, almacenamiento de objectos) para que los datos se almacenen en la clase de almacenamiento más adecuada en función de consideraciones como la rapidez de acceso, seguridad, coste y escalabilidad. Permitiendo almacenar los datos con extensos periodos de retención en soportes más económicos y seguros, como la cinta. Buscando así la optimización de los recursos existentes.

El uso de los metadatos permite la rápida localización y acceso a los datos de un archivo activo, ante peticiones de recuperación/restauración, gracias al control y seguimiento riguroso de los datos alojados en copias primarias, secundarias y terciarias dentro del mismo sistema. Así se mantiene la accesibilidad en línea de cualquier archivo, independientemente de la tecnología utilizada para su almacenamiento o de su ubicación.

Contar con un sistema de cintas moderno apoyado en un software de gestión y archivo de datos inteligente permite el desborde de datos de disco a cinta y de una nube a otra de forma ágil e intuitiva.

La cinta encaja perfectamente en una solución de archivo bien diseñada en la que los procesos atendidos no dependen de reducidos tiempos de acceso hasta el primer byte. Estos serían algunos de los casos de uso de un archivo activo basado en cinta:

- Validación de la calidad de los datos y verificación de la integridad de éstos: los procesos que garantizan que los datos sean correctos y útiles, que permitan detectar y corregir o eliminar registros corruptos o inexactos de un conjunto de registros, tabla o base de datos. Estos procesos implican identificar los datos incompletos, incorrectos o irrelevantes, y luego reemplazarlos, modificarlos o eliminarlos. La limpieza de datos se puede realizar mediante procesamiento por lotes de forma programada.

- Muestreo de datos: una técnica de análisis estadístico utilizada para seleccionar, manipular y analizar un subconjunto representativo de datos para identificar patrones y tendencias en el conjunto de datos más amplio que se examina.

-  Análisis de datos de alta dimensionalidad, proyectos de reducción de datos y archivado activo de fuentes de datos distribuidas.

 

Ante el cambio climático global y la necesidad de cumplir con los objetivos de desarrollo sostenible marcados por Naciones Unidas y el Pacto Verde Europeo, para todas las compañías poder contar con un archivado activo basado en un soporte ecológico de almacenamiento de datos, como la cinta, es aún más relevante.

Los archivos activos basados en modernos sistemas de cinta permiten acelerar la neutralidad de los centros de datos reduciendo el consumo de energía, las emisiones de CO2 y los residuos electrónicos.

El consumo de energía del almacenamiento en cinta es tan sólo del 4-9% respecto al almacenamiento de en disco.  Dado que el almacenamiento en cinta solo requiere electricidad cuando se lee/escribe una cinta y no necesita los sistemas de refrigeración y ventilación constantes que exige la tecnología de disco para su correcto funcionamiento.

Los sistemas de almacenamiento basados en cinta logran reducir hasta un 97% las emisiones de CO2 generadas durante su ciclo de vida en comparación con soluciones equivalentes basadas en disco duro cuando la fuente de energía utilizada es el gas natural. Logrando reducir los residuos electrónicos hasta un 80%, al poder archivar datos durante más de 3 décadas sin consumir energía, entre 7 y 10 veces más que con la tecnología de disco.  

Además de las grandes ventajas relacionadas con la protección del medioambiente, la cinta desempeña un papel fundamental en la reducción de costes del centro de datos y en la protección de datos a largo plazo. El almacenamiento en cinta logra absorber grandes volúmenes de información en un espacio muy reducido gracias a las altas densidades de grabación de las últimas generaciones de cinta, 50 Petabytes en tan solo 6,3 m2 con la tecnología 3592JF o 30 Petabytes en la misma superficie con la tecnología LTO9. Como ya hemos mencionado, la cinta permite conservar datos durante extensos periodos de tiempo, más de 30 años, sin consumir electricidad, generando un importante ahorro económico, al tiempo que ofrece un nivel adicional de protección de datos contra la ciberdelincuencia al quedar desacoplada de la red, cuando no se usa. La naturaleza amovible de la cinta permite generar tantas copias de datos como se desee y conservarlas en distintas ubicaciones para beneficiarse del llamado “air gap”. De este modo, se garantiza la desconexión física de las copias de datos de cualquier red para que sean totalmente inaccesibles ante cualquier amenaza, permitiendo que la solución se convierta en un rápido plan de recuperación de desastres gracias a los altos rendimientos alcanzados esta última década.

La necesidad de proteger el medioambiente y los datos lleva a que las organizaciones estén apostando por archivos activos basados en cinta orquestados por softwares inteligentes de gestión y archivo de datos compatibles con el almacenamiento en cinta. Primando siempre que sea posible por softwares de código abierto, como el software Object Archive de FUJIFILM, que se integra fácilmente con las infraestructuras existentes y permite la transferencia de datos desde su ubicación actual de forma simultánea a cintas de gran capacidad en centros de datos internos (nube privada) y/o proveedores externos (nube pública). Liberando así a las compañías de los temidos formatos propietarios. Al permitir el acceso y la lectura de datos en todo momento, incluso cuando no se cuente con la licencia activa del software.

Las soluciones de archivo activo basadas en cinta solucionan los problemas de indexación, ejecución de búsquedas y recuperación de datos de grandes volúmenes de información de forma rápida, sencilla, eficiente y a bajo coste. Convirtiendo los archivos offline en extensiones visibles y accesibles de los sistemas de almacenamiento y archivo online. Consiguiendo una visión completa y de gran valor de toda la información disponible de la organización.