La Inteligencia Artificial mejora la eficiencia de los centros de datos de Google

  • Reportajes

Para lograr la máxima eficiencia energética en sus grandes instalaciones de centros de datos, Google lleva tiempo aplicando técnicas de aprendizaje automático e inteligencia artificial. Estas aplicaciones han pasado de ser un medio para emitir recomendaciones a convertirse en un sistema de gestión automatizado capaz de optimizar al máximo los sistemas de refrigeración, ahorrando energía en todo momento.

En una instalación tan compleja como un centro de datos, donde se almacenan Petabytes de información y se suministran servicios a millones de clientes, el consumo energético es enorme, y sus operadores siempre tratan de alcanzar la máxima eficiencia energética para reducir los costes. Google, como uno de los mayores propietarios de centros de datos de gran escala, dedica muchos recursos a la investigación y el desarrollo de mejores tecnologías para sus centros de datos, desde procesadores a sistemas de refrigeración de alto rendimiento. Y uno de sus principales frentes es el de la eficiencia energética. En 2014 se hizo público que Google estaba empezando a usar inteligencia artificial para encontrar mejores formas de gestionar el consumo eléctrico de sus instalaciones. El entonces ingeniero de centros de datos de la compañía, Jim Gao, desarrolló un proyecto basado en la monitorización avanzada, aplicando un algoritmo de inteligencia artificial para analizar la información de los sensores y encontrar nuevas formas de mejorar sus operaciones. Comenzó como un sistema de recomendaciones para los técnicos que operan sus instalaciones, y que proporcionaba consejos útiles para adaptar mejor el funcionamiento de sistemas como los de refrigeración, reduciendo el PUE hasta cotas difíciles de alcanzar con las operaciones manuales.

Según declaró Joe Kava, Vicepresidente de Centros de Datos de Google, en una reciente entrevista concedida a Data Center Knowledge, “Teníamos un modelo independiente que ejecutaríamos, y emitiría recomendaciones, y luego los ingenieros y los operadores de la instalación cambiarían los parámetros en los enfriadores, los intercambiadores de calor, las bombas y demás equipos, para que coincidieran con las propuestas del sistema de inteligencia artificial”. El resultado es que este algoritmo inteligente era capaz de proponer cambios de forma altamente dinámica para ahorrar cada kilovatio/hora posible, basándose en el estado de funcionamiento de los equipos y en las condiciones climáticas, lo que podía proporcionar importantes ahorros de costes. Este primer sistema tenía como objetivo alcanzar una reducción del 20% en el consumo de energía de los sistemas de refrigeración. Más adelante, gracias a la colaboración del equipo de DeepMind AI de Google, se planteó la posibilidad de llegar al 40%.

Tomando el control de le eficiencia energética

Tras unos años de prueba, quedó demostrado que el potencial de este algoritmo se podía llevar más allá, y Google decidió pasar a la siguiente fase, creando lo que denominan un “Sistema de control automatizado de nivel 2”, que ya opera de forma autónoma en diferentes instalaciones de Google. Con esta última versión del sistema, desarrollada conjuntamente por Gao y el equipo de DeepMind AI, se calcula que podría reducirse un 15% de la energía restante tras las mejoras anteriores. Y, para ello, emplea los datos de monitorización provenientes de sensores que analizan las mismas 21 variables de la primera versión: temperatura del aire exterior, presión barométrica, humedad, carga de energía del centro de datos, presión de aire en la salida de aire caliente de los servidores, y otras más. Analiza toda esta información en tiempo real y, en función de las condiciones climáticas exteriores, implementa los cambios de forma automática en los sistemas de refrigeración, optimizando al máximo el PUE.

Más allá de la capacidad humana

Los resultados que está obteniendo Google con este nuevo sistema de control automatizado inteligente están superando las expectativas, y proporcionando un gran ahorro energético en sus grandes instalaciones, que supera lo obtenido con el control humano. Esto se debe a que el algoritmo de IA implementa modificaciones muy precisas en el funcionamiento, independientemente de lo pequeños que sean los cambios en las condiciones ambientales y de funcionamiento de los equipos, aprovechando cada oportunidad de ahorro. Un equipo humano maneja generalmente ciertos márgenes de tolerancia antes de efectuar cambios. Por ejemplo, frente a un pequeño cambio en la temperatura exterior a lo largo del día, o variaciones menores en la presión atmosférica o la humedad. Simplemente, los operarios humanos no tienen la capacidad para valorar las ventajas de realizar ajustes muy pequeños en diferentes variables del funcionamiento de los sistemas de refrigeración. En cambio, la inteligencia artificial no deja escapar la ocasión de ahorrar una pequeña cantidad de energía. Estas pequeñas variaciones de consumo pueden parecer pequeñas, pero cuando se calculan en grandes instalaciones como los centros de datos de Google, el cálculo final puede ser de una importante reducción de costes a lo largo del año.

Ahorro energético desde el primer día

Cuando se abren nuevas instalaciones, sobre todo las de hiperescala, se inician las operaciones con máquinas que sólo ocupan una parte del recinto, por lo que generalmente la eficiencia energética es menor, ya que los sistemas de enfriamiento ya deben estar preparados para las futuras ampliaciones de servidores, redes y almacenamiento. Y Google lleva un tiempo ampliando su huella tecnológica en todo el mundo, abriendo nuevas regiones y ampliando la infraestructura de las existentes para adaptarse a la creciente oferta de servicios cloud. Según ha declarado Kava, “Tienes que tener corriente en todas las filas, aunque no estén llenas. El aprendizaje automático realmente nos ha ayudado a ser mucho más eficientes, incluso en esas condiciones de poca carga”. Según las cifras que dan desde la compañía, en un lanzamiento típico de un nuevo centro de datos de Google en PUE suele estar entre 1,3 y 1,2. Pero contando con el sistema de refrigeración gestionado por IA se puede bajar hasta 1,1 o 1,09, lo que supone un gran cambio en instalaciones de esa escala.

Aplicaciones inteligentes que requieren aprendizaje

Google reconoce el valor de esta nueva herramienta y está implementándola poco a poco en sus centros de datos, pero esto no puede hacerse trasladando sin más la experiencia acumulada en una instalación a otra. Aunque sus datacenter comparten una estructura muy similar, no todos son iguales, y cada uno tiene unas características particulares de hardware y carga de trabajo. Por ello, el algoritmo de inteligencia artificial debe pasar por una curva de aprendizaje inicial antes de hacerse con el control total de las instalaciones, aprendiendo mediante mecanismos de machine learning para adaptar su funcionamiento a las particularidades de cada centro de datos. Una vez pasado este período se puede ceder el control de los sistemas de enfriamiento a la IA. Y, en palabras de los responsables de Google, cuando confirmas que estos sistemas totalmente automáticos ofrecen mejoras en una instalación y son fiables, el siguiente paso es extender su uso al resto de centros de datos.

La IA demuestra su eficiencia en las peores condiciones

Recientemente se ha podido comprobar cómo este motor de inteligencia artificial basado en el aprendizaje automático es capaz de dar soluciones eficaces en las condiciones más adversas. En un centro de datos de Google ubicado en el medio oeste americano, un sistema de aviso de tornados emitió una alerta por una fuerte tormenta incipiente. Aunque el tornado no llegó a formarse, el sistema de IA comenzó a modificar el funcionamiento del sistema de refrigeración con órdenes que, a juicio de los operadores, eran contradictorias. Pero tras un detallado análisis posterior se demostró que había tomado las medidas más adecuadas para ahorrar energía en esas condiciones específicas. Para ello fue capaz de interpretar adecuadamente las implicaciones de la fuerte caída de presión atmosférica y los grandes cambios de temperatura y humedad, adaptando dinámicamente el funcionamiento de los sistemas de refrigeración y logrando el máximo ahorro de energía.

La intervención humana es fundamental

Las bondades de un sistema de gestión basado en inteligencia artificial están ya demostradas, pero eso no significa que se pueda prescindir del personal humano que trabaja en los centros de datos. Es más, gracias a que no necesitan preocuparse de los ajustes de determinados subsistemas como el de refrigeración, los técnicos pueden dedicar más tiempo a tareas vitales como el mantenimiento preventivo, las reparaciones y la actualización de los sistemas, en las que se requiere trabajo manual.  Además, existen diversos escenarios en los que los sistemas automatizados aún no son la mejor solución. Tomando como ejemplo el caso anterior del aviso de tornados, si realmente se formase uno, las instalaciones requerirían de personal cualificado capaz de tomar las mejores decisiones para asegurar la integridad de las instalaciones y el funcionamiento adecuado de los sistemas, al margen de la eficiencia energética. Además, se debe tener en cuenta que las IA basadas en este tipo de aprendizaje automático son buenas manejando los escenarios más comunes y los cambios de situación relativamente paulatinos, y todavía no pueden ofrecer soluciones inmediatas para situaciones para las que no han sido “entrenadas”. En estos casos se requieren las habilidades de personal cualificado capaz de tomar las mejores decisiones al instante.

Más allá de los centros de datos

El tándem formado por Jim Gao y DeepMind, al que ahora pertenece de facto, ya ha probado el buen desempeño de esta herramienta de gestión automatizada en los centros de datos de Google, pero opinan que puede aplicarse con éxito a otros sectores, y ya están trabajando en ello. Por ejemplo, resultaría útil para cualquier instalación que requiera el uso de sistemas avanzados de control de temperatura, desde una planta industrial a un laboratorio o una refinería de petróleo. Dado el éxito de este sistema para sus propios creadores, cabe esperar que en los próximo años Google lance al mercado versiones de su IA específicas para otros sectores.

Más información

¿Cuál es el futuro del mercado de almacenamiento? ¿Qué tecnologías son las más adecuadas para las empresas? Si quieres obtener más información sobre un segmento en crecimiento puedes visitar las páginas de nuestros colaboradores: NetApp y Huawei.