Software de código abierto para reducir los fallos en switches para centros de datos

  • Noticias y Actualidad

SONIC OS Switch Datacenter

Según una investigación, el sistema operativo de código abierto SONiC OS, diseñado para conmutadores de centros de datos, ha demostrado ser menos propenso a los fallos que el software propietario. Para los expertos, uno de los motivos principales es que el software de código abierto permite a los operadores de las instalaciones mejorar el funcionamiento de los equipos y aplicar actualizaciones con más rapidez, eficacia y un mayor grado de personalización para sus necesidades concretas.

La infraestructura y el software de código abierto se están abriendo paso en el entorno de los centros de datos, desplazando a las tradicionales soluciones propietarias y basadas en licencias, que tiene un coste superior y en muchas ocasiones son menos flexibles. Un ejemplo es el sistema operativo para conmutadores de centros de datos SONiC OS, diseñado por Microsoft y el Open Compute Project. Para compararlo con otras soluciones vigentes en la industria, el gigante del software ha realizado un exhaustivo estudio sobre el funcionamiento de 180.000 conmutadores utilizados en 130 ubicaciones de sus plataformas de la nube Microsoft Azure.

El resultado es que los switches equipados con SONiC OS han mostrado un menor nivel de fallas de software que sus homólogos basados en un sistema propietario, aunque los responsables del estudio no han especificado cuál o cuáles son. Este es un tema complejo, ya que en muchas ocasiones es muy difícil determinar si la falla de un conmutador tiene su origen en el software o en el hardware, ya que en ambos casos se pueden manifestar como registros de fallas del proceso y como rastros de pila en el conmutador que ha fallado, sin más detalles. Incluso el error puede deberse al software, aunque el registro diga que proviene de un problema de hardware, debido a una ambigüedad en la evaluación del origen real del error por parte del sistema.

Por ello, los investigadores de Microsoft han establecido un criterio fijo para determinar si en estos casos poco claros se trata realmente de un fallo de software. Así, si el fabricante proporciona una solución de software para el error, se trata de un error de software. En caso contrario, es un fallo de hardware. Y, para evaluar el desempeño y la tasa de errores, los investigadores han sondeado cada uno de los switches de red cada seis horas, en busca de los eventos de reinicio más frecuentes y buscando su causa.

Los resultados de esta investigación son que existe un 2% de probabilidades de que un conmutador falle en un plazo de 3 meses, y el hardware es el causante más común, ya que provoca un 32% de los reinicios del equipo. La pérdida de suministro energético provoca el 28% de los fallos y el software el 17%. Pero un dato muy interesante que arroja este estudio es que si se reemplaza el software propietario de un switch por SONiC OS la probabilidad de que falle se reduce a la mitad en esos tres meses.

Los expertos afirman que en toro a tres cuartas partes de los conmutadores que han analizado ya estaban utilizando SONiC y afirman que esto se debe a las ventajas que proporciona el modelo de software de código abierto. Los argumentos en que se basa esta afirmación son que al ser un software de código abierto puede ser modificado con más facilidad por el cliente para adaptarlo a sus necesidades, lo que acelera el ciclo de desarrollo-prueba-implementación.

Y, en su artículo, los investigadores explican que “de hecho, las actualizaciones y parches de software de los proveedores se implementan en escalas de tiempo más largas (por ejemplo, varios meses). Esto conduce a que vuelvan a ocurrir problemas conocidos en dispositivos que aún no se han parcheado con las correcciones proporcionadas por el proveedor. Por el contrario, las fallas de SONiC tienen su origen en la raíz y se solucionan en escalas de tiempo breves, gracias a la experiencia de los equipos de desarrollo internos”.

Más información

¿Cuál es el futuro del mercado de almacenamiento? ¿Qué tecologías son las más adecuadas? Si quieres obtener más información sobre un segmento en crecimiento puedes visitar las páginas de nuestros colaboradores NetApp y Synology