Memoria ferroeléctrica para acelerar las redes neuronales profundas

  • Noticias y Actualidad

cm vv nov

Investigadores alemanes han desarrollado una nueva arquitectura in-memory de señal mixta de baja potencia basada en memoria ferroeléctrica, aplicable a las redes neuronales profundas. Afirman que su tecnología permitirá fabricar dispositivos con celdas de memoria no volátil basadas en FeFET que acelerará las operaciones de inferencia en este tipo de redes.

Muchas aplicaciones actuales emplean redes neuronales profundas (DNN) para procesar datos y realizar tareas altamente complejas en entornos con restricciones de latencia y consumo de energía. Para mejorar su desempeño y eficiencia se está explorando el uso de plataformas de procesamiento en memoria (PIM), con unidades centrales basadas en memorias resistivas no volátiles.

Actualmente diferentes arquitecturas PIM emplean memorias ressitivas para construir aceleradores basados en barras transversales para las operaciones de inferencia de DNN, pero las desarrolladas hasta ahora presentan ciertos problemas de confiabilidad, precisión y consumo de energía, entre otros. Para resolver estos desafíos, un equipo de investigadores del Centro de Tecnologías Nanoelectrónicas Fraunhofer IPMS, de la compañía Bosch y de la Universidad de Kaiserslautern (Alemania) han desarrollado una nueva arquitectura pensada para las redes DNN.

La describen como una arquitectura in-memory de señal mixta basada que se puede aplicar para las operaciones de inferencia en memoria empleando un único dispositivo FeFET como celda de memoria no volátil. Afirman que su diseño proporciona un alto nivel de paralelismo empleando solo ADC de 3 bits, y elimina la necesidad de cualquier DAC, requisitos que se dan en la mayoría diseños planteados hasta ahora.

Sus pruebas indican que esta arquitectura proporciona más flexibilidad y una mayor eficiencia en el uso, incluso para tareas y cargas variables. Sus simulaciones demuestran que se supera la eficiencia más alta lograda en las últimas generaciones de dispositivos similares, logrando 36,5 TOPS/W, y que es posible empaquetar capacidades superiores en un área más pequeña. Como resultado, dicen que empleando operaciones binarias se obtienen 1.169 TOPS/W y más de 261 TOPS/W/mm2 a nivel de sistema.

Más información

¿Cuál es el futuro del mercado de almacenamiento? ¿Qué tecologías son las más adecuadas? Si quieres obtener más información sobre un segmento en crecimiento puedes visitar la página de nuestro colaborador Synology