HPE desarrolla una tecnología de procesamiento de lenguaje natural para ayudar en la lucha contra la pandemia
- Noticias y Actualidad
A raíz de la pandemia se ha hecho más necesario que nunca acelerar el trabajo con los sistemas de datos y conectar de forma más eficiente a los investigadores en todo el mundo. Para acelerar el proceso, HPE ha desarrollado una tecnología de procesamiento del lenguaje natural basado en preguntas y respuestas, que ha demostrado más eficiencia que los sistemas PLN convencionales.
La inteligencia artificial está introduciendo mejoras revolucionarias en las interfaces de usuario y en la forma de interconectar distintas fuentes de datos, por ejemplo, en los proyectos de trabajo colaborativo. Uno de los ejemplos más destacados es la rama de IA denominada Procesamiento del Lenguaje Natural (PLN), que tiene aplicaciones en cualquier sistema de reconocimiento del habla o de textos. Actualmente se asocia sobre todo a los asistentes virtuales, pero sus usos son cada vez más variados, y su desarrollo continúa, siguiendo diferentes caminos.
Como explica Soumyendu Sarkar, destacado investigador de IA en Hewlett Packard Labs, en un reciente artículo, la irrupción de la pandemia ha hecho más necesario que nunca contar con sistemas capaces de conectar a los científicos en todo el mundo, acelerando la investigación contra la enfermedad COVID-19. Al comienzo de la crisis sanitaria se contabilizaron unas 33.000 publicaciones científicas relacionadas con la investigación del coronavirus, pero actualmente la cifra supera las 100.000.
Conscientes de esta acuciante necesidad, los investigadores de HPE han desarrollado la nueva herramienta de HPE NLP, basada en un enfoque diferente que resulta más eficiente que los sistemas convencionales. Esta herramienta de investigación emplea una dinámica de preguntas y respuestas basadas en PLN, en combinación con análisis de aprendizaje automático inteligente. Gracias a ello los investigadores médicos pueden disponer de información actualizada sobre los factores de riesgo de la enfermedad, la transmisión, la evolución del virus, las posibles vacunas y los sistemas y protocolos de atención médica.
A través de un portal web cualquier interesado puede acceder a los trabajos de investigación publicados por los científicos de todo el mundo, accediendo con rapidez y facilidad a la información más actualizada. En palabras de Sarkar, esta herramienta pretende contribuir a la lucha contra la pandemia, realizando una búsqueda rápida a través de miles de documentos, extrayendo respuestas precisas, clasificando y cotejando respuestas de múltiples fuentes y admitiendo la búsqueda en las variables de ubicación y tiempo. Y también es compatible con una Interface de Programación de Aplicaciones (API) para interactuar con software de terceros, aplicaciones móviles e interfaces de usuario.
El motivo por el que este sistema se ha demostrado más eficiente que los clásicos motores de búsqueda es que permite formular preguntas en lenguaje convencional, y gracias a la tecnología PLN de HPE, proporciona respuestas más ajustadas a los requisitos en forma de publicaciones relacionadas. Según HPE, la investigación a través de búsquedas convencionales conlleva obtener una lista de resultados relacionados que se deben revisar hasta encontrar lo que se busca, algo que muchas veces lleva tiempo y puede resultar infructuoso.
Por el contrario, el método de pregunta-respuesta proporciona respuestas específicas a preguntas concretas, que no se basan en meras palabras clave, sino en una mayor comprensión de la solicitud de información original. Tal como explica Sarkar, la mayor parte de las soluciones de preguntas y respuestas de PLN se han desarrollado basándose en el conjunto de datos de preguntas y respuestas de Stanford (SQUAD), que es el más popular. Pero este sistema se basa en fragmentos cortos de texto, y no es capaz de comprender plenamente la complejidad de las preguntas que los investigadores pueden realizar acerca de la enfermedad.
En HPE Labs han ido varios pasos más allá, desarrollando un sistema mucho más complejo, capaz de trabajar con párrafos de texto mucho más largos y complejos, como los que se encuentran comúnmente en los trabajos de investigación científica. Además, incluyen jergas complejas y altamente especializadas que complican la identificación y comprensión de la información. Por ello, su sistema realiza el trabajo en tres etapas principales, desde la formulación de la pregunta hasta la obtención de un listado de respuestas.
Para hacer funcionar el sistema, HPE se ha centrado en la integración de servidores, la optimización del sistema, la integración web y una arquitectura que sea capaz de garantizar la ejecución simultánea de aplicaciones de PLN en el mismo clúster de servidores, compartiendo los recursos de información disponibles. Hasta ahora, a pesar de algunos fallos, esta herramienta ha demostrado ser mucho más útil que los sistemas de búsqueda convencionales, y HPE se plantea seguir el mismo enfoque para el desarrollo de otras soluciones basadas en el procesamiento del lenguaje natural.
Más información
¿Cuál es el futuro del mercado de almacenamiento? ¿Qué tecnologías son las más adecuadas para las empresas? Si quieres obtener más información sobre un segmento en crecimiento puedes visitar la página de nuestro colaborador HPE.