Investigadores de la Universidad de Jaén desarrollan un sistema de inteligencia artificial que analiza la información textual incluida en los informes radiológicos de una exploración de TAC de tórax con el objetivo de extraer información relevante relacionada con la COVID-19. Este sistema está basado en tecnologías del lenguaje y aprendizaje automático y ha sido diseñado por expertos del Grupo SINAI (Sistemas Inteligentes de Acceso a las Información) en colaboración con radiólogos de la clínica HT Médica.
El personal de la UJA explica que el diagnóstico de COVID-19 generalmente se basa en la prueba de PCR utilizando imágenes radiológicas, principalmente RX y TAC de tórax para la evaluación de la afectación pulmonar. Y detallan que los informes radiológicos textuales también contienen información relevante para determinar la probabilidad de presentar hallazgos radiológicos compatibles con afectación por COVID-19 a nivel pulmonar. En este sentido, el desarrollo de este tipo de sistemas de detección automática podría proporcionar una gran ayuda para apoyar a los médicos a la hora de detectar a personas afectadas.
Esta investigación es importante porque la mayoría de trabajos basados en inteligencia artificial relacionados con la detección de COVID-19 en radiología siempre se han centrado en el análisis de la imagen, explican los expertos de la UJA. “Sin embargo, en este caso hemos utilizado técnicas de procesamiento del lenguaje para identificar entidades médicas en el texto de los informes y poder extraer información relevante.” señala Pilar López, co-autora de este estudio. Así, esta investigación propone un sistema de clasificación de textos basado en la integración de diferentes fuentes de información.
Para la realización de los experimentos se han utilizado 295 informes radiológicos facilitados por la clínica HT Médica, todos ellos solicitudes radiológicas con sospecha de afectación torácica por COVID-19. Para entrenar el sistema de clasificación textual se han aplicado algoritmos de aprendizaje automático y técnicas de reconocimiento de entidades nombradas. El sistema toma dos fuentes de información como entrada: el texto del informe radiológico y los trastornos relacionados con COVID-19 extraídos de la base de conocimiento médica SNOMED-CT. A partir de estos datos se entrena un sistema computacional de aprendizaje automático. La precisión en la predicción de afectación pulmonar por COVID-19 obtenida por el sistema entrenado alcanza un 90%, demostrando así su capacidad de predecir la presencia del virus en un examen radiológico. :
La investigadora de la Universidad de Jaén Maite Martín Valdivia y miembro del grupo SINAI resalta que “si bien el objetivo principal de nuestro trabajo es la integración de trastornos extraídos de SNOMED-CT con el fin de desarrollar un sistema de detección de casos sospechosos de COVID-19 en informes radiológicos textuales, también existen otras motivaciones interesantes que surgen de nuestro estudio, como por ejemplo, la detección de hallazgos inesperados relacionados con COVID-19 en pacientes que son explorados por otros motivos no relacionados con el virus, el seguimiento de la incidencia y prevalencia de COVID-19 en unidades de radiología mediante informes radiológicos, pudiendo ser utilizados para detectar nuevos brotes de la enfermedad, la notificación temprana de casos de COVID-19 o la búsqueda retrospectiva de hallazgos de COVID-19 en pacientes con TAC de tórax en los meses previos a la pandemia”. Tras los importantes resultados obtenidos, los investigadores del grupo SINAI de la UJA han creado una aplicación para implementar el sistema desarrollado directamente en los equipos de la clínica radiológica HT Médica, con el fin de pasar a explotación la investigación realizada y poder comprobar así cómo funciona la herramienta en un escenario real.