MADRID, 16 (EUROPA PRESS)
El Instituto de Ingeniería del Conocimiento ha trabajado con casos anonimizados del Centro Nacional de Investigaciones Oncológicas (CNIO) para avanzar en una herramienta capaz de detectar relaciones entre enfermedades, síntomas y medicamentos a partir del análisis automático de grandes volúmenes de textos clínicos.
Con técnicas de Procesamiento del Lenguaje Natural (PLN), han desarrollado una metodología de anotación y análisis lingüístico específica para los profesionales sanitarios, algo imprescindible previo al análisis de textos para etiquetar lingüísticamente y estructurar la información escrita.
La labor de los investigadores, en concreto, ha consistido en estudiar a fondo los casos del CNIO y anotarlos manualmente para identificar la terminología clínica y tratar los posibles problemas de procesamiento del lenguaje. De esta forma, se puede configurar el etiquetado automático de narrativa clínica con técnicas de PLN mediante el enriquecimiento de las herramientas de análisis estándar en español, pues hasta ahora solo existían herramientas lingüísticas adaptadas al dominio médico en inglés.
El equipo de lingüistas computacionales del IIC ha alcanzado la calidad de anotación exigida por los expertos en narrativa clínica del CNIO. En total, se han anotado más de 300.000 palabras, 64.000 oraciones y 18.000 lemas diferentes, para poner a disposición de la comunidad científica y la industria médica una rigurosa metodología de anotación y sentar las bases de esta nueva herramienta adaptada al dominio médico en nuestro idioma.
Con esta herramienta, aseguran que se conseguiría una información clínica estructurada que permitiría su inclusión en bases de datos, y a partir de las cuales ya sí sería posible hacer búsquedas avanzadas o detectar relaciones entre enfermedades, síntomas o medicamentos, teniendo en cuenta el 'background' de casos clínicos. "Así se facilitaría en un futuro a los profesionales la toma de decisiones basada en el análisis de toda la información conservada en texto", concluyen.