
El MineClever: Minero de Información Clínica y Epidemiológica en Virosis Respiratorias Emergentes es una herramienta de inteligencia artificial desarrollada a través de la colaboración entre investigadores de la Fiocruz Pernambuco, Programa de Computación Científica (PROCC) de la Fiocruz Río de Janeiro, del Hospital Johns Hopkins y del equipo Fiocruz de The Global Health Network América Latina y Caribe.
Desarrollado en el período de junio de 2024 a septiembre de 2025, el proyecto busca mitigar una barrera crítica identificada durante la pandemia de COVID-19 por el estudio NeuroCOVID (2020-2023) la falta de acceso a datos clínicos estructurados en registros de historias clínicas, dejando de atender no sólo a las necesidades asistenciales, sino también a la comunidad científica que buscaba generar evidencias para dirigir la rápida toma de decisiones para el control de la pandemia. Así, la herramienta MineClever fue diseñada para extraer y analizar datos clínicos y de laboratorio primarios de síndromes respiratorios agudos virales en historias clínicas electrónicas del Sistema Único de Salud (SUS). Este proyecto fue financiado por el Programa Inova Fiocruz - Emergencias en Salud (Nº 1/2024 3ª Convocatoria).
El proyecto se inició con la obtención de 315 historias clínicas electrónicas de personas hospitalizadas con COVID-19 entre abril y junio de 2020 en dos unidades de referencia de Pernambuco. Los investigadores examinaron manualmente 104 historias clínicas para estructurar procedimientos estandarizados e identificar la variabilidad terminológica utilizada en la descripción clínica, resultando en la documentación de 287 palabras diferentes, siglas o abreviaciones: 60% referentes a manifestaciones respiratorias (con "disnea" y "ventilación mecánica" presentando mayor variabilidad), 20% a síntomas neurológicos y 12% a síntomas generales.
Con base en esta estructura terminológica, se desarrolló un programa en lenguaje Python y modelo de Procesamiento de Lenguaje Natural (PLN) con dos pipelines especializados (clínico y de laboratorio) utilizando técnicas de Reconocimiento Óptico de Caracteres (OCR) para extraer información textual de las historias clínicas en PDF. El MineClever V1.0 fue probado en 21 historias clínicas, presentando concordancia global hombre-máquina de 68% (Kappa de Cohen 0,452), estando en fase de identificación de inconsistencias y mejora.
El programa recibió contribución teórico-práctica sustancial de profesores del Programa de Posgrado en Tecnología en Salud de la Pontificia Universidad Católica de Paraná (PUC PR), resultando en el MineClever V1.1 implementado en plataformas de código abierto para garantizar seguridad y confidencialidad.
Inicio | El estudio anfitrión | Pathfinder | Objetivos | Eventos | Recursos
Este proyecto fue apoyado por el Wellcome Trust (Grant 226688/Z/22/Z).
El desarrollo del MineClever evidenció no sólo el potencial de la inteligencia artificial para la minería de datos en salud, sino también la complejidad implicada en la construcción, validación e posible implementación de herramientas digitales. En este contexto, el uso de la metodología Pathfinder por el estudio MineClever surge como una iniciativa dirigida a documentar la trayectoria de construcción de la herramienta, incluyendo desafíos, barreras y soluciones adoptadas a lo largo del recorrido. Al sistematizar esta experiencia, el Pathfinder busca contribuir a la reproducibilidad metodológica y apoyar futuras aplicaciones de la herramienta en otras condiciones de salud y contextos.
Mapear y analizar el proceso de desarrollo de la herramienta MineClever, así como investigar posibilidades de mejora de su marco metodológico, usabilidad y aplicabilidad para profesionales de salud, además de perspectivas para su implementación en el Sistema Único de Salud (SUS).
Inicio | El estudio anfitrión | Pathfinder | Objetivos | Eventos | Recursos
Inicio | El estudio anfitrión | Pathfinder | Objetivos | Eventos | Recursos
Início | O estudo anfitrião | Pathfinder | Objetivos | Recursos