Pathfinder MineClever: mapeo de procesos y perspectivas de implementación de una herramienta de minería de datos clínicos y epidemiológicos.

 

El estudio anfitrión

Logo MineClever

El MineClever: Minero de Información Clínica y Epidemiológica en Virosis Respiratorias Emergentes es una herramienta de inteligencia artificial desarrollada a través de la colaboración entre investigadores de la Fiocruz Pernambuco, Programa de Computación Científica (PROCC) de la Fiocruz Río de Janeiro, del Hospital Johns Hopkins y del equipo Fiocruz de The Global Health Network América Latina y Caribe.

Desarrollado en el período de junio de 2024 a septiembre de 2025, el proyecto busca mitigar una barrera crítica identificada durante la pandemia de COVID-19 por el estudio NeuroCOVID (2020-2023) la falta de acceso a datos clínicos estructurados en registros de historias clínicas, dejando de atender no sólo a las necesidades asistenciales, sino también a la comunidad científica que buscaba generar evidencias para dirigir la rápida toma de decisiones para el control de la pandemia. Así, la herramienta MineClever fue diseñada para extraer y analizar datos clínicos y de laboratorio primarios de síndromes respiratorios agudos virales en historias clínicas electrónicas del Sistema Único de Salud (SUS). Este proyecto fue financiado por el Programa Inova Fiocruz - Emergencias en Salud (Nº 1/2024 3ª Convocatoria).

Cómo fue Construida la Herramienta

El proyecto se inició con la obtención de 315 historias clínicas electrónicas de personas hospitalizadas con COVID-19 entre abril y junio de 2020 en dos unidades de referencia de Pernambuco. Los investigadores examinaron manualmente 104 historias clínicas para estructurar procedimientos estandarizados e identificar la variabilidad terminológica utilizada en la descripción clínica, resultando en la documentación de 287 palabras diferentes, siglas o abreviaciones: 60% referentes a manifestaciones respiratorias (con "disnea" y "ventilación mecánica" presentando mayor variabilidad), 20% a síntomas neurológicos y 12% a síntomas generales.

Con base en esta estructura terminológica, se desarrolló un programa en lenguaje Python y modelo de Procesamiento de Lenguaje Natural (PLN) con dos pipelines especializados (clínico y de laboratorio) utilizando técnicas de Reconocimiento Óptico de Caracteres (OCR) para extraer información textual de las historias clínicas en PDF. El MineClever V1.0 fue probado en 21 historias clínicas, presentando concordancia global hombre-máquina de 68% (Kappa de Cohen 0,452), estando en fase de identificación de inconsistencias y mejora.

El programa recibió contribución teórico-práctica sustancial de profesores del Programa de Posgrado en Tecnología en Salud de la Pontificia Universidad Católica de Paraná (PUC PR), resultando en el MineClever V1.1 implementado en plataformas de código abierto para garantizar seguridad y confidencialidad.

Esquema de flujo con formas rectangulares en tonos de púrpura y lila.Mapa mental MineClever.

Inicio | El estudio anfitrión | Pathfinder | Objetivos | Eventos | Recursos

Pathfinder

Este proyecto fue apoyado por el Wellcome Trust (Grant 226688/Z/22/Z).

El desarrollo del MineClever evidenció no sólo el potencial de la inteligencia artificial para la minería de datos en salud, sino también la complejidad implicada en la construcción, validación e posible implementación de herramientas digitales. En este contexto, el uso de la metodología Pathfinder por el estudio MineClever surge como una iniciativa dirigida a documentar la trayectoria de construcción de la herramienta, incluyendo desafíos, barreras y soluciones adoptadas a lo largo del recorrido. Al sistematizar esta experiencia, el Pathfinder busca contribuir a la reproducibilidad metodológica y apoyar futuras aplicaciones de la herramienta en otras condiciones de salud y contextos.

Objetivo general

Mapear y analizar el proceso de desarrollo de la herramienta MineClever, así como investigar posibilidades de mejora de su marco metodológico, usabilidad y aplicabilidad para profesionales de salud, además de perspectivas para su implementación en el Sistema Único de Salud (SUS).

Objetivos específicos

  • Mapeo Retrospectivo y Documentación
    Mapear retrospectivamente los procesos del estudio anfitrión y documentar el desarrollo de la herramienta, sus barreras y soluciones, a fin de contribuir a la reproducibilidad del método en otras condiciones de salud.
  • Apoyo al Desarrollo Prospectivo
    Apoyar el plan de trabajo prospectivo del equipo en el refinamiento de la herramienta, incluyendo procesos de validación y desarrollo de su interfaz front-end.
  • Desarrollo de Materiales de Apoyo y Orientación
    Comprender la usabilidad de la herramienta con vistas al desarrollo de materiales de apoyo y orientación para el uso del MineClever.
  • Viabilidad de Implementación en el SUS
    Explorar posibilidades y desafíos para la implementación de la herramienta en el SUS, considerando aspectos éticos, legales y relacionados con el potencial de mercado de la herramienta.

Sesiones Híbridas de Aprendizaje Construyendo el Pathfinder MineClever: del concepto a la práctica, enero a febrero de 2026

Las sesiones fueron realizadas como parte de las actividades del grupo Pathfinder del equipo Fiocruz de la TGHN LAC, con el objetivo de construir la comprensión conceptual e iniciar la aplicación de la metodología Pathfinder en el estudio anfitrión MineClever, por medio de un proceso estructurado de aprendizaje colaborativo.

Sesiones Híbridas de Aprendizaje Construyendo el Pathfinder MineClever: del concepto a la práctica, enero a febrero de 2026

Las sesiones fueron realizadas como parte de las actividades del grupo Pathfinder del equipo Fiocruz de la TGHN LAC, con el objetivo de construir la comprensión conceptual e iniciar la aplicación de la metodología Pathfinder en el estudio anfitrión MineClever, por medio de un proceso estructurado de aprendizaje colaborativo.