Pathfinder MineClever mapeamento de processos e perspectivas de implementação de uma ferramenta de mineração de dados clínicos e epidemiológicos.

 

O estudo anfitrião

Logo MineClever

O MineClever: Minerador de Informações Clínicas e Epidemiológicas em Viroses Emergentes Respiratórias é uma ferramenta de inteligência artificial desenvolvida através da colaboração entre pesquisadores da Fiocruz Pernambuco, Programa de Computação Científica (PROCC) da Fiocruz Rio de Janeiro, do Hospital Johns Hopkins e a equipe Fiocruz da The Global Health Network América Latina e Caribe.

Desenvolvido no período de junho de 2024 a setembro de 2025, o projeto busca mitigar uma barreira crítica identificada durante a pandemia de COVID-19 pelo estudo NeuroCOVID (2020-2023) a falta de acesso a dados clínicos estruturados em registros de prontuários, deixando de atender não somente às necessidades assistenciais, mas também à comunidade científica que buscava gerar evidências para direcionar a rápida tomada de decisão para o controle da pandemia. Assim, a ferramenta MineClever foi desenhada para extrair e analisar dados clínicos e laboratoriais primários de síndromes respiratórias agudas virais em prontuários eletrônicos do Sistema Único de Saúde (SUS). Este projeto foi financiado pelo Programa Inova Fiocruz - Emergências em Saúde (N° 1/2024 3ª Chamada).

Como a Ferramenta foi Construída

O projeto iniciou-se com a obtenção de 315 prontuários eletrônicos de pessoas hospitalizadas com COVID-19 entre abril e junho de 2020 em duas unidades de referência de Pernambuco. Pesquisadores examinaram manualmente 104 prontuários para estruturar procedimentos padronizados e identificar a variabilidade terminológica utilizada na descrição clínica, resultando na documentação de 287 diferentes palavras, siglas ou abreviações: 60% referentes a manifestações respiratórias (com "dispneia" e "ventilação mecânica" apresentando maior variabilidade), 20% a sintomas neurológicos e 12% a sintomas gerais.

Com base nessa estrutura terminológica, foi desenvolvido um programa em linguagem Python e modelo de Processamento de Linguagem Natural (PLN) com dois pipelines esppecializados (clínico e laboratorial) utilizando técnicas de Reconhecimento Ótico de Caracteres (OCR) para extrair informações textuais dos prontuários em PDF. O MineClever V1.0 foi testado em 21 prontuários, apresentando concordância global homem-máquina de 68% (Kappa de Cohen 0,452), estando em fase de identificação de inconsistências e aperfeiçoamento.

O programa recebeu contribuição teórico-prática substancial de professores do Programa de Pós-graduação em Tecnologia em Saúde da Pontifícia Universidade Católica do Paraná (PUC PR), resultando no MineClever V1.1 implementado em plataformas de código aberto para garantir segurança e sigilo.

Esquema de fluxo com formas retângulares em tons de roxo e lilás.Mapa mental MineClever.

Início | O estudo anfitrião | Pathfinder | Objetivos | Recursos

Pathfinder

Este projeto foi apoiado pelo Wellcome Trust (Grant 226688/Z/22/Z).

O Pathfinder Mineclever é um estudo de pesquisa dedicado a mapear, documentar e avaliar a ferramenta MineClever — um sistema de inteligência artificial desenvolvido para extrair e analisar dados clínicos de síndromes respiratórias agudas virais em prontuários eletrônicos do SUS. Este projeto Pathfinder investiga possibilidades de aprimoramento metodológico, usabilidade e aplicabilidade da ferramenta, além de explorar caminhos viáveis para sua implementação no Sistema Único de Saúde. Por meio de um mapeamento retrospectivo do desenvolvimento, apoio prospectivo ao refinamento técnico, compreensão das necessidades dos usuários e análise de desafios éticos, legais e de mercado, este estudo busca preparar a ferramenta MineClever para uma possível integração sustentável no SUS.

Objetivo geral

Mapear e analisar o processo de desenvolvimento da ferramenta MineClever, bem como investigar possibilidades de melhoria de seu arcabouço metodológico, usabilidade e aplicabilidade para profissionais de saúde, além de perspectivas para sua implementação no Sistema Único de Saúde (SUS).

Objetivos específicos

  • Mapeamento Retrospectivo e Documentação
    Mapear retrospectivamente os processos do estudo anfitrião e documentar o desenvolvimento da ferramenta, suas barreiras e soluções, a fim de contribuir para a reprodutibilidade do método em outras condições de saúde.
  • Apoio ao Desenvolvimento Prospectivo
    Apoiar o plano de trabalho prospectivo da equipe no refinamento da ferramenta, incluindo processos de validação e desenvolvimento de sua interface front-end.
  • Desenvolvimento de Materiais de Apoio e Orientação
    Compreender a usabilidade da ferramenta com vistas ao desenvolvimento de materiais de apoio e orientação para o uso do MineClever.
  • Viabilidade de Implementação no SUS
    Explorar possibilidades e desafios para a implementação da ferramenta no SUS, considerando aspectos éticos, legais e relacionados ao potencial de mercado da ferramenta.

Sessões Híbridas de Aprendizagem Construindo o Pathfinder MineClever - do conceito à prática, Janeiro a Fevereiro 2026

As sessões foram realizadas como parte das atividades do grupo Pathfinder da equipe Fiocruz da TGHN LAC, com o objetivo de construir o entendimento conceitual e iniciar a aplicação da metodologia Pathfinder no estudo anfitrião MineClever, por meio de um processo estruturado de aprendizagem colaborativa.

Código-fonte do MineClever em repositório aberto

As sessões foram realizadas como parte das atividades do grupo Pathfinder da equipe Fiocruz da TGHN LAC, com o objetivo de construir o entendimento conceitual e iniciar a aplicação da metodologia Pathfinder no estudo anfitrião MineClever, por meio de um processo estruturado de aprendizagem colaborativa.