Avaliação End-to-End de um Sistema RAG para Documentos Hospitalares em Português

Murilo Vargas da Cunha; Marília Rosa Silveira; César Brasil Sperb; Brenda Salenave Santana; Larissa Astrogildo Freitas; Ulisses Brisolara Corrêa

Avaliação End-to-End de um Sistema RAG para Documentos Hospitalares em Português

Murilo Vargas da Cunha, Marília Rosa Silveira, César Brasil Sperb, Brenda Salenave Santana, Larissa Astrogildo Freitas, Ulisses Brisolara Corrêa

Abstract

Este artigo avalia um sistema end-to-end de Geração Aumentada por Recuperação (RAG) para consulta a documentos hospitalares regulatórios em português. O estudo analisa o impacto da otimização de cada componente (recuperação, reclassificação e geração) em um cenário de recursos limitados. A metodologia combinou a criação de um dataset híbrido (sintético e validado por especialistas) com avaliações quantitativas utilizando métricas como MRR, NDCG@10 e BERTScore. Os resultados demonstram que o modelo de embedding intfloat/multilingual-e5-small apresentou a maior robustez, com taxa de falha de apenas 1,4% na recuperação. Na etapa de reclassificação, o método RRF destacou-se pelo equilíbrio entre custo computacional e desempenho. Conclui-se que a arquitetura otimizada, integrando esses componentes ao gerador Gemini 2.5 Flash, oferece uma solução eficiente e precisa para suporte à decisão em ambientes hospitalares.

Anthology ID:: 2026.propor-1.74
Volume:: Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1
Month:: April
Year:: 2026
Address:: Salvador, Brazil
Editors:: Marlo Souza, Iria de-Dios-Flores, Diana Santos, Larissa Freitas, Jackson Wilke da Cruz Souza, Eugénio Ribeiro
Venue:: PROPOR
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 749–758
Language:
URL:: https://aclanthology.org/2026.propor-1.74/
DOI:
Bibkey:
Cite (ACL):: Murilo Vargas da Cunha, Marília Rosa Silveira, César Brasil Sperb, Brenda Salenave Santana, Larissa Astrogildo Freitas, and Ulisses Brisolara Corrêa. 2026. Avaliação End-to-End de um Sistema RAG para Documentos Hospitalares em Português. In Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1, pages 749–758, Salvador, Brazil. Association for Computational Linguistics.
Cite (Informal):: Avaliação End-to-End de um Sistema RAG para Documentos Hospitalares em Português (Cunha et al., PROPOR 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.propor-1.74.pdf

PDF Cite Search Fix data