LLM-Based Multi-Agent System with Retrieval-Augmented Generation for Medical Care Planning Generation in Sickle Cell Disease

Luana Bringel Leite; David Eduardo Pereira; Eyshila Buriti de Araujo Azevedo; Leonardo Mota Meira Filho; Eliane Cristina Araújo; Cláudio E. C. Campelo; Taciana R. O. C. Marques; Letícia B. de Almeida; Herman Martins Gomes

LLM-Based Multi-Agent System with Retrieval-Augmented Generation for Medical Care Planning Generation in Sickle Cell Disease

Luana Bringel Leite, David Eduardo Pereira, Eyshila Buriti de Araujo Azevedo, Leonardo Mota Meira Filho, Eliane Cristina Araújo, Cláudio E. C. Campelo, Taciana R. O. C. Marques, Letícia B. de Almeida, Herman Martins Gomes

Abstract

Ensuring safety in clinical applications of large language models (LLMs) remains an unresolved challenge, particularly for high-risk and underrepresented conditions such as Sickle Cell Disease (SCD). Consequently, these models may exhibit limited reliability for SCD, including hallucinations and clinically unsafe outputs. This paper proposes an LLM-based Multi-Agent System (MAS) enhanced by Retrieval-Augmented Generation (RAG) to support the generation of medical care plans for SCD. The MAS decomposes clinical reasoning into specialized agents responsible for diagnosis, investigation, and treatment planning. Retrieval is framed not as a performance optimization, but as a safety control mechanism. Three RAG strategies, namely LLM-Guided Tree Retrieval, Metadata-Filtered Retrieval, and Semantic Similarity Retrieval, are evaluated alongside a baseline. Our experiments considered LLM-as-a-Judge evaluations and independent assessments by physicians. The results demonstrate high clinical quality, with safety scores exceeding 4 on a 5-point scale. While average performance was similar between RAG and baseline conditions, the Tree Retrieval strategy reduced the frequency of clinically unsafe outputs compared to conventional Semantic Retrieval, indicating fewer clinically unsafe outputs. These findings show evidence that average performance is insufficient to evaluate clinical AI systems, particularly in high-risk scenarios where retrieval serves as a safety control layer.

Anthology ID:: 2026.propor-2.16
Volume:: Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2
Month:: April
Year:: 2026
Address:: Salvador, Brazil
Editors:: Marlo Souza, Iria de-Dios-Flores, Diana Santos, Larissa Freitas, Jackson Wilke da Cruz Souza, Eugénio Ribeiro
Venue:: PROPOR
SIG:
Publisher:: Association for Computational Linguistics
Note:
Pages:: 88–100
Language:
URL:: https://aclanthology.org/2026.propor-2.16/
DOI:
Bibkey:
Cite (ACL):: Luana Bringel Leite, David Eduardo Pereira, Eyshila Buriti de Araujo Azevedo, Leonardo Mota Meira Filho, Eliane Cristina Araújo, Cláudio E. C. Campelo, Taciana R. O. C. Marques, Letícia B. de Almeida, and Herman Martins Gomes. 2026. LLM-Based Multi-Agent System with Retrieval-Augmented Generation for Medical Care Planning Generation in Sickle Cell Disease. In Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2, pages 88–100, Salvador, Brazil. Association for Computational Linguistics.
Cite (Informal):: LLM-Based Multi-Agent System with Retrieval-Augmented Generation for Medical Care Planning Generation in Sickle Cell Disease (Leite et al., PROPOR 2026)
Copy Citation:
PDF:: https://aclanthology.org/2026.propor-2.16.pdf

PDF Cite Search Fix data