Ulisses Brisolara Corrêa
2026
Avaliação End-to-End de um Sistema RAG para Documentos Hospitalares em Português
Murilo Vargas da Cunha | Marília Rosa Silveira | César Brasil Sperb | Brenda Salenave Santana | Larissa Astrogildo Freitas | Ulisses Brisolara Corrêa
Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1
Murilo Vargas da Cunha | Marília Rosa Silveira | César Brasil Sperb | Brenda Salenave Santana | Larissa Astrogildo Freitas | Ulisses Brisolara Corrêa
Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1
Este artigo avalia um sistema end-to-end de Geração Aumentada por Recuperação (RAG) para consulta a documentos hospitalares regulatórios em português. O estudo analisa o impacto da otimização de cada componente (recuperação, reclassificação e geração) em um cenário de recursos limitados. A metodologia combinou a criação de um dataset híbrido (sintético e validado por especialistas) com avaliações quantitativas utilizando métricas como MRR, NDCG@10 e BERTScore. Os resultados demonstram que o modelo de embedding intfloat/multilingual-e5-small apresentou a maior robustez, com taxa de falha de apenas 1,4% na recuperação. Na etapa de reclassificação, o método RRF destacou-se pelo equilíbrio entre custo computacional e desempenho. Conclui-se que a arquitetura otimizada, integrando esses componentes ao gerador Gemini 2.5 Flash, oferece uma solução eficiente e precisa para suporte à decisão em ambientes hospitalares.
Análise de Sentimento Baseada em Aspectos no Domínio de Acomodações Utilizando o modelo BERTimbau
Franco Noronha Pereira | Larissa Astrogildo de Freitas | Ulisses Brisolara Corrêa
Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1
Franco Noronha Pereira | Larissa Astrogildo de Freitas | Ulisses Brisolara Corrêa
Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1
Este trabalho investiga a aplicação do modelo monolíngue BERTimbau para a Análise de Sentimentos Baseada em Aspectos (ABSA) em português, visando estabelecer um baseline robusto para o domínio hoteleiro. São comparadas duas estratégias via fine-tuning: uma abordagem pipeline (extração seguida de classificação) e uma abordagem end-to-end (multitarefa com esquema de tags colapsadas). Avaliadas no conjunto de dados da competição ABSAPT 2024, os resultados evidenciam um trade-off arquitetural: o pipeline favorece a revocação na extração de aspectos (F1: 0,840), enquanto o end-to-end prioriza a precisão, mas sofre com a dispersão de classes. A análise composta demonstra desempenho competitivo (Medida-F 0,72 para ambos), oferecendo um ponto de partida para futuras investigações em arquiteturas híbridas e generativas para o português.
A RAG Chatbot with Incremental Context Retrieval based on Local LLMs for Hospital Documents
Murilo Vargas da Cunha | Marília Rosa Silveira | César Brasil Sperb | Larissa Astrogildo Freitas | Ulisses Brisolara Corrêa
Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2
Murilo Vargas da Cunha | Marília Rosa Silveira | César Brasil Sperb | Larissa Astrogildo Freitas | Ulisses Brisolara Corrêa
Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2
The adoption of LLMs in hospital environments demands solutions that ensure information security, computational efficiency, and rigorous control over sensitive institutional data. This work presents the development and evaluation of a chatbot based on RAG, using exclusively local LLMs, applied to internal documents of a university hospital in Portuguese, composed of Standard Operating Procedures and technical manuals. The methodology initially evaluates the quality of information retrieval through dense embedding models, measured by the Mean Reciprocal Rank (MRR) metric. Then, the generation stage is analyzed in two distinct scenarios: (i) RAG with fixed context, in which multiple chunks are provided simultaneously to the model, and (ii) Incremental page retrieval, in which chunks are sent sequentially according to the retrieval ranking. The generation assessment was conducted with four local LLMs — MedGemma3:27B, Gemma3:27B, Gpt-oss:20B, and Mistral Small 3.1 — using BERTScore as a quality metric. The results indicate that indiscriminate context increase in the fixed-context scenario degrades generation quality, even while increasing the probability of recovering the relevant chunk. In contrast, the incremental page retrieval technique showed improvements in BERTScore values, with the MedGemma3:27B model standing out with the best overall results. These findings demonstrate that adaptive context control is a critical factor in increasing the reliability and efficiency of RAG systems based on local LLMs in the healthcare domain.
LARI Dataset: A Native Portuguese Question Answering Dataset from Brasileiras em PLN
Júlia da Rocha Junqueira | Larissa A. de Freitas | Ulisses Brisolara Corrêa
Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1
Júlia da Rocha Junqueira | Larissa A. de Freitas | Ulisses Brisolara Corrêa
Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1
Recent advances in the field have revolutionized Question and Answering (QA). However, for languages like Portuguese, progress is often hindered by the lack of native training resources. To address this gap, this paper introduces LARI, a new dataset designed to benchmark and enhance QA in Portuguese. Our methodology combines the capabilities of the Sabiá-7B model, fine-tuned via QLoRA on a domain-specific corpus, with human validation. We utilized the book Natural Language Processing – Concepts, Techniques, and Applications in Portuguese (2nd Edition), as a case study for content extraction. The generated instances underwent expert human evaluation, achieving an average quality score of 4.47 out of 5. The final dataset, comprising 464 context-question-answer triples, is made publicly available to the community, offering a valuable resource for future research in low-resource settings.