@inproceedings{moura-etal-2026-sintomas,
title = "Sintomas Lingu{\'i}sticos: Gera{\c{c}}{\~a}o Aumentada por Recupera{\c{c}}{\~a}o e Racioc{\'i}nio em {LLM}s sob a Varia{\c{c}}{\~a}o Portugu{\^e}s-Ingl{\^e}s em Contextos M{\'e}dicos",
author = "Moura, Guilherme Vianna de and
Assis, Gabriel and
Paes, Aline",
editor = "Souza, Marlo and
de-Dios-Flores, Iria and
Santos, Diana and
Freitas, Larissa and
Souza, Jackson Wilke da Cruz and
Ribeiro, Eug{\'e}nio",
booktitle = "Proceedings of the 17th International Conference on Computational Processing of {P}ortuguese ({PROPOR} 2026) - Vol. 1",
month = apr,
year = "2026",
address = "Salvador, Brazil",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2026.propor-1.46/",
pages = "467--477",
ISBN = "979-8-89176-387-6",
abstract = "Modelos de L{\'i}ngua de Grande Porte (LLMs) t{\^e}m demonstrado desempenho expressivo em tarefas de racioc{\'i}nio m{\'e}dico. No entanto, sua robustez diante de varia{\c{c}}{\~o}es lingu{\'i}sticas ainda {\'e} pouco explorada, especialmente em idiomas al{\'e}m do ingl{\^e}s, como o portugu{\^e}s. Neste trabalho, investigamos como o idioma de entrada afeta o desempenho e o comportamento de racioc{\'i}nio de LLMs m{\'e}dicos, bem como se a Gera{\c{c}}{\~a}o Aumentada por Recupera{\c{c}}{\~a}o (RAG) {\'e} capaz de mitigar eventuais limita{\c{c}}{\~o}es decorrentes dessas varia{\c{c}}{\~o}es. Para isso, realizamos experimentos em portugu{\^e}s e em ingl{\^e}s, utilizando duas variantes do modelo MedGemma, com 4B e 27B par{\^a}metros, e avaliando-as em tr{\^e}s conjuntos de dados m{\'e}dicos. A avalia{\c{c}}{\~a}o combina m{\'e}tricas quantitativas de acur{\'a}cia com an{\'a}lises qualitativas e estruturais das cadeias de racioc{\'i}nio e das respostas geradas pelos modelos. Os resultados indicam que a varia{\c{c}}{\~a}o lingu{\'i}stica impacta de forma mais acentuada os modelos de menor porte. Em particular, a variante de 4B par{\^a}metros apresenta desempenho consistentemente inferior quando as entradas s{\~a}o fornecidas em portugu{\^e}s. Em contraste, a variante de 27B par{\^a}metros demonstra maior robustez entre idiomas, mantendo n{\'i}veis semelhantes de acur{\'a}cia e de estrutura de racioc{\'i}nio tanto em portugu{\^e}s quanto em ingl{\^e}s. Embora o sistema de RAG implementado apresente recupera{\c{c}}{\~a}o de documentos de boa qualidade, sua integra{\c{c}}{\~a}o n{\~a}o resulta em ganhos consistentes para o modelo menor, o que sugere limita{\c{c}}{\~o}es na explora{\c{c}}{\~a}o efetiva do contexto adicional. De forma geral, este trabalho contribui para o entendimento dos limites atuais dos LLMs m{\'e}dicos em contextos multil{\'i}ngues, destacando os desafios associados ao desempenho em idiomas com recursos limitados."
}<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="moura-etal-2026-sintomas">
<titleInfo>
<title>Sintomas Linguísticos: Geração Aumentada por Recuperação e Raciocínio em LLMs sob a Variação Português-Inglês em Contextos Médicos</title>
</titleInfo>
<name type="personal">
<namePart type="given">Guilherme</namePart>
<namePart type="given">Vianna</namePart>
<namePart type="given">de</namePart>
<namePart type="family">Moura</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Gabriel</namePart>
<namePart type="family">Assis</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Aline</namePart>
<namePart type="family">Paes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2026-04</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<relatedItem type="host">
<titleInfo>
<title>Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1</title>
</titleInfo>
<name type="personal">
<namePart type="given">Marlo</namePart>
<namePart type="family">Souza</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Iria</namePart>
<namePart type="family">de-Dios-Flores</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Santos</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Larissa</namePart>
<namePart type="family">Freitas</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jackson</namePart>
<namePart type="given">Wilke</namePart>
<namePart type="given">da</namePart>
<namePart type="given">Cruz</namePart>
<namePart type="family">Souza</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eugénio</namePart>
<namePart type="family">Ribeiro</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>Association for Computational Linguistics</publisher>
<place>
<placeTerm type="text">Salvador, Brazil</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
<identifier type="isbn">979-8-89176-387-6</identifier>
</relatedItem>
<abstract>Modelos de Língua de Grande Porte (LLMs) têm demonstrado desempenho expressivo em tarefas de raciocínio médico. No entanto, sua robustez diante de variações linguísticas ainda é pouco explorada, especialmente em idiomas além do inglês, como o português. Neste trabalho, investigamos como o idioma de entrada afeta o desempenho e o comportamento de raciocínio de LLMs médicos, bem como se a Geração Aumentada por Recuperação (RAG) é capaz de mitigar eventuais limitações decorrentes dessas variações. Para isso, realizamos experimentos em português e em inglês, utilizando duas variantes do modelo MedGemma, com 4B e 27B parâmetros, e avaliando-as em três conjuntos de dados médicos. A avaliação combina métricas quantitativas de acurácia com análises qualitativas e estruturais das cadeias de raciocínio e das respostas geradas pelos modelos. Os resultados indicam que a variação linguística impacta de forma mais acentuada os modelos de menor porte. Em particular, a variante de 4B parâmetros apresenta desempenho consistentemente inferior quando as entradas são fornecidas em português. Em contraste, a variante de 27B parâmetros demonstra maior robustez entre idiomas, mantendo níveis semelhantes de acurácia e de estrutura de raciocínio tanto em português quanto em inglês. Embora o sistema de RAG implementado apresente recuperação de documentos de boa qualidade, sua integração não resulta em ganhos consistentes para o modelo menor, o que sugere limitações na exploração efetiva do contexto adicional. De forma geral, este trabalho contribui para o entendimento dos limites atuais dos LLMs médicos em contextos multilíngues, destacando os desafios associados ao desempenho em idiomas com recursos limitados.</abstract>
<identifier type="citekey">moura-etal-2026-sintomas</identifier>
<location>
<url>https://aclanthology.org/2026.propor-1.46/</url>
</location>
<part>
<date>2026-04</date>
<extent unit="page">
<start>467</start>
<end>477</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Sintomas Linguísticos: Geração Aumentada por Recuperação e Raciocínio em LLMs sob a Variação Português-Inglês em Contextos Médicos
%A Moura, Guilherme Vianna de
%A Assis, Gabriel
%A Paes, Aline
%Y Souza, Marlo
%Y de-Dios-Flores, Iria
%Y Santos, Diana
%Y Freitas, Larissa
%Y Souza, Jackson Wilke da Cruz
%Y Ribeiro, Eugénio
%S Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1
%D 2026
%8 April
%I Association for Computational Linguistics
%C Salvador, Brazil
%@ 979-8-89176-387-6
%F moura-etal-2026-sintomas
%X Modelos de Língua de Grande Porte (LLMs) têm demonstrado desempenho expressivo em tarefas de raciocínio médico. No entanto, sua robustez diante de variações linguísticas ainda é pouco explorada, especialmente em idiomas além do inglês, como o português. Neste trabalho, investigamos como o idioma de entrada afeta o desempenho e o comportamento de raciocínio de LLMs médicos, bem como se a Geração Aumentada por Recuperação (RAG) é capaz de mitigar eventuais limitações decorrentes dessas variações. Para isso, realizamos experimentos em português e em inglês, utilizando duas variantes do modelo MedGemma, com 4B e 27B parâmetros, e avaliando-as em três conjuntos de dados médicos. A avaliação combina métricas quantitativas de acurácia com análises qualitativas e estruturais das cadeias de raciocínio e das respostas geradas pelos modelos. Os resultados indicam que a variação linguística impacta de forma mais acentuada os modelos de menor porte. Em particular, a variante de 4B parâmetros apresenta desempenho consistentemente inferior quando as entradas são fornecidas em português. Em contraste, a variante de 27B parâmetros demonstra maior robustez entre idiomas, mantendo níveis semelhantes de acurácia e de estrutura de raciocínio tanto em português quanto em inglês. Embora o sistema de RAG implementado apresente recuperação de documentos de boa qualidade, sua integração não resulta em ganhos consistentes para o modelo menor, o que sugere limitações na exploração efetiva do contexto adicional. De forma geral, este trabalho contribui para o entendimento dos limites atuais dos LLMs médicos em contextos multilíngues, destacando os desafios associados ao desempenho em idiomas com recursos limitados.
%U https://aclanthology.org/2026.propor-1.46/
%P 467-477
Markdown (Informal)
[Sintomas Linguísticos: Geração Aumentada por Recuperação e Raciocínio em LLMs sob a Variação Português-Inglês em Contextos Médicos](https://aclanthology.org/2026.propor-1.46/) (Moura et al., PROPOR 2026)
ACL