Levados em Consideração: Uma Avaliação de Vieses de Estima por Raça, Gênero e Região em Grandes Modelos de Linguagem em Português Brasileiro

João Lucas Lima de Melo, Marlo Souza


Abstract
Este trabalho propõe a identificação de vieses sociais em português nos modelos GPT-4o, GPT-4o-mini, Sabiá-3 e Sabiázinho-3, utilizando a métrica de estima a fim de avaliar o nível de respeito e deferência dos modelos sobre diferentes grupos demográficos. A avaliação abrange sujeitos com marcadores sociais explícitos de género, raça e região brasileira, em condições com e sem o uso de uma técnica de contorno das restrições de moderação (jailbreaking). Os achados mostram que os modelos de linguagem avaliados reproduzem padrões sistemáticos de valoração diferenciada entre grupos sociais, revelando vieses de estima associados a marcadores de gênero, raça e região no português brasileiro. Sujeitos com marcadores sociais enfatizados, especialmente os de raça, tendem a receber estimas mais baixas. A utilização da técnica de jailbreaking não apresentou um impacto uniforme, podendo tanto ampliar quanto reduzir as diferenças de estima.
Anthology ID:
2026.propor-1.51
Volume:
Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1
Month:
April
Year:
2026
Address:
Salvador, Brazil
Editors:
Marlo Souza, Iria de-Dios-Flores, Diana Santos, Larissa Freitas, Jackson Wilke da Cruz Souza, Eugénio Ribeiro
Venue:
PROPOR
SIG:
Publisher:
Association for Computational Linguistics
Note:
Pages:
516–528
Language:
URL:
https://aclanthology.org/2026.propor-1.51/
DOI:
Bibkey:
Cite (ACL):
João Lucas Lima de Melo and Marlo Souza. 2026. Levados em Consideração: Uma Avaliação de Vieses de Estima por Raça, Gênero e Região em Grandes Modelos de Linguagem em Português Brasileiro. In Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1, pages 516–528, Salvador, Brazil. Association for Computational Linguistics.
Cite (Informal):
Levados em Consideração: Uma Avaliação de Vieses de Estima por Raça, Gênero e Região em Grandes Modelos de Linguagem em Português Brasileiro (Melo & Souza, PROPOR 2026)
Copy Citation:
PDF:
https://aclanthology.org/2026.propor-1.51.pdf