Marcação semântica de entidades nomeadas em Os Lusíadas

Adriane Maria de Oliveira Queiroz, Bruno Oliveira Maroneze


Abstract
Este artigo apresenta a modelagem semântica de entidades nomeadas em Os Lusíadas, de Luís de Camões, com base no padrão TEI P5. Propõe-se um fluxo híbrido de anotação quecombina NER (spaCy), dicionário de autoridade (gazetteer) e pós-edição filológica manual. São tipificados antropônimos, mitônimos e topônimos por meio dos elementos <persName> (nome de pessoa), <placeName> (nome de lugar) e <rs> (referencing string, para cadeias de referências), com especial atenção à marcação de epítetos. O estudo evidencia os limites de modelos treinados em corpora jornalísticos diante da sintaxe épica e da ortografia da edição de 1572, demonstrando a necessidade de uma abordagem híbrida. Conclui-se que o XML/TEI atua como ferramenta de modelagem do conhecimento literário.
Anthology ID:
2026.propor-2.38
Volume:
Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2
Month:
April
Year:
2026
Address:
Salvador, Brazil
Editors:
Marlo Souza, Iria de-Dios-Flores, Diana Santos, Larissa Freitas, Jackson Wilke da Cruz Souza, Eugénio Ribeiro
Venue:
PROPOR
SIG:
Publisher:
Association for Computational Linguistics
Note:
Pages:
293–297
Language:
URL:
https://aclanthology.org/2026.propor-2.38/
DOI:
Bibkey:
Cite (ACL):
Adriane Maria de Oliveira Queiroz and Bruno Oliveira Maroneze. 2026. Marcação semântica de entidades nomeadas em Os Lusíadas. In Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2, pages 293–297, Salvador, Brazil. Association for Computational Linguistics.
Cite (Informal):
Marcação semântica de entidades nomeadas em Os Lusíadas (Queiroz & Maroneze, PROPOR 2026)
Copy Citation:
PDF:
https://aclanthology.org/2026.propor-2.38.pdf