Bruno Oliveira Maroneze
2026
Marcação semântica de entidades nomeadas em Os Lusíadas
Adriane Maria de Oliveira Queiroz | Bruno Oliveira Maroneze
Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2
Adriane Maria de Oliveira Queiroz | Bruno Oliveira Maroneze
Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2
Este artigo apresenta a modelagem semântica de entidades nomeadas em Os Lusíadas, de Luís de Camões, com base no padrão TEI P5. Propõe-se um fluxo híbrido de anotação quecombina NER (spaCy), dicionário de autoridade (gazetteer) e pós-edição filológica manual. São tipificados antropônimos, mitônimos e topônimos por meio dos elementos <persName> (nome de pessoa), <placeName> (nome de lugar) e <rs> (referencing string, para cadeias de referências), com especial atenção à marcação de epítetos. O estudo evidencia os limites de modelos treinados em corpora jornalísticos diante da sintaxe épica e da ortografia da edição de 1572, demonstrando a necessidade de uma abordagem híbrida. Conclui-se que o XML/TEI atua como ferramenta de modelagem do conhecimento literário.