Bruno Oliveira Maroneze


2026

Este artigo apresenta a modelagem semântica de entidades nomeadas em Os Lusíadas, de Luís de Camões, com base no padrão TEI P5. Propõe-se um fluxo híbrido de anotação quecombina NER (spaCy), dicionário de autoridade (gazetteer) e pós-edição filológica manual. São tipificados antropônimos, mitônimos e topônimos por meio dos elementos <persName> (nome de pessoa), <placeName> (nome de lugar) e <rs> (referencing string, para cadeias de referências), com especial atenção à marcação de epítetos. O estudo evidencia os limites de modelos treinados em corpora jornalísticos diante da sintaxe épica e da ortografia da edição de 1572, demonstrando a necessidade de uma abordagem híbrida. Conclui-se que o XML/TEI atua como ferramenta de modelagem do conhecimento literário.