Fauna e Flora setecentista: das Entidades Nomeadas aos problemas de normalização

Helena Freire Cameron, Fernanda Olival, Daniel Reyes, Renata Vieira


Abstract
Este artigo aborda tarefas de etapas anteriores ao processamento computacional de fontes históricas do século XVIII, em língua portuguesa. O trabalho desenvolvido incidiu em domínios muito especializados: fauna e flora. Por esta última característica, esperava-se um fraco nível de ambiguidade vocabular, mas assim não aconteceu. Por isso, apresenta-se um roteiro do processo de normalização ortográfica; descreve-se a constituição do corpus anotado de Entidades Nomeadas e, sobretudo, discutem-se problemas ligados à variação lexical nestes thesauri de especialidade e os constrangimentos do processo. Desta forma, pretende-se contribuir para a reflexão sobre o que é o processo de normalização de fontes históricas e chamar a atenção para a importância das boas práticas neste quadro.
Anthology ID:
2026.propor-2.36
Volume:
Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2
Month:
April
Year:
2026
Address:
Salvador, Brazil
Editors:
Marlo Souza, Iria de-Dios-Flores, Diana Santos, Larissa Freitas, Jackson Wilke da Cruz Souza, Eugénio Ribeiro
Venue:
PROPOR
SIG:
Publisher:
Association for Computational Linguistics
Note:
Pages:
275–281
Language:
URL:
https://aclanthology.org/2026.propor-2.36/
DOI:
Bibkey:
Cite (ACL):
Helena Freire Cameron, Fernanda Olival, Daniel Reyes, and Renata Vieira. 2026. Fauna e Flora setecentista: das Entidades Nomeadas aos problemas de normalização. In Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2, pages 275–281, Salvador, Brazil. Association for Computational Linguistics.
Cite (Informal):
Fauna e Flora setecentista: das Entidades Nomeadas aos problemas de normalização (Cameron et al., PROPOR 2026)
Copy Citation:
PDF:
https://aclanthology.org/2026.propor-2.36.pdf