Vanessa Andréani
2009
Normalisation des entités nommées : pour une approche mixte et orientée utilisateurs
Vanessa Andréani
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
La normalisation intervient dans de nombreux champs du traitement de l’information. Elle permet d’optimiser les performances des applications, telles que la recherche ou l’extraction d’information, et de rendre plus fiable la constitution de ressources langagières. La normalisation consiste à ramener toutes les variantes d’un même terme ou d’une entité nommée à une forme standard, et permet de limiter l’impact de la variation linguistique. Notre travail porte sur la normalisation des entités nommées, pour laquelle nous avons mis en place un système complexe mêlant plusieurs approches. Nous en présentons ici une des composantes : une méthode endogène de délimitation et de validation de l’entité nommée normée, adaptée à des données multilingues. De plus, nous plaçons l’utilisateur au centre du processus de normalisation, dans l’objectif d’obtenir des données parfaitement fiables et adaptées à ses besoins.
Search