Combinaison de contenus encyclopédiques multilingues pour une reconnaissance d’entités nommées en contexte

Eric Charton


Abstract
Dans cet article, nous présentons une méthode de transformation de Wikipédia en ressource d’information externe pour détecter et désambiguïser des entités nommées, en milieu ouvert et sans apprentissage spécifique. Nous expliquons comment nous construisons notre système, puis nous utilisons cinq éditions linguistiques de Wikipédia afin d’enrichir son lexique. Pour finir nous réalisons une évaluation et comparons les performances du système avec et sans compléments lexicaux issus des informations inter-linguistiques, sur une tâche d’extraction d’entités nommées appliquée à un corpus d’articles journalistiques.
Anthology ID:
2009.jeptalnrecital-recital.10
Volume:
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
Month:
June
Year:
2009
Address:
Senlis, France
Editors:
Thibault Mondary, Aurélien Bossard, Thierry Hamon
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
91–100
Language:
French
URL:
https://aclanthology.org/2009.jeptalnrecital-recital.10
DOI:
Bibkey:
Cite (ACL):
Eric Charton. 2009. Combinaison de contenus encyclopédiques multilingues pour une reconnaissance d’entités nommées en contexte. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues, pages 91–100, Senlis, France. ATALA.
Cite (Informal):
Combinaison de contenus encyclopédiques multilingues pour une reconnaissance d’entités nommées en contexte (Charton, JEP/TALN/RECITAL 2009)
Copy Citation:
PDF:
https://aclanthology.org/2009.jeptalnrecital-recital.10.pdf