Exploitation de treillis de Galois en désambiguïsation non supervisée d’entités nommées

Thomas Girault


Abstract
Nous présentons une méthode non supervisée de désambiguïsation d’entités nommées, basée sur l’exploitation des treillis de Galois. Nous réalisons une analyse de concepts formels à partir de relations entre des entités nommées et leurs contextes syntaxiques extraits d’un corpus d’apprentissage. Le treillis de Galois résultant fournit des concepts qui sont utilisés comme des étiquettes pour annoter les entités nommées et leurs contextes dans un corpus de test. Une évaluation en cascade montre qu’un système d’apprentissage supervisé améliore la classification des entités nommées lorsqu’il s’appuie sur l’annotation réalisée par notre système de désambiguïsation non supervisée.
Anthology ID:
2008.jeptalnrecital-long.26
Volume:
Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2008
Address:
Avignon, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
252–261
Language:
French
URL:
https://aclanthology.org/2008.jeptalnrecital-long.26
DOI:
Bibkey:
Copy Citation:
PDF:
https://aclanthology.org/2008.jeptalnrecital-long.26.pdf