Désambiguïsation de corpus monolingues par des approches de type Lesk

Florentina Vasilescu, Philippe Langlais


Abstract
Cet article présente une analyse détaillée des facteurs qui déterminent les performances des approches de désambiguïsation dérivées de la méthode de Lesk (1986). Notre étude porte sur une série d’expériences concernant la méthode originelle de Lesk et des variantes que nous avons adaptées aux caractéristiques de WORDNET. Les variantes implémentées ont été évaluées sur le corpus de test de SENSEVAL2, English All Words, ainsi que sur des extraits du corpus SEMCOR. Notre évaluation se base d’un côté, sur le calcul de la précision et du rappel, selon le modèle de SENSEVAL, et d’un autre côté, sur une taxonomie des réponses qui permet de mesurer la prise de risque d’un décideur par rapport à un système de référence.
Anthology ID:
2004.jeptalnrecital-long.20
Volume:
Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
April
Year:
2004
Address:
Fès, Maroc
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
189–198
Language:
French
URL:
https://aclanthology.org/2004.jeptalnrecital-long.20
DOI:
Bibkey:
Copy Citation:
PDF:
https://aclanthology.org/2004.jeptalnrecital-long.20.pdf