Filtrage thématique d’un réseau de collocations

Olivier Ferret


Abstract
Les réseaux lexicaux de type WordNet présentent une absence de relations de nature thématique, relations pourtant très utiles dans des tâches telles que le résumé automatique ou l’extraction d’information. Dans cet article, nous proposons une méthode visant à construire automatiquement à partir d’un large corpus un réseau lexical dont les relations sont préférentiellement thématiques. En l’absence d’utilisation de ressources de type dictionnaire, cette méthode se fonde sur un principe d’auto-amorçage : un réseau de collocations est d’abord construit à partir d’un corpus puis filtré sur la base des mots du corpus que le réseau initial a permis de sélectionner. Nous montrons au travers d’une évaluation portant sur la segmentation thématique que le réseau final, bien que de taille bien inférieure au réseau initial, permet d’obtenir les mêmes performances que celui-ci pour cette tâche.
Anthology ID:
2003.jeptalnrecital-poster.9
Volume:
Actes de la 10ème conférence sur le Traitement Automatique des Langues Naturelles. Posters
Month:
June
Year:
2003
Address:
Batz-sur-Mer, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
347–352
Language:
French
URL:
https://aclanthology.org/2003.jeptalnrecital-poster.9
DOI:
Bibkey:
Copy Citation:
PDF:
https://aclanthology.org/2003.jeptalnrecital-poster.9.pdf