Mise au jour semi-automatique de nuances sémantiques entre mots de sens proches

Mathias Rossignol, Pascale Sébillot


Abstract
L’acquisition automatique sur corpus d’informations lexicales sémantiques donne une place importante à la constitution de classes sémantiques rassemblant des mots de sens proches. Or, l’intérêt pratique de celles-ci reste limité en l’absence d’information sur les distinctions individualisant les sens des mots qu’elles rassemblent. Nous présentons dans cet article un premier système permettant de mettre au jour, de manière semi-automatique et à partir des seules données textuelles rassemblées dans un corpus, des éléments de distinction sémantique fine entre mots appartenant à une même classe, atteignant ainsi un degré de définition du sens encore inédit en acquisition automatique d’informations sémantiques lexicales. La technique mise au point regroupe, en s’appuyant sur l’étude de grands voisinages autour des occurrences des mots comparés, des paires de mots distingués par des nuances similaires. Cette approche présente la faiblesse de ne permettre qu’une représentation implicite des nuances découvertes : les listes de paires de mots rapprochées doivent être interprétées afin de « comprendre » l’élément de distinction commun. En revanche, elle permet une automatisation importante du processus de recherche de nuances, suffisante pour assurer que le travail humain de validation des résultats n’introduise dans ceux-ci de biais interprétatif trop important.
Anthology ID:
2006.jeptalnrecital-long.24
Volume:
Actes de la 13ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
April
Year:
2006
Address:
Leuven, Belgique
Editors:
Piet Mertens, Cédrick Fairon, Anne Dister, Patrick Watrin
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
267–276
Language:
French
URL:
https://aclanthology.org/2006.jeptalnrecital-long.24
DOI:
Bibkey:
Cite (ACL):
Mathias Rossignol and Pascale Sébillot. 2006. Mise au jour semi-automatique de nuances sémantiques entre mots de sens proches. In Actes de la 13ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 267–276, Leuven, Belgique. ATALA.
Cite (Informal):
Mise au jour semi-automatique de nuances sémantiques entre mots de sens proches (Rossignol & Sébillot, JEP/TALN/RECITAL 2006)
Copy Citation:
PDF:
https://aclanthology.org/2006.jeptalnrecital-long.24.pdf