Extraction de paraphrases désambiguïsées à partir d’un corpus d’articles encyclopédiques alignés automatiquement

François-Régis Chaumartin


Abstract
Nous décrivons ici comment enrichir automatiquement WordNet en y important des articles encyclopédiques. Ce processus permet de créer des nouvelles entrées, en les rattachant au bon hyperonyme. Par ailleurs, les entrées préexistantes de WordNet peuvent être enrichies de descriptions complémentaires. La répétition de ce processus sur plusieurs encyclopédies permet de constituer un corpus d’articles comparables. On peut ensuite extraire automatiquement des paraphrases à partir des couples d’articles ainsi créés. Grâce à l’application d’une mesure de similarité, utilisant la hiérarchie de verbes de WordNet, les constituants de ces paraphrases peuvent être désambiguïsés.
Anthology ID:
2007.jeptalnrecital-recital.4
Volume:
Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
Month:
June
Year:
2007
Address:
Toulouse, France
Editors:
Farah Benamara, Sylwia Ozdowska
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
457–466
Language:
French
URL:
https://aclanthology.org/2007.jeptalnrecital-recital.4
DOI:
Bibkey:
Cite (ACL):
François-Régis Chaumartin. 2007. Extraction de paraphrases désambiguïsées à partir d’un corpus d’articles encyclopédiques alignés automatiquement. In Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues, pages 457–466, Toulouse, France. ATALA.
Cite (Informal):
Extraction de paraphrases désambiguïsées à partir d’un corpus d’articles encyclopédiques alignés automatiquement (Chaumartin, JEP/TALN/RECITAL 2007)
Copy Citation:
PDF:
https://aclanthology.org/2007.jeptalnrecital-recital.4.pdf