Apprentissage Automatique de Paraphrases pour l’Amélioration d’un Système de Questions-Réponses

Florence Duclaye, Olivier Collin, François Yvon


Abstract
Dans cet article, nous présentons une méthodologie d’apprentissage faiblement supervisé pour l’extraction automatique de paraphrases à partir du Web. À partir d’un seule exemple de paire (prédicat, arguments), un corpus est progressivement accumulé par sondage duWeb. Les phases de sondage alternent avec des phases de filtrage, durant lesquelles les paraphrases les moins plausibles sont éliminées à l’aide d’une procédure de clustering non supervisée. Ce mécanisme d’apprentissage s’appuie sur un système de Questions-Réponses existant et les paraphrases apprises seront utilisées pour en améliorer le rappel. Nous nous concentrons ici sur le mécanisme d’apprentissage de ce système et en présentons les premiers résultats.
Anthology ID:
2003.jeptalnrecital-long.10
Volume:
Actes de la 10ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2003
Address:
Batz-sur-Mer, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
115–124
Language:
French
URL:
https://aclanthology.org/2003.jeptalnrecital-long.10
DOI:
Bibkey:
Copy Citation:
PDF:
https://aclanthology.org/2003.jeptalnrecital-long.10.pdf