Construction d’un corpus de paraphrases d’énoncés par traduction multiple multilingue

Houda Bouamor


Abstract
Les corpus de paraphrases à large échelle sont importants dans de nombreuses applications de TAL. Dans cet article nous présentons une méthode visant à obtenir un corpus parallèle de paraphrases d’énoncés en français. Elle vise à collecter des traductions multiples proposées par des contributeurs volontaires francophones à partir de plusieurs langues européennes. Nous formulons l’hypothèse que deux traductions soumises indépendamment par deux participants conservent généralement le sens de la phrase d’origine, quelle que soit la langue à partir de laquelle la traduction est effectuée. L’analyse des résultats nous permet de discuter cette hypothèse.
Anthology ID:
2010.jeptalnrecital-recital.5
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
Month:
July
Year:
2010
Address:
Montréal, Canada
Editors:
Alexandre Patry, Philippe Langlais, Aurélien Max
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
44–53
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-recital.5
DOI:
Bibkey:
Cite (ACL):
Houda Bouamor. 2010. Construction d’un corpus de paraphrases d’énoncés par traduction multiple multilingue. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues, pages 44–53, Montréal, Canada. ATALA.
Cite (Informal):
Construction d’un corpus de paraphrases d’énoncés par traduction multiple multilingue (Bouamor, JEP/TALN/RECITAL 2010)
Copy Citation:
PDF:
https://aclanthology.org/2010.jeptalnrecital-recital.5.pdf