Adaptation d’un Système de Traduction Automatique Statistique avec des Ressources monolingues

Holger Schwenk


Abstract
Les performances d’un système de traduction statistique dépendent beaucoup de la qualité et de la quantité des données d’apprentissage disponibles. La plupart des textes parallèles librement disponibles proviennent d’organisations internationales. Le jargon observé dans ces textes n’est pas très adapté pour construire un système de traduction pour d’autres domaines. Nous présentons dans cet article une technique pour adapter le modèle de traduction à un domaine différent en utilisant des textes dans la langue source uniquement. Nous obtenons des améliorations significatives du score BLEU dans des systèmes de traduction de l’arabe vers le français et vers l’anglais.
Anthology ID:
2010.jeptalnrecital-long.1
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
July
Year:
2010
Address:
Montréal, Canada
Editors:
Philippe Langlais, Michel Gagnon
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
1–10
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-long.1
DOI:
Bibkey:
Cite (ACL):
Holger Schwenk. 2010. Adaptation d’un Système de Traduction Automatique Statistique avec des Ressources monolingues. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 1–10, Montréal, Canada. ATALA.
Cite (Informal):
Adaptation d’un Système de Traduction Automatique Statistique avec des Ressources monolingues (Schwenk, JEP/TALN/RECITAL 2010)
Copy Citation:
PDF:
https://aclanthology.org/2010.jeptalnrecital-long.1.pdf