Collocation translation based on sentence alignment and parsing

Violeta Seretan, Éric Wehrli


Abstract
Bien que de nombreux efforts aient été déployés pour extraire des collocations à partir de corpus de textes, seule une minorité de travaux se préoccupent aussi de rendre le résultat de l’extraction prêt à être utilisé dans les applications TAL qui pourraient en bénéficier, telles que la traduction automatique. Cet article décrit une méthode précise d’identification de la traduction des collocations dans un corpus parallèle, qui présente les avantages suivants : elle peut traiter des collocation flexibles (et pas seulement figées) ; elle a besoin de ressources limitées et d’un pouvoir de calcul raisonnable (pas d’alignement complet, pas d’entraînement) ; elle peut être appliquée à plusieurs paires des langues et fonctionne même en l’absence de dictionnaires bilingues. La méthode est basée sur l’information syntaxique provenant du parseur multilingue Fips. L’évaluation effectuée sur 4000 collocations de type verbe-objet correspondant à plusieurs paires de langues a montré une précision moyenne de 89.8% et une couverture satisfaisante (70.9%). Ces résultats sont supérieurs à ceux enregistrés dans l’évaluation d’autres méthodes de traduction de collocations.
Anthology ID:
2007.jeptalnrecital-long.37
Volume:
Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2007
Address:
Toulouse, France
Editors:
Nabil Hathout, Philippe Muller
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
375–384
Language:
French
URL:
https://aclanthology.org/2007.jeptalnrecital-long.37
DOI:
Bibkey:
Cite (ACL):
Violeta Seretan and Éric Wehrli. 2007. Collocation translation based on sentence alignment and parsing. In Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 375–384, Toulouse, France. ATALA.
Cite (Informal):
Collocation translation based on sentence alignment and parsing (Seretan & Wehrli, JEP/TALN/RECITAL 2007)
Copy Citation:
PDF:
https://aclanthology.org/2007.jeptalnrecital-long.37.pdf