Extraction de terminologies bilingues à partir de corpus comparables

Emmanuel Morin, Samuel Dufour-Kowalski, Béatrice Daille


Abstract
Cet article présente une méthode pour extraire, à partir de corpus comparables d’un domaine de spécialité, un lexique bilingue comportant des termes simples et complexes. Cette méthode extrait d’abord les termes complexes dans chaque langue, puis les aligne à l’aide de méthodes statistiques exploitant le contexte des termes. Après avoir rappelé les difficultés que pose l’alignement des termes complexes et précisé notre approche, nous présentons le processus d’extraction de terminologies bilingues adopté et les ressources utilisées pour nos expérimentations. Enfin, nous évaluons notre approche et démontrons son intérêt en particulier pour l’alignement de termes complexes non compositionnels.
Anthology ID:
2004.jeptalnrecital-long.13
Volume:
Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
April
Year:
2004
Address:
Fès, Maroc
Editors:
Philippe Blache, Noël Nguyen, Nouredine Chenfour, Abdenbi Rajouani
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
120–129
Language:
French
URL:
https://aclanthology.org/2004.jeptalnrecital-long.13
DOI:
Bibkey:
Cite (ACL):
Emmanuel Morin, Samuel Dufour-Kowalski, and Béatrice Daille. 2004. Extraction de terminologies bilingues à partir de corpus comparables. In Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 120–129, Fès, Maroc. ATALA.
Cite (Informal):
Extraction de terminologies bilingues à partir de corpus comparables (Morin et al., JEP/TALN/RECITAL 2004)
Copy Citation:
PDF:
https://aclanthology.org/2004.jeptalnrecital-long.13.pdf