Traduction de requêtes basée sur Wikipédia

Benoît Gaillard, Olivier Collin, Malek Boualem


Abstract
Cet article s’inscrit dans le domaine de la recherche d’information multilingue. Il propose une méthode de traduction automatique de requêtes basée sur Wikipédia. Une phase d’analyse permet de segmenter la requête en syntagmes ou unités lexicales à traduire en s’appuyant sur les liens multilingues entre les articles de Wikipédia. Une deuxième phase permet de choisir, parmi les traductions possibles, celle qui est la plus cohérente en s’appuyant sur les informations d’ordre sémantique fournies par les catégories associées à chacun des articles de Wikipédia. Cet article justifie que les données issues de Wikipédia sont particulièrement pertinentes pour la traduction de requêtes, détaille l’approche proposée et son implémentation, et en démontre le potentiel par la comparaison du taux d’erreur du prototype de traduction avec celui d’autres services de traduction automatique.
Anthology ID:
2010.jeptalnrecital-court.35
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Month:
July
Year:
2010
Address:
Montréal, Canada
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
207–212
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-court.35
DOI:
Bibkey:
Copy Citation:
PDF:
https://aclanthology.org/2010.jeptalnrecital-court.35.pdf