2010
pdf
bib
abs
Traduction de requêtes basée sur Wikipédia
Benoît Gaillard
|
Olivier Collin
|
Malek Boualem
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Cet article s’inscrit dans le domaine de la recherche d’information multilingue. Il propose une méthode de traduction automatique de requêtes basée sur Wikipédia. Une phase d’analyse permet de segmenter la requête en syntagmes ou unités lexicales à traduire en s’appuyant sur les liens multilingues entre les articles de Wikipédia. Une deuxième phase permet de choisir, parmi les traductions possibles, celle qui est la plus cohérente en s’appuyant sur les informations d’ordre sémantique fournies par les catégories associées à chacun des articles de Wikipédia. Cet article justifie que les données issues de Wikipédia sont particulièrement pertinentes pour la traduction de requêtes, détaille l’approche proposée et son implémentation, et en démontre le potentiel par la comparaison du taux d’erreur du prototype de traduction avec celui d’autres services de traduction automatique.
pdf
bib
Query translation using Wikipedia-based resources for analysis and disambiguation
Benoit Gaillard
|
Malek Boualem
|
Olivier Collin
Proceedings of the 14th Annual Conference of the European Association for Machine Translation
2008
pdf
bib
abs
Dissymétrie entre l’indexation des documents et le traitement des requêtes pour la recherche d’information en langue arabe
Ramzi Abbès
|
Malek Boualem
Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Les moteurs de recherches sur le web produisent des résultats comparables et assez satisfaisants pour la recherche de documents écrits en caractères latins. Cependant, ils présentent de sérieuses lacunes dès que l’ont s’intéresse à des langues peu dotées ou des langues sémitiques comme l’arabe. Dans cet article nous présentons une étude analytique et qualitative de la recherche d’information en langue arabe en mettant l’accent sur l’insuffisance des outils de recherche actuels, souvent mal adaptés aux spécificités de la langue arabe. Pour argumenter notre analyse, nous présentons des résultats issus d’observations et de tests autour de certains phénomènes linguistiques de l’arabe écrit. Pour la validation des ces observations, nous avons testé essentiellement le moteur de recherche Google.
pdf
bib
TiLT : plate-forme pour le traitement automatique des langues naturelles [TiLT : a natural language processing platform]
Johannes Heinecke
|
Grégory Smits
|
Christine Chardenon
|
Émilie Guimier De Neef
|
Estelle Maillebuau
|
Malek Boualem
Traitement Automatique des Langues, Volume 49, Numéro 2 : Plate-formes pour le traitement automatique des langues [Platforms for Natural Language Processing]