Wafa Neifar


2018

2016

Nous présentons, dans cet article, une adaptation à l’arabe standard moderne d’un extracteur de termes pour le français et l’anglais. L’adaptation a d’abord consisté à décrire le processus d’extraction des termes de manière similaire à celui défini pour l’anglais et le français en prenant en compte certains particularités morpho-syntaxiques de la langue arabe. Puis, nous avons considéré le phénomène de l’agglutination de la langue arabe. L’évaluation a été réalisée sur un corpus de textes médicaux. Les résultats montrent que parmi 400 termes candidats maximaux analysés, 288 sont jugés corrects par rapport au domaine (72,1%). Les erreurs d’extraction sont dues à l’étiquetage morpho-syntaxique et à la non-voyellation des textes mais aussi à des phénomènes d’agglutination.
L’acquisition terminologique est une tâche indispensable pour l’accès aux informations présentes dans les corpus de spécialité. Il s’agit d’une part, d’identifier et d’extraire des termes, et d’autre part, de structurer ces termes à l’aide de méthodes d’acquisition de relations sémantiques. Dans cet article, nous nous intéressons l’acquisition terminologique sur des textes arabe standard moderne (MSA). Nous réalisons tout d’abord, un état de l’art décrivant les méthodes d’extraction de termes sur cette langue ainsi que les approches proposées pour la reconnaissance de relations sémantiques entre termes issus. Après avoir présenter quelques corpus de spécialité et ressources terminologiques disponibles en MSA que nous avons identifiés, nous décrivons nos premières pistes de travail.