Siham Boulaknadel


pdf bib
NERAM : Named Entity Recognition for AMazigh language (RENAM: Système de Reconnaissance des Entités Nommées Amazighes) [in French]
Meryem Talha | Siham Boulaknadel | Driss Aboutajdine
Proceedings of TALN 2014 (Volume 2: Short Papers)

pdf bib
Amazigh Verb Conjugator
Fadoua Ataa Allah | Siham Boulaknadel
Proceedings of the Ninth International Conference on Language Resources and Evaluation (LREC'14)

With the aim of preserving the Amazigh heritage from being threatened with disappearance, it seems suitable to provide Amazigh with required resources to confront the stakes of access to the domain of New Information and Communication Technologies (ICT). In this context and in the perspective to build linguistic resources and natural language processing tools for this language, we have undertaken to develop an online conjugating tool that generates the inflectional forms of the Amazigh verbs. This tool is based on novel linguistically motivated morphological rules describing the verbal paradigm for all the Moroccan Amazigh varieties. Furthermore, it is based on the notion of morphological tree structure and uses transformational rules which are attached to the leaf nodes. Each rule may have numerous mutually exclusive clauses, where each part of a clause is a regular expression pattern that is matched against the radical pattern. This tool is an interactive conjugator that provides exhaustive coverage of linguistically accurate conjugation paradigms for over 3584 Armazigh verbs. It has been made simple and easy to use and designed from the ground up to be a highly effective learning aid that stimulates a desire to learn.


pdf bib
Morphological analysis of the standard Amazigh language using NooJ platform (Analyse Automatique de la Morphologie Nominale Amazighe) [in French]
Fatima Zahra Nejme | Siham Boulaknadel | Driss Aboutajdine
Proceedings of TALN 2013 (Volume 1: Long Papers)


pdf bib
Formalisation de l’amazighe standard avec NooJ (Formalization of the standard Amazigh with NooJ) [in French]
Fatima Zahra Nejme | Siham Boulaknadel
JEP-TALN-RECITAL 2012, Workshop TALAf 2012: Traitement Automatique des Langues Africaines (TALAf 2012: African Language Processing)

pdf bib
Toward an amazigh language processing
Fatima Zahra Nejme | Siham Boulaknadel | Driss Aboutajdine
Proceedings of the 3rd Workshop on South and Southeast Asian Natural Language Processing


pdf bib
Pseudo-racinisation de la langue amazighe
Fadoua Ataa Allah | Siham Boulaknadel
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts

Dans le cadre de la promotion de la langue amazighe, nous avons voulu lui apporter des ressources et outils linguistiques pour son traitement automatique et son intégration dans le domaine des nouvelles technologies de l’information et de la communication. Partant de ce principe, nous avons opté, au sein de l’Institut Royal de la Culture Amazighe, pour une démarche innovante de réalisations progressives de ressources linguistiques et d’outils de base de traitement automatique, qui permettront de préparer le terrain pour d’éventuelles recherches scientifiques. Dans cette perspective, nous avons entrepris de développer, dans un premier temps, un outil de pseudoracinisation basé sur une approche relevant du cas de la morphologie flexionnelle et reposant sur l’élimination d’une liste de suffixes et de préfixes de la langue amazighe. Cette approche permettra de regrouper les mots sémantiquement proches à partir de ressemblances afin d’être exploités dans des applications tel que la recherche d’information et la classification.


pdf bib
A Multi-Word Term Extraction Program for Arabic Language
Siham Boulaknadel | Beatrice Daille | Driss Aboutajdine
Proceedings of the Sixth International Conference on Language Resources and Evaluation (LREC'08)

Terminology extraction commonly includes two steps: identification of term-like units in the texts, mostly multi-word phrases, and the ranking of the extracted term-like units according to their domain representativity. In this paper, we design a multi-word term extraction program for Arabic language. The linguistic filtering performs a morphosyntactic analysis and takes into account several types of variations. The domain representativity is measure thanks to statistical scores. We evalutate several association measures and show that the results we otained are consitent with those obtained for Romance languages.


pdf bib
Recherche d’information en langue arabe : influence des paramètres linguistiques et de pondération en LSA
Siham Boulaknadel | Fadoua Ataa-Allah
Actes de la 12ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues (articles courts)

Nous nous intéressons à la recherche d’information en langue arabe en utilisant le modèle de l’analyse sémantique latente (LSA). Nous proposons dans cet article de montrer que le traitement linguistique et la pondération des unités lexicales influent sur la performance de la LSA pour quatre cas d’études : le premier avec un simple prétraitement des corpus; le deuxième en utilisant un anti-dictionnaire; le troisième avec un racineur de l’arabe ; le quatrième où nous avons combiné l’anti-dictionnaire et le racineur. Globalement les résultats de nos expérimentations montrent que les traitements linguistiques ainsi que la pondération des unités lexicales utilisés améliorent la performance de LSA.