Le contexte au service de la correction des graphies fautives arabes

Chiraz Ben Othmane Zribi, Mohamed Ben Ahmed


Abstract
Les mots arabes sont lexicalement beaucoup plus proches les uns des autres que les mots français et anglais. Cette proximité a pour effet un grand nombre de propositions à la correction d’une forme erronée arabe. Nous proposons dans cet article une méthode qui prend en considération le contexte de l’erreur pour éliminer certaines propositions données par le correcteur. Le contexte de l’erreur sera dans un premier temps les mots voisinant l’erreur et s’étendra jusqu’à l’ensemble des mots du texte contenant l’erreur. Ayant été testée sur un corpus textuel contenant des erreurs réelles, la méthode que nous proposons aura permis de réduire le nombre moyen de propositions d’environ 75% (de 16,8 à 3,98 propositions en moyenne).
Anthology ID:
2003.jeptalnrecital-poster.19
Volume:
Actes de la 10ème conférence sur le Traitement Automatique des Langues Naturelles. Posters
Month:
June
Year:
2003
Address:
Batz-sur-Mer, France
Editors:
Béatrice Daille, Emmanuel Morin
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
409–414
Language:
French
URL:
https://aclanthology.org/2003.jeptalnrecital-poster.19
DOI:
Bibkey:
Cite (ACL):
Chiraz Ben Othmane Zribi and Mohamed Ben Ahmed. 2003. Le contexte au service de la correction des graphies fautives arabes. In Actes de la 10ème conférence sur le Traitement Automatique des Langues Naturelles. Posters, pages 409–414, Batz-sur-Mer, France. ATALA.
Cite (Informal):
Le contexte au service de la correction des graphies fautives arabes (Ben Othmane Zribi & Ben Ahmed, JEP/TALN/RECITAL 2003)
Copy Citation:
PDF:
https://aclanthology.org/2003.jeptalnrecital-poster.19.pdf