Segmentation de textes arabes basée sur l’analyse contextuelle des signes de ponctuations et de certaines particules

Lamia Hadrich Belguith, Leila Baccour, Mourad Ghassan


Abstract
Nous proposons dans cet article une approche de segmentation de textes arabes non voyellés basée sur une analyse contextuelle des signes de ponctuations et de certaines particules, tels que les conjonctions de coordination. Nous présentons ensuite notre système STAr, un segmenteur de textes arabes basé sur l’approche proposée. STAr accepte en entrée un texte arabe en format txt et génère en sortie un texte segmenté en paragraphes et en phrases.
Anthology ID:
2005.jeptalnrecital-court.12
Volume:
Actes de la 12ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Month:
June
Year:
2005
Address:
Dourdan, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
451–456
Language:
French
URL:
https://aclanthology.org/2005.jeptalnrecital-court.12
DOI:
Bibkey:
Copy Citation:
PDF:
https://aclanthology.org/2005.jeptalnrecital-court.12.pdf