Développement de ressources pour le persan: lexique morphologique et chaîne de traitements de surface

Benoît Sagot, Géraldine Walther


Abstract
Nous présentons PerLex, un lexique morphologique du persan à large couverture et librement disponible, accompagné d’une chaîne de traitements de surface pour cette langue. Nous décrivons quelques caractéristiques de la morphologie du persan, et la façon dont nous l’avons représentée dans le formalisme lexical Alexina, sur lequel repose PerLex. Nous insistons sur la méthodologie que nous avons employée pour construire les entrées lexicales à partir de diverses sources, ainsi que sur les problèmes liés à la normalisation typographique. Le lexique obtenu a une couverture satisfaisante sur un corpus de référence, et devrait donc constituer un bon point de départ pour le développement d’un lexique syntaxique du persan.
Anthology ID:
2010.jeptalnrecital-long.40
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
July
Year:
2010
Address:
Montréal, Canada
Editors:
Philippe Langlais, Michel Gagnon
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
393–402
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-long.40
DOI:
Bibkey:
Cite (ACL):
Benoît Sagot and Géraldine Walther. 2010. Développement de ressources pour le persan: lexique morphologique et chaîne de traitements de surface. In Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 393–402, Montréal, Canada. ATALA.
Cite (Informal):
Développement de ressources pour le persan: lexique morphologique et chaîne de traitements de surface (Sagot & Walther, JEP/TALN/RECITAL 2010)
Copy Citation:
PDF:
https://aclanthology.org/2010.jeptalnrecital-long.40.pdf