Une plateforme pour l’acquisition, la maintenance et la validation de ressources lexicales

Tristan Vanrullen, Philippe Blache, Cristel Portes, Stéphane Rauzy, Jean-François Maeyhieux


Abstract
Nous présentons une plateforme de développement de lexique offrant une base lexicale accompagnée d’un certain nombre d’outils de maintenance et d’utilisation. Cette base, qui comporte aujourd’hui 440.000 formes du Français contemporain, est destinée à être diffusée et remise à jour régulièrement. Nous exposons d’abord les outils et les techniques employées pour sa constitution et son enrichissement, notamment la technique de calcul des fréquences lexicales par catégorie morphosyntaxique. Nous décrivons ensuite différentes approches pour constituer un sous-lexique de taille réduite, dont la particularité est de couvrir plus de 90% de l’usage. Un tel lexique noyau offre en outre la possibilité d’être réellement complété manuellement avec des informations sémantiques, de valence, pragmatiques etc.
Anthology ID:
2005.jeptalnrecital-court.22
Volume:
Actes de la 12ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Month:
June
Year:
2005
Address:
Dourdan, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
511–516
Language:
French
URL:
https://aclanthology.org/2005.jeptalnrecital-court.22
DOI:
Bibkey:
Copy Citation:
PDF:
https://aclanthology.org/2005.jeptalnrecital-court.22.pdf