Un étiqueteur de rôles grammaticaux libre pour le français intégré à Apache UIMA

Charles Dejean, Manoel Fortun, Clotilde Massot, Vincent Pottier, Fabien Poulard, Matthieu Vernier


Abstract
L’étiquetage des rôles grammaticaux est une tâche de pré-traitement récurrente. Pour le français, deux outils sont majoritairement utilisés : TreeTagger et Brill. Nous proposons une démarche, ne nécessitant aucune ressource, pour la création d’un modèle de Markov caché (HMM) pour palier les problèmes de ces outils, et de licences notamment. Nous distribuons librement toutes les ressources liées à ce travail.
Anthology ID:
2010.jeptalnrecital-court.13
Volume:
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Month:
July
Year:
2010
Address:
Montréal, Canada
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
74–79
Language:
French
URL:
https://aclanthology.org/2010.jeptalnrecital-court.13
DOI:
Bibkey:
Copy Citation:
PDF:
https://aclanthology.org/2010.jeptalnrecital-court.13.pdf