Extraction de lexique dans un corpus spécialisé en chinois contemporain

Gaël Patin


Abstract
La constitution de ressources lexicales est une tâche cruciale pour l’amélioration des performances des systèmes de recherche d’information. Cet article présente une méthode d’extraction d’unités lexicales en chinois contemporain dans un corpus spécialisé non-annoté et non-segmenté. Cette méthode se base sur une construction incrémentale de l’unité lexicale orientée par une mesure d’association. Elle se distingue des travaux précédents par une approche linguistique non-supervisée assistée par les statistiques. Les résultats de l’extraction, évalués sur un échantillon aléatoire du corpus de travail, sont honorables avec des scores de précision et de rappel respectivement de 52,6 % et 53,7 %.
Anthology ID:
2009.jeptalnrecital-recital.4
Volume:
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
Month:
June
Year:
2009
Address:
Senlis, France
Editors:
Thibault Mondary, Aurélien Bossard, Thierry Hamon
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
31–40
Language:
French
URL:
https://aclanthology.org/2009.jeptalnrecital-recital.4
DOI:
Bibkey:
Cite (ACL):
Gaël Patin. 2009. Extraction de lexique dans un corpus spécialisé en chinois contemporain. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues, pages 31–40, Senlis, France. ATALA.
Cite (Informal):
Extraction de lexique dans un corpus spécialisé en chinois contemporain (Patin, JEP/TALN/RECITAL 2009)
Copy Citation:
PDF:
https://aclanthology.org/2009.jeptalnrecital-recital.4.pdf