Comparaison de méthodes lexicales et syntaxico-sémantiques dans la segmentation thématique de texte non supervisée

Alexandre Labadié, Violaine Prince


Abstract
Cet article présente une méthode basée sur des calculs de distance et une analyse sémantique et syntaxique pour la segmentation thématique de texte. Pour évaluer cette méthode nous la comparons à un un algorithme lexical très connu : c99. Nous testons les deux méthodes sur un corpus de discours politique français et comparons les résultats. Les deux conclusions qui ressortent de notre expérience sont que les approches sont complémentaires et que les protocoles d’évaluation actuels sont inadaptés.
Anthology ID:
2008.jeptalnrecital-court.3
Volume:
Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Month:
June
Year:
2008
Address:
Avignon, France
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
21–30
Language:
French
URL:
https://aclanthology.org/2008.jeptalnrecital-court.3
DOI:
Bibkey:
Copy Citation:
PDF:
https://aclanthology.org/2008.jeptalnrecital-court.3.pdf