Evaluation de méthodes de segmentation thématique linéaire non supervisées après adaptation au français

Laurianne Sitbon, Patrice Bellot


Abstract
Nous proposons une évaluation de différentes méthodes et outils de segmentation thématique de textes. Nous présentons les outils de segmentation linéaire et non supervisée DotPlotting, Segmenter, C99, TextTiling, ainsi qu’une manière de les adapter et de les tester sur des documents français. Les résultats des tests montrent des différences en performance notables selon les sujets abordés dans les documents, et selon que le nombre de segments à trouver est fixé au préalable par l’utilisateur. Ces travaux font partie du projet Technolangue AGILE-OURAL.
Anthology ID:
2004.jeptalnrecital-long.1
Volume:
Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
April
Year:
2004
Address:
Fès, Maroc
Editors:
Philippe Blache, Noël Nguyen, Nouredine Chenfour, Abdenbi Rajouani
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
1–10
Language:
French
URL:
https://aclanthology.org/2004.jeptalnrecital-long.1
DOI:
Bibkey:
Cite (ACL):
Laurianne Sitbon and Patrice Bellot. 2004. Evaluation de méthodes de segmentation thématique linéaire non supervisées après adaptation au français. In Actes de la 11ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 1–10, Fès, Maroc. ATALA.
Cite (Informal):
Evaluation de méthodes de segmentation thématique linéaire non supervisées après adaptation au français (Sitbon & Bellot, JEP/TALN/RECITAL 2004)
Copy Citation:
PDF:
https://aclanthology.org/2004.jeptalnrecital-long.1.pdf