Segmenter et structurer thématiquement des textes par l’utilisation conjointe de collocations et de la récurrence lexicale

Olivier Ferret


Abstract
Nous exposons dans cet article une méthode réalisant de façon intégrée deux tâches de l’analyse thématique : la segmentation et la détection de liens thématiques. Cette méthode exploite conjointement la récurrence des mots dans les textes et les liens issus d’un réseau de collocations afin de compenser les faiblesses respectives des deux approches. Nous présentons son évaluation concernant la segmentation sur un corpus en français et un corpus en anglais et nous proposons une mesure d’évaluation spécifiquement adaptée à ce type de systèmes.
Anthology ID:
2002.jeptalnrecital-long.13
Volume:
Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Month:
June
Year:
2002
Address:
Nancy, France
Editor:
Jean-Marie Pierrel
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
156–166
Language:
French
URL:
https://aclanthology.org/2002.jeptalnrecital-long.13
DOI:
Bibkey:
Cite (ACL):
Olivier Ferret. 2002. Segmenter et structurer thématiquement des textes par l’utilisation conjointe de collocations et de la récurrence lexicale. In Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs, pages 156–166, Nancy, France. ATALA.
Cite (Informal):
Segmenter et structurer thématiquement des textes par l’utilisation conjointe de collocations et de la récurrence lexicale (Ferret, JEP/TALN/RECITAL 2002)
Copy Citation:
PDF:
https://aclanthology.org/2002.jeptalnrecital-long.13.pdf