Segmentation et classification non supervisée de conversations téléphoniques automatiquement retranscrites

Laurent Bozzi; Philippe Suignard; Claire Waast-Richard

Segmentation et classification non supervisée de conversations téléphoniques automatiquement retranscrites

Laurent Bozzi, Philippe Suignard, Claire Waast-Richard

Abstract

Cette étude porte sur l’analyse de conversations entre des clients et des téléconseillers d’EDF. Elle propose une chaîne de traitements permettant d’automatiser la détection des sujets abordés dans chaque conversation. L’aspect multi-thématique des conversations nous incite à trouver une unité de documents entre le simple tour de parole et la conversation entière. Cette démarche enchaîne une étape de segmentation de la conversation en thèmes homogènes basée sur la notion de cohésion lexicale, puis une étape de text-mining comportant une analyse linguistique enrichie d’un vocabulaire métier spécifique à EDF, et enfin une classification non supervisée des segments obtenus. Plusieurs algorithmes de segmentation ont été évalués sur un corpus de test, segmenté et annoté manuellement : le plus « proche » de la segmentation de référence est C99. Cette démarche, appliquée à la fois sur un corpus de conversations transcrites à la main, et sur les mêmes conversations décodées par un moteur de reconnaissance vocale, aboutit quasiment à l’obtention des 20 mêmes classes thématiques.

Anthology ID:: 2009.jeptalnrecital-court.36
Volume:: Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Month:: June
Year:: 2009
Address:: Senlis, France
Editors:: Adeline Nazarenko, Thierry Poibeau
Venue:: JEP/TALN/RECITAL
SIG:
Publisher:: ATALA
Note:
Pages:: 331–336
Language:: French
URL:: https://aclanthology.org/2009.jeptalnrecital-court.36/
DOI:
Bibkey:
Cite (ACL):: Laurent Bozzi, Philippe Suignard, and Claire Waast-Richard. 2009. Segmentation et classification non supervisée de conversations téléphoniques automatiquement retranscrites. In Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts, pages 331–336, Senlis, France. ATALA.
Cite (Informal):: Segmentation et classification non supervisée de conversations téléphoniques automatiquement retranscrites (Bozzi et al., JEP/TALN/RECITAL 2009)
Copy Citation:
PDF:: https://aclanthology.org/2009.jeptalnrecital-court.36.pdf

PDF Cite Search Fix data