@inproceedings{bozzi-etal-2009-segmentation,
title = "Segmentation et classification non supervis{\'e}e de conversations t{\'e}l{\'e}phoniques automatiquement retranscrites",
author = "Bozzi, Laurent and
Suignard, Philippe and
Waast-Richard, Claire",
editor = "Nazarenko, Adeline and
Poibeau, Thierry",
booktitle = "Actes de la 16{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles courts",
month = jun,
year = "2009",
address = "Senlis, France",
publisher = "ATALA",
url = "https://aclanthology.org/2009.jeptalnrecital-court.36",
pages = "331--336",
abstract = "Cette {\'e}tude porte sur l{'}analyse de conversations entre des clients et des t{\'e}l{\'e}conseillers d{'}EDF. Elle propose une cha{\^\i}ne de traitements permettant d{'}automatiser la d{\'e}tection des sujets abord{\'e}s dans chaque conversation. L{'}aspect multi-th{\'e}matique des conversations nous incite {\`a} trouver une unit{\'e} de documents entre le simple tour de parole et la conversation enti{\`e}re. Cette d{\'e}marche encha{\^\i}ne une {\'e}tape de segmentation de la conversation en th{\`e}mes homog{\`e}nes bas{\'e}e sur la notion de coh{\'e}sion lexicale, puis une {\'e}tape de text-mining comportant une analyse linguistique enrichie d{'}un vocabulaire m{\'e}tier sp{\'e}cifique {\`a} EDF, et enfin une classification non supervis{\'e}e des segments obtenus. Plusieurs algorithmes de segmentation ont {\'e}t{\'e} {\'e}valu{\'e}s sur un corpus de test, segment{\'e} et annot{\'e} manuellement : le plus « proche » de la segmentation de r{\'e}f{\'e}rence est C99. Cette d{\'e}marche, appliqu{\'e}e {\`a} la fois sur un corpus de conversations transcrites {\`a} la main, et sur les m{\^e}mes conversations d{\'e}cod{\'e}es par un moteur de reconnaissance vocale, aboutit quasiment {\`a} l{'}obtention des 20 m{\^e}mes classes th{\'e}matiques.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="bozzi-etal-2009-segmentation">
<titleInfo>
<title>Segmentation et classification non supervisée de conversations téléphoniques automatiquement retranscrites</title>
</titleInfo>
<name type="personal">
<namePart type="given">Laurent</namePart>
<namePart type="family">Bozzi</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Philippe</namePart>
<namePart type="family">Suignard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Claire</namePart>
<namePart type="family">Waast-Richard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2009-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts</title>
</titleInfo>
<name type="personal">
<namePart type="given">Adeline</namePart>
<namePart type="family">Nazarenko</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Poibeau</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Senlis, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Cette étude porte sur l’analyse de conversations entre des clients et des téléconseillers d’EDF. Elle propose une chaîne de traitements permettant d’automatiser la détection des sujets abordés dans chaque conversation. L’aspect multi-thématique des conversations nous incite à trouver une unité de documents entre le simple tour de parole et la conversation entière. Cette démarche enchaîne une étape de segmentation de la conversation en thèmes homogènes basée sur la notion de cohésion lexicale, puis une étape de text-mining comportant une analyse linguistique enrichie d’un vocabulaire métier spécifique à EDF, et enfin une classification non supervisée des segments obtenus. Plusieurs algorithmes de segmentation ont été évalués sur un corpus de test, segmenté et annoté manuellement : le plus « proche » de la segmentation de référence est C99. Cette démarche, appliquée à la fois sur un corpus de conversations transcrites à la main, et sur les mêmes conversations décodées par un moteur de reconnaissance vocale, aboutit quasiment à l’obtention des 20 mêmes classes thématiques.</abstract>
<identifier type="citekey">bozzi-etal-2009-segmentation</identifier>
<location>
<url>https://aclanthology.org/2009.jeptalnrecital-court.36</url>
</location>
<part>
<date>2009-06</date>
<extent unit="page">
<start>331</start>
<end>336</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Segmentation et classification non supervisée de conversations téléphoniques automatiquement retranscrites
%A Bozzi, Laurent
%A Suignard, Philippe
%A Waast-Richard, Claire
%Y Nazarenko, Adeline
%Y Poibeau, Thierry
%S Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
%D 2009
%8 June
%I ATALA
%C Senlis, France
%G French
%F bozzi-etal-2009-segmentation
%X Cette étude porte sur l’analyse de conversations entre des clients et des téléconseillers d’EDF. Elle propose une chaîne de traitements permettant d’automatiser la détection des sujets abordés dans chaque conversation. L’aspect multi-thématique des conversations nous incite à trouver une unité de documents entre le simple tour de parole et la conversation entière. Cette démarche enchaîne une étape de segmentation de la conversation en thèmes homogènes basée sur la notion de cohésion lexicale, puis une étape de text-mining comportant une analyse linguistique enrichie d’un vocabulaire métier spécifique à EDF, et enfin une classification non supervisée des segments obtenus. Plusieurs algorithmes de segmentation ont été évalués sur un corpus de test, segmenté et annoté manuellement : le plus « proche » de la segmentation de référence est C99. Cette démarche, appliquée à la fois sur un corpus de conversations transcrites à la main, et sur les mêmes conversations décodées par un moteur de reconnaissance vocale, aboutit quasiment à l’obtention des 20 mêmes classes thématiques.
%U https://aclanthology.org/2009.jeptalnrecital-court.36
%P 331-336
Markdown (Informal)
[Segmentation et classification non supervisée de conversations téléphoniques automatiquement retranscrites](https://aclanthology.org/2009.jeptalnrecital-court.36) (Bozzi et al., JEP/TALN/RECITAL 2009)
ACL