@inproceedings{servan-bechet-2006-decodage,
title = "D{\'e}codage conceptuel et apprentissage automatique : application au corpus de dialogue Homme-Machine {MEDIA}",
author = "Servan, Christophe and
B{\'e}chet, Fr{\'e}d{\'e}ric",
editor = "Mertens, Piet and
Fairon, C{\'e}drick and
Dister, Anne and
Watrin, Patrick",
booktitle = "Actes de la 13{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = apr,
year = "2006",
address = "Leuven, Belgique",
publisher = "ATALA",
url = "https://aclanthology.org/2006.jeptalnrecital-long.30/",
pages = "328--337",
language = "fra",
abstract = "Cette {\'e}tude pr{\'e}sente les travaux du LIA effectu{\'e}s sur le corpus de dialogue homme-machine MEDIA et visant {\`a} proposer des m{\'e}thodes d`analyse robuste permettant d`extraire d`un message audio une s{\'e}quence de concepts {\'e}l{\'e}mentaires. Le mod{\`e}le de d{\'e}codage conceptuel pr{\'e}sent{\'e} est bas{\'e} sur une approche stochastique qui int{\`e}gre directement le processus de compr{\'e}hension au processus de Reconnaissance Automatique de la Parole (RAP). Cette approche permet de garder l`espace probabiliste des phrases produit en sortie du module de RAP et de le projeter vers un espace probabiliste de s{\'e}quences de concepts. Les exp{\'e}riences men{\'e}es sur le corpus MEDIA montrent que les performances atteintes par notre mod{\`e}le sont au niveau des meilleurs syst{\`e}mes ayant particip{\'e} {\`a} l'{\'e}valuation sur des transcriptions manuelles de dialogues. En d{\'e}taillant les performances du syst{\`e}me en fonction de la taille du corpus d`apprentissage on peut mesurer le nombre minimal ainsi que le nombre optimal de dialogues n{\'e}cessaires {\`a} l`apprentissage des mod{\`e}les. Enfin nous montrons comment des connaissances a priori peuvent {\^e}tre int{\'e}gr{\'e}es dans nos mod{\`e}les afin d`augmenter significativement leur couverture en diminuant, {\`a} performance {\'e}gale, l`effort de constitution et d`annotation du corpus d`apprentissage."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="servan-bechet-2006-decodage">
<titleInfo>
<title>Décodage conceptuel et apprentissage automatique : application au corpus de dialogue Homme-Machine MEDIA</title>
</titleInfo>
<name type="personal">
<namePart type="given">Christophe</namePart>
<namePart type="family">Servan</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Béchet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2006-04</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 13ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Piet</namePart>
<namePart type="family">Mertens</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Cédrick</namePart>
<namePart type="family">Fairon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Anne</namePart>
<namePart type="family">Dister</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Patrick</namePart>
<namePart type="family">Watrin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Leuven, Belgique</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Cette étude présente les travaux du LIA effectués sur le corpus de dialogue homme-machine MEDIA et visant à proposer des méthodes d‘analyse robuste permettant d‘extraire d‘un message audio une séquence de concepts élémentaires. Le modèle de décodage conceptuel présenté est basé sur une approche stochastique qui intègre directement le processus de compréhension au processus de Reconnaissance Automatique de la Parole (RAP). Cette approche permet de garder l‘espace probabiliste des phrases produit en sortie du module de RAP et de le projeter vers un espace probabiliste de séquences de concepts. Les expériences menées sur le corpus MEDIA montrent que les performances atteintes par notre modèle sont au niveau des meilleurs systèmes ayant participé à l’évaluation sur des transcriptions manuelles de dialogues. En détaillant les performances du système en fonction de la taille du corpus d‘apprentissage on peut mesurer le nombre minimal ainsi que le nombre optimal de dialogues nécessaires à l‘apprentissage des modèles. Enfin nous montrons comment des connaissances a priori peuvent être intégrées dans nos modèles afin d‘augmenter significativement leur couverture en diminuant, à performance égale, l‘effort de constitution et d‘annotation du corpus d‘apprentissage.</abstract>
<identifier type="citekey">servan-bechet-2006-decodage</identifier>
<location>
<url>https://aclanthology.org/2006.jeptalnrecital-long.30/</url>
</location>
<part>
<date>2006-04</date>
<extent unit="page">
<start>328</start>
<end>337</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Décodage conceptuel et apprentissage automatique : application au corpus de dialogue Homme-Machine MEDIA
%A Servan, Christophe
%A Béchet, Frédéric
%Y Mertens, Piet
%Y Fairon, Cédrick
%Y Dister, Anne
%Y Watrin, Patrick
%S Actes de la 13ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2006
%8 April
%I ATALA
%C Leuven, Belgique
%G fra
%F servan-bechet-2006-decodage
%X Cette étude présente les travaux du LIA effectués sur le corpus de dialogue homme-machine MEDIA et visant à proposer des méthodes d‘analyse robuste permettant d‘extraire d‘un message audio une séquence de concepts élémentaires. Le modèle de décodage conceptuel présenté est basé sur une approche stochastique qui intègre directement le processus de compréhension au processus de Reconnaissance Automatique de la Parole (RAP). Cette approche permet de garder l‘espace probabiliste des phrases produit en sortie du module de RAP et de le projeter vers un espace probabiliste de séquences de concepts. Les expériences menées sur le corpus MEDIA montrent que les performances atteintes par notre modèle sont au niveau des meilleurs systèmes ayant participé à l’évaluation sur des transcriptions manuelles de dialogues. En détaillant les performances du système en fonction de la taille du corpus d‘apprentissage on peut mesurer le nombre minimal ainsi que le nombre optimal de dialogues nécessaires à l‘apprentissage des modèles. Enfin nous montrons comment des connaissances a priori peuvent être intégrées dans nos modèles afin d‘augmenter significativement leur couverture en diminuant, à performance égale, l‘effort de constitution et d‘annotation du corpus d‘apprentissage.
%U https://aclanthology.org/2006.jeptalnrecital-long.30/
%P 328-337
Markdown (Informal)
[Décodage conceptuel et apprentissage automatique : application au corpus de dialogue Homme-Machine MEDIA](https://aclanthology.org/2006.jeptalnrecital-long.30/) (Servan & Béchet, JEP/TALN/RECITAL 2006)
ACL