@inproceedings{bechet-etal-2001-modeles,
title = "Mod{\`e}les de langage hi{\'e}rarchiques pour les applications de dialogue en parole spontan{\'e}e",
author = "B{\'e}chet, Fr{\'e}d{\'e}ric and
Est{\`e}ve, Yannick and
De Mori, Renato",
editor = "Maurel, Denis",
booktitle = "Actes de la 8{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Posters",
month = jul,
year = "2001",
address = "Tours, France",
publisher = "ATALA",
url = "https://aclanthology.org/2001.jeptalnrecital-poster.1",
pages = "325--330",
abstract = "Le cadre de cette {\'e}tude concerne les syst{\`e}mes de dialogue via le t{\'e}l{\'e}phone entre un serveur de donn{\'e}es et un utilisateur. Nous nous int{\'e}resserons au cas de dialogues non contraints o{\`u} l{'}utilisateur {\`a} toute libert{\'e} pour formuler ses requ{\^e}tes. G{\'e}n{\'e}ralement, le module de Reconnaissance Automatique de la Parole (RAP) de tels serveurs utilise un seul Mod{\`e}le de Langage (ML) de type bigramme ou trigramme pour mod{\'e}liser l{'}ensemble des interventions possibles de l{'}utilisateur. Ces ML sont appris sur des corpus de phrases retranscrites {\`a} partir de sessions entre le serveur et plusieurs utilisateurs. Nous proposons dans cette {\'e}tude une m{\'e}thode de segmentation de corpus d{'}apprentissage de dialogue utilisant une strat{\'e}gie mixte bas{\'e}e {\`a} la fois sur des connaissances explicites mais aussi sur l{'}optimisation d{'}un crit{\`e}re statistique. Nous montrons qu{'}un gain en terme de perplexit{\'e} et de taux d{'}erreurs/mot peut {\^e}tre constat{\'e} en utilisant un ensemble de sous mod{\`e}les de langage issus de la segmentation plut{\^o}t qu{'}un mod{\`e}le unique appris sur l{'}ensemble du corpus.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="bechet-etal-2001-modeles">
<titleInfo>
<title>Modèles de langage hiérarchiques pour les applications de dialogue en parole spontanée</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Béchet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Yannick</namePart>
<namePart type="family">Estève</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Renato</namePart>
<namePart type="family">De Mori</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2001-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 8ème conférence sur le Traitement Automatique des Langues Naturelles. Posters</title>
</titleInfo>
<name type="personal">
<namePart type="given">Denis</namePart>
<namePart type="family">Maurel</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Tours, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Le cadre de cette étude concerne les systèmes de dialogue via le téléphone entre un serveur de données et un utilisateur. Nous nous intéresserons au cas de dialogues non contraints où l’utilisateur à toute liberté pour formuler ses requêtes. Généralement, le module de Reconnaissance Automatique de la Parole (RAP) de tels serveurs utilise un seul Modèle de Langage (ML) de type bigramme ou trigramme pour modéliser l’ensemble des interventions possibles de l’utilisateur. Ces ML sont appris sur des corpus de phrases retranscrites à partir de sessions entre le serveur et plusieurs utilisateurs. Nous proposons dans cette étude une méthode de segmentation de corpus d’apprentissage de dialogue utilisant une stratégie mixte basée à la fois sur des connaissances explicites mais aussi sur l’optimisation d’un critère statistique. Nous montrons qu’un gain en terme de perplexité et de taux d’erreurs/mot peut être constaté en utilisant un ensemble de sous modèles de langage issus de la segmentation plutôt qu’un modèle unique appris sur l’ensemble du corpus.</abstract>
<identifier type="citekey">bechet-etal-2001-modeles</identifier>
<location>
<url>https://aclanthology.org/2001.jeptalnrecital-poster.1</url>
</location>
<part>
<date>2001-07</date>
<extent unit="page">
<start>325</start>
<end>330</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Modèles de langage hiérarchiques pour les applications de dialogue en parole spontanée
%A Béchet, Frédéric
%A Estève, Yannick
%A De Mori, Renato
%Y Maurel, Denis
%S Actes de la 8ème conférence sur le Traitement Automatique des Langues Naturelles. Posters
%D 2001
%8 July
%I ATALA
%C Tours, France
%G French
%F bechet-etal-2001-modeles
%X Le cadre de cette étude concerne les systèmes de dialogue via le téléphone entre un serveur de données et un utilisateur. Nous nous intéresserons au cas de dialogues non contraints où l’utilisateur à toute liberté pour formuler ses requêtes. Généralement, le module de Reconnaissance Automatique de la Parole (RAP) de tels serveurs utilise un seul Modèle de Langage (ML) de type bigramme ou trigramme pour modéliser l’ensemble des interventions possibles de l’utilisateur. Ces ML sont appris sur des corpus de phrases retranscrites à partir de sessions entre le serveur et plusieurs utilisateurs. Nous proposons dans cette étude une méthode de segmentation de corpus d’apprentissage de dialogue utilisant une stratégie mixte basée à la fois sur des connaissances explicites mais aussi sur l’optimisation d’un critère statistique. Nous montrons qu’un gain en terme de perplexité et de taux d’erreurs/mot peut être constaté en utilisant un ensemble de sous modèles de langage issus de la segmentation plutôt qu’un modèle unique appris sur l’ensemble du corpus.
%U https://aclanthology.org/2001.jeptalnrecital-poster.1
%P 325-330
Markdown (Informal)
[Modèles de langage hiérarchiques pour les applications de dialogue en parole spontanée](https://aclanthology.org/2001.jeptalnrecital-poster.1) (Béchet et al., JEP/TALN/RECITAL 2001)
ACL