@inproceedings{buet-yvon-2021-vers,
title = "Vers la production automatique de sous-titres adapt{\'e}s {\`a} l{'}affichage (Towards automatic adapted monolingual captioning)",
author = "Buet, Fran{\c{c}}ois and
Yvon, Fran{\c{c}}ois",
editor = "Denis, Pascal and
Grabar, Natalia and
Fraisse, Amel and
Cardon, R{\'e}mi and
Jacquemin, Bernard and
Kergosien, Eric and
Balvet, Antonio",
booktitle = "Actes de la 28e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conf{\'e}rence principale",
month = "6",
year = "2021",
address = "Lille, France",
publisher = "ATALA",
url = "https://aclanthology.org/2021.jeptalnrecital-taln.8",
pages = "91--104",
abstract = "Une fa{\c{c}}on de r{\'e}aliser un sous-titrage automatique monolingue est d{'}associer un syst{\`e}me de reconnaissance de parole avec un mod{\`e}le de traduction de la transcription vers les sous-titres. La t{\^a}che de « traduction » est d{\'e}licate dans la mesure o{\`u} elle doit op{\'e}rer une simplification et une compression du texte, respecter des normes li{\'e}es {\`a} l{'}affichage, tout en composant avec les erreurs issues de la reconnaissance vocale. Une difficult{\'e} suppl{\'e}mentaire est la relative raret{\'e} des corpus mettant en parall{\`e}le transcription automatique et sous-titres sont relativement rares. Nous d{\'e}crivons ici un nouveau corpus en cours de constitution et nous exp{\'e}rimentons l{'}utilisation de m{\'e}thodes de contr{\^o}le plus ou moins direct de la longueur des phrases engendr{\'e}es, afin d{'}am{\'e}liorer leur qualit{\'e} du point de vue linguistique et normatif.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="buet-yvon-2021-vers">
<titleInfo>
<title>Vers la production automatique de sous-titres adaptés à l’affichage (Towards automatic adapted monolingual captioning)</title>
</titleInfo>
<name type="personal">
<namePart type="given">François</namePart>
<namePart type="family">Buet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">François</namePart>
<namePart type="family">Yvon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2021-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale</title>
</titleInfo>
<name type="personal">
<namePart type="given">Pascal</namePart>
<namePart type="family">Denis</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Natalia</namePart>
<namePart type="family">Grabar</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Amel</namePart>
<namePart type="family">Fraisse</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Rémi</namePart>
<namePart type="family">Cardon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Bernard</namePart>
<namePart type="family">Jacquemin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eric</namePart>
<namePart type="family">Kergosien</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Antonio</namePart>
<namePart type="family">Balvet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Lille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Une façon de réaliser un sous-titrage automatique monolingue est d’associer un système de reconnaissance de parole avec un modèle de traduction de la transcription vers les sous-titres. La tâche de « traduction » est délicate dans la mesure où elle doit opérer une simplification et une compression du texte, respecter des normes liées à l’affichage, tout en composant avec les erreurs issues de la reconnaissance vocale. Une difficulté supplémentaire est la relative rareté des corpus mettant en parallèle transcription automatique et sous-titres sont relativement rares. Nous décrivons ici un nouveau corpus en cours de constitution et nous expérimentons l’utilisation de méthodes de contrôle plus ou moins direct de la longueur des phrases engendrées, afin d’améliorer leur qualité du point de vue linguistique et normatif.</abstract>
<identifier type="citekey">buet-yvon-2021-vers</identifier>
<location>
<url>https://aclanthology.org/2021.jeptalnrecital-taln.8</url>
</location>
<part>
<date>2021-6</date>
<extent unit="page">
<start>91</start>
<end>104</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Vers la production automatique de sous-titres adaptés à l’affichage (Towards automatic adapted monolingual captioning)
%A Buet, François
%A Yvon, François
%Y Denis, Pascal
%Y Grabar, Natalia
%Y Fraisse, Amel
%Y Cardon, Rémi
%Y Jacquemin, Bernard
%Y Kergosien, Eric
%Y Balvet, Antonio
%S Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale
%D 2021
%8 June
%I ATALA
%C Lille, France
%G French
%F buet-yvon-2021-vers
%X Une façon de réaliser un sous-titrage automatique monolingue est d’associer un système de reconnaissance de parole avec un modèle de traduction de la transcription vers les sous-titres. La tâche de « traduction » est délicate dans la mesure où elle doit opérer une simplification et une compression du texte, respecter des normes liées à l’affichage, tout en composant avec les erreurs issues de la reconnaissance vocale. Une difficulté supplémentaire est la relative rareté des corpus mettant en parallèle transcription automatique et sous-titres sont relativement rares. Nous décrivons ici un nouveau corpus en cours de constitution et nous expérimentons l’utilisation de méthodes de contrôle plus ou moins direct de la longueur des phrases engendrées, afin d’améliorer leur qualité du point de vue linguistique et normatif.
%U https://aclanthology.org/2021.jeptalnrecital-taln.8
%P 91-104
Markdown (Informal)
[Vers la production automatique de sous-titres adaptés à l’affichage (Towards automatic adapted monolingual captioning)](https://aclanthology.org/2021.jeptalnrecital-taln.8) (Buet & Yvon, JEP/TALN/RECITAL 2021)
ACL