Vers la production automatique de sous-titres adaptés à l’affichage (Towards automatic adapted monolingual captioning)

François Buet, François Yvon


Abstract
Une façon de réaliser un sous-titrage automatique monolingue est d’associer un système de reconnaissance de parole avec un modèle de traduction de la transcription vers les sous-titres. La tâche de « traduction » est délicate dans la mesure où elle doit opérer une simplification et une compression du texte, respecter des normes liées à l’affichage, tout en composant avec les erreurs issues de la reconnaissance vocale. Une difficulté supplémentaire est la relative rareté des corpus mettant en parallèle transcription automatique et sous-titres sont relativement rares. Nous décrivons ici un nouveau corpus en cours de constitution et nous expérimentons l’utilisation de méthodes de contrôle plus ou moins direct de la longueur des phrases engendrées, afin d’améliorer leur qualité du point de vue linguistique et normatif.
Anthology ID:
2021.jeptalnrecital-taln.8
Volume:
Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale
Month:
6
Year:
2021
Address:
Lille, France
Editors:
Pascal Denis, Natalia Grabar, Amel Fraisse, Rémi Cardon, Bernard Jacquemin, Eric Kergosien, Antonio Balvet
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA
Note:
Pages:
91–104
Language:
French
URL:
https://aclanthology.org/2021.jeptalnrecital-taln.8
DOI:
Bibkey:
Cite (ACL):
François Buet and François Yvon. 2021. Vers la production automatique de sous-titres adaptés à l’affichage (Towards automatic adapted monolingual captioning). In Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 : conférence principale, pages 91–104, Lille, France. ATALA.
Cite (Informal):
Vers la production automatique de sous-titres adaptés à l’affichage (Towards automatic adapted monolingual captioning) (Buet & Yvon, JEP/TALN/RECITAL 2021)
Copy Citation:
PDF:
https://aclanthology.org/2021.jeptalnrecital-taln.8.pdf