@inproceedings{halbout-fabre-2025-corpus,
title = "Corpus bilingue sous-titrage et Langue des Signes Fran{\c{c}}aise : la probl{\'e}matique de l{'}alignement automatique des donn{\'e}es",
author = "Halbout, Julie and
Fabre, Diandra",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 18e Rencontres Jeunes Chercheurs en RI (RJCRI) et 27{\`e}me Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL)",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-recital.6/",
pages = "91--103",
language = "fra",
abstract = "Dans cet article, nous pr{\'e}sentons une {\'e}tude sur la probl{\'e}matique de l{'}alignement automatique des donn{\'e}es dans un corpus constitu{\'e} de discours en fran{\c{c}}ais parl{\'e}, sous-titr{\'e}s en fran{\c{c}}ais {\'e}crit et interpr{\'e}t{\'e}s en langue des signes fran{\c{c}}aise (LSF). Apr{\`e}s une introduction pr{\'e}cisant le processus bien particulier de l{'}interpr{\'e}tation en langue des signes, nous dressons un tour d{'}horizon des ensembles de donn{\'e}es existants pour la LSF ainsi que les sp{\'e}cificit{\'e}s du corpus Matignon-LSF, constitu{\'e} {\`a} partir des comptes-rendus vid{\'e}os hebdomadaires du conseil des ministres. Nous montrons ensuite sur quelques exemples certains des ph{\'e}nom{\`e}nes observ{\'e}s sur la probl{\'e}matique de l{'}alignement temporel entre les sous-titres synchronis{\'e}s avec l{'}audio, et la LSF interpr{\'e}t{\'e}e qui subit un d{\'e}calage temporel. Nous en concluons que le niveau d{'}alignement ne peut pas {\^e}tre celui des phrases en fran{\c{c}}ais {\'e}crit et proposons quelques pistes pour la suite."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="halbout-fabre-2025-corpus">
<titleInfo>
<title>Corpus bilingue sous-titrage et Langue des Signes Française : la problématique de l’alignement automatique des données</title>
</titleInfo>
<name type="personal">
<namePart type="given">Julie</namePart>
<namePart type="family">Halbout</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diandra</namePart>
<namePart type="family">Fabre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 18e Rencontres Jeunes Chercheurs en RI (RJCRI) et 27ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Dans cet article, nous présentons une étude sur la problématique de l’alignement automatique des données dans un corpus constitué de discours en français parlé, sous-titrés en français écrit et interprétés en langue des signes française (LSF). Après une introduction précisant le processus bien particulier de l’interprétation en langue des signes, nous dressons un tour d’horizon des ensembles de données existants pour la LSF ainsi que les spécificités du corpus Matignon-LSF, constitué à partir des comptes-rendus vidéos hebdomadaires du conseil des ministres. Nous montrons ensuite sur quelques exemples certains des phénomènes observés sur la problématique de l’alignement temporel entre les sous-titres synchronisés avec l’audio, et la LSF interprétée qui subit un décalage temporel. Nous en concluons que le niveau d’alignement ne peut pas être celui des phrases en français écrit et proposons quelques pistes pour la suite.</abstract>
<identifier type="citekey">halbout-fabre-2025-corpus</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-recital.6/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>91</start>
<end>103</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Corpus bilingue sous-titrage et Langue des Signes Française : la problématique de l’alignement automatique des données
%A Halbout, Julie
%A Fabre, Diandra
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes des 18e Rencontres Jeunes Chercheurs en RI (RJCRI) et 27ème Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL)
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F halbout-fabre-2025-corpus
%X Dans cet article, nous présentons une étude sur la problématique de l’alignement automatique des données dans un corpus constitué de discours en français parlé, sous-titrés en français écrit et interprétés en langue des signes française (LSF). Après une introduction précisant le processus bien particulier de l’interprétation en langue des signes, nous dressons un tour d’horizon des ensembles de données existants pour la LSF ainsi que les spécificités du corpus Matignon-LSF, constitué à partir des comptes-rendus vidéos hebdomadaires du conseil des ministres. Nous montrons ensuite sur quelques exemples certains des phénomènes observés sur la problématique de l’alignement temporel entre les sous-titres synchronisés avec l’audio, et la LSF interprétée qui subit un décalage temporel. Nous en concluons que le niveau d’alignement ne peut pas être celui des phrases en français écrit et proposons quelques pistes pour la suite.
%U https://aclanthology.org/2025.jeptalnrecital-recital.6/
%P 91-103
Markdown (Informal)
[Corpus bilingue sous-titrage et Langue des Signes Française : la problématique de l’alignement automatique des données](https://aclanthology.org/2025.jeptalnrecital-recital.6/) (Halbout & Fabre, JEP/TALN/RECITAL 2025)
ACL