@inproceedings{n-havard-etal-2025-modeles,
title = "Mod{\`e}les auto-supervis{\'e}s de traitement de la parole pour le Cr{\'e}ole Haitien",
author = "N. Havard, William and
Govain, Renauld and
Lecouteux, Benjamin and
Schang, Emmanuel",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 32{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-taln.33/",
pages = "542--554",
language = "fra",
abstract = {Nous d{\'e}veloppons des mod{\`e}les de traitement de la parole sp{\'e}cifiquement d{\'e}di{\'e}s au cr{\'e}ole ha{\"i}tien (krey{\`o}l), le positionnant ainsi comme une langue bien dot{\'e}e en termes de mod{\`e}les auto-supervis{\'e}s de traitement de la parole. Pour ce faire, nous pr{\'e}-entra{\^i}nons des mod{\`e}les monolingues WAV2VEC2BASE,WAV2VEC2-L ARGE etDATA 2VEC-AUDIO -BASE{\`a} partir de z{\'e}ro, qui sont ensuite affin{\'e}s pour une t{\^a}che de reconnaissance automatique de la parole. Nous comparons la performance de ces mod{\`e}les avec des mod{\`e}les affin{\'e}s {\`a} partir de mod{\`e}les multilingues (XLSR-53, XLSR2-300 M, MMS-1B) et monolingues bas{\'e}s sur le fran{\c{c}}ais (LEBENCHMARK 1 {\`a} 7K). Nos r{\'e}sultats d{\'e}montrent l{'}efficacit{\'e} du pr{\'e}-entra{\^i}nement monolingue, avec des performances pouvant rivaliser, voire surpasser, celle de grands mod{\`e}les multilingues. Ce travail propose ainsi des mod{\`e}les robustes de reconnaissance vocale pour le krey{\`o}l , adaptables {\`a} d{'}autres cr{\'e}oles fran{\c{c}}ais des Cara{\"i}bes, contribuant ainsi au d{\'e}veloppement technologique de ces langues peu dot{\'e}es.}
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="n-havard-etal-2025-modeles">
<titleInfo>
<title>Modèles auto-supervisés de traitement de la parole pour le Créole Haitien</title>
</titleInfo>
<name type="personal">
<namePart type="given">William</namePart>
<namePart type="family">N. Havard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Renauld</namePart>
<namePart type="family">Govain</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benjamin</namePart>
<namePart type="family">Lecouteux</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Emmanuel</namePart>
<namePart type="family">Schang</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous développons des modèles de traitement de la parole spécifiquement dédiés au créole haïtien (kreyòl), le positionnant ainsi comme une langue bien dotée en termes de modèles auto-supervisés de traitement de la parole. Pour ce faire, nous pré-entraînons des modèles monolingues WAV2VEC2BASE,WAV2VEC2-L ARGE etDATA 2VEC-AUDIO -BASEà partir de zéro, qui sont ensuite affinés pour une tâche de reconnaissance automatique de la parole. Nous comparons la performance de ces modèles avec des modèles affinés à partir de modèles multilingues (XLSR-53, XLSR2-300 M, MMS-1B) et monolingues basés sur le français (LEBENCHMARK 1 à 7K). Nos résultats démontrent l’efficacité du pré-entraînement monolingue, avec des performances pouvant rivaliser, voire surpasser, celle de grands modèles multilingues. Ce travail propose ainsi des modèles robustes de reconnaissance vocale pour le kreyòl , adaptables à d’autres créoles français des Caraïbes, contribuant ainsi au développement technologique de ces langues peu dotées.</abstract>
<identifier type="citekey">n-havard-etal-2025-modeles</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-taln.33/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>542</start>
<end>554</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Modèles auto-supervisés de traitement de la parole pour le Créole Haitien
%A N. Havard, William
%A Govain, Renauld
%A Lecouteux, Benjamin
%A Schang, Emmanuel
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F n-havard-etal-2025-modeles
%X Nous développons des modèles de traitement de la parole spécifiquement dédiés au créole haïtien (kreyòl), le positionnant ainsi comme une langue bien dotée en termes de modèles auto-supervisés de traitement de la parole. Pour ce faire, nous pré-entraînons des modèles monolingues WAV2VEC2BASE,WAV2VEC2-L ARGE etDATA 2VEC-AUDIO -BASEà partir de zéro, qui sont ensuite affinés pour une tâche de reconnaissance automatique de la parole. Nous comparons la performance de ces modèles avec des modèles affinés à partir de modèles multilingues (XLSR-53, XLSR2-300 M, MMS-1B) et monolingues basés sur le français (LEBENCHMARK 1 à 7K). Nos résultats démontrent l’efficacité du pré-entraînement monolingue, avec des performances pouvant rivaliser, voire surpasser, celle de grands modèles multilingues. Ce travail propose ainsi des modèles robustes de reconnaissance vocale pour le kreyòl , adaptables à d’autres créoles français des Caraïbes, contribuant ainsi au développement technologique de ces langues peu dotées.
%U https://aclanthology.org/2025.jeptalnrecital-taln.33/
%P 542-554
Markdown (Informal)
[Modèles auto-supervisés de traitement de la parole pour le Créole Haitien](https://aclanthology.org/2025.jeptalnrecital-taln.33/) (N. Havard et al., JEP/TALN/RECITAL 2025)
ACL