@inproceedings{n-havard-etal-2025-exploration,
title = "Exploration de la s{\'e}paration en langues dans les mod{\`e}les de traitement de la parole auto-supervis{\'e}s multilingues pr{\'e}entra{\^i}n{\'e}s avec des donn{\'e}es {\'e}cologiques",
author = "N. Havard, William and
Hassamal, Shrita and
Alleesaib, Muhsina and
Florigny, Guilhem and
Fon Sing, Guillaume and
Abeill{\'e}, Anne and
Lecouteux, Benjamin and
Schang, Emmanuel",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 32{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-taln.24/",
pages = "390--403",
language = "fra",
abstract = "Les mod{\`e}les auto-supervis{\'e}s omnilingues de traitement de la parole sont adaptables mais manquent de plausibilit{\'e} {\'e}cologique et cognitive. Entra{\^i}n{\'e}s sur des corpus monolingues, ils n{\'e}gligent le multi- linguisme r{\'e}el et le code-switching. De pr{\'e}c{\'e}dents travaux sugg{\`e}rent que de tels mod{\`e}les proc{\`e}dent {\`a} des regroupements en langues dans l{'}espace latent, mais cela pourrait {\^e}tre d{\^u} {\`a} des biais acoustiques ou paralinguistiques plut{\^o}t qu'{\`a} de v{\'e}ritables traitements linguistiques. Nous avons entra{\^i}n{\'e} un mod{\`e}le WAV2VEC2 sur des donn{\'e}es multilingues de Maurice, incluant des locuteurs plurilingues et du code-switching, et avons {\'e}tudi{\'e} les repr{\'e}sentations latentes du mod{\`e}le. Nos analyses montrent que les facteurs acoustiques et paralinguistiques sont encod{\'e}s sans apprentissage actif, tandis que le regroupement par langue {\'e}merge avec un r{\'e}el apprentissage. Ces r{\'e}sultats {\'e}clairent ainsi sur les v{\'e}ritable capacit{\'e}s linguistiques et paralinguistiques des mod{\`e}les auto-supervis{\'e}s de la parole."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="n-havard-etal-2025-exploration">
<titleInfo>
<title>Exploration de la séparation en langues dans les modèles de traitement de la parole auto-supervisés multilingues préentraînés avec des données écologiques</title>
</titleInfo>
<name type="personal">
<namePart type="given">William</namePart>
<namePart type="family">N. Havard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Shrita</namePart>
<namePart type="family">Hassamal</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Muhsina</namePart>
<namePart type="family">Alleesaib</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Guilhem</namePart>
<namePart type="family">Florigny</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Guillaume</namePart>
<namePart type="family">Fon Sing</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Anne</namePart>
<namePart type="family">Abeillé</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benjamin</namePart>
<namePart type="family">Lecouteux</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Emmanuel</namePart>
<namePart type="family">Schang</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les modèles auto-supervisés omnilingues de traitement de la parole sont adaptables mais manquent de plausibilité écologique et cognitive. Entraînés sur des corpus monolingues, ils négligent le multi- linguisme réel et le code-switching. De précédents travaux suggèrent que de tels modèles procèdent à des regroupements en langues dans l’espace latent, mais cela pourrait être dû à des biais acoustiques ou paralinguistiques plutôt qu’à de véritables traitements linguistiques. Nous avons entraîné un modèle WAV2VEC2 sur des données multilingues de Maurice, incluant des locuteurs plurilingues et du code-switching, et avons étudié les représentations latentes du modèle. Nos analyses montrent que les facteurs acoustiques et paralinguistiques sont encodés sans apprentissage actif, tandis que le regroupement par langue émerge avec un réel apprentissage. Ces résultats éclairent ainsi sur les véritable capacités linguistiques et paralinguistiques des modèles auto-supervisés de la parole.</abstract>
<identifier type="citekey">n-havard-etal-2025-exploration</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-taln.24/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>390</start>
<end>403</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Exploration de la séparation en langues dans les modèles de traitement de la parole auto-supervisés multilingues préentraînés avec des données écologiques
%A N. Havard, William
%A Hassamal, Shrita
%A Alleesaib, Muhsina
%A Florigny, Guilhem
%A Fon Sing, Guillaume
%A Abeillé, Anne
%A Lecouteux, Benjamin
%A Schang, Emmanuel
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F n-havard-etal-2025-exploration
%X Les modèles auto-supervisés omnilingues de traitement de la parole sont adaptables mais manquent de plausibilité écologique et cognitive. Entraînés sur des corpus monolingues, ils négligent le multi- linguisme réel et le code-switching. De précédents travaux suggèrent que de tels modèles procèdent à des regroupements en langues dans l’espace latent, mais cela pourrait être dû à des biais acoustiques ou paralinguistiques plutôt qu’à de véritables traitements linguistiques. Nous avons entraîné un modèle WAV2VEC2 sur des données multilingues de Maurice, incluant des locuteurs plurilingues et du code-switching, et avons étudié les représentations latentes du modèle. Nos analyses montrent que les facteurs acoustiques et paralinguistiques sont encodés sans apprentissage actif, tandis que le regroupement par langue émerge avec un réel apprentissage. Ces résultats éclairent ainsi sur les véritable capacités linguistiques et paralinguistiques des modèles auto-supervisés de la parole.
%U https://aclanthology.org/2025.jeptalnrecital-taln.24/
%P 390-403
Markdown (Informal)
[Exploration de la séparation en langues dans les modèles de traitement de la parole auto-supervisés multilingues préentraînés avec des données écologiques](https://aclanthology.org/2025.jeptalnrecital-taln.24/) (N. Havard et al., JEP/TALN/RECITAL 2025)
ACL
- William N. Havard, Shrita Hassamal, Muhsina Alleesaib, Guilhem Florigny, Guillaume Fon Sing, Anne Abeillé, Benjamin Lecouteux, and Emmanuel Schang. 2025. Exploration de la séparation en langues dans les modèles de traitement de la parole auto-supervisés multilingues préentraînés avec des données écologiques. In Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux, pages 390–403, Marseille, France. ATALA \\& ARIA.