@inproceedings{ferret-2025-projeter,
title = "Projeter pour mieux fusionner : une histoire de bandit et de lit",
author = "Ferret, Olivier",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 32{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-taln.38/",
pages = "629--641",
language = "fra",
abstract = "La mise {\`a} disposition d{'}un nombre important de mod{\`e}les de langue neuronaux affin{\'e}s pour diff{\'e}rentes t{\^a}ches conduit assez naturellement {\`a} se poser la question de l{'}int{\'e}r{\^e}t de les combiner, en particulier par le biais de la fusion de param{\`e}tres, option aboutissant au r{\'e}sultat demandant le moins de ressources. Dans cet article, nous proposons une nouvelle m{\'e}thode entrant dans ce champ de recherche, fond{\'e} sur l{'}analyse procust{\'e}enne. Nous {\'e}valuons cette m{\'e}thode pour la fusion de mod{\`e}les affin{\'e}s pour une m{\^e}me t{\^a}che {\`a} partir d{'}un m{\^e}me mod{\`e}le de base, de type encodeur. En consid{\'e}rant neuf t{\^a}ches du jeu de donn{\'e}es GLUE et six m{\'e}thodes de fusion de r{\'e}f{\'e}rence, nous montrons que notre proposition est capable d{'}am{\'e}liorer les m{\'e}thodes de fusion existantes dans la plupart des configurations test{\'e}es."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="ferret-2025-projeter">
<titleInfo>
<title>Projeter pour mieux fusionner : une histoire de bandit et de lit</title>
</titleInfo>
<name type="personal">
<namePart type="given">Olivier</namePart>
<namePart type="family">Ferret</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La mise à disposition d’un nombre important de modèles de langue neuronaux affinés pour différentes tâches conduit assez naturellement à se poser la question de l’intérêt de les combiner, en particulier par le biais de la fusion de paramètres, option aboutissant au résultat demandant le moins de ressources. Dans cet article, nous proposons une nouvelle méthode entrant dans ce champ de recherche, fondé sur l’analyse procustéenne. Nous évaluons cette méthode pour la fusion de modèles affinés pour une même tâche à partir d’un même modèle de base, de type encodeur. En considérant neuf tâches du jeu de données GLUE et six méthodes de fusion de référence, nous montrons que notre proposition est capable d’améliorer les méthodes de fusion existantes dans la plupart des configurations testées.</abstract>
<identifier type="citekey">ferret-2025-projeter</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-taln.38/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>629</start>
<end>641</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Projeter pour mieux fusionner : une histoire de bandit et de lit
%A Ferret, Olivier
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F ferret-2025-projeter
%X La mise à disposition d’un nombre important de modèles de langue neuronaux affinés pour différentes tâches conduit assez naturellement à se poser la question de l’intérêt de les combiner, en particulier par le biais de la fusion de paramètres, option aboutissant au résultat demandant le moins de ressources. Dans cet article, nous proposons une nouvelle méthode entrant dans ce champ de recherche, fondé sur l’analyse procustéenne. Nous évaluons cette méthode pour la fusion de modèles affinés pour une même tâche à partir d’un même modèle de base, de type encodeur. En considérant neuf tâches du jeu de données GLUE et six méthodes de fusion de référence, nous montrons que notre proposition est capable d’améliorer les méthodes de fusion existantes dans la plupart des configurations testées.
%U https://aclanthology.org/2025.jeptalnrecital-taln.38/
%P 629-641
Markdown (Informal)
[Projeter pour mieux fusionner : une histoire de bandit et de lit](https://aclanthology.org/2025.jeptalnrecital-taln.38/) (Ferret, JEP/TALN/RECITAL 2025)
ACL