@inproceedings{bouthors-etal-2025-ameliorer,
title = "Am{\'e}liorer la Traduction Neuronale par Exemple avec des Donn{\'e}es Monolingues",
author = "Bouthors, Maxime and
Crego, Josep and
Yvon, Fran{\c{c}}ois",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 32{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-taln.7/",
pages = "117--133",
language = "fra",
abstract = "Les syst{\`e}mes de traduction neuronale augment{\'e}e par des exemples (RANMT) utilisent des corpus bilingues dits m{\'e}moires de traduction (TM). Pourtant, dans de nombreux cas, des corpus monolingues du domaine d{'}int{\'e}r{\^e}t dans la langue cible sont disponibles. Nos travaux s{'}int{\'e}ressent {\`a} l{'}exploitation de telles ressources, en recherchant les segments pertinents directement dans la langue cible, conditionnellement {\`a} une phrase source en requ{\^e}te. {\`A} cet effet, nous proposons d{'}am{\'e}liorer les syst{\`e}mes de recherche cross-lingue, en les entra{\^i}nant {\`a} r{\'e}aliser des association lexicales. Nos exp{\'e}riences avec deux architectures neuronales montrent l{'}avantage de notre m{\'e}thode dans un cas contr{\^o}l{\'e}, conduisant {\`a} des performances de traduction qui peuvent surpasser les m{\'e}thodes bas{\'e}es sur une m{\'e}moire de traduction. Enfin, nous {\'e}valuons notre m{\'e}thode dans une configuration r{\'e}aliste pour laquelle la quantit{\'e} de donn{\'e}es monolingues exc{\`e}de celle des donn{\'e}es parall{\`e}les. Cette approche r{\'e}sulte en une nette am{\'e}lioration des performances par rapport {\`a} des mod{\`e}les de base ainsi que des encodeurs pr{\'e}-entra{\^i}n{\'e}s."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="bouthors-etal-2025-ameliorer">
<titleInfo>
<title>Améliorer la Traduction Neuronale par Exemple avec des Données Monolingues</title>
</titleInfo>
<name type="personal">
<namePart type="given">Maxime</namePart>
<namePart type="family">Bouthors</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Josep</namePart>
<namePart type="family">Crego</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">François</namePart>
<namePart type="family">Yvon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les systèmes de traduction neuronale augmentée par des exemples (RANMT) utilisent des corpus bilingues dits mémoires de traduction (TM). Pourtant, dans de nombreux cas, des corpus monolingues du domaine d’intérêt dans la langue cible sont disponibles. Nos travaux s’intéressent à l’exploitation de telles ressources, en recherchant les segments pertinents directement dans la langue cible, conditionnellement à une phrase source en requête. À cet effet, nous proposons d’améliorer les systèmes de recherche cross-lingue, en les entraînant à réaliser des association lexicales. Nos expériences avec deux architectures neuronales montrent l’avantage de notre méthode dans un cas contrôlé, conduisant à des performances de traduction qui peuvent surpasser les méthodes basées sur une mémoire de traduction. Enfin, nous évaluons notre méthode dans une configuration réaliste pour laquelle la quantité de données monolingues excède celle des données parallèles. Cette approche résulte en une nette amélioration des performances par rapport à des modèles de base ainsi que des encodeurs pré-entraînés.</abstract>
<identifier type="citekey">bouthors-etal-2025-ameliorer</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-taln.7/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>117</start>
<end>133</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Améliorer la Traduction Neuronale par Exemple avec des Données Monolingues
%A Bouthors, Maxime
%A Crego, Josep
%A Yvon, François
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F bouthors-etal-2025-ameliorer
%X Les systèmes de traduction neuronale augmentée par des exemples (RANMT) utilisent des corpus bilingues dits mémoires de traduction (TM). Pourtant, dans de nombreux cas, des corpus monolingues du domaine d’intérêt dans la langue cible sont disponibles. Nos travaux s’intéressent à l’exploitation de telles ressources, en recherchant les segments pertinents directement dans la langue cible, conditionnellement à une phrase source en requête. À cet effet, nous proposons d’améliorer les systèmes de recherche cross-lingue, en les entraînant à réaliser des association lexicales. Nos expériences avec deux architectures neuronales montrent l’avantage de notre méthode dans un cas contrôlé, conduisant à des performances de traduction qui peuvent surpasser les méthodes basées sur une mémoire de traduction. Enfin, nous évaluons notre méthode dans une configuration réaliste pour laquelle la quantité de données monolingues excède celle des données parallèles. Cette approche résulte en une nette amélioration des performances par rapport à des modèles de base ainsi que des encodeurs pré-entraînés.
%U https://aclanthology.org/2025.jeptalnrecital-taln.7/
%P 117-133
Markdown (Informal)
[Améliorer la Traduction Neuronale par Exemple avec des Données Monolingues](https://aclanthology.org/2025.jeptalnrecital-taln.7/) (Bouthors et al., JEP/TALN/RECITAL 2025)
ACL