@inproceedings{lerner-yvon-2024-vers,
title = "Vers la traduction automatique des n{\'e}ologismes scientifiques",
author = "Lerner, Paul and
Yvon, Fran{\c{c}}ois",
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes de la 31{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://aclanthology.org/2024.jeptalnrecital-taln.17",
pages = "245--261",
abstract = "La recherche scientifique d{\'e}couvre et invente continuellement de nouveaux concepts qui sont alors d{\'e}sign{\'e}s par de nouveaux termes, des n{\'e}ologismes, ou n{\'e}onymes dans ce contexte. Puisque les publications se font tr{\`e}s majoritairement en anglais, diffuser ces nouvelles connaissances en fran{\c{c}}ais demande souvent de traduire ces termes, afin d{'}{\'e}viter de multiplier les anglicismes qui sont moins facilement compr{\'e}hensibles pour le grand public. Nous proposons d{'}explorer cette t{\^a}che {\`a} partir de deux th{\'e}saurus en exploitant la d{\'e}finition du terme afin de le traduire plus fid{\`e}lement. Pour ce faire, nous explorons les capacit{\'e}s de deux grands mod{\`e}les de langue multilingues, BLOOM et CroissantLLM, qui parviennent {\`a} traduire des n{\'e}ologismes scientifiques dans une certaine mesure. Nous montrons notamment qu{'}ils utilisent souvent des proc{\'e}d{\'e}s morphosyntaxiques appropri{\'e}s mais sont limit{\'e}s par la segmentation en unit{\'e}s sous-lexicales et biais{\'e}s par la fr{\'e}quence d{'}occurrences des termes ainsi que par des similarit{\'e}s de surface entre l{'}anglais et le fran{\c{c}}ais.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="lerner-yvon-2024-vers">
<titleInfo>
<title>Vers la traduction automatique des néologismes scientifiques</title>
</titleInfo>
<name type="personal">
<namePart type="given">Paul</namePart>
<namePart type="family">Lerner</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">François</namePart>
<namePart type="family">Yvon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2024-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Balaguer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nihed</namePart>
<namePart type="family">Bendahman</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lydia-Mai</namePart>
<namePart type="family">Ho-dac</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julie</namePart>
<namePart type="family">Mauclair</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">G Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Pinquier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA and AFPC</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La recherche scientifique découvre et invente continuellement de nouveaux concepts qui sont alors désignés par de nouveaux termes, des néologismes, ou néonymes dans ce contexte. Puisque les publications se font très majoritairement en anglais, diffuser ces nouvelles connaissances en français demande souvent de traduire ces termes, afin d’éviter de multiplier les anglicismes qui sont moins facilement compréhensibles pour le grand public. Nous proposons d’explorer cette tâche à partir de deux thésaurus en exploitant la définition du terme afin de le traduire plus fidèlement. Pour ce faire, nous explorons les capacités de deux grands modèles de langue multilingues, BLOOM et CroissantLLM, qui parviennent à traduire des néologismes scientifiques dans une certaine mesure. Nous montrons notamment qu’ils utilisent souvent des procédés morphosyntaxiques appropriés mais sont limités par la segmentation en unités sous-lexicales et biaisés par la fréquence d’occurrences des termes ainsi que par des similarités de surface entre l’anglais et le français.</abstract>
<identifier type="citekey">lerner-yvon-2024-vers</identifier>
<location>
<url>https://aclanthology.org/2024.jeptalnrecital-taln.17</url>
</location>
<part>
<date>2024-7</date>
<extent unit="page">
<start>245</start>
<end>261</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Vers la traduction automatique des néologismes scientifiques
%A Lerner, Paul
%A Yvon, François
%Y Balaguer, Mathieu
%Y Bendahman, Nihed
%Y Ho-dac, Lydia-Mai
%Y Mauclair, Julie
%Y G Moreno, Jose
%Y Pinquier, Julien
%S Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position
%D 2024
%8 July
%I ATALA and AFPC
%C Toulouse, France
%G French
%F lerner-yvon-2024-vers
%X La recherche scientifique découvre et invente continuellement de nouveaux concepts qui sont alors désignés par de nouveaux termes, des néologismes, ou néonymes dans ce contexte. Puisque les publications se font très majoritairement en anglais, diffuser ces nouvelles connaissances en français demande souvent de traduire ces termes, afin d’éviter de multiplier les anglicismes qui sont moins facilement compréhensibles pour le grand public. Nous proposons d’explorer cette tâche à partir de deux thésaurus en exploitant la définition du terme afin de le traduire plus fidèlement. Pour ce faire, nous explorons les capacités de deux grands modèles de langue multilingues, BLOOM et CroissantLLM, qui parviennent à traduire des néologismes scientifiques dans une certaine mesure. Nous montrons notamment qu’ils utilisent souvent des procédés morphosyntaxiques appropriés mais sont limités par la segmentation en unités sous-lexicales et biaisés par la fréquence d’occurrences des termes ainsi que par des similarités de surface entre l’anglais et le français.
%U https://aclanthology.org/2024.jeptalnrecital-taln.17
%P 245-261
Markdown (Informal)
[Vers la traduction automatique des néologismes scientifiques](https://aclanthology.org/2024.jeptalnrecital-taln.17) (Lerner & Yvon, JEP/TALN/RECITAL 2024)
ACL