@inproceedings{radola-yvon-2025-alignements,
title = "Alignements divisifs de textes parall{\`e}les: donn{\'e}es, algorithme et {\'e}valuation",
author = "Rado{\l}a, Joanna and
Yvon, Fran{\c{c}}ois",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 32{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-taln.5/",
pages = "84--99",
language = "fra",
abstract = "Nous pr{\'e}sentons Alibi - un corpus d{'}alignements hi{\'e}rarchiques sous-phrastiques fran{\c{c}}ais-anglais, annot{\'e} manuellement {\`a} l{'}aide d{'}une strat{\'e}gie divisive. Nous comparons globalement les alignements ainsi obtenus avec plusieurs corpus parall{\`e}les align{\'e}s mot-{\`a}-mot et {\'e}talonnons sa difficult{\'e} en r{\'e}alisant des alignements automatiques par des m{\'e}thodes de l'{\'e}tat de l{'}art. Nous proposons {\'e}galement un algorithme exploitant des repr{\'e}sentations neuronales des mots et des groupes de mots afin de repro- duire les alignements hi{\'e}rarchiques de r{\'e}f{\'e}rence. Enfin, nous proposons une m{\'e}trique d'{\'e}valuation des arbres d{'}alignement avec laquelle nous comparons les performances de plusieurs variantes de l{'}algorithme d{'}alignement, obtenues en faisant varier les mesures d{'}appariemment de groupes de mots. Nos r{\'e}sultats montrent que (a) les arbres d{'}alignements de r{\'e}f{\'e}rence sont tr{\`e}s ambigus et difficiles {\`a} reproduire automatiquement, cependant, les alignements mot-{\`a}-mot sont pr{\'e}dits de mani{\`e}re fiable ; (b) l{'}utilisation d{'}alternatives {\`a} la similarit{\'e} cosinus pour {\'e}valuer l{'}appariemment de blocs permet d{'}am{\'e}liorer significativement les r{\'e}sultats du syst{\`e}me de base."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="radola-yvon-2025-alignements">
<titleInfo>
<title>Alignements divisifs de textes parallèles: données, algorithme et évaluation</title>
</titleInfo>
<name type="personal">
<namePart type="given">Joanna</namePart>
<namePart type="family">Radoła</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">François</namePart>
<namePart type="family">Yvon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous présentons Alibi - un corpus d’alignements hiérarchiques sous-phrastiques français-anglais, annoté manuellement à l’aide d’une stratégie divisive. Nous comparons globalement les alignements ainsi obtenus avec plusieurs corpus parallèles alignés mot-à-mot et étalonnons sa difficulté en réalisant des alignements automatiques par des méthodes de l’état de l’art. Nous proposons également un algorithme exploitant des représentations neuronales des mots et des groupes de mots afin de repro- duire les alignements hiérarchiques de référence. Enfin, nous proposons une métrique d’évaluation des arbres d’alignement avec laquelle nous comparons les performances de plusieurs variantes de l’algorithme d’alignement, obtenues en faisant varier les mesures d’appariemment de groupes de mots. Nos résultats montrent que (a) les arbres d’alignements de référence sont très ambigus et difficiles à reproduire automatiquement, cependant, les alignements mot-à-mot sont prédits de manière fiable ; (b) l’utilisation d’alternatives à la similarité cosinus pour évaluer l’appariemment de blocs permet d’améliorer significativement les résultats du système de base.</abstract>
<identifier type="citekey">radola-yvon-2025-alignements</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-taln.5/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>84</start>
<end>99</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Alignements divisifs de textes parallèles: données, algorithme et évaluation
%A Radoła, Joanna
%A Yvon, François
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F radola-yvon-2025-alignements
%X Nous présentons Alibi - un corpus d’alignements hiérarchiques sous-phrastiques français-anglais, annoté manuellement à l’aide d’une stratégie divisive. Nous comparons globalement les alignements ainsi obtenus avec plusieurs corpus parallèles alignés mot-à-mot et étalonnons sa difficulté en réalisant des alignements automatiques par des méthodes de l’état de l’art. Nous proposons également un algorithme exploitant des représentations neuronales des mots et des groupes de mots afin de repro- duire les alignements hiérarchiques de référence. Enfin, nous proposons une métrique d’évaluation des arbres d’alignement avec laquelle nous comparons les performances de plusieurs variantes de l’algorithme d’alignement, obtenues en faisant varier les mesures d’appariemment de groupes de mots. Nos résultats montrent que (a) les arbres d’alignements de référence sont très ambigus et difficiles à reproduire automatiquement, cependant, les alignements mot-à-mot sont prédits de manière fiable ; (b) l’utilisation d’alternatives à la similarité cosinus pour évaluer l’appariemment de blocs permet d’améliorer significativement les résultats du système de base.
%U https://aclanthology.org/2025.jeptalnrecital-taln.5/
%P 84-99
Markdown (Informal)
[Alignements divisifs de textes parallèles: données, algorithme et évaluation](https://aclanthology.org/2025.jeptalnrecital-taln.5/) (Radoła & Yvon, JEP/TALN/RECITAL 2025)
ACL