@inproceedings{lardilleux-etal-2011-generalisation,
title = "G{\'e}n{\'e}ralisation de l{'}alignement sous-phrastique par {\'e}chantillonnage (Generalization of sub-sentential alignment by sampling)",
author = "Lardilleux, Adrien and
Yvon, Fran{\c{c}}ois and
Lepage, Yves",
editor = "Lafourcade, Mathieu and
Prince, Violaine",
booktitle = "Actes de la 18e conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2011",
address = "Montpellier, France",
publisher = "ATALA",
url = "https://aclanthology.org/2011.jeptalnrecital-long.36",
pages = "412--423",
abstract = "L{'}alignement sous-phrastique consiste {\`a} extraire des traductions d{'}unit{\'e}s textuelles de grain inf{\'e}rieur {\`a} la phrase {\`a} partir de textes multilingues parall{\`e}les align{\'e}s au niveau de la phrase. Un tel alignement est n{\'e}cessaire, par exemple, pour entra{\^\i}ner des syst{\`e}mes de traduction statistique. L{'}approche standard pour r{\'e}aliser cette t{\^a}che implique l{'}estimation successive de plusieurs mod{\`e}les probabilistes de complexit{\'e} croissante et l{'}utilisation d{'}heuristiques qui permettent d{'}aligner des mots isol{\'e}s, puis, par extension, des groupes de mots. Dans cet article, nous consid{\'e}rons une approche alternative, initialement propos{\'e}e dans (Lardilleux {\&} Lepage, 2008), qui repose sur un principe beaucoup plus simple, {\`a} savoir la comparaison des profils d{'}occurrences dans des souscorpus obtenus par {\'e}chantillonnage. Apr{\`e}s avoir analys{\'e} les forces et faiblesses de cette approche, nous montrons comment am{\'e}liorer la d{\'e}tection d{'}unit{\'e}s de traduction longues, et {\'e}valuons ces am{\'e}liorations sur des t{\^a}ches de traduction automatique.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="lardilleux-etal-2011-generalisation">
<titleInfo>
<title>Généralisation de l’alignement sous-phrastique par échantillonnage (Generalization of sub-sentential alignment by sampling)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Adrien</namePart>
<namePart type="family">Lardilleux</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">François</namePart>
<namePart type="family">Yvon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Yves</namePart>
<namePart type="family">Lepage</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2011-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Lafourcade</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Violaine</namePart>
<namePart type="family">Prince</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Montpellier, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>L’alignement sous-phrastique consiste à extraire des traductions d’unités textuelles de grain inférieur à la phrase à partir de textes multilingues parallèles alignés au niveau de la phrase. Un tel alignement est nécessaire, par exemple, pour entraîner des systèmes de traduction statistique. L’approche standard pour réaliser cette tâche implique l’estimation successive de plusieurs modèles probabilistes de complexité croissante et l’utilisation d’heuristiques qui permettent d’aligner des mots isolés, puis, par extension, des groupes de mots. Dans cet article, nous considérons une approche alternative, initialement proposée dans (Lardilleux & Lepage, 2008), qui repose sur un principe beaucoup plus simple, à savoir la comparaison des profils d’occurrences dans des souscorpus obtenus par échantillonnage. Après avoir analysé les forces et faiblesses de cette approche, nous montrons comment améliorer la détection d’unités de traduction longues, et évaluons ces améliorations sur des tâches de traduction automatique.</abstract>
<identifier type="citekey">lardilleux-etal-2011-generalisation</identifier>
<location>
<url>https://aclanthology.org/2011.jeptalnrecital-long.36</url>
</location>
<part>
<date>2011-06</date>
<extent unit="page">
<start>412</start>
<end>423</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Généralisation de l’alignement sous-phrastique par échantillonnage (Generalization of sub-sentential alignment by sampling)
%A Lardilleux, Adrien
%A Yvon, François
%A Lepage, Yves
%Y Lafourcade, Mathieu
%Y Prince, Violaine
%S Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2011
%8 June
%I ATALA
%C Montpellier, France
%G French
%F lardilleux-etal-2011-generalisation
%X L’alignement sous-phrastique consiste à extraire des traductions d’unités textuelles de grain inférieur à la phrase à partir de textes multilingues parallèles alignés au niveau de la phrase. Un tel alignement est nécessaire, par exemple, pour entraîner des systèmes de traduction statistique. L’approche standard pour réaliser cette tâche implique l’estimation successive de plusieurs modèles probabilistes de complexité croissante et l’utilisation d’heuristiques qui permettent d’aligner des mots isolés, puis, par extension, des groupes de mots. Dans cet article, nous considérons une approche alternative, initialement proposée dans (Lardilleux & Lepage, 2008), qui repose sur un principe beaucoup plus simple, à savoir la comparaison des profils d’occurrences dans des souscorpus obtenus par échantillonnage. Après avoir analysé les forces et faiblesses de cette approche, nous montrons comment améliorer la détection d’unités de traduction longues, et évaluons ces améliorations sur des tâches de traduction automatique.
%U https://aclanthology.org/2011.jeptalnrecital-long.36
%P 412-423
Markdown (Informal)
[Généralisation de l’alignement sous-phrastique par échantillonnage (Generalization of sub-sentential alignment by sampling)](https://aclanthology.org/2011.jeptalnrecital-long.36) (Lardilleux et al., JEP/TALN/RECITAL 2011)
ACL