@inproceedings{do-etal-2009-exploitation,
title = "Exploitation d{'}un corpus bilingue pour la cr{\'e}ation d{'}un syst{\`e}me de traduction probabiliste Vietnamien - Fran{\c{c}}ais",
author = "Do, Thi-Ngoc-Diep and
Le, Viet-Bac and
Bigi, Brigitte and
Besacier, Laurent and
Castelli, Eric",
editor = "Nazarenko, Adeline and
Poibeau, Thierry",
booktitle = "Actes de la 16{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2009",
address = "Senlis, France",
publisher = "ATALA",
url = "https://aclanthology.org/2009.jeptalnrecital-long.9",
pages = "81--90",
abstract = "Cet article pr{\'e}sente nos premiers travaux en vue de la construction d{'}un syst{\`e}me de traduction probabiliste pour le couple de langue vietnamien-fran{\c{c}}ais. La langue vietnamienne {\'e}tant consid{\'e}r{\'e}e comme une langue peu dot{\'e}e, une des difficult{\'e}s r{\'e}side dans la constitution des corpus parall{\`e}les, indispensable {\`a} l{'}apprentissage des mod{\`e}les. Nous nous concentrons sur la constitution d{'}un grand corpus parall{\`e}le vietnamien-fran{\c{c}}ais. La m{\'e}thode d{'}identification automatique des paires de documents parall{\`e}les fond{\'e}e sur la date de publication, les mots sp{\'e}ciaux et les scores d{'}alignements des phrases est appliqu{\'e}e. Cet article pr{\'e}sente {\'e}galement la construction d{'}un premier syst{\`e}me de traduction automatique probabiliste vietnamienfran{\c{c}}ais et fran{\c{c}}ais-vietnamien {\`a} partir de ce corpus et discute l{'}opportunit{\'e} d{'}utiliser des unit{\'e}s lexicales ou sous-lexicales pour le vietnamien (syllabes, mots, ou leurs combinaisons). Les performances du syst{\`e}me sont encourageantes et se comparent avantageusement {\`a} celles du syst{\`e}me de Google.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="do-etal-2009-exploitation">
<titleInfo>
<title>Exploitation d’un corpus bilingue pour la création d’un système de traduction probabiliste Vietnamien - Français</title>
</titleInfo>
<name type="personal">
<namePart type="given">Thi-Ngoc-Diep</namePart>
<namePart type="family">Do</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Viet-Bac</namePart>
<namePart type="family">Le</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Brigitte</namePart>
<namePart type="family">Bigi</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Laurent</namePart>
<namePart type="family">Besacier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eric</namePart>
<namePart type="family">Castelli</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2009-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Adeline</namePart>
<namePart type="family">Nazarenko</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Poibeau</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Senlis, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Cet article présente nos premiers travaux en vue de la construction d’un système de traduction probabiliste pour le couple de langue vietnamien-français. La langue vietnamienne étant considérée comme une langue peu dotée, une des difficultés réside dans la constitution des corpus parallèles, indispensable à l’apprentissage des modèles. Nous nous concentrons sur la constitution d’un grand corpus parallèle vietnamien-français. La méthode d’identification automatique des paires de documents parallèles fondée sur la date de publication, les mots spéciaux et les scores d’alignements des phrases est appliquée. Cet article présente également la construction d’un premier système de traduction automatique probabiliste vietnamienfrançais et français-vietnamien à partir de ce corpus et discute l’opportunité d’utiliser des unités lexicales ou sous-lexicales pour le vietnamien (syllabes, mots, ou leurs combinaisons). Les performances du système sont encourageantes et se comparent avantageusement à celles du système de Google.</abstract>
<identifier type="citekey">do-etal-2009-exploitation</identifier>
<location>
<url>https://aclanthology.org/2009.jeptalnrecital-long.9</url>
</location>
<part>
<date>2009-06</date>
<extent unit="page">
<start>81</start>
<end>90</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Exploitation d’un corpus bilingue pour la création d’un système de traduction probabiliste Vietnamien - Français
%A Do, Thi-Ngoc-Diep
%A Le, Viet-Bac
%A Bigi, Brigitte
%A Besacier, Laurent
%A Castelli, Eric
%Y Nazarenko, Adeline
%Y Poibeau, Thierry
%S Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2009
%8 June
%I ATALA
%C Senlis, France
%G French
%F do-etal-2009-exploitation
%X Cet article présente nos premiers travaux en vue de la construction d’un système de traduction probabiliste pour le couple de langue vietnamien-français. La langue vietnamienne étant considérée comme une langue peu dotée, une des difficultés réside dans la constitution des corpus parallèles, indispensable à l’apprentissage des modèles. Nous nous concentrons sur la constitution d’un grand corpus parallèle vietnamien-français. La méthode d’identification automatique des paires de documents parallèles fondée sur la date de publication, les mots spéciaux et les scores d’alignements des phrases est appliquée. Cet article présente également la construction d’un premier système de traduction automatique probabiliste vietnamienfrançais et français-vietnamien à partir de ce corpus et discute l’opportunité d’utiliser des unités lexicales ou sous-lexicales pour le vietnamien (syllabes, mots, ou leurs combinaisons). Les performances du système sont encourageantes et se comparent avantageusement à celles du système de Google.
%U https://aclanthology.org/2009.jeptalnrecital-long.9
%P 81-90
Markdown (Informal)
[Exploitation d’un corpus bilingue pour la création d’un système de traduction probabiliste Vietnamien - Français](https://aclanthology.org/2009.jeptalnrecital-long.9) (Do et al., JEP/TALN/RECITAL 2009)
ACL