@inproceedings{scherrer-2008-transducteurs,
title = "Transducteurs {\`a} fen{\^e}tre glissante pour l{'}induction lexicale",
author = "Scherrer, Yves",
editor = "Bellot, Patrice and
Gu{\'e}not, Marie-Laure",
booktitle = "Actes de la 15{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues",
month = jun,
year = "2008",
address = "Avignon, France",
publisher = "ATALA",
url = "https://aclanthology.org/2008.jeptalnrecital-recital.8",
pages = "70--79",
abstract = "Nous appliquons diff{\'e}rents mod{\`e}les de similarit{\'e} graphique {\`a} la t{\^a}che de l{'}induction de lexiques bilingues entre un dialecte de Suisse allemande et l{'}allemand standard. Nous comparons des transducteurs stochastiques utilisant des fen{\^e}tres glissantes de 1 {\`a} 3 caract{\`e}res, entra{\^\i}n{\'e}s {\`a} l{'}aide de l{'}algorithme de maximisation de l{'}esp{\'e}rance avec des corpus d{'}entra{\^\i}nement de tailles diff{\'e}rentes. Si les transducteurs {\`a} unigrammes donnent des r{\'e}sultats satisfaisants avec des corpus tr{\`e}s petits, nous montrons que les transducteurs {\`a} bigrammes les d{\'e}passent {\`a} partir de 750 paires de mots d{'}entra{\^\i}nement. En g{\'e}n{\'e}ral, les mod{\`e}les entra{\^\i}n{\'e}s nous ont permis d{'}am{\'e}liorer la F-mesure de 7{\%} {\`a} 15{\%} par rapport {\`a} la distance de Levenshtein.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="scherrer-2008-transducteurs">
<titleInfo>
<title>Transducteurs à fenêtre glissante pour l’induction lexicale</title>
</titleInfo>
<name type="personal">
<namePart type="given">Yves</namePart>
<namePart type="family">Scherrer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2008-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues</title>
</titleInfo>
<name type="personal">
<namePart type="given">Patrice</namePart>
<namePart type="family">Bellot</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Marie-Laure</namePart>
<namePart type="family">Guénot</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Avignon, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous appliquons différents modèles de similarité graphique à la tâche de l’induction de lexiques bilingues entre un dialecte de Suisse allemande et l’allemand standard. Nous comparons des transducteurs stochastiques utilisant des fenêtres glissantes de 1 à 3 caractères, entraînés à l’aide de l’algorithme de maximisation de l’espérance avec des corpus d’entraînement de tailles différentes. Si les transducteurs à unigrammes donnent des résultats satisfaisants avec des corpus très petits, nous montrons que les transducteurs à bigrammes les dépassent à partir de 750 paires de mots d’entraînement. En général, les modèles entraînés nous ont permis d’améliorer la F-mesure de 7% à 15% par rapport à la distance de Levenshtein.</abstract>
<identifier type="citekey">scherrer-2008-transducteurs</identifier>
<location>
<url>https://aclanthology.org/2008.jeptalnrecital-recital.8</url>
</location>
<part>
<date>2008-06</date>
<extent unit="page">
<start>70</start>
<end>79</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Transducteurs à fenêtre glissante pour l’induction lexicale
%A Scherrer, Yves
%Y Bellot, Patrice
%Y Guénot, Marie-Laure
%S Actes de la 15ème conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
%D 2008
%8 June
%I ATALA
%C Avignon, France
%G French
%F scherrer-2008-transducteurs
%X Nous appliquons différents modèles de similarité graphique à la tâche de l’induction de lexiques bilingues entre un dialecte de Suisse allemande et l’allemand standard. Nous comparons des transducteurs stochastiques utilisant des fenêtres glissantes de 1 à 3 caractères, entraînés à l’aide de l’algorithme de maximisation de l’espérance avec des corpus d’entraînement de tailles différentes. Si les transducteurs à unigrammes donnent des résultats satisfaisants avec des corpus très petits, nous montrons que les transducteurs à bigrammes les dépassent à partir de 750 paires de mots d’entraînement. En général, les modèles entraînés nous ont permis d’améliorer la F-mesure de 7% à 15% par rapport à la distance de Levenshtein.
%U https://aclanthology.org/2008.jeptalnrecital-recital.8
%P 70-79
Markdown (Informal)
[Transducteurs à fenêtre glissante pour l’induction lexicale](https://aclanthology.org/2008.jeptalnrecital-recital.8) (Scherrer, JEP/TALN/RECITAL 2008)
ACL