@inproceedings{gosme-lepage-2011-structure,
title = "Structure des trigrammes inconnus et lissage par analogie (Structure of unknown trigrams and smoothing by analogy)",
author = "Gosme, Julien and
Lepage, Yves",
editor = "Lafourcade, Mathieu and
Prince, Violaine",
booktitle = "Actes de la 18e conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2011",
address = "Montpellier, France",
publisher = "ATALA",
url = "https://aclanthology.org/2011.jeptalnrecital-long.25",
pages = "282--293",
abstract = "Nous montrons dans une s{\'e}rie d{'}exp{\'e}riences sur quatre langues, sur des {\'e}chantillons du corpus Europarl, que, dans leur grande majorit{\'e}, les trigrammes inconnus d{'}un jeu de test peuvent {\^e}tre reconstruits par analogie avec des trigrammes hapax du corpus d{'}entra{\^\i}nement. De ce r{\'e}sultat, nous d{\'e}rivons une m{\'e}thode de lissage simple pour les mod{\`e}les de langue par trigrammes et obtenons de meilleurs r{\'e}sultats que les lissages de Witten-Bell, Good-Turing et Kneser-Ney dans des exp{\'e}riences men{\'e}es en onze langues sur la partie commune d{'}Europarl, sauf pour le finnois et, dans une moindre mesure, le fran{\c{c}}ais.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="gosme-lepage-2011-structure">
<titleInfo>
<title>Structure des trigrammes inconnus et lissage par analogie (Structure of unknown trigrams and smoothing by analogy)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Gosme</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Yves</namePart>
<namePart type="family">Lepage</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2011-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Lafourcade</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Violaine</namePart>
<namePart type="family">Prince</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Montpellier, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous montrons dans une série d’expériences sur quatre langues, sur des échantillons du corpus Europarl, que, dans leur grande majorité, les trigrammes inconnus d’un jeu de test peuvent être reconstruits par analogie avec des trigrammes hapax du corpus d’entraînement. De ce résultat, nous dérivons une méthode de lissage simple pour les modèles de langue par trigrammes et obtenons de meilleurs résultats que les lissages de Witten-Bell, Good-Turing et Kneser-Ney dans des expériences menées en onze langues sur la partie commune d’Europarl, sauf pour le finnois et, dans une moindre mesure, le français.</abstract>
<identifier type="citekey">gosme-lepage-2011-structure</identifier>
<location>
<url>https://aclanthology.org/2011.jeptalnrecital-long.25</url>
</location>
<part>
<date>2011-06</date>
<extent unit="page">
<start>282</start>
<end>293</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Structure des trigrammes inconnus et lissage par analogie (Structure of unknown trigrams and smoothing by analogy)
%A Gosme, Julien
%A Lepage, Yves
%Y Lafourcade, Mathieu
%Y Prince, Violaine
%S Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2011
%8 June
%I ATALA
%C Montpellier, France
%G French
%F gosme-lepage-2011-structure
%X Nous montrons dans une série d’expériences sur quatre langues, sur des échantillons du corpus Europarl, que, dans leur grande majorité, les trigrammes inconnus d’un jeu de test peuvent être reconstruits par analogie avec des trigrammes hapax du corpus d’entraînement. De ce résultat, nous dérivons une méthode de lissage simple pour les modèles de langue par trigrammes et obtenons de meilleurs résultats que les lissages de Witten-Bell, Good-Turing et Kneser-Ney dans des expériences menées en onze langues sur la partie commune d’Europarl, sauf pour le finnois et, dans une moindre mesure, le français.
%U https://aclanthology.org/2011.jeptalnrecital-long.25
%P 282-293
Markdown (Informal)
[Structure des trigrammes inconnus et lissage par analogie (Structure of unknown trigrams and smoothing by analogy)](https://aclanthology.org/2011.jeptalnrecital-long.25) (Gosme & Lepage, JEP/TALN/RECITAL 2011)
ACL