@inproceedings{granet-etal-2018-decodeur,
title = "D{\'e}codeur neuronal pour la transcription de documents manuscrits anciens (Neural decoder for the transcription of historical handwritten documents)",
author = "Granet, Adeline and
Morin, Emmanuel and
Mouch{\`e}re, Harold and
Quiniou, Solen and
Viard-Gaudin, Christian",
editor = "S{\'e}billot, Pascale and
Claveau, Vincent",
booktitle = "Actes de la Conf{\'e}rence TALN. Volume 1 - Articles longs, articles courts de TALN",
month = "5",
year = "2018",
address = "Rennes, France",
publisher = "ATALA",
url = "https://aclanthology.org/2018.jeptalnrecital-long.14",
pages = "183--195",
abstract = "L{'}absence de donn{\'e}es annot{\'e}es peut {\^e}tre une difficult{\'e} majeure lorsque l{'}on s{'}int{\'e}resse {\`a} l{'}analyse de documents manuscrits anciens. Pour contourner cette difficult{\'e}, nous proposons de diviser le probl{\`e}me en deux, afin de pouvoir s{'}appuyer sur des donn{\'e}es plus facilement accessibles. Dans cet article nous pr{\'e}sentons la partie d{\'e}codeur d{'}un encodeur-d{\'e}codeur multimodal utilisant l{'}apprentissage par transfert de connaissances pour la transcription des titres de pi{\`e}ces de la Com{\'e}die Italienne. Le d{\'e}codeur transforme un vecteur de n-grammes au niveau caract{\`e}res en une s{\'e}quence de caract{\`e}res correspondant {\`a} un mot. L{'}apprentissage par transfert de connaissances est r{\'e}alis{\'e} principalement {\`a} partir d{'}une nouvelle ressource inexploit{\'e}e contemporaine {\`a} la Com{\'e}die-Italienne et th{\'e}matiquement proche ; ainsi que d{'}autres ressources couvrant d{'}autres domaines, des langages diff{\'e}rents et m{\^e}me des p{\'e}riodes diff{\'e}rentes. Nous obtenons 97,27{\%} de caract{\`e}res bien reconnus sur les donn{\'e}es de la Com{\'e}die-Italienne, ainsi que 86,57{\%} de mots correctement g{\'e}n{\'e}r{\'e}s malgr{\'e} une couverture de 67,58{\%} uniquement entre la Com{\'e}die-Italienne et l{'}ensemble d{'}apprentissage. Les exp{\'e}riences montrent qu{'}un tel syst{\`e}me peut {\^e}tre une approche efficace dans le cadre d{'}apprentissage par transfert.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="granet-etal-2018-decodeur">
<titleInfo>
<title>Décodeur neuronal pour la transcription de documents manuscrits anciens (Neural decoder for the transcription of historical handwritten documents)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Adeline</namePart>
<namePart type="family">Granet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Emmanuel</namePart>
<namePart type="family">Morin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Harold</namePart>
<namePart type="family">Mouchère</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Solen</namePart>
<namePart type="family">Quiniou</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Christian</namePart>
<namePart type="family">Viard-Gaudin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2018-05</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la Conférence TALN. Volume 1 - Articles longs, articles courts de TALN</title>
</titleInfo>
<name type="personal">
<namePart type="given">Pascale</namePart>
<namePart type="family">Sébillot</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Vincent</namePart>
<namePart type="family">Claveau</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Rennes, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>L’absence de données annotées peut être une difficulté majeure lorsque l’on s’intéresse à l’analyse de documents manuscrits anciens. Pour contourner cette difficulté, nous proposons de diviser le problème en deux, afin de pouvoir s’appuyer sur des données plus facilement accessibles. Dans cet article nous présentons la partie décodeur d’un encodeur-décodeur multimodal utilisant l’apprentissage par transfert de connaissances pour la transcription des titres de pièces de la Comédie Italienne. Le décodeur transforme un vecteur de n-grammes au niveau caractères en une séquence de caractères correspondant à un mot. L’apprentissage par transfert de connaissances est réalisé principalement à partir d’une nouvelle ressource inexploitée contemporaine à la Comédie-Italienne et thématiquement proche ; ainsi que d’autres ressources couvrant d’autres domaines, des langages différents et même des périodes différentes. Nous obtenons 97,27% de caractères bien reconnus sur les données de la Comédie-Italienne, ainsi que 86,57% de mots correctement générés malgré une couverture de 67,58% uniquement entre la Comédie-Italienne et l’ensemble d’apprentissage. Les expériences montrent qu’un tel système peut être une approche efficace dans le cadre d’apprentissage par transfert.</abstract>
<identifier type="citekey">granet-etal-2018-decodeur</identifier>
<location>
<url>https://aclanthology.org/2018.jeptalnrecital-long.14</url>
</location>
<part>
<date>2018-5</date>
<extent unit="page">
<start>183</start>
<end>195</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Décodeur neuronal pour la transcription de documents manuscrits anciens (Neural decoder for the transcription of historical handwritten documents)
%A Granet, Adeline
%A Morin, Emmanuel
%A Mouchère, Harold
%A Quiniou, Solen
%A Viard-Gaudin, Christian
%Y Sébillot, Pascale
%Y Claveau, Vincent
%S Actes de la Conférence TALN. Volume 1 - Articles longs, articles courts de TALN
%D 2018
%8 May
%I ATALA
%C Rennes, France
%G French
%F granet-etal-2018-decodeur
%X L’absence de données annotées peut être une difficulté majeure lorsque l’on s’intéresse à l’analyse de documents manuscrits anciens. Pour contourner cette difficulté, nous proposons de diviser le problème en deux, afin de pouvoir s’appuyer sur des données plus facilement accessibles. Dans cet article nous présentons la partie décodeur d’un encodeur-décodeur multimodal utilisant l’apprentissage par transfert de connaissances pour la transcription des titres de pièces de la Comédie Italienne. Le décodeur transforme un vecteur de n-grammes au niveau caractères en une séquence de caractères correspondant à un mot. L’apprentissage par transfert de connaissances est réalisé principalement à partir d’une nouvelle ressource inexploitée contemporaine à la Comédie-Italienne et thématiquement proche ; ainsi que d’autres ressources couvrant d’autres domaines, des langages différents et même des périodes différentes. Nous obtenons 97,27% de caractères bien reconnus sur les données de la Comédie-Italienne, ainsi que 86,57% de mots correctement générés malgré une couverture de 67,58% uniquement entre la Comédie-Italienne et l’ensemble d’apprentissage. Les expériences montrent qu’un tel système peut être une approche efficace dans le cadre d’apprentissage par transfert.
%U https://aclanthology.org/2018.jeptalnrecital-long.14
%P 183-195
Markdown (Informal)
[Décodeur neuronal pour la transcription de documents manuscrits anciens (Neural decoder for the transcription of historical handwritten documents)](https://aclanthology.org/2018.jeptalnrecital-long.14) (Granet et al., JEP/TALN/RECITAL 2018)
ACL