@inproceedings{sagot-2017-construction,
title = "Construction automatique d{'}une base de donn{\'e}es {\'e}tymologiques {\`a} partir du wiktionary (Automatic construction of an etymological database using {W}iktionary)",
author = "Sagot, Beno{\^\i}t",
editor = "Eshkol-Taravella, Iris and
Antoine, Jean-Yves",
booktitle = "Actes des 24{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 1 - Articles longs",
month = "6",
year = "2017",
address = "Orl{\'e}ans, France",
publisher = "ATALA",
url = "https://aclanthology.org/2017.jeptalnrecital-long.12",
pages = "169--181",
abstract = "Les ressources lexicales {\'e}lectroniques ne contiennent quasiment jamais d{'}informations {\'e}tymologiques. De telles informations, convenablement formalis{\'e}es, permettraient pourtant de d{\'e}velopper des outils automatiques au service de la linguistique historique et comparative, ainsi que d{'}am{\'e}liorer significativement le traitement automatique de langues anciennes. Nous d{\'e}crivons ici le processus que nous avons mis en {\oe}uvre pour extraire des donn{\'e}es {\'e}tymologiques {\`a} partir des notices {\'e}tymologiques du wiktionary, r{\'e}dig{\'e}es en anglais. Nous avons ainsi produit une base multilingue de pr{\`e}s d{'}un million de lex{\`e}mes et une base de plus d{'}un demi-million de relations {\'e}tymologiques entre lex{\`e}mes.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="sagot-2017-construction">
<titleInfo>
<title>Construction automatique d’une base de données étymologiques à partir du wiktionary (Automatic construction of an etymological database using Wiktionary)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Benoît</namePart>
<namePart type="family">Sagot</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2017-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 - Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Iris</namePart>
<namePart type="family">Eshkol-Taravella</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jean-Yves</namePart>
<namePart type="family">Antoine</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Orléans, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les ressources lexicales électroniques ne contiennent quasiment jamais d’informations étymologiques. De telles informations, convenablement formalisées, permettraient pourtant de développer des outils automatiques au service de la linguistique historique et comparative, ainsi que d’améliorer significativement le traitement automatique de langues anciennes. Nous décrivons ici le processus que nous avons mis en øeuvre pour extraire des données étymologiques à partir des notices étymologiques du wiktionary, rédigées en anglais. Nous avons ainsi produit une base multilingue de près d’un million de lexèmes et une base de plus d’un demi-million de relations étymologiques entre lexèmes.</abstract>
<identifier type="citekey">sagot-2017-construction</identifier>
<location>
<url>https://aclanthology.org/2017.jeptalnrecital-long.12</url>
</location>
<part>
<date>2017-6</date>
<extent unit="page">
<start>169</start>
<end>181</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Construction automatique d’une base de données étymologiques à partir du wiktionary (Automatic construction of an etymological database using Wiktionary)
%A Sagot, Benoît
%Y Eshkol-Taravella, Iris
%Y Antoine, Jean-Yves
%S Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 1 - Articles longs
%D 2017
%8 June
%I ATALA
%C Orléans, France
%G French
%F sagot-2017-construction
%X Les ressources lexicales électroniques ne contiennent quasiment jamais d’informations étymologiques. De telles informations, convenablement formalisées, permettraient pourtant de développer des outils automatiques au service de la linguistique historique et comparative, ainsi que d’améliorer significativement le traitement automatique de langues anciennes. Nous décrivons ici le processus que nous avons mis en øeuvre pour extraire des données étymologiques à partir des notices étymologiques du wiktionary, rédigées en anglais. Nous avons ainsi produit une base multilingue de près d’un million de lexèmes et une base de plus d’un demi-million de relations étymologiques entre lexèmes.
%U https://aclanthology.org/2017.jeptalnrecital-long.12
%P 169-181
Markdown (Informal)
[Construction automatique d’une base de données étymologiques à partir du wiktionary (Automatic construction of an etymological database using Wiktionary)](https://aclanthology.org/2017.jeptalnrecital-long.12) (Sagot, JEP/TALN/RECITAL 2017)
ACL