@inproceedings{da-sylva-2010-extraction,
title = "Extraction semi-automatique d{'}un vocabulaire savant de base pour l{'}indexation automatique",
author = "Da Sylva, Lyne",
editor = "Langlais, Philippe and
Gagnon, Michel",
booktitle = "Actes de la 17e conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jul,
year = "2010",
address = "Montr{\'e}al, Canada",
publisher = "ATALA",
url = "https://aclanthology.org/2010.jeptalnrecital-long.37",
pages = "363--372",
abstract = "Le projet d{\'e}crit vise {\`a} soutenir les efforts de constitution de ressources lexicales utiles {\`a} l{'}indexation automatique. Un type de vocabulaire utile {\`a} l{'}indexation est d{\'e}fini, le vocabulaire savant de base, qui peut s{'}articuler avec le vocabulaire sp{\'e}cialis{\'e} pour constituer des entr{\'e}es d{'}index structur{\'e}es. On pr{\'e}sente les r{\'e}sultats d{'} une exp{\'e}rimentation d{'} extraction (semi-)automatique des mots du vocabulaire savant de base {\`a} partir d{'}un corpus cibl{\'e}, constitu{\'e} de r{\'e}sum{\'e}s d{'}articles scientifiques en fran{\c{c}}ais et en anglais. La t{\^a}che d{'}extraction a r{\'e}ussi {\`a} doubler une liste originale constitu{\'e}e manuellement pour le fran{\c{c}}ais. La comparaison est {\'e}tablie avec une exp{\'e}rimentation similaire effectu{\'e}e pour l{'}anglais sur un corpus plus grand et contenant des r{\'e}sum{\'e}s d{'}articles non seulement en sciences pures mais aussi en sciences humaines et sociales.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="da-sylva-2010-extraction">
<titleInfo>
<title>Extraction semi-automatique d’un vocabulaire savant de base pour l’indexation automatique</title>
</titleInfo>
<name type="personal">
<namePart type="given">Lyne</namePart>
<namePart type="family">Da Sylva</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2010-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Philippe</namePart>
<namePart type="family">Langlais</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Michel</namePart>
<namePart type="family">Gagnon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Montréal, Canada</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Le projet décrit vise à soutenir les efforts de constitution de ressources lexicales utiles à l’indexation automatique. Un type de vocabulaire utile à l’indexation est défini, le vocabulaire savant de base, qui peut s’articuler avec le vocabulaire spécialisé pour constituer des entrées d’index structurées. On présente les résultats d’ une expérimentation d’ extraction (semi-)automatique des mots du vocabulaire savant de base à partir d’un corpus ciblé, constitué de résumés d’articles scientifiques en français et en anglais. La tâche d’extraction a réussi à doubler une liste originale constituée manuellement pour le français. La comparaison est établie avec une expérimentation similaire effectuée pour l’anglais sur un corpus plus grand et contenant des résumés d’articles non seulement en sciences pures mais aussi en sciences humaines et sociales.</abstract>
<identifier type="citekey">da-sylva-2010-extraction</identifier>
<location>
<url>https://aclanthology.org/2010.jeptalnrecital-long.37</url>
</location>
<part>
<date>2010-07</date>
<extent unit="page">
<start>363</start>
<end>372</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Extraction semi-automatique d’un vocabulaire savant de base pour l’indexation automatique
%A Da Sylva, Lyne
%Y Langlais, Philippe
%Y Gagnon, Michel
%S Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2010
%8 July
%I ATALA
%C Montréal, Canada
%G French
%F da-sylva-2010-extraction
%X Le projet décrit vise à soutenir les efforts de constitution de ressources lexicales utiles à l’indexation automatique. Un type de vocabulaire utile à l’indexation est défini, le vocabulaire savant de base, qui peut s’articuler avec le vocabulaire spécialisé pour constituer des entrées d’index structurées. On présente les résultats d’ une expérimentation d’ extraction (semi-)automatique des mots du vocabulaire savant de base à partir d’un corpus ciblé, constitué de résumés d’articles scientifiques en français et en anglais. La tâche d’extraction a réussi à doubler une liste originale constituée manuellement pour le français. La comparaison est établie avec une expérimentation similaire effectuée pour l’anglais sur un corpus plus grand et contenant des résumés d’articles non seulement en sciences pures mais aussi en sciences humaines et sociales.
%U https://aclanthology.org/2010.jeptalnrecital-long.37
%P 363-372
Markdown (Informal)
[Extraction semi-automatique d’un vocabulaire savant de base pour l’indexation automatique](https://aclanthology.org/2010.jeptalnrecital-long.37) (Da Sylva, JEP/TALN/RECITAL 2010)
ACL