@inproceedings{mathieu-2023-construction,
title = "Construction d{'}un jeu de donn{\'e}es de publications scientifiques pour le {TAL} et la fouille de textes {\`a} partir d{'}{ISTEX}",
author = "Mathieu, Constant",
editor = {Boudin, Florian and
Daille, B{\'e}atrice and
Dufour, Richard and
El, Oumaima and
Houbre, Ma{\"e}l and
Jourdan, L{\'e}ane and
Kooli, Nihel},
booktitle = "Actes de CORIA-TALN 2023. Actes de l'atelier ``Analyse et Recherche de Textes Scientifiques'' (ARTS)@TALN 2023",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://aclanthology.org/2023.jeptalnrecital-arts.13",
pages = "79--79",
abstract = "La plateforme ISTEX (https://www.istex.fr/) permet d{'}acc{\'e}der {\`a} une large base d{'}archives scientifiques comptant plus de 25 millions de documents de tous les grands domaines scientifiques. Les documents incluent non seulement les m{\'e}tadonn{\'e}es mais aussi le texte plein, et ont {\'e}t{\'e} pr{\'e}trait{\'e}s de mani{\`e}re homog{\`e}ne pour faciliter leur traitement automatique. Dans cet expos{\'e}, nous pr{\'e}senterons une initiative pour cr{\'e}er une dynamique de recherche en TAL et TDM autour de ces donn{\'e}es. En particulier, nous pr{\'e}senterons les travaux en cours pour la construction d{'}un jeu de donn{\'e}es d{\'e}di{\'e} au TAL et la fouille de textes.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="mathieu-2023-construction">
<titleInfo>
<title>Construction d’un jeu de données de publications scientifiques pour le TAL et la fouille de textes à partir d’ISTEX</title>
</titleInfo>
<name type="personal">
<namePart type="given">Constant</namePart>
<namePart type="family">Mathieu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2023-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de CORIA-TALN 2023. Actes de l’atelier “Analyse et Recherche de Textes Scientifiques” (ARTS)@TALN 2023</title>
</titleInfo>
<name type="personal">
<namePart type="given">Florian</namePart>
<namePart type="family">Boudin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Béatrice</namePart>
<namePart type="family">Daille</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Richard</namePart>
<namePart type="family">Dufour</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Oumaima</namePart>
<namePart type="family">El</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Maël</namePart>
<namePart type="family">Houbre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Léane</namePart>
<namePart type="family">Jourdan</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nihel</namePart>
<namePart type="family">Kooli</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La plateforme ISTEX (https://www.istex.fr/) permet d’accéder à une large base d’archives scientifiques comptant plus de 25 millions de documents de tous les grands domaines scientifiques. Les documents incluent non seulement les métadonnées mais aussi le texte plein, et ont été prétraités de manière homogène pour faciliter leur traitement automatique. Dans cet exposé, nous présenterons une initiative pour créer une dynamique de recherche en TAL et TDM autour de ces données. En particulier, nous présenterons les travaux en cours pour la construction d’un jeu de données dédié au TAL et la fouille de textes.</abstract>
<identifier type="citekey">mathieu-2023-construction</identifier>
<location>
<url>https://aclanthology.org/2023.jeptalnrecital-arts.13</url>
</location>
<part>
<date>2023-6</date>
<extent unit="page">
<start>79</start>
<end>79</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Construction d’un jeu de données de publications scientifiques pour le TAL et la fouille de textes à partir d’ISTEX
%A Mathieu, Constant
%Y Boudin, Florian
%Y Daille, Béatrice
%Y Dufour, Richard
%Y El, Oumaima
%Y Houbre, Maël
%Y Jourdan, Léane
%Y Kooli, Nihel
%S Actes de CORIA-TALN 2023. Actes de l’atelier “Analyse et Recherche de Textes Scientifiques” (ARTS)@TALN 2023
%D 2023
%8 June
%I ATALA
%C Paris, France
%G French
%F mathieu-2023-construction
%X La plateforme ISTEX (https://www.istex.fr/) permet d’accéder à une large base d’archives scientifiques comptant plus de 25 millions de documents de tous les grands domaines scientifiques. Les documents incluent non seulement les métadonnées mais aussi le texte plein, et ont été prétraités de manière homogène pour faciliter leur traitement automatique. Dans cet exposé, nous présenterons une initiative pour créer une dynamique de recherche en TAL et TDM autour de ces données. En particulier, nous présenterons les travaux en cours pour la construction d’un jeu de données dédié au TAL et la fouille de textes.
%U https://aclanthology.org/2023.jeptalnrecital-arts.13
%P 79-79
Markdown (Informal)
[Construction d’un jeu de données de publications scientifiques pour le TAL et la fouille de textes à partir d’ISTEX](https://aclanthology.org/2023.jeptalnrecital-arts.13) (Mathieu, JEP/TALN/RECITAL 2023)
ACL