@inproceedings{barbaresi-lejeune-2020-que,
title = "Que rec{\`e}lent les donn{\'e}es textuelles issues du web ? (What do text data from the Web have to hide ?)",
author = {Barbaresi, Adrien and
Lejeune, Ga{\"e}l},
editor = {Adda, Gilles and
Amblard, Maxime and
Fort, Kar{\"e}n},
booktitle = "Actes de la 6e conf{\'e}rence conjointe Journ{\'e}es d'{\'E}tudes sur la Parole (JEP, 33e {\'e}dition), Traitement Automatique des Langues Naturelles (TALN, 27e {\'e}dition), Rencontre des {\'E}tudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (R{\'E}CITAL, 22e {\'e}dition). 2e atelier {\'E}thique et TRaitemeNt Automatique des Langues (ETeRNAL)",
month = "6",
year = "2020",
address = "Nancy, France",
publisher = "ATALA et AFCP",
url = "https://aclanthology.org/2020.jeptalnrecital-eternal.3",
pages = "19--28",
abstract = "La collecte et l{'}usage opportunistes de donn{\'e}es textuelles tir{\'e}es du web sont sujets {\`a} une s{\'e}rie de probl{\`e}mes {\'e}thiques, m{\'e}thodologiques et {\'e}pist{\'e}mologiques qui m{\'e}ritent l{'}attention de la communaut{\'e} scientifique. Nous pr{\'e}sentons des {\'e}tudes empiriques de leur impact en linguistique et TAL centr{\'e}es sur la forme (m{\'e}thodes d{'}extraction des donn{\'e}es) ainsi que sur le fond (contenu des corpus).",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="barbaresi-lejeune-2020-que">
<titleInfo>
<title>Que recèlent les données textuelles issues du web ? (What do text data from the Web have to hide ?)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Adrien</namePart>
<namePart type="family">Barbaresi</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Gaël</namePart>
<namePart type="family">Lejeune</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2020-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 6e conférence conjointe Journées d’Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). 2e atelier Éthique et TRaitemeNt Automatique des Langues (ETeRNAL)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Gilles</namePart>
<namePart type="family">Adda</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Maxime</namePart>
<namePart type="family">Amblard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karën</namePart>
<namePart type="family">Fort</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA et AFCP</publisher>
<place>
<placeTerm type="text">Nancy, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La collecte et l’usage opportunistes de données textuelles tirées du web sont sujets à une série de problèmes éthiques, méthodologiques et épistémologiques qui méritent l’attention de la communauté scientifique. Nous présentons des études empiriques de leur impact en linguistique et TAL centrées sur la forme (méthodes d’extraction des données) ainsi que sur le fond (contenu des corpus).</abstract>
<identifier type="citekey">barbaresi-lejeune-2020-que</identifier>
<location>
<url>https://aclanthology.org/2020.jeptalnrecital-eternal.3</url>
</location>
<part>
<date>2020-6</date>
<extent unit="page">
<start>19</start>
<end>28</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Que recèlent les données textuelles issues du web ? (What do text data from the Web have to hide ?)
%A Barbaresi, Adrien
%A Lejeune, Gaël
%Y Adda, Gilles
%Y Amblard, Maxime
%Y Fort, Karën
%S Actes de la 6e conférence conjointe Journées d’Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). 2e atelier Éthique et TRaitemeNt Automatique des Langues (ETeRNAL)
%D 2020
%8 June
%I ATALA et AFCP
%C Nancy, France
%G French
%F barbaresi-lejeune-2020-que
%X La collecte et l’usage opportunistes de données textuelles tirées du web sont sujets à une série de problèmes éthiques, méthodologiques et épistémologiques qui méritent l’attention de la communauté scientifique. Nous présentons des études empiriques de leur impact en linguistique et TAL centrées sur la forme (méthodes d’extraction des données) ainsi que sur le fond (contenu des corpus).
%U https://aclanthology.org/2020.jeptalnrecital-eternal.3
%P 19-28
Markdown (Informal)
[Que recèlent les données textuelles issues du web ? (What do text data from the Web have to hide ?)](https://aclanthology.org/2020.jeptalnrecital-eternal.3) (Barbaresi & Lejeune, JEP/TALN/RECITAL 2020)
ACL
- Adrien Barbaresi and Gaël Lejeune. 2020. Que recèlent les données textuelles issues du web ? (What do text data from the Web have to hide ?). In Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition). 2e atelier Éthique et TRaitemeNt Automatique des Langues (ETeRNAL), pages 19–28, Nancy, France. ATALA et AFCP.