@inproceedings{leonard-etal-2025-elitec,
title = "{ELITEC} : un corpus de conversations en microposts fran{\c{c}}ais annot{\'e} pour le liage d{'}entit{\'e}s {W}ikidata",
author = "Leonard, Vivien and
Markhoff, B{\'e}atrice and
Antoine, Jean-Yves",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 32{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-taln.17/",
pages = "284--294",
language = "fra",
abstract = "Nous pr{\'e}sentons un corpus de microposts en fran{\c{c}}ais pour l'{\'e}valuation de la t{\^a}che de liage des mentions pr{\'e}sentes dans le texte {\`a} des entit{\'e}s de Wikidata. Ce corpus est annot{\'e} {\`a} la fois pour la reconnaissance des mentions (Named Entity Recognition - NER) et leur liaison {\`a} des entit{\'e}s de Wikidata (Entity Linking - EL). Il s{'}agit d{'}une collection de 2 500 microposts, cibl{\'e}s sur des termes li{\'e}s {\`a} la vie en ville et regroup{\'e}s en 618 conversations. Construit en suivant les conventions d{'}annotation de Impresso-Quaero, ce corpus a {\'e}t{\'e} pseudo-anonymis{\'e} afin d'{\^e}tre mis librement {\`a} disposition de la communaut{\'e}. Nomm{\'e} ELITEC (EL for mIcroposTs in FrEnCh), son objectif est de compl{\'e}ter les ressources sp{\'e}cifiques au fran{\c{c}}ais. ELITEC sert de base de tests pour les t{\^a}ches NER et EL, et nous l{'}avons utilis{\'e} pour l'{\'e}valuation d{'}un syst{\`e}me d{'}EL que nous avons d{\'e}velopp{\'e}."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="leonard-etal-2025-elitec">
<titleInfo>
<title>ELITEC : un corpus de conversations en microposts français annoté pour le liage d’entités Wikidata</title>
</titleInfo>
<name type="personal">
<namePart type="given">Vivien</namePart>
<namePart type="family">Leonard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Béatrice</namePart>
<namePart type="family">Markhoff</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jean-Yves</namePart>
<namePart type="family">Antoine</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous présentons un corpus de microposts en français pour l’évaluation de la tâche de liage des mentions présentes dans le texte à des entités de Wikidata. Ce corpus est annoté à la fois pour la reconnaissance des mentions (Named Entity Recognition - NER) et leur liaison à des entités de Wikidata (Entity Linking - EL). Il s’agit d’une collection de 2 500 microposts, ciblés sur des termes liés à la vie en ville et regroupés en 618 conversations. Construit en suivant les conventions d’annotation de Impresso-Quaero, ce corpus a été pseudo-anonymisé afin d’être mis librement à disposition de la communauté. Nommé ELITEC (EL for mIcroposTs in FrEnCh), son objectif est de compléter les ressources spécifiques au français. ELITEC sert de base de tests pour les tâches NER et EL, et nous l’avons utilisé pour l’évaluation d’un système d’EL que nous avons développé.</abstract>
<identifier type="citekey">leonard-etal-2025-elitec</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-taln.17/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>284</start>
<end>294</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T ELITEC : un corpus de conversations en microposts français annoté pour le liage d’entités Wikidata
%A Leonard, Vivien
%A Markhoff, Béatrice
%A Antoine, Jean-Yves
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F leonard-etal-2025-elitec
%X Nous présentons un corpus de microposts en français pour l’évaluation de la tâche de liage des mentions présentes dans le texte à des entités de Wikidata. Ce corpus est annoté à la fois pour la reconnaissance des mentions (Named Entity Recognition - NER) et leur liaison à des entités de Wikidata (Entity Linking - EL). Il s’agit d’une collection de 2 500 microposts, ciblés sur des termes liés à la vie en ville et regroupés en 618 conversations. Construit en suivant les conventions d’annotation de Impresso-Quaero, ce corpus a été pseudo-anonymisé afin d’être mis librement à disposition de la communauté. Nommé ELITEC (EL for mIcroposTs in FrEnCh), son objectif est de compléter les ressources spécifiques au français. ELITEC sert de base de tests pour les tâches NER et EL, et nous l’avons utilisé pour l’évaluation d’un système d’EL que nous avons développé.
%U https://aclanthology.org/2025.jeptalnrecital-taln.17/
%P 284-294
Markdown (Informal)
[ELITEC : un corpus de conversations en microposts français annoté pour le liage d’entités Wikidata](https://aclanthology.org/2025.jeptalnrecital-taln.17/) (Leonard et al., JEP/TALN/RECITAL 2025)
ACL