@inproceedings{claveau-kijak-2015-strategies,
title = "Strat{\'e}gies de s{\'e}lection des exemples pour l{'}apprentissage actif avec des champs al{\'e}atoires conditionnels",
author = "Claveau, Vincent and
Kijak, Ewa",
editor = "Lecarpentier, Jean-Marc and
Lucas, Nadine",
booktitle = "Actes de la 22e conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2015",
address = "Caen, France",
publisher = "ATALA",
url = "https://aclanthology.org/2015.jeptalnrecital-long.2",
pages = "13--24",
abstract = {Beaucoup de probl{\`e}mes de TAL sont d{\'e}sormais mod{\'e}lis{\'e}s comme des t{\^a}ches d{'}apprentissage supervis{\'e}. De ce fait, le co{\^u}t des annotations des exemples par l{'}expert repr{\'e}sente un probl{\`e}me important. L{'}apprentissage actif (active learning) apporte un cadre {\`a} ce probl{\`e}me, permettant de contr{\^o}ler le co{\^u}t d{'}annotation tout en maximisant, on l{'}esp{\`e}re, la performance de la t{\^a}che vis{\'e}e, mais repose sur le choix difficile des exemples {\`a} soumettre {\`a} l{'}expert. Dans cet article, nous examinons et proposons des strat{\'e}gies de s{\'e}lection des exemples pour le cas sp{\'e}cifique des champs al{\'e}atoires conditionnels (Conditional Random Fields, CRF), outil largement utilis{\'e} en TAL. Nous proposons d{'}une part une m{\'e}thode simple corrigeant un biais de certaines m{\'e}thodes de l{'}{\'e}tat de l{'}art. D{'}autre part, nous d{\'e}taillons une m{\'e}thode originale de s{\'e}lection s{'}appuyant sur un crit{\`e}re de respect des proportions dans les jeux de donn{\'e}es manipul{\'e}s. Le bien- fond{\'e} de ces propositions est v{\'e}rifi{\'e} au travers de plusieurs t{\^a}ches et jeux de donn{\'e}es, incluant reconnaissance d{'}entit{\'e}s nomm{\'e}es, chunking, phon{\'e}tisation, d{\'e}sambigu{\"\i}sation de sens.},
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="claveau-kijak-2015-strategies">
<titleInfo>
<title>Stratégies de sélection des exemples pour l’apprentissage actif avec des champs aléatoires conditionnels</title>
</titleInfo>
<name type="personal">
<namePart type="given">Vincent</namePart>
<namePart type="family">Claveau</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Ewa</namePart>
<namePart type="family">Kijak</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2015-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Jean-Marc</namePart>
<namePart type="family">Lecarpentier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nadine</namePart>
<namePart type="family">Lucas</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Caen, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Beaucoup de problèmes de TAL sont désormais modélisés comme des tâches d’apprentissage supervisé. De ce fait, le coût des annotations des exemples par l’expert représente un problème important. L’apprentissage actif (active learning) apporte un cadre à ce problème, permettant de contrôler le coût d’annotation tout en maximisant, on l’espère, la performance de la tâche visée, mais repose sur le choix difficile des exemples à soumettre à l’expert. Dans cet article, nous examinons et proposons des stratégies de sélection des exemples pour le cas spécifique des champs aléatoires conditionnels (Conditional Random Fields, CRF), outil largement utilisé en TAL. Nous proposons d’une part une méthode simple corrigeant un biais de certaines méthodes de l’état de l’art. D’autre part, nous détaillons une méthode originale de sélection s’appuyant sur un critère de respect des proportions dans les jeux de données manipulés. Le bien- fondé de ces propositions est vérifié au travers de plusieurs tâches et jeux de données, incluant reconnaissance d’entités nommées, chunking, phonétisation, désambiguïsation de sens.</abstract>
<identifier type="citekey">claveau-kijak-2015-strategies</identifier>
<location>
<url>https://aclanthology.org/2015.jeptalnrecital-long.2</url>
</location>
<part>
<date>2015-06</date>
<extent unit="page">
<start>13</start>
<end>24</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Stratégies de sélection des exemples pour l’apprentissage actif avec des champs aléatoires conditionnels
%A Claveau, Vincent
%A Kijak, Ewa
%Y Lecarpentier, Jean-Marc
%Y Lucas, Nadine
%S Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2015
%8 June
%I ATALA
%C Caen, France
%F claveau-kijak-2015-strategies
%X Beaucoup de problèmes de TAL sont désormais modélisés comme des tâches d’apprentissage supervisé. De ce fait, le coût des annotations des exemples par l’expert représente un problème important. L’apprentissage actif (active learning) apporte un cadre à ce problème, permettant de contrôler le coût d’annotation tout en maximisant, on l’espère, la performance de la tâche visée, mais repose sur le choix difficile des exemples à soumettre à l’expert. Dans cet article, nous examinons et proposons des stratégies de sélection des exemples pour le cas spécifique des champs aléatoires conditionnels (Conditional Random Fields, CRF), outil largement utilisé en TAL. Nous proposons d’une part une méthode simple corrigeant un biais de certaines méthodes de l’état de l’art. D’autre part, nous détaillons une méthode originale de sélection s’appuyant sur un critère de respect des proportions dans les jeux de données manipulés. Le bien- fondé de ces propositions est vérifié au travers de plusieurs tâches et jeux de données, incluant reconnaissance d’entités nommées, chunking, phonétisation, désambiguïsation de sens.
%U https://aclanthology.org/2015.jeptalnrecital-long.2
%P 13-24
Markdown (Informal)
[Stratégies de sélection des exemples pour l’apprentissage actif avec des champs aléatoires conditionnels](https://aclanthology.org/2015.jeptalnrecital-long.2) (Claveau & Kijak, JEP/TALN/RECITAL 2015)
ACL