@inproceedings{zweigenbaum-lavergne-2017-detection,
title = "D{\'e}tection de concepts et granularit{\'e} de l`annotation (Concept detection and annotation granularity )",
author = "Zweigenbaum, Pierre and
Lavergne, Thomas",
editor = "Eshkol-Taravella, Iris and
Antoine, Jean-Yves",
booktitle = "Actes des 24{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts",
month = "6",
year = "2017",
address = "Orl{\'e}ans, France",
publisher = "ATALA",
url = "https://aclanthology.org/2017.jeptalnrecital-court.28/",
pages = "226--233",
language = "fra",
abstract = "Nous nous int{\'e}ressons ici {\`a} une t{\^a}che de d{\'e}tection de concepts dans des textes sans exigence particuli{\`e}re de passage par une phase de d{\'e}tection d`entit{\'e}s avec leurs fronti{\`e}res. Il s`agit donc d`une t{\^a}che de cat{\'e}gorisation de textes multi{\'e}tiquette, avec des jeux de donn{\'e}es annot{\'e}s au niveau des textes entiers. Nous faisons l`hypoth{\`e}se qu`une annotation {\`a} un niveau de granularit{\'e} plus fin, typiquement au niveau de l'{\'e}nonc{\'e}, devrait am{\'e}liorer la performance d`un d{\'e}tecteur automatique entra{\^i}n{\'e} sur ces donn{\'e}es. Nous examinons cette hypoth{\`e}se dans le cas de textes courts particuliers : des certificats de d{\'e}c{\`e}s o{\`u} l`on cherche {\`a} reconna{\^i}tre des diagnostics, avec des jeux de donn{\'e}es initialement annot{\'e}s au niveau du certificat entier. Nous constatons qu`une annotation au niveau de la {\guillemotleft} ligne {\guillemotright} am{\'e}liore effectivement les r{\'e}sultats, mais aussi que le simple fait d`appliquer au niveau de la ligne un classifieur entra{\^i}n{\'e} au niveau du texte est d{\'e}j{\`a} une source d`am{\'e}lioration."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="zweigenbaum-lavergne-2017-detection">
<titleInfo>
<title>Détection de concepts et granularité de l‘annotation (Concept detection and annotation granularity )</title>
</titleInfo>
<name type="personal">
<namePart type="given">Pierre</namePart>
<namePart type="family">Zweigenbaum</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thomas</namePart>
<namePart type="family">Lavergne</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2017-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts</title>
</titleInfo>
<name type="personal">
<namePart type="given">Iris</namePart>
<namePart type="family">Eshkol-Taravella</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jean-Yves</namePart>
<namePart type="family">Antoine</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Orléans, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous nous intéressons ici à une tâche de détection de concepts dans des textes sans exigence particulière de passage par une phase de détection d‘entités avec leurs frontières. Il s‘agit donc d‘une tâche de catégorisation de textes multiétiquette, avec des jeux de données annotés au niveau des textes entiers. Nous faisons l‘hypothèse qu‘une annotation à un niveau de granularité plus fin, typiquement au niveau de l’énoncé, devrait améliorer la performance d‘un détecteur automatique entraîné sur ces données. Nous examinons cette hypothèse dans le cas de textes courts particuliers : des certificats de décès où l‘on cherche à reconnaître des diagnostics, avec des jeux de données initialement annotés au niveau du certificat entier. Nous constatons qu‘une annotation au niveau de la \guillemotleft ligne \guillemotright améliore effectivement les résultats, mais aussi que le simple fait d‘appliquer au niveau de la ligne un classifieur entraîné au niveau du texte est déjà une source d‘amélioration.</abstract>
<identifier type="citekey">zweigenbaum-lavergne-2017-detection</identifier>
<location>
<url>https://aclanthology.org/2017.jeptalnrecital-court.28/</url>
</location>
<part>
<date>2017-6</date>
<extent unit="page">
<start>226</start>
<end>233</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Détection de concepts et granularité de l‘annotation (Concept detection and annotation granularity )
%A Zweigenbaum, Pierre
%A Lavergne, Thomas
%Y Eshkol-Taravella, Iris
%Y Antoine, Jean-Yves
%S Actes des 24ème Conférence sur le Traitement Automatique des Langues Naturelles. Volume 2 - Articles courts
%D 2017
%8 June
%I ATALA
%C Orléans, France
%G fra
%F zweigenbaum-lavergne-2017-detection
%X Nous nous intéressons ici à une tâche de détection de concepts dans des textes sans exigence particulière de passage par une phase de détection d‘entités avec leurs frontières. Il s‘agit donc d‘une tâche de catégorisation de textes multiétiquette, avec des jeux de données annotés au niveau des textes entiers. Nous faisons l‘hypothèse qu‘une annotation à un niveau de granularité plus fin, typiquement au niveau de l’énoncé, devrait améliorer la performance d‘un détecteur automatique entraîné sur ces données. Nous examinons cette hypothèse dans le cas de textes courts particuliers : des certificats de décès où l‘on cherche à reconnaître des diagnostics, avec des jeux de données initialement annotés au niveau du certificat entier. Nous constatons qu‘une annotation au niveau de la \guillemotleft ligne \guillemotright améliore effectivement les résultats, mais aussi que le simple fait d‘appliquer au niveau de la ligne un classifieur entraîné au niveau du texte est déjà une source d‘amélioration.
%U https://aclanthology.org/2017.jeptalnrecital-court.28/
%P 226-233
Markdown (Informal)
[Détection de concepts et granularité de l’annotation (Concept detection and annotation granularity )](https://aclanthology.org/2017.jeptalnrecital-court.28/) (Zweigenbaum & Lavergne, JEP/TALN/RECITAL 2017)
ACL