@inproceedings{boyer-neveol-2018-detection,
title = "D{\'e}tection automatique de phrases en domaine de sp{\'e}cialit{\'e} en fran{\c{c}}ais (Sentence boundary detection for specialized domains in {F}rench )",
author = "Boyer, Arthur and
N{\'e}v{\'e}ol, Aur{\'e}lie",
editor = "S{\'e}billot, Pascale and
Claveau, Vincent",
booktitle = "Actes de la Conf{\'e}rence TALN. Volume 1 - Articles longs, articles courts de TALN",
month = "5",
year = "2018",
address = "Rennes, France",
publisher = "ATALA",
url = "https://aclanthology.org/2018.jeptalnrecital-court.2/",
pages = "205--214",
language = "fra",
abstract = "La d{\'e}tection de fronti{\`e}res de phrase est g{\'e}n{\'e}ralement consid{\'e}r{\'e} comme un probl{\`e}me r{\'e}solu. Cependant, les outils performant sur des textes en domaine g{\'e}n{\'e}ral, ne le sont pas forcement sur des domaines sp{\'e}cialis{\'e}s, ce qui peut engendrer des d{\'e}gradations de performance des outils intervenant en aval dans une cha{\^i}ne de traitement automatique s`appuyant sur des textes d{\'e}coup{\'e}s en phrases. Dans cet article, nous {\'e}valuons 5 outils de segmentation en phrase sur 3 corpus issus de diff{\'e}rent domaines. Nous r{\'e}-entrainerons l`un de ces outils sur un corpus de sp{\'e}cialit{\'e} pour {\'e}tudier l`adaptation en domaine. Notamment, nous utilisons un nouveau corpus biom{\'e}dical annot{\'e} sp{\'e}cifiquement pour cette t{\^a}che. La detection de fronti{\`e}res de phrase {\`a} l`aide d`un mod{\`e}le OpenNLP entra{\^i}n{\'e} sur un corpus clinique offre une F-mesure de .73, contre .66 pour la version standard de l`outil."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="boyer-neveol-2018-detection">
<titleInfo>
<title>Détection automatique de phrases en domaine de spécialité en français (Sentence boundary detection for specialized domains in French )</title>
</titleInfo>
<name type="personal">
<namePart type="given">Arthur</namePart>
<namePart type="family">Boyer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Aurélie</namePart>
<namePart type="family">Névéol</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2018-05</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la Conférence TALN. Volume 1 - Articles longs, articles courts de TALN</title>
</titleInfo>
<name type="personal">
<namePart type="given">Pascale</namePart>
<namePart type="family">Sébillot</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Vincent</namePart>
<namePart type="family">Claveau</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Rennes, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La détection de frontières de phrase est généralement considéré comme un problème résolu. Cependant, les outils performant sur des textes en domaine général, ne le sont pas forcement sur des domaines spécialisés, ce qui peut engendrer des dégradations de performance des outils intervenant en aval dans une chaîne de traitement automatique s‘appuyant sur des textes découpés en phrases. Dans cet article, nous évaluons 5 outils de segmentation en phrase sur 3 corpus issus de différent domaines. Nous ré-entrainerons l‘un de ces outils sur un corpus de spécialité pour étudier l‘adaptation en domaine. Notamment, nous utilisons un nouveau corpus biomédical annoté spécifiquement pour cette tâche. La detection de frontières de phrase à l‘aide d‘un modèle OpenNLP entraîné sur un corpus clinique offre une F-mesure de .73, contre .66 pour la version standard de l‘outil.</abstract>
<identifier type="citekey">boyer-neveol-2018-detection</identifier>
<location>
<url>https://aclanthology.org/2018.jeptalnrecital-court.2/</url>
</location>
<part>
<date>2018-5</date>
<extent unit="page">
<start>205</start>
<end>214</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Détection automatique de phrases en domaine de spécialité en français (Sentence boundary detection for specialized domains in French )
%A Boyer, Arthur
%A Névéol, Aurélie
%Y Sébillot, Pascale
%Y Claveau, Vincent
%S Actes de la Conférence TALN. Volume 1 - Articles longs, articles courts de TALN
%D 2018
%8 May
%I ATALA
%C Rennes, France
%G fra
%F boyer-neveol-2018-detection
%X La détection de frontières de phrase est généralement considéré comme un problème résolu. Cependant, les outils performant sur des textes en domaine général, ne le sont pas forcement sur des domaines spécialisés, ce qui peut engendrer des dégradations de performance des outils intervenant en aval dans une chaîne de traitement automatique s‘appuyant sur des textes découpés en phrases. Dans cet article, nous évaluons 5 outils de segmentation en phrase sur 3 corpus issus de différent domaines. Nous ré-entrainerons l‘un de ces outils sur un corpus de spécialité pour étudier l‘adaptation en domaine. Notamment, nous utilisons un nouveau corpus biomédical annoté spécifiquement pour cette tâche. La detection de frontières de phrase à l‘aide d‘un modèle OpenNLP entraîné sur un corpus clinique offre une F-mesure de .73, contre .66 pour la version standard de l‘outil.
%U https://aclanthology.org/2018.jeptalnrecital-court.2/
%P 205-214
Markdown (Informal)
[Détection automatique de phrases en domaine de spécialité en français (Sentence boundary detection for specialized domains in French )](https://aclanthology.org/2018.jeptalnrecital-court.2/) (Boyer & Névéol, JEP/TALN/RECITAL 2018)
ACL