@inproceedings{miletic-etal-2016-mise,
title = "Mise au point d{'}une m{\'e}thode d{'}annotation morphosyntaxique fine du serbe (Developping a method for detailed morphosyntactic tagging of {S}erbian)",
author = "Miletic, Aleksandra and
Fabre, C{\'e}cile and
Stosic, Dejan",
editor = "Danlos, Laurence and
Hamon, Thierry",
booktitle = "Actes de la conf{\'e}rence conjointe JEP-TALN-RECITAL 2016. volume 2 : TALN (Posters)",
month = "7",
year = "2016",
address = "Paris, France",
publisher = "AFCP - ATALA",
url = "https://aclanthology.org/2016.jeptalnrecital-poster.25",
pages = "506--513",
abstract = "Cet article pr{\'e}sente une exp{\'e}rience d{'}annotation morphosyntaxique fine du volet serbe du corpus parall{\`e}le ParCoLab (corpus serbe-fran{\c{c}}ais-anglais). Elle a consist{\'e} {\`a} enrichir une annotation existante en parties du discours avec des traits morphosyntaxiques fins, afin de pr{\'e}parer une {\'e}tape ult{\'e}rieure de parsing. Nous avons compar{\'e} trois approches : 1) annotation manuelle ; 2) pr{\'e}annotation avec un {\'e}tiqueteur entra{\^\i}n{\'e} sur le croate suivie d{'}une correction manuelle ; 3) r{\'e}entra{\^\i}nement de l{'}outil sur un petit {\'e}chantillon valid{\'e} du corpus, suivi de l{'}annotation automatique et de la correction manuelle. Le mod{\`e}le croate maintient une stabilit{\'e} globale en passant au serbe, mais les diff{\'e}rences entre les deux jeux d{'}{\'e}tiquettes exigent des interventions manuelles importantes. Le mod{\`e}le r{\'e}-entra{\^\i}n{\'e} sur un {\'e}chantillon de taille limit{\'e} (20K tokens) atteint la m{\^e}me exactitude que le mod{\`e}le existant et le gain de temps observ{\'e} montre que cette m{\'e}thode optimise la phase de correction.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="miletic-etal-2016-mise">
<titleInfo>
<title>Mise au point d’une méthode d’annotation morphosyntaxique fine du serbe (Developping a method for detailed morphosyntactic tagging of Serbian)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Aleksandra</namePart>
<namePart type="family">Miletic</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Cécile</namePart>
<namePart type="family">Fabre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Dejan</namePart>
<namePart type="family">Stosic</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2016-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 2 : TALN (Posters)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Laurence</namePart>
<namePart type="family">Danlos</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Hamon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>AFCP - ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Cet article présente une expérience d’annotation morphosyntaxique fine du volet serbe du corpus parallèle ParCoLab (corpus serbe-français-anglais). Elle a consisté à enrichir une annotation existante en parties du discours avec des traits morphosyntaxiques fins, afin de préparer une étape ultérieure de parsing. Nous avons comparé trois approches : 1) annotation manuelle ; 2) préannotation avec un étiqueteur entraîné sur le croate suivie d’une correction manuelle ; 3) réentraînement de l’outil sur un petit échantillon validé du corpus, suivi de l’annotation automatique et de la correction manuelle. Le modèle croate maintient une stabilité globale en passant au serbe, mais les différences entre les deux jeux d’étiquettes exigent des interventions manuelles importantes. Le modèle ré-entraîné sur un échantillon de taille limité (20K tokens) atteint la même exactitude que le modèle existant et le gain de temps observé montre que cette méthode optimise la phase de correction.</abstract>
<identifier type="citekey">miletic-etal-2016-mise</identifier>
<location>
<url>https://aclanthology.org/2016.jeptalnrecital-poster.25</url>
</location>
<part>
<date>2016-7</date>
<extent unit="page">
<start>506</start>
<end>513</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Mise au point d’une méthode d’annotation morphosyntaxique fine du serbe (Developping a method for detailed morphosyntactic tagging of Serbian)
%A Miletic, Aleksandra
%A Fabre, Cécile
%A Stosic, Dejan
%Y Danlos, Laurence
%Y Hamon, Thierry
%S Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 2 : TALN (Posters)
%D 2016
%8 July
%I AFCP - ATALA
%C Paris, France
%G French
%F miletic-etal-2016-mise
%X Cet article présente une expérience d’annotation morphosyntaxique fine du volet serbe du corpus parallèle ParCoLab (corpus serbe-français-anglais). Elle a consisté à enrichir une annotation existante en parties du discours avec des traits morphosyntaxiques fins, afin de préparer une étape ultérieure de parsing. Nous avons comparé trois approches : 1) annotation manuelle ; 2) préannotation avec un étiqueteur entraîné sur le croate suivie d’une correction manuelle ; 3) réentraînement de l’outil sur un petit échantillon validé du corpus, suivi de l’annotation automatique et de la correction manuelle. Le modèle croate maintient une stabilité globale en passant au serbe, mais les différences entre les deux jeux d’étiquettes exigent des interventions manuelles importantes. Le modèle ré-entraîné sur un échantillon de taille limité (20K tokens) atteint la même exactitude que le modèle existant et le gain de temps observé montre que cette méthode optimise la phase de correction.
%U https://aclanthology.org/2016.jeptalnrecital-poster.25
%P 506-513
Markdown (Informal)
[Mise au point d’une méthode d’annotation morphosyntaxique fine du serbe (Developping a method for detailed morphosyntactic tagging of Serbian)](https://aclanthology.org/2016.jeptalnrecital-poster.25) (Miletic et al., JEP/TALN/RECITAL 2016)
ACL