@inproceedings{wilkens-etal-2024-tcfle,
title = "{TCFLE}-8 : un corpus de productions {\'e}crites d{'}apprenants de fran{\c{c}}ais langue {\'e}trang{\`e}re et son application {\`a} la correction automatis{\'e}e de textes",
author = "Wilkens, Rodrigo and
Pintard, Alice and
Alfter, David and
Folny, Vincent and
Fran{\c{c}}ois, Thomas",
editor = "Balaguer, Mathieu and
Bendahman, Nihed and
Ho-dac, Lydia-Mai and
Mauclair, Julie and
G Moreno, Jose and
Pinquier, Julien",
booktitle = "Actes de la 31{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position",
month = "7",
year = "2024",
address = "Toulouse, France",
publisher = "ATALA and AFPC",
url = "https://aclanthology.org/2024.jeptalnrecital-taln.44",
pages = "677--685",
abstract = "La correction automatis{\'e}e de textes (CAT) vise {\`a} {\'e}valuer automatiquement la qualit{\'e} de textes {\'e}crits. L{'}automatisation permet une {\'e}valuation {\`a} grande {\'e}chelle ainsi qu{'}une am{\'e}lioration de la coh{\'e}rence, de la fiabilit{\'e} et de la normalisation du processus. Ces caract{\'e}ristiques sont particuli{\`e}rement importantes dans le contexte des examens de certification linguistique. Cependant, un goulot d{'}{\'e}tranglement majeur dans le d{\'e}veloppement des syst{\`e}mes CAT est la disponibilit{\'e} des corpus. Dans cet article, nous visons {\`a} encourager le d{\'e}veloppement de syst{\`e}mes de correction automatique en fournissant le corpus TCFLE-8, un corpus de 6{\textasciitilde}569 essais collect{\'e}s dans le contexte de l{'}examen de certification Test de Connaissance du Fran{\c{c}}ais (TCF). Nous d{\'e}crivons la proc{\'e}dure d{'}{\'e}valuation stricte qui a conduit {\`a} la notation de chaque essai par au moins deux {\'e}valuateurs selon l{'}{\'e}chelle du Cadre europ{\'e}en commun de r{\'e}f{\'e}rence pour les langues (CECR) et {\`a} la cr{\'e}ation d{'}un corpus {\'e}quilibr{\'e}. Nous faisons {\'e}galement progresser les performances de l{'}{\'e}tat de l{'}art pour la t{\^a}che de CAT en fran{\c{c}}ais en exp{\'e}rimentant deux solides mod{\`e}les de r{\'e}f{\'e}rence.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="wilkens-etal-2024-tcfle">
<titleInfo>
<title>TCFLE-8 : un corpus de productions écrites d’apprenants de français langue étrangère et son application à la correction automatisée de textes</title>
</titleInfo>
<name type="personal">
<namePart type="given">Rodrigo</namePart>
<namePart type="family">Wilkens</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Alice</namePart>
<namePart type="family">Pintard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">David</namePart>
<namePart type="family">Alfter</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Vincent</namePart>
<namePart type="family">Folny</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thomas</namePart>
<namePart type="family">François</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2024-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Balaguer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nihed</namePart>
<namePart type="family">Bendahman</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Lydia-Mai</namePart>
<namePart type="family">Ho-dac</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julie</namePart>
<namePart type="family">Mauclair</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">G Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Julien</namePart>
<namePart type="family">Pinquier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA and AFPC</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La correction automatisée de textes (CAT) vise à évaluer automatiquement la qualité de textes écrits. L’automatisation permet une évaluation à grande échelle ainsi qu’une amélioration de la cohérence, de la fiabilité et de la normalisation du processus. Ces caractéristiques sont particulièrement importantes dans le contexte des examens de certification linguistique. Cependant, un goulot d’étranglement majeur dans le développement des systèmes CAT est la disponibilité des corpus. Dans cet article, nous visons à encourager le développement de systèmes de correction automatique en fournissant le corpus TCFLE-8, un corpus de 6~569 essais collectés dans le contexte de l’examen de certification Test de Connaissance du Français (TCF). Nous décrivons la procédure d’évaluation stricte qui a conduit à la notation de chaque essai par au moins deux évaluateurs selon l’échelle du Cadre européen commun de référence pour les langues (CECR) et à la création d’un corpus équilibré. Nous faisons également progresser les performances de l’état de l’art pour la tâche de CAT en français en expérimentant deux solides modèles de référence.</abstract>
<identifier type="citekey">wilkens-etal-2024-tcfle</identifier>
<location>
<url>https://aclanthology.org/2024.jeptalnrecital-taln.44</url>
</location>
<part>
<date>2024-7</date>
<extent unit="page">
<start>677</start>
<end>685</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T TCFLE-8 : un corpus de productions écrites d’apprenants de français langue étrangère et son application à la correction automatisée de textes
%A Wilkens, Rodrigo
%A Pintard, Alice
%A Alfter, David
%A Folny, Vincent
%A François, Thomas
%Y Balaguer, Mathieu
%Y Bendahman, Nihed
%Y Ho-dac, Lydia-Mai
%Y Mauclair, Julie
%Y G Moreno, Jose
%Y Pinquier, Julien
%S Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position
%D 2024
%8 July
%I ATALA and AFPC
%C Toulouse, France
%G French
%F wilkens-etal-2024-tcfle
%X La correction automatisée de textes (CAT) vise à évaluer automatiquement la qualité de textes écrits. L’automatisation permet une évaluation à grande échelle ainsi qu’une amélioration de la cohérence, de la fiabilité et de la normalisation du processus. Ces caractéristiques sont particulièrement importantes dans le contexte des examens de certification linguistique. Cependant, un goulot d’étranglement majeur dans le développement des systèmes CAT est la disponibilité des corpus. Dans cet article, nous visons à encourager le développement de systèmes de correction automatique en fournissant le corpus TCFLE-8, un corpus de 6~569 essais collectés dans le contexte de l’examen de certification Test de Connaissance du Français (TCF). Nous décrivons la procédure d’évaluation stricte qui a conduit à la notation de chaque essai par au moins deux évaluateurs selon l’échelle du Cadre européen commun de référence pour les langues (CECR) et à la création d’un corpus équilibré. Nous faisons également progresser les performances de l’état de l’art pour la tâche de CAT en français en expérimentant deux solides modèles de référence.
%U https://aclanthology.org/2024.jeptalnrecital-taln.44
%P 677-685
Markdown (Informal)
[TCFLE-8 : un corpus de productions écrites d’apprenants de français langue étrangère et son application à la correction automatisée de textes](https://aclanthology.org/2024.jeptalnrecital-taln.44) (Wilkens et al., JEP/TALN/RECITAL 2024)
ACL