@inproceedings{amandine-kehina-2025-pre,
title = "Pr{\'e}-traiter les donn{\'e}es d'{\'e}criture en temps r{\'e}el",
author = "Amandine, Jouvenel and
Kehina, Manseri",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes de l'atelier Traitement de donn{\'e}es langagi{\`e}res dynamiques par les outils et m{\'e}thodes du TAL 2025 (DYN-TAL)",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-dyntal.5/",
pages = "23--27",
language = "fra",
abstract = "Traiter les donn{\'e}es d'{\'e}criture en temps r{\'e}el est une t{\^a}che complexe, ces derni{\`e}res combinant des informations spatiales et temporelles, et conservant les traces du processus d'{\'e}criture. Les outils actuels de traitement des donn{\'e}es linguistiques - comme les tokenizeurs, les {\'e}tiqueteurs morpho-syntaxiques ou les parseurs syntaxiques - ne sont pas con{\c{c}}us ni entra{\^i}n{\'e}s pour traiter ce type de corpus et de donn{\'e}es {\`a} haute dimensionalit{\'e}. Cela soul{\`e}ve donc la probl{\'e}matique du traitement automatique des donn{\'e}es d'{\'e}criture dynamique. Le travail pr{\'e}sent{\'e} ici constitue une s{\'e}rie de premi{\`e}res exp{\'e}riences portant sur l'{\'e}tiquetage morpho-syntaxique et le chunking de ces donn{\'e}es. Il vise {\`a} annoter les donn{\'e}es tout en prenant en compte les traces de l'{\'e}criture en temps r{\'e}el, appel{\'e}es ici disfluences."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="amandine-kehina-2025-pre">
<titleInfo>
<title>Pré-traiter les données d’écriture en temps réel</title>
</titleInfo>
<name type="personal">
<namePart type="given">Jouvenel</namePart>
<namePart type="family">Amandine</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Manseri</namePart>
<namePart type="family">Kehina</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de l’atelier Traitement de données langagières dynamiques par les outils et méthodes du TAL 2025 (DYN-TAL)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Traiter les données d’écriture en temps réel est une tâche complexe, ces dernières combinant des informations spatiales et temporelles, et conservant les traces du processus d’écriture. Les outils actuels de traitement des données linguistiques - comme les tokenizeurs, les étiqueteurs morpho-syntaxiques ou les parseurs syntaxiques - ne sont pas conçus ni entraînés pour traiter ce type de corpus et de données à haute dimensionalité. Cela soulève donc la problématique du traitement automatique des données d’écriture dynamique. Le travail présenté ici constitue une série de premières expériences portant sur l’étiquetage morpho-syntaxique et le chunking de ces données. Il vise à annoter les données tout en prenant en compte les traces de l’écriture en temps réel, appelées ici disfluences.</abstract>
<identifier type="citekey">amandine-kehina-2025-pre</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-dyntal.5/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>23</start>
<end>27</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Pré-traiter les données d’écriture en temps réel
%A Amandine, Jouvenel
%A Kehina, Manseri
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes de l’atelier Traitement de données langagières dynamiques par les outils et méthodes du TAL 2025 (DYN-TAL)
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F amandine-kehina-2025-pre
%X Traiter les données d’écriture en temps réel est une tâche complexe, ces dernières combinant des informations spatiales et temporelles, et conservant les traces du processus d’écriture. Les outils actuels de traitement des données linguistiques - comme les tokenizeurs, les étiqueteurs morpho-syntaxiques ou les parseurs syntaxiques - ne sont pas conçus ni entraînés pour traiter ce type de corpus et de données à haute dimensionalité. Cela soulève donc la problématique du traitement automatique des données d’écriture dynamique. Le travail présenté ici constitue une série de premières expériences portant sur l’étiquetage morpho-syntaxique et le chunking de ces données. Il vise à annoter les données tout en prenant en compte les traces de l’écriture en temps réel, appelées ici disfluences.
%U https://aclanthology.org/2025.jeptalnrecital-dyntal.5/
%P 23-27
Markdown (Informal)
[Pré-traiter les données d’écriture en temps réel](https://aclanthology.org/2025.jeptalnrecital-dyntal.5/) (Amandine & Kehina, JEP/TALN/RECITAL 2025)
ACL
- Jouvenel Amandine and Manseri Kehina. 2025. Pré-traiter les données d’écriture en temps réel. In Actes de l'atelier Traitement de données langagières dynamiques par les outils et méthodes du TAL 2025 (DYN-TAL), pages 23–27, Marseille, France. ATALA \\& ARIA.