Prédiction des pauses dans les données d’écriture en temps réel

Eshkol-taravella Iris, Manseri Kehina, Silai Ioana-Madalina


Abstract
Cette étude explore la prédiction des pauses dans des données d’écriture enregistrées en temps réel. Deux hypothèses sont testées : (1) les pauses dépendent du contenu lexical des bursts, et (2) les catégories morpho-syntaxiques (POS) influencent leur distribution. Après prétraitement linguistique, plusieurs techniques de classification sont testées. CamemBERT atteint jusqu’à 90 % de précision en classification binaire, suggérant un lien fort entre structure linguistique et pauses.
Anthology ID:
2025.jeptalnrecital-dyntal.6
Volume:
Actes de l'atelier Traitement de données langagières dynamiques par les outils et méthodes du TAL 2025 (DYN-TAL)
Month:
6
Year:
2025
Address:
Marseille, France
Editors:
Frédéric Bechet, Adrian-Gabriel Chifu, Karen Pinel-sauvagnat, Benoit Favre, Eliot Maes, Diana Nurbakova
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA \\& ARIA
Note:
Pages:
28–33
Language:
French
URL:
https://aclanthology.org/2025.jeptalnrecital-dyntal.6/
DOI:
Bibkey:
Cite (ACL):
Eshkol-taravella Iris, Manseri Kehina, and Silai Ioana-Madalina. 2025. Prédiction des pauses dans les données d’écriture en temps réel. In Actes de l'atelier Traitement de données langagières dynamiques par les outils et méthodes du TAL 2025 (DYN-TAL), pages 28–33, Marseille, France. ATALA \\& ARIA.
Cite (Informal):
Prédiction des pauses dans les données d’écriture en temps réel (Iris et al., JEP/TALN/RECITAL 2025)
Copy Citation:
PDF:
https://aclanthology.org/2025.jeptalnrecital-dyntal.6.pdf