Gilquin Gaëtanelle
2025
Détection automatique des unités linguistiques permettant le maintien de la producton écrite
Feltgen Quentin
|
Gilquin Gaëtanelle
Actes de l'atelier Traitement de données langagières dynamiques par les outils et méthodes du TAL 2025 (DYN-TAL)
La production textuelle est segmentée par des pauses en jets textuels de longueur variable, interprétés comme manifestant une certaine cohérence cognitive dans la rédaction. Pour favoriser la fluence de ce processus, les scripteurs peuvent avoir recours à des unités linguistiques qui permettent de maintenir le flux de la production. L’objectif de cette contribution est de proposer une méthode de TAL pour détecter automatiquement ces unités. Nous l’appliquons à un corpus d’apprenants écrit en anglais L2 et montrons, d’une part, que les unités de structuration du texte (connecteurs, etc.) opèrent souvent de manière isolée, et d’autre part que la production peut être maintenue par le recours à des stratégies de complémentation (syntagme prépositionnel, proposition infinitive) qui permettent d’élaborer à partir d’un contenu déjà en place.