Amandine Decker
2025
L’essentiel est invisible pour les représentations sémantiques
Amandine Decker
|
Maxime Amblard
Actes de l'atelier Avancement de l’AMR et de l’Analyse Sémantique 2025 (4AS)
L’analyse sémantique est un terrain de recherche dynamique cherchant à produire des représentations formelles du sens au-delà de la syntaxe. Ces représentations détaillées peuvent être utilisées comme base pour la compréhension de la langue ( Natural Language Understanding ) ou de la génération (Natural Language Generation ) par exemple. Bien que ces représentations permettent une analyse fine, elles ne couvrent pas certains aspects cruciaux des usages réels de la langue. La plupart des formalismes de représentation sémantiques comme les AMR, les DRS ou les UMR fonctionnent hors contexte, ce qui revient à ignorer une partie importante du contenu des énoncés analysés. Dans cet article nous discutons de différents aspects de l’usage de la langue laissés de côté par les formalismes de représentations sémantiques. Nous soutenons que les travaux futurs dans ce domaine devraient inclure l’aspect interactif du langage à l’extension de ces formalismes.
2024
With a Little Help from my (Linguistic) Friends: Topic segmentation of multi-party casual conversations
Amandine Decker
|
Maxime Amblard
Proceedings of the 5th Workshop on Computational Approaches to Discourse (CODI 2024)
Topics play an important role in the global organisation of a conversation as what is currently discussed constrains the possible contributions of the participant. Understanding the way topics are organised in interaction would provide insight on the structure of dialogue beyond the sequence of utterances. However, studying this high-level structure is a complex task that we try to approach by first segmenting dialogues into smaller topically coherent sets of utterances. Understanding the interactions between these segments would then enable us to propose a model of topic organisation at a dialogue level. In this paper we work with open-domain conversations and try to reach a comparable level of accuracy as recent machine learning based topic segmentation models but with a formal approach. The features we identify as meaningful for this task help us understand better the topical structure of a conversation.
Construction d’une mesure de similarité thématique non supervisée pour les conversations
Amandine Decker
|
Maxime Amblard
Actes de la 31ème Conférence sur le Traitement Automatique des Langues Naturelles, volume 1 : articles longs et prises de position
La structure thématique d’une conversation représente la manière dont l’interaction est organisée à un niveau plus global que le strict enchaînement des interventions. Elle permet de comprendre comment la cohérence est maintenue sur le temps de l’échange. La création d’une mesure de similarité thématique qui donne un score de similarité à deux énoncés du point de vue thématique pourrait nous permettre de produire et d’analyser ces structures. Nous entraînons une mesure non supervisée, basée sur le modèle BERT avec prédiction de la phrase suivante, sur des conversations Reddit. La structure de Reddit nous fournit différents niveaux de proximité de cohérence entre des paires de messages, ce qui nous permet d’entraîner notre modèle avec une fonction de perte basée sur des comparaisons plutôt que sur des valeurs numériques attendues a priori. Cette mesure nous permet de trouver des ensembles d’interventions localement cohérents dans nos conversations Reddit, mais aussi de mesurer la variabilité en termes de thème tout au long d’une conversation.