Soufian Salim


2016

pdf bib
Comparaison d’approches de classification automatique des actes de dialogue dans un corpus de conversations écrites en ligne sur différentes modalités (A comparison of automatic dialog act recognition approaches in a multimodal corpus of online written conversations)
Soufian Salim | Nicolas Hernandez | Emmanuel Morin
Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 2 : TALN (Articles longs)

L’analyse des conversations écrites porteuses de demandes d’assistance est un enjeu important pour le développement de nouvelles technologies liées au support client. Dans cet article, nous nous intéressons à l’analyse d’un même type d’échange sur un canal différent : les conversations se déroulant sur les plate-formes d’entraide entre utilisateurs. Nous comparons des approches de classification supervisées sur trois modalités des CMR 1 différentes à même thématique : des courriels, forums et chats issus de la communauté Ubuntu. Le système emploie une taxonomie fine basée sur le schéma DIT++. D’autres expériences sont détaillées, et nous rapportons les résultats obtenus avec différentes approches et différents traits sur les différentes parties de notre corpus multimodal.

pdf bib
Un analyseur de conversations pour la relation client (Parsing email and chat conversations for customer support softwares)
Hugues de Mazancourt | Gaëlle Recourcé | Soufian Salim
Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 5 : Démonstrations

Cette démonstration a pour objet de présenter l’utilisation d’un analyseur de conversations par email ou chat dans le cadre d’une application de support client : mise en valeur des demandes d’action, repérage des thèmes dangereux, tableau de bord pour le superviseur, alertes pour l’agent ...

pdf bib
Ubuntu-fr: A Large and Open Corpus for Multi-modal Analysis of Online Written Conversations
Nicolas Hernandez | Soufian Salim | Elizaveta Loginova Clouet
Proceedings of the Tenth International Conference on Language Resources and Evaluation (LREC'16)

We present a large, free, French corpus of online written conversations extracted from the Ubuntu platform’s forums, mailing lists and IRC channels. The corpus is meant to support multi-modality and diachronic studies of online written conversations. We choose to build the corpus around a robust metadata model based upon strong principles, such as the “stand off” annotation principle. We detail the model, we explain how the data was collected and processed - in terms of meta-data, text and conversation - and we detail the corpus’contents through a series of meaningful statistics. A portion of the corpus - about 4,700 sentences from emails, forum posts and chat messages sent in November 2014 - is annotated in terms of dialogue acts and sentiment. We discuss how we adapted our dialogue act taxonomy from the DIT++ annotation scheme and how the data was annotated, before presenting our results as well as a brief qualitative analysis of the annotated data.

2015

pdf bib
État de l’art : analyse des conversations écrites en ligne porteuses de demandes d’assistance en termes d’actes de dialogue
Soufian Salim
Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues

Le développement du Web 2.0 et le processus de création et de consommation massive de contenus générés par les utilisateurs qu’elle a enclenché a permis le développement de nouveaux types d’interactions chez les internautes. En particulier, nous nous intéressons au développement du support en ligne et des plate-formes d’entraide. En effet, les archives de conversations en ligne porteuses de demandes d’assistance représentent une ressource inestimable, mais peu exploitée. L’exploitation de cette ressource permettrait non seulement d’améliorer les systèmes liés à la résolution collaborative des problèmes, mais également de perfectionner les canaux de support proposés par les entreprises opérant sur le web. Pour ce faire, il est cependant nécessaire de définir un cadre formel pour l’analyse discursive de ce type de conversations. Cet article a pour objectif de présenter l’état de la recherche en analyse des conversations écrites en ligne, sous différents médiums, et de montrer dans quelle mesure les différentes méthodes exposées dans la littérature peuvent être appliquées à des conversations fonctionnelles inscrites dans le cadre de la résolution collaborative des problèmes utilisateurs.

2014

pdf bib
Exploiting the Human Computational Effort Dedicated to Message Reply Formatting for Training Discursive Email Segmenters
Nicolas Hernandez | Soufian Salim
Proceedings of LAW VIII - The 8th Linguistic Annotation Workshop