pdf
bib
Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. REncontres jeunes Chercheurs en Informatique pour le Traitement Automatique des Langues
Jean-Marc Lecarpentier
|
Nadine Lucas
pdf
bib
abs
fr2sql : Interrogation de bases de données en français
Benoît Couderc
|
Jérémy Ferrero
Les bases de données sont de plus en plus courantes et prennent de plus en plus d’ampleur au sein des applications et sites Web actuels. Elles sont souvent amenées à être utilisées par des personnes n’ayant pas une grande compétence en la matière et ne connaissant pas rigoureusement leur structure. C’est pour cette raison que des traducteurs du langage naturel aux requêtes SQL sont développés. Malheureusement, la plupart de ces traducteurs se cantonnent à une seule base du fait de la spécificité de l’architecture de celle-ci. Dans cet article, nous proposons une méthode visant à pouvoir interroger n’importe quelle base de données à partir de questions en français. Nous évaluons notre application sur deux bases à la structure différente et nous montrons également qu’elle supporte plus d’opérations que la plupart des autres traducteurs.
pdf
bib
abs
Désambiguïsation lexicale à base de connaissances par sélection distributionnelle et traits sémantiques
Mokhtar Boumedyen Billami
La désambiguïsation lexicale permet d’améliorer de nombreuses applications en traitement automatique des langues (TAL) comme la recherche d’information, l’extraction d’information, la traduction automatique, ou la simplification lexicale de textes. Schématiquement, il s’agit de choisir quel est le sens le plus approprié pour chaque mot d’un texte. Une des approches classiques consiste à estimer la similarité sémantique qui existe entre les sens de deux mots puis de l’étendre à l’ensemble des mots du texte. La méthode la plus directe donne un score de similarité à toutes les paires de sens de mots puis choisit la chaîne de sens qui retourne le meilleur score (on imagine la complexité exponentielle liée à cette approche exhaustive). Dans cet article, nous proposons d’utiliser une méta-heuristique d’optimisation combinatoire qui consiste à choisir les voisins les plus proches par sélection distributionnelle autour du mot à désambiguïser. Le test et l’évaluation de notre méthode portent sur un corpus écrit en langue française en se servant du réseau sémantique BabelNet. Le taux d’exactitude obtenu est de 78% sur l’ensemble des noms et des verbes choisis pour l’évaluation.
pdf
bib
abs
Vers un modèle de détection des affects, appréciations et jugements dans le cadre d’interactions humain-agent
Caroline Langlet
Cet article aborde la question de la détection des expressions d’attitude – i.e affect, d’appréciation et de jugement (Martin& White, 2005) – dans le contenu verbal de l’utilisateur au cours d’interactions en face-à-face avec un agent conversationnel animé. Il propose un positionnement en termes de modèles et de méthodes pour le développement d’un système de détection adapté aux buts communicationnels de l’agent et à une parole conversationnelle. Après une description du modèle théorique de référence choisi, l’article propose un modèle d’annotation des attitudes dédié l’exploration de ce phénomène dans un corpus d’interaction humain-agent. Il présente ensuite une première version de notre système. Cette première version se concentre sur la détection des expressions d’attitudes pouvant référer à ce qu’aime ou n’aime pas l’utilisateur. Le système est conçu selon une approche symbolique fondée sur un ensemble de règles sémantiques et de représentations logico-sémantiques des énoncés.
pdf
bib
abs
Résumé Automatique Multi-Document Dynamique : État de l’Art
Maâli Mnasri
Les travaux menés dans le cadre du résumé automatique de texte ont montré des résultats à la fois très encourageants mais qui sont toujours à améliorer. La problématique du résumé automatique ne cesse d’évoluer avec les nouveaux champs d’application qui s’imposent, ce qui augmente les contraintes liées à cette tâche. Nous nous inté- ressons au résumé extractif multi-document dynamique. Pour cela, nous examinons les différentes approches existantes en mettant l’accent sur les travaux les plus récents. Nous montrons ensuite que la performance des systèmes de résumé multi-document et dynamique est encore modeste. Trois contraintes supplémentaires sont ajoutées : la redondance inter-document, la redondance à travers le temps et la grande taille des données à traiter. Nous essayons de déceler les insuffisances des systèmes existants afin de bien définir notre problématique et guider ainsi nos prochains travaux.
pdf
bib
abs
Alignement multimodal de ressources éducatives et scientifiques
Hugo Mougard
Cet article présente certaines questions de recherche liées au projet COC O 1 . L’ambition de ce projet est de valoriser les ressources éducatives et académiques en exploitant au mieux les différents médias disponibles (vidéos de cours ou de présentations d’articles, manuels éducatifs, articles scientifiques, présentations, etc). Dans un premier temps, nous décrirons le problème d’utilisation jointe de ressources multimédias éducatives ou scientifiques pour ensuite introduire l’état de l’art dans les domaines concernés. Cela nous permettra de présenter quelques questions de recherche sur lesquelles porteront des études ultérieures. Enfin nous finirons en introduisant trois prototypes développés pour analyser ces questions.
pdf
bib
abs
État de l’art : analyse des conversations écrites en ligne porteuses de demandes d’assistance en termes d’actes de dialogue
Soufian Salim
Le développement du Web 2.0 et le processus de création et de consommation massive de contenus générés par les utilisateurs qu’elle a enclenché a permis le développement de nouveaux types d’interactions chez les internautes. En particulier, nous nous intéressons au développement du support en ligne et des plate-formes d’entraide. En effet, les archives de conversations en ligne porteuses de demandes d’assistance représentent une ressource inestimable, mais peu exploitée. L’exploitation de cette ressource permettrait non seulement d’améliorer les systèmes liés à la résolution collaborative des problèmes, mais également de perfectionner les canaux de support proposés par les entreprises opérant sur le web. Pour ce faire, il est cependant nécessaire de définir un cadre formel pour l’analyse discursive de ce type de conversations. Cet article a pour objectif de présenter l’état de la recherche en analyse des conversations écrites en ligne, sous différents médiums, et de montrer dans quelle mesure les différentes méthodes exposées dans la littérature peuvent être appliquées à des conversations fonctionnelles inscrites dans le cadre de la résolution collaborative des problèmes utilisateurs.