Agnès Tutin

Also published as: Agnes Tutin


2017

pdf bib
Comparing Recurring Lexico-Syntactic Trees (RLTs) and Ngram Techniques for Extended Phraseology Extraction
Agnès Tutin | Olivier Kraif
Proceedings of the 13th Workshop on Multiword Expressions (MWE 2017)

This paper aims at assessing to what extent a syntax-based method (Recurring Lexico-syntactic Trees (RLT) extraction) allows us to extract large phraseological units such as prefabricated routines, e.g. “as previously said” or “as far as we/I know” in scientific writing. In order to evaluate this method, we compare it to the classical ngram extraction technique, on a subset of recurring segments including speech verbs in a French corpus of scientific writing. Results show that the LRT extraction technique is far more efficient for extended MWEs such as routines or collocations but performs more poorly for surface phenomena such as syntactic constructions or fully frozen expressions.

2012

pdf bib
ScienQuest: a Treebank Exploitation Tool for non NLP-Specialists
Achille Falaise | Olivier Kraif | Agnès Tutin | David Rouquet
Proceedings of COLING 2012: Demonstration Papers

2011

pdf bib
Exploitation d’un corpus arboré pour non spécialistes par des requêtes guidées et des requêtes sémantiques (Exploiting a Treebank for non-specialists by guided queries and semantic queries)
Achille Falaise | Agnès Tutin | Olivier Kraif
Actes de la 18e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts

L’exploitation de corpus analysés syntaxiquement (ou corpus arborés) pour le public non spécialiste n’est pas un problème trivial. Si la communauté du TAL souhaite mettre à la disposition des chercheurs non-informaticiens des corpus comportant des annotations linguistiques complexes, elle doit impérativement développer des interfaces simples à manipuler mais permettant des recherches fines. Dans cette communication, nous présentons les modes de recherche « grand public » développé(e)s dans le cadre du projet Scientext, qui met à disposition un corpus d’écrits scientifiques interrogeable par partie textuelle, par partie du discours et par fonction syntaxique. Les modes simples sont décrits : un mode libre et guidé, où l’utilisateur sélectionne lui-même les éléments de la requête, et un mode sémantique, qui comporte des grammaires locales préétablies à l’aide des fonctions syntaxiques.

pdf bib
Définition et conception d’une interface pour l’exploitation de corpus arborés pour non-informaticiens : la plateforme ScienQuest du projet Scientext [Definition and design of an interface for treebanks exploitation by non-computer scientists: the ScienQuest platform from Scientext project]
Achille Falaise | Agnès Tutin | Olivier Kraif
Traitement Automatique des Langues, Volume 52, Numéro 3 : Ressources linguistiques libres [Free Language Resources]

2007

pdf bib
Traitement sémantique par analyse distributionnelle des noms transdisciplinaires des écrits scientifiques
Agnès Tutin
Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Posters

Dans cette étude sur le lexique transdisciplinaire des écrits scientifiques, nous souhaitons évaluer dans quelle mesure les méthodes distributionnelles de TAL peuvent faciliter la tâche du linguiste dans le traitement sémantique de ce lexique. Après avoir défini le champ lexical et les corpus exploités, nous testons plusieurs méthodes basées sur des dépendances syntaxiques et observons les proximités sémantiques et les classes établies. L’hypothèse que certaines relations syntaxiques - en particulier les relations de sous-catégorisation – sont plus appropriées pour établir des classements sémantiques n’apparaît qu’en partie vérifiée. Si les relations de sous-catégorisation génèrent des proximités sémantiques entre les mots de meilleure qualité, cela ne semble pas le cas pour la classification par voisinage.

2004

pdf bib
Annotation of Anaphoric Expressions in an Aligned Bilingual Corpus
Agnès Tutin | Meriam Haddara | Ruslan Mitkov | Constantin Orasan
Proceedings of the Fourth International Conference on Language Resources and Evaluation (LREC’04)

1992

pdf bib
Lexical choice in context: generating procedural texts
Agnes Tutin | Richard Kittredge
COLING 1992 Volume 2: The 14th International Conference on Computational Linguistics