Jean Fontaine
2010
Au-delà de la paire de mots : extraction de cooccurrences syntaxiques multilexémiques
Simon Charest
|
Éric Brunelle
|
Jean Fontaine
Actes de la 17e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Cet article décrit l’élaboration de la deuxième édition du dictionnaire de cooccurrences du logiciel d’aide à la rédaction Antidote. Cette nouvelle mouture est le résultat d’une refonte complète du processus d’extraction, ayant principalement pour but l’extraction de cooccurrences de plus de deux unités lexicales. La principale contribution de cet article est la description d’une technique originale pour l’extraction de cooccurrences de plus de deux mots conservant une structure syntaxique complète.
2007
Élaboration automatique d’un dictionnaire de cooccurrences grand public
Simon Charest
|
Éric Brunelle
|
Jean Fontaine
|
Bertrand Pelletier
Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
Antidote RX, un logiciel d’aide à la rédaction grand public, comporte un nouveau dictionnaire de 800 000 cooccurrences, élaboré essentiellement automatiquement. Nous l’avons créé par l’analyse syntaxique détaillée d’un vaste corpus et par la sélection automatique des cooccurrences les plus pertinentes à l’aide d’un test statistique, le rapport de vraisemblance. Chaque cooccurrence est illustrée par des exemples de phrases également tirés du corpus automatiquement. Les cooccurrences et les exemples extraits ont été révisés par des linguistes. Nous examinons les choix d’interface que nous avons faits pour présenter ces données complexes à un public non spécialisé. Enfin, nous montrons comment nous avons intégré les cooccurrences au correcteur d’Antidote pour améliorer ses performances.
Search