2016
pdf
bib
TAXI at SemEval-2016 Task 13: a Taxonomy Induction Method based on Lexico-Syntactic Patterns, Substrings and Focused Crawling
Alexander Panchenko
|
Stefano Faralli
|
Eugen Ruppert
|
Steffen Remus
|
Hubert Naets
|
Cédrick Fairon
|
Simone Paolo Ponzetto
|
Chris Biemann
Proceedings of the 10th International Workshop on Semantic Evaluation (SemEval-2016)
2014
pdf
bib
AMesure: a readability formula for administrative texts (AMESURE: une plateforme de lisibilité pour les textes administratifs) [in French]
Thomas François
|
Laetitia Brouwers
|
Hubert Naets
|
Cédrick Fairon
Proceedings of TALN 2014 (Volume 2: Short Papers)
2013
pdf
bib
Search and Visualization of Semantically Related Words (Recherche et visualisation de mots sémantiquement liés) [in French]
Alexander Panchenko
|
Hubert Naets
|
Laetitia Brouwers
|
Pavel Romanov
|
Cédrick Fairon
Proceedings of TALN 2013 (Volume 2: Short Papers)
pdf
bib
Automatic extraction of contextual valence shifters.
Noémi Boubel
|
Thomas François
|
Hubert Naets
Proceedings of the International Conference Recent Advances in Natural Language Processing RANLP 2013
2009
pdf
bib
abs
Recto /Verso Un système de conversion automatique ancienne / nouvelle orthographe à visée linguistique et didactique
Richard Beaufort
|
Anne Dister
|
Hubert Naets
|
Kévin Macé
|
Cédrick Fairon
Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
Cet article présente Recto /Verso, un système de traitement automatique du langage dédié à l’application des rectifications orthographiques de 1990. Ce système a été développé dans le cadre de la campagne de sensibilisation réalisée en mars dernier par le Service et le Conseil de la langue française et de la politique linguistique de la Communauté française de Belgique. Nous commençons par rappeler les motivations et le contenu de la réforme proposée, et faisons le point sur les principes didactiques retenus dans le cadre de la campagne. La plus grande partie de l’article est ensuite consacrée à l’implémentation du système. Nous terminons enfin par une première analyse de l’impact de la campagne sur les utilisateurs.
2008
pdf
bib
abs
GlossaNet 2: a linguistic search engine for RSS-based corpora
Cédrick Fairon
|
Kévin Macé
|
Hubert Naets
Proceedings of the 4th Web as Corpus Workshop
This paper presents GlossaNet 2, a free online concordance service that enables users to search into dynamic Web corpora. Two steps are involved in using GlossaNet. At first, users define a corpus by selecting RSS feeds in a preselected pool of sources (they can also add their own RSS feeds). These sources will be visited on a regular basis by a crawler in order to generate a dynamic corpus. Secondly, the user can register one or more search queries on his / her dynamic corpus. Search queries will be re-applied on the corpus every time it is updated, new concordances will be recorded for the user (results can be emailed, published for the user in a privative RSS feed, or they can be viewed online). This service integrates two preexisting software: Corporator (Fairon, 2006), a program that creates corpora by downloading, filtering RSS feeds, Unitex (Paumier, 2003), an open source corpus processor that relies on linguistic resources. After a short introduction, we will briefly present the concept of “RSS corpora”, the assets of this approach to corpus development. We will then give an overview of the GlossaNet architecture, present various cases of use.