Beatriz Sánchez-Cárdenas
Also published as: Beatriz Sanchez Cardenas
Caractériser les discours académiques et de vulgarisation : quelles propriétés ?
Amalia Todirascu
Beatriz Sanchez Cardenas
Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
L’article présente une étude des propriétés linguistiques (lexicales, morpho-syntaxiques, syntaxiques) permettant la classification automatique de documents selon leur genre (articles scientifiques et articles de vulgarisation), dans deux domaines différentes (médecine et informatique). Notre analyse, effectuée sur des corpus comparables en genre et en thèmes disponibles en français, permet de valider certaines propriétés identifiées dans la littérature comme caractéristiques des discours académiques ou de vulgarisation scientifique. Les premières expériences de classification évaluent l’influence de ces propriétés pour l’identification automatique du genre pour le cas spécifique des textes scientifiques ou de vulgarisation.
Linguistic knowledge for specialized text production
Miriam Buendía-Castro
Beatriz Sánchez-Cárdenas
Proceedings of the Eighth International Conference on Language Resources and Evaluation (LREC'12)
This paper outlines a proposal for encoding and describing verb phrase constructions in the knowledge base on the environment EcoLexicon, with the objective of helping translators in specialized text production. In order to be able to propose our own template, the characteristics and limitations of the most representative terminographic resources that include phraseological information were analyzed, along with the theoretical background that underlies the verb meaning argument structure in EcoLexicon. Our description provides evidence of the fact that this kind of entry structure can be easily encoded in other languages.