@inproceedings{goeuriot-etal-2007-caracterisation,
title = "Caract{\'e}risation des discours scientifiques et vulgaris{\'e}s en fran{\c{c}}ais, japonais et russe",
author = "Goeuriot, Lorraine and
Grabar, Natalia and
Daille, B{\'e}atrice",
editor = "Hathout, Nabil and
Muller, Philippe",
booktitle = "Actes de la 14{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Posters",
month = jun,
year = "2007",
address = "Toulouse, France",
publisher = "ATALA",
url = "https://aclanthology.org/2007.jeptalnrecital-poster.9",
pages = "93--102",
abstract = "L{'}objectif principal de notre travail consiste {\`a} {\'e}tudier la notion de comparabilit{\'e} des corpus, et nous abordons cette question dans un contexte monolingue en cherchant {\`a} distinguer les documents scientifiques et vulgaris{\'e}s. Nous travaillons s{\'e}par{\'e}ment sur des corpus compos{\'e}s de documents du domaine m{\'e}dical dans trois langues {\`a} forte distance linguistique (le fran{\c{c}}ais, le japonais et le russe). Dans notre approche, les documents sont caract{\'e}ris{\'e}s dans chaque langue selon leur th{\'e}matique et une typologie discursive qui se situe {\`a} trois niveaux de l{'}analyse des documents : structurel, modal et lexical. Le typage des documents est impl{\'e}ment{\'e} avec deux algorithmes d{'}apprentissage (SVMlight et C4.5). L{'}{\'e}valuation des r{\'e}sultats montre que la typologie discursive propos{\'e}e est portable d{'}une langue {\`a} l{'}autre car elle permet en effet de distinguer les deux discours. Nous constatons n{\'e}anmoins des performances tr{\`e}s vari{\'e}es selon les langues, les algorithmes et les types de caract{\'e}ristiques discursives.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="goeuriot-etal-2007-caracterisation">
<titleInfo>
<title>Caractérisation des discours scientifiques et vulgarisés en français, japonais et russe</title>
</titleInfo>
<name type="personal">
<namePart type="given">Lorraine</namePart>
<namePart type="family">Goeuriot</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Natalia</namePart>
<namePart type="family">Grabar</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Béatrice</namePart>
<namePart type="family">Daille</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2007-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Posters</title>
</titleInfo>
<name type="personal">
<namePart type="given">Nabil</namePart>
<namePart type="family">Hathout</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Philippe</namePart>
<namePart type="family">Muller</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Toulouse, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>L’objectif principal de notre travail consiste à étudier la notion de comparabilité des corpus, et nous abordons cette question dans un contexte monolingue en cherchant à distinguer les documents scientifiques et vulgarisés. Nous travaillons séparément sur des corpus composés de documents du domaine médical dans trois langues à forte distance linguistique (le français, le japonais et le russe). Dans notre approche, les documents sont caractérisés dans chaque langue selon leur thématique et une typologie discursive qui se situe à trois niveaux de l’analyse des documents : structurel, modal et lexical. Le typage des documents est implémenté avec deux algorithmes d’apprentissage (SVMlight et C4.5). L’évaluation des résultats montre que la typologie discursive proposée est portable d’une langue à l’autre car elle permet en effet de distinguer les deux discours. Nous constatons néanmoins des performances très variées selon les langues, les algorithmes et les types de caractéristiques discursives.</abstract>
<identifier type="citekey">goeuriot-etal-2007-caracterisation</identifier>
<location>
<url>https://aclanthology.org/2007.jeptalnrecital-poster.9</url>
</location>
<part>
<date>2007-06</date>
<extent unit="page">
<start>93</start>
<end>102</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Caractérisation des discours scientifiques et vulgarisés en français, japonais et russe
%A Goeuriot, Lorraine
%A Grabar, Natalia
%A Daille, Béatrice
%Y Hathout, Nabil
%Y Muller, Philippe
%S Actes de la 14ème conférence sur le Traitement Automatique des Langues Naturelles. Posters
%D 2007
%8 June
%I ATALA
%C Toulouse, France
%G French
%F goeuriot-etal-2007-caracterisation
%X L’objectif principal de notre travail consiste à étudier la notion de comparabilité des corpus, et nous abordons cette question dans un contexte monolingue en cherchant à distinguer les documents scientifiques et vulgarisés. Nous travaillons séparément sur des corpus composés de documents du domaine médical dans trois langues à forte distance linguistique (le français, le japonais et le russe). Dans notre approche, les documents sont caractérisés dans chaque langue selon leur thématique et une typologie discursive qui se situe à trois niveaux de l’analyse des documents : structurel, modal et lexical. Le typage des documents est implémenté avec deux algorithmes d’apprentissage (SVMlight et C4.5). L’évaluation des résultats montre que la typologie discursive proposée est portable d’une langue à l’autre car elle permet en effet de distinguer les deux discours. Nous constatons néanmoins des performances très variées selon les langues, les algorithmes et les types de caractéristiques discursives.
%U https://aclanthology.org/2007.jeptalnrecital-poster.9
%P 93-102
Markdown (Informal)
[Caractérisation des discours scientifiques et vulgarisés en français, japonais et russe](https://aclanthology.org/2007.jeptalnrecital-poster.9) (Goeuriot et al., JEP/TALN/RECITAL 2007)
ACL