@inproceedings{bigi-smaili-2002-identification,
title = "Identification th{\'e}matique hi{\'e}rarchique : Application aux forums de discussions",
author = {Bigi, Brigitte and
Sma{\"\i}li, Kamel},
editor = "Pierrel, Jean-Marie",
booktitle = "Actes de la 9{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2002",
address = "Nancy, France",
publisher = "ATALA",
url = "https://aclanthology.org/2002.jeptalnrecital-long.9",
pages = "116--125",
abstract = "Les mod{\`e}les statistiques du langage ont pour but de donner une repr{\'e}sentation statistique de la langue mais souffrent de nombreuses imperfections. Des travaux r{\'e}cents ont montr{\'e} que ces mod{\`e}les peuvent {\^e}tre am{\'e}lior{\'e}s s{'}ils peuvent b{\'e}n{\'e}ficier de la connaissance du th{\`e}me trait{\'e}, afin de s{'}y adapter. Le th{\`e}me du document est alors obtenu par un m{\'e}canisme d{'}identification th{\'e}matique, mais les th{\`e}mes ainsi trait{\'e}s sont souvent de granularit{\'e} diff{\'e}rente, c{'}est pourquoi il nous semble opportun qu{'}ils soient organis{\'e}s dans une hi{\'e}rarchie. Cette structuration des th{\`e}mes implique la mise en place de techniques sp{\'e}cifiques d{'}identification th{\'e}matique. Cet article propose un mod{\`e}le statistique {\`a} base d{'}unigrammes pour identifier automatiquement le th{\`e}me d{'}un document parmi une arborescence pr{\'e}d{\'e}finie de th{\`e}mes possibles. Nous pr{\'e}sentons {\'e}galement un crit{\`e}re qui permet au mod{\`e}le de donner un degr{\'e} de fiabilit{\'e} {\`a} la d{\'e}cision prise. L{'}ensemble des exp{\'e}rimentations a {\'e}t{\'e} r{\'e}alis{\'e} sur des donn{\'e}es extraites du groupe {'}fr{'} des forums de discussion.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="bigi-smaili-2002-identification">
<titleInfo>
<title>Identification thématique hiérarchique : Application aux forums de discussions</title>
</titleInfo>
<name type="personal">
<namePart type="given">Brigitte</namePart>
<namePart type="family">Bigi</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Kamel</namePart>
<namePart type="family">Smaïli</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2002-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Jean-Marie</namePart>
<namePart type="family">Pierrel</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Nancy, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les modèles statistiques du langage ont pour but de donner une représentation statistique de la langue mais souffrent de nombreuses imperfections. Des travaux récents ont montré que ces modèles peuvent être améliorés s’ils peuvent bénéficier de la connaissance du thème traité, afin de s’y adapter. Le thème du document est alors obtenu par un mécanisme d’identification thématique, mais les thèmes ainsi traités sont souvent de granularité différente, c’est pourquoi il nous semble opportun qu’ils soient organisés dans une hiérarchie. Cette structuration des thèmes implique la mise en place de techniques spécifiques d’identification thématique. Cet article propose un modèle statistique à base d’unigrammes pour identifier automatiquement le thème d’un document parmi une arborescence prédéfinie de thèmes possibles. Nous présentons également un critère qui permet au modèle de donner un degré de fiabilité à la décision prise. L’ensemble des expérimentations a été réalisé sur des données extraites du groupe ’fr’ des forums de discussion.</abstract>
<identifier type="citekey">bigi-smaili-2002-identification</identifier>
<location>
<url>https://aclanthology.org/2002.jeptalnrecital-long.9</url>
</location>
<part>
<date>2002-06</date>
<extent unit="page">
<start>116</start>
<end>125</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Identification thématique hiérarchique : Application aux forums de discussions
%A Bigi, Brigitte
%A Smaïli, Kamel
%Y Pierrel, Jean-Marie
%S Actes de la 9ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2002
%8 June
%I ATALA
%C Nancy, France
%G French
%F bigi-smaili-2002-identification
%X Les modèles statistiques du langage ont pour but de donner une représentation statistique de la langue mais souffrent de nombreuses imperfections. Des travaux récents ont montré que ces modèles peuvent être améliorés s’ils peuvent bénéficier de la connaissance du thème traité, afin de s’y adapter. Le thème du document est alors obtenu par un mécanisme d’identification thématique, mais les thèmes ainsi traités sont souvent de granularité différente, c’est pourquoi il nous semble opportun qu’ils soient organisés dans une hiérarchie. Cette structuration des thèmes implique la mise en place de techniques spécifiques d’identification thématique. Cet article propose un modèle statistique à base d’unigrammes pour identifier automatiquement le thème d’un document parmi une arborescence prédéfinie de thèmes possibles. Nous présentons également un critère qui permet au modèle de donner un degré de fiabilité à la décision prise. L’ensemble des expérimentations a été réalisé sur des données extraites du groupe ’fr’ des forums de discussion.
%U https://aclanthology.org/2002.jeptalnrecital-long.9
%P 116-125
Markdown (Informal)
[Identification thématique hiérarchique : Application aux forums de discussions](https://aclanthology.org/2002.jeptalnrecital-long.9) (Bigi & Smaïli, JEP/TALN/RECITAL 2002)
ACL