@inproceedings{pena-saldarriaga-etal-2009-un,
title = "Un nouveau sch{\'e}ma de pond{\'e}ration pour la cat{\'e}gorisation de documents manuscrits",
author = "Pe{\~n}a Saldarriaga, Sebasti{\'a}n and
Morin, Emmanuel and
Viard-Gaudin, Christian",
editor = "Nazarenko, Adeline and
Poibeau, Thierry",
booktitle = "Actes de la 16{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles courts",
month = jun,
year = "2009",
address = "Senlis, France",
publisher = "ATALA",
url = "https://aclanthology.org/2009.jeptalnrecital-court.43",
pages = "394--403",
abstract = "Les sch{\'e}mas de pond{\'e}ration utilis{\'e}s habituellement en cat{\'e}gorisation de textes, et plus g{\'e}n{\'e}ralement en recherche d{'}information (RI), ne sont pas adapt{\'e}s {\`a} l{'}utilisation de donn{\'e}es li{\'e}es {\`a} des textes issus d{'}un processus de reconnaissance de l{'}{\'e}criture. En particulier, les candidats-mot {\`a} la reconnaissance ne pourraient {\^e}tre exploit{\'e}s sans introduire de fausses occurrences de termes dans le document. Dans cet article nous pr{\'e}sentons un nouveau sch{\'e}ma de pond{\'e}ration permettant d{'}exploiter les listes de candidats-mot. Il permet d{'}estimer le pouvoir discriminant d{'}un terme en fonction de la probabilit{\'e} a posteriori d{'}un candidat-mot dans une liste de candidats. Les r{\'e}sultats montrent que le taux de classification de documents fortement d{\'e}grad{\'e}s peut {\^e}tre am{\'e}lior{\'e} en utilisant le sch{\'e}ma propos{\'e}.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="pena-saldarriaga-etal-2009-un">
<titleInfo>
<title>Un nouveau schéma de pondération pour la catégorisation de documents manuscrits</title>
</titleInfo>
<name type="personal">
<namePart type="given">Sebastián</namePart>
<namePart type="family">Peña Saldarriaga</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Emmanuel</namePart>
<namePart type="family">Morin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Christian</namePart>
<namePart type="family">Viard-Gaudin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2009-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts</title>
</titleInfo>
<name type="personal">
<namePart type="given">Adeline</namePart>
<namePart type="family">Nazarenko</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Poibeau</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Senlis, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les schémas de pondération utilisés habituellement en catégorisation de textes, et plus généralement en recherche d’information (RI), ne sont pas adaptés à l’utilisation de données liées à des textes issus d’un processus de reconnaissance de l’écriture. En particulier, les candidats-mot à la reconnaissance ne pourraient être exploités sans introduire de fausses occurrences de termes dans le document. Dans cet article nous présentons un nouveau schéma de pondération permettant d’exploiter les listes de candidats-mot. Il permet d’estimer le pouvoir discriminant d’un terme en fonction de la probabilité a posteriori d’un candidat-mot dans une liste de candidats. Les résultats montrent que le taux de classification de documents fortement dégradés peut être amélioré en utilisant le schéma proposé.</abstract>
<identifier type="citekey">pena-saldarriaga-etal-2009-un</identifier>
<location>
<url>https://aclanthology.org/2009.jeptalnrecital-court.43</url>
</location>
<part>
<date>2009-06</date>
<extent unit="page">
<start>394</start>
<end>403</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Un nouveau schéma de pondération pour la catégorisation de documents manuscrits
%A Peña Saldarriaga, Sebastián
%A Morin, Emmanuel
%A Viard-Gaudin, Christian
%Y Nazarenko, Adeline
%Y Poibeau, Thierry
%S Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
%D 2009
%8 June
%I ATALA
%C Senlis, France
%G French
%F pena-saldarriaga-etal-2009-un
%X Les schémas de pondération utilisés habituellement en catégorisation de textes, et plus généralement en recherche d’information (RI), ne sont pas adaptés à l’utilisation de données liées à des textes issus d’un processus de reconnaissance de l’écriture. En particulier, les candidats-mot à la reconnaissance ne pourraient être exploités sans introduire de fausses occurrences de termes dans le document. Dans cet article nous présentons un nouveau schéma de pondération permettant d’exploiter les listes de candidats-mot. Il permet d’estimer le pouvoir discriminant d’un terme en fonction de la probabilité a posteriori d’un candidat-mot dans une liste de candidats. Les résultats montrent que le taux de classification de documents fortement dégradés peut être amélioré en utilisant le schéma proposé.
%U https://aclanthology.org/2009.jeptalnrecital-court.43
%P 394-403
Markdown (Informal)
[Un nouveau schéma de pondération pour la catégorisation de documents manuscrits](https://aclanthology.org/2009.jeptalnrecital-court.43) (Peña Saldarriaga et al., JEP/TALN/RECITAL 2009)
ACL