@inproceedings{hamlat-2016-apprentissage,
title = "Apprentissage bay{\'e}sien incr{\'e}mental pour la d{\'e}termination de l{'}{\^a}ge et du genre d{'}utilisateurs de plateformes du web social ({UGC} text-based age {\&} gender author profiling through incrementally semi-supervised bayesian learning)",
author = {Hamlat, Jugurtha A{\"\i}t},
editor = "Danlos, Laurence and
Hamon, Thierry",
booktitle = "Actes de la conf{\'e}rence conjointe JEP-TALN-RECITAL 2016. volume 3 : RECITAL",
month = "7",
year = "2016",
address = "Paris, France",
publisher = "AFCP - ATALA",
url = "https://aclanthology.org/2016.jeptalnrecital-recital.2",
pages = "13--26",
abstract = "Les m{\'e}thodes de classification textuelles bas{\'e}es sur l{'}apprentissage automatique ont l{'}avantage, en plus d{'}{\^e}tre robustes, de fournir des r{\'e}sultats satisfaisants, sous r{\'e}serve de disposer d{'}une base d{'}entra{\^\i}nement de qualit{\'e} et en quantit{\'e} suffisante. Les corpus d{'}apprentissage {\'e}tant co{\^u}teux {\`a} construire, leur carence {\`a} grande {\'e}chelle se r{\'e}v{\`e}le {\^e}tre l{'}une des principales causes d{'}erreurs. Dans un contexte industriel {\`a} forte volum{\'e}trie de donn{\'e}es, nous pr{\'e}sentons une approche de pr{\'e}diction des deux plus importants indicateurs socio-d{\'e}mographiques « {\^a}ge » et « genre » appliqu{\'e}e {\`a} des utilisateurs de forums, blogs et r{\'e}seaux sociaux et ce, {\`a} partir de leurs seules productions textuelles. Le mod{\`e}le bay{\'e}sien multinomial est construit {\`a} partir d{'}un processus d{'}apprentissage incr{\'e}mental et it{\'e}ratif sur une vaste base d{'}entra{\^\i}nement semi-supervis{\'e}e. Le caract{\`e}re incr{\'e}mental permet de s{'}affranchir des contraintes de volum{\'e}trie. L{'}aspect it{\'e}ratif a pour objectif d{'}affiner le mod{\`e}le et d{'}augmenter ainsi les niveaux de rappel {\&} pr{\'e}cision.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="hamlat-2016-apprentissage">
<titleInfo>
<title>Apprentissage bayésien incrémental pour la détermination de l’âge et du genre d’utilisateurs de plateformes du web social (UGC text-based age & gender author profiling through incrementally semi-supervised bayesian learning)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Jugurtha</namePart>
<namePart type="given">Aït</namePart>
<namePart type="family">Hamlat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2016-07</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 3 : RECITAL</title>
</titleInfo>
<name type="personal">
<namePart type="given">Laurence</namePart>
<namePart type="family">Danlos</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Hamon</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>AFCP - ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les méthodes de classification textuelles basées sur l’apprentissage automatique ont l’avantage, en plus d’être robustes, de fournir des résultats satisfaisants, sous réserve de disposer d’une base d’entraînement de qualité et en quantité suffisante. Les corpus d’apprentissage étant coûteux à construire, leur carence à grande échelle se révèle être l’une des principales causes d’erreurs. Dans un contexte industriel à forte volumétrie de données, nous présentons une approche de prédiction des deux plus importants indicateurs socio-démographiques « âge » et « genre » appliquée à des utilisateurs de forums, blogs et réseaux sociaux et ce, à partir de leurs seules productions textuelles. Le modèle bayésien multinomial est construit à partir d’un processus d’apprentissage incrémental et itératif sur une vaste base d’entraînement semi-supervisée. Le caractère incrémental permet de s’affranchir des contraintes de volumétrie. L’aspect itératif a pour objectif d’affiner le modèle et d’augmenter ainsi les niveaux de rappel & précision.</abstract>
<identifier type="citekey">hamlat-2016-apprentissage</identifier>
<location>
<url>https://aclanthology.org/2016.jeptalnrecital-recital.2</url>
</location>
<part>
<date>2016-7</date>
<extent unit="page">
<start>13</start>
<end>26</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Apprentissage bayésien incrémental pour la détermination de l’âge et du genre d’utilisateurs de plateformes du web social (UGC text-based age & gender author profiling through incrementally semi-supervised bayesian learning)
%A Hamlat, Jugurtha Aït
%Y Danlos, Laurence
%Y Hamon, Thierry
%S Actes de la conférence conjointe JEP-TALN-RECITAL 2016. volume 3 : RECITAL
%D 2016
%8 July
%I AFCP - ATALA
%C Paris, France
%G French
%F hamlat-2016-apprentissage
%X Les méthodes de classification textuelles basées sur l’apprentissage automatique ont l’avantage, en plus d’être robustes, de fournir des résultats satisfaisants, sous réserve de disposer d’une base d’entraînement de qualité et en quantité suffisante. Les corpus d’apprentissage étant coûteux à construire, leur carence à grande échelle se révèle être l’une des principales causes d’erreurs. Dans un contexte industriel à forte volumétrie de données, nous présentons une approche de prédiction des deux plus importants indicateurs socio-démographiques « âge » et « genre » appliquée à des utilisateurs de forums, blogs et réseaux sociaux et ce, à partir de leurs seules productions textuelles. Le modèle bayésien multinomial est construit à partir d’un processus d’apprentissage incrémental et itératif sur une vaste base d’entraînement semi-supervisée. Le caractère incrémental permet de s’affranchir des contraintes de volumétrie. L’aspect itératif a pour objectif d’affiner le modèle et d’augmenter ainsi les niveaux de rappel & précision.
%U https://aclanthology.org/2016.jeptalnrecital-recital.2
%P 13-26
Markdown (Informal)
[Apprentissage bayésien incrémental pour la détermination de l’âge et du genre d’utilisateurs de plateformes du web social (UGC text-based age & gender author profiling through incrementally semi-supervised bayesian learning)](https://aclanthology.org/2016.jeptalnrecital-recital.2) (Hamlat, JEP/TALN/RECITAL 2016)
ACL