@inproceedings{brixtel-etal-2015-attribution,
title = "Attribution d{'}Auteur : approche multilingue fond{\'e}e sur les r{\'e}p{\'e}titions maximales",
author = {Brixtel, Romain and
Lecluze, Charlotte and
Lejeune, Ga{\"e}l},
editor = "Lecarpentier, Jean-Marc and
Lucas, Nadine",
booktitle = "Actes de la 22e conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2015",
address = "Caen, France",
publisher = "ATALA",
url = "https://aclanthology.org/2015.jeptalnrecital-long.18",
pages = "208--219",
abstract = "Cet article s{'}attaque {\`a} la t{\^a}che d{'}Attribution d{'}Auteur en contexte multilingue. Nous proposons une alternative aux m{\'e}thodes supervis{\'e}es fond{\'e}es sur les n-grammes de caract{\`e}res de longueurs variables : les r{\'e}p{\'e}titions maximales. Pour un texte donn{\'e}, la liste de ses n-grammes de caract{\`e}res contient des informations redondantes. A contrario, les r{\'e}p{\'e}titions maximales repr{\'e}sentent l{'}ensemble des r{\'e}p{\'e}titions de ce texte de mani{\`e}re condens{\'e}e. Nos exp{\'e}riences montrent que la redondance des n-grammes contribue {\`a} l{'}efficacit{\'e} des techniques d{'}Attribution d{'}Auteur exploitant des sous-cha{\^\i}nes de caract{\`e}res. Ce constat pos{\'e}, nous proposons une fonction de pond{\'e}ration sur les traits donn{\'e}s en entr{\'e}e aux classifieurs, en introduisant les r{\'e}p{\'e}titions maximales du n{\`e}me ordre (c{'}est-{\`a}-dire des r{\'e}p{\'e}titions maximales d{\'e}tect{\'e}es dans un ensemble de r{\'e}p{\'e}titions maximales). Les r{\'e}sultats exp{\'e}rimentaux montrent de meilleures performances avec des r{\'e}p{\'e}titions maximales, avec moins de donn{\'e}es que pour les approches fond{\'e}es sur les n-grammes.",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="brixtel-etal-2015-attribution">
<titleInfo>
<title>Attribution d’Auteur : approche multilingue fondée sur les répétitions maximales</title>
</titleInfo>
<name type="personal">
<namePart type="given">Romain</namePart>
<namePart type="family">Brixtel</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Charlotte</namePart>
<namePart type="family">Lecluze</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Gaël</namePart>
<namePart type="family">Lejeune</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2015-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Jean-Marc</namePart>
<namePart type="family">Lecarpentier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nadine</namePart>
<namePart type="family">Lucas</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Caen, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Cet article s’attaque à la tâche d’Attribution d’Auteur en contexte multilingue. Nous proposons une alternative aux méthodes supervisées fondées sur les n-grammes de caractères de longueurs variables : les répétitions maximales. Pour un texte donné, la liste de ses n-grammes de caractères contient des informations redondantes. A contrario, les répétitions maximales représentent l’ensemble des répétitions de ce texte de manière condensée. Nos expériences montrent que la redondance des n-grammes contribue à l’efficacité des techniques d’Attribution d’Auteur exploitant des sous-chaînes de caractères. Ce constat posé, nous proposons une fonction de pondération sur les traits donnés en entrée aux classifieurs, en introduisant les répétitions maximales du nème ordre (c’est-à-dire des répétitions maximales détectées dans un ensemble de répétitions maximales). Les résultats expérimentaux montrent de meilleures performances avec des répétitions maximales, avec moins de données que pour les approches fondées sur les n-grammes.</abstract>
<identifier type="citekey">brixtel-etal-2015-attribution</identifier>
<location>
<url>https://aclanthology.org/2015.jeptalnrecital-long.18</url>
</location>
<part>
<date>2015-06</date>
<extent unit="page">
<start>208</start>
<end>219</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Attribution d’Auteur : approche multilingue fondée sur les répétitions maximales
%A Brixtel, Romain
%A Lecluze, Charlotte
%A Lejeune, Gaël
%Y Lecarpentier, Jean-Marc
%Y Lucas, Nadine
%S Actes de la 22e conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2015
%8 June
%I ATALA
%C Caen, France
%F brixtel-etal-2015-attribution
%X Cet article s’attaque à la tâche d’Attribution d’Auteur en contexte multilingue. Nous proposons une alternative aux méthodes supervisées fondées sur les n-grammes de caractères de longueurs variables : les répétitions maximales. Pour un texte donné, la liste de ses n-grammes de caractères contient des informations redondantes. A contrario, les répétitions maximales représentent l’ensemble des répétitions de ce texte de manière condensée. Nos expériences montrent que la redondance des n-grammes contribue à l’efficacité des techniques d’Attribution d’Auteur exploitant des sous-chaînes de caractères. Ce constat posé, nous proposons une fonction de pondération sur les traits donnés en entrée aux classifieurs, en introduisant les répétitions maximales du nème ordre (c’est-à-dire des répétitions maximales détectées dans un ensemble de répétitions maximales). Les résultats expérimentaux montrent de meilleures performances avec des répétitions maximales, avec moins de données que pour les approches fondées sur les n-grammes.
%U https://aclanthology.org/2015.jeptalnrecital-long.18
%P 208-219
Markdown (Informal)
[Attribution d’Auteur : approche multilingue fondée sur les répétitions maximales](https://aclanthology.org/2015.jeptalnrecital-long.18) (Brixtel et al., JEP/TALN/RECITAL 2015)
ACL