@inproceedings{bestgen-2009-quel,
title = "Quel indice pour mesurer l{'}efficacit{\'e} en segmentation de textes?",
author = "Bestgen, Yves",
editor = "Nazarenko, Adeline and
Poibeau, Thierry",
booktitle = "Actes de la 16{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles longs",
month = jun,
year = "2009",
address = "Senlis, France",
publisher = "ATALA",
url = "https://aclanthology.org/2009.jeptalnrecital-long.18",
pages = "171--180",
abstract = "L{'}{\'e}valuation de l{'}efficacit{\'e} d{'}algorithmes de segmentation th{\'e}matique est g{\'e}n{\'e}ralement effectu{\'e}e en quantifiant le degr{\'e} d{'}accord entre une segmentation hypoth{\'e}tique et une segmentation de r{\'e}f{\'e}rence. Les indices classiques de pr{\'e}cision et de rappel {\'e}tant peu adapt{\'e}s {\`a} ce domaine, WindowDiff (Pevzner, Hearst, 2002) s{'}est impos{\'e} comme l{'}indice de r{\'e}f{\'e}rence. Une analyse de cet indice montre toutefois qu{'}il pr{\'e}sente plusieurs limitations. L{'}objectif de ce rapport est d{'}{\'e}valuer un indice propos{\'e} par Bookstein, Kulyukin et Raita (2002), la distance de Hamming g{\'e}n{\'e}ralis{\'e}e, qui est susceptible de rem{\'e}dier {\`a} celles-ci. Les analyses montrent que celui-ci conserve tous les avantages de WindowDiff sans les limitations. De plus, contrairement {\`a} WindowDiff, il pr{\'e}sente une interpr{\'e}tation simple puisqu{'}il correspond {\`a} une vraie distance entre les deux segmentations {\`a} comparer.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="bestgen-2009-quel">
<titleInfo>
<title>Quel indice pour mesurer l’efficacité en segmentation de textes?</title>
</titleInfo>
<name type="personal">
<namePart type="given">Yves</namePart>
<namePart type="family">Bestgen</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2009-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Adeline</namePart>
<namePart type="family">Nazarenko</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Poibeau</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Senlis, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>L’évaluation de l’efficacité d’algorithmes de segmentation thématique est généralement effectuée en quantifiant le degré d’accord entre une segmentation hypothétique et une segmentation de référence. Les indices classiques de précision et de rappel étant peu adaptés à ce domaine, WindowDiff (Pevzner, Hearst, 2002) s’est imposé comme l’indice de référence. Une analyse de cet indice montre toutefois qu’il présente plusieurs limitations. L’objectif de ce rapport est d’évaluer un indice proposé par Bookstein, Kulyukin et Raita (2002), la distance de Hamming généralisée, qui est susceptible de remédier à celles-ci. Les analyses montrent que celui-ci conserve tous les avantages de WindowDiff sans les limitations. De plus, contrairement à WindowDiff, il présente une interprétation simple puisqu’il correspond à une vraie distance entre les deux segmentations à comparer.</abstract>
<identifier type="citekey">bestgen-2009-quel</identifier>
<location>
<url>https://aclanthology.org/2009.jeptalnrecital-long.18</url>
</location>
<part>
<date>2009-06</date>
<extent unit="page">
<start>171</start>
<end>180</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Quel indice pour mesurer l’efficacité en segmentation de textes?
%A Bestgen, Yves
%Y Nazarenko, Adeline
%Y Poibeau, Thierry
%S Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles longs
%D 2009
%8 June
%I ATALA
%C Senlis, France
%G French
%F bestgen-2009-quel
%X L’évaluation de l’efficacité d’algorithmes de segmentation thématique est généralement effectuée en quantifiant le degré d’accord entre une segmentation hypothétique et une segmentation de référence. Les indices classiques de précision et de rappel étant peu adaptés à ce domaine, WindowDiff (Pevzner, Hearst, 2002) s’est imposé comme l’indice de référence. Une analyse de cet indice montre toutefois qu’il présente plusieurs limitations. L’objectif de ce rapport est d’évaluer un indice proposé par Bookstein, Kulyukin et Raita (2002), la distance de Hamming généralisée, qui est susceptible de remédier à celles-ci. Les analyses montrent que celui-ci conserve tous les avantages de WindowDiff sans les limitations. De plus, contrairement à WindowDiff, il présente une interprétation simple puisqu’il correspond à une vraie distance entre les deux segmentations à comparer.
%U https://aclanthology.org/2009.jeptalnrecital-long.18
%P 171-180
Markdown (Informal)
[Quel indice pour mesurer l’efficacité en segmentation de textes?](https://aclanthology.org/2009.jeptalnrecital-long.18) (Bestgen, JEP/TALN/RECITAL 2009)
ACL