@inproceedings{bendahman-etal-2023-quelles,
title = "Quelles {\'e}volutions sur cette loi ? Entre abstraction et hallucination dans le domaine du r{\'e}sum{\'e} de textes juridiques",
author = "Bendahman, Nihed and
Pinel-Sauvagnat, Karen and
Hubert, Gilles and
Billami, Mokhtar Boumedyen",
editor = {Zargayouna, Ha{\"\i}fa},
booktitle = "Actes de CORIA-TALN 2023. Actes de la 18e Conf{\'e}rence en Recherche d'Information et Applications (CORIA)",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://aclanthology.org/2023.jeptalnrecital-coria.2",
pages = "18--36",
abstract = "R{\'e}sumer automatiquement des textes juridiques permettrait aux charg{\'e}s de veille d{'}{\'e}viter une surcharge informationnelle et de gagner du temps sur une activit{\'e} particuli{\`e}rement chronophage. Dans cet article, nous pr{\'e}sentons un corpus de textes juridiques en fran{\c{c}}ais associ{\'e}s {\`a} des r{\'e}sum{\'e}s de r{\'e}f{\'e}rence produits par des experts, et cherchons {\`a} {\'e}tablir quels mod{\`e}les g{\'e}n{\'e}ratifs de r{\'e}sum{\'e} sont les plus int{\'e}ressants sur ces documents poss{\'e}dant de fortes sp{\'e}cificit{\'e}s m{\'e}tier. Nous {\'e}tudions quatre mod{\`e}les de l{'}{\'e}tat de l{'}art, que nous commen{\c{c}}ons {\`a} {\'e}valuer avec des m{\'e}triques traditionnelles. Afin de comprendre en d{\'e}tail la capacit{\'e} des mod{\`e}les {\`a} transcrire les sp{\'e}cificit{\'e}s m{\'e}tiers, nous effectuons une analyse plus fine sur les entit{\'e}s d{'}int{\'e}r{\^e}t. Nous {\'e}valuons notamment la couverture des r{\'e}sum{\'e}s en termes d{'}entit{\'e}s, mais aussi l{'}apparition d{'}informations non pr{\'e}sentes dans les documents d{'}origine, dites hallucinations. Les premiers r{\'e}sultats montrent que le contr{\^o}le des hallucinations est crucial dans les domaines de sp{\'e}cialit{\'e}, particuli{\`e}rement le juridique.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="bendahman-etal-2023-quelles">
<titleInfo>
<title>Quelles évolutions sur cette loi ? Entre abstraction et hallucination dans le domaine du résumé de textes juridiques</title>
</titleInfo>
<name type="personal">
<namePart type="given">Nihed</namePart>
<namePart type="family">Bendahman</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-Sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Gilles</namePart>
<namePart type="family">Hubert</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Mokhtar</namePart>
<namePart type="given">Boumedyen</namePart>
<namePart type="family">Billami</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2023-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de CORIA-TALN 2023. Actes de la 18e Conférence en Recherche d’Information et Applications (CORIA)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Haïfa</namePart>
<namePart type="family">Zargayouna</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Résumer automatiquement des textes juridiques permettrait aux chargés de veille d’éviter une surcharge informationnelle et de gagner du temps sur une activité particulièrement chronophage. Dans cet article, nous présentons un corpus de textes juridiques en français associés à des résumés de référence produits par des experts, et cherchons à établir quels modèles génératifs de résumé sont les plus intéressants sur ces documents possédant de fortes spécificités métier. Nous étudions quatre modèles de l’état de l’art, que nous commençons à évaluer avec des métriques traditionnelles. Afin de comprendre en détail la capacité des modèles à transcrire les spécificités métiers, nous effectuons une analyse plus fine sur les entités d’intérêt. Nous évaluons notamment la couverture des résumés en termes d’entités, mais aussi l’apparition d’informations non présentes dans les documents d’origine, dites hallucinations. Les premiers résultats montrent que le contrôle des hallucinations est crucial dans les domaines de spécialité, particulièrement le juridique.</abstract>
<identifier type="citekey">bendahman-etal-2023-quelles</identifier>
<location>
<url>https://aclanthology.org/2023.jeptalnrecital-coria.2</url>
</location>
<part>
<date>2023-6</date>
<extent unit="page">
<start>18</start>
<end>36</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Quelles évolutions sur cette loi ? Entre abstraction et hallucination dans le domaine du résumé de textes juridiques
%A Bendahman, Nihed
%A Pinel-Sauvagnat, Karen
%A Hubert, Gilles
%A Billami, Mokhtar Boumedyen
%Y Zargayouna, Haïfa
%S Actes de CORIA-TALN 2023. Actes de la 18e Conférence en Recherche d’Information et Applications (CORIA)
%D 2023
%8 June
%I ATALA
%C Paris, France
%G French
%F bendahman-etal-2023-quelles
%X Résumer automatiquement des textes juridiques permettrait aux chargés de veille d’éviter une surcharge informationnelle et de gagner du temps sur une activité particulièrement chronophage. Dans cet article, nous présentons un corpus de textes juridiques en français associés à des résumés de référence produits par des experts, et cherchons à établir quels modèles génératifs de résumé sont les plus intéressants sur ces documents possédant de fortes spécificités métier. Nous étudions quatre modèles de l’état de l’art, que nous commençons à évaluer avec des métriques traditionnelles. Afin de comprendre en détail la capacité des modèles à transcrire les spécificités métiers, nous effectuons une analyse plus fine sur les entités d’intérêt. Nous évaluons notamment la couverture des résumés en termes d’entités, mais aussi l’apparition d’informations non présentes dans les documents d’origine, dites hallucinations. Les premiers résultats montrent que le contrôle des hallucinations est crucial dans les domaines de spécialité, particulièrement le juridique.
%U https://aclanthology.org/2023.jeptalnrecital-coria.2
%P 18-36
Markdown (Informal)
[Quelles évolutions sur cette loi ? Entre abstraction et hallucination dans le domaine du résumé de textes juridiques](https://aclanthology.org/2023.jeptalnrecital-coria.2) (Bendahman et al., JEP/TALN/RECITAL 2023)
ACL