@inproceedings{belfathi-etal-2025-le,
title = "Le r{\^o}le du contexte dans la classification s{\'e}quentielle de phrases pour les documents longs",
author = "Belfathi, Anas and
Hernandez, Nicolas and
Monceaux, Laura and
Dufour, Richard",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 32{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-taln.30/",
pages = "488--501",
language = "fra",
abstract = "La classification s{\'e}quentielle de phrases {\'e}tend la classification traditionnelle en int{\'e}grant un contexte plus large. Cependant, les approches de pointe rencontrent deux d{\'e}fis majeurs dans le traitement automatique des documents longs : les mod{\`e}les de langue pr{\'e}entra{\^i}n{\'e}s sont limit{\'e}s par des contraintes de longueur d{'}entr{\'e}e, tandis que les mod{\`e}les hi{\'e}rarchiques propos{\'e}s introduisent souvent du contenu non pertinent. Nous proposons une approche de recherche d{'}information au niveau du document visant {\`a} extraire uniquement le contexte le plus pertinent. Nous introduisons deux types d{'}heuristiques : S{\'e}quentiel , qui capture l{'}information locale, et S{\'e}lectif, qui s{\'e}lectionne les phrases les plus s{\'e}mantiquement similaires. Nos exp{\'e}riences sur trois corpus juridiques en anglais montrent que ces heuristiques am{\'e}liorent les performances. Les heuristiques s{\'e}quentielles surpassent les mod{\`e}les hi{\'e}rarchiques sur deux des trois jeux de donn{\'e}es. d{\'e}montrant l{'}apport du contexte cibl{\'e}."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="belfathi-etal-2025-le">
<titleInfo>
<title>Le rôle du contexte dans la classification séquentielle de phrases pour les documents longs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Anas</namePart>
<namePart type="family">Belfathi</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nicolas</namePart>
<namePart type="family">Hernandez</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Laura</namePart>
<namePart type="family">Monceaux</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Richard</namePart>
<namePart type="family">Dufour</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La classification séquentielle de phrases étend la classification traditionnelle en intégrant un contexte plus large. Cependant, les approches de pointe rencontrent deux défis majeurs dans le traitement automatique des documents longs : les modèles de langue préentraînés sont limités par des contraintes de longueur d’entrée, tandis que les modèles hiérarchiques proposés introduisent souvent du contenu non pertinent. Nous proposons une approche de recherche d’information au niveau du document visant à extraire uniquement le contexte le plus pertinent. Nous introduisons deux types d’heuristiques : Séquentiel , qui capture l’information locale, et Sélectif, qui sélectionne les phrases les plus sémantiquement similaires. Nos expériences sur trois corpus juridiques en anglais montrent que ces heuristiques améliorent les performances. Les heuristiques séquentielles surpassent les modèles hiérarchiques sur deux des trois jeux de données. démontrant l’apport du contexte ciblé.</abstract>
<identifier type="citekey">belfathi-etal-2025-le</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-taln.30/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>488</start>
<end>501</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Le rôle du contexte dans la classification séquentielle de phrases pour les documents longs
%A Belfathi, Anas
%A Hernandez, Nicolas
%A Monceaux, Laura
%A Dufour, Richard
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F belfathi-etal-2025-le
%X La classification séquentielle de phrases étend la classification traditionnelle en intégrant un contexte plus large. Cependant, les approches de pointe rencontrent deux défis majeurs dans le traitement automatique des documents longs : les modèles de langue préentraînés sont limités par des contraintes de longueur d’entrée, tandis que les modèles hiérarchiques proposés introduisent souvent du contenu non pertinent. Nous proposons une approche de recherche d’information au niveau du document visant à extraire uniquement le contexte le plus pertinent. Nous introduisons deux types d’heuristiques : Séquentiel , qui capture l’information locale, et Sélectif, qui sélectionne les phrases les plus sémantiquement similaires. Nos expériences sur trois corpus juridiques en anglais montrent que ces heuristiques améliorent les performances. Les heuristiques séquentielles surpassent les modèles hiérarchiques sur deux des trois jeux de données. démontrant l’apport du contexte ciblé.
%U https://aclanthology.org/2025.jeptalnrecital-taln.30/
%P 488-501
Markdown (Informal)
[Le rôle du contexte dans la classification séquentielle de phrases pour les documents longs](https://aclanthology.org/2025.jeptalnrecital-taln.30/) (Belfathi et al., JEP/TALN/RECITAL 2025)
ACL