@inproceedings{maachou-etal-2025-supervision,
title = "Supervision faible pour la classification des relations discursives",
author = "Maachou, Khalil and
Braud, Chlo{\'e} and
Muller, Philippe",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 32{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-taln.42/",
pages = "697--714",
language = "fra",
abstract = "L{'}identification des relations discursives est importante pour comprendre les liens s{\'e}mantiques qui structurent un texte, mais cette t{\^a}che souffre d{'}un manque de donn{\'e}es qui limite les performances. D{'}un autre c{\^o}t{\'e}, de nombreux corpus discursifs existent : les divergences entre les projets d{'}annotation emp{\^e}chent cependant de combiner directement ces jeux de donn{\'e}es {\`a} l{'}entra{\^i}nement. Nous proposons de r{\'e}soudre ce probl{\`e}me en exploitant le cadre de la supervision faible, dont l{'}objectif est de g{\'e}n{\'e}rer des annotations {\`a} partir de sources vari{\'e}es, comme des heuristiques ou des mod{\`e}les pr{\'e}-entra{\^i}n{\'e}s. Ces annotations bruit{\'e}es et partielles sont ensuite combin{\'e}es pour entra{\^i}ner un mod{\`e}le sur la t{\^a}che. En combinant cette m{\'e}thode avec des strat{\'e}gies permettant de g{\'e}rer les diff{\'e}rences dans les jeux d'{\'e}tiquettes, nous d{\'e}montrons qu{'}il est possible d{'}obtenir des performances proches d{'}un syst{\`e}me enti{\`e}rement supervis{\'e} en s{'}appuyant sur une tr{\`e}s petite partie des donn{\'e}es d{'}origine, ouvrant ainsi des perspectives d{'}am{\'e}lioration pour des domaines ou des langages {\`a} faibles ressources."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="maachou-etal-2025-supervision">
<titleInfo>
<title>Supervision faible pour la classification des relations discursives</title>
</titleInfo>
<name type="personal">
<namePart type="given">Khalil</namePart>
<namePart type="family">Maachou</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Chloé</namePart>
<namePart type="family">Braud</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Philippe</namePart>
<namePart type="family">Muller</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>L’identification des relations discursives est importante pour comprendre les liens sémantiques qui structurent un texte, mais cette tâche souffre d’un manque de données qui limite les performances. D’un autre côté, de nombreux corpus discursifs existent : les divergences entre les projets d’annotation empêchent cependant de combiner directement ces jeux de données à l’entraînement. Nous proposons de résoudre ce problème en exploitant le cadre de la supervision faible, dont l’objectif est de générer des annotations à partir de sources variées, comme des heuristiques ou des modèles pré-entraînés. Ces annotations bruitées et partielles sont ensuite combinées pour entraîner un modèle sur la tâche. En combinant cette méthode avec des stratégies permettant de gérer les différences dans les jeux d’étiquettes, nous démontrons qu’il est possible d’obtenir des performances proches d’un système entièrement supervisé en s’appuyant sur une très petite partie des données d’origine, ouvrant ainsi des perspectives d’amélioration pour des domaines ou des langages à faibles ressources.</abstract>
<identifier type="citekey">maachou-etal-2025-supervision</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-taln.42/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>697</start>
<end>714</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Supervision faible pour la classification des relations discursives
%A Maachou, Khalil
%A Braud, Chloé
%A Muller, Philippe
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F maachou-etal-2025-supervision
%X L’identification des relations discursives est importante pour comprendre les liens sémantiques qui structurent un texte, mais cette tâche souffre d’un manque de données qui limite les performances. D’un autre côté, de nombreux corpus discursifs existent : les divergences entre les projets d’annotation empêchent cependant de combiner directement ces jeux de données à l’entraînement. Nous proposons de résoudre ce problème en exploitant le cadre de la supervision faible, dont l’objectif est de générer des annotations à partir de sources variées, comme des heuristiques ou des modèles pré-entraînés. Ces annotations bruitées et partielles sont ensuite combinées pour entraîner un modèle sur la tâche. En combinant cette méthode avec des stratégies permettant de gérer les différences dans les jeux d’étiquettes, nous démontrons qu’il est possible d’obtenir des performances proches d’un système entièrement supervisé en s’appuyant sur une très petite partie des données d’origine, ouvrant ainsi des perspectives d’amélioration pour des domaines ou des langages à faibles ressources.
%U https://aclanthology.org/2025.jeptalnrecital-taln.42/
%P 697-714
Markdown (Informal)
[Supervision faible pour la classification des relations discursives](https://aclanthology.org/2025.jeptalnrecital-taln.42/) (Maachou et al., JEP/TALN/RECITAL 2025)
ACL