@inproceedings{hatoum-etal-2025-clustering,
title = "Clustering de r{\'e}sum{\'e}s {LLM} guid{\'e}s par l{'}utilisateur : vers une approche constructiviste et r{\'e}aliste unifi{\'e}e",
author = "Hatoum, Carl and
Combes, Catherine and
Fresse, Virginie and
Gravier, Christophe and
Orzalesi, Mathieu",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes de la 20e Conf{\'e}rence en Recherche d{'}Information et Applications (CORIA)",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-coria.7/",
pages = "82--95",
language = "fra",
abstract = "Nous introduisons un cadre hybride combinant grands mod{\`e}les de langage et techniques de regroupement pour extraire, r{\'e}sumer, {\'e}valuer et structurer automatiquement les connaissances de larges collections textuelles. Apr{\`e}s avoir s{\'e}lectionn{\'e}, via une m{\'e}trique d{'}entropie s{\'e}mantique, la strat{\'e}gie de prompt la plus stable, un LLM g{\'e}n{\`e}re des r{\'e}sum{\'e}s modulables qui font l{'}objet d{'}une {\'e}valuation factuelle assurant leur fiabilit{\'e}. Ces r{\'e}sum{\'e}s valid{\'e}s sont ensuite vectoris{\'e}s, projet{\'e}s en basse dimension et regroup{\'e}s en th{\'e}matiques. Optionnellement, un second LLM affine ensuite leurs libell{\'e}s pour renforcer l{'}interpr{\'e}tabilit{\'e}. Exp{\'e}riment{\'e}e sur un corpus majeur d{'}incidents a{\'e}riens, cette approche augmente la coh{\'e}rence et la granularit{\'e} des clusters th{\'e}matiques par rapport {\`a} une analyse directe des textes, ouvrant de nouvelles perspectives pour la recherche d{'}information et l{'}exploration de bases documentaires."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="hatoum-etal-2025-clustering">
<titleInfo>
<title>Clustering de résumés LLM guidés par l’utilisateur : vers une approche constructiviste et réaliste unifiée</title>
</titleInfo>
<name type="personal">
<namePart type="given">Carl</namePart>
<namePart type="family">Hatoum</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Catherine</namePart>
<namePart type="family">Combes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Virginie</namePart>
<namePart type="family">Fresse</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Christophe</namePart>
<namePart type="family">Gravier</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Mathieu</namePart>
<namePart type="family">Orzalesi</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 20e Conférence en Recherche d’Information et Applications (CORIA)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Nous introduisons un cadre hybride combinant grands modèles de langage et techniques de regroupement pour extraire, résumer, évaluer et structurer automatiquement les connaissances de larges collections textuelles. Après avoir sélectionné, via une métrique d’entropie sémantique, la stratégie de prompt la plus stable, un LLM génère des résumés modulables qui font l’objet d’une évaluation factuelle assurant leur fiabilité. Ces résumés validés sont ensuite vectorisés, projetés en basse dimension et regroupés en thématiques. Optionnellement, un second LLM affine ensuite leurs libellés pour renforcer l’interprétabilité. Expérimentée sur un corpus majeur d’incidents aériens, cette approche augmente la cohérence et la granularité des clusters thématiques par rapport à une analyse directe des textes, ouvrant de nouvelles perspectives pour la recherche d’information et l’exploration de bases documentaires.</abstract>
<identifier type="citekey">hatoum-etal-2025-clustering</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-coria.7/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>82</start>
<end>95</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Clustering de résumés LLM guidés par l’utilisateur : vers une approche constructiviste et réaliste unifiée
%A Hatoum, Carl
%A Combes, Catherine
%A Fresse, Virginie
%A Gravier, Christophe
%A Orzalesi, Mathieu
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes de la 20e Conférence en Recherche d’Information et Applications (CORIA)
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F hatoum-etal-2025-clustering
%X Nous introduisons un cadre hybride combinant grands modèles de langage et techniques de regroupement pour extraire, résumer, évaluer et structurer automatiquement les connaissances de larges collections textuelles. Après avoir sélectionné, via une métrique d’entropie sémantique, la stratégie de prompt la plus stable, un LLM génère des résumés modulables qui font l’objet d’une évaluation factuelle assurant leur fiabilité. Ces résumés validés sont ensuite vectorisés, projetés en basse dimension et regroupés en thématiques. Optionnellement, un second LLM affine ensuite leurs libellés pour renforcer l’interprétabilité. Expérimentée sur un corpus majeur d’incidents aériens, cette approche augmente la cohérence et la granularité des clusters thématiques par rapport à une analyse directe des textes, ouvrant de nouvelles perspectives pour la recherche d’information et l’exploration de bases documentaires.
%U https://aclanthology.org/2025.jeptalnrecital-coria.7/
%P 82-95
Markdown (Informal)
[Clustering de résumés LLM guidés par l’utilisateur : vers une approche constructiviste et réaliste unifiée](https://aclanthology.org/2025.jeptalnrecital-coria.7/) (Hatoum et al., JEP/TALN/RECITAL 2025)
ACL