Clustering de résumés LLM guidés par l’utilisateur : vers une approche constructiviste et réaliste unifiée

Carl Hatoum, Catherine Combes, Virginie Fresse, Christophe Gravier, Mathieu Orzalesi


Abstract
Nous introduisons un cadre hybride combinant grands modèles de langage et techniques de regroupement pour extraire, résumer, évaluer et structurer automatiquement les connaissances de larges collections textuelles. Après avoir sélectionné, via une métrique d’entropie sémantique, la stratégie de prompt la plus stable, un LLM génère des résumés modulables qui font l’objet d’une évaluation factuelle assurant leur fiabilité. Ces résumés validés sont ensuite vectorisés, projetés en basse dimension et regroupés en thématiques. Optionnellement, un second LLM affine ensuite leurs libellés pour renforcer l’interprétabilité. Expérimentée sur un corpus majeur d’incidents aériens, cette approche augmente la cohérence et la granularité des clusters thématiques par rapport à une analyse directe des textes, ouvrant de nouvelles perspectives pour la recherche d’information et l’exploration de bases documentaires.
Anthology ID:
2025.jeptalnrecital-coria.7
Volume:
Actes de la 20e Conférence en Recherche d’Information et Applications (CORIA)
Month:
6
Year:
2025
Address:
Marseille, France
Editors:
Frédéric Bechet, Adrian-Gabriel Chifu, Karen Pinel-sauvagnat, Benoit Favre, Eliot Maes, Diana Nurbakova
Venue:
JEP/TALN/RECITAL
SIG:
Publisher:
ATALA \\& ARIA
Note:
Pages:
82–95
Language:
French
URL:
https://aclanthology.org/2025.jeptalnrecital-coria.7/
DOI:
Bibkey:
Cite (ACL):
Carl Hatoum, Catherine Combes, Virginie Fresse, Christophe Gravier, and Mathieu Orzalesi. 2025. Clustering de résumés LLM guidés par l’utilisateur : vers une approche constructiviste et réaliste unifiée. In Actes de la 20e Conférence en Recherche d’Information et Applications (CORIA), pages 82–95, Marseille, France. ATALA \\& ARIA.
Cite (Informal):
Clustering de résumés LLM guidés par l’utilisateur : vers une approche constructiviste et réaliste unifiée (Hatoum et al., JEP/TALN/RECITAL 2025)
Copy Citation:
PDF:
https://aclanthology.org/2025.jeptalnrecital-coria.7.pdf