Extraction de mots-clés à partir d’articles scientifiques: comparaison entre modèles traditionnels et modèles de langue

Motasem Alrahabi; Nacef Ben Mansour; Hamed Rahimi

Extraction de mots-clés à partir d’articles scientifiques: comparaison entre modèles traditionnels et modèles de langue

Motasem Alrahabi, Nacef Ben Mansour, Hamed Rahimi

Abstract

L’extraction automatique des mots-clés est cruciale pour résumer le contenu des documents et affiner la recherche d’informations. Dans cette étude, nous comparons les performances de plusieurs modèles d’extraction et de génération de mots-clés appliqués aux résumés d’articles issus des archives HAL : des approches basées sur des statistiques et des modèles vectoriels, ainsi que des approches génératives modernes utilisant les LLMs. Les résultats montrent que les LLMs surpassent largement les méthodes traditionnelles en termes de précision et de pertinence, même en configuration zero-shot, et que l’inclusion des titres d’articles améliore significativement les scores F1. Nous introduisons également une nouvelle métrique pour évaluer les performances des LLMs en tenant compte des coûts de traitement, offrant ainsi une perspective équilibrée entre efficacité et coût.

Anthology ID:: 2025.jeptalnrecital-trad.12
Volume:: Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : traductions d'articles publiés
Month:: 6
Year:: 2025
Address:: Marseille, France
Editors:: Frédéric Bechet, Adrian-Gabriel Chifu, Karen Pinel-sauvagnat, Benoit Favre, Eliot Maes, Diana Nurbakova
Venue:: JEP/TALN/RECITAL
SIG:
Publisher:: ATALA \\& ARIA
Note:
Pages:: 15–27
Language:: French
URL:: https://aclanthology.org/2025.jeptalnrecital-trad.12/
DOI:
Bibkey:
Cite (ACL):: Motasem Alrahabi, Nacef Ben Mansour, and Hamed Rahimi. 2025. Extraction de mots-clés à partir d’articles scientifiques: comparaison entre modèles traditionnels et modèles de langue. In Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : traductions d'articles publiés, pages 15–27, Marseille, France. ATALA \\& ARIA.
Cite (Informal):: Extraction de mots-clés à partir d’articles scientifiques: comparaison entre modèles traditionnels et modèles de langue (Alrahabi et al., JEP/TALN/RECITAL 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.jeptalnrecital-trad.12.pdf

PDF Cite Search Fix data