@inproceedings{alrahabi-etal-2025-extraction,
title = "Extraction de mots-cl{\'e}s {\`a} partir d{'}articles scientifiques: comparaison entre mod{\`e}les traditionnels et mod{\`e}les de langue",
author = "Alrahabi, Motasem and
Ben Mansour, Nacef and
Rahimi, Hamed",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 32{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : traductions d'articles publi{\'e}s",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-trad.12/",
pages = "15--27",
language = "fra",
abstract = "L{'}extraction automatique des mots-cl{\'e}s est cruciale pour r{\'e}sumer le contenu des documents et affiner la recherche d{'}informations. Dans cette {\'e}tude, nous comparons les performances de plusieurs mod{\`e}les d{'}extraction et de g{\'e}n{\'e}ration de mots-cl{\'e}s appliqu{\'e}s aux r{\'e}sum{\'e}s d{'}articles issus des archives HAL : des approches bas{\'e}es sur des statistiques et des mod{\`e}les vectoriels, ainsi que des approches g{\'e}n{\'e}ratives modernes utilisant les LLMs. Les r{\'e}sultats montrent que les LLMs surpassent largement les m{\'e}thodes traditionnelles en termes de pr{\'e}cision et de pertinence, m{\^e}me en configuration zero-shot, et que l{'}inclusion des titres d{'}articles am{\'e}liore significativement les scores F1. Nous introduisons {\'e}galement une nouvelle m{\'e}trique pour {\'e}valuer les performances des LLMs en tenant compte des co{\^u}ts de traitement, offrant ainsi une perspective {\'e}quilibr{\'e}e entre efficacit{\'e} et co{\^u}t."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="alrahabi-etal-2025-extraction">
<titleInfo>
<title>Extraction de mots-clés à partir d’articles scientifiques: comparaison entre modèles traditionnels et modèles de langue</title>
</titleInfo>
<name type="personal">
<namePart type="given">Motasem</namePart>
<namePart type="family">Alrahabi</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nacef</namePart>
<namePart type="family">Ben Mansour</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Hamed</namePart>
<namePart type="family">Rahimi</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : traductions d’articles publiés</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>L’extraction automatique des mots-clés est cruciale pour résumer le contenu des documents et affiner la recherche d’informations. Dans cette étude, nous comparons les performances de plusieurs modèles d’extraction et de génération de mots-clés appliqués aux résumés d’articles issus des archives HAL : des approches basées sur des statistiques et des modèles vectoriels, ainsi que des approches génératives modernes utilisant les LLMs. Les résultats montrent que les LLMs surpassent largement les méthodes traditionnelles en termes de précision et de pertinence, même en configuration zero-shot, et que l’inclusion des titres d’articles améliore significativement les scores F1. Nous introduisons également une nouvelle métrique pour évaluer les performances des LLMs en tenant compte des coûts de traitement, offrant ainsi une perspective équilibrée entre efficacité et coût.</abstract>
<identifier type="citekey">alrahabi-etal-2025-extraction</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-trad.12/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>15</start>
<end>27</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Extraction de mots-clés à partir d’articles scientifiques: comparaison entre modèles traditionnels et modèles de langue
%A Alrahabi, Motasem
%A Ben Mansour, Nacef
%A Rahimi, Hamed
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : traductions d’articles publiés
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F alrahabi-etal-2025-extraction
%X L’extraction automatique des mots-clés est cruciale pour résumer le contenu des documents et affiner la recherche d’informations. Dans cette étude, nous comparons les performances de plusieurs modèles d’extraction et de génération de mots-clés appliqués aux résumés d’articles issus des archives HAL : des approches basées sur des statistiques et des modèles vectoriels, ainsi que des approches génératives modernes utilisant les LLMs. Les résultats montrent que les LLMs surpassent largement les méthodes traditionnelles en termes de précision et de pertinence, même en configuration zero-shot, et que l’inclusion des titres d’articles améliore significativement les scores F1. Nous introduisons également une nouvelle métrique pour évaluer les performances des LLMs en tenant compte des coûts de traitement, offrant ainsi une perspective équilibrée entre efficacité et coût.
%U https://aclanthology.org/2025.jeptalnrecital-trad.12/
%P 15-27
Markdown (Informal)
[Extraction de mots-clés à partir d’articles scientifiques: comparaison entre modèles traditionnels et modèles de langue](https://aclanthology.org/2025.jeptalnrecital-trad.12/) (Alrahabi et al., JEP/TALN/RECITAL 2025)
ACL