Evaluation et analyse des performances des grands modèles de langue sur des épreuves d’examen de médecine français

Adrien Kuhnast; Loic Verlingue

Evaluation et analyse des performances des grands modèles de langue sur des épreuves d’examen de médecine français

Abstract

Les grands modèles de langue (GMLs) ont démontré leur capacité à répondre correctement à des questions de médecine sur des bases anglaises. Or, leur paramétrage par apprentissage profond les soumet au biais linguistique et doivent ainsi être évalués dans la langue de l’utilisateur. Nous avons évalué des GMLs sur 278 questions à choix multiples provenant d’examens de médecine (Lyon-Est 2024) de différentes spécialités et respectant les recommandations nationales. Nos résultats montrent que les GMLs sont aussi bons que les étudiants mais qu’il existe d’importantes variations selon les spécialités. Améliorer la consigne en précisant de s’appuyer sur les recommandations françaises modifie significativement les notes obtenues ce qui démontre la nécessité d’éprouver les GMLs selon différents contextes géographiques et linguistiques. Nous avons également analysé le type d’erreur que font les GMLs ce qui ouvre la porte à des améliorations plus ciblées.

Anthology ID:: 2025.jeptalnrecital-mlpllm.2
Volume:: Actes de l'atelier Traitement du langage médical à l’époque des LLMs 2025 (MLP-LLM)
Month:: 6
Year:: 2025
Address:: Marseille, France
Editors:: Frédéric Bechet, Adrian-Gabriel Chifu, Karen Pinel-sauvagnat, Benoit Favre, Eliot Maes, Diana Nurbakova
Venue:: JEP/TALN/RECITAL
SIG:
Publisher:: ATALA \\& ARIA
Note:
Pages:: 14–24
Language:: French
URL:: https://aclanthology.org/2025.jeptalnrecital-mlpllm.2/
DOI:
Bibkey:
Cite (ACL):: Adrien Kuhnast and Loic Verlingue. 2025. Evaluation et analyse des performances des grands modèles de langue sur des épreuves d’examen de médecine français. In Actes de l'atelier Traitement du langage médical à l’époque des LLMs 2025 (MLP-LLM), pages 14–24, Marseille, France. ATALA \\& ARIA.
Cite (Informal):: Evaluation et analyse des performances des grands modèles de langue sur des épreuves d’examen de médecine français (Kuhnast & Verlingue, JEP/TALN/RECITAL 2025)
Copy Citation:
PDF:: https://aclanthology.org/2025.jeptalnrecital-mlpllm.2.pdf

PDF Cite Search Fix data