@inproceedings{khessiba-etal-2025-detection,
title = "D{\'e}tection d{'}Hallucinations dans les Dossiers M{\'e}dicaux G{\'e}n{\'e}r{\'e}s Automatiquement : Une Approche d{'}Optimisation pour les Couches S{\'e}mantiques et les Seuils Adaptatifs",
author = "Khessiba, Souhir and
Alavoine, Nad{\`e}ge and
Forest, Damien",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes de l'atelier Traitement du langage m{\'e}dical {\`a} l'{\'e}poque des LLMs 2025 (MLP-LLM)",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-mlpllm.1/",
pages = "1--13",
language = "fra",
abstract = "Les Mod{\`e}les de Langage (LLM) sont susceptibles aux hallucinations, g{\'e}n{\'e}rant parfois des informations inexactes d{'}o{\`u} un risque non n{\'e}gligeable, notamment dans le domaine m{\'e}dical o{\`u} la fiabilit{\'e} est essentielle. Cet article aborde deux objectifs : am{\'e}liorer la qualit{\'e} des dossiers m{\'e}dicaux et renforcer la fiabilit{\'e} des cohortes de recherche. Nous pr{\'e}sentons un syst{\`e}me de d{\'e}tection des hallucinations dans les r{\'e}sum{\'e}s m{\'e}dicaux g{\'e}n{\'e}r{\'e}s par IA en optimisant les couches s{\'e}mantiques de BERT. Notre m{\'e}thodologie exploite BERT Score pour {\'e}valuer la similarit{\'e} entre les phrases des rapports g{\'e}n{\'e}r{\'e}s et des transcriptions originales. Notre contribution principale introduit un m{\'e}canisme {\`a} double seuil critique et alerte optimis{\'e} par l{'}algorithme Tree Parzen Estimator, contrairement aux approches traditionnelles {\`a} seuil unique. Les r{\'e}sultats d{\'e}montrent des am{\'e}liorations significatives dans la d{\'e}tection des hallucinations, avec une pr{\'e}cision et un rappel sup{\'e}rieur aux m{\'e}thodes de r{\'e}f{\'e}rence. Bien que notre {\'e}tude soit limit{\'e}e {\`a} la langue fran{\c{c}}aise, le syst{\`e}me propos{\'e} assure am{\'e}liore la fiabilit{\'e} des informations m{\'e}dicales, r{\'e}pondant aux objectifs d{'}am{\'e}lioration de la qualit{\'e} documentaire et d{'}int{\'e}grit{\'e} des donn{\'e}es de recherche."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="khessiba-etal-2025-detection">
<titleInfo>
<title>Détection d’Hallucinations dans les Dossiers Médicaux Générés Automatiquement : Une Approche d’Optimisation pour les Couches Sémantiques et les Seuils Adaptatifs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Souhir</namePart>
<namePart type="family">Khessiba</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nadège</namePart>
<namePart type="family">Alavoine</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Damien</namePart>
<namePart type="family">Forest</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de l’atelier Traitement du langage médical à l’époque des LLMs 2025 (MLP-LLM)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les Modèles de Langage (LLM) sont susceptibles aux hallucinations, générant parfois des informations inexactes d’où un risque non négligeable, notamment dans le domaine médical où la fiabilité est essentielle. Cet article aborde deux objectifs : améliorer la qualité des dossiers médicaux et renforcer la fiabilité des cohortes de recherche. Nous présentons un système de détection des hallucinations dans les résumés médicaux générés par IA en optimisant les couches sémantiques de BERT. Notre méthodologie exploite BERT Score pour évaluer la similarité entre les phrases des rapports générés et des transcriptions originales. Notre contribution principale introduit un mécanisme à double seuil critique et alerte optimisé par l’algorithme Tree Parzen Estimator, contrairement aux approches traditionnelles à seuil unique. Les résultats démontrent des améliorations significatives dans la détection des hallucinations, avec une précision et un rappel supérieur aux méthodes de référence. Bien que notre étude soit limitée à la langue française, le système proposé assure améliore la fiabilité des informations médicales, répondant aux objectifs d’amélioration de la qualité documentaire et d’intégrité des données de recherche.</abstract>
<identifier type="citekey">khessiba-etal-2025-detection</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-mlpllm.1/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>1</start>
<end>13</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Détection d’Hallucinations dans les Dossiers Médicaux Générés Automatiquement : Une Approche d’Optimisation pour les Couches Sémantiques et les Seuils Adaptatifs
%A Khessiba, Souhir
%A Alavoine, Nadège
%A Forest, Damien
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes de l’atelier Traitement du langage médical à l’époque des LLMs 2025 (MLP-LLM)
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F khessiba-etal-2025-detection
%X Les Modèles de Langage (LLM) sont susceptibles aux hallucinations, générant parfois des informations inexactes d’où un risque non négligeable, notamment dans le domaine médical où la fiabilité est essentielle. Cet article aborde deux objectifs : améliorer la qualité des dossiers médicaux et renforcer la fiabilité des cohortes de recherche. Nous présentons un système de détection des hallucinations dans les résumés médicaux générés par IA en optimisant les couches sémantiques de BERT. Notre méthodologie exploite BERT Score pour évaluer la similarité entre les phrases des rapports générés et des transcriptions originales. Notre contribution principale introduit un mécanisme à double seuil critique et alerte optimisé par l’algorithme Tree Parzen Estimator, contrairement aux approches traditionnelles à seuil unique. Les résultats démontrent des améliorations significatives dans la détection des hallucinations, avec une précision et un rappel supérieur aux méthodes de référence. Bien que notre étude soit limitée à la langue française, le système proposé assure améliore la fiabilité des informations médicales, répondant aux objectifs d’amélioration de la qualité documentaire et d’intégrité des données de recherche.
%U https://aclanthology.org/2025.jeptalnrecital-mlpllm.1/
%P 1-13
Markdown (Informal)
[Détection d’Hallucinations dans les Dossiers Médicaux Générés Automatiquement : Une Approche d’Optimisation pour les Couches Sémantiques et les Seuils Adaptatifs](https://aclanthology.org/2025.jeptalnrecital-mlpllm.1/) (Khessiba et al., JEP/TALN/RECITAL 2025)
ACL