@inproceedings{aguiar-etal-2025-inference,
title = "Inf{\'e}rence en langue naturelle appliqu{\'e}e au recrutement de patients pour les essais cliniques : le point de vue du patient",
author = "Aguiar, Mathilde and
Zweigenbaum, Pierre and
Naderi, Nona",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 32{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : traductions d'articles publi{\'e}s",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-trad.18/",
pages = "34--35",
language = "fra",
abstract = "Recruter des patients pour les essais cliniques est long et complexe. Habituellement, le processus de recrutement est initi{\'e} par un professionnel de sant{\'e} qui propose {\`a} un patient de participer {\`a} l{'}essai clinique. Promouvoir les essais directement aux patients via des plateformes en ligne pourrait aider {\`a} en atteindre un plus grand nombre. Dans cette {\'e}tude, nous nous int{\'e}ressons au cas o{\`u} le patient est l{'}initiateur de la d{\'e}marche et veut savoir s{'}il est {\'e}ligible {\`a} un essai clinique, tout cela en utilisant son propre langage patient. Pour d{\'e}terminer si l{'}utilisation d{'}un tel langage permet tout de m{\^e}me au mod{\`e}le de langue de d{\'e}terminer l'{\'e}gilibilit{\'e} du patient pour l{'}essai clinique, nous construisons la t{\^a}che Natural Language Inference for Patient Recrutement (NLI4PR). Pour cela nous adaptons le jeu de donn{\'e}es TREC 2022 Clinical Trial Track en r{\'e}{\'e}crivant manuellement les profils m{\'e}dicaux en langage patient. Nous extrayons {\'e}galement les essais cliniques o{\`u} les patients {\'e}taient labellis{\'e}s {\guillemotleft} {\'e}ligible {\guillemotright} ou {\guillemotleft} exclu {\guillemotright}. Nous soumettons des amorces {\`a} plusieurs grands mod{\`e}les de langue, et obtenons un score F1 compris entre 56,6 et 71,8 avec le langage patient, contre 64,7 {\`a} 73,1 pour du langage m{\'e}dical. Nous observons que l{'}utilisation du langage patient ne m{\`e}ne qu'{\`a} une d{\'e}gradation de performance relativement petite pour notre meilleur mod{\`e}le. Cela sugg{\`e}re qu{'}avoir le patient en tant que point de d{\'e}part du recrutement pourrait {\^e}tre r{\'e}alisable. Nos scripts ainsi que nos jeux de donn{\'e}es sont disponibles sur Github et HuggingFace(Aguiar et al. , 2025)."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="aguiar-etal-2025-inference">
<titleInfo>
<title>Inférence en langue naturelle appliquée au recrutement de patients pour les essais cliniques : le point de vue du patient</title>
</titleInfo>
<name type="personal">
<namePart type="given">Mathilde</namePart>
<namePart type="family">Aguiar</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Pierre</namePart>
<namePart type="family">Zweigenbaum</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nona</namePart>
<namePart type="family">Naderi</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : traductions d’articles publiés</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Recruter des patients pour les essais cliniques est long et complexe. Habituellement, le processus de recrutement est initié par un professionnel de santé qui propose à un patient de participer à l’essai clinique. Promouvoir les essais directement aux patients via des plateformes en ligne pourrait aider à en atteindre un plus grand nombre. Dans cette étude, nous nous intéressons au cas où le patient est l’initiateur de la démarche et veut savoir s’il est éligible à un essai clinique, tout cela en utilisant son propre langage patient. Pour déterminer si l’utilisation d’un tel langage permet tout de même au modèle de langue de déterminer l’égilibilité du patient pour l’essai clinique, nous construisons la tâche Natural Language Inference for Patient Recrutement (NLI4PR). Pour cela nous adaptons le jeu de données TREC 2022 Clinical Trial Track en réécrivant manuellement les profils médicaux en langage patient. Nous extrayons également les essais cliniques où les patients étaient labellisés \guillemotleft éligible \guillemotright ou \guillemotleft exclu \guillemotright. Nous soumettons des amorces à plusieurs grands modèles de langue, et obtenons un score F1 compris entre 56,6 et 71,8 avec le langage patient, contre 64,7 à 73,1 pour du langage médical. Nous observons que l’utilisation du langage patient ne mène qu’à une dégradation de performance relativement petite pour notre meilleur modèle. Cela suggère qu’avoir le patient en tant que point de départ du recrutement pourrait être réalisable. Nos scripts ainsi que nos jeux de données sont disponibles sur Github et HuggingFace(Aguiar et al. , 2025).</abstract>
<identifier type="citekey">aguiar-etal-2025-inference</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-trad.18/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>34</start>
<end>35</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Inférence en langue naturelle appliquée au recrutement de patients pour les essais cliniques : le point de vue du patient
%A Aguiar, Mathilde
%A Zweigenbaum, Pierre
%A Naderi, Nona
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 2 : traductions d’articles publiés
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F aguiar-etal-2025-inference
%X Recruter des patients pour les essais cliniques est long et complexe. Habituellement, le processus de recrutement est initié par un professionnel de santé qui propose à un patient de participer à l’essai clinique. Promouvoir les essais directement aux patients via des plateformes en ligne pourrait aider à en atteindre un plus grand nombre. Dans cette étude, nous nous intéressons au cas où le patient est l’initiateur de la démarche et veut savoir s’il est éligible à un essai clinique, tout cela en utilisant son propre langage patient. Pour déterminer si l’utilisation d’un tel langage permet tout de même au modèle de langue de déterminer l’égilibilité du patient pour l’essai clinique, nous construisons la tâche Natural Language Inference for Patient Recrutement (NLI4PR). Pour cela nous adaptons le jeu de données TREC 2022 Clinical Trial Track en réécrivant manuellement les profils médicaux en langage patient. Nous extrayons également les essais cliniques où les patients étaient labellisés \guillemotleft éligible \guillemotright ou \guillemotleft exclu \guillemotright. Nous soumettons des amorces à plusieurs grands modèles de langue, et obtenons un score F1 compris entre 56,6 et 71,8 avec le langage patient, contre 64,7 à 73,1 pour du langage médical. Nous observons que l’utilisation du langage patient ne mène qu’à une dégradation de performance relativement petite pour notre meilleur modèle. Cela suggère qu’avoir le patient en tant que point de départ du recrutement pourrait être réalisable. Nos scripts ainsi que nos jeux de données sont disponibles sur Github et HuggingFace(Aguiar et al. , 2025).
%U https://aclanthology.org/2025.jeptalnrecital-trad.18/
%P 34-35
Markdown (Informal)
[Inférence en langue naturelle appliquée au recrutement de patients pour les essais cliniques : le point de vue du patient](https://aclanthology.org/2025.jeptalnrecital-trad.18/) (Aguiar et al., JEP/TALN/RECITAL 2025)
ACL