@inproceedings{bailly-etal-2021-classification,
title = "Classification multi-label de cas cliniques avec {C}amem{BERT} (Multi-label classification of clinical cases with {C}amem{BERT} )",
author = "Bailly, Alexandre and
Blanc, Corentin and
Guillotin, Thierry",
editor = "Grouin, Cyril and
Grabar, Natalia and
Illouz, Gabriel",
booktitle = "Actes de la 28e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Atelier D{\'E}fi Fouille de Textes (DEFT)",
month = "6",
year = "2021",
address = "Lille, France",
publisher = "ATALA",
url = "https://aclanthology.org/2021.jeptalnrecital-deft.2",
pages = "14--20",
abstract = "La quantit{\'e} de documents textuels m{\'e}dicaux allant grandissant, la n{\'e}cessit{\'e} d{'}en extraire automatiquement des informations concernant des patients devient de plus en plus grande. La pr{\'e}diction du profil clinique permet de gagner du temps pour le praticien tout en extrayant l{'}essentiel de l{'}information concernant un patient. Avec l{'}explosion du nombre de documents (m{\'e}dicaux ou non), des mod{\`e}les pr{\'e}-entra{\^\i}n{\'e}s tels que BERT pour l{'}anglais ou CamemBERT pour le fran{\c{c}}ais ont {\'e}merg{\'e}. L{'}utilisation de ces mod{\`e}les permet d{'}encoder contextuellement du texte afin de l{'}utiliser dans des r{\'e}seaux neuronaux pour notamment pr{\'e}dire des profils cliniques. Cet article vise {\`a} comparer diff{\'e}rentes m{\'e}thodes de pr{\'e}diction de profil clinique en se basant sur l{'}utilisation de CamemBERT. Dans un premier temps, uniquement du texte provenant de documents m{\'e}dicaux a {\'e}t{\'e} utilis{\'e}. Dans un second temps, des entit{\'e}s nomm{\'e}es ont {\'e}t{\'e} inject{\'e}es en plus du texte par concat{\'e}nation ou par sommation pond{\'e}r{\'e}e. Les r{\'e}sultats ont montr{\'e} un succ{\`e}s limit{\'e} et d{\'e}pendant de la pr{\'e}valence des chapitres {\`a} pr{\'e}dire dans le corpus ainsi qu{'}une d{\'e}gradation des performances lors de l{'}ajout des entit{\'e}s nomm{\'e}es.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="bailly-etal-2021-classification">
<titleInfo>
<title>Classification multi-label de cas cliniques avec CamemBERT (Multi-label classification of clinical cases with CamemBERT )</title>
</titleInfo>
<name type="personal">
<namePart type="given">Alexandre</namePart>
<namePart type="family">Bailly</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Corentin</namePart>
<namePart type="family">Blanc</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Guillotin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2021-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Atelier DÉfi Fouille de Textes (DEFT)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Cyril</namePart>
<namePart type="family">Grouin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Natalia</namePart>
<namePart type="family">Grabar</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Gabriel</namePart>
<namePart type="family">Illouz</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Lille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>La quantité de documents textuels médicaux allant grandissant, la nécessité d’en extraire automatiquement des informations concernant des patients devient de plus en plus grande. La prédiction du profil clinique permet de gagner du temps pour le praticien tout en extrayant l’essentiel de l’information concernant un patient. Avec l’explosion du nombre de documents (médicaux ou non), des modèles pré-entraînés tels que BERT pour l’anglais ou CamemBERT pour le français ont émergé. L’utilisation de ces modèles permet d’encoder contextuellement du texte afin de l’utiliser dans des réseaux neuronaux pour notamment prédire des profils cliniques. Cet article vise à comparer différentes méthodes de prédiction de profil clinique en se basant sur l’utilisation de CamemBERT. Dans un premier temps, uniquement du texte provenant de documents médicaux a été utilisé. Dans un second temps, des entités nommées ont été injectées en plus du texte par concaténation ou par sommation pondérée. Les résultats ont montré un succès limité et dépendant de la prévalence des chapitres à prédire dans le corpus ainsi qu’une dégradation des performances lors de l’ajout des entités nommées.</abstract>
<identifier type="citekey">bailly-etal-2021-classification</identifier>
<location>
<url>https://aclanthology.org/2021.jeptalnrecital-deft.2</url>
</location>
<part>
<date>2021-6</date>
<extent unit="page">
<start>14</start>
<end>20</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Classification multi-label de cas cliniques avec CamemBERT (Multi-label classification of clinical cases with CamemBERT )
%A Bailly, Alexandre
%A Blanc, Corentin
%A Guillotin, Thierry
%Y Grouin, Cyril
%Y Grabar, Natalia
%Y Illouz, Gabriel
%S Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Atelier DÉfi Fouille de Textes (DEFT)
%D 2021
%8 June
%I ATALA
%C Lille, France
%G French
%F bailly-etal-2021-classification
%X La quantité de documents textuels médicaux allant grandissant, la nécessité d’en extraire automatiquement des informations concernant des patients devient de plus en plus grande. La prédiction du profil clinique permet de gagner du temps pour le praticien tout en extrayant l’essentiel de l’information concernant un patient. Avec l’explosion du nombre de documents (médicaux ou non), des modèles pré-entraînés tels que BERT pour l’anglais ou CamemBERT pour le français ont émergé. L’utilisation de ces modèles permet d’encoder contextuellement du texte afin de l’utiliser dans des réseaux neuronaux pour notamment prédire des profils cliniques. Cet article vise à comparer différentes méthodes de prédiction de profil clinique en se basant sur l’utilisation de CamemBERT. Dans un premier temps, uniquement du texte provenant de documents médicaux a été utilisé. Dans un second temps, des entités nommées ont été injectées en plus du texte par concaténation ou par sommation pondérée. Les résultats ont montré un succès limité et dépendant de la prévalence des chapitres à prédire dans le corpus ainsi qu’une dégradation des performances lors de l’ajout des entités nommées.
%U https://aclanthology.org/2021.jeptalnrecital-deft.2
%P 14-20
Markdown (Informal)
[Classification multi-label de cas cliniques avec CamemBERT (Multi-label classification of clinical cases with CamemBERT )](https://aclanthology.org/2021.jeptalnrecital-deft.2) (Bailly et al., JEP/TALN/RECITAL 2021)
ACL