Clément Gilavert
2021
Classification multilabel de concepts médicaux pour l’identification du profil clinique du patient (Multilabel classification of medical concepts for patient’s clinical profile identification )
Christel Gérardin
|
Pascal Vaillant
|
Perceval Wajsbürt
|
Clément Gilavert
|
Ali Bellamine
|
Emmanuelle Kempf
|
Xavier Tannier
Actes de la 28e Conférence sur le Traitement Automatique des Langues Naturelles. Atelier DÉfi Fouille de Textes (DEFT)
La première tâche du Défi fouille de textes 2021 a consisté à extraire automatiquement, à partir de cas cliniques, les phénotypes pathologiques des patients regroupés par tête de chapitre du MeSH-maladie. La solution présentée est celle d’un classifieur multilabel basé sur un transformer. Deux transformers ont été utilisés : le camembert-large classique (run 1) et le camembert-large fine-tuné (run 2) sur des articles biomédicaux français en accès libre. Nous avons également proposé un modèle « bout-enbout », avec une première phase d’extraction d’entités nommées également basée sur un transformer de type camembert-large et un classifieur de genre sur un modèle Adaboost. Nous obtenons un très bon rappel et une précision correcte, pour une F1-mesure autour de 0,77 pour les trois runs. La performance du modèle « bout-en-bout » est similaire aux autres méthodes.
Search
Co-authors
- Christel Gérardin 1
- Pascal Vaillant 1
- Perceval Wajsbürt 1
- Ali Bellamine 1
- Emmanuelle Kempf 1
- show all...