@inproceedings{de-murcia-etal-2025-detection,
title = "D{\'e}tection et {\'e}valuation de la communication toxique pour la relation client par des {LLM}s",
author = "De Murcia, Guillaume and
Meineri, Ludovic and
Gillard, Laurent and
Gouritin, Thomas and
Lastmann, Samy",
editor = "Bechet, Fr{\'e}d{\'e}ric and
Chifu, Adrian-Gabriel and
Pinel-sauvagnat, Karen and
Favre, Benoit and
Maes, Eliot and
Nurbakova, Diana",
booktitle = "Actes des 32{\`e}me Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux",
month = "6",
year = "2025",
address = "Marseille, France",
publisher = "ATALA {\textbackslash}{\textbackslash}{\&} ARIA",
url = "https://aclanthology.org/2025.jeptalnrecital-taln.16/",
pages = "268--283",
language = "fra",
abstract = "Cet article pr{\'e}sente une m{\'e}thode de d{\'e}tection de la toxicit{\'e} dans les interactions et dialogues client avant des g{\'e}n{\'e}rations par un LLM. En proposant une taxonomie originale, adapt{\'e}e aux {\'e}changes conversationnels et {\`a} la relation client, nous avons con{\c{c}}u un processus d'{\'e}valuation rigoureux, accompagn{\'e} de deux corpus annot{\'e}s : Toximini-fr etToxiMaxi-multilingual . Ces corpus combinent des requ{\^e}tes issues de donn{\'e}es r{\'e}elles {---} extraites de logs de nos chatbots en production {---} et de jeux de donn{\'e}es de r{\'e}f{\'e}rence, ainsi que des exemples g{\'e}n{\'e}r{\'e}s de mani{\`e}re synth{\'e}tique afin de couvrir un large {\'e}ventail de situations. Nos exp{\'e}rimentations comparent diff{\'e}rents mod{\`e}les, dont GPT-4o mini et Mistral Moderation , sur des requ{\^e}tes multilingues dans des contextes vari{\'e}s. Les r{\'e}sultats montrent que notre approche permet une d{\'e}tection robuste, notamment sur les contenus bruit{\'e}s ou implicites. Cette {\'e}tude ouvre la voie {\`a} une meilleure ma{\^i}trise des risques li{\'e}s aux comportements toxiques dans les {\'e}changes conversationnels automatis{\'e}s."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="de-murcia-etal-2025-detection">
<titleInfo>
<title>Détection et évaluation de la communication toxique pour la relation client par des LLMs</title>
</titleInfo>
<name type="personal">
<namePart type="given">Guillaume</namePart>
<namePart type="family">De Murcia</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Ludovic</namePart>
<namePart type="family">Meineri</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Laurent</namePart>
<namePart type="family">Gillard</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thomas</namePart>
<namePart type="family">Gouritin</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Samy</namePart>
<namePart type="family">Lastmann</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2025-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux</title>
</titleInfo>
<name type="personal">
<namePart type="given">Frédéric</namePart>
<namePart type="family">Bechet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Adrian-Gabriel</namePart>
<namePart type="family">Chifu</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Karen</namePart>
<namePart type="family">Pinel-sauvagnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoit</namePart>
<namePart type="family">Favre</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eliot</namePart>
<namePart type="family">Maes</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Nurbakova</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA \textbackslash\textbackslash& ARIA</publisher>
<place>
<placeTerm type="text">Marseille, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Cet article présente une méthode de détection de la toxicité dans les interactions et dialogues client avant des générations par un LLM. En proposant une taxonomie originale, adaptée aux échanges conversationnels et à la relation client, nous avons conçu un processus d’évaluation rigoureux, accompagné de deux corpus annotés : Toximini-fr etToxiMaxi-multilingual . Ces corpus combinent des requêtes issues de données réelles — extraites de logs de nos chatbots en production — et de jeux de données de référence, ainsi que des exemples générés de manière synthétique afin de couvrir un large éventail de situations. Nos expérimentations comparent différents modèles, dont GPT-4o mini et Mistral Moderation , sur des requêtes multilingues dans des contextes variés. Les résultats montrent que notre approche permet une détection robuste, notamment sur les contenus bruités ou implicites. Cette étude ouvre la voie à une meilleure maîtrise des risques liés aux comportements toxiques dans les échanges conversationnels automatisés.</abstract>
<identifier type="citekey">de-murcia-etal-2025-detection</identifier>
<location>
<url>https://aclanthology.org/2025.jeptalnrecital-taln.16/</url>
</location>
<part>
<date>2025-6</date>
<extent unit="page">
<start>268</start>
<end>283</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Détection et évaluation de la communication toxique pour la relation client par des LLMs
%A De Murcia, Guillaume
%A Meineri, Ludovic
%A Gillard, Laurent
%A Gouritin, Thomas
%A Lastmann, Samy
%Y Bechet, Frédéric
%Y Chifu, Adrian-Gabriel
%Y Pinel-sauvagnat, Karen
%Y Favre, Benoit
%Y Maes, Eliot
%Y Nurbakova, Diana
%S Actes des 32ème Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 1 : articles scientifiques originaux
%D 2025
%8 June
%I ATALA \textbackslash\textbackslash& ARIA
%C Marseille, France
%G fra
%F de-murcia-etal-2025-detection
%X Cet article présente une méthode de détection de la toxicité dans les interactions et dialogues client avant des générations par un LLM. En proposant une taxonomie originale, adaptée aux échanges conversationnels et à la relation client, nous avons conçu un processus d’évaluation rigoureux, accompagné de deux corpus annotés : Toximini-fr etToxiMaxi-multilingual . Ces corpus combinent des requêtes issues de données réelles — extraites de logs de nos chatbots en production — et de jeux de données de référence, ainsi que des exemples générés de manière synthétique afin de couvrir un large éventail de situations. Nos expérimentations comparent différents modèles, dont GPT-4o mini et Mistral Moderation , sur des requêtes multilingues dans des contextes variés. Les résultats montrent que notre approche permet une détection robuste, notamment sur les contenus bruités ou implicites. Cette étude ouvre la voie à une meilleure maîtrise des risques liés aux comportements toxiques dans les échanges conversationnels automatisés.
%U https://aclanthology.org/2025.jeptalnrecital-taln.16/
%P 268-283
Markdown (Informal)
[Détection et évaluation de la communication toxique pour la relation client par des LLMs](https://aclanthology.org/2025.jeptalnrecital-taln.16/) (De Murcia et al., JEP/TALN/RECITAL 2025)
ACL