@inproceedings{gonzalez-gallardo-etal-2023-oui,
title = "Oui mais... {C}hat{GPT} peut-il identifier des entit{\'e}s dans des documents historiques ?",
author = "Gonz{\'a}lez-Gallardo, Carlos-Emiliano and
Boros, Emanuela and
Girdhar, Nancy and
Hamdi, Ahmed and
Moreno, Jose and
Doucet, Antoine",
editor = "Servan, Christophe and
Vilnat, Anne",
booktitle = "Actes de CORIA-TALN 2023. Actes de la 30e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 4 : articles d{\'e}j{\`a} soumis ou accept{\'e}s en conf{\'e}rence internationale",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://aclanthology.org/2023.jeptalnrecital-international.9",
pages = "74--82",
abstract = "Les mod{\`e}les de langage de grande taille (LLM) sont exploit{\'e}s depuis plusieurs ann{\'e}es maintenant, obtenant des performances de pointe dans la reconnaissance d{'}entit{\'e}s {\`a} partir de documents modernes. Depuis quelques mois, l{'}agent conversationnel ChatGPT a suscit{\'e} beaucoup d{'}int{\'e}r{\^e}t aupr{\`e}s de la communaut{\'e} scientifique et du grand public en raison de sa capacit{\'e} {\`a} g{\'e}n{\'e}rer des r{\'e}ponses plausibles. Dans cet article, nous explorons cette comp{\'e}tence {\`a} travers la t{\^a}che de reconnaissance et de classification d{'}entit{\'e}s nomm{\'e}es (NERC) dans des sources primaires (des journaux historiques et des commentaires classiques) d{'}une mani{\`e}re zero-shot et en la comparant avec les syst{\`e}mes de pointe bas{\'e}s sur des mod{\`e}les de langage. Nos r{\'e}sultats indiquent plusieurs lacunes dans l{'}identification des entit{\'e}s dans le texte historique, qui concernant la coh{\'e}rence des guidelines d{'}annotation des entit{\'e}s, la complexit{\'e} des entit{\'e}s et du changement de code et la sp{\'e}cificit{\'e} du prompt. De plus, comme pr{\'e}vu, l{'}inaccessibilit{\'e} des archives historiques a {\'e}galement un impact sur les performances de ChatGPT.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="gonzalez-gallardo-etal-2023-oui">
<titleInfo>
<title>Oui mais... ChatGPT peut-il identifier des entités dans des documents historiques ?</title>
</titleInfo>
<name type="personal">
<namePart type="given">Carlos-Emiliano</namePart>
<namePart type="family">González-Gallardo</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Emanuela</namePart>
<namePart type="family">Boros</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nancy</namePart>
<namePart type="family">Girdhar</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Ahmed</namePart>
<namePart type="family">Hamdi</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jose</namePart>
<namePart type="family">Moreno</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Antoine</namePart>
<namePart type="family">Doucet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2023-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 4 : articles déjà soumis ou acceptés en conférence internationale</title>
</titleInfo>
<name type="personal">
<namePart type="given">Christophe</namePart>
<namePart type="family">Servan</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Anne</namePart>
<namePart type="family">Vilnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Les modèles de langage de grande taille (LLM) sont exploités depuis plusieurs années maintenant, obtenant des performances de pointe dans la reconnaissance d’entités à partir de documents modernes. Depuis quelques mois, l’agent conversationnel ChatGPT a suscité beaucoup d’intérêt auprès de la communauté scientifique et du grand public en raison de sa capacité à générer des réponses plausibles. Dans cet article, nous explorons cette compétence à travers la tâche de reconnaissance et de classification d’entités nommées (NERC) dans des sources primaires (des journaux historiques et des commentaires classiques) d’une manière zero-shot et en la comparant avec les systèmes de pointe basés sur des modèles de langage. Nos résultats indiquent plusieurs lacunes dans l’identification des entités dans le texte historique, qui concernant la cohérence des guidelines d’annotation des entités, la complexité des entités et du changement de code et la spécificité du prompt. De plus, comme prévu, l’inaccessibilité des archives historiques a également un impact sur les performances de ChatGPT.</abstract>
<identifier type="citekey">gonzalez-gallardo-etal-2023-oui</identifier>
<location>
<url>https://aclanthology.org/2023.jeptalnrecital-international.9</url>
</location>
<part>
<date>2023-6</date>
<extent unit="page">
<start>74</start>
<end>82</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Oui mais... ChatGPT peut-il identifier des entités dans des documents historiques ?
%A González-Gallardo, Carlos-Emiliano
%A Boros, Emanuela
%A Girdhar, Nancy
%A Hamdi, Ahmed
%A Moreno, Jose
%A Doucet, Antoine
%Y Servan, Christophe
%Y Vilnat, Anne
%S Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 4 : articles déjà soumis ou acceptés en conférence internationale
%D 2023
%8 June
%I ATALA
%C Paris, France
%G French
%F gonzalez-gallardo-etal-2023-oui
%X Les modèles de langage de grande taille (LLM) sont exploités depuis plusieurs années maintenant, obtenant des performances de pointe dans la reconnaissance d’entités à partir de documents modernes. Depuis quelques mois, l’agent conversationnel ChatGPT a suscité beaucoup d’intérêt auprès de la communauté scientifique et du grand public en raison de sa capacité à générer des réponses plausibles. Dans cet article, nous explorons cette compétence à travers la tâche de reconnaissance et de classification d’entités nommées (NERC) dans des sources primaires (des journaux historiques et des commentaires classiques) d’une manière zero-shot et en la comparant avec les systèmes de pointe basés sur des modèles de langage. Nos résultats indiquent plusieurs lacunes dans l’identification des entités dans le texte historique, qui concernant la cohérence des guidelines d’annotation des entités, la complexité des entités et du changement de code et la spécificité du prompt. De plus, comme prévu, l’inaccessibilité des archives historiques a également un impact sur les performances de ChatGPT.
%U https://aclanthology.org/2023.jeptalnrecital-international.9
%P 74-82
Markdown (Informal)
[Oui mais... ChatGPT peut-il identifier des entités dans des documents historiques ?](https://aclanthology.org/2023.jeptalnrecital-international.9) (González-Gallardo et al., JEP/TALN/RECITAL 2023)
ACL
- Carlos-Emiliano González-Gallardo, Emanuela Boros, Nancy Girdhar, Ahmed Hamdi, Jose Moreno, and Antoine Doucet. 2023. Oui mais... ChatGPT peut-il identifier des entités dans des documents historiques ?. In Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 4 : articles déjà soumis ou acceptés en conférence internationale, pages 74–82, Paris, France. ATALA.