@inproceedings{martinez-tornes-etal-2023-jeu,
title = "Jeu de donn{\'e}es de tickets de caisse pour la d{\'e}tection de fraude documentaire",
author = {Mart{\'\i}nez Torn{\'e}s, Beatriz and
Taburet, Th{\'e}o and
Boros, Emanuela and
Rouis, Kais and
Gomez-Kr{\"a}mer, Petra and
Sidere, Nicolas and
Doucet, Antoine and
Poulain D{'}andecy, Vincent},
editor = "Servan, Christophe and
Vilnat, Anne",
booktitle = "Actes de CORIA-TALN 2023. Actes de la 30e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles (TALN), volume 4 : articles d{\'e}j{\`a} soumis ou accept{\'e}s en conf{\'e}rence internationale",
month = "6",
year = "2023",
address = "Paris, France",
publisher = "ATALA",
url = "https://aclanthology.org/2023.jeptalnrecital-international.16",
pages = "140--147",
abstract = "L{'}utilisation g{\'e}n{\'e}ralis{\'e}e de documents num{\'e}riques non s{\'e}curis{\'e}s par les entreprises et les administrations comme pi{\`e}ces justificatives les rend vuln{\'e}rables {\`a} la falsification. En outre, les logiciels de retouche d{'}images et les possibilit{\'e}s qu{'}ils offrent compliquent les t{\^a}ches de la d{\'e}tection de fraude d{'}images num{\'e}riques. N{\'e}anmoins, la recherche dans ce domaine se heurte au manque de donn{\'e}es r{\'e}alistes accessibles au public. Dans cet article, nous proposons un nouveau jeu de donn{\'e}es pour la d{\'e}tection des faux tickets contenant 988 images num{\'e}ris{\'e}es de tickets et leurs transcriptions, provenant du jeu de donn{\'e}es SROIE (scanned receipts OCR and information extraction). 163 images et leurs transcriptions ont subi des modifications frauduleuses r{\'e}alistes et ont {\'e}t{\'e} annot{\'e}es. Nous d{\'e}crivons en d{\'e}tail le jeu de donn{\'e}es, les falsifications et leurs annotations et fournissons deux baselines (bas{\'e}es sur l{'}image et le texte) sur la t{\^a}che de d{\'e}tection de la fraude.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="martinez-tornes-etal-2023-jeu">
<titleInfo>
<title>Jeu de données de tickets de caisse pour la détection de fraude documentaire</title>
</titleInfo>
<name type="personal">
<namePart type="given">Beatriz</namePart>
<namePart type="family">Martínez Tornés</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Théo</namePart>
<namePart type="family">Taburet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Emanuela</namePart>
<namePart type="family">Boros</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Kais</namePart>
<namePart type="family">Rouis</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Petra</namePart>
<namePart type="family">Gomez-Krämer</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Nicolas</namePart>
<namePart type="family">Sidere</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Antoine</namePart>
<namePart type="family">Doucet</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Vincent</namePart>
<namePart type="family">Poulain D’andecy</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2023-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 4 : articles déjà soumis ou acceptés en conférence internationale</title>
</titleInfo>
<name type="personal">
<namePart type="given">Christophe</namePart>
<namePart type="family">Servan</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Anne</namePart>
<namePart type="family">Vilnat</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Paris, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>L’utilisation généralisée de documents numériques non sécurisés par les entreprises et les administrations comme pièces justificatives les rend vulnérables à la falsification. En outre, les logiciels de retouche d’images et les possibilités qu’ils offrent compliquent les tâches de la détection de fraude d’images numériques. Néanmoins, la recherche dans ce domaine se heurte au manque de données réalistes accessibles au public. Dans cet article, nous proposons un nouveau jeu de données pour la détection des faux tickets contenant 988 images numérisées de tickets et leurs transcriptions, provenant du jeu de données SROIE (scanned receipts OCR and information extraction). 163 images et leurs transcriptions ont subi des modifications frauduleuses réalistes et ont été annotées. Nous décrivons en détail le jeu de données, les falsifications et leurs annotations et fournissons deux baselines (basées sur l’image et le texte) sur la tâche de détection de la fraude.</abstract>
<identifier type="citekey">martinez-tornes-etal-2023-jeu</identifier>
<location>
<url>https://aclanthology.org/2023.jeptalnrecital-international.16</url>
</location>
<part>
<date>2023-6</date>
<extent unit="page">
<start>140</start>
<end>147</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Jeu de données de tickets de caisse pour la détection de fraude documentaire
%A Martínez Tornés, Beatriz
%A Taburet, Théo
%A Boros, Emanuela
%A Rouis, Kais
%A Gomez-Krämer, Petra
%A Sidere, Nicolas
%A Doucet, Antoine
%A Poulain D’andecy, Vincent
%Y Servan, Christophe
%Y Vilnat, Anne
%S Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 4 : articles déjà soumis ou acceptés en conférence internationale
%D 2023
%8 June
%I ATALA
%C Paris, France
%G French
%F martinez-tornes-etal-2023-jeu
%X L’utilisation généralisée de documents numériques non sécurisés par les entreprises et les administrations comme pièces justificatives les rend vulnérables à la falsification. En outre, les logiciels de retouche d’images et les possibilités qu’ils offrent compliquent les tâches de la détection de fraude d’images numériques. Néanmoins, la recherche dans ce domaine se heurte au manque de données réalistes accessibles au public. Dans cet article, nous proposons un nouveau jeu de données pour la détection des faux tickets contenant 988 images numérisées de tickets et leurs transcriptions, provenant du jeu de données SROIE (scanned receipts OCR and information extraction). 163 images et leurs transcriptions ont subi des modifications frauduleuses réalistes et ont été annotées. Nous décrivons en détail le jeu de données, les falsifications et leurs annotations et fournissons deux baselines (basées sur l’image et le texte) sur la tâche de détection de la fraude.
%U https://aclanthology.org/2023.jeptalnrecital-international.16
%P 140-147
Markdown (Informal)
[Jeu de données de tickets de caisse pour la détection de fraude documentaire](https://aclanthology.org/2023.jeptalnrecital-international.16) (Martínez Tornés et al., JEP/TALN/RECITAL 2023)
ACL
- Beatriz Martínez Tornés, Théo Taburet, Emanuela Boros, Kais Rouis, Petra Gomez-Krämer, Nicolas Sidere, Antoine Doucet, and Vincent Poulain D’andecy. 2023. Jeu de données de tickets de caisse pour la détection de fraude documentaire. In Actes de CORIA-TALN 2023. Actes de la 30e Conférence sur le Traitement Automatique des Langues Naturelles (TALN), volume 4 : articles déjà soumis ou acceptés en conférence internationale, pages 140–147, Paris, France. ATALA.