@inproceedings{naguib-etal-2022-romanciers,
title = "Romanciers et romanci{\`e}res du {XIX}{\`e}me si{\`e}cle : une {\'e}tude automatique du genre sur le corpus {GIRLS} (Male and female novelists : an automatic study of gender of authors and their characters )",
author = {Naguib, Marco and
Delaborde, Marine and
Andrault, Blandine and
Bekolo, Ana{\"i}s and
Seminck, Olga},
editor = "Moncla, Ludovic and
Brando, Carmen",
booktitle = "Actes de la 29e Conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Atelier TAL et Humanit{\'e}s Num{\'e}riques (TAL-HN)",
month = "6",
year = "2022",
address = "Avignon, France",
publisher = "ATALA",
url = "https://aclanthology.org/2022.jeptalnrecital-humanum.8/",
pages = "66--77",
language = "fra",
abstract = "Cette {\'e}tude porte sur les diff{\'e}rences entre les romans fran{\c{c}}ais du XIXe si{\`e}cle {\'e}crits par des hommes et ceux {\'e}crits par des femmes en trois {\'e}tapes. Premi{\`e}rement, nous observons que ces textes peuvent {\^e}tre distingu{\'e}s par apprentissage supervis{\'e} selon ce crit{\`e}re. Un mod{\`e}le simple a un score de 99{\%} d`exactitude sur cette t{\^a}che si d`autres {\oe}uvres de la m{\^e}me personne figurent dans le jeu d`entra{\^i}nement, et de 72{\%} d`exactitude sinon. Cette diff{\'e}rence s`explique par le fait que le langage de l`individu est plus distinctif qu`un {\'e}ventuel style propre au genre. Deuxi{\`e}mement, notre {\'e}tude textom{\'e}trique met au jour des st{\'e}r{\'e}otypes de genre chez les hommes et les femmes. Troisi{\`e}mement, nous pr{\'e}sentons un mod{\`e}le de cor{\'e}f{\'e}rence entra{\^i}n{\'e} sur des textes litt{\'e}raires pour {\'e}tudier le genre des personnages. Nous montrons ainsi que les personnages f{\'e}minins sont plus nombreux chez les femmes, et prennent g{\'e}n{\'e}ralement une place plus pro{\'e}minente que chez les hommes."
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="naguib-etal-2022-romanciers">
<titleInfo>
<title>Romanciers et romancières du XIXème siècle : une étude automatique du genre sur le corpus GIRLS (Male and female novelists : an automatic study of gender of authors and their characters )</title>
</titleInfo>
<name type="personal">
<namePart type="given">Marco</namePart>
<namePart type="family">Naguib</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Marine</namePart>
<namePart type="family">Delaborde</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Blandine</namePart>
<namePart type="family">Andrault</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Anaïs</namePart>
<namePart type="family">Bekolo</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Olga</namePart>
<namePart type="family">Seminck</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2022-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">fra</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Atelier TAL et Humanités Numériques (TAL-HN)</title>
</titleInfo>
<name type="personal">
<namePart type="given">Ludovic</namePart>
<namePart type="family">Moncla</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Carmen</namePart>
<namePart type="family">Brando</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Avignon, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Cette étude porte sur les différences entre les romans français du XIXe siècle écrits par des hommes et ceux écrits par des femmes en trois étapes. Premièrement, nous observons que ces textes peuvent être distingués par apprentissage supervisé selon ce critère. Un modèle simple a un score de 99% d‘exactitude sur cette tâche si d‘autres øeuvres de la même personne figurent dans le jeu d‘entraînement, et de 72% d‘exactitude sinon. Cette différence s‘explique par le fait que le langage de l‘individu est plus distinctif qu‘un éventuel style propre au genre. Deuxièmement, notre étude textométrique met au jour des stéréotypes de genre chez les hommes et les femmes. Troisièmement, nous présentons un modèle de coréférence entraîné sur des textes littéraires pour étudier le genre des personnages. Nous montrons ainsi que les personnages féminins sont plus nombreux chez les femmes, et prennent généralement une place plus proéminente que chez les hommes.</abstract>
<identifier type="citekey">naguib-etal-2022-romanciers</identifier>
<location>
<url>https://aclanthology.org/2022.jeptalnrecital-humanum.8/</url>
</location>
<part>
<date>2022-6</date>
<extent unit="page">
<start>66</start>
<end>77</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Romanciers et romancières du XIXème siècle : une étude automatique du genre sur le corpus GIRLS (Male and female novelists : an automatic study of gender of authors and their characters )
%A Naguib, Marco
%A Delaborde, Marine
%A Andrault, Blandine
%A Bekolo, Anaïs
%A Seminck, Olga
%Y Moncla, Ludovic
%Y Brando, Carmen
%S Actes de la 29e Conférence sur le Traitement Automatique des Langues Naturelles. Atelier TAL et Humanités Numériques (TAL-HN)
%D 2022
%8 June
%I ATALA
%C Avignon, France
%G fra
%F naguib-etal-2022-romanciers
%X Cette étude porte sur les différences entre les romans français du XIXe siècle écrits par des hommes et ceux écrits par des femmes en trois étapes. Premièrement, nous observons que ces textes peuvent être distingués par apprentissage supervisé selon ce critère. Un modèle simple a un score de 99% d‘exactitude sur cette tâche si d‘autres øeuvres de la même personne figurent dans le jeu d‘entraînement, et de 72% d‘exactitude sinon. Cette différence s‘explique par le fait que le langage de l‘individu est plus distinctif qu‘un éventuel style propre au genre. Deuxièmement, notre étude textométrique met au jour des stéréotypes de genre chez les hommes et les femmes. Troisièmement, nous présentons un modèle de coréférence entraîné sur des textes littéraires pour étudier le genre des personnages. Nous montrons ainsi que les personnages féminins sont plus nombreux chez les femmes, et prennent généralement une place plus proéminente que chez les hommes.
%U https://aclanthology.org/2022.jeptalnrecital-humanum.8/
%P 66-77
Markdown (Informal)
[Romanciers et romancières du XIXème siècle : une étude automatique du genre sur le corpus GIRLS (Male and female novelists : an automatic study of gender of authors and their characters )](https://aclanthology.org/2022.jeptalnrecital-humanum.8/) (Naguib et al., JEP/TALN/RECITAL 2022)
ACL