@inproceedings{andrade-etal-2026-caracterizacao,
title = "Caracteriza{\c{c}}{\~a}o lexical e sint{\'a}tica de not{\'i}cias falsas em portugu{\^e}s produzidas por humanos e por m{\'a}quinas",
author = "Andrade, Pedro Lucas Castro de and
Silva, Renato and
Pardo, Thiago Alexandre Salgueiro",
editor = "Souza, Marlo and
de-Dios-Flores, Iria and
Santos, Diana and
Freitas, Larissa and
Souza, Jackson Wilke da Cruz and
Ribeiro, Eug{\'e}nio",
booktitle = "Proceedings of the 17th International Conference on Computational Processing of {P}ortuguese ({PROPOR} 2026) - Vol. 2",
month = apr,
year = "2026",
address = "Salvador, Brazil",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2026.propor-2.22/",
pages = "148--158",
ISBN = "979-8-89176-387-6",
abstract = "Not{\'i}cias falsas s{\~a}o um grande problema para a sociedade. Com a Intelig{\^e}ncia Artificial generativa, not{\'i}cias falsas produzidas pela m{\'a}quina t{\^e}m se proliferado, tornando o cen{\'a}rio mais desafiador. Apesar da relev{\^a}ncia desse problema, em l{\'i}nguas sub-representadas como o Portugu{\^e}s, as pesquisas que buscam diferenciar not{\'i}cias falsas de humanos e de m{\'a}quinas s{\~a}o incipientes. Buscando preencher essa lacuna, este artigo explora os corpora Fake.br e FakeTrueBR expandidos com not{\'i}cias falsas geradas automaticamente, caracterizando lexical e sintaticamente as not{\'i}cias falsas produzidas por humanos e por m{\'a}quina. Os resultados mostram que textos gerados por m{\'a}quina apresentam palavras significativamente mais longas, maior uso de modificadores adjetivais e menor diversidade sint{\'a}tica, apesar de utilizarem mais regras sint{\'a}ticas por senten{\c{c}}a. Em contrapartida, textos humanos exibem maior variabilidade estil{\'i}stica em todas as dimens{\~o}es analisadas."
}<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="andrade-etal-2026-caracterizacao">
<titleInfo>
<title>Caracterização lexical e sintática de notícias falsas em português produzidas por humanos e por máquinas</title>
</titleInfo>
<name type="personal">
<namePart type="given">Pedro</namePart>
<namePart type="given">Lucas</namePart>
<namePart type="given">Castro</namePart>
<namePart type="given">de</namePart>
<namePart type="family">Andrade</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Renato</namePart>
<namePart type="family">Silva</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thiago</namePart>
<namePart type="given">Alexandre</namePart>
<namePart type="given">Salgueiro</namePart>
<namePart type="family">Pardo</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2026-04</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<relatedItem type="host">
<titleInfo>
<title>Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2</title>
</titleInfo>
<name type="personal">
<namePart type="given">Marlo</namePart>
<namePart type="family">Souza</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Iria</namePart>
<namePart type="family">de-Dios-Flores</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Santos</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Larissa</namePart>
<namePart type="family">Freitas</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jackson</namePart>
<namePart type="given">Wilke</namePart>
<namePart type="given">da</namePart>
<namePart type="given">Cruz</namePart>
<namePart type="family">Souza</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eugénio</namePart>
<namePart type="family">Ribeiro</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>Association for Computational Linguistics</publisher>
<place>
<placeTerm type="text">Salvador, Brazil</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
<identifier type="isbn">979-8-89176-387-6</identifier>
</relatedItem>
<abstract>Notícias falsas são um grande problema para a sociedade. Com a Inteligência Artificial generativa, notícias falsas produzidas pela máquina têm se proliferado, tornando o cenário mais desafiador. Apesar da relevância desse problema, em línguas sub-representadas como o Português, as pesquisas que buscam diferenciar notícias falsas de humanos e de máquinas são incipientes. Buscando preencher essa lacuna, este artigo explora os corpora Fake.br e FakeTrueBR expandidos com notícias falsas geradas automaticamente, caracterizando lexical e sintaticamente as notícias falsas produzidas por humanos e por máquina. Os resultados mostram que textos gerados por máquina apresentam palavras significativamente mais longas, maior uso de modificadores adjetivais e menor diversidade sintática, apesar de utilizarem mais regras sintáticas por sentença. Em contrapartida, textos humanos exibem maior variabilidade estilística em todas as dimensões analisadas.</abstract>
<identifier type="citekey">andrade-etal-2026-caracterizacao</identifier>
<location>
<url>https://aclanthology.org/2026.propor-2.22/</url>
</location>
<part>
<date>2026-04</date>
<extent unit="page">
<start>148</start>
<end>158</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Caracterização lexical e sintática de notícias falsas em português produzidas por humanos e por máquinas
%A Andrade, Pedro Lucas Castro de
%A Silva, Renato
%A Pardo, Thiago Alexandre Salgueiro
%Y Souza, Marlo
%Y de-Dios-Flores, Iria
%Y Santos, Diana
%Y Freitas, Larissa
%Y Souza, Jackson Wilke da Cruz
%Y Ribeiro, Eugénio
%S Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 2
%D 2026
%8 April
%I Association for Computational Linguistics
%C Salvador, Brazil
%@ 979-8-89176-387-6
%F andrade-etal-2026-caracterizacao
%X Notícias falsas são um grande problema para a sociedade. Com a Inteligência Artificial generativa, notícias falsas produzidas pela máquina têm se proliferado, tornando o cenário mais desafiador. Apesar da relevância desse problema, em línguas sub-representadas como o Português, as pesquisas que buscam diferenciar notícias falsas de humanos e de máquinas são incipientes. Buscando preencher essa lacuna, este artigo explora os corpora Fake.br e FakeTrueBR expandidos com notícias falsas geradas automaticamente, caracterizando lexical e sintaticamente as notícias falsas produzidas por humanos e por máquina. Os resultados mostram que textos gerados por máquina apresentam palavras significativamente mais longas, maior uso de modificadores adjetivais e menor diversidade sintática, apesar de utilizarem mais regras sintáticas por sentença. Em contrapartida, textos humanos exibem maior variabilidade estilística em todas as dimensões analisadas.
%U https://aclanthology.org/2026.propor-2.22/
%P 148-158
Markdown (Informal)
[Caracterização lexical e sintática de notícias falsas em português produzidas por humanos e por máquinas](https://aclanthology.org/2026.propor-2.22/) (Andrade et al., PROPOR 2026)
ACL