@inproceedings{ribeiro-merschmann-2026-uma,
title = "Uma Abordagem H{\'i}brida para Predi{\c{c}}{\~a}o de Faixa Et{\'a}ria de Autores de Textos Escritos na L{\'i}ngua Portuguesa",
author = "Ribeiro, Alice Rezende and
Merschmann, Luiz Henrique de Campos",
editor = "Souza, Marlo and
de-Dios-Flores, Iria and
Santos, Diana and
Freitas, Larissa and
Souza, Jackson Wilke da Cruz and
Ribeiro, Eug{\'e}nio",
booktitle = "Proceedings of the 17th International Conference on Computational Processing of {P}ortuguese ({PROPOR} 2026) - Vol. 1",
month = apr,
year = "2026",
address = "Salvador, Brazil",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2026.propor-1.31/",
pages = "311--320",
ISBN = "979-8-89176-387-6",
abstract = "A crescente quantidade de textos dispon{\'i}veis na Web torna as ferramentas de minera{\c{c}}{\~a}o de texto essenciais para a extra{\c{c}}{\~a}o de informa{\c{c}}{\~o}es valiosas para diversas aplica{\c{c}}{\~o}es. No entanto, al{\'e}m dos pr{\'o}prios textos, conhecer as caracter{\'i}sticas de seus autores {\'e} crucial para algumas organiza{\c{c}}{\~o}es. Como os textos podem ser publicados anonimamente, {\'e} crescente o interesse em pesquisas voltadas para a cria{\c{c}}{\~a}o de t{\'e}cnicas computacionais para inferir as caracter{\'i}sticas demogr{\'a}ficas de seus autores. Apesar disso, para o problema da predi{\c{c}}{\~a}o da faixa et{\'a}ria de autores de textos escritos na l{\'i}ngua portuguesa, a quantidade limitada de recursos e o baixo desempenho preditivo evidenciam a necessidade de mais pesquisas focadas nessa tarefa. Assim, este trabalho prop{\~o}e e avalia uma abordagem que, al{\'e}m de um classificador tradicional, utiliza dicion{\'a}rios de palavras para capturar as especificidades do dom{\'i}nio textual e aprimorar o desempenho preditivo da tarefa de predi{\c{c}}{\~a}o da faixa et{\'a}ria. Os resultados experimentais obtidos com a abordagem proposta mostram que explorar as caracter{\'i}sticas do dom{\'i}nio dos textos pode contribuir positivamente para o desempenho dessa tarefa."
}<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="ribeiro-merschmann-2026-uma">
<titleInfo>
<title>Uma Abordagem Híbrida para Predição de Faixa Etária de Autores de Textos Escritos na Língua Portuguesa</title>
</titleInfo>
<name type="personal">
<namePart type="given">Alice</namePart>
<namePart type="given">Rezende</namePart>
<namePart type="family">Ribeiro</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Luiz</namePart>
<namePart type="given">Henrique</namePart>
<namePart type="given">de</namePart>
<namePart type="given">Campos</namePart>
<namePart type="family">Merschmann</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2026-04</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<relatedItem type="host">
<titleInfo>
<title>Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1</title>
</titleInfo>
<name type="personal">
<namePart type="given">Marlo</namePart>
<namePart type="family">Souza</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Iria</namePart>
<namePart type="family">de-Dios-Flores</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Diana</namePart>
<namePart type="family">Santos</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Larissa</namePart>
<namePart type="family">Freitas</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Jackson</namePart>
<namePart type="given">Wilke</namePart>
<namePart type="given">da</namePart>
<namePart type="given">Cruz</namePart>
<namePart type="family">Souza</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Eugénio</namePart>
<namePart type="family">Ribeiro</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>Association for Computational Linguistics</publisher>
<place>
<placeTerm type="text">Salvador, Brazil</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
<identifier type="isbn">979-8-89176-387-6</identifier>
</relatedItem>
<abstract>A crescente quantidade de textos disponíveis na Web torna as ferramentas de mineração de texto essenciais para a extração de informações valiosas para diversas aplicações. No entanto, além dos próprios textos, conhecer as características de seus autores é crucial para algumas organizações. Como os textos podem ser publicados anonimamente, é crescente o interesse em pesquisas voltadas para a criação de técnicas computacionais para inferir as características demográficas de seus autores. Apesar disso, para o problema da predição da faixa etária de autores de textos escritos na língua portuguesa, a quantidade limitada de recursos e o baixo desempenho preditivo evidenciam a necessidade de mais pesquisas focadas nessa tarefa. Assim, este trabalho propõe e avalia uma abordagem que, além de um classificador tradicional, utiliza dicionários de palavras para capturar as especificidades do domínio textual e aprimorar o desempenho preditivo da tarefa de predição da faixa etária. Os resultados experimentais obtidos com a abordagem proposta mostram que explorar as características do domínio dos textos pode contribuir positivamente para o desempenho dessa tarefa.</abstract>
<identifier type="citekey">ribeiro-merschmann-2026-uma</identifier>
<location>
<url>https://aclanthology.org/2026.propor-1.31/</url>
</location>
<part>
<date>2026-04</date>
<extent unit="page">
<start>311</start>
<end>320</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Uma Abordagem Híbrida para Predição de Faixa Etária de Autores de Textos Escritos na Língua Portuguesa
%A Ribeiro, Alice Rezende
%A Merschmann, Luiz Henrique de Campos
%Y Souza, Marlo
%Y de-Dios-Flores, Iria
%Y Santos, Diana
%Y Freitas, Larissa
%Y Souza, Jackson Wilke da Cruz
%Y Ribeiro, Eugénio
%S Proceedings of the 17th International Conference on Computational Processing of Portuguese (PROPOR 2026) - Vol. 1
%D 2026
%8 April
%I Association for Computational Linguistics
%C Salvador, Brazil
%@ 979-8-89176-387-6
%F ribeiro-merschmann-2026-uma
%X A crescente quantidade de textos disponíveis na Web torna as ferramentas de mineração de texto essenciais para a extração de informações valiosas para diversas aplicações. No entanto, além dos próprios textos, conhecer as características de seus autores é crucial para algumas organizações. Como os textos podem ser publicados anonimamente, é crescente o interesse em pesquisas voltadas para a criação de técnicas computacionais para inferir as características demográficas de seus autores. Apesar disso, para o problema da predição da faixa etária de autores de textos escritos na língua portuguesa, a quantidade limitada de recursos e o baixo desempenho preditivo evidenciam a necessidade de mais pesquisas focadas nessa tarefa. Assim, este trabalho propõe e avalia uma abordagem que, além de um classificador tradicional, utiliza dicionários de palavras para capturar as especificidades do domínio textual e aprimorar o desempenho preditivo da tarefa de predição da faixa etária. Os resultados experimentais obtidos com a abordagem proposta mostram que explorar as características do domínio dos textos pode contribuir positivamente para o desempenho dessa tarefa.
%U https://aclanthology.org/2026.propor-1.31/
%P 311-320
Markdown (Informal)
[Uma Abordagem Híbrida para Predição de Faixa Etária de Autores de Textos Escritos na Língua Portuguesa](https://aclanthology.org/2026.propor-1.31/) (Ribeiro & Merschmann, PROPOR 2026)
ACL