Brazilian Symposium in Information and Human Language Technology (2024)

Volumes

Proceedings of the 15th Brazilian Symposium in Information and Human Language Technology 66 papers

pdf (full)
bib (full) Proceedings of the 15th Brazilian Symposium in Information and Human Language Technology

Proceedings of the 15th Brazilian Symposium in Information and Human Language Technology
Daniela Barreiro Claro | Adriana Pagano

pdf bib

pdf bib

Synthetic AI Data Pipeline for Domain-Specific Speech-to-Text Solutions
Caminha Caminha | Yvens Rebouças Serpa | Leonardo Pires | Guilherme Fernandes | Anderson Karl

pdf bib

pdf bib

Biases in GPT-3.5 Turbo model: a case study regarding gender and language
Fernanda Malheiros Assi | Helena Caseli

pdf bib

Modestos e Sustentáveis: O Ajuste Eficiente Beneficia Modelos de Língua de Menor Escala em Português?
Gabriel Assis | Arthur Vasconcelos | Lívia Silva | Mariza Ferro | Aline Paes

pdf bib

pdf bib

PropBank e anotacão de papéis semânticos para a língua portuguesa: O que há de novo?
Cláudia Freitas | Thiago Pardo

pdf bib

LLMs as Tools for Evaluating Textual Coherence: A Comparative Analysis
Bryan Khelven Barbosa | Claudio Campelo

pdf bib

Evaluating Federated Learning with Homomorphic Encryption for Medical Named Entity Recognition Using Compact BERT Models
Marcos Felipe Rezende | Rodrigo Silva | Eduardo Luz | Pedro Silva

pdf bib

A Dependency Treebank of Tweets in Brazilian Portuguese: Syntactic Annotation Issues and Approach
Ariani Di Felippo | Maria das Graças Volpe Nunes | Bryan Khelven Barbosa

pdf bib

Geração Automática de Perguntas em Português do Brasil Usando os Modelos PTT5 e FLAN-T5
Tiago Braga | Hilário Tomaz de Oliveira | Bruno Coutinho

pdf bib

Sumarização Automática de Artigos de Notícias em Português: Da Extração à Abstração com Abordagens Clássicas e Modelos de Neurais
Marcio Alves Sarmento | Hilário Tomaz de Oliveira

pdf bib

Boosting not so Large Language Models by using Knowledge Graphs and Reinforcement Learning
William Beckhauser | Renato Fileto

pdf bib

Genipapo - a Multigenre Dependency Parsing for Brazilian Portuguese
Ariani Felippo | Bryan Khelven Barbosa | Norton Trevisan Roman | Thiago Pardo

pdf bib

pdf bib

Disfluency Detection and Removal in Speech Transcriptions via Large Language Models
Pedro Siqueira de Lima | Claudio Campelo

pdf bib

Detection and Censorship of Offensive Language in Extended Texts in Portuguese
Lucas Lenoch de Souza | Franciele Beal | Andre Ortoncelli | Marlon Marcon

pdf bib

pdf bib

Quati: A Brazilian Portuguese Information Retrieval Dataset from Native Speakers
Eduardo de Oliveira | Mirelle Bueno | Rodrigo Nogueira | Roberto Lotufo | Jayr Pereira

pdf bib

Mineração de Argumentos em Textos de Redes Sociais no Idioma Português
Vitor Santos | Livia Alabarse dos Santos | Renata Araujo | Ivan Carlos Alcântara de Oliveira | Orlando Coelho

pdf bib

A Hybrid Machine Learning Method to Author Name Disambiguation
Natan Rodrigues | Celia Ralha

pdf bib

Adapting LLMs to New Domains: A Comparative Study of Fine-Tuning and RAG strategies for Portuguese QA Tasks
Leandro Costa | João Baptista de Oliveira e Souza-Filho

pdf bib

pdf bib

pdf bib

Syntactic parsing: where are we going?
Lucelene Lopes | Thiago Alexandre Salgueiro Pardo | Magali Duran

pdf bib

pdf bib

pdf bib

Avaliação de arquiteturas de síntese de fala generativa com abordagens de espectrograma e fim-a-fim em cenários low-resource para clonagem de voz
Bruno C. dos S. Ribeiro | Gustavo H. dos S. Figueiredo | Leonardo H. da S. Correia | Mário Uliani-Neto | Fernando O. Runstein | Ricardo P. V. Violato | Marcus Lima

pdf bib

Leveraging Structured Data Input for Effective Chatbot Integration in Enterprises
Caio Siqueira | Orlando Guilarte | Giuliano Ferreira | Omar Leiva

pdf bib

Anomaly Detection in Text Data: A Semi-Supervised Approach Applied to the Portuguese Domain
Fabio Masaracchia Maia | Anna Helena Reali Costa

pdf bib

pdf bib

Avaliação de Algoritmos de Clusterização para Agrupamento de Descrições de Produtos em Notas Fiscais Eletrônicas
Jonas Gabriel L. de Araújo | Thaís G. do Rêgo | Yuri de A. M. Barbosa

pdf bib

Unified Knowledge-Graph for Brazilian Indigenous Languages: An Educational Applications Perspective
Gustavo Polleti | Fabio Cozman | Fabricio Gerardi

pdf bib

A Robustness Analysis of Automated Essay Scoring Methods
Rafael T. Anchiêta | Rogério F. de Sousa | Raimundo S. Moura

pdf bib

pdf bib

Beyond Single Models: Leveraging LLM Ensembles for Human Value Detection in Text
Diego Dimer Rodrigues | Mariana Recamonde-Mendoza | Viviane P. Moreira

pdf bib

Performance in a dialectal profiling task of LLMs for varieties of Brazilian Portuguese
Raquel M. Ko Freitag | Túlio Sousa de Gois

pdf bib

Mini-glossário do Tucumã do Pará no Município de Acará: olhares, significados e cultura da Amazônia
Eliene da S. Alves | Brayna C. dos S. Cardoso

pdf bib

Desambiguação de lema e atributos morfológicos na anotação do córpus Porttinari-base
Lucelene Lopes | Magali S. Duran | Thiago Alexandre Salgueiro Pardo

pdf bib

An NLP approach to impersonal –se in Brazilian Portuguese
Elvis A. de Souza | Magali S. Duran | Adriana S. Pagano

pdf bib

Inferências baseadas em sintaxe: a anotação de sujeitos implícitos
Magali Sanches Duran | Maria das Graças Volpe Nunes | Thiago Alexandre Salgueiro Pardo

pdf bib

Notes on variation and lexical diachrony in the Parish Memories-Alentejo collection (1758)
Helena Freire Cameron | Fernanda Olival | Renata Vieira

pdf bib

A sílaba e a composicionalidade em emakhuwa (P31): análise de empréstimos do português
Francelino Wilson | Vasco Magona | Felermino Ali

pdf bib

Linguistic and emotional dynamics in satirical vs. real news: a psycholinguistic analysis
Gabriela Wick-Pedro | Roney Lira de Sales Santos | Oto Araújo Vale

pdf bib

Complementos de eco de adjetivos com completiva-sujeito em português do Brasil
Ryan Saldanha Martinez | Jorge Baptista | Oto Araújo Vale

pdf bib

Modelagem baseada em frames para identificação do léxico da Violência de Gênero
Lorena Tasca Larré | Tiago Timponi Torrent

pdf bib

Relações Retóricas de List e Sequence em textos jornalísticos
Tobias J. A. Almeida | Patrícia V. Almeida | Paula C.F. Cardoso

pdf bib

Estudo preliminar sobre sinalizadores discursivos para Conteúdo Gerado por Usuários
Naira Silva Gama | Jackson Wilke da Cruz Souza

pdf bib

Relações de coerência do português brasileiro: um estudo bibliográfico-documental da RST e seus sinalizadores discursivos
Larissa Jesus Santa Bárbara | Roana Rodrigues | Jackson Wilke da Cruz Souza

pdf bib

Subsídios Linguísticos para classificação automática de textos de User-Generated Content
Mateus Araújo Pereira | Jackson Wilke da Cruz Souza

pdf bib

Relações de coerência do espanhol peninsular: Um estudo bibliográfico-documental da Rhetorical Structure Theory
Ewerson Dantas | Roana Rodrigues | Jackson Wilke da Cruz Souza

pdf bib

Estratégias automáticas para análise da concordância da anotação de Sinalizadores Discursivos
Gabriel Sizinio Bomfim Cruz | Jackson Wilke da Cruz Souza | Paula C. F. Cardoso

pdf bib

Mineração de Emoções Multirrótulo Em Textos Curtos
Ramon N. Mendes | Syanne. K. M. Tavares | Luiz Nicollas M. Campos | Fabíola P. O. Araújo

pdf bib

Classificação automática de textos de User-Generated Content utilizando Aprendizagem de Máquina Supervisionado
Iolanda Victoria Morais Ramos | Jackson Wilke da Cruz Souza

pdf bib

PLN e Segurança Jurídica Identificação de divergências jurisprudenciais com Processamento de Linguagem Natural
Marcella Queiroz de Castro | Ana Régia Mendonça

pdf bib

Um Pipeline de Pré-Processamento de Dados Textuais em Português para Análise de Redes Sociais
Livia A. dos Santos | Orlando B. Coelho | Ivan Carlos A. Oliveira Renata Araujo

pdf bib

Especulação Mística. Uma abordagem de Clusterização e Busca Semântica na aproximação de preço em cartas de Magic: The Gathering
Rodrigo Marques Duarte | André de Lima Salgado | Paula Figueira Cardoso

pdf bib

Comparação de Ferramentas para Análise de Sentimentos Aplicada no Contexto Educacional
Benjamin G. Moreira | Luiz C. Camargo | Ricardo J. Pfitscher | Tatiana R. Garcia

pdf bib

Modelo de Linguagem Quantizados na Área da Saúde: Um Enfoque em Perguntas e Respostas com Base na Técnica DPO
Mário Pinto Freitas Filho | João Dallyson Almeida | Sousa De | Anselmo C. Paiva

pdf bib

LLM-SEMREL: Towards a Better Coreference Resolution for Portuguese
Evandro Fonseca | Joaquim Neto

pdf bib

Automated Topic Annotation in Brazilian Product Reviews: A Case Study of Adversarial Examples with Sabia-3
Lucas Nildaimon dos Santos Silva | Livy Real

pdf bib

Text extraction from Knowledge Graphs in the Oil and Gas Industry
Laura P. Navarro | Elvis A. de Souza | Marco A. C. Pacheco

pdf bib

Getting Logic From LLMs Annotating Natural Language Inference with Sabiá
Fabiana Avais | Marcos Carreira | Livy Real

pdf bib

Augmenting Data to Improve the Performance of Recommender Systems
Leticia Freire de Figueiredo | Joel Pinho Lucas | Aline Paes

pdf bib