Brazilian Symposium in Information and Human Language Technology (2024)


up

pdf (full)
bib (full)
Proceedings of the 15th Brazilian Symposium in Information and Human Language Technology

pdf bib
Proceedings of the 15th Brazilian Symposium in Information and Human Language Technology
Daniela Barreiro Claro | Adriana Pagano

pdf bib
A Linguagem em Foco: Anotação de Sinalizadores Discursivos em Textos Jornalísticos
Paula Figueira Cardoso | Jackson Wilke da Cruz Souza | Roana Rodrigues | Ewerson Dantas | Gabriel Sizinio Bomfim Cruz | Larissa Bárbara | Naira Gama

pdf bib
Synthetic AI Data Pipeline for Domain-Specific Speech-to-Text Solutions
Caminha Caminha | Yvens Rebouças Serpa | Leonardo Pires | Guilherme Fernandes | Anderson Karl

pdf bib
Automatic Annotation of Enhanced Universal Dependencies for Brazilian Portuguese
Elvis Souza | Magali Duran | Maria das Graças Volpe Nunes | Gustavo Sampaio | Giovanna Belasco | Thiago Pardo

pdf bib
Biases in GPT-3.5 Turbo model: a case study regarding gender and language
Fernanda Malheiros Assi | Helena Caseli

pdf bib
Modestos e Sustentáveis: O Ajuste Eficiente Beneficia Modelos de Língua de Menor Escala em Português?
Gabriel Assis | Arthur Vasconcelos | Lívia Silva | Mariza Ferro | Aline Paes

pdf bib
TableRAG: A Novel Approach for Augmenting LLMs with Information from Retrieved Tables
Elvis Souza | Patricia Ferreira da Silva | Diogo Gomes | Vitor Batista | Evelyn Batista | Marco Pacheco

pdf bib
PropBank e anotacão de papéis semânticos para a língua portuguesa: O que há de novo?
Cláudia Freitas | Thiago Pardo

pdf bib
LLMs as Tools for Evaluating Textual Coherence: A Comparative Analysis
Bryan Khelven Barbosa | Claudio Campelo

pdf bib
Evaluating Federated Learning with Homomorphic Encryption for Medical Named Entity Recognition Using Compact BERT Models
Marcos Felipe Rezende | Rodrigo Silva | Eduardo Luz | Pedro Silva

pdf bib
A Dependency Treebank of Tweets in Brazilian Portuguese: Syntactic Annotation Issues and Approach
Ariani Di Felippo | Maria das Graças Volpe Nunes | Bryan Khelven Barbosa

pdf bib
Geração Automática de Perguntas em Português do Brasil Usando os Modelos PTT5 e FLAN-T5
Tiago Braga | Hilário Tomaz de Oliveira | Bruno Coutinho

pdf bib
Sumarização Automática de Artigos de Notícias em Português: Da Extração à Abstração com Abordagens Clássicas e Modelos de Neurais
Marcio Alves Sarmento | Hilário Tomaz de Oliveira

pdf bib
Boosting not so Large Language Models by using Knowledge Graphs and Reinforcement Learning
William Beckhauser | Renato Fileto

pdf bib
Genipapo - a Multigenre Dependency Parsing for Brazilian Portuguese
Ariani Felippo | Bryan Khelven Barbosa | Norton Trevisan Roman | Thiago Pardo

pdf bib
Toxic Text Classification in Portuguese: Is LLaMA 3.1 8B All You Need?
Amanda Oliveira | Pedro Silva | Vander Freitas | Valéria Santos | Gladston Moreira | Eduardo Luz

pdf bib
Disfluency Detection and Removal in Speech Transcriptions via Large Language Models
Pedro Siqueira de Lima | Claudio Campelo

pdf bib
Detection and Censorship of Offensive Language in Extended Texts in Portuguese
Lucas Lenoch de Souza | Franciele Beal | Andre Ortoncelli | Marlon Marcon

pdf bib
EyetrackingMOS: Proposta de um método rápido e barato para avaliar modelos de sintese de fala
Gustavo Araújo | Julio Cesar Galdino | Rodrigo Lima | Sandra Aluísio | Arnaldo Candido Jr. | Miguel Oliveira Jr. | Moacir Ponti

pdf bib
Quati: A Brazilian Portuguese Information Retrieval Dataset from Native Speakers
Eduardo de Oliveira | Mirelle Bueno | Rodrigo Nogueira | Roberto Lotufo | Jayr Pereira

pdf bib
Mineração de Argumentos em Textos de Redes Sociais no Idioma Português
Vitor Santos | Livia Alabarse dos Santos | Renata Araujo | Ivan Carlos Alcântara de Oliveira | Orlando Coelho

pdf bib
A Hybrid Machine Learning Method to Author Name Disambiguation
Natan Rodrigues | Celia Ralha

pdf bib
Adapting LLMs to New Domains: A Comparative Study of Fine-Tuning and RAG strategies for Portuguese QA Tasks
Leandro Costa | João Baptista de Oliveira e Souza-Filho

pdf bib
A Change in Perspective: The Trade-Off Between Perspective API and Custom Models in Classifying Hate Speech in Portuguese
Arthur Buzelin | Pedro Torres Bento | Samira Araújo Malaquias Souza | Yan Amorim | Wagner Meira Jr. | Gisele Pappa

pdf bib
No Argument Left Behind: Overlapping Chunks for Faster Processing of Arbitrarily Long Legal Texts
Israel Fama | Bárbara Bueno | Alexandre Alcoforado | Thomas Palmeira Ferraz | Arnold Moya | Anna Helena Reali Costa

pdf bib
Syntactic parsing: where are we going?
Lucelene Lopes | Thiago Alexandre Salgueiro Pardo | Magali Duran

pdf bib
Segmentação Textual Baseada em Tópicos em Português Utilizando BERTimbau
Luciano A. C. da Silva | Maiara S. F. Rodrigues | Adriana P. Archanjo | Luis Pessoa | Thiago F. de Miguel L. Silva, Almeida | Leonardo Silveira

pdf bib
Avaliação de modelos para detecção de ataques de replay usando diferentes bases de dados
Giovana Y. Nakashima | Higor D. C. Santos | Jone W. M. Soares | Mário Uliani Neto | Fernando O. Runstein | Ricardo P. V. Violato | Marcus Lima

pdf bib
Avaliação de arquiteturas de síntese de fala generativa com abordagens de espectrograma e fim-a-fim em cenários low-resource para clonagem de voz
Bruno C. dos S. Ribeiro | Gustavo H. dos S. Figueiredo | Leonardo H. da S. Correia | Mário Uliani-Neto | Fernando O. Runstein | Ricardo P. V. Violato | Marcus Lima

pdf bib
Leveraging Structured Data Input for Effective Chatbot Integration in Enterprises
Caio Siqueira | Orlando Guilarte | Giuliano Ferreira | Omar Leiva

pdf bib
Anomaly Detection in Text Data: A Semi-Supervised Approach Applied to the Portuguese Domain
Fabio Masaracchia Maia | Anna Helena Reali Costa

pdf bib
Identificação de aspectos explícitos e implícitos em críticas gastronômicas em português: avaliando o potencial dos LLMs
Luiz H. N. Silva | Eloize R. M. Seno | Rozane R. Rebechi | Helena M. Caseli | Fabiano M. Rocha-Jr. | Guilherme A. Faller

pdf bib
Avaliação de Algoritmos de Clusterização para Agrupamento de Descrições de Produtos em Notas Fiscais Eletrônicas
Jonas Gabriel L. de Araújo | Thaís G. do Rêgo | Yuri de A. M. Barbosa

pdf bib
Unified Knowledge-Graph for Brazilian Indigenous Languages: An Educational Applications Perspective
Gustavo Polleti | Fabio Cozman | Fabricio Gerardi

pdf bib
A Robustness Analysis of Automated Essay Scoring Methods
Rafael T. Anchiêta | Rogério F. de Sousa | Raimundo S. Moura

pdf bib
Classificação de Notícias em Português Utilizando Modelos Baseados em Transferência de Aprendizagem e Transformers
Wagner Narde | João Mendanha | Henrique Barbosa | Frederico Coelho | Bruno Santos | Luiz Torres

pdf bib
Beyond Single Models: Leveraging LLM Ensembles for Human Value Detection in Text
Diego Dimer Rodrigues | Mariana Recamonde-Mendoza | Viviane P. Moreira

pdf bib
Performance in a dialectal profiling task of LLMs for varieties of Brazilian Portuguese
Raquel M. Ko Freitag | Túlio Sousa de Gois

pdf bib
Mini-glossário do Tucumã do Pará no Município de Acará: olhares, significados e cultura da Amazônia
Eliene da S. Alves | Brayna C. dos S. Cardoso

pdf bib
Desambiguação de lema e atributos morfológicos na anotação do córpus Porttinari-base
Lucelene Lopes | Magali S. Duran | Thiago Alexandre Salgueiro Pardo

pdf bib
An NLP approach to impersonal –se in Brazilian Portuguese
Elvis A. de Souza | Magali S. Duran | Adriana S. Pagano

pdf bib
Inferências baseadas em sintaxe: a anotação de sujeitos implícitos
Magali Sanches Duran | Maria das Graças Volpe Nunes | Thiago Alexandre Salgueiro Pardo

pdf bib
Notes on variation and lexical diachrony in the Parish Memories-Alentejo collection (1758)
Helena Freire Cameron | Fernanda Olival | Renata Vieira

pdf bib
A sílaba e a composicionalidade em emakhuwa (P31): análise de empréstimos do português
Francelino Wilson | Vasco Magona | Felermino Ali

pdf bib
Linguistic and emotional dynamics in satirical vs. real news: a psycholinguistic analysis
Gabriela Wick-Pedro | Roney Lira de Sales Santos | Oto Araújo Vale

pdf bib
Complementos de eco de adjetivos com completiva-sujeito em português do Brasil
Ryan Saldanha Martinez | Jorge Baptista | Oto Araújo Vale

pdf bib
Modelagem baseada em frames para identificação do léxico da Violência de Gênero
Lorena Tasca Larré | Tiago Timponi Torrent

pdf bib
Relações Retóricas de List e Sequence em textos jornalísticos
Tobias J. A. Almeida | Patrícia V. Almeida | Paula C.F. Cardoso

pdf bib
Estudo preliminar sobre sinalizadores discursivos para Conteúdo Gerado por Usuários
Naira Silva Gama | Jackson Wilke da Cruz Souza

pdf bib
Relações de coerência do português brasileiro: um estudo bibliográfico-documental da RST e seus sinalizadores discursivos
Larissa Jesus Santa Bárbara | Roana Rodrigues | Jackson Wilke da Cruz Souza

pdf bib
Subsídios Linguísticos para classificação automática de textos de User-Generated Content
Mateus Araújo Pereira | Jackson Wilke da Cruz Souza

pdf bib
Relações de coerência do espanhol peninsular: Um estudo bibliográfico-documental da Rhetorical Structure Theory
Ewerson Dantas | Roana Rodrigues | Jackson Wilke da Cruz Souza

pdf bib
Estratégias automáticas para análise da concordância da anotação de Sinalizadores Discursivos
Gabriel Sizinio Bomfim Cruz | Jackson Wilke da Cruz Souza | Paula C. F. Cardoso

pdf bib
Mineração de Emoções Multirrótulo Em Textos Curtos
Ramon N. Mendes | Syanne. K. M. Tavares | Luiz Nicollas M. Campos | Fabíola P. O. Araújo

pdf bib
Classificação automática de textos de User-Generated Content utilizando Aprendizagem de Máquina Supervisionado
Iolanda Victoria Morais Ramos | Jackson Wilke da Cruz Souza

pdf bib
PLN e Segurança Jurídica Identificação de divergências jurisprudenciais com Processamento de Linguagem Natural
Marcella Queiroz de Castro | Ana Régia Mendonça

pdf bib
Um Pipeline de Pré-Processamento de Dados Textuais em Português para Análise de Redes Sociais
Livia A. dos Santos | Orlando B. Coelho | Ivan Carlos A. Oliveira Renata Araujo

pdf bib
Especulação Mística. Uma abordagem de Clusterização e Busca Semântica na aproximação de preço em cartas de Magic: The Gathering
Rodrigo Marques Duarte | André de Lima Salgado | Paula Figueira Cardoso

pdf bib
Comparação de Ferramentas para Análise de Sentimentos Aplicada no Contexto Educacional
Benjamin G. Moreira | Luiz C. Camargo | Ricardo J. Pfitscher | Tatiana R. Garcia

pdf bib
Modelo de Linguagem Quantizados na Área da Saúde: Um Enfoque em Perguntas e Respostas com Base na Técnica DPO
Mário Pinto Freitas Filho | João Dallyson Almeida | Sousa De | Anselmo C. Paiva

pdf bib
LLM-SEMREL: Towards a Better Coreference Resolution for Portuguese
Evandro Fonseca | Joaquim Neto

pdf bib
Automated Topic Annotation in Brazilian Product Reviews: A Case Study of Adversarial Examples with Sabia-3
Lucas Nildaimon dos Santos Silva | Livy Real

pdf bib
Text extraction from Knowledge Graphs in the Oil and Gas Industry
Laura P. Navarro | Elvis A. de Souza | Marco A. C. Pacheco

pdf bib
Getting Logic From LLMs Annotating Natural Language Inference with Sabiá
Fabiana Avais | Marcos Carreira | Livy Real

pdf bib
Augmenting Data to Improve the Performance of Recommender Systems
Leticia Freire de Figueiredo | Joel Pinho Lucas | Aline Paes

pdf bib
Brazilian Consumer Protection Code: a methodology for a dataset to Question-Answer (QA) Models
Aline Athaydes | Lucas Bulcao | Caio Sacramento | Babacar Mane | Daniela Barreiro Claro | Marlo Souza | Robespierre Pita