Nesta segunda-feira, 19, em Recife, Pernambuco, durante o XXI Simpósio Brasileiro de Sistemas de Informação (SBSI) 2025, Washington Cunha, ex-aluno de doutorado e professor substituto do Departamento de Ciência da Computação (DCC) da UFMG, conquistou o primeiro lugar na categoria teses no VII Concurso de Teses, Dissertações e Trabalhos de Graduação em Sistemas de Informação (CTDGSI). A tese foi orientada pelos professores Leonardo Rocha, da Universidade Federal de São João del Rei, e pelo professor Marcos André Gonçalves, do DCC.
A tese vencedora, intitulada “A comprehensive exploitation of instance selection methods for automatic text classification”, aborda uma técnica inovadora de engenharia de dados em Processamento de Linguagem Natural (PLN), pouco explorada até agora. Segundo os autores, essa técnica, conhecida como Seleção de Instâncias (SI), possui um potencial enorme no cenário atual. “O objetivo da SI é reduzir o tamanho do conjunto de treinamento, eliminando instâncias ruidosas ou redundantes, sem comprometer a eficácia dos modelos treinados e, ao mesmo tempo, diminuir os custos do processo de treinamento”, explicaram.
Washington Cunha destacou o impacto das descobertas. “Nossas pesquisas revelam um potencial inexplorado para soluções de SI. Propusemos duas novas abordagens voltadas para ruído e reconhecimento de redundância, especialmente pensadas para grandes conjuntos de dados e arquiteturas de transformadores. Nossa solução final conseguiu reduzir, em média, 41% do tamanho dos conjuntos de treinamento, mantendo o mesmo nível de eficácia. Além disso, nossas técnicas proporcionaram melhorias na velocidade de processamento, com aceleração de até 2,46 vezes, tornando-as escaláveis para conjuntos de dados com centenas de milhares de documentos”, detalhou.
O SBSI 2025 teve como tema central “Inovação com Equidade, Diversidade e Inclusão em Sistemas de Informação”, uma escolha que reflete a urgência de discutir como desenvolver tecnologias que promovam uma sociedade mais justa e igualitária. Segundo os organizadores, “Inovação com EDI vai além da criação de novas tecnologias; trata-se de garantir que essas inovações sejam acessíveis e benéficas para todos, independentemente de suas origens, identidades ou condições socioeconômicas”.