O aluno de doutorado do Programa de Pós-graduação em Ciência da Computação (PPGCC) da UFMG, Erico M. Pereira, está em Sheffield, Inglaterra, onde participa da British Machine Vision Conference (BMVC), um dos principais eventos internacionais nas áreas de visão computacional, processamento de imagens e reconhecimento de padrões. A conferência reúne anualmente pesquisadores de ponta para discutir avanços científicos que moldam o futuro da inteligência artificial. A participação do estudante também contou com o apoio do Instituto Serrapilheira.
Erico apresenta o trabalho “MO-SHW: Hierarchy-Aware Multi-Objective Optimization for Open-World Segmentation”, desenvolvido em coautoria com o professor do Departamento de Ciência da Computação (DCC) da UFMG, Frederico Gadelha Guimarães e com o professor da Universidade de Sheffield, Jefersson A. dos Santos. A pesquisa investiga como informações hierárquicas podem ser exploradas de forma mais eficiente por modelos de visão computacional em cenários de mundo aberto, nos quais os sistemas precisam lidar com classes desconhecidas, dinâmicas e pouco representadas.
Segundo o estudo, embora a utilização de hierarquias já tenha mostrado resultados promissores em tarefas de segmentação, ainda há desafios importantes para aplicá-la em ambientes de mundo aberto. Isso porque vários métodos atuais dependem de ajustes arquitetônicos incompatíveis com esse tipo de modelo ou usam funções de perda que conflitam com os múltiplos objetivos envolvidos no treinamento.
O trabalho apresentado na BMVC propõe uma solução para esse impasse. A equipe demonstra que funções de perda com reconhecimento de hierarquia podem ser incorporadas de forma eficaz quando otimizadas em um arcabouço de aprendizado multi-objetivo. Para isso, empregam métodos baseados em gradiente, como o Multi-Objective Gradient Descent (MOGD), capazes de conciliar simultaneamente objetivos hierárquicos e específicos da tarefa.
Como contribuição central, os autores introduzem o SHW, uma nova função de perda baseada na distância de Wasserstein, leve, independente de modelo e projetada para promover maior compacidade dentro das classes e melhor separação entre elas em diferentes níveis semânticos. Quando integrada ao MOGD, essa abordagem resulta em uma estrutura que permite explorar hierarquias de forma geral e eficiente, melhorando o desempenho de diversos métodos recentes de segmentação em mundo aberto.










