Foi apresentado em fevereiro deste ano, na Conferência Internacional de Inteligência Artificial – AAAI, o artigo do recém-mestre em Ciência da Computação, Daniel Mello, denominado “Clustering profundo de cima para baixo com GANs de vários geradores” (em tradução livre). O aluno foi orientado pelos professores do Departamento de Ciências da Computação da Universidade Federal de Minas Gerais, Fabrício Murai e Renato Assunção. A AAAI visa promover a pesquisa, o uso responsável da inteligência artificial, a compreensão pública da inteligência artificial, a melhoria do ensino e do treinamento de profissionais de IA e, também, fornecer orientação para planejadores e financiadores de pesquisa sobre a importância e o potencial dos atuais desenvolvimentos de IA e direções futuras.
De acordo com o professor Fabrício, o artigo trata da clusterização de um conjunto grande de imagens, cujo objetivo é agrupar imagens semelhantes de forma automática, sem que haja um rótulo previamente conhecido associado a cada uma. “Conseguimos propor um novo método para agrupar as imagens de forma hierárquica, começando do todo para os grupos mais específicos. Desta forma, é mais interativo, já que permite ir até onde deseja. É o primeiro método hierárquico na literatura que usa as redes neurais, conhecidas como GANs”, explicou.
Nesse novo método, a máquina aprende a gerar novos exemplos a partir de um conjunto de imagens reais. Assim, uma rede geradora gera imagens fictícias e a outra, discriminadora, aponta o que é fake e o que é real. Neste embate das duas redes, a rede geradora passa a criar imagens tão realistas quanto as originais. “Um exemplo disso é o site Essa pessoa não existe, que une imagens de forma a construir o rosto e todas as características físicas de uma pessoa que, na verdade, não existe”, citou Fabrício.
De acordo com o estudante, o clustering profundo (DC) aproveita o poder de representação de arquiteturas profundas para aprender a incorporar espaços que são ideais para análise de cluster. Essa abordagem filtra informações de baixo nível irrelevantes para clustering e provou ser notavelmente bem-sucedida para espaços de dados de alta dimensão. Alguns métodos DC empregam Generative Adversarial Networks (GANs), motivados pelas poderosas representações latentes que esses modelos são capazes de aprender implicitamente. “Neste trabalho, propomos o HC-MGAN, uma nova técnica baseada em GANs com múltiplos geradores (MGANs), que ainda não foram exploradas para clustering. Nosso método é inspirado na observação de que cada gerador de um MGAN tende a gerar dados que se correlacionam com uma sub-região da distribuição real dos dados. Usamos essa geração agrupada para treinar um classificador para inferir de qual gerador uma determinada imagem veio, fornecendo assim um agrupamento semanticamente significativo para a distribuição real. Além disso, projetamos nosso método para que seja executado em uma árvore de agrupamento hierárquica de cima para baixo, propondo assim o primeiro método DC hierárquico, até onde sabemos”, falou Daniel.
Com o uso cada vez maior de imagens na internet, além da necessidade de que tenham anotações associadas, a forma de busca de imagens semelhantes pode facilitar o trabalho de diversos profissionais. “Ter uma forma de pegar um mundo de imagens não rotuladas e agrupar para encontrar imagens similares é um grande avanço facilitador, por exemplo, para os profissionais de design, arquitetura, marketing, já que, comparado aos outros métodos já existentes, este alcança resultados muito próximos ao estado da arte mesmo dentre os que não são capazes de retornar uma hierarquia”, concluiu.