Pesquisa da UFMG em parceria com a UFSJ propõe padrão para medir precisão de ferramentas que analisam opiniões em textos
O excesso de opções na internet é um problema universal. Quem nunca passou horas rolando telas sem decidir qual filme assistir, que música ouvir ou que produto comprar? Para tentar solucionar isso, surgiram os sistemas de recomendação, que oferecem sugestões com base em escolhas anteriores. No entanto, boa parte dessas ferramentas ainda depende quase exclusivamente de notas numéricas, as famosas ‘estrelinhas’. O resultado é um ciclo vicioso: mais do mesmo, pouca diversidade e menos precisão. Esse ‘loop da bolha’ acaba deixando o usuário preso a recomendações repetitivas.
Um grupo de cientistas da UFMG da UFSJ decidiu atacar o problema. O trabalho foi desenvolvido junto ao recém-inaugurado Instituto Nacional de Ciência e Tecnologia em Inteligência Artificial Responsável para Linguística Computacional, Tratamento e Disseminação de Informação (INCT TILD-IAR), que tem sede no Departamento de Ciência da Computação (DCC) da UFMG.
Em vez de confiar apenas em números, os especialistas mostraram que os comentários – textos nos quais os usuários explicam suas experiências, críticas e elogios –, têm muito mais valor para entender preferências reais.
Do estudo à criação do iRev
Em artigo publicado na ACM Computing Surveys, os pesquisadores revisaram 124 estudos internacionais sobre sistemas de recomendação baseados em comentários, os chamados RARSs (Review-Aware Recommender Systems). Mas a contribuição dos pesquisadores não se limitou à revisão. A partir da análise, eles criaram o iRev, a primeira plataforma aberta projetada para padronizar testes e comparações desses sistemas.
O iRev funciona como espécie de benchmark, ou seja, trata-se de um padrão de referência que possibilita avaliar tecnologias de forma justa e replicável. Ele compara desempenho, processos e produtos com os destaques do setor, identificando as práticas mais eficientes e oportunidades de melhoria. Na prática, a plataforma atua como ‘campo neutro’, definindo quais bases de dados usar – como Amazon ou Yelp – e quais métricas aplicar, incluindo precisão, diversidade e novidade. Isso garante que todos os algoritmos sejam testados nas mesmas condições, tornando os resultados comparáveis e confiáveis.
Os testes iniciais realizados pelos pesquisadores indicaram que não existe um algoritmo perfeito para todas as situações, e cada modelo se destaca em contextos específicos. Ainda assim, com a padronização oferecida pelo iRev, pesquisadores e empresas poderão contar com um guia confiável para selecionar soluções adequadas e mais eficazes.
“Comentários carregam detalhes impossíveis de serem capturados por meio de números. Eles permitem que algoritmos expliquem o porquê de uma recomendação, o que aumenta a confiança dos usuários”, avalia o professor Leonardo Rocha, um dos autores do artigo e coordenador de comunicação do INCT TILD IAR.
Para ele, a capacidade de analisar textos pode ajudar a entender as razões de boas e de más avaliações. “Observamos que usar textos para fazer as recomendações ao usuário permite que ele compreenda o motivo dessa sugestão e que haja maior chance de sucesso. A recomendação passa a ser algo do interesse ou do gosto daquela pessoa, e não uma coisa generalizada”, afirma.
A plataforma iRev garante que essas novas abordagens sejam avaliadas de forma rigorosa, transparente e comparável. Ao colocar a opinião do usuário no centro, o estudo estabelece um marco. “Não dá mais para ignorar a voz das pessoas. A inteligência artificial pode aprender muito com a riqueza das experiências compartilhadas on-line”, diz Rocha.
O INCT TILD-IAR reforça que o desenvolvimento de IA no Brasil precisa ser não só eficiente, mas também responsável. Isso significa criar ferramentas que respeitem a pluralidade de opiniões, ajudem a reduzir as desigualdades e valorizem a identidade cultural do país. Assim, a pesquisa mostra que inovação não é apenas copiar modelos de fora, mas construir caminhos próprios e mais próximos da realidade brasileira.
IA com as ‘cores’ do Brasil
O TILD IAR é uma rede nacional de pesquisa, cuja missão é desenvolver inteligência artificial responsável aplicada à linguagem, alinhada à diversidade cultural brasileira. A rede busca reduzir a dependência de modelos importados, criando soluções éticas, transparentes e inclusivas, que reflitam a pluralidade do país e promovam tecnologias que dialoguem com a sociedade de forma prática e acessível.
O projeto INCTs é uma iniciativa do Ministério da Ciência, Tecnologia e Inovação (MCTI). Entre outras estratégias, ele também promove a transferência de conhecimento para a sociedade e para setores produtivos, conectando pesquisa acadêmica à inovação aplicada.
Artigo: Review-aware recommender systems (RARSs): recent advances, experimental comparative analysis, discussions, and new directions
Autores: Guilherme Bittencourt, Naan Vasconcelos, Yan Andrade, Nicollas Silva, Washington Cunha, Diego Roberto Colombo Dias, Marcos André Gonçalves, Leonardo Rocha.
Publicado na ACM Computing Surveys, em junho de 2025, e disponível on-line.
Marcus Vinicius dos Santos | INCT TILD-IAR
Matéria reproduzida na íntegra do site da UFMG