Durante um evento comemorativo pelos 20 anos do Google no Brasil, realizado em Belo Horizonte — cidade onde a empresa iniciou suas atividades no país em 2005, após a aquisição da startup Akwan, formada por professores, estudantes e pesquisadores do Departamento de Ciência da Computação (DCC) da UFMG — foi apresentado oficialmente um projeto inovador voltado à ampliação da representatividade de línguas e culturas nos modelos de inteligência artificial (IA). A iniciativa, fruto de uma pesquisa colaborativa entre a UFMG e o Google Research, tem como foco valorizar a diversidade cultural e linguística do Brasil e evitar possíveis riscos éticos e sociais que um uso indevido desses modelos possam causar.
Coordenado pelo professor do DCC/UFMG, Marcos André Gonçalves, o projeto intitulado “Amplify – Google/DCC – Avançando aplicações em Inteligência Artificial Generativa no contexto brasileiro” conta com a participação da professora Jussara Almeida e do professor Washington Cunha, ambos do DCC, além da professora da Faculdade de Letras (FALE), Adriana Pagano. Integram a equipe as doutorandas Kênia Gonçalves (DCC/UFMG) e Letícia Guedes (FALE/UFMG). O principal objetivo dessa iniciativa é coletar e avaliar dados gerados por um modelo de linguagem em resposta a consultas formuladas por comunidades locais sobre tópicos e temas representativos das distintas realidades dessas comunidades. Partindo-se do pressuposto de que os chamados Modelos de Linguagem de Larga Escala são treinados com um número limitado de idiomas e contextos culturais, geralmente em inglês e em realidades do Norte Global, a linguagem produzida por esses modelos tende a disseminar informações e valores enviesados sobre culturas sub-representadas.
Por meio de uma metodologia desenvolvida pelo Google e adaptada pelos pesquisadores da UFMG, busca-se identificar lacunas e vieses para poder-se incluir saberes e conhecimentos que atualmente não fazem parte dos modelos de IA existentes. Esses dados serão cuidadosamente coletados, enriquecidos e curados por anotadores humanos, garantindo diversidade e proteção de informações sensíveis. O projeto envolve a interação com grandes modelos de linguagem para coleta e validação de dados de sistemas reais, além do desenvolvimento de protótipos e provas de conceito. Entre os resultados esperados estão publicações acadêmicas de destaque e a geração de tecnologias aplicáveis à IA generativa, contribuindo para soluções mais inclusivas e diversificadas.
Esta colaboração faz parte da Iniciativa Amplify, do Google Research, que visa criar dados mais localizados e representativos para a IA globalizada. O Amplify se concentra em empoderar comunidades em todo o mundo, apoiando pesquisas centradas em dados e práticas de desenvolvimento aberto que contemplem idiomas, valores, costumes e contextos locais.
Essa parceria reforça a conexão entre a pesquisa acadêmica e as demandas do mercado, promovendo avanços tecnológicos que respeitam e valorizam a diversidade, além de contribuir para a redução das desigualdades, alinhando-se aos objetivos de desenvolvimento sustentável da ONU para 2030 e o Plano Brasileiro para Inteligência Artificial (PBIA) apresentado pelo Laboratório Nacional de Computação Científica (LNCC).
De acordo com Gonçalves, a pesquisa em IA deve ser ética, transparente e sensível às diferenças sociais e culturais. “Os Modelos de Linguagem de Grande Escala ainda apresentam lacunas significativas em relação aos aspectos linguísticos e culturais de diversos países e comunidades. O projeto Amplify Brasil busca preencher essas lacunas, com foco especial no contexto brasileiro, caracterizado pela rica diversidade resultante da interação de distintas comunidades culturais . Diferente de outras iniciativas, o Amplify adota práticas abertas e responsáveis, respeitando a privacidade e as leis locais. Temos orgulho de integrar esse esforço colaborativo entre academia e indústria para ampliar a representatividade cultural do Brasil na IA”, afirmou.
Segundo Washington Cunha, especialista no desenvolvimento de modelos avançados de IA, a iniciativa é fundamental para apoiar uma inteligência artificial mais inclusiva, sustentável e responsável. Ele destaca que, ao ampliar a representatividade das distintas comunidades , o projeto busca tornar a IA mais acessível e refletir a pluralidade cultural do Brasil.
Cunha também compartilhou sua motivação: “Juntei-me ao Amplify porque acredito que empoderar pesquisadores e comunidades locais com ferramentas de IA adaptadas às nossas realidades sociais e culturais é essencial. Participar da criação de sistemas que sejam, ao mesmo tempo, tecnicamente robustos e eticamente alinhados com os valores da nossa sociedade, é algo que me entusiasma bastante” disse.
Ainda conforme Cunha, na América Latina, especialmente no Brasil, existem desafios como desigualdades no acesso à educação, saúde e serviços públicos, além de uma vasta extensão territorial com regiões bastante distintas. “Nesse cenário, comunidades com um rico passado de tradições e ativas na criação de formas alternativas de desenvolvimento podem ganhar maior representatividade por meio do Amplify, inspirando modelos mais resilientes capazes de ajudar a reduzir desigualdades e melhorar a qualidade de vida”, explicou.
Concluindo, pela perspectiva do professor Marcos, o projeto busca garantir que os benefícios da IA sejam compartilhados de forma mais justa e sustentável, promovendo uma tecnologia que respeite e valorize a diversidade cultural e linguística do Brasil. “Com essa iniciativa, a UFMG e o Google Research reforçam a representividade do país diante dos avanços tecnológicos e seu compromisso de desenvolver uma inteligência artificial mais justa, acessível e representativa da pluralidade do nosso país”, falou.
Estiveram presentes no evento a chefia do DCC, a coordenação do Programa de Pós-graduação em Ciência da Computação da UFMG, pesquisadores do departamento envolvidos na pesquisa, além de docentes e integrantes do DCC que participaram da criação da Akwan e do início da trajetória do Google no Brasil.
