Aprendizado de Máquina Aplicado a Problemas de Recuperação de Informação e Integração de Dados


O projeto em andamento tem como objetivo principal explorar uma técnica de aprendizado de máquina (ou supervisionada), programação genética (PG), na resolução 
de diversos problemas nas áreas de recuperação de informação e casamento inexato em Sistemas de Informação avançados, com foco principal na Web. Mais especificamente, PG foi utilizada, com bastante sucesso pelo nosso grupo, como um arcabouço para permitir a combinação flexível de diversas evidências disponíveis em cada tipo de problema atacado. Entre os diferentes sub-problemas/aplicações que atacamos, incluímos: 1) recuperação de informação em coleções de documentos textuais; 2) recuperação de imagens baseada em conteúdo; 3) publicidade baseada em conteúdo na Web; 4) deduplicação de registros em bases de dados; e 5) remoção de ambigüidade de 
autoria de publicações científicas.