Um Sistema Genérico para A Mineração de Padrões Expressivos


Quando mais específico é um tipo de padrão a ser descoberto de forma completa (i.e., quando todos os padrões verificando a definição são extraídos dos dados), mais rapidamente a mineração ocorre. Isso não implica que as abordagens escaláveis são necessariamente específicas. Desenvolvemos princípios de enumeração (i.e., como caminhar no espaço dos padrões) genéricos que permitem ao analista escolher, em uma grande classe, restrições de relevância que podem ser eficientemente impostas aos padrões do tipo itemset. Mostramos também que essa enumeração é aplicável a conjuntos dados mais gerais do que as relações binárias em que os itemsets são tradicionalmente definidos. Porém a aplicabilidade dos nossos princípios de enumeração ainda tem limites. A comunidade internacional mostrou recentemente dois deles e, neste projeto, estenderemos nosso algoritmo a dados fuzzy e/ou muito esparsos. Além disso, destacaremos a grande expressividade da nossa classe de restrição mostrando como podemos, com a nossa solução genérica, descobrir eficientemente padrões que são a base de vários classificadores associativos. Finalmente, a última linha de pesquisa se refere a tolerância a ruído que afeta qualquer conjunto de dados reais.

Alunos envolvidos: Graduação: (1) .

Integrantes: Loïc Pascal Gilles Cerf – Coordenador / Adriano Veloso – Integrante / Wagner Meira Jr. – Integrante.