Mineração de padrões que otimizam simultaneamente várias medidas de qualidade


O contexto deste projeto é a mineração de padrões locais. Esses padrões representam “regiões de interesse” em um conjunto de dados. Por exemplo, no caso do sistema de informação de uma loja, o conjunto de dados pode ser simplesmente uma tabela, que associa clientes com os produtos comprados por eles. Matematicamente, esse conjunto de dados é uma relação binária. Nela, um tipo de padrão muito estudado é o intemset. Ele associa subconjuntos das duas dimensões de forma que o produto Cartesiano desses dois subconjuntos seja incluído na relação. Os objetivos deste projeto são: a extensão do nosso algoritmo, multidupehack, para a mineração eficiente (poda do espaço de busca) de padrões n-dimensionais e fuzzy que otimizam qualquer conjunto de medidas de qualidade que se relacionam com a nossa grande classe de restrições, a avaliação do desempenho assim obtido, usando dados reais como os do Observatório da web, implementação das medidas mais comuns para a discriminação de um grupo de elemntos, no contexto da classificação associativa,integração da otimização dessas medidas no LAC, um classificador associativo e a avaliação dos ganhos assim obtidos quanto à necessidade,à interpretabilidade e à robustez da classificação.