Detecção de fraude em transações eletrônicas


O problema central que motiva esse trabalho é a identificação de fraudes eletrônicas, temas que é amplo e está relacionado a diferentes tipos de fraudes que podem ocorrer nesse cenário de comércio eletrônico. O objetivo dessa pesquisa é projetar e implementar técnicas para detecção de fraudes em transações eletrônicas, como, por exemplo em aplicação de e-Business que envolvem pagamento eletrônico. Para isso, a proposta é utilizar diferentes abordagens e avaliar sua eficácia, usando dados reais. Para a realização desse cenário, temos uma cooperação com a instituição Universo Online S/A (UOL), que nos oferece apoio técnico e base de dados reais para a realização de estudo de caso. Mais especificamente, a proposta é trabalhar com a modelagem, caracterização previsão de Charge-Back. O Charge-Back é cancelamento de uma venda feita com cartão de débito ou crédito, que pode acontecer por dois motivos: um deles é o não reconhecimento da compra por parte titular do cartão, e outro pode se dar pelo fato de a transação não obedecer às regulamentações previstas nos contratos, termos, aditivos e manuais editados pelas administradoras. Ou seja, lojista vende e depois descobre que o valor da venda não será creditado porque a compra foi considerada inválida. Os números são desconhecidos, mas o que se sabe é que o volume é bem significativo, principalemte nas lojas virtuais. O problema de previsão de Charge-Back se resume à necessidade de identificar quais transações eletrônicas vão culminar em estorno e, completamente, quais serão bem sucedidas. Antes de aplicar técnicas para a previsão de Charge-Back, torna-se necessário caracterizar os atributos das transações eletrônicas para entender melhor as suas características. A solução desse problema está diretamente relacionada ao problema de classificação, que pode ser dividido em duas etapas principais: O treinamento e avaliação. O treinamento diz respeito à construção de um modelo para classificar as transações. Já a avaliação consiste na aplicação do modelo de classificação a dados de teste e obtenção de indicadores para análise da qualidade dos resultados.