Caçadores de fraudes

A tese do Anselmo Castelo Branco Ferreira orientado pelo professor Anderson de Rezende Rocha (IC/UNICAMP) e coorientado pelo professor Jefersson Alex dos Santos (DCC/UFMG) propõe nova abordagem para a identificação de fraudes em documentos digitais. Em vez de utilizar um método único para cada tipo de caso, como se faz usualmente, o estudo sugere a combinação de diferentes técnicas [metodologia denominada de multianálise] como forma de refinar a investigação. 

Os crimes envolvendo a adulteração de documentos digitais, observa Ferreira, têm aumentado significativamente em tempos recentes, acompanhando o crescimento das redes sociais, blogs e sites. “Está se tornando cada vez mais difícil constatar a autenticidade de fotografias e vídeos compartilhados nesses espaços, dado que as ferramentas de edição de imagens também estão cada vez mais acessíveis”, afirma. Comprovar se um documento é autêntico não constitui, porém, o único desafio para quem atua na área da computação forense.

De acordo com o autor da tese de doutorado, outra dificuldade é descobrir a origem dos documentos. “Identificar qual impressora gerou um contrato fraudado, por exemplo, também é tarefa das mais complexas”, diz. Normalmente, esse tipo de fraude tem sido investigado por meio de abordagens específicas. “Ainda nesse contexto, quando pensamos na identificação de falsificações em fotografias, normalmente as técnicas exploram um ou poucos aspectos ou artefatos de cada vez. Ou seja, muitas vezes uma técnica verifica um único ponto, como a iluminação da foto. Ocorre que esse tipo de exame não é tão efetivo, porque desconsidera vários outros elementos. O que a tese propõe é realizar uma multianálise do documento, promovendo a combinação de diferentes técnicas para checar distintos atributos do objeto investigado”, acrescenta Ferreira.

Dito de modo simplificado, o trabalho do pesquisador estabelece um conjunto de passos, vários deles originais, para promover a checagem tanto da autenticidade quanto da origem de documentos digitais. Assim, utilizando novamente o exemplo da fotografia, ao invés de investigar somente a iluminação, o modelo também consideraria outras propriedades da imagem, como cor, tom de pele das pessoas e eventuais inconsistências nas bordas, que são analisadas por algoritmos dotados da capacidade de aprender com esses dados de entrada.

Em seguida, outro algoritmo faz a fusão dessas análises e determina se o objeto em questão foi ou não alvo de alguma manipulação. “O cumprimento dessa rota é importante porque a fraude pode eventualmente driblar um algoritmo, mas dificilmente conseguirá driblar vários deles”, pontua o professor Rocha. Em relação à origem do documento, o procedimento é semelhante. No caso de um texto impresso, por exemplo, os pesquisadores avaliam o tipo e o corpo das letras, a área de mancha da impressão, o tom do toner etc, e fazem a comparação com textos gerados por impressoras suspeitas, de modo a encontrar diferenças ou semelhanças.

O orientador da tese observa que, para realizar esse tipo de análise, os documentos digitais passam por pré-processamentos. “Nós ampliamos ou reduzimos várias vezes uma imagem, para enfatizar determinadas propriedades da mesma. Ou a decompomos em diferentes canais de informação. Ou, ainda, aplicamos determinadas perturbações. Como muitos fraudadores aplicam filtros nas imagens, na tentativa de dificultar a comprovação da falsificação, nós também filtramos a imagem diversas vezes e analisamos o comportamento desta após cada etapa de filtragem, que pode ser vista como um processo de perturbação. Se ela não foi filtrada anteriormente, o comportamento será um. Se foi, será outro”, pormenoriza.

Uma analogia interessante em relação a esse processo seria com a compressão de textos. “Se temos um texto original nunca foi comprimido e o comprimimos pela primeira vez, ele diminui de tamanho; se ele já foi comprimido anteriormente, dificilmente diminuirá e, possivelmente, até aumentará de tamanho. O mesmo acontece na filtragem; se a imagem já foi filtrada e a filtramos novamente, certos elementos da mesma serão excluídos, mas, certamente, são elementos diferentes em relação àquela imagem que nunca foi filtrada e está sofrendo a primeira filtragem”, reforça o docente do IC/UNICAMP.



Fonte: Jornal da UNICAMP, número 660
Texto: Manuel Alves Filho; Fotos: Divulgação, Antoninho Perri;  Edição de Imagens:  André Vieira