Jennifer Newman (canto inferior direito) está liderando o esforço para construir um banco de dados de fotos para pesquisa de esteganálise. Crédito:Christopher Gannon
Não há nada impressionante ou notável nas dezenas de milhares de fotos que uma equipe de pesquisa da Iowa State University passou os últimos 18 meses coletando para um novo banco de dados.
Jennifer Newman, um professor associado de matemática liderando a equipe em nome do Centro de Estatística e Aplicações em Evidências Forenses com sede no estado de Iowa, diz que não se interessa por estética ou fotos dignas de enquadramento. Na verdade, as imagens mal iluminadas e superexpostas tornam o banco de dados valioso para pesquisadores interessados em esteganálise.
"As fotos no banco de dados são de cenas comuns, e coletamos propositalmente fotos de baixa qualidade em diferentes ambientes de configuração de câmera, "Newman disse." Nós descobrimos que as configurações podem influenciar o quão bem a detecção de esteganálise funciona. "
Steganalysis é de interesse crescente para investigadores forenses que analisam fotos digitais, que pode conter conteúdo oculto relacionado a um processo criminal. A esteganografia - um método secreto de enviar mensagens sem detecção - remonta à Grécia antiga. Ele evoluiu com a tecnologia, Newman disse. Agora, qualquer pessoa com um algoritmo simples - disponível por meio de uma variedade de aplicativos gratuitos - pode manipular o código de uma imagem ou qualquer arquivo digital, como um documento do Word ou PDF, para ocultar uma mensagem.
Ao contrário da criptografia, que não mascara a presença de uma mensagem, a esteganografia "esconde a mensagem à vista de todos" para que alguém olhando para a foto não suspeite que ela contém texto oculto, Newman disse. Ajudar os investigadores forenses a identificar e decodificar essas mensagens é o objetivo final dos pesquisadores, mas primeiro eles devem estabelecer uma base para a esteganálise, ou detecção de steg.
É onde Newman e seus colegas Yong Guan, professor associado de engenharia elétrica e da computação na ISU; e Min Wu, na Universidade de Maryland, junto com uma equipe de alunos de graduação e pós-graduação da ISU estão concentrando seus esforços. Armado com quase duas dúzias de modelos diferentes de telefones celulares, os pesquisadores pegaram mais de 50, 000 imagens originais para o banco de dados StegoDB, com lançamento previsto para o final de março. Agora, pesquisadores de todo o mundo têm um catálogo de imagens de telefones celulares para usar no treinamento e teste de ferramentas de detecção de esteganálise.
“Se você não tem o banco de dados para testar as imagens, por onde você começa? Esperamos que outros pesquisadores possam analisar os dados que coletamos e desenvolver uma análise estatística quantitativa que seja útil em um tribunal, "Newman disse.
A tecnologia cria uma necessidade
Os bancos de dados públicos de esteganálise existentes incluem apenas imagens de câmeras estáticas. Com o uso generalizado de câmeras de telefones celulares, Os pesquisadores da ISU reconheceram a necessidade de dados específicos para imagens de telefones celulares para ajudar no desenvolvimento e teste de ferramentas de detecção de esteganálise. Newman diz que porque as configurações da câmera, que são únicos para cada marca e modelo de telefone, pode afetar a confiabilidade de uma ferramenta, é necessário testar as inconsistências.
Considerando a variedade de marcas e modelos de telefone, essa é uma tarefa difícil, mas Newman diz que a equipe está pronta para o desafio. Um dos objetivos do CSAFE é introduzir uma estrutura estatística para evidências em processos criminais que não existe atualmente, ela disse. De acordo com um relatório da Academia Nacional de Ciências de 2009, apenas o DNA era confiável, taxas de erro quantificáveis associadas às conclusões. Newman diz que isso significa que não há validade estatística ou suporte científico para evidências, como impressões digitais, marcas de mordida, balas ou imagens stego.
"Esta é uma evidência valiosa que pode ajudar a descartar suspeitos em um caso, mas você precisa identificar a força ou falta de força das evidências, "Newman disse." Como cientistas, nosso trabalho está focado em quantificar o que é conhecido e o que é desconhecido. Estamos estabelecendo limites do que é estatisticamente conhecido e estatisticamente incerto para essas arenas forenses. "
A determinação desses limites estatísticos permite que uma testemunha especialista testemunhe com certo grau de certeza que uma foto coletada como evidência veio de um modelo de telefone específico e a probabilidade de conter conteúdo oculto, ela disse. Levará anos de pesquisa para chegar a este ponto, mas Newman diz que o trabalho pode beneficiar investigadores em casos de pornografia infantil e roubo de propriedade intelectual. Como um exemplo, ela explicou que cada vez mais empresas estão interessadas em tecnologia para escanear arquivos eletrônicos enviados para detectar se um funcionário está enviando secretamente informações confidenciais para alguém de fora da empresa.
Nova área para exploração
Newman diz que a esteganálise é um campo relativamente jovem com várias aplicações inexploradas. Isso cria oportunidades para os pesquisadores explorarem e contribuírem com a estrutura. Ela e seus colegas apresentaram algumas de suas descobertas iniciais em conferências sobre computação forense e imagens multimídia. O trabalho não seria possível sem a experiência combinada da equipe em matemática, Estatisticas, ciência da computação e engenharia e física.
A equipe continuará coletando fotos tiradas com diferentes modelos de telefone para expandir o banco de dados. Newman diz que para ser eficaz, os pesquisadores precisam de uma grande variedade de imagens para maior aplicabilidade.