Usando inteligência artificial, uma equipe liderada pelo IST da Penn State projetou um sistema que pode compactar e restaurar arquivos, como imagens. Freqüentemente, há perda de qualidade quando as imagens são restauradas. Contudo, quando o algoritmo da equipe restaurou imagens de amostra, a qualidade da imagem era melhor do que benchmarks, incluindo o próprio sistema de compressão do Google. Crédito:Wikimedia Commons
O mundo produz cerca de 2,5 quintilhões de bytes de dados todos os dias. Armazenar e transferir todo esse enorme - e em constante crescimento - número de imagens, vídeos, Tweets, e outras formas de dados estão se tornando um desafio significativo, que ameaça minar o crescimento da Internet e impedir a introdução de novas tecnologias, como a Internet das Coisas.
Agora, uma equipe de pesquisadores relata que um algoritmo que usa uma técnica de aprendizado de máquina baseada no cérebro humano pode facilitar o entupimento de dados, reduzindo o tamanho dos arquivos multimídia, como vídeos e imagens, e restaurá-los sem perder muita qualidade ou informação. O aprendizado de máquina é um tipo de inteligência artificial, ou AI.
Em um estudo, os pesquisadores desenvolveram um algoritmo que apresenta uma rede neural recorrente para compactar e restaurar dados, de acordo com C. Lee Giles, David Reese Professor de Ciências e Tecnologia da Informação, Estado de Penn, e um associado do Institute for CyberScience. Nesse caso, o algoritmo, que eles chamam de algoritmo de refinamento iterativo, que se concentra na etapa de decodificação ou restauração, foi capaz de produzir imagens restauradas com melhor qualidade do que os benchmarks selecionados para o estudo, incluindo um sistema de compressão projetado pelo Google, que os pesquisadores consideraram a melhor na época.
As pessoas compactam dados para armazenar mais fotos em seus smartphones, por exemplo, ou compartilhe vídeos na Internet ou em plataformas de mídia social, como YouTube e Twitter.
Ele disse que o sucesso do sistema em compactar arquivos se deve ao uso de um decodificador de rede neural recorrente, em vez de uma rede feedforward ou um decodificador convencional (linear). Uma rede neural recorrente usa memória stateful, o que permite armazenar dados enquanto faz cálculos. Contudo, uma rede neural regular - ou rede neural feedforward - não pode armazenar dados e só pode processar informações sequencialmente. Com a capacidade de memória adicionada, redes neurais recorrentes podem desempenhar melhor as tarefas, como reconhecimento de imagem.
"Um sistema recorrente tem feedback, enquanto um perceptron multicamadas, ou rede convolucional, ou outro tipo semelhante de rede neural, são geralmente feedforward, em outras palavras, os dados simplesmente passam, não é armazenado como memória, "Disse Giles.
David Miller, professor de engenharia elétrica e ciência da computação, que trabalhou com Giles, disse que "a principal vantagem da recorrência neste contexto de decodificação de imagem é que ele explora correlações em longas regiões espaciais da imagem do que um decodificador de imagem convencional."
Outra vantagem do algoritmo, em comparação com sistemas concorrentes, foi a simplicidade do design do algoritmo, disseram os pesquisadores, que relataram suas descobertas recentemente na Data Compression Conference (DCC).
"Na verdade, temos apenas a rede neural recorrente no final do processo, em comparação com o do Google, que inclui redes neurais recorrentes, mas eles são colocados em muitas camadas diferentes, o que aumenta a complexidade, "disse Giles.
Um dos problemas com a compactação é que, quando uma imagem ou vídeo compactado é restaurado, o arquivo pode perder pedaços de informação, o que pode tornar a imagem ou o vídeo desfocado, ou distorcido. Os pesquisadores testaram o algoritmo em várias imagens e foi capaz de armazenar e reconstruir as imagens com qualidade superior ao algoritmo do Google e outros sistemas de benchmark.
As redes neurais organizam seus "neurônios" eletrônicos de maneira muito semelhante à forma como o cérebro é composto de redes de neurônios; Contudo, Alexander G. Ororbia, professor assistente do Rochester Institute of Technology, cuja pesquisa se concentra no desenvolvimento de sistemas neurais com motivação biológica, e algoritmos de aprendizagem lideram essa pesquisa, disse que os cérebros eletrônicos são muito mais simples.
"O importante a lembrar é que essas redes neurais são vagamente baseadas no cérebro, "disse Ororbia." Os neurônios que compõem uma rede neural eletrônica são muito, muito mais simples. Neurônios biológicos reais são extremamente complexos. Algumas pessoas dizem que a rede neural eletrônica é quase uma caricatura da rede neural do cérebro. "
Giles disse que a ideia de usar redes neurais recorrentes para compressão veio revisitando as antigas pesquisas de redes neurais sobre o problema de compressão, .
"Percebemos que não havia muito uso de rede neural para compressão - e nos perguntamos por quê, "disse Giles." É sempre bom revisitar trabalhos antigos para ver algo que pode ser aplicável hoje. "
Os pesquisadores testaram a capacidade de seu algoritmo de compactar e restaurar uma imagem em comparação com o sistema do Google usando três métricas independentes que avaliam a qualidade da imagem:Taxa de ruído do sinal de pico, Índice de imagem de similaridade estrutural e Índice de imagem de similaridade estrutural em várias escalas - que avaliam a qualidade da imagem.
"Os resultados de todos os benchmarks independentes e conjuntos de teste e para todas as métricas, mostram que o algoritmo de refinamento iterativo proposto produziu imagens com menor distorção e maior qualidade perceptiva, "disse Ankur Mali, um estudante candidato a doutorado na Penn State, who worked extensively on the technical implementation of the system.
No futuro, the researchers may also explore whether the system is easier to train than competing algorithms.
While all the compression neural networks require training—feeding data into the system to teach it how to perform—Giles thinks the team's design may be easier to train.
"I would guess it's much, much faster, in terms of training, também, " said Giles.