câmera projetada por IA grava apenas objetos de interesse enquanto está cego para os outros
Imagem específica de classe de objeto usando uma câmera difrativa. a Ilustração de uma câmera difrativa de três camadas treinada para realizar imagens específicas de classe de objeto com apagamento totalmente óptico instantâneo das outras classes de objetos em seu FOV de saída. b A configuração experimental para o teste de câmera difrativa usando iluminação THz coerente. Crédito:eLight (2022). DOI:10.1186/s43593-022-00021-3
Na última década, as câmeras digitais foram amplamente adotadas em vários aspectos da nossa sociedade e estão sendo massivamente usadas em telefones celulares, vigilância de segurança, veículos autônomos e reconhecimento facial. Por meio dessas câmeras, enormes quantidades de dados de imagem estão sendo geradas, o que aumenta a preocupação com a proteção da privacidade.
Alguns métodos existentes abordam essas preocupações aplicando algoritmos para ocultar informações confidenciais das imagens adquiridas, como desfoque de imagem ou criptografia. No entanto, esses métodos ainda arriscam a exposição de dados confidenciais porque as imagens brutas já são capturadas antes de serem submetidas ao processamento digital para ocultar ou criptografar as informações confidenciais. Além disso, o cálculo desses algoritmos requer consumo de energia adicional. Outros esforços também foram feitos para buscar soluções para esse problema, utilizando câmeras customizadas para rebaixar a qualidade da imagem, de modo que informações identificáveis possam ser ocultadas. No entanto, essas abordagens sacrificam a qualidade geral da imagem para todos os objetos de interesse, o que é indesejado, e ainda são vulneráveis a ataques adversários para recuperar as informações confidenciais registradas.
Um novo artigo de pesquisa publicado na
eLight demonstrou um novo paradigma para obter imagens que preservam a privacidade, construindo um tipo fundamentalmente novo de gerador de imagens projetado pela IA. Em seu artigo, os pesquisadores da UCLA, liderados pelo professor Aydogan Ozcan, apresentaram um design de câmera inteligente que fotografa apenas certos tipos de objetos desejados, enquanto apaga instantaneamente outros tipos de objetos de suas imagens sem exigir nenhum processamento digital.
Este novo design de câmera consiste em sucessivas superfícies transmissivas, cada uma composta por dezenas de milhares de características difrativas na escala do comprimento de onda da luz. A estrutura dessas superfícies transmissivas é otimizada usando aprendizado profundo para modular a fase dos campos ópticos transmitidos de forma que a câmera apenas capture certos tipos/classes de objetos desejados e apague os outros. Após seu design baseado em deep learning (treinamento), as camadas resultantes são fabricadas e montadas em 3D, formando a câmera inteligente. Após sua montagem, quando os objetos de entrada das classes de objetos de destino aparecem na frente dele, eles formam imagens de alta qualidade na saída da câmera - conforme desejado. Em contraste, quando os objetos de entrada na frente da mesma câmera pertencem a outras classes indesejadas, eles são apagados opticamente, formando padrões não informativos e de baixa intensidade semelhantes ao ruído aleatório.
Como as informações características de classes indesejadas de objetos são apagadas de forma totalmente óptica na saída da câmera por meio de difração de luz, essa câmera projetada por IA nunca grava suas imagens diretas. Portanto, a proteção da privacidade é maximizada, pois um ataque adversário que tenha acesso às imagens gravadas desta câmera não pode trazer as informações de volta. Esse recurso também pode reduzir o armazenamento de dados das câmeras e a carga de transmissão, pois as imagens de objetos indesejados não são gravadas.
Para demonstrar experimentalmente essa câmera exclusiva de dados específicos, a equipe de pesquisa da UCLA a projetou para criar imagens específicas e seletivas de apenas uma classe de dígitos manuscritos e fabricou a câmera projetada usando impressão 3D. Esta câmera impressa em 3D foi testada usando ondas terahertz que iluminam dígitos manuscritos. Seguindo os princípios básicos de seu design, a câmera inteligente foi capaz de criar imagens seletivamente dos objetos de entrada apenas se fossem dígitos manuscritos "2", enquanto apagava instantaneamente todos os outros dígitos manuscritos das imagens de saída, produzindo recursos semelhantes a ruído de baixa intensidade .
Além dos dígitos manuscritos, os pesquisadores da UCLA também demonstraram outra variação do mesmo design de câmera específico de classe ao criar imagens seletivamente de um tipo de produto de moda (por exemplo, calças), enquanto apagava instantaneamente outros produtos de moda da saída da câmera. A equipe de pesquisa testou rigorosamente o design de sua câmera sob condições de iluminação variadas que nunca foram incluídas em seu treinamento e mostrou que essa câmera inteligente é robusta a variações de iluminação.
Além da imagem específica de classe de dados, esse design de câmera baseado em IA também foi usado para construir câmeras de criptografia, fornecendo uma camada adicional de segurança e proteção de privacidade. Essa câmera de criptografia, projetada usando camadas difrativas otimizadas para IA, realiza opticamente uma transformação linear selecionada, exclusivamente para os objetos alvo de interesse. Somente aqueles com acesso à chave de descriptografia (ou seja, a transformação linear inversa neste caso) podem recuperar a imagem original dos objetos de destino. On the other hand, the information of the other undesired objects is irreversibly lost since the AI-designed camera all-optically erases them at the output. Therefore, even if the decryption key is applied to the recorded images, it yields noise-like, unrecognizable features for other classes of undesired objects.
Except for the illumination light, this smart camera does not require any external power for its computation and operates at the speed of light. Therefore, it is fast, data- and energy-efficient, making it especially suitable for task-specific, privacy-aware, and power-limited imaging applications. The core teachings of this diffractive camera design can inspire future imaging systems that consume orders of magnitude less computing and data transmission power.
This research was led by Professor Aydogan Ozcan, the associate director of the California NanoSystems Institute (CNSI) and the Volgenau Chair for Engineering Innovation at the Electrical and Computer Engineering (ECE) department at UCLA, along with Professor Mona Jarrahi, the Northrop Grumman Endowed Chair and the director of the Terahertz Electronics Laboratory at UCLA ECE. The other authors of this work include graduate students Bijie Bai, Yi Luo, Tianyi Gan, Yuhang Li, Yifan Zhao, Deniz Mengu and post-doctoral researcher Dr. Jingtian Hu, all with the ECE department at UCLA.
+ Explorar mais All-optical phase recovery and quantitative phase imaging performed instantly without a computer