uma, Ilustração da matriz de fotodiodos ANN. Todos os subpixels com a mesma cor são conectados em paralelo para gerar M correntes de saída. b, Diagrama de circuito de um único pixel na matriz de fotodiodo. c, d, Esquemas do classificador (c) e do autoencoder (d). Abaixo da ilustração do codificador automático, mostrado é um exemplo de codificação / decodificação de uma letra de 28 × 28 pixels do banco de dados de dígitos manuscritos MNIST. A imagem original é codificada em 9 neurônios da camada de código e então decodificada de volta em uma imagem. Crédito: Natureza (2020). DOI:10.1038 / s41586-020-2038-x
Ao aplicar computação no sensor de dados analógicos, uma equipe de pesquisadores do Instituto de Fotônica da Universidade de Tecnologia de Viena desenvolveu uma maneira de acelerar a visão de máquina. Em seu artigo publicado na revista Natureza , o grupo descreve seu projeto e quão bem ele foi executado durante o teste. Yang Chai, da Universidade Politécnica de Hong Kong, publicou um artigo News &Views na mesma edição do jornal, descrevendo o trabalho da equipe.
Com a tecnologia atual, a visão de máquina é realizada por meio de um sistema básico que envolve um dispositivo com um sensor de imagem que responde à luz. Os dados do sensor de imagem são convertidos de um sinal analógico para um digital com outro dispositivo. Os dados digitais são então processados por outro dispositivo, localmente ou na nuvem. Este sistema funciona razoavelmente bem para os aplicativos atuais, mas não será adequado para aqueles no futuro devido ao atraso envolvido na leitura e processamento de grandes quantidades de dados de imagem. Neste novo esforço, os pesquisadores propuseram um novo tipo de sensor de imagem que pode processar dados analógicos de forma limitada.
O sensor de imagem previsto pela equipe na Áustria consiste em incorporar trios de fotodiodos em um chip de forma que permita aumentar ou diminuir sua sensibilidade à luz usando uma voltagem aplicada, uma configuração que permite que cada diodo seja individualmente ajustado ou pesado. Em tal configuração, os diodos agem de forma semelhante aos nervos do olho humano. Conforme as imagens são apresentadas ao dispositivo, todos os diodos reagem com base em sua sintonia - juntos, eles servem como um processador de visão de rede. Quando a luz chega ao sensor, ele é processado adicionando a intensidade da luz de cada uma das colunas e linhas que compõem a matriz do sensor. A matriz de diodos é então treinada para uma tarefa ajustando cada membro individualmente com base em um resultado desejado. O estágio inicial de aprendizagem leva um pouco de tempo, mas uma vez que a rede foi treinada, o processamento ocorre a uma taxa igual ao tempo de reação dos fotodiodos.
O dispositivo idealizado pelos pesquisadores não era para produzir imagens. Em vez de, ele filtra os dados desnecessários e realiza uma classificação inicial. Para testar, os pesquisadores ensinaram seu dispositivo a classificar três letras simplificadas. Eles também o usaram para fazer uma autocodificação muito básica com base nos principais recursos de uma determinada imagem. Eles observam que seu design e dispositivo ainda estão no estágio de prova de conceito, mas dizem que suas descobertas até agora são encorajadoras.
© 2020 Science X Network