Crédito:Unsplash / CC0 Public Domain
Pesquisadores da Oregon State University estão fazendo avanços importantes com um novo tipo de sensor óptico que imita mais de perto a capacidade do olho humano de perceber mudanças em seu campo visual.
O sensor é um grande avanço para áreas como reconhecimento de imagem, robótica e inteligência artificial. As descobertas do pesquisador da Faculdade de Engenharia da OSU John Labram e da estudante de graduação Cinthya Trujillo Herrera foram publicadas hoje em Cartas de Física Aplicada .
Tentativas anteriores de construir um dispositivo do tipo olho humano, chamado de sensor retinomórfico, confiaram em software ou hardware complexo, disse Labram, professor assistente de engenharia elétrica e ciência da computação. Mas a operação do novo sensor é parte de seu design fundamental, usando camadas ultrafinas de semicondutores perovskita - amplamente estudados nos últimos anos por seu potencial de energia solar - que mudam de fortes isolantes elétricos para fortes condutores quando colocados na luz.
"Você pode pensar nisso como um único pixel fazendo algo que atualmente exigiria um microprocessador, "disse Labram, que está liderando o esforço de pesquisa com o apoio da National Science Foundation.
O novo sensor pode ser uma combinação perfeita para os computadores neuromórficos que irão alimentar a próxima geração de inteligência artificial em aplicações como carros autônomos, robótica e reconhecimento avançado de imagem, Disse Labram. Ao contrário dos computadores tradicionais, que processa informações sequencialmente como uma série de instruções, Os computadores neuromórficos são projetados para emular as redes maciçamente paralelas do cérebro humano.
"As pessoas tentaram replicar isso em hardware e foram razoavelmente bem-sucedidas, "Labram disse." No entanto, mesmo que os algoritmos e a arquitetura projetados para processar informações estejam se tornando cada vez mais como o cérebro humano, as informações que esses sistemas recebem ainda são decididamente projetadas para computadores tradicionais. "
Em outras palavras:para atingir seu potencial máximo, um computador que "pensa" mais como o cérebro humano precisa de um sensor de imagem que "veja" mais como o olho humano.
Um órgão espetacularmente complexo, o olho contém cerca de 100 milhões de fotorreceptores. Contudo, o nervo óptico tem apenas 1 milhão de conexões com o cérebro. Isso significa que uma quantidade significativa de pré-processamento e compressão dinâmica deve ocorrer na retina antes que a imagem possa ser transmitida.
Acontece que nosso sentido de visão é particularmente bem adaptado para detectar objetos em movimento e é comparativamente "menos interessado" em imagens estáticas, Disse Labram. Assim, nosso circuito óptico dá prioridade aos sinais de fotorreceptores que detectam uma mudança na intensidade da luz - você pode demonstrar isso olhando para um ponto fixo até que os objetos em sua visão periférica comecem a desaparecer, um fenômeno conhecido como efeito Troxler.
Tecnologias convencionais de detecção, como os chips encontrados em câmeras digitais e smartphones, são mais adequados para o processamento sequencial, Disse Labram. As imagens são digitalizadas em uma matriz bidimensional de sensores, pixel por pixel, em uma frequência definida. Cada sensor gera um sinal com uma amplitude que varia diretamente com a intensidade da luz que recebe, o que significa que uma imagem estática resultará em uma tensão de saída mais ou menos constante do sensor.
Por contraste, o sensor retinomórfico permanece relativamente silencioso em condições estáticas. Ele registra um curto, sinal agudo quando detecta uma mudança na iluminação, em seguida, reverte rapidamente para seu estado de linha de base. Este comportamento é devido às propriedades fotoelétricas únicas de uma classe de semicondutores conhecida como perovskitas, que se mostraram muito promissores como a próxima geração, materiais de células solares de baixo custo.
No sensor retinomórfico de Labram, a perovskita é aplicada em camadas ultrafinas, apenas algumas centenas de nanômetros de espessura, e funciona essencialmente como um capacitor que varia sua capacitância sob iluminação. Um capacitor armazena energia em um campo elétrico.
"A forma como testamos é, basicamente, deixamos no escuro por um segundo, então ligamos as luzes e apenas as deixamos acesas, "ele disse." Assim que a luz acender, você tem este grande pico de voltagem, então a voltagem decai rapidamente, mesmo que a intensidade da luz seja constante. E é isso que queremos. "
Embora o laboratório de Labram atualmente possa testar apenas um sensor por vez, sua equipe mediu uma série de dispositivos e desenvolveu um modelo numérico para replicar seu comportamento, chegando ao que Labram considera "uma boa combinação" entre teoria e experimento.
Isso permitiu à equipe simular uma série de sensores retinomórficos para prever como uma câmera de vídeo retinomórfica responderia ao estímulo de entrada.
"Podemos converter o vídeo em um conjunto de intensidades de luz e, em seguida, colocá-lo em nossa simulação, "Labram disse." Regiões onde uma saída de alta tensão é prevista pelo sensor acendem, enquanto as regiões de baixa tensão permanecem escuras. Se a câmera for relativamente estática, você pode ver claramente que todas as coisas que estão se movendo respondem fortemente. Isso permanece razoavelmente fiel ao paradigma do sensor óptico em mamíferos. "
Uma simulação usando imagens de um treino de beisebol demonstra os resultados esperados:os jogadores no campo interno aparecem claramente visíveis, objetos brilhantes em movimento. Objetos relativamente estáticos - o diamante de beisebol, as arquibancadas, até mesmo os outfielders - desaparecem na escuridão.
Uma simulação ainda mais impressionante mostra um pássaro voando à vista, em seguida, quase desaparece quando para em um comedouro de pássaros invisível. O pássaro reaparece enquanto decola. O alimentador, oscilando, torna-se visível apenas quando começa a se mover.
"O bom é que, com esta simulação, podemos inserir qualquer vídeo em uma dessas matrizes e processar essas informações essencialmente da mesma maneira que o olho humano faria, "Labram disse." Por exemplo, você pode imaginar esses sensores sendo usados por um robô rastreando o movimento de objetos. Qualquer coisa estática em seu campo de visão não provocaria uma resposta, entretanto, um objeto em movimento estaria registrando uma alta tensão. Isso diria ao robô imediatamente onde o objeto estava, sem qualquer processamento de imagem complexo. "