Uma rede neural de Fourier de amplitude massivamente paralela. Crédito:George Washington University
Pesquisadores da George Washington University, junto com pesquisadores da Universidade da Califórnia, Los Angeles, e a startup de tecnologia profunda Optelligence LLC, desenvolveram um acelerador de rede neural convolucional óptica capaz de processar grandes quantidades de informações, na ordem de petabytes, por segundo. Esta inovação, que aproveita o enorme paralelismo da luz, anuncia uma nova era de processamento de sinais ópticos para aprendizado de máquina com inúmeras aplicações, inclusive em carros autônomos, Redes 5G, centros de dados, diagnóstico biomédico, segurança de dados e muito mais.
A demanda global por hardware de aprendizado de máquina está ultrapassando drasticamente as fontes de alimentação de computação atuais. Hardware eletrônico de última geração, como unidades de processamento gráfico e aceleradores de unidade de processamento de tensor, ajudar a mitigar isso, mas são intrinsecamente desafiados pelo processamento de dados seriais que requer processamento iterativo de dados e encontra atrasos de fiação e restrições de circuito. Alternativas ópticas ao hardware eletrônico podem ajudar a acelerar os processos de aprendizado de máquina, simplificando a maneira como as informações são processadas de forma não iterativa. Contudo, O aprendizado de máquina baseado em fotônica é normalmente limitado pelo número de componentes que podem ser colocados em circuitos integrados fotônicos, limitando a interconectividade, enquanto os moduladores de luz espacial de espaço livre são restritos a velocidades de programação lentas.
Para alcançar um avanço neste sistema óptico de aprendizado de máquina, os pesquisadores substituíram os moduladores de luz espacial por tecnologia digital baseada em espelho, desenvolvendo assim um sistema 100 vezes mais rápido. O tempo não iterativo deste processador, em combinação com programação rápida e paralelização massiva, permite que este sistema de aprendizado de máquina óptico supere até mesmo as unidades de processamento gráfico topo de linha em mais de uma ordem de magnitude, com espaço para otimização adicional além do protótipo inicial.
Ao contrário do paradigma atual em hardware de aprendizado de máquina eletrônico que processa informações sequencialmente, este processador usa a ótica de Fourier, um conceito de filtragem de frequência que permite realizar as convoluções necessárias da rede neural como multiplicações de elementos muito mais simples usando a tecnologia de espelho digital.
"Este processador óptico de Fourier maciçamente paralelo de amplitude está anunciando uma nova era para processamento de informações e aprendizado de máquina. Mostramos que o treinamento desta rede neural pode ser responsável pela falta de informações de fase, "diz Volker Sorger, professor associado de engenharia elétrica e da computação na George Washington University.
"A óptica permite o processamento de matrizes em grande escala em uma única etapa de tempo, o que permite novos vetores de escala de realização de convoluções opticamente. Isso pode ter um potencial significativo para aplicativos de aprendizado de máquina, conforme demonstrado aqui, "diz Puneet Gupta, professor e vice-presidente de engenharia da computação da Universidade da Califórnia, Los Angeles.
"Esta demonstração de protótipo mostra um caminho comercial para aceleradores ópticos prontos para uma série de aplicações, como processamento de ponta de rede, centros de dados e sistemas de computação de alto desempenho, "diz Hamed Dalir, co-fundador, Optelligence LLC.
O papel, "Massively Parallel Amplitude-Only Fourier Neural Network" foi publicado hoje na revista Optica .