Crédito:Light:Ciência e Aplicações (2024). DOI:10.1038/s41377-024-01376-7 Nos últimos anos, as tecnologias de inteligência artificial, especialmente algoritmos de aprendizado de máquina, fizeram grandes avanços. Essas tecnologias permitiram uma eficiência sem precedentes em tarefas como reconhecimento de imagens, geração e processamento de linguagem natural e detecção de objetos, mas essa funcionalidade excepcional requer um poder computacional substancial como base.
Os recursos computacionais atuais estão se aproximando do seu limite, portanto, reduzir efetivamente o custo de treinamento de modelos de aprendizado de máquina e melhorar sua eficiência de treinamento é uma questão importante no campo da pesquisa.
Para resolver o problema, grandes esforços têm sido feitos em duas direções de pesquisa:redes neurais ópticas e redes neurais quânticas. As redes neurais ópticas utilizam métodos avançados de manipulação óptica para executar algoritmos de aprendizado de máquina no processamento clássico de informações ópticas. Eles têm vantagens exclusivas, como baixo consumo de energia, baixa diafonia e baixa latência de transmissão. No entanto, as atuais redes neurais ópticas não apresentam aceleração algorítmica, como velocidade de convergência de modelo mais rápida.
Redes neurais quânticas são algoritmos de redes neurais baseados na teoria da computação quântica. Pesquisas recentes mostraram que as redes neurais quânticas podem demonstrar aceleração algorítmica devido às correlações quânticas. No entanto, devido a limitações técnicas, atualmente é difícil executar tais algoritmos de redes neurais em hardware em larga escala, tornando difícil a sua aplicação em problemas práticos enfrentados pelas pessoas atualmente.
Em um novo artigo publicado em Light:Science &Applications , uma equipe de cientistas, liderada pelo Professor Xiangdong Zhang, do Laboratório Chave de Arquitetura Quântica Optoeletrônica Avançada e Medições do Ministério da Educação; O Laboratório Principal de Nanofotônica e Sistemas Optoeletrônicos Ultrafinos de Pequim, Escola de Física, Instituto de Tecnologia de Pequim, China, e colegas de trabalho desenvolveram um novo tipo de rede neural óptica que pode exibir a aceleração análoga a uma rede neural quântica.
Esta interessante propriedade surge devido à introdução de correlações ópticas clássicas como portadoras de informação. Na verdade, ao usar esse tipo de portadora, pode-se imitar a forma de processamento da informação possibilitada pela computação quântica, o que foi comprovado por trabalhos anteriores dos pesquisadores.
Com base na propriedade, os pesquisadores desenvolveram a operação convolucional e de agrupamento no estado óptico correlacionado e estabeleceram uma rede neural convolucional óptica correlacionada. Esta rede neural óptica tem uma correspondência um-para-um com a rede neural convolucional quântica. Ele mostra a aceleração do processo de treinamento no aprendizado de determinados conjuntos de dados e pode ser aplicado para identificar o caráter de estados quânticos sob um princípio de codificação específico.
O método e a técnica relatados abrirão novos caminhos para a realização de redes neurais ópticas aprimoradas por algoritmos, o que beneficiará o processamento de informações na era do big data.
A estrutura básica de uma rede neural convolucional óptica correlacionada inclui quatro partes:a fonte de luz correlacionada, a convolução, o agrupamento e as detecções. O processamento central do estado óptico correlacionado é feito pela convolução e pela parte de pooling. Ao contrário das redes neurais convolucionais clássicas, essas duas partes da rede neural óptica convolucional correlacionada manipulam a correlação dos estados ópticos e geram os estados correlacionados mais simples pela fusão dos feixes.
“Essas duas partes realmente realizam operações análogas às portas quânticas nas redes neurais convolucionais quânticas”, disseram os cientistas. “A parte de convolução da nossa rede é composta por operações unitárias no estado óptico correlacionado.
"É como as operações unitárias no espaço de Hilbert de qubits. A parte de agrupamento que consideramos é equivalente a medir qubits parciais para obter um espaço sub-Hilbert. Tal parte leva a uma diminuição exponencial na dimensão dos dados. Portanto, o A função das duas partes contribui para uma convergência mais rápida da função de perda ao aprender certos conjuntos de dados.
"Além disso, também certificamos a similaridade de nossa rede neural convolucional óptica correlacionada com a rede neural convolucional quântica, realizando a identificação da fase topológica dos estados quânticos. A certificação é apoiada por resultados teóricos e experimentais.
“Os resultados também indicam que as propriedades da rede neural quântica podem ser realizadas de uma forma mais acessível”, acrescentaram.
"Apesar das vantagens potenciais das redes neurais quânticas, implementá-las praticamente requer circuitos quânticos profundos com muitas portas multi-qubit e medições complicadas. Isso requer recursos significativos para estabilizar os circuitos e corrigir erros, o que é tecnicamente desafiador devido aos distúrbios ambientais inevitáveis.
"Uma alternativa potencialmente melhor é encontrar um sistema descrito pela mesma matemática da teoria quântica e menos interrompido pelo ambiente. As redes neurais ópticas correlacionadas propostas servem como exemplo de tal sistema, como evidenciado pela facilidade de arranjos de elementos e baixo requisitos sobre as circunstâncias em nossos experimentos.
“Dado o crescimento exponencial de dados e a escassez de recursos para computação de alta qualidade, nossa abordagem apresenta uma solução econômica e de alto desempenho que poderia ter aplicações generalizadas em vários campos de pesquisa em ciência de dados”.