Um platô estéril é um problema de treinabilidade que ocorre em algoritmos de otimização de aprendizado de máquina quando o espaço de solução de problemas torna-se plano quando o algoritmo é executado. Pesquisadores do Laboratório Nacional de Los Alamos desenvolveram teoremas para provar que qualquer algoritmo evitará um platô estéril à medida que aumenta sua escala para ser executado em um computador quântico. Crédito:Laboratório Nacional de Los Alamos, 19 de março, 2021
Muitos algoritmos de aprendizado de máquina em computadores quânticos sofrem do temido "platô estéril" da insolubilidade, onde eles encontram becos sem saída em problemas de otimização. Este desafio foi relativamente não estudado - até agora. O trabalho teórico rigoroso estabeleceu teoremas que garantem se um determinado algoritmo de aprendizado de máquina funcionará à medida que aumenta em computadores maiores.
"O trabalho resolve um problema fundamental de usabilidade para aprendizado de máquina quântica. Provamos rigorosamente as condições sob as quais certas arquiteturas de algoritmos quânticos variacionais terão ou não platôs estéreis à medida que são aumentados, "disse Marco Cerezo, autor principal do artigo publicado em Nature Communications hoje por uma equipe do Laboratório Nacional de Los Alamos. Cerezo é um pós-doutorando em teoria da informação quântica em Los Alamos. "Com nossos teoremas, você pode garantir que a arquitetura será escalonável para computadores quânticos com um grande número de qubits. "
"Normalmente, a abordagem tem sido executar uma otimização e ver se funciona, e isso estava levando à fadiga entre os pesquisadores da área, "disse Patrick Coles, coautor do estudo. O estabelecimento de teoremas matemáticos e a derivação dos primeiros princípios eliminam as suposições do desenvolvimento de algoritmos.
A equipe de Los Alamos usou a abordagem híbrida comum para algoritmos quânticos variacionais, treinar e otimizar os parâmetros em um computador clássico e avaliar a função de custo do algoritmo, ou a medida do sucesso do algoritmo, em um computador quântico.
Algoritmos de aprendizado de máquina traduzem uma tarefa de otimização - digamos, encontrar a rota mais curta para um vendedor viajante por várias cidades - em uma função de custo, disse o co-autor Lukasz Cincio. Essa é uma descrição matemática de uma função que será minimizada. A função atinge seu valor mínimo somente se você resolver o problema.
A maioria dos algoritmos variacionais quânticos inicia sua pesquisa aleatoriamente e avalia a função de custo globalmente em cada qubit, o que muitas vezes leva a um platô árido.
"Fomos capazes de provar que, se você escolher uma função de custo que analisa localmente cada qubit individual, então garantimos que a escala não resultará em uma curva impossivelmente íngreme de tempo versus tamanho do sistema, e, portanto, pode ser treinado, "Disse Coles.
Um algoritmo variacional quântico configura um cenário de resolução de problemas onde os picos representam os pontos de alta energia do sistema, ou problema, e os vales são os valores de baixa energia. A resposta está no vale mais profundo. Esse é o estado fundamental, representado pela função de custo minimizado. Para encontrar a solução, o algoritmo treina sobre a paisagem, navegando assim para o ponto baixo.
"As pessoas têm proposto redes neurais quânticas e comparando-as com simulações em pequena escala de 10s (ou menos) alguns qubits, "Cerezo disse." O problema é, você não verá o platô árido com um pequeno número de qubits, mas quando você tenta aumentar para mais qubits, parece. Em seguida, o algoritmo deve ser retrabalhado para um computador quântico maior. "
Um platô estéril é um problema de treinabilidade que ocorre em algoritmos de otimização de aprendizado de máquina quando o espaço de solução de problemas torna-se plano quando o algoritmo é executado. Nessa situação, o algoritmo não consegue encontrar a inclinação descendente no que parece ser uma paisagem sem características e não há um caminho claro para o mínimo de energia. Faltando recursos de paisagem, o aprendizado de máquina não consegue se treinar para encontrar a solução.
"Se você tem um planalto estéril, toda esperança de aceleração quântica ou vantagem quântica está perdida, "Cerezo disse.
A descoberta da equipe de Los Alamos dá um passo importante em direção à vantagem quântica, quando um computador quântico executa uma tarefa que demoraria infinitamente muito em um computador clássico. Alcançar a vantagem quântica depende, em curto prazo, do aumento de escala dos algoritmos quânticos variacionais. Esses algoritmos têm o potencial de resolver problemas práticos quando computadores quânticos de 100 qubits ou mais estiverem disponíveis - espero que em breve. Os computadores quânticos atualmente atingem o máximo de 65 qubits. Um qubit é a unidade básica de informação em um computador quântico, como os bits estão em um computador digital clássico.
"O tópico mais quente em computadores quânticos de escala intermediária barulhentos são os algoritmos quânticos variacionais, ou aprendizagem de máquina quântica e redes neurais quânticas, "Eles foram propostos para aplicações que vão desde a resolução da estrutura de uma molécula em química até a simulação da dinâmica de átomos e moléculas e números de fatoração."