p Uma ilustração do DeepCube. O processo de treinamento e resolução é dividido em ADI e MCTS. Primeiro, treinamos iterativamente um DNN estimando o valor real dos estados de entrada usando a pesquisa em largura. Então, usando o DNN para orientar a exploração, resolvemos cubos usando Monte Carlo Tree Search. Crédito:arXiv:1805.07470 [cs.AI]
p Desencadeando maneiras de uma máquina resolver o Cubo de Rubik? Inúmeras equipes podem se levantar e dizer que já estive lá, Fiz isso. Vimos muitas manchetes, também, sobre como eles marcaram o ponto para definir recordes de tempo. Então, qual é o problema da última história de cubos de resolução de máquina? p David Grossman em
Mecânica Popular comentou que os cientistas da Califórnia levaram as coisas para a terceira dimensão com um algoritmo que pode descobrir como resolver um cubo de Rubik.
p Uma equipe da Universidade da Califórnia em Irvine está por trás de uma abordagem que chamou atenção especial. "Resolvendo o cubo de Rubik sem conhecimento humano" é o título do artigo, que descreve sua exploração, e o artigo está em arXiv.
p Stephen McAleer, Forest Agostinelli, Alexander Shmakov e Pierre Baldi são os autores.
p "Apresentamos a Iteração Autodidática:um novo algoritmo de aprendizagem por reforço que é capaz de ensinar a si mesmo como resolver o Cubo de Rubik sem ajuda humana."
p Paul Lilly em
HotHardware :As máquinas geralmente usam um método de autoaprendizagem baseado em um sistema de recompensas. Os pesquisadores alimentam a máquina com as regras do jogo, e então usa um processo de recompensa para determinar se um movimento foi bom ou ruim,
p Contudo, como os autores escreveram, "para muitos ambientes de otimização combinatória, as recompensas são esparsas e os episódios não têm garantia de término. "
p Eles seguiram o caminho da Iteração Autodidática. Eles disseram, "Para resolver o Cubo de Rubik usando aprendizado por reforço, o algoritmo aprenderá uma política. A política determina qual movimento tomar em qualquer estado. "
p
MIT Technology Review definiu como funciona. "Dado um cubo não resolvido, a máquina deve decidir se um movimento específico é uma melhoria na configuração existente. Para fazer isso, deve ser capaz de avaliar o movimento. A iteração autodidática faz isso começando com o cubo acabado e trabalhando de trás para frente para encontrar uma configuração que seja semelhante ao movimento proposto. "
p Os autores escreveram que "DeepCube descobriu uma quantidade notável de conhecimento do Rubik's Cube durante seu processo de treinamento, incluindo o conhecimento de como usar grupos de permutação complexos e estratégias semelhantes aos melhores 'aceleradores' humanos. "
p A máquina de treinamento deles era um servidor Intel Xeon E5-2620 de 32 núcleos com três GPUs NVIDIA Titan XP. Eles chamaram seu solucionador de DeepCube.
p Avaliação de Lilly:não é uma solução perfeita para o problema, mas é impecável em termos de precisão.
p A equipe declarou no resumo do artigo que "Nosso algoritmo é capaz de resolver 100% dos cubos embaralhados aleatoriamente enquanto atinge um comprimento médio de resolução de 30 movimentos - menor ou igual aos resolvedores que empregam conhecimento de domínio humano."
p Por que isso é importante:é uma história de resolução de cubos e muito mais. A equipe mencionou metas adicionais.
p "Além de continuar a trabalhar com o Cubo de Rubik, estamos trabalhando na extensão deste método para encontrar soluções aproximadas para outros problemas de otimização combinatória, como a previsão da estrutura terciária da proteína. Muitos problemas de otimização combinatória podem ser considerados como problemas de tomada de decisão sequencial, nesse caso, podemos usar o aprendizado por reforço. "
p
MIT Technology Review disse que a nova abordagem abordou "um problema importante na ciência da computação - como resolver problemas complexos quando a ajuda é mínima."
p Idealmente, disse Lilly, "pode levar à descoberta de curas para doenças, se o método for capaz de funcionar tão bem nessas coisas quanto na solução de um cubo de Rubik. "
p
MIT Technology Review :"O verdadeiro teste, claro, será como essa abordagem lida com problemas mais complexos, como o enovelamento de proteínas. Estaremos observando para ver como fica. " p © 2018 Tech Xplore