Crédito:openai
Com letras, bloco multicolorido:uma tarefa trivial espera os humanos para pegá-lo, virar o jogo, jogue-o na palma das nossas mãos. Para um especialista em robôs, no entanto, esta é uma tarefa difícil de escalar. A manipulação manual de robôs sempre foi um desafio.
Digite Dactyl. Um vídeo OpenAI postado na segunda-feira, intitulado Learning Destreza, orgulhosamente mostrou seu sistema de robô, Dáctilo, que foi criado para manipular objetos - de uma maneira de primeira.
O acento está na palavra destreza. Seus dedos manuseiam o bloco de uma maneira notável, incluindo habilmente girar o bloco em seus diferentes lados. Ele aprendeu a girar o bloco em qualquer orientação desejada.
Eles treinaram uma rede neural convolucional, disse Espectro IEEE Evan Ackerman, para controlar uma mão de sombra para manipular objetos, em apenas 50 horas.
Para ter certeza, a outra razão pela qual sua mão atraiu o interesse foi que ela foi trabalhada em um tempo mais curto. Ackerman ressaltou a importância da redução do tempo para as equipes de robôs. (Os números são humilhantes. Espectro IEEE mencionou 50 manipulações de cubo bem-sucedidas como resultado de 6, 144 núcleos de CPU e 8 GPUs coletando 100 anos de experiência de robô simulado em 50 horas.)
Os humanos levam anos para atingir níveis "robustos" de manipulação manual. Nós vamos, robôs, disse Ackerman, "não tem esse tempo. Aprender com a prática e a experiência ainda é o caminho a percorrer para tarefas complexas como esta, e o desafio é encontrar uma maneira de aprender com mais rapidez e eficiência do que apenas dar a um robô algo para manipular continuamente até que ele aprenda o que funciona e o que não funciona, o que provavelmente levaria cerca de cem anos. "
A Reuters descreveu de forma semelhante por que seu trabalho é importante:"O treinamento físico leva meses ou anos e tem seus próprios problemas - por exemplo, se a mão de um robô deixa cair uma peça de trabalho, um humano precisa pegá-lo e colocá-lo de volta. Isso também é caro. Os pesquisadores procuraram dividir esses anos de treinamento físico e distribuí-los a vários computadores para uma simulação de software que pode fazer o treinamento em horas ou dias, sem ajuda humana. "
Outro aspecto interessante foi apontado por Stephen Nellis no artigo da Reuters. "Os pesquisadores injetaram ruído aleatório na simulação de software, tornando o mundo virtual da mão do robô confuso o suficiente para não ser confundido pelo inesperado do mundo real. "
Ao elevar a fasquia na manipulação manual, a equipe conseguiu cobrir variabilidades que não podem ser bem modeladas. Ackerman escreveu, "Isso inclui a massa e as dimensões do objeto, fricção da superfície do objeto e das pontas dos dedos do robô, quão bem as articulações do robô são amortecidas, forças do atuador, limites da junta, folga do motor e ruído, e mais."
Em sua postagem no blog OpenAI, a equipe disse que treinou uma mão de robô semelhante à humana para manipular objetos físicos "com destreza sem precedentes". Eles notaram como Dactyl foi treinado inteiramente em simulação, "adaptando-se à física do mundo real usando técnicas nas quais estivemos trabalhando no ano passado. Dactyl aprende do zero usando o mesmo algoritmo de aprendizado de reforço de propósito geral e código do OpenAI Five."
É possível treinar agentes em simulação e fazer com que resolvam tarefas do mundo real, eles disseram, sem modelagem fisicamente precisa do mundo.
© 2018 Tech Xplore