p Esta foto sem data fornecida pela OpenAI mostra uma mão robótica segurando um cubo no laboratório de pesquisa da empresa em San Francisco. A mão, chamado Dactyl, tem um único trabalho, e isso é para girar um cubo até que a letra voltada para cima corresponda a uma seleção aleatória. (Eric Louis Haines / OpenAI via AP)
p Quanto tempo leva para uma mão robótica aprender a fazer malabarismos com um cubo? p Cerca de 100 anos, dar ou pegar.
p É quanto tempo de computação virtual levou para os pesquisadores da OpenAI, o laboratório de inteligência artificial sem fins lucrativos financiado por Elon Musk e outros, para treinar sua mão desencarnada. A equipe pagou ao Google $ 3, 500 para executar seu software em milhares de computadores simultaneamente, reduzindo o tempo real para 48 horas. Depois de treinar o robô em um ambiente virtual, a equipe o testou no mundo real.
p A mão, chamado Dactyl, aprendeu a se mover, a equipe de duas dezenas de pesquisadores divulgou esta semana. Sua função é simplesmente ajustar o cubo de modo que uma de suas letras— "O, "'' P, "'' E, "'' N, "'' A" ou "I '' - voltado para cima para corresponder a uma seleção aleatória.
p Ken Goldberg, uma Universidade da Califórnia, Professor de robótica de Berkeley que não é afiliado ao projeto, disse que a conquista da OpenAI é um grande negócio porque demonstra como robôs treinados em um ambiente virtual podem operar no mundo real. Seu laboratório está tentando algo semelhante com um robô chamado Dex-Net, embora sua mão seja mais simples e os objetos que manipula sejam mais complexos.
p Esta foto sem data fornecida pela OpenAI mostra uma mão robótica girando um cubo no laboratório de pesquisa da empresa em San Francisco. A mão, chamado Dactyl, tem um único trabalho, e isso é para girar um cubo até que a letra voltada para cima corresponda a uma seleção aleatória. (Eric Louis Haines / OpenAI via AP)
p "A chave é a ideia de que você pode fazer tanto progresso na simulação, "disse ele." Este é um caminho plausível a seguir, quando fazer experimentos físicos é muito difícil. "
p Os dedos do mundo real de Dactyl são rastreados por pontos infravermelhos e câmeras. Em treinamento, cada movimento simulado que aproximava o cubo do gol deu a Dactyl uma pequena recompensa. Deixar cair o cubo fez com que sentisse uma penalidade 20 vezes maior.
p O processo é chamado de aprendizagem por reforço. O software do robô repete as tentativas milhões de vezes em um ambiente simulado, tentando continuamente obter a maior recompensa. O OpenAI usava praticamente o mesmo algoritmo usado para vencer jogadores humanos em um videogame, "Dota 2."
p Na vida real, uma equipe de pesquisadores trabalhou cerca de um ano para levar a mão mecânica até esse ponto.
p Porque?
p Nesta quinta-feira, 26 de julho 2018, foto, O pesquisador da OpenAI Jonas Schneider examina a mão robótica do laboratório de pesquisa em San Francisco. A mão, chamado Dactyl, tem um único trabalho, e isso é para girar um cubo até que a letra voltada para cima corresponda a uma seleção aleatória. (AP Photo / Ryan Nakashima)
p Para um, a mão em um ambiente simulado não entende o atrito. Portanto, embora seus dedos verdadeiros sejam de borracha, Dactyl carece de compreensão humana sobre as melhores empunhaduras.
p Os pesquisadores injetaram seu ambiente simulado com mudanças na gravidade, ângulo da mão e outras variáveis para que o software aprenda a operar de forma adaptável. Isso ajudou a diminuir a lacuna entre os resultados do mundo real e os simulados, que eram muito melhores.
p As variações ajudaram a mão a conseguir colocar a letra certa voltada para cima mais de uma dúzia de vezes seguidas antes de deixar cair o cubo. Na simulação, a mão normalmente teve sucesso 50 vezes consecutivas antes de o teste ser interrompido.
p O objetivo da OpenAI é desenvolver inteligência artificial geral, ou máquinas que pensam e aprendem como humanos, de uma forma segura para as pessoas e amplamente distribuída.
p Musk advertiu que, se os sistemas de IA forem desenvolvidos apenas por empresas com fins lucrativos ou governos poderosos, eles poderiam um dia exceder a inteligência humana e ser mais perigosos do que uma guerra nuclear com a Coréia do Norte. p © 2018 Associated Press. Todos os direitos reservados.