• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Aprendendo com os erros e habilidades transferíveis - os atributos de um robô trabalhador
    p Crédito CC0:domínio público

    p A prática leva à perfeição - é um ditado que ajudou os humanos a se tornarem altamente hábeis e agora é uma abordagem que está sendo aplicada a robôs. p Cientistas da computação da Universidade de Leeds estão usando técnicas de inteligência artificial (IA) de planejamento automatizado e aprendizado de reforço para "treinar" um robô para encontrar um objeto em um espaço desordenado, como uma prateleira de armazém ou em uma geladeira - e mova-o.

    p O objetivo é desenvolver a autonomia robótica, para que a máquina possa avaliar as circunstâncias únicas apresentadas em uma tarefa e encontrar uma solução - semelhante a um robô transferindo habilidades e conhecimento para um novo problema.

    p Os pesquisadores de Leeds estão apresentando suas descobertas hoje (segunda-feira, 4 de novembro) na Conferência Internacional de Robótica e Sistemas Inteligentes em Macau, China.

    p O grande desafio é que em uma área confinada, um braço robótico pode não ser capaz de agarrar um objeto de cima. Em vez disso, ele deve planejar uma sequência de movimentos para alcançar o objeto de destino, talvez manipulando outros itens para fora do caminho. O poder do computador necessário para planejar tal tarefa é tão grande, o robô freqüentemente fará uma pausa por vários minutos. E quando ele executa o movimento, frequentemente falhará.

    p Desenvolver a ideia de prática leva à perfeição, os cientistas da computação em Leeds estão reunindo duas ideias da IA.

    p Um é o planejamento automatizado. O robô é capaz de "ver" o problema por meio de um sistema de visão, com efeito, uma imagem. O software no sistema operacional do robô simula a possível sequência de movimentos que ele pode fazer para alcançar o objeto alvo.

    p Mas as simulações que foram "ensaiadas" pelo robô falham em capturar a complexidade do mundo real e quando são implementadas, o robô não consegue executar a tarefa. Por exemplo, pode derrubar objetos da prateleira.

    p Portanto, a equipe de Leeds combinou o planejamento com outra técnica de IA chamada aprendizado por reforço.

    p A aprendizagem por reforço envolve o computador em uma sequência de tentativas de tentativa e erro - cerca de 10, 000 no total - para alcançar e mover objetos. Por meio dessas tentativas de tentativa e erro, o robô "aprende" quais ações ele planejou têm mais probabilidade de terminar com sucesso.

    p O computador se responsabiliza pela aprendizagem, começando selecionando aleatoriamente um movimento planejado que pode funcionar. Mas conforme o robô aprende com tentativa e erro, torna-se mais hábil em selecionar os movimentos planejados que têm maior chance de sucesso.

    p Dr. Matteo Leonetti, da Escola de Computação, disse:"A inteligência artificial é boa para permitir que robôs raciocinem - por exemplo, vimos robôs envolvidos em jogos de xadrez com grandes mestres.

    p "Mas os robôs não são muito bons no que os humanos fazem muito bem:serem altamente móveis e hábeis. Essas habilidades físicas foram programadas no cérebro humano, o resultado da evolução e a forma como praticamos e praticamos e praticamos.

    p "E essa é uma ideia que estamos aplicando à próxima geração de robôs."

    p De acordo com Wissam Bejjani, um Ph.D. estudante que escreveu o artigo de pesquisa, o robô desenvolve a capacidade de generalizar, para aplicar o que planejou a um conjunto único de circunstâncias.

    p Ele disse:"Nosso trabalho é significativo porque combina planejamento com aprendizado por reforço. Muitas pesquisas para tentar desenvolver essa tecnologia se concentram em apenas uma dessas abordagens.

    p "Nossa abordagem foi validada por resultados que vimos no laboratório de robótica da Universidade.

    p "Com um problema, onde o robô teve que mover uma grande maçã, primeiro foi para o lado esquerdo da maçã para afastar a desordem, antes de manipular a maçã.

    p "Fez isso sem que a desordem caísse fora dos limites da prateleira."

    p Dr. Mehmet Dogar, Professor Associado da Escola de Computação, também esteve envolvido no estudo. Ele disse que a abordagem acelerou o tempo de "pensamento" do robô em um fator de dez - decisões que levam 50 segundos agora levam 5 segundos.


    © Ciência https://pt.scienceaq.com