p Três etapas para nosso algoritmo de meta-aprendizagem. Crédito:Tianhe Yu e Chelsea Finn
p Uma equipe de pesquisadores da UC Berkeley encontrou uma maneira de fazer um robô imitar uma atividade que ele vê em uma tela de vídeo apenas uma vez. Em um artigo, eles enviaram para o
arXiv servidor de pré-impressão, a equipe descreve a abordagem que usaram e como funciona. p Os robôs que aprendem a fazer coisas simplesmente observando um humano realizando uma ação uma única vez seriam capazes de aprender muito mais ações novas com muito mais rapidez do que agora. Os cientistas têm trabalhado muito para descobrir como fazer isso acontecer.
p Porém, historicamente, os robôs foram programados para realizar ações como pegar um objeto por meio de um código que define expressamente o que precisa ser feito e como. É assim que a maioria dos robôs que fazem coisas como montar carros em uma fábrica funcionam. Esses robôs ainda devem passar por um processo de treinamento pelo qual são conduzidos por procedimentos várias vezes até que sejam capazes de executá-los sem cometer erros. Mais recentemente, os robôs foram programados para aprender puramente por meio da observação - muito parecido com o que os humanos e outros animais fazem. Mas esse aprendizado imitativo normalmente requer milhares de observações. Neste novo esforço, os pesquisadores descrevem uma técnica que desenvolveram que permite a um robô realizar uma ação desejada ao observar um ser humano fazê-lo apenas uma vez.
p Para realizar esta façanha, os pesquisadores combinaram a aprendizagem por imitação com um algoritmo de meta-aprendizagem. O resultado é algo que eles chamam de meta-aprendizagem agnóstica de modelo (MAML). Meta-aprendizagem, os pesquisadores explicam, é um processo pelo qual um robô aprende incorporando experiências anteriores. Se um robô assistir ao vídeo de um humano pegando uma pêra ou outro objeto semelhante, por exemplo, e colocando em um copo, tigela ou outro objeto, pode dar uma "sensação" a um objetivo. Se em cada caso for ensinado a imitar o comportamento de uma certa maneira, então, ele "aprende" o que fazer ao observar outros comportamentos semelhantes. Assim, quando vê um vídeo de uma pessoa pegando uma ameixa e colocando-a em uma tigela, reconhece o comportamento e é capaz de traduzi-lo em um comportamento semelhante próprio, que pode então realizar. p © 2018 Tech Xplore