• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • O modelo ajuda os robôs a navegar mais como os humanos

    Os pesquisadores do MIT desenvolveram uma maneira de ajudar os robôs a navegar em ambientes mais parecidos com os dos humanos. Crédito:Massachusetts Institute of Technology

    Ao mover-se no meio de uma multidão para alcançar algum objetivo final, os humanos geralmente podem navegar pelo espaço com segurança, sem pensar muito. Eles podem aprender com o comportamento dos outros e observar quaisquer obstáculos a evitar. Robôs, por outro lado, luta com esses conceitos de navegação.

    Os pesquisadores do MIT desenvolveram agora uma maneira de ajudar os robôs a navegar em ambientes mais parecidos com os dos humanos. Seu novo modelo de planejamento de movimento permite que os robôs determinem como alcançar um objetivo explorando o ambiente, observando outros agentes, e explorando o que aprenderam antes em situações semelhantes. Um artigo descrevendo o modelo foi apresentado nesta semana na Conferência Internacional IEEE / RSJ sobre Robôs e Sistemas Inteligentes (IROS).

    Algoritmos populares de planejamento de movimento criarão uma árvore de decisões possíveis que se ramifica até encontrar bons caminhos para navegação. Um robô que precisa navegar por uma sala para chegar a uma porta, por exemplo, irá criar uma árvore de pesquisa passo a passo de movimentos possíveis e, em seguida, executar o melhor caminho para a porta, considerando várias restrições. Uma desvantagem, Contudo, Esses algoritmos raramente aprendem:os robôs não podem aproveitar as informações sobre como eles ou outros agentes agiram anteriormente em ambientes semelhantes.

    "Assim como ao jogar xadrez, essas decisões se ramificam até que [os robôs] encontrem uma boa maneira de navegar. Mas, ao contrário dos jogadores de xadrez, [os robôs] exploram como será o futuro sem aprender muito sobre seu ambiente e outros agentes, "diz o co-autor Andrei Barbu, pesquisador do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL) e do Center for Brains, Minds, and Machines (CBMM) dentro do McGovern Institute do MIT. "A milésima vez que eles passam pela mesma multidão é tão complicado quanto da primeira vez. Eles estão sempre explorando, raramente observando, e nunca usar o que aconteceu no passado. "

    Os pesquisadores desenvolveram um modelo que combina um algoritmo de planejamento com uma rede neural que aprende a reconhecer caminhos que podem levar ao melhor resultado, e usa esse conhecimento para guiar o movimento do robô em um ambiente.

    Em seu jornal, "Modelos sequenciais profundos para planejamento baseado em amostragem, "os pesquisadores demonstram as vantagens de seu modelo em dois ambientes:navegar por salas desafiadoras com armadilhas e passagens estreitas, e áreas de navegação, evitando colisões com outros agentes. Uma aplicação promissora do mundo real está ajudando carros autônomos a navegar em cruzamentos, onde eles têm que avaliar rapidamente o que os outros farão antes de entrar no tráfego. Os pesquisadores estão atualmente buscando tais aplicações por meio do Toyota-CSAIL Joint Research Center.

    “Quando os humanos interagem com o mundo, vemos um objeto com o qual interagimos antes, ou estão em algum lugar que já estivemos antes, então sabemos como vamos agir, "diz Yen-Ling Kuo, um Ph.D. em CSAIL e primeiro autor do artigo. "A ideia por trás deste trabalho é adicionar ao espaço de pesquisa um modelo de aprendizado de máquina que sabe, por experiência anterior, como tornar o planejamento mais eficiente."

    Boris Katz, um cientista pesquisador principal e chefe do Grupo InfoLab em CSAIL, também é co-autor do artigo.

    Negociando exploração e exploração

    Os planejadores de movimento tradicionais exploram um ambiente expandindo rapidamente uma árvore de decisões que eventualmente cobre um espaço inteiro. O robô então olha para a árvore para encontrar uma maneira de alcançar o objetivo, como uma porta. O modelo dos pesquisadores, Contudo, oferece "uma troca entre explorar o mundo e explorar o conhecimento passado, "Kuo diz.

    O processo de aprendizagem começa com alguns exemplos. Um robô que usa o modelo é treinado em algumas maneiras de navegar em ambientes semelhantes. A rede neural aprende o que torna esses exemplos bem-sucedidos ao interpretar o ambiente ao redor do robô, como o formato das paredes, as ações de outros agentes, e características das metas. Resumidamente, o modelo "aprende que quando você está preso em um ambiente, e você vê uma porta, provavelmente é uma boa ideia passar pela porta para sair, "Barbu diz.

    O modelo combina o comportamento de exploração de métodos anteriores com essas informações aprendidas. O planejador subjacente, chamado RRT *, foi desenvolvido pelos professores do MIT Sertac Karaman e Emilio Frazzoli. (É uma variante de um algoritmo de planejamento de movimento amplamente usado, conhecido como Árvores Aleatórias de Exploração Rápida, ou RRT.) O planejador cria uma árvore de pesquisa enquanto a rede neural espelha cada etapa e faz previsões probabilísticas sobre para onde o robô deve ir em seguida. Quando a rede faz uma previsão com alta confiança, com base nas informações aprendidas, ele guia o robô por um novo caminho. Se a rede não tiver alta confiança, permite que o robô explore o ambiente em vez disso, como um planejador tradicional.

    Por exemplo, os pesquisadores demonstraram o modelo em uma simulação conhecida como "bug trap, "onde um robô 2-D deve escapar de uma câmara interna através de um canal estreito central e chegar a um local em uma sala maior ao redor. Aliados cegos em ambos os lados do canal podem prender os robôs. Nesta simulação, o robô foi treinado em alguns exemplos de como escapar de diferentes armadilhas de insetos. Quando confrontado com uma nova armadilha, reconhece características da armadilha, escapes, e continua em busca de seu objetivo na sala maior. A rede neural ajuda o robô a encontrar a saída para a armadilha, identificar os becos sem saída, e dá ao robô uma noção do que está ao seu redor para que ele possa encontrar o objetivo rapidamente.

    Os resultados do artigo baseiam-se nas chances de que um caminho seja encontrado depois de algum tempo, comprimento total do caminho que atingiu um determinado objetivo, e a consistência dos caminhos. Em ambas as simulações, o modelo dos pesquisadores traçou com mais rapidez caminhos muito mais curtos e consistentes do que um planejador tradicional.

    Trabalhar com vários agentes

    Em um outro experimento, os pesquisadores treinaram e testaram o modelo em ambientes de navegação com vários agentes móveis, que é um teste útil para carros autônomos, especialmente cruzamentos de navegação e rotundas. Na simulação, vários agentes estão contornando um obstáculo. Um agente robô deve navegar com sucesso em torno dos outros agentes, evite colisões, e chegar a um local de destino, como uma saída em uma rotatória.

    "Situações como rotatórias são difíceis, porque exigem raciocínio sobre como os outros responderão às suas ações, como você responderá aos deles, o que eles farão a seguir, e assim por diante, "Barbu diz." Você finalmente descobre que sua primeira ação foi errada, porque mais tarde isso levará a um provável acidente. Esse problema fica exponencialmente pior quanto mais carros você tem que enfrentar. "

    Os resultados indicam que o modelo dos pesquisadores pode capturar informações suficientes sobre o comportamento futuro dos outros agentes (carros) para interromper o processo mais cedo, ao mesmo tempo em que toma boas decisões na navegação. Isso torna o planejamento mais eficiente. Além disso, eles só precisaram treinar o modelo em alguns exemplos de rotatórias com apenas alguns carros. “Os planos que os robôs fazem levam em consideração o que os outros carros vão fazer, como qualquer humano faria, "Barbu diz.

    Passar por cruzamentos ou rotatórias é um dos cenários mais desafiadores que os carros autônomos enfrentam. Este trabalho pode um dia permitir que os carros aprendam como os humanos se comportam e como se adaptar aos motoristas em ambientes diferentes, de acordo com os pesquisadores. Este é o foco do trabalho do Toyota-CSAIL Joint Research Center.

    "Nem todo mundo se comporta da mesma maneira, mas as pessoas são muito estereotipadas. Tem gente que é tímida, pessoas que são agressivas. O modelo reconhece isso rapidamente e é por isso que pode planejar com eficiência, "Barbu diz.

    Mais recentemente, os pesquisadores têm aplicado este trabalho a robôs com manipuladores que enfrentam desafios assustadores semelhantes ao alcançar objetos em ambientes em constante mudança.

    Esta história foi republicada por cortesia do MIT News (web.mit.edu/newsoffice/), um site popular que cobre notícias sobre pesquisas do MIT, inovação e ensino.




    © Ciência https://pt.scienceaq.com