p Para entrega de última milha, robôs do futuro podem usar um novo algoritmo do MIT para encontrar a porta da frente, usando pistas em seu ambiente. Crédito:MIT News
p Num futuro não muito distante, robôs podem ser despachados como veículos de entrega de última milha para retirar seu pedido de entrega, pacote, ou a assinatura do kit de refeição à sua porta - se conseguirem encontrar a porta. p Abordagens padrão para navegação robótica envolvem mapear uma área com antecedência, em seguida, usando algoritmos para guiar um robô em direção a um objetivo específico ou coordenada GPS no mapa. Embora essa abordagem possa fazer sentido para explorar ambientes específicos, como o layout de um edifício específico ou pista de obstáculos planejada, pode se tornar difícil no contexto de entrega na última milha.
p Imagine, por exemplo, ter que mapear com antecedência cada bairro dentro da zona de entrega de um robô, incluindo a configuração de cada casa naquele bairro, juntamente com as coordenadas específicas da porta da frente de cada casa. Essa tarefa pode ser difícil de escalar para uma cidade inteira, particularmente porque os exteriores das casas mudam frequentemente com as estações. Mapear cada casa também pode gerar problemas de segurança e privacidade.
p Agora, os engenheiros do MIT desenvolveram um método de navegação que não requer o mapeamento de uma área com antecedência. Em vez de, sua abordagem permite que um robô use pistas em seu ambiente para planejar uma rota até seu destino, que pode ser descrito em termos semânticos gerais, como "porta da frente" ou "garagem, "em vez de coordenadas em um mapa. Por exemplo, se um robô é instruído a entregar um pacote na porta da frente de alguém, pode começar na estrada e ver uma entrada de automóveis, que foi treinado para reconhecer como susceptível de conduzir a uma calçada, o que, por sua vez, provavelmente levará à porta da frente.
p A nova técnica pode reduzir muito o tempo que um robô gasta explorando uma propriedade antes de identificar seu alvo, e não depende de mapas de residências específicas.
p "Não gostaríamos de ter que fazer um mapa de cada edifício que precisaríamos visitar, "diz Michael Everett, um aluno de pós-graduação no Departamento de Engenharia Mecânica do MIT. "Com esta técnica, esperamos derrubar um robô no final de qualquer entrada de automóveis e fazer com que ele encontre uma porta. "
p Everett apresentará os resultados do grupo esta semana na Conferência Internacional sobre Robôs e Sistemas Inteligentes. O papel, que é co-autoria de Jonathan How, professor de aeronáutica e astronáutica no MIT, e Justin Miller da Ford Motor Company, é finalista do "Melhor Artigo para Robôs Cognitivos".
Crédito:Massachusetts Institute of Technology p
"Uma noção do que as coisas são"
p Nos últimos anos, pesquisadores trabalharam na introdução de produtos naturais, linguagem semântica para sistemas robóticos, treinar robôs para reconhecer objetos por seus rótulos semânticos, para que possam processar visualmente uma porta como uma porta, por exemplo, e não simplesmente como um sólido, obstáculo retangular.
p "Agora temos a capacidade de dar aos robôs uma noção do que são as coisas, em tempo real, "Everett diz.
p Everett, Quão, e Miller estão usando técnicas semânticas semelhantes como trampolim para sua nova abordagem de navegação, que aproveita algoritmos pré-existentes que extraem recursos de dados visuais para gerar um novo mapa da mesma cena, representado como pistas semânticas, ou contexto.
p No caso deles, os pesquisadores usaram um algoritmo para construir um mapa do ambiente conforme o robô se movia, usando os rótulos semânticos de cada objeto e uma imagem de profundidade. Este algoritmo é denominado SLAM semântico (Simultaneous Localization and Mapping).
p Embora outros algoritmos semânticos tenham permitido aos robôs reconhecer e mapear objetos em seu ambiente pelo que são, eles não permitiram que um robô tomasse decisões no momento em que navegava em um novo ambiente, no caminho mais eficiente para chegar a um destino semântico, como uma "porta da frente".
p "Antes, explorar foi apenas, coloque um robô no chão e diga 'vá, "e ele se moverá e, eventualmente, chegará lá, mas vai ser lento, "Como diz.
p
O custo para ir
p Os pesquisadores procuraram acelerar o planejamento do caminho de um robô por meio de uma semântica, mundo colorido do contexto. Eles desenvolveram um novo "estimador de custo operacional, "um algoritmo que converte um mapa semântico criado por algoritmos SLAM preexistentes em um segundo mapa, representando a probabilidade de qualquer local estar perto da meta.
p "Isso foi inspirado na tradução imagem a imagem, onde você tira a foto de um gato e o faz parecer um cachorro, "Everett diz." O mesmo tipo de ideia acontece aqui, quando você tira uma imagem que se parece com um mapa do mundo, e transformá-lo em outra imagem que se parece com o mapa do mundo, mas agora é colorida com base em quão próximos os diferentes pontos do mapa estão do objetivo final. "
p Este mapa de custo para ir é colorido, em escala de cinza, para representar regiões mais escuras como locais distantes de uma meta, e regiões mais claras como áreas próximas à meta. Por exemplo, a calçada, codificado em amarelo em um mapa semântico, pode ser traduzido pelo algoritmo cost-to-go como uma região mais escura no novo mapa, em comparação com uma garagem, que é progressivamente mais claro à medida que se aproxima da porta da frente - a região mais clara no novo mapa.
p Os pesquisadores treinaram este novo algoritmo em imagens de satélite do Bing Maps contendo 77 casas de um bairro urbano e três suburbanos. O sistema converteu um mapa semântico em um mapa cost-to-go, e mapeou o caminho mais eficiente, seguindo regiões mais claras no mapa, para o objetivo final. Para cada imagem de satélite, Everett atribuiu rótulos semânticos e cores aos recursos de contexto em um jardim típico, como cinza para uma porta da frente, azul para uma garagem, e verde para uma cerca viva.
p Durante este processo de treinamento, a equipe também aplicou máscaras a cada imagem para imitar a visão parcial que a câmera de um robô provavelmente teria ao atravessar um jardim.
p "Parte do truque da nossa abordagem era [fornecer ao sistema] muitas imagens parciais, “Como explica.” Então, realmente tinha que descobrir como todas essas coisas estavam relacionadas. Isso é parte do que torna este trabalho robusto. "
p Os pesquisadores então testaram sua abordagem em uma simulação de uma imagem de uma casa totalmente nova, fora do conjunto de dados de treinamento, primeiro usando o algoritmo SLAM preexistente para gerar um mapa semântico, em seguida, aplicando seu novo estimador de custo para gerar um segundo mapa, e o caminho para uma meta, nesse caso, a porta da frente.
p A nova técnica cost-to-go do grupo encontrou a porta da frente 189 por cento mais rápida do que os algoritmos de navegação clássicos, que não levam em conta o contexto ou a semântica, e, em vez disso, gaste etapas excessivas explorando áreas que provavelmente não estarão próximas de seu objetivo.
p Everett diz que os resultados ilustram como os robôs podem usar o contexto para localizar um objetivo com eficiência, mesmo em desconhecido, ambientes não mapeados.
p "Mesmo que um robô esteja entregando um pacote em um ambiente onde nunca esteve, pode haver pistas que serão as mesmas de outros lugares que ela viu, "Everett diz." Portanto, o mundo pode ser organizado de uma forma um pouco diferente, mas provavelmente há algumas coisas em comum. " p
Esta história foi republicada por cortesia do MIT News (web.mit.edu/newsoffice/), um site popular que cobre notícias sobre pesquisas do MIT, inovação e ensino.