Figura delineando como o planejador semelhante ao humano funciona. Crédito:Hasan et al.
Embora a pesquisa no campo da robótica tenha levado a avanços significativos nos últimos anos, ainda existem diferenças substanciais em como humanos e robôs manipulam objetos. Na verdade, mesmo os robôs mais sofisticados desenvolvidos até agora lutam para se equiparar às habilidades de manipulação de objetos de uma criança comum. Um aspecto particular da manipulação de objetos que a maioria dos robôs ainda não domina é alcançar e agarrar objetos específicos em um ambiente desordenado.
Para superar essa limitação, como parte de um projeto financiado pelo EPSRC, pesquisadores da University of Leeds desenvolveram recentemente um planejador robótico semelhante ao humano que combina técnicas de realidade virtual (VR) e aprendizado de máquina (ML). Este novo planejador, apresentado em um artigo pré-publicado no arXiv e definido para ser apresentado na Conferência Internacional de Robótica e Automação (ICRA), pode melhorar o desempenho de uma variedade de robôs em tarefas de manipulação de objetos.
"Nosso objetivo de pesquisa é desenvolver melhores sistemas robóticos; sistemas que podem ajudar os humanos em uma série de tarefas, variando de explorar ambientes perigosos a ajudar uma criança a aprender a escrever, "Prof. Anthony G. Cohn, investigador principal do estudo, disse TechXplore. "Então, formamos um grupo multidisciplinar de psicólogos e cientistas da computação para explorar se poderíamos capturar o comportamento dos humanos e fazer a engenharia reversa das regras que os humanos usam ao alcançar os objetos."
Em contraste com outros pesquisadores que treinaram classificadores de aprendizado de máquina em imagens de ambientes desordenados, Cohn e seus colegas queriam gerar dados de treinamento usando novas tecnologias imersivas. Em seu estudo, assim, eles usaram equipamentos de RV para coletar dados sobre humanos realizando tarefas de manipulação.
Subseqüentemente, eles usaram classificadores de ML para analisar os dados de RV que coletaram e extrair regras gerais que podem estar subjacentes à tomada de decisão humana. O planejador usa essas regras para planejar estratégias eficientes para robôs concluírem tarefas de manipulação de objetos.
"Queríamos que os planos resultantes executados pelo robô também fossem 'legíveis por humanos, "no sentido de que seriam aqueles que um humano esperaria que outro humano executasse, o que não é o caso de muitos planos atuais de robôs, "Cohn explicou.
As decisões de humanos que estão completando tarefas de manipulação parecem ser guiadas principalmente por representações qualitativas (ou seja, não a distância exata e direção de todos os objetos em seu ambiente circundante, mas sim distâncias e direções relativas). Em seu estudo, os pesquisadores tentaram entender melhor esses processos de tomada de decisão para reproduzi-los parcialmente nos classificadores de ML.
"Exploramos como os humanos chegam em cenários onde os objetos que eles agarram têm relações espaciais particulares e usamos métodos desenvolvidos por pesquisadores de IA da Universidade de Leeds para descrever qualitativamente onde os objetos estavam localizados, "Dr. Mohamed Hasan, um pesquisador trabalhando no projeto, explicado. "Isso significava que o planejador poderia classificar as relações espaciais qualitativas entre os objetos e, em seguida, selecionar as ações que os humanos usariam naquele cenário."
A abordagem proposta por Cohn e seus colegas permite que os robôs identifiquem ações eficazes para alcançar um objeto em um espaço desordenado muito mais rápido do que fariam se tivessem que considerar todas as ações possíveis. Ele faz isso produzindo um plano de alto nível, que é representado como uma sequência de pontos importantes e movimentos. Este plano é transmitido a um planejador padrão de baixo nível, que o usa para planejar trajetórias detalhadas para o braço do robô.
"Nosso planejador trabalha de uma forma que lembra o processo de planejar uma viagem, escolhendo quais cidades percorrer e só depois decidindo exatamente quais estradas e pistas tomar, "Cohn disse." Descobrimos que essa abordagem torna nosso planejador semelhante ao humano muito mais eficiente do que os planejadores existentes. "
Os pesquisadores avaliaram seu planejador em uma série de experimentos, testá-lo em cenários de RV onde os humanos completaram tarefas de manipulação em simulações de robôs baseadas na física e usando uma pinça robótica real. Todas as três avaliações produziram resultados muito promissores, com o planejador semelhante ao humano superando o desempenho de um estado da arte, algoritmo de otimização de trajetória padrão.
O planejador desenvolvido por Cohn e seus colegas foi capaz de gerar estratégias eficazes que permitiram aos robôs alcançar objetos em ambientes desordenados de forma mais rápida e eficiente do que fariam ao usar as técnicas padrão de otimização de trajetória. Além de apresentar um planejador semelhante ao humano para tarefas de manipulação de robôs, o estudo mostra que a tecnologia de RV pode ser usada para estudar o comportamento humano e obter uma melhor compreensão dos processos de tomada de decisão.
"Nossa plataforma de RV, que foi desenvolvido internamente na Universidade de Leeds, nos permitiu registrar centenas de alcances em um curto período de tempo, mas também poderíamos mudar o layout do ambiente entre cada ensaio e facilmente apresentar exatamente o mesmo ambiente para diferentes participantes humanos, "disse o Prof. Mark Mon-Williams, co-investigador e psicólogo cognitivo, explicado. "Nossas descobertas apóiam nossas sugestões recentes de que a RV se tornará uma das ferramentas mais onipresentes na pesquisa psicológica. No entanto, também descobrimos que as regras que sustentam a seleção da ação humana podem ser capturadas por métodos de ML."
No futuro, o planejador desenvolvido por Cohn e seus colegas pode ajudar a aprimorar as habilidades de manipulação de robôs existentes e novos, permitindo que as máquinas selecionem ações com mais eficiência e potencialmente até mesmo explicar o "raciocínio" por trás de suas decisões. Este estudo recente também pode encorajar outros pesquisadores a usar dados de RV ao investigar processos de tomada de decisão humana, que poderia então ser melhor reproduzido em máquinas.
O objetivo final da pesquisa é construir robôs inteligentes que irão entender e antecipar as intenções humanas em cenários de colaboração entre humanos e robôs. Idealmente, esses robôs também seriam capazes de responder de maneiras humanas, comunicar-se com usuários humanos da mesma forma que outro humano faria.
“O trabalho atual é uma prova de conceito, então agora planejamos pegar o método que desenvolvemos e explorar seu imenso potencial, "Mon-Williams disse." Ficou claro que esta combinação de ciência da computação e psicologia é uma abordagem muito útil que tem o potencial de lançar luz sobre a seleção da ação humana, o que é importante por uma série de razões, incluindo a compreensão de como tratar condições médicas, como derrames, além de nos ajudar a projetar robôs mais eficientes. No momento, estamos trabalhando em nossa próxima série de experimentos e projetos. "
© 2020 Science X Network