Crédito:Garg et al.
Os avanços na robótica e inteligência artificial (IA) estão permitindo o desenvolvimento de agentes artificiais projetados para ajudar os seres humanos em uma variedade de configurações do dia a dia. Um dos muitos usos possíveis para esses sistemas poderia ser para escoltar seres humanos ou bens valiosos que estão sendo transferidos de um local para outro, defendendo-os de ameaças ou ataques.
Fascinado por esta ideia, uma equipe de pesquisadores da Universidade do Novo México apresentou recentemente uma nova solução ponta a ponta para coordenar equipes de escolta robótica que protegem cargas ou mercadorias de alto valor. A técnica que eles propuseram, apresentado em um artigo pré-publicado no arXiv, é baseado na aprendizagem por reforço profundo (RL), que envolve algoritmos de treinamento para fazer previsões eficazes por meio da análise de dados.
"Tive a ideia por trás deste estudo quando pensei em arrastar minha mala por um aeroporto lotado, "Lydia Tapia, o pesquisador principal do estudo, disse TechXplore. "Pensei comigo mesmo:e se isso pudesse ajudar minha navegação, ficando comigo e me protegendo enquanto caminhava?"
Antes de começarem a desenvolver sua solução para coordenar equipes de escolta defensiva, Tapia e sua equipe revisaram a literatura anterior em busca de inspiração ou abordagens semelhantes. Infelizmente, Contudo, eles não conseguiram encontrar outros estudos nos quais robôs foram usados para prever ameaças de entrada e interceptá-los, protegendo os usuários humanos e garantindo que eles cheguem ao seu destino com segurança.
"Há muito trabalho com assistentes de navegação, mas, principalmente, funcionam soando um alarme para impedir que uma pessoa navegue perto de uma ameaça que se aproxima, "Tapia explicou." Descobrimos que uma equipe de escolta robótica poderia ter várias outras aplicações em cenários críticos de segurança, muito mais importante do que minha mala de aeroporto, então focamos este artigo na navegação de carga útil, que é uma tarefa comum em que os acompanhantes mantêm a carga útil segura durante a navegação. "
Tapia e seus colegas treinaram seu modelo RL profundo para prever posições e estratégias eficazes para interceptar possíveis ameaças. Como outras técnicas de RL, durante o treinamento, seu modelo passou por uma longa série de testes em que teve que propor ações para interceptar ameaças e coordenar escoltas, receber recompensas quando a estratégia proposta fosse eficaz. Hora extra, o modelo aprendeu a generalizar o que aprendeu durante o treinamento e a aplicá-lo a situações inteiramente novas.
"Atualmente não existem métodos inteligentes para resolver este problema, então mostramos como os agentes com uma posição fixa podem ser usados, "Tapia disse." No entanto, como você pode imaginar, você precisaria de alguns agentes defensivos colocados em posições regulares para proteger uma carga útil em navegação. "
Os pesquisadores avaliaram sua técnica de RL em uma série de simulações onde agentes de escolta protegem um alvo específico de ameaças ou obstáculos no ambiente circundante. Eles descobriram que seu modelo superou algoritmos de última geração para evitar obstáculos, aumentando o sucesso da navegação em até 31 por cento. Além disso, descobriu-se que as equipes de escolta coordenadas usando sua técnica protegiam cargas úteis com uma taxa de sucesso 75% maior do que a obtida por equipes de escolta em formações estáticas.
"A descoberta mais significativa do nosso trabalho foi ser capaz de representar o problema de uma forma que seja viável para o agente aprender uma solução que seja flexível, mesmo em circunstâncias inesperadas, como agentes sendo removidos ou adicionados, "Tapia explicou.
No futuro, a abordagem desenvolvida por Tapia e sua equipe na Universidade do Novo México poderia ser usada para coordenar equipes que estão acompanhando cargas úteis ou viajantes humanos. Contudo, também pode ter outros aplicativos, por exemplo, auxiliando no desenvolvimento de novas ferramentas para auxiliar e acompanhar pessoas com deficiência visual enquanto viajam ou navegam em ambientes desconhecidos.
"Estamos entusiasmados para investigar aplicações adicionais deste trabalho para novos problemas que ainda não resolvemos, "Tapia disse." Seria bom ver também nossos agentes inteligentes demonstrados em hardware. "
© 2019 Science X Network