Pesquisadores do Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL) desenvolveram um algoritmo que pode dar aos robôs uma abordagem intuitiva para o uso de ferramentas. Este método, denominado "TL;DR (Too Long; Didn't Read)", visa abordar as dificuldades que os robôs enfrentam ao aprender interações objeto-ferramenta a partir de demonstrações ou instruções de linguagem.
Um dos principais desafios é que os robôs muitas vezes precisam aprender a usar ferramentas com diferentes orientações e tamanhos. Além disso, eles devem compreender os efeitos de suas ações nos objetos que estão sendo manipulados, que podem variar significativamente dependendo da ferramenta utilizada.
Para superar esses desafios, TL;DR usa uma combinação de aprendizagem por reforço profundo e processamento de linguagem natural. O algoritmo começa aprendendo uma compreensão geral de como as ferramentas interagem com os objetos a partir de um conjunto de demonstrações. Esse conhecimento é então usado para gerar descrições textuais das ações necessárias para tarefas específicas, como “martelar o prego na madeira” ou “levantar o copo com o garfo”.
Depois que as instruções de texto são geradas, o TL;DR usa um modelo de processamento de linguagem natural para extrair as principais ações e objetos. Estas ações são então representadas usando o formato SMPL, uma representação padrão para dados de movimento.
Finalmente, o algoritmo usa aprendizagem por reforço profundo para ajustar as ações do robô com base em suas experiências do mundo real. Isso permite que o robô se adapte às variações do ambiente e aprenda como usar as ferramentas de maneira eficaz.
Em experimentos, os pesquisadores demonstraram que o TL;DR supera significativamente as abordagens existentes para o aprendizado do uso de ferramentas robóticas, especialmente quando se trata de novos objetos e ferramentas. O algoritmo também foi capaz de aprender a usar ferramentas complexas, como pinças, para manipular pequenos objetos.
Os pesquisadores antecipam que o TL;DR pode ter implicações importantes para aplicações robóticas em vários domínios, incluindo manufatura, saúde e exploração autônoma. Ao permitir que os robôs aprendam como usar as ferramentas de forma intuitiva, o TL;DR pode expandir a gama de tarefas que os robôs podem realizar e reduzir a necessidade de intervenção humana.
O estudo foi coautor de Anirudha Parasuraman, Jialin Se e Peter Fazli. A pesquisa foi apoiada por ONR, NSF, Samsung, Toyota Research Institute e MIT-IBM Watson AI Lab.