Pesquisadores realizando experimentos no robô móvel. Crédito:HU Yanming
Os seres humanos mostram uma adaptabilidade incrível ao lidar com tarefas complexas da vida diária. Esta adaptabilidade é a personificação direta da capacidade de aprendizagem individual, que permite aos seres humanos melhorar sua própria capacidade de comportamento de forma independente e incremental.
Portanto, se os robôs podem ter essa habilidade, eles podem gerar automaticamente novos padrões de comportamento de acordo com a aquisição em tempo real de dados e casos. Esta habilidade mostra inteligência óbvia, que é chamada de inteligência comportamental.
Recentemente, o pesquisador do Instituto Shenyang de automação da Academia Chinesa de Ciências desenvolveu um novo método desenvolveu um novo método para melhorar a inteligência comportamental dos robôs, os resultados relacionados foram publicados em Transações IEEE em sistemas cognitivos e de desenvolvimento .
O pesquisador propôs um novo framework de método de aprendizagem incremental baseado no Q-Learning e no modelo linear de kernel adaptativo (AKL). O framework permite que o robô aprenda novos comportamentos sem esquecer os anteriores. Sob o novo método, os comportamentos do robô podem ser avaliados por meio de aprendizagem autônoma e aprendizagem de imitação, e a estrutura e os parâmetros do modelo podem ser alterados em tempo real usando um novo algoritmo de mínimos quadrados recursivos de kernel de norma L2 (L2-KRLS).
Além do mais, eles conduziram dois experimentos para validar o desempenho do novo método. Os resultados mostraram que o framework proposto pode aprender comportamentos de forma incremental em ambientes variados. O Q-learning baseado em políticas locais é mais rápido do que os algoritmos de Q-learning existentes. Atualmente, esta conquista foi aplicada na navegação autônoma de robôs.