Crédito CC0:domínio público
Desejando uma mordida em um francisco de estádio grelhado na hora? Dois robôs chamados Jaco e Baxter podem servir um. Os engenheiros da Boston University deram um salto ao usar o aprendizado de máquina para ensinar robôs a realizar tarefas complexas, uma estrutura que pode ser aplicada a uma série de tarefas, como identificar pontos cancerígenos em mamografias ou compreender melhor os comandos falados para tocar música. Mas primeiro, como uma prova de conceito - eles aprenderam a preparar o cachorro-quente perfeito.
Os pesquisadores ainda não entendem exatamente como os algoritmos de aprendizado de máquina - bem, aprender. Esse ponto cego torna difícil aplicar a técnica a complexos, tarefas de alto risco, como direção autônoma, onde a segurança é uma preocupação. Em um passo adiante publicado em Ciência Robótica , Calin Belta, professor da Faculdade de Engenharia da BU, e os pesquisadores em seu laboratório ensinaram dois robôs a cozinhar, montar, e sirvam cachorros-quentes juntos. O método deles combina técnicas de aprendizado de máquina e métodos formais, uma área da ciência da computação normalmente usada para garantir a segurança, mais notavelmente usado em software de aviônica ou cibersegurança. Essas técnicas díspares são difíceis de combinar matematicamente e em uma linguagem que um robô possa entender.
Belta, um professor de mecânica, sistemas, e engenharia elétrica e de computação, e sua equipe empregou um ramo do aprendizado de máquina conhecido como aprendizado por reforço. Quando um computador completa uma tarefa corretamente, recebe uma recompensa que orienta seu processo de aprendizagem. Embora as etapas da tarefa sejam descritas em um algoritmo de "conhecimento prévio", como exatamente executar essas etapas não é. Quando o robô fica melhor no desempenho de uma etapa, sua recompensa aumenta, criando um mecanismo de feedback que empurra o robô para aprender a melhor maneira de, por exemplo, coloque um cachorro-quente em um pão.
Integrar o conhecimento prévio com a aprendizagem por reforço e métodos formais é o que torna esta técnica nova. Ao combinar essas três técnicas, a equipe pode reduzir a quantidade de possibilidades que os robôs têm que percorrer para aprender a cozinhar, montar, e sirva um cachorro-quente com segurança. Belta vê este trabalho como uma demonstração de prova de conceito de sua estrutura geral, e ele espera que, no futuro, possa ser aplicado a outras tarefas complexas, como a condução autônoma.