O agente AI colocando a mesa. Crédito:MIT CSAIL
Para muitas pessoas, tarefas domésticas são temidas, parte inescapável da vida que muitas vezes adiamos ou fazemos com pouco cuidado - mas e se uma empregada robô pudesse ajudar a aliviar a carga?
Recentemente, cientistas da computação têm trabalhado em máquinas de ensino para fazer uma gama mais ampla de tarefas em casa. Em um novo artigo liderado pelo Laboratório de Ciência da Computação e Inteligência Artificial do MIT (CSAIL) e da Universidade de Toronto, pesquisadores demonstram "VirtualHome, "um sistema que pode simular tarefas domésticas detalhadas e, em seguida, ter" agentes "artificiais para executá-las, abrindo a possibilidade de um dia ensinar robôs a fazer tais tarefas.
A equipe treinou o sistema usando quase 3, 000 programas de várias atividades, que são subdivididos em subtarefas para o computador entender. Uma tarefa simples como "fazer café, " por exemplo, também incluiria a etapa "pegar uma xícara". Os pesquisadores demonstraram o VirtualHome em um mundo 3-D inspirado no videogame Sims.
O agente de IA da equipe pode executar 1, 000 dessas interações no mundo estilo Sims, com oito cenas diferentes, incluindo uma sala de estar, cozinha, sala de jantar, quarto, e escritório em casa.
"Descrever ações como programas de computador tem a vantagem de fornecer descrições claras e inequívocas de todas as etapas necessárias para concluir uma tarefa, "diz o estudante de doutorado Xavier Puig, quem foi o autor principal do artigo. “Esses programas podem instruir um robô ou um personagem virtual, e também pode ser usado como uma representação para tarefas complexas com ações mais simples. "
O projeto foi co-desenvolvido pelo CSAIL e pela University of Toronto, juntamente com pesquisadores da McGill University e da University of Ljubljana. Será apresentado na conferência Computer Vision and Pattern Recognition (CVPR), que acontece este mês em Salt Lake City.
Como funciona
Ao contrário dos humanos, robôs precisam de instruções mais explícitas para completar tarefas fáceis - eles não podem simplesmente inferir e raciocinar com facilidade.
Por exemplo, pode-se dizer a um humano para "ligar a TV e assistir do sofá". Aqui, ações como "pegar o controle remoto" e "sentar / deitar no sofá" foram omitidas, uma vez que eles fazem parte do conhecimento de senso comum que os humanos têm.
Para demonstrar melhor esses tipos de tarefas aos robôs, as descrições das ações precisavam ser muito mais detalhadas. Para fazer isso, a equipe primeiro coletou descrições verbais de atividades domésticas, e os traduziu em um código simples. Um programa como este pode incluir etapas como:caminhar até a televisão, ligar a televisão, caminhe até o sofá, sente-se no sofá, e assistir televisão.
O autor principal Xavier Puig Fernandez trabalhando na interface da Casa Virtual. Crédito:Jason Dorfman, MIT CSAIL
Depois que os programas foram criados, a equipe os alimentou com o simulador VirtualHome 3-D para serem transformados em vídeos. Então, um agente virtual executaria as tarefas definidas pelos programas, se estava assistindo televisão, colocando uma panela no fogão, ou ligar e desligar uma torradeira.
O resultado final não é apenas um sistema para treinar robôs para fazer tarefas, mas também um grande banco de dados de tarefas domésticas descritas em linguagem natural. Empresas como a Amazon, que estão trabalhando para desenvolver sistemas robóticos como o Alexa em casa, podem eventualmente usar dados como esse para treinar seus modelos para realizar tarefas mais complexas.
O modelo da equipe demonstrou com sucesso que, seus agentes poderiam aprender a reconstruir um programa, e, portanto, realizar uma tarefa, recebeu uma descrição:"despeje leite no copo", ou um vídeo de demonstração da atividade.
"Esta linha de trabalho pode facilitar verdadeiros assistentes pessoais robóticos no futuro, "diz Qiao Wang, um assistente de pesquisa em artes, meios de comunicação, e engenharia na Arizona State University. "Em vez de cada tarefa programada pelo fabricante, o robô pode aprender tarefas apenas ouvindo ou observando a pessoa específica que acompanha. Isso permite que o robô execute tarefas de forma personalizada, ou mesmo algum dia invoque uma conexão emocional como resultado desse processo de aprendizagem personalizado. "
No futuro, a equipe espera treinar os robôs usando vídeos reais em vez de vídeos de simulação no estilo Sims, que permitiria a um robô aprender simplesmente assistindo a um vídeo no YouTube. A equipe também está trabalhando na implementação de um sistema de aprendizado por recompensa, no qual o agente obtém feedback positivo ao realizar as tarefas corretamente.
"Você pode imaginar um ambiente onde os robôs estão ajudando nas tarefas domésticas e podem, eventualmente, antecipar desejos e necessidades personalizados, ou ação iminente, "diz Puig." Isso pode ser especialmente útil como uma tecnologia de assistência para os idosos, ou aqueles que podem ter dificuldade de locomoção. "