Crédito:FB
Jason Weston, com doutorado em aprendizado de máquina na University of London e Douwe Kiela, com doutorado pela Universidade de Cambridge com tese sobre semântica de base em modalidades perceptivas, são cientistas pesquisadores do Facebook Research e apresentaram ao mundo o Talk the Walk de sua equipe formidável.
O Talk the Walk abre os olhos dos cientistas interessados em fazer mais pela IA como agente de conversação. Nos dias de hoje, eles não se regozijam com os assistentes de voz dizendo às pessoas quando o show começa ou se vai chover. Os cientistas estão explorando diálogos direcionados a objetivos.
Isso parece fácil? Não se iludam. Tentar chegar lá é difícil.
Fast Company Recorreu a Kiela por razões pelas quais o esforço do guia turístico tem peso de pesquisa. "Esta tarefa é muito importante para a pesquisa de IA porque é muito difícil, "Kiela diz, "e porque combina todos esses problemas interessantes - percepção visual trezentos e sessenta, navegação baseada em mapa, raciocínio visual, e comunicações em linguagem natural via diálogo. "
Eles fizeram o ponto, primeiramente, que a linguagem natural é compreensível para a maioria das pessoas "sem exigir etapas extras ou conhecimento para decifrar seu significado." Para esse fim, Grupo de pesquisa de IA do Facebook, JUSTA, são fisgados por uma certa estratégia de IA para mostrar a compreensão da linguagem em nível humano.
Essa estratégia, eles escreveram, "é treinar esses sistemas de uma forma mais natural, vinculando a linguagem a ambientes específicos. Assim como os bebês aprendem primeiro a nomear o que podem ver e tocar, esta abordagem, às vezes referida como IA incorporada, favorece a aprendizagem no contexto dos arredores de um sistema, em vez de treinar por meio de grandes conjuntos de dados de texto (como a Wikipedia). "
Digite Talk the Walk. Eles estão ensinando sistemas de IA para navegar pelas ruas de Nova York usando trocas de idiomas que parecem naturais entre o guia e o turista. Dois bots têm tarefas. O robô turístico quer navegar por imagens de 360 graus dos bairros de Nova York. O guia bot serve para ajudar com um mapa da vizinhança. A equipe usou MASC (Atenção Mascarada para Convolução Espacial) para que o robô guia pudesse se concentrar no lugar certo no mapa.
Eles disseram que seu objetivo é "atingir esse alto grau de desempenho sintético por meio da interação de linguagem natural, e desafiar a comunidade a fazer o mesmo. "
As informações do Talk the Walk estão no GitHub. "Compartilhar este trabalho fornecerá a outros pesquisadores uma estrutura para testar seus próprios sistemas de IA incorporados, particularmente no que diz respeito ao diálogo. "
Uma câmera de 360 graus capturou 5 bairros, A cozinha do inferno, East Village, Distrito financeiro, Upper East Side, e Williamsburg no Brooklyn. Daniel Terdiman em Fast Company disse que o robô guia usava um mapa 2D padrão com pontos de referência genéricos - "banco, " "cafeteria, "" deli "- para fornecer as instruções sobre como navegar.
O trabalho de IA envolvido é sobre perceber um determinado ambiente, navegando por ele, e comunicar sobre isso. Lucas Matney em TechCrunch escreveu que "Em" Talk the Walk, "o guia IA bot tinha todos esses dados de mapa 2D e o bot turístico tinha todos esses ricos dados visuais em 360 °, mas foi somente através da comunicação uns com os outros que eles foram capazes de cumprir suas diretrizes. "
Turista:Woo eu encontrei um Chipotle
Guia:Haha
Turista:"Sou diagonal de um banco"
Guia:"Legal".
O artigo que discute o trabalho deles pode ser encontrado no arXiv. É intitulado "Talk the Walk:Navigating New York City through Grounded Dialogue, "por Harm de Vries, Kurt Shuster, Dhruv Batra, Devi Parikh, Jason Weston e Douwe Kiela.
© 2018 Tech Xplore