• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Quando o pequeno robô irá percorrer seus quartos para encontrar a bolsa laranja

    Crédito:encarnadoqa.org

    Hmm, era uma vez, Ficamos impressionados com o fato de esse fenômeno de busca chamado Google poder responder perguntas instantaneamente, bastando digitar palavras em uma barra de espaço. Mirabile dictu se você perguntasse onde está Miani, o Google dispararia de volta, Você quis dizer Miami?

    A cena de perguntas e respostas cresceu muito e agora os cientistas estão trabalhando em outro nível onde os sistemas inteligentes veem, plano, e raciocinar a resposta.

    Resposta a perguntas incorporadas é o nome de um projeto e o título de um artigo sobre o arXiv. Os seis autores, com afiliações do Georgia Institute of Technology e Facebook AI Research, descrever seu trabalho abrangendo uma gama de habilidades de IA.

    EmbodiedQA, como é chamado, agentes de tarefas navegando em ambientes 3D ricos para responder a perguntas. Will Knight, MIT Technology Review , referiu-se a este "desafio da caça ao tesouro".

    Esses agentes devem aprender em conjunto a compreensão da linguagem, raciocínio visual, e navegação orientada por objetivos para o sucesso.

    Do que se trata:um agente é gerado em um local aleatório em um ambiente 3-D. É feita uma pergunta ao agente ("Qual é a cor do carro?"). Para obter a resposta, o agente deve navegar para explorar o ambiente, coletar informações por meio da "visão de primeira pessoa (egocêntrica), "e depois responda.

    A equipe desenvolveu um conjunto de dados de perguntas e respostas em ambientes House3D. (Você pode descobrir mais sobre House3D um ambiente 3D virtual, no GitHub).

    O artigo dá mais detalhes sobre os tipos de perguntas e modelos no conjunto de dados EQA. local:qual sala? Qual é a cor do objeto? O que está acima, abaixo, ao lado de, o objeto? Existência:há um objeto na sala? Quantos? O Objeto 1 está mais perto do Objeto 2 do que o Objeto 3?

    As questões testam habilidades:detecção de objetos, reconhecimento de cena, contando, raciocínio espacial, reconhecimento de cores e lógica.

    Também, os autores disseram que "EQA é facilmente extensível para incluir novas operações elementares, tipos de perguntas, e modelos conforme necessário para aumentar a dificuldade da tarefa para corresponder ao desenvolvimento. "

    Os autores enfatizaram que o EQA não é um conjunto de dados estático. Em vez, é um teste para "um currículo de capacidades que gostaríamos de alcançar em agentes de comunicação incorporados".

    Por que isso é importante: Fast Company notaram que este projeto do Facebook e da Georgia Tech está, na verdade, treinando sistemas de inteligência artificial para analisar questões de linguagem natural e encontrar objetos específicos.

    Por que isso é importante, para Will Knight em MIT Technology Review :"Imagine pedir a um Roomba para aspirar o quarto. Mesmo que a máquina pudesse entender sua voz e ver os arredores, não tem ideia do que é um quarto, ou onde um pode ser encontrado. Mas os futuros robôs domésticos podem usar software de IA que aprendeu fatos tão simples sobre casas comuns, explorando primeiro muitas casas virtuais. "

    Como os pesquisadores fizeram isso? Daniel Terdiman em Fast Company escreveu que a equipe "utilizou vários tipos de aprendizado de máquina para treinar os bots a responder a perguntas sobre a casa virtual."

    "Aprender" é uma parte importante do que a equipe realizou. O agente aprendeu o que Knight chamou de "uma forma rudimentar de bom senso". Com tentativa e erro, descobriu os melhores lugares para procurar o objeto em questão. Pode ser, por exemplo, o agente fica sabendo que os carros geralmente são encontrados na garagem. Ele pode descobrir que as garagens estão na porta da frente ou de trás.

    © 2018 Tech Xplore




    © Ciência https://pt.scienceaq.com