• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Algoritmos de aprendizagem de imitação aprimorados usando dados do olhar humano

    Pilha de imagens de entrada alimentada para os algoritmos. Crédito:Saran et al.

    Estudos anteriores de psicologia sugerem que o olhar humano pode codificar as intenções dos humanos enquanto realizam tarefas cotidianas, como fazer um sanduíche ou uma bebida quente. De forma similar, o olhar humano melhora o desempenho dos métodos de aprendizagem por imitação, que permitem que os robôs aprendam a realizar tarefas imitando demonstradores humanos.

    Inspirado por essas descobertas anteriores, pesquisadores da Universidade do Texas em Austin e da Tufts University desenvolveram recentemente uma nova estratégia para aprimorar algoritmos de aprendizagem de imitação usando dados relacionados ao olhar humano. O método que desenvolveram, descrito em um artigo pré-publicado no arXiv, usa o olhar de um demonstrador humano para direcionar a atenção de algoritmos de aprendizagem de imitação para áreas que eles acreditam ser importantes, com base no fato de que usuários humanos os atendiam.

    "Algoritmos de aprendizado profundo precisam aprender a identificar características importantes em cenas visuais, por exemplo, um personagem de videogame ou um inimigo, enquanto também aprende como usar esses recursos para a tomada de decisões, "O Prof. Scott Niekum da Universidade do Texas em Austin disse ao TechXplore." Nossa abordagem torna isso mais fácil, usando o olhar do humano como uma dica que indica quais elementos visuais da cena são mais importantes para a tomada de decisão. "

    A abordagem desenvolvida pelos pesquisadores envolve o uso de informações relacionadas ao olhar humano como orientação, direcionar a atenção de um modelo de aprendizado profundo para recursos particularmente importantes nos dados que está analisando. Essa orientação relacionada ao olhar é codificada na função de perda aplicada a modelos de aprendizado profundo durante o treinamento.

    "Pesquisas anteriores explorando o uso de dados de olhar para aprimorar abordagens de aprendizagem de imitação normalmente integram dados de olhar por meio de algoritmos de treinamento com parâmetros mais fáceis de aprender, tornando o aprendizado computacionalmente caro e exigindo informações do olhar tanto no treinamento quanto no tempo de teste, "Akanksha Saran, um Ph.D. estudante da Universidade do Texas em Austin que estava envolvido no estudo, disse TechXplore. "Queríamos explorar caminhos alternativos para aumentar facilmente as abordagens existentes de aprendizagem de imitação com dados do olhar humano, sem aumentar os parâmetros aprendíveis. "

    A estratégia desenvolvida por Niekum, Saran e seus colegas podem ser aplicados à maioria das arquiteturas baseadas em redes neurais convolucionais (CNN) existentes. Usando um componente auxiliar de perda de olhar que orienta as arquiteturas em direção a políticas mais eficazes, sua abordagem pode melhorar o desempenho de uma variedade de algoritmos de aprendizado profundo.

    Vídeo curto mostrando alguns exemplos de como os algoritmos de aprendizagem funcionam com e sem o uso do olhar humano. Crédito:Saran et al.

    A nova abordagem tem várias vantagens sobre outras estratégias que usam dados relacionados ao olhar para guiar modelos de aprendizado profundo. Os dois mais notáveis ​​são que ele não requer acesso aos dados do olhar no momento do teste e a adição de parâmetros de aprendizagem suplementares.

    Os pesquisadores avaliaram sua abordagem em uma série de experimentos, usá-lo para aprimorar diferentes arquiteturas de aprendizado profundo e, em seguida, testar seu desempenho nos jogos Atari. Eles descobriram que melhorou significativamente o desempenho de três algoritmos de aprendizagem de imitação diferentes, superando um método de linha de base que usa dados do olhar humano. Além disso, a abordagem dos pesquisadores correspondeu ao desempenho de outra estratégia que usa dados relacionados ao olhar durante o treinamento e no momento do teste, mas isso envolve aumentar o número de parâmetros aprendíveis.

    "Nossas descobertas sugerem que os benefícios de algumas abordagens propostas anteriormente vêm de um aumento no número de parâmetros aprendíveis em si, não apenas do uso de dados do olhar, "Saran disse." Nosso método mostra melhorias comparáveis ​​sem adicionar parâmetros às técnicas de aprendizagem de imitação existentes. "

    Durante a realização de seus experimentos, os pesquisadores também observaram que o movimento dos objetos em uma determinada cena por si só não explica totalmente a informação codificada pelo olhar. No futuro, a estratégia que desenvolveram pode ser usada para melhorar o desempenho de algoritmos de aprendizagem de imitação em uma variedade de tarefas diferentes. Os pesquisadores esperam que seu trabalho também sirva de base para estudos futuros voltados para o uso de dados relacionados ao olhar humano para o avanço das técnicas computacionais.

    "Embora nosso método reduza as necessidades computacionais durante o tempo de teste, requer ajuste de hiperparâmetros durante o treinamento para obter um bom desempenho, "Saran disse." Aliviar este fardo durante o treinamento codificando outras intuições do comportamento do olhar humano será um aspecto do trabalho futuro. "

    A abordagem desenvolvida por Saran e seus colegas tem se mostrado altamente promissora, no entanto, há várias maneiras de aprimorá-lo ainda mais. Por exemplo, atualmente não modela todos os aspectos dos dados relacionados ao olhar humano que poderiam ser benéficos para aplicações de aprendizagem de imitação. Os pesquisadores esperam enfocar alguns desses outros aspectos em seus estudos futuros.

    "Finalmente, conexões temporais de olhar e ação ainda não foram exploradas e podem ser críticas para obter mais benefícios no desempenho, "Saran disse." Também estamos trabalhando para usar outras dicas de professores humanos para melhorar o aprendizado de imitação, como demonstrações de acompanhamento de áudio humano. "

    © 2020 Science X Network




    © Ciência https://pt.scienceaq.com