• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Hanabi:A IA do Facebook avança para uma jogabilidade cooperativa
    p Crédito CC0:domínio público

    p O jogo de cartas Hanabi foi aceito como um desafio pela IA do Facebook, e é um grande desafio, considerando que eles estão entrando em um reino onde jogar não é apenas uma questão de um oponente vencer o outro, mas um jogo de cartas "cooperativo" em que uma equipe competidora ajuda uma à outra. p Jonathan Vanian, Fortuna , orientou os leitores pelo jogo como uma forma de introdução:

    p "...:equipes de dois a cinco jogadores recebem cartas aleatórias de cores e números diferentes que representam pontos. O objetivo das equipes é colocar as cartas em uma mesa, agrupado por cor, na ordem numérica correta. O problema, Contudo, é que os jogadores não podem ver seus próprios cartões enquanto seus companheiros podem. Um jogador pode dar dicas para outro, como fazer uma observação sobre uma determinada cor, que alertaria o outro para fazer algo como jogar ou descartar uma carta. O dilema é que o jogador deve deduzir o que significa a pista de seu companheiro de equipe. "

    p Os líderes corporativos mostraram uma tendência para Hanabi como uma experiência de aprendizagem de construção de equipes; agora ele ganhou a atenção de pesquisadores de IA que estão pensando em construir sistemas de IA de destaque.

    p "Obter pontuações quase perfeitas em um obscuro jogo de cartas francês é ótimo e tudo, exceto o Facebook, tem planos maiores para sua IA cooperativa, " disse Engadget .

    p Pesquisador do Facebook, Tom Lerer, foi citado em Engadget :"O que estamos procurando são agentes artificiais que podem raciocinar melhor sobre interações cooperativas com humanos e chatbots que podem raciocinar sobre por que a pessoa com quem estão conversando disse o que eles fizeram ... Chatbots que podem raciocinar melhor sobre por que as pessoas dizer as coisas que eles fazem sem ter que enumerar todos os detalhes do que estão pedindo é uma aplicação muito direta desse tipo de técnica de pesquisa. "

    p Quais estratégias de IA os pesquisadores colocaram em ação?

    p Vanian identificou uma técnica de pesquisa usada anteriormente pela DeepMind; ele permite que vários bots Hanabi avaliem várias opções de jogo enquanto compartilham informações entre si. Combinado com aprendizagem por reforço, os bots do Facebook aprenderam a jogar Hanabi uns com os outros.

    p Os autores por trás desta investigação escreveram um artigo discutindo seu trabalho e o artigo está no arXiv (publicado no Inteligência artificial Diário). "O desafio de Hanabi:uma nova fronteira para pesquisas de IA" é o título do artigo, e os autores disseram que consideraram Hanabi um "domínio de desafio com novos problemas que surgem de sua combinação de jogabilidade puramente cooperativa e informações imperfeitas em um cenário de dois a cinco jogadores".

    p Os autores observaram que é melhor descrito como um tipo de Paciência em equipe e as informações imperfeitas do jogo surgem do fato de cada jogador ser incapaz de ver suas próprias cartas (aquelas que eles possuem e nas quais podem agir), cada um dos quais tem uma cor e classificação.

    p Para resultados de pesquisa reproduzíveis, os autores lançaram um ambiente Hanabi RL de código aberto chamado Hanabi Learning Environment escrito em Python e C ++.

    p Em outro lugar, mas relevante para seus objetivos em pesquisas reproduzíveis, Jerome Pesenti, vice-presidente de IA do Facebook, estava em uma recente sessão de perguntas e respostas com Will Knight em Com fio .

    p Knight perguntou a Pesenti sobre a recriação de pesquisas inovadoras.

    p "É algo pelo qual a IA do Facebook é muito apaixonada, "disse Pesenti." Quando as pessoas fazem coisas que não são reproduzíveis, isso cria muitos desafios. Se você não pode reproduzi-lo, é muito investimento perdido ... A beleza da IA ​​é que, em última análise, são sistemas operados por computadores. Portanto, é um candidato principal, como um subcampo da ciência, para ser reproduzível. Acreditamos que o futuro da IA ​​será algo reproduzível quase que por padrão. Tentamos abrir a maior parte do código que estamos produzindo em IA, para que outras pessoas possam construir em cima dele. "

    p Os autores, em seu papel, tem uma seção com a cruzeta "Hanabi:The Benchmark."

    p Este esforço de pesquisa é sobre o uso de Hanabi como um problema de referência desafiador para IA. Propriedades exclusivas o distinguem de outros benchmarks. "É um problema de aprendizagem multiagente, diferente, por exemplo, o ambiente de aprendizagem Arcade. É também um jogo de informação imperfeito, onde os jogadores têm conhecimento assimétrico sobre o estado do ambiente, o que torna o jogo mais parecido com pôquer do que xadrez, gamão, ou vá."

    p Andrew Tarantola em Engadget pegou neste ponto. A vida no mundo real não é um jogo de soma zero como pôquer ou Starcraft, ele disse, "e precisamos da IA ​​para trabalhar conosco, não contra nós. "

    p Dois Engadget os comentários dos leitores não demonstram admiração pelo que foi alcançado até agora. "Tenho certeza de que ter conhecimento de como os humanos geralmente jogam um único jogo de cartas e conhecimento geral das intenções humanas são duas coisas muito diferentes, "disse um. Outro disse que" identificar padrões de ação está muito longe da teoria da mente ... Você poderia argumentar se eles estão tentando atribuir a teoria da mente, sua precisão precisa ser melhorada. " p © 2019 Science X Network




    © Ciência https://pt.scienceaq.com