p Superando campeões humanos em jogos complexos como damas, poker and Go é um desafio ideal para inteligência artificial - e um trampolim para aplicações abrangentes além da sala de jogos, dizem especialistas UAlberta. Crédito:Universidade de Alberta
p Quando ele estava crescendo em Ohio, seus pais eram jogadores ávidos de cartas, distribuindo mãos de tudo, de euchre a gin rummy. Enquanto isso, ele e seus amigos rasgavam jogos de tabuleiro espalhados pela casa da família e combinavam as peças para fazer seus próprios jogos, com novos desafios e novos marcadores de vitória. p O boliche está longe de seus dias de jogar com cartas coloridas e dados de plástico. Ele tem três diplomas em ciência da computação e agora é professor da Universidade de Alberta.
p Mas, em seu coração, O boliche ainda adora jogar. Sua pesquisa em inteligência artificial - e como ela se cruza com jogos e aprendizado de máquina - o colocou na vanguarda do campo em rápida evolução.
p "Os jogos são um microcosmo tão bonito de problemas interessantes de tomada de decisão, " ele diz.
p "Por um momento), você pode mantê-lo como algo independente, onde seus agentes de inteligência artificial olham para o mundo do jogo e tentam resolvê-lo. Do mesmo jeito, é divertido para os humanos jogar esse jogo por um minuto e simplificar seus mundos para isso. "
p Bowling lidera o Grupo de Pesquisa de Pôquer de Computador da universidade, onde ele e uma equipe resolveram um problema no ano passado que se pensava sem solução:o grupo desenvolveu um algoritmo que vence os jogadores profissionais de pôquer no pôquer no-limit Texas Hold 'em.
p É chamado de DeepStack. Seu sucesso é considerado outro marco na pesquisa de inteligência artificial, onde algoritmos complexos geralmente começam com cientistas que usam jogos de cartas, jogos de tabuleiro e videogames como campos de teste.
p
De damas ao genoma humano
p Em 1989, o cientista da computação Jonathan Schaeffer teve a ideia de escrever um programa de computador, Chinook, para ganhar o Campeonato Mundial de Damas / Drafts.
p Enquanto as pessoas da comunidade de jogadores de damas ficavam intrigadas com a novidade de um computador competindo em seus torneios, eles ficaram surpresos quando, em apenas seu segundo torneio, Chinook conquistou o direito de disputar o Campeonato Mundial.
p Os órgãos dirigentes das damas mundiais resistiram inicialmente à ideia de um computador jogar pelo campeonato mundial, mas as principais federações do jogo finalmente cederam - um pouco - e formaram um novo evento:o Campeonato Mundial Homem contra Máquina.
p Em 1992, Chinook perdeu para Marion Tinsley, que havia se aposentado no ano anterior como campeão mundial de damas. Mas em uma revanche em 1994, o programa prevaleceu. O Chinook se tornou o primeiro programa a ganhar um campeonato mundial humano em qualquer jogo, um feito reconhecido pelo Guinness Book of World Records.
p Essa batalha de homem contra máquina tem se repetido continuamente nas décadas desde:em 1997, O Deep Blue da IBM - coautor do ex-aluno da U of A, Murray Campbell e dois outros - derrotou o campeão mundial de xadrez Garry Kasparov; em 2011, O Watson da IBM levou para casa um prêmio Jeopardy! De US $ 1 milhão! campeonato; e no ano passado, AlphaGo se tornou o primeiro programa de computador a vencer um ser humano no complexo jogo de tabuleiro, Ir.
p Schaeffer, agora reitor da Faculdade de Ciências da U of A, tem pesquisado inteligência artificial desde 1979.
p "Eu faço pesquisas de IA. E um dos testes que uso, o mais popular entre os alunos, acontece de ser jogos. E se as ideias forem boas, eles podem ser aplicados a outros aplicativos. "
p Schaeffer claramente aprecia a diversão de um jogo, a competição e o amplo apelo de trabalhar em algo com o qual tantos podem se identificar. Mas ele também deixou claro que a pesquisa de jogos pode ter impactos muito além de um baralho de cartas ou um tabuleiro de jogo.
p Ele aponta para algo onipresente na vida moderna:o sistema GPS. E ele conecta a tecnologia por trás dele ao Cubo de Rubik.
p "O cubo de Rubik está confuso. É o seu 'início' e você está tentando chegar a uma posição em que tudo esteja no lugar. Qual é o caminho para ir de um ponto a outro? Pense em cada movimento (no jogo) como parte da sua viagem, e você deseja ir do início ao fim o mais rápido possível - que é exatamente o que o GPS faz.
p "Gostaria de pensar que algumas das ideias que geramos aqui são utilizadas em sistemas GPS. Não temos certeza disso. Nosso trabalho é público e as empresas não precisam divulgar o que colocam em seus produtos."
p Jonathan Schaeffer desenvolveu o Chinook, um programa de jogo de damas que derrotou o ex-campeão mundial Marion Tinsley em 1994 - o primeiro programa a ganhar um campeonato mundial humano em qualquer jogo. Crédito:Richard Siemens
p O trabalho de Schaeffer no Chinook envolveu uma quantidade enorme de poder de computação que teve que organizar os dados e compactá-los em algo muito pequeno. O programa também precisava encontrar informações rapidamente, entre os trilhões de pontos de dados que foram compactados.
p Logo após o campeonato mundial de Chinook, um biólogo entrou no escritório de Schaeffer. Ele estava trabalhando no projeto do genoma humano, que também envolveu uma enorme quantidade de dados. Ele também precisava compactar esses dados, e identificar os elementos rapidamente.
p Um ano depois, uma empresa chamada BioTools formada para apoiar o projeto do genoma humano. Algumas das ideias utilizadas em seus produtos vieram da pesquisa de verificadores.
p "Foi uma daquelas agradáveis surpresas, completamente inesperado, saindo do campo esquerdo. "
p
Construindo a máquina 'intuitiva'
p O trabalho recente da U of A para dominar o pôquer no-limit Texas Hold 'em foi publicado na edição de março de 2017 do prestigioso jornal
Ciência . O que tornou o feito inovador é que o jogo é um cenário de "informação imperfeita" - ao contrário do xadrez ou das damas, onde ambos os jogadores podem ver tudo na mesa, os jogadores de pôquer mantêm algumas cartas para si.
p O desafio para Bowling e sua equipe era desenvolver uma "intuição" para o DeepStack.
p "Nossos algoritmos precisam pensar profundamente sobre o que PODERIA o outro agente saber sobre minhas cartas agora e o que eu poderia saber sobre as cartas deles. O raciocínio deve abranger crenças e não apenas o que você pode ver na mesa."
p Para desenvolver esse instinto, aquela "intuição, "Bowling e sua equipe tiveram que executar o DeepStack em dezenas de milhões de cenários de pôquer. O programa começou a reconhecer algumas situações como boas e outras como ruins, alguns como menos bons ou menos ruins.
p Isso construiu a experiência geral do DeepStack, e começou a reconhecer novas situações como tendo vários graus de boas ou más - e permitiu que apresentasse as melhores jogadas com base nisso.
p A equipe provou a competência do DeepStack ao jogar contra alguns dos melhores jogadores de pôquer do mundo. Eles jogaram tantas mãos que as descobertas foram estatisticamente significativas.
p Quando perguntado se o DeepStack vai essencialmente matar o pôquer - afinal, quem quer jogar contra uma máquina se tiver a garantia de que ela vencerá? - Bowling aponta para o xadrez.
p "Isso foi dito sobre o xadrez e agora talvez haja mais grandes mestres do que em qualquer outro momento ... parece ter acelerado o nível de habilidade, " ele diz, observando que os amadores podem jogar contra os melhores computadores para aprimorar suas habilidades e há competições onde jogadores de xadrez se unem a computadores para aprimorar a competição.
p Mas ele também reconhece que o pôquer é um pouco diferente. As pessoas jogam pôquer por dinheiro. É uma atividade de jogo, e não faz sentido jogar contra uma entidade com probabilidade estatística de vencer.
p "Talvez isso signifique que o pôquer começa a se tornar algo diferente do que apenas uma atividade de jogo pura ... Espero que isso afaste o jogo da peça de jogo. Vamos tentar descobrir quem são os melhores jogadores do mundo e talvez possamos comece a destacar isso pelo que é, uma atividade baseada em habilidades. "
p Bowling começou seu trabalho no DeepStack com a abordagem que a maioria dos problemas do "mundo real" são, na verdade, cenários de informação imperfeitos.
p Mas seu trabalho não é impulsionado apenas por como seus avanços em IA podem ser aplicados além do reino dos jogos.
p "Se vamos avançar para ver uma inteligência artificial mais capaz, pode ser uma distração dizer, 'Este é um aplicativo com o qual você pode ganhar muito dinheiro.' Esse é realmente o caminho para nos levar a melhorar, inteligência artificial mais capaz?
p "Deve haver pessoas que buscam o caminho de longo prazo, que o empurram para a próxima coisa sem ter certeza de como será uma atividade lucrativa. "