Crédito:Hutsuliak Dmytro/Shutterstock
Há alguns anos, o site de xadrez Chess.com baniu temporariamente o grande mestre norte-americano Hans Niemann por jogar lances de xadrez online que o site suspeitava terem sido sugeridos a ele por um programa de computador. Ele já havia banido seu mentor Maxim Dlugy.
E na Sinquefield Cup no início deste mês, o campeão mundial Magnus Carlsen renunciou sem comentários depois de jogar um jogo ruim contra Niemann, de 19 anos. Desde então, ele disse que isso aconteceu porque acredita que Niemann continuou a trapacear recentemente.
Outro participante, o grão-mestre russo Ian Nepomniachtchi, chamou o desempenho de Niemann de "mais do que impressionante". Embora Nieman tenha admitido às vezes ter trapaceado em jogos online anteriores, ele negou veementemente ter trapaceado em um torneio de xadrez ao vivo.
Mas como o Chess.com, o maior site de xadrez do mundo, decide que um jogador provavelmente trapaceou? Ele não pode mostrar ao mundo o código que usa, ou então os possíveis trapaceiros saberiam exatamente como evitar a detecção. O site afirma:"Embora considerações legais e práticas impeçam o Chess.com de revelar o conjunto completo de dados, métricas e rastreamento usados para avaliar jogos em nossa ferramenta de jogo justo, podemos dizer que no centro do sistema do Chess.com está um modelo estatístico que avalia a probabilidade de um jogador humano corresponder às principais escolhas de um mecanismo e superar o jogo limpo confirmado de alguns dos maiores jogadores de xadrez da história."
Felizmente, a pesquisa pode esclarecer qual abordagem o site pode estar usando.
Humanos x IA Quando a empresa de IA DeepMind desenvolveu o programa AlphaGo, que poderia jogar o jogo de estratégia Go, foi ensinado a prever quais movimentos um humano faria de qualquer posição.
Prever movimentos humanos é um problema de aprendizado supervisionado, o pão com manteiga do aprendizado de máquina. Dados muitos exemplos de posições de jogos humanos (o conjunto de dados) e um exemplo de um movimento humano de cada uma dessas posições (o rótulo), os algoritmos de aprendizado de máquina podem ser treinados para prever rótulos em novos pontos de dados. Então, a DeepMind ensinou sua IA a estimar a probabilidade de um humano fazer qualquer movimento de qualquer posição.
O AlphaGo venceu o rival humano Lee Sedol em 2017. Um dos movimentos famosos da IA no jogo foi o Move 37. jogado por um jogador humano."
Então, de acordo com esse modelo de aprendizado de máquina de jogadores humanos de Go, se você visse uma pessoa jogando o Move 37, seria uma evidência de que eles não tiveram a ideia. Mas é claro que não seria uma prova. Qualquer humano
poderia fazer esse movimento.
Para se tornar muito confiante de que alguém trapaceia em um jogo, você precisa observar muitos movimentos. Por exemplo, pesquisadores investigaram como muitos movimentos de um jogador podem ser analisados coletivamente para detectar anomalias.
O Chess.com usa abertamente o aprendizado de máquina para prever quais movimentos podem ser feitos por um humano em qualquer posição. Na verdade, ele tem diferentes modelos de jogadores de xadrez famosos individuais, e você pode realmente jogar contra eles. Presumivelmente, modelos semelhantes são usados para detectar trapaças.
Um estudo recente sugeriu que, além de prever a probabilidade de um ser humano fazer um determinado movimento, também é importante considerar o quão bom é esse movimento. Isto coincide com a declaração do Chess.com de que avalia se os movimentos "superam... confirmaram jogo limpo" dos grandes.
Mas como você mede quais movimentos são melhores que outros? Em teoria, uma posição de xadrez é "ganhar" (você pode garantir uma vitória), "perder" (o outro jogador pode) ou "empatar" (nem pode), e uma boa jogada seria qualquer jogada que não faça sua posição pior. Mas, realisticamente, embora os computadores sejam muito melhores em calcular e escolher movimentos futuros do que os humanos, para muitas posições nem mesmo eles podem dizer com certeza se uma posição está ganhando, perdendo ou empatando. E eles certamente nunca poderiam provar isso - uma prova geralmente exigiria muitos cálculos, examinando cada folha de uma árvore de jogo exponencial.
Então, o que as pessoas e os computadores fazem é usar "heurísticas" (adivinhações instintivas) para avaliar o "valor" de diferentes posições - estimando qual jogador eles acham que vencerá. Isso também pode ser interpretado como um problema de aprendizado de máquina em que o conjunto de dados contém muitas posições no tabuleiro e os rótulos são quem ganhou – o que treina o algoritmo para prever quem ganhará em uma determinada posição.
Normalmente, os modelos de aprendizado de máquina usados para esse fim pensam nos próximos movimentos prováveis, consideram quais posições são acessíveis a ambos os jogadores e, em seguida, usam "intuição" sobre essas posições futuras para informar sua avaliação da posição atual.
Mas quem ganha de uma determinada posição depende de quão bons são os jogadores. Portanto, a avaliação do modelo de um jogo específico dependerá de quem estava jogando os jogos que entraram no conjunto de dados de treinamento. Normalmente, quando os comentaristas de xadrez falam sobre o "valor objetivo" de diferentes posições, eles querem dizer quem provavelmente vencerá de uma determinada posição quando ambos os lados estiverem sendo jogados pelas melhores IAs de xadrez disponíveis. Mas essa medida de valor nem sempre é a mais útil quando se considera uma posição que os jogadores humanos terão que desempenhar no final. Portanto, não está claro exatamente o que o Chess.com (ou nós) devemos considerar como uma "boa jogada".
Se eu estivesse trapaceando no xadrez e fizesse alguns movimentos sugeridos por uma máquina de xadrez, talvez nem me ajudasse a vencer. Esses movimentos podem estar criando um ataque brilhante que nunca me ocorreria, então eu o desperdiçaria a menos que pedisse ao mecanismo de xadrez para jogar o resto do jogo para mim. (Lichess.org me diz que eu joguei 3.049 jogos Blitz no momento em que escrevo, e minha não muito boa classificação ELO de 1632 significa que você pode esperar que eu perca boas táticas a torto e a direito.)
Detectar traição é difícil. Se você está jogando online e está se perguntando se seu oponente está trapaceando, você realmente não será capaz de dizer com certeza – porque você não viu milhões de jogos humanos jogados com estilos radicalmente variados. É um problema em que os modelos de aprendizado de máquina treinados com grandes quantidades de dados têm uma grande vantagem. Em última análise, eles podem ser críticos para a integridade contínua do xadrez.
+ Explorar mais A nova IA Go-playing do Google aprende rápido e até derrotou seu antigo eu
Este artigo é republicado de The Conversation sob uma licença Creative Commons. Leia o artigo original.