Pipeline completo para treinar o modelo de avaliação. Crédito:arXiv:1907.08321 [cs.LG]
O xadrez e a IA estão nas notícias novamente, desta vez em relatórios sobre uma equipe que explora um modelo para xadrez por meio de processamento de linguagem natural (PNL). O mecanismo de aprendizagem era a conversa de xadrez - conversa bem escolhida. Eles pré-treinaram os sentimentos de comentários associados aos movimentos de xadrez. Os sentimentos nortearam a tomada de decisão do agente.
O algoritmo de xadrez resultante foi projetado para avaliar a qualidade dos movimentos de xadrez, analisando a reação de comentaristas especialistas.
Os três pesquisadores da University College London escreveram um artigo descrevendo seus métodos e resultados. Isaac Kamlish, Isaac Chocron e Nicholas McCarthy escreveram "SentiMATE:Learning to play Chess through Natural Language Processing, "e está no arXiv. O artigo foi enviado no mês passado.
"Apresentamos SentiMATE, um novo modelo de aprendizado profundo de ponta a ponta para o xadrez, empregando Processamento de Linguagem Natural que visa aprender uma função de avaliação eficaz avaliando a qualidade do movimento. Esta função é pré-treinada no sentimento de comentário associado aos movimentos de treinamento, e é usado para orientar e otimizar a tomada de decisão do agente durante o jogo. "
Não convide AlphaZero e este modelo de PNL para a mesma festa; eles ficariam em lados opostos da sala. Os pesquisadores escreveram que o AlphaZero do Deep Mind teve sucesso "depois de milhões de iterações de auto-jogo e usando milhares de unidades de processamento de tensor (TPUs)." Esse não foi o caso na nova pesquisa.
Em vez de, eles disseram, eles visavam "abordar a avaliação da qualidade dos movimentos individuais através do uso de Processamento de Linguagem Natural ... Dados de diferentes sites de xadrez foram copiados, que incluía informações sobre os movimentos sendo feitos, e uma avaliação qualitativa dos próprios movimentos na forma de comentários, escrito por uma ampla gama de jogadores de xadrez; resultando em um grande banco de dados de movimentos com comentários anotados. "
"Ele avalia a qualidade dos lances de xadrez, analisando a reação de comentaristas especialistas, "disse Will Knight, MIT Technology Review .
Os pesquisadores eliminaram comentários que não se relacionavam com movimentos de alta qualidade e exemplos que eram muito ambíguos, ele adicionou. "Em seguida, eles usaram um tipo especial de rede neural recorrente e incorporação de palavras (uma técnica matemática que conecta palavras com base em seus significados), treinado em outro modelo de última geração para analisar a linguagem. "
O algoritmo, chamado SentiMATE, elaborou por si mesmo as regras básicas do xadrez, bem como várias estratégias-chave - incluindo bifurcação e roque.
A equipe descobriu que o SentiMATE era capaz de avaliar os movimentos de xadrez "com base em uma função de avaliação de sentimento pré-treinada". Eles concluíram que havia fortes evidências para apoiar o processamento de linguagem natural sendo usado para treinar uma função de avaliação em motores de xadrez.
O desempenho de sua solução foi menos do que espetacular. Knight disse, "não conseguiu vencer alguns bots convencionais de xadrez de forma consistente." Este, Contudo, não deve desviar a atenção do fato de que SentiMATE funcionou, e a maneira como funcionou:
"SentiMATE surpreendeu os pesquisadores com sua capacidade de trabalhar alguns dos princípios básicos do xadrez, bem como várias estratégias-chave, como bifurcação (quando duas ou mais peças são ameaçadas simultaneamente) e roque (quando o rei e o castelo se movem para uma posição mais defensiva na parte de trás do tabuleiro, "disseram os autores.
A lição importante está nos esforços para projetar tal programa:a linguagem pode servir para ensinar como jogar xadrez com menos dados de prática necessários do que nas abordagens convencionais?
Tibi Puiu em ZME Science pensei sobre isso:
"Só dessa vez, seu programa de aprendizado de máquina não praticou milhões de jogos para dominar o xadrez, mas sim analisou a linguagem de comentaristas especialistas. Algum dia, os pesquisadores dizem que uma abordagem semelhante poderia permitir que as máquinas decifrassem a linguagem emocional e adquirissem habilidades que de outra forma seriam inacessíveis por meio da 'força bruta'. "
Quanto ao modelo não ser um super campeão de xadrez, ele disse, "O desempenho de alto nível não era seu objetivo, no entanto. Onde o SentiMATE brilha é em sua habilidade de usar a linguagem para adquirir uma habilidade em vez de praticá-la. "
Em seu jornal, os autores falaram sobre o conjunto de dados muito importante para apoiar suas pesquisas. "Ao limpar e classificar o conjunto de dados com base em comentários, bitificando os lances de xadrez, e aplicando análise de sentimento ao comentário, apresentamos ao SentiChess um conjunto de dados de 15, 000 jogadas de xadrez representadas em formato de bits, ao lado de seus comentários e avaliação de sentimento. Este conjunto de dados é oferecido na esperança de um maior desenvolvimento de trabalho em torno de modelos de xadrez baseados em sentimento, e análise estatística de movimentos. "
Seguindo em frente, Will Knight disse que conversas relevantes ao jogo podem ajudar os programas de IA a aprender a jogar de uma nova maneira. E, além do xadrez, "a mesma técnica poderia permitir que as máquinas usassem o conteúdo emocional de nossa língua para dominar várias tarefas práticas."
(Enquanto o MIT Technology Review subtítulo de colocá-lo, "As máquinas que apreciam movimentos de xadrez 'brilhantes' e 'burros' podem aprender a jogar - e fazer outras coisas - com mais eficiência.")
© 2019 Science X Network