Matrizes progressivas no estilo Raven. Em (a), a regra abstrata subjacente é uma progressão aritmética do número de formas ao longo das colunas. Em (b) há uma relação XOR nas posições da forma ao longo das linhas (painel 3 =XOR (painel 1, painel 2)). Outros recursos, como o tipo de forma, não são levados em consideração. A é a escolha correta para ambos. Crédito:arXiv:1807.04225 [cs.LG]
Testando, teste:DeepMind senta AI para um teste de QI. Embora os resultados de desempenho de IA não sejam surpreendentes em superar ou combinar o raciocínio humano, é um começo. Cientistas de IA reconhecem que estabelecer sua capacidade de raciocinar sobre conceitos abstratos tem se mostrado difícil. DeepMind queria ver como a IA poderia funcionar e a equipe propôs um conjunto de dados e um desafio para investigar o raciocínio abstrato.
A IA pode corresponder às nossas habilidades de raciocínio abstrato? As redes neurais profundas serão mais capazes de resolver problemas de raciocínio visual abstrato no futuro? Os pesquisadores da DeepMind certamente estiveram no caso.
Seu papel, "Medindo o raciocínio abstrato em redes neurais, "está no arXiv. Os autores são David Barrett, Felix Hill, Adam Santoro, Ari Morcos, Timothy Lillicrap, da DeepMind. Você pode verificar o que eles estavam procurando e como foram testados. O artigo concentra-se basicamente em uma abordagem para medir o raciocínio abstrato em máquinas de aprendizagem. Em sua discussão, a equipe disse, sim, tem havido progresso no raciocínio e no aprendizado da representação abstrata em redes neurais - mas até que ponto esses modelos exibem algo como raciocínio abstrato geral "é assunto de muito debate".
Os modelos para ter sucesso tiveram que lidar com regimes de generalização nos quais os dados de treinamento e teste diferiam. Eles disseram que apresentaram uma arquitetura com uma estrutura projetada para encorajar o raciocínio. Resultados:Saco misto. Eles disseram que seu modelo era proficiente em certas formas de generalização, mas fraco em outros.
Apesar disso, é digno de nota que eles exploraram maneiras de medir e extrair um raciocínio abstrato mais forte em redes neurais.
"Testes de QI humano padrão muitas vezes exigem que os participantes interpretem cenas visuais perceptualmente simples, aplicando princípios que aprenderam na experiência cotidiana, "disse um blog da DeepMind." Ainda não temos os meios para expor os agentes de aprendizado de máquina a um fluxo semelhante de 'experiências cotidianas', o que significa que não podemos medir facilmente sua capacidade de transferir conhecimento do mundo real para testes de raciocínio visual. Apesar disso, podemos criar uma configuração experimental que ainda dá bom uso aos testes de raciocínio visual humano. "
Eles começaram a construir um gerador para problemas de matriz com um conjunto de fatores abstratos. A equipe está incentivando mais pesquisas em raciocínio abstrato, e eles disponibilizaram seu conjunto de dados publicamente.
A questão geral é se os cientistas podem alcançar capacidades de raciocínio analítico semelhantes às humanas.
Embora os resultados do teste de QI possam ter sido uma mistura, os pesquisadores não veem isso como um jogo de vencer ou desistir. Eles continuarão trabalhando para explorar estratégias para melhorar a generalização e explorar modelos futuros. Como CIO Dive comentou, "Assistentes inteligentes receberam montanhas de dados para ajudar os consumidores em quase todas as áreas imagináveis, no entanto, quando apresentado com problemas desconhecidos, ainda pode ficar aquém. "
Os autores escreveram, em seu abstrato, "propomos um conjunto de dados e um desafio projetado para investigar o raciocínio abstrato, inspirado por um conhecido teste de QI humano. Para ter sucesso neste desafio, os modelos devem lidar com vários "regimes" de generalização nos quais os dados de treinamento e teste diferem de maneiras claramente definidas. Mostramos que modelos populares, como ResNets, funcionam mal, mesmo quando os conjuntos de treinamento e teste diferem apenas minimamente, e apresentamos uma nova arquitetura, com uma estrutura projetada para encorajar o raciocínio, isso é significativamente melhor. "
CIO Dive descreveram seus testes como testes de QI visual. No processo, os autores estavam interessados em ver o desempenho em habilidades de generalização quando os dados do teste eram diferentes.
Combinar IA com habilidades humanas para abstração continua a ser uma batalha difícil.
Como CIO Dive Alex Hickey escreveu:A IA precisaria distinguir significados diferentes entre "comer espaguete com queijo" e "comer espaguete com cachorros".
O artigo comentou que testar as capacidades das redes neurais pode ser complicado e as redes neurais têm suas armadilhas, dada sua capacidade de memorização e habilidade de explorar pistas estatísticas superficiais.
© 2018 Tech Xplore