• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • AI Aristo faz o teste de ciências, surge superstar de múltipla escolha

    Crédito:aristo

    Aristo passou em um teste americano de ciências da oitava série. Se lhe disserem que Aristo é um garoto sério que adora ler tudo o que pode sobre Faraday e toca bateria, você dirá, então, grande negócio.

    Aristo, no entanto, é um programa de inteligência artificial e os cientistas gostariam que o mundo soubesse que isso é importante, como "uma referência no desenvolvimento de IA, "como Melissa Locker chamou em Fast Company .

    Nós queremos dizer, apenas pense nisso. Cade Metz, no O jornal New York Times , pensou sobre isso. "Quatro anos atrás, mais de 700 cientistas da computação competiram em uma competição para construir inteligência artificial que pudesse passar em um teste de ciências da oitava série. Havia $ 80, 000 em prêmio em dinheiro na linha. Todos eles foram reprovados. Mesmo o sistema mais sofisticado não poderia fazer melhor do que 60% no teste. A IA não conseguiu corresponder às habilidades de linguagem e lógica que se espera que os alunos tenham ao entrar no ensino médio. "

    Então, quem está por trás do teste que em 2019 finalmente impressionou? Não é um mau palpite:The Allen Institute for Artificial Intelligence, que é supervisionado por Oren Etzioni. O sistema deles tinha as respostas corretas para mais de 90 por cento das perguntas do teste, e não para por aí - o sistema obteve mais de 80% das respostas corretas em questões de múltipla escolha sem diagrama em um exame de ciências do 12º ano.

    Estamos agora observando "um progresso significativo no desenvolvimento de IA que pode compreender linguagens e imitar a lógica e a tomada de decisões dos humanos, "disse Metz.

    Para a história direta, você deve ler "De 'F' a 'A' no N.Y. Regents Science Exams:Uma Visão Geral do Projeto Aristo, "que agora está no arXiv. Este projeto era uma missão de seis anos para responder a exames de ciências do ensino fundamental e médio.

    Os autores estavam bem cientes de que a IA não havia feito um show impressionante no passado de desempenho nos níveis desejados. Com todo o domínio da IA ​​em Go, Pôquer e perigo, eles disseram, "a rica variedade de exames padronizados permaneceu um desafio histórico. Mesmo em 2016, o melhor sistema de IA alcançou apenas 59,3% em um desafio de exame de ciências da 8ª série. "

    O AI fez testes de múltipla escolha; o número de 90 por cento estava no não diagrama do exame, questões de múltipla escolha.

    Aqui está a maneira como o AI2 descreve seu gênio não humano:"Aristo reúne leitura de máquina e PNL, vinculação textual e inferência, raciocinando com incerteza, técnicas estatísticas em grandes corpora, e a compreensão do diagrama para desenvolver a primeira "máquina com conhecimento" sobre a ciência. "

    A equipe mimava Aristo por um motivo oculto, menos a ver com dar tapinhas nas próprias costas e mais sobre o que eles poderiam aprender com o comportamento de Ariston nos exames de ciências, "já que essas perguntas testam muitas das principais habilidades necessárias para a inteligência da máquina, " eles disseram.

    Em seu jornal, eles explicaram mais sobre as boas razões para aproveitar os exames de ciências padronizados.

    "Testes padronizados, em exames específicos de ciências, são um raro exemplo de desafio que atende a esses requisitos. Embora não seja um teste completo de inteligência de máquina, eles exploram vários recursos fortemente associados à inteligência, incluindo compreensão da linguagem, raciocínio, e uso de conhecimento de bom senso. Um dos aspectos mais interessantes e atraentes dos exames de ciências é sua natureza graduada e multifacetada; diferentes questões exploram diferentes tipos de conhecimento, variando substancialmente em dificuldade. Por esta razão, eles têm sido usados ​​como uma tarefa atraente - e desafiadora - para o campo por muitos anos. "

    Novos direitos de se gabar:Aristo, os autores disseram, é o primeiro sistema a atingir uma pontuação de mais de 90 por cento no não diagrama, parte de múltipla escolha do New York Regents 8th Grade Science Exam.

    Stephen Johnson em Big Think escreveu sobre a incapacidade de Aristo de fazer diagramas. Ele disse que "o sistema é projetado apenas para interpretar a linguagem, o que significa que pode responder a questões de múltipla escolha, mas não aqueles que apresentam uma ilustração ou gráfico. "

    Apesar disso, o desempenho mostrou que "os métodos modernos de PNL podem resultar no domínio dessa tarefa".

    Para o instituto, O feito de Aristo não é considerado um poleiro na montanha, mas sim um passo na direção desejada. Eles chamam isso de um marco "no longo caminho em direção a uma máquina que tem um profundo conhecimento da ciência e realiza o sonho original de Paul Allen de um Aristóteles Digital."

    © 2019 Science X Network




    © Ciência https://pt.scienceaq.com