• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • IA pior em reconhecer imagens do que humanos

    Crédito:Domínio Público CC0

    Pesquisadores da Universidade HSE e da Universidade Politécnica de Moscou descobriram que os modelos de IA são incapazes de representar características da visão humana devido à falta de acoplamento estreito com a respectiva fisiologia, por isso são piores no reconhecimento de imagens. Os resultados do estudo foram publicados nos Proceedings of the Seventh International Congress on Information and Communication Technology .
    Para entender como a percepção da máquina de imagens difere da percepção humana, os cientistas fizeram upload de imagens de ilusões visuais clássicas para o serviço online IBM Watson Visual Recognition. A maioria deles eram silhuetas geométricas, parcialmente ocultas por formas geométricas da cor de fundo. O sistema tentou determinar a natureza da imagem e indicou o grau de certeza em sua resposta.

    Descobriu-se que a inteligência artificial não é capaz de reconhecer nenhuma figura imaginária, com exceção de um triângulo imaginário colorido. Devido ao alto contraste com o fundo, foi reconhecido corretamente.

    "Objetos semelhantes aos que usamos durante o experimento podem ser encontrados na vida real", diz Vladimir Vinnikov, analista do Laboratório de Métodos de Análise de Big Data da HSE Faculdade de Ciência da Computação e autor do estudo. "Por exemplo, o piloto automático de um carro ou avião percebe um trailer ou uma torre de rádio, que à noite são indicados apenas por luzes de sinalização, da mesma forma que percebemos formas geométricas imaginárias."

    O olho humano está constantemente se movendo involuntariamente, e a superfície fotossensível de sua retina tem a forma de um hemisfério. Uma pessoa pode ver uma ilusão se a imagem for um vetor, ou seja, se incluir pontos de referência e curvas conectando-os. A imaginação humana completará o quadro devido ao movimento constante dos olhos, uma característica fisiológica da nossa visão.

    Nos sistemas optoeletrônicos, tudo é organizado de maneira diferente. Sua matriz sensível à luz tem uma forma plana, geralmente retangular, e o próprio sistema de lentes não é tão livre em movimento quanto o olho humano. Portanto, a inteligência artificial não consegue completar linhas imaginárias que conectam fragmentos de uma ilusão geométrica. A visão de máquina vê apenas o que está realmente representado, enquanto as pessoas completam a imagem em sua imaginação com base em seus contornos.

    Hoje, os sistemas de reconhecimento de imagem de rede neural estão se espalhando ativamente no setor comercial. No entanto, a questão de quão precisamente as máquinas reconhecem as imagens ainda está em aberto. Vidas humanas podem depender da precisão do reconhecimento. Por exemplo, um acidente pode ocorrer se o piloto automático de um carro ou avião não reconhecer um objeto com baixo contraste em relação ao fundo e não conseguir desviar de um obstáculo a tempo.

    Os cientistas acreditam que a imprecisão do reconhecimento de imagem da máquina pode ser corrigida. Por exemplo, eles podem complementar o reconhecimento de imagens raster, que representam uma grade de pixels, simulando características fisiológicas do movimento dos olhos que permitem ao olho ver cenas bidimensionais e tridimensionais. Uma forma alternativa é adicionar a descrição vetorial das imagens, o que ajudará a programar a máquina para contornar a imagem ao longo das trajetórias especificadas pelos vetores.

    "Objetos imaginários definitivamente devem ser usados ​​como testes em sistemas que dependem do reconhecimento de fluxos de fotos e vídeos, por exemplo, em pilotos automáticos de carros ou drones. Isso ajudará a evitar os riscos associados ao uso de sistemas de inteligência de máquina na indústria e sistemas de transporte", diz Vinnikov. + Explorar mais

    Movimentos extras de 'olho' são a chave para carros autônomos melhores




    © Ciência https://pt.scienceaq.com