p Crédito CC0:domínio público
p Pode ser mais difícil para os computadores encontrarem o Wally, um personagem evasivo que se esconde nas multidões em uma série de livros infantis populares, do que para os humanos. p Agora, uma pesquisadora da A * STAR e seus colegas desenvolveram um programa de inspiração biológica que pode permitir que os computadores identifiquem Waldos da vida real e outros alvos com mais eficiência.
p A análise de imagens de computador é usada rotineiramente na medicina, segurança, e resgate. A velocidade costuma ser crítica nesses esforços, disse Mengmi Zhang, um cientista da computação no Institute for Infocomm Research da A * STAR, quem conduziu o estudo. Ela cita o uso de computadores para ajudar a encontrar vítimas de desastres naturais, como terremotos.
p Mas esses esforços são frequentemente prejudicados porque os computadores não têm intuição humana. Uma pessoa pode detectar rapidamente um cachorro em um espaço lotado, por exemplo, mesmo que nunca tenham visto aquele cachorro em particular antes. Um computador, por contraste, precisa ser treinado usando milhares de imagens de cães diferentes, e mesmo assim, eles podem vacilar ao procurar um novo cão cuja imagem não tenham encontrado anteriormente.
p Esta fraqueza pode ser particularmente problemática durante a varredura de armas, diz Zhang. Um computador treinado para procurar facas e armas, pode ignorar outro objeto pontiagudo. "Se houver um bastão de metal afiado que não foi visto no conjunto de treinamento, não significa que o passageiro deve ser capaz de levá-lo a bordo do avião, "diz Zhang.
p As pesquisas atuais do computador também tendem a ser lentas porque o computador deve verificar todas as partes de uma imagem em sequência, prestando igual atenção a cada parte. Humanos, Contudo, mudar rapidamente sua atenção entre vários locais diferentes em uma imagem para encontrar seu alvo. Zhang e seus colegas queriam entender como os humanos fazem isso com tanta eficiência. Eles apresentaram imagens superlotadas a 45 pessoas e pediram que caçassem um alvo, dizer, uma ovelha. Eles monitoraram como os olhos dos sujeitos percorriam a cena, fixando brevemente em diferentes locais da imagem. Eles descobriram que, na média, as pessoas podiam localizar as ovelhas em cerca de 640 milissegundos. Isso correspondeu a mudar a localização do seu olhar, na média, pouco mais de duas vezes e meia.
p A equipe desenvolveu então um modelo de computador para implementar essa estratégia de busca mais parecida com a humana na caça a um cachorro. Em vez de procurar um alvo idêntico à imagem de um cachorro dada de antemão, o modelo foi treinado para procurar algo que tivesse características semelhantes à imagem de exemplo. Isso permitiu que o modelo generalizasse a partir de uma única imagem de cachorro, ao "conceito geral de um cão, "e rapidamente escolha outros cães que não tinha visto antes, explica Zhang.
p Os pesquisadores testaram a eficácia do novo modelo de busca visual por computador medindo o número de vezes que o computador teve que se fixar em diferentes locais em uma cena antes de encontrar seu alvo. “O que nos surpreende é que, usando nosso método, computadores podem pesquisar imagens tão rápido quanto humanos, mesmo ao procurar objetos que nunca viram antes, "diz Zhang. O computador era tão bom quanto os humanos para encontrar Wally.
p A equipe agora está programando seu modelo com uma melhor compreensão do contexto. Por exemplo, os humanos entendem naturalmente que é mais provável que uma xícara esteja sobre uma mesa do que flutuando no ar. Uma vez implementado, isso deve melhorar ainda mais a eficiência do modelo, diz Zhang, adicionando, "Wally não pode mais se esconder."