As 'armadilhas fotográficas' do sensor de movimento tiram fotos de animais em seu ambiente natural, sem obstruções, muitas vezes produzindo imagens não observáveis de outra forma. O sistema de inteligência artificial processa automaticamente essas imagens, aqui, relatando corretamente isso como uma imagem de dois impalas em pé. Crédito:Snapshot Serengeti
Um novo jornal no Proceedings of the National Academy of Sciences (PNAS) relata como uma técnica de inteligência artificial de ponta chamada aprendizagem profunda pode identificar automaticamente, contar e descrever os animais em seus habitats naturais.
As fotografias que são coletadas automaticamente por câmeras com sensores de movimento podem então ser descritas automaticamente por redes neurais profundas. O resultado é um sistema que pode automatizar a identificação de animais para até 99,3 por cento das imagens, ao mesmo tempo em que executa a mesma taxa de precisão de 96,6 por cento de equipes de crowdsourcing de voluntários humanos.
"Essa tecnologia nos permite, com precisão, coletar dados da vida selvagem de forma discreta e econômica, que poderia ajudar a catalisar a transformação de muitos campos da ecologia, biologia da vida selvagem, zoologia, biologia da conservação e comportamento animal em ciências de 'big data'. Isso irá melhorar drasticamente nossa capacidade de estudar e conservar a vida selvagem e ecossistemas preciosos, "diz Jeff Clune, o autor sênior do artigo. Ele é o Harris Professor Associate da Universidade de Wyoming e gerente de pesquisa sênior do Uber's Artificial Intelligence Labs.
O artigo foi escrito por Clune; seu Ph.D. estudante Mohammad Sadegh Norouzzadeh; seu ex-Ph.D. estudante Anh Nguyen (agora na Auburn University); Margaret Kosmala (Universidade de Harvard); Ali Swanson (Universidade de Oxford); e Meredith Palmer e Craig Packer (ambos da Universidade de Minnesota).
Redes neurais profundas são uma forma de inteligência computacional vagamente inspirada em como o cérebro dos animais vê e entende o mundo. Eles exigem uma grande quantidade de dados de treinamento para funcionar bem, e os dados devem ser rotulados com precisão (por exemplo, cada imagem sendo corretamente identificada com a espécie de animal presente, quantos são, etc.).
Este estudo obteve os dados necessários do Snapshot Serengeti, um projeto de ciência cidadã na plataforma http://www.zooniverse.org. Snapshot Serengeti implantou um grande número de "armadilhas fotográficas" (câmeras com sensores de movimento) na Tanzânia que coletam milhões de imagens de animais em seu habitat natural, como leões, leopardos, chitas e elefantes. A informação nestas fotografias só é útil depois de convertida em texto e números. Por anos, o melhor método para extrair tais informações era pedir a equipes de crowdsourcing de voluntários humanos para rotular cada imagem manualmente. O estudo publicado hoje aproveitou 3,2 milhões de imagens rotuladas produzidas desta maneira por mais de 50, 000 voluntários humanos ao longo de vários anos.
"Quando eu disse a Jeff Clune que tínhamos 3,2 milhões de imagens rotuladas, ele parou no meio do caminho, "diz Packer, que chefia o projeto Snapshot Serengeti. "Queríamos testar se poderíamos usar o aprendizado de máquina para automatizar o trabalho de voluntários humanos. Nossos cientistas cidadãos fizeram um trabalho fenomenal, mas precisávamos acelerar o processo para lidar com quantidades cada vez maiores de dados. O algoritmo de aprendizado profundo é incrível e superou em muito as minhas expectativas. Esta é uma virada de jogo para a ecologia da vida selvagem. "
Swanson, que fundou o Snapshot Serengeti, acrescenta:"Existem centenas de projetos de armadilhas fotográficas no mundo, e muito poucos deles são capazes de recrutar grandes exércitos de voluntários humanos para extrair seus dados. Isso significa que muito do conhecimento nesses conjuntos de dados importantes permanece inexplorado. Embora os projetos estejam cada vez mais se voltando para a ciência cidadã para classificação de imagens, estamos começando a ver que leva cada vez mais tempo para rotular cada lote de imagens conforme a demanda por voluntários aumenta. Acreditamos que o aprendizado profundo será fundamental para aliviar o gargalo dos projetos de armadilhas fotográficas:o esforço de converter imagens em dados utilizáveis. "
"O sistema de inteligência artificial não apenas informa qual das 48 espécies diferentes de animais está presente, mas também informa quantos existem e o que estão fazendo. Ele vai te dizer se eles estão comendo, adormecido, se os bebês estão presentes, etc, "acrescenta Kosmala, outro líder Snapshot Serengeti. "Estimamos que o pipeline de tecnologia de aprendizagem profunda que descrevemos economizaria mais de oito anos de esforço de rotulagem humana para cada 3 milhões de imagens adicionais. Isso é muito tempo valioso de voluntariado que pode ser redistribuído para ajudar outros projetos."
O primeiro autor Sadegh Norouzzadeh aponta que "O aprendizado profundo ainda está melhorando rapidamente, e esperamos que seu desempenho só melhore nos próximos anos. Aqui, queríamos demonstrar o valor da tecnologia para a comunidade de ecologia da vida selvagem, mas esperamos que, à medida que mais pessoas pesquisam como melhorar o aprendizado profundo para este aplicativo e publicam seus conjuntos de dados, o céu é o limite. É empolgante pensar em todas as diferentes maneiras como essa tecnologia pode ajudar em nossas importantes missões científicas e de conservação. "
O jornal que aparece hoje em PNAS é intitulado, "Identificando automaticamente, contando, e descrevendo animais selvagens em imagens de armadilhas fotográficas com aprendizado profundo. "