Abordagem proposta de recuperação de pessoas usando altura, cor e gênero do pano. Crédito:arXiv:1810.05080 [cs.CV] https://arxiv.org/abs/1810.05080
Uma abordagem de pesquisa especial permite que você encontre pessoas em vídeo de vigilância apenas com base em suas descrições. O título RT dizia, "O algoritmo de IA pode encontrar você em filmagens de CFTV sem usar o reconhecimento de rosto." Mas como? Altura, Gênero sexual, confecções, não características faciais, são os brindes, por meio de um algoritmo de inteligência artificial.
O trabalho reflete o potencial das técnicas de aprendizado profundo. A RT é um ponto útil para aqueles que ainda podem confundir o conceito de aprendizado profundo com aprendizado de máquina.
RT escreveu que nos esforços dos pesquisadores, o aprendizado profundo viajou "além do aprendizado de máquina (onde os padrões são definidos em algoritmos e exigem supervisão) ao incorporar o 'autoaprendizado' - para treinar uma rede neural convolucional (CNN) para reconhecer a biometria suave usando visão computacional."
RT e outros sites relataram a equipe de pesquisadores que criou a ferramenta que encontra pessoas em imagens de CFTV.
Hiren Galiyawala, Kenil Shah, Vandit Gajjar e Mehul S. Raval descreveram seu trabalho em seu artigo, "Recuperação de pessoa em vídeo de vigilância usando altura, Cor e gênero, "submetido em setembro e agora no arXiv. As afiliações dos autores incluem a Escola de Engenharia e Ciências Aplicadas, Universidade de Ahmedabad e o L. D. College of Engineering, ambos na Índia.
Atributos como estes - altura, construir, roupas - cor de pano, tipo de tecido - e gênero são chamados de biometria suave. "A tarefa de recuperação de pessoa no vídeo é muito desafiadora devido à oclusão, condição de luz, qualidade da câmera, pose, e zoom. Contudo, atributos como altura, cor do pano, o gênero pode ser deduzido do vídeo de vigilância de baixa qualidade à distância, sem a cooperação do sujeito. Esses atributos são conhecidos como biometria suave, "escreveram os autores.
Tristan Greene, TNW, ofereceu um exemplo, sendo esse um pedido para mulheres com camisas vermelhas de 153 cm de altura. O resultado seria um videoclipe reduzido a quadros de pessoas que atendem a esses critérios.
Quais foram os resultados? RT e outros sites disseram que o algoritmo identificou corretamente 28 pessoas de 41 em um conjunto de dados com atributos biométricos suaves e que os pesquisadores disseram - com apenas alguns pequenos ajustes - a precisão poderia ser melhorada substancialmente.
Os autores do resumo disseram que os modelos de cor e gênero foram ajustados com o uso do AlexNet. A última é uma rede neural convolucional (CNN) que recebe o nome de seu designer, Alex Krizhevsky. O AlexNet é treinado em mais de 1 milhão de imagens do banco de dados ImageNet, disse MathWorks.
"A rede tem 8 camadas de profundidade e pode classificar imagens em 1000 categorias de objetos, como teclado, mouse, lápis, e muitos animais. Como resultado, a rede aprendeu representações ricas de recursos para uma ampla gama de imagens. "
Tristan Greene em TNW argumentou por que sua pesquisa é importante.
Greene achou seu trabalho emocionante por suas implicações em encontrar pessoas desaparecidas ou rastrear criminosos suspeitos.
Mas, ele adicionou, “talvez tão importante seja o fato de que esta é uma resposta legítima para o problema da vigilância onipresente”. Uma alternativa para "onipresente" seria apenas o que fosse relevante.
Greene disse que "este paradigma envolveria o uso de computadores para vasculhar imagens de arquivo em busca de apenas os dados que sejam pelo menos um pouco relevantes. É uma pequena distinção, mas que poderia significar a diferença entre o voyeurismo do governo e a proteção do cidadão. "
Greene também pensou, "se pudéssemos alimentar uma rede neural com vídeo e deixá-la restringir as coisas a algumas horas de filmagem compilada, seria possível rastrear humanos com precisão em vários feeds de vigilância. "
© 2018 Science X Network