Crédito CC0:domínio público
A IA está cada vez mais sendo usada para ajudar operadores humanos a lidar com grandes quantidades de imagens de CFTV e outras fontes de segurança. A reidentificação de pessoas (ReID) é um método no qual uma IA é capaz de reconhecer imagens da mesma pessoa tiradas de câmeras diferentes ou em ocasiões diferentes. Isso ajuda a rastrear suspeitos em uma rede CCTV que cobre um grande espaço público, como uma rede subterrânea. ReID é um desafio para as máquinas, pois elas devem considerar e diferenciar a mesma pessoa sob diferentes fontes de luz, poses e mudanças na aparência, como suas roupas.
Em um artigo a ser apresentado na Conferência Internacional sobre Visão Computacional deste ano em Seul, Coreia do Sul, a conferência de maior prestígio em IA visual, especialistas do Centro de Visão de Surrey, Speech and Signal Processing (CVSSP) detalha como eles desenvolveram um sistema exclusivo chamado OSNet que superou muitos sistemas de identificação populares já em uso.
A equipe CVSSP mostrou que a OSNet é capaz de detalhar informações de uma variedade de escalas espaciais para ajudar a fazer uma reidentificação com precisão - desde os menores detalhes, como o logotipo em uma camiseta a outro, fatores maiores, como o tipo de casaco usado pelo suspeito.
Incrivelmente, OSNet só precisa de 2,2 milhões de parâmetros, um número muito pequeno no contexto de modelos de redes neurais profundas, para superar muitos de seus concorrentes construídos na infraestrutura ResNet50 popular que usa 24 milhões de parâmetros - sugerindo que a OSNet poderia se tornar o padrão em tecnologia de reconhecimento visual. Um tamanho de parâmetro tão pequeno significa que o modelo pode ser implantado "na borda, "o que significa que o levantamento computacional pesado pode ser realizado na própria câmera, em vez de em um data center remoto, economizando largura de banda para a transmissão de grandes quantidades de dados de vídeo das câmeras para os servidores de dados.
Tao Xiang, Distinto Professor de Visão Computacional e Aprendizado de Máquina na CVSSP, disse:"Com OSNet, decidimos desenvolver uma ferramenta que pode superar muitos dos problemas de reidentificação de pessoas que outras configurações enfrentam - mas os resultados excederam em muito nossas expectativas. A precisão ReID alcançada pela OSNet ultrapassou claramente a dos operadores humanos.
"A OSNet não só mostra que é capaz de superar suas contrapartes em muitos problemas de reidentificação, mas os resultados são tais que acreditamos que poderia ser usado como uma tecnologia autônoma de reconhecimento visual por si só. "
Professor Adrian Hilton, Diretor da CVSSP, disse:"Esta é uma conquista considerável do Prof Xiang e sua equipe em alcançar a tecnologia de reidentificação líder mundial. Seu trabalho na OSNet tem potencial para ser inovador e pode ajudar a moldar o campo de reconhecimento visual nos próximos anos. é um ótimo exemplo de IA e percepção de máquina para o benefício da sociedade, fornecendo tecnologia capacitadora para espaços públicos mais seguros. "