Imagem 1:podemos prestar mais atenção ao corpo humano, parte superior do corpo e parte inferior do corpo. Crédito:Cai, Wang e Cheng.
A reidentificação de pessoas envolve a identificação automática da mesma pessoa em várias imagens de câmeras diferentes e com diferentes origens, ângulos ou posições. Apesar dos avanços recentes no campo da inteligência artificial (IA), a reidentificação de pessoas continua sendo uma tarefa altamente desafiadora, particularmente devido às muitas variações na pose de uma pessoa, bem como outras diferenças associadas à iluminação, oclusão, desalinhamento e desordem de fundo.
Pesquisadores do Centro de P&D Suning nos EUA desenvolveram recentemente uma nova técnica para a reidentificação de pessoas com base em uma rede de atenção guiada por máscara de partes do corpo em várias escalas (MMGA). Seu papel, pré-publicado no arXiv, será apresentado durante a apresentação dos destaques do Workshop CVPR 2019 em junho.
"A reidentificação de pessoas está se tornando uma tarefa cada vez mais importante devido à sua ampla gama de aplicações potenciais, como investigação criminal, segurança pública e recuperação de imagens, "Honglong Cai, um dos pesquisadores que realizou o estudo, contado TechXplore . "Contudo, continua sendo uma tarefa desafiadora, devido à oclusão, desalinhamento, variação de poses e desordem de fundo. Em nosso estudo recente, nossa equipe tentou desenvolver um método para superar esses desafios. "
Em vez de se concentrar em imagens inteiras, Cai e seus colegas desenvolveram um modelo de reidentificação de pessoa que só dá atenção à pessoa de interesse, ignorando o fundo. Levando essa ideia um passo adiante, seu modelo analisa diferentes partes do corpo da pessoa em uma determinada imagem.
“Para implementar a nossa ideia, propusemos criativamente uma rede de atenção guiada por máscara de partes do corpo em várias escalas, "Disse Cai." Aplicamos máscaras corporais para orientar o treinamento do nosso modelo para que ele possa prestar mais atenção ao corpo humano na imagem. Nosso modelo contém duas partes:um extrator de recursos e um módulo de atenção. "
Os 5 primeiros resultados de recuperação para imagens de consulta estão todos corretos. Crédito:Cai, Wang e Cheng.
O componente extrator de características do modelo desenvolvido por Cai e seus colegas pode extrair características discriminativas dos corpos das pessoas a partir de imagens. O módulo de atenção do modelo, por outro lado, orienta a rede MMGA, destacando áreas da imagem (ou seja, pixels) às quais ele deve prestar mais atenção.
Os pesquisadores usaram máscaras corporais para orientar o treinamento do módulo de atenção de seu modelo, pois isso permite discernir corpos humanos de informações de fundo. Além disso, eles dividem as máscaras do corpo em máscaras da parte superior e inferior do corpo, para que o módulo de atenção possa aprender a distinguir entre as partes superiores e inferiores do corpo de uma pessoa.
"Diferentemente da maioria dos métodos atuais de reidentificação de pessoas, que dividem as imagens em slides fixos, nosso modelo pode dizer exatamente onde estão as partes superior e inferior do corpo, "Cai explicou." Além disso, máscaras corporais são usadas apenas na fase de treinamento, e não exigimos máscaras corporais na fase de inferência, o que torna nosso modelo muito eficiente em aplicações práticas. "
Para avaliar seu modelo, Cai e seus colegas realizaram uma série de experimentos testando seu desempenho em dois conjuntos de dados, a saber, os conjuntos de dados Market-1501 e DukeMTMC-reID. Eles descobriram que seu modelo pode reduzir os efeitos negativos das variações na pose de uma pessoa, desalinhamento e desordem de fundo, superando os métodos de reidentificação de última geração.
As descobertas coletadas pelos pesquisadores sugerem que os mecanismos de atenção podem melhorar significativamente a precisão das redes de reidentificação de pessoas. Além disso, seu estudo introduziu um método de treinamento de atenção por guia de máscara que pode melhorar ainda mais essa precisão.
"Em nosso trabalho recente, máscaras da parte superior do corpo e máscaras do corpo inferior são usadas para orientar o treinamento do módulo de atenção, "Cai disse." No futuro, gostaríamos de tentar dividir as máscaras corporais em detalhes mais sutis, como a cabeça, mão, braço, perna, etc, pois isso pode melhorar ainda mais a precisão da reidentificação de pessoas. "
© 2019 Science X Network