Um diagrama do sistema de estimativa de idade proposto. Crédito:Agbo-Ajala &Viriri.
Ao longo dos últimos anos, pesquisadores criaram um número crescente de técnicas de reconhecimento facial baseadas em aprendizado de máquina (ML), que pode ter inúmeras aplicações interessantes, por exemplo, melhorando o monitoramento de vigilância, controle de segurança, e potencialmente até mesmo arte forense. Além do reconhecimento facial, avanços em ML também permitiram o desenvolvimento de ferramentas para prever ou estimar qualidades específicas (por exemplo, sexo ou idade) de uma pessoa, analisando imagens de seus rostos.
Em um estudo recente, pesquisadores da Universidade de Kwazulu-Natal, na África do Sul, desenvolveu um modelo baseado em aprendizado de máquina para estimar a idade das pessoas analisando imagens de seus rostos tiradas em ambientes aleatórios da vida real. Esta nova arquitetura foi apresentada em um artigo publicado por Spinger e apresentado há poucos dias na Conferência Internacional de Inteligência Coletiva Computacional (ICCCI) 2019.
A maioria das abordagens tradicionais para classificação de idade só funcionam bem ao analisar imagens de rosto tiradas em ambientes controlados, por exemplo, no laboratório ou em estúdios de fotografia. Por outro lado, muito poucos deles são capazes de estimar a idade das pessoas em imagens tiradas em ambientes reais do dia a dia.
"Os métodos de aprendizagem profunda provaram ser eficazes na resolução deste problema, especialmente com a disponibilidade de uma grande quantidade de dados para treinamento e máquinas de última geração, "escreveram os pesquisadores em seu artigo." Em vista disso, propomos uma solução de aprendizagem profunda para estimar a idade a partir de rostos da vida real. "
A equipe de pesquisadores da Universidade de Kwazulu-Natal desenvolveu uma arquitetura baseada em rede neural convolucional profunda (CNN) com seis camadas. Seu modelo foi treinado para estimar a idade de indivíduos a partir de imagens de rostos tiradas em ambientes não controlados. A arquitetura consegue isso aprendendo quais representações faciais são mais cruciais para a estimativa de idade e se concentrando nessas características específicas.
A fase de pré-processamento da imagem. Crédito:Agbo-Ajala &Viriri.
Para melhorar o desempenho de seu modelo baseado em CNN, os pesquisadores o pré-treinaram em um grande conjunto de dados chamado IMDB-WIKI, que contém mais de meio milhão de imagens de rostos tiradas do IMDB e da Wikipedia, rotulado com a idade de cada sujeito. Esse treinamento inicial permitiu que eles adequassem sua arquitetura ao conteúdo da imagem de rosto.
Subseqüentemente, os pesquisadores ajustaram o modelo usando imagens de outros dois bancos de dados, a saber, MORPH-II e OUI-Adience, treiná-lo para captar peculiaridades e diferenças. MORPH-II contém aproximadamente 70, 000 imagens rotuladas de rostos, enquanto OUI-Adience contém 26, 580 imagens de rosto tiradas em ambientes ideais da vida real.
Quando eles avaliaram seu modelo em imagens tiradas em ambientes não controlados, os pesquisadores descobriram que esse treinamento extensivo levou a um desempenho notável. Seu modelo alcançou resultados de última geração, superando vários outros métodos baseados em CNN para estimativa de idade.
"Nossos experimentos demonstram a eficácia do nosso método para estimativa de idade na natureza quando avaliado no benchmark OUI-Adience, que é conhecido por conter imagens de rostos adquiridos em condições ideais e sem restrições, "escreveram os pesquisadores." O método de classificação de idade proposto atinge novos resultados de ponta, com uma melhoria na precisão de 8,6 por cento (exata) e 3,4 por cento (one-off) sobre o melhor resultado relatado no conjunto de dados OUI-Adience. "
No futuro, a nova arquitetura baseada em CNN desenvolvida por esses pesquisadores poderia permitir implementações de estimativa de idade mais eficazes em uma variedade de configurações da vida real. A equipe também planeja adicionar camadas ao modelo e treiná-lo em outros conjuntos de dados de imagens faciais tiradas em ambientes não controlados assim que estiverem disponíveis, a fim de melhorar ainda mais seu desempenho.
© 2019 Science X Network