O algoritmo identifica as emoções percebidas dos indivíduos com base em seus estilos de caminhada. Dado um vídeo RGB de um indivíduo caminhando (topo), o método dos pesquisadores extrai seu andar como uma série de poses 3D (embaixo). Em seguida, ele usa uma combinação de recursos profundos aprendidos por meio de um LSTM e recursos afetivos calculados usando sinais de postura e movimento e os classifica em emoções básicas (por exemplo, feliz, triste, etc.), usando um classificador de floresta aleatório. Crédito:Randhavane et al.
Uma equipe de pesquisadores da Universidade da Carolina do Norte em Chapel Hill e da Universidade de Maryland em College Park desenvolveu recentemente um novo modelo de aprendizado profundo que pode identificar as emoções das pessoas com base em seus estilos de caminhada. A abordagem deles, descrito em um artigo pré-publicado no arXiv, funciona extraindo a marcha de um indivíduo de um vídeo RGB dele / dela caminhando, em seguida, analisando-o e classificando-o como uma das quatro emoções:feliz, triste, zangado ou neutro.
"As emoções desempenham um papel significativo em nossas vidas, definindo nossas experiências, e moldar a forma como vemos o mundo e interagimos com outros humanos, "Tanmay Randhavane, um dos pesquisadores principais e um aluno de pós-graduação da UNC, disse TechXplore. "Perceber as emoções de outras pessoas nos ajuda a compreender seu comportamento e a decidir nossas ações em relação a elas. Por exemplo, as pessoas se comunicam de maneira muito diferente com alguém que percebem estar com raiva e hostil do que com alguém que percebem ser calmo e contente. "
A maioria das ferramentas existentes de reconhecimento e identificação de emoções funcionam analisando expressões faciais ou gravações de voz. Contudo, estudos anteriores sugerem que a linguagem corporal (por exemplo, postura, movimentos, etc.) também pode dizer muito sobre como alguém está se sentindo. Inspirado por essas observações, os pesquisadores se propuseram a desenvolver uma ferramenta que pode identificar automaticamente a emoção percebida de indivíduos com base em seu estilo de caminhada.
"A principal vantagem de nossa abordagem de reconhecimento de emoção percebida é que ela combina duas técnicas diferentes, "Randhavane disse." Além de usar o aprendizado profundo, nossa abordagem também aproveita as descobertas de estudos psicológicos. A combinação de ambas as técnicas nos dá uma vantagem sobre os outros métodos. "
A abordagem primeiro extrai a marcha de uma pessoa de um vídeo RGB dela caminhando, representando-o como uma série de poses 3-D. Subseqüentemente, os pesquisadores usaram uma rede neural recorrente de memória de curto prazo longa (LSTM) e um classificador de floresta aleatória (RF) para analisar essas poses e identificar a emoção mais proeminente sentida pela pessoa no vídeo, escolhendo entre a felicidade, tristeza, raiva ou neutro.
O LSTM é inicialmente treinado em uma série de recursos profundos, mas estes são mais tarde combinados com características afetivas calculadas a partir dos passos usando sinais de postura e movimento. Todos esses recursos são classificados em última instância usando o classificador de RF.
Randhavane e seus colegas realizaram uma série de testes preliminares em um conjunto de dados contendo vídeos de pessoas caminhando e descobriram que seu modelo poderia identificar as emoções percebidas de indivíduos com 80 por cento de precisão. Além disso, sua abordagem levou a uma melhoria de aproximadamente 14 por cento em relação a outros métodos de reconhecimento de emoção percebida que se concentram no estilo de caminhada das pessoas.
"Embora não façamos qualquer afirmação sobre as emoções reais que uma pessoa está experimentando, nossa abordagem pode fornecer uma estimativa da emoção percebida desse estilo de caminhada, "Aniket Bera, um professor de pesquisa no departamento de ciência da computação, supervisionando a pesquisa, disse TechXplore. “Existem muitas aplicações para esta pesquisa, variando de uma melhor percepção humana para robôs e veículos autônomos a vigilância aprimorada para a criação de experiências mais envolventes em realidade aumentada e virtual. "
Junto com Tanmay Randhavane e Aniket Bera, a equipe de pesquisa por trás deste estudo inclui Dinesh Manocha e Uttaran Bhattacharya da Universidade de Maryland em College Park, bem como Kurt Gray e Kyra Kapsaskis do departamento de psicologia da Universidade da Carolina do Norte em Chapel Hill.
Para treinar seu modelo de aprendizado profundo, os pesquisadores também compilaram um novo conjunto de dados chamado Emotion Walk (EWalk), que contém vídeos de pessoas caminhando em ambientes internos e externos marcados com emoções percebidas. No futuro, este conjunto de dados pode ser usado por outras equipes para desenvolver e treinar novas ferramentas de reconhecimento de emoção projetadas para analisar o movimento, postura, e / ou marcha.
"Nossa pesquisa está em um estágio muito primitivo, "Bera disse." Queremos explorar diferentes aspectos da linguagem corporal e olhar mais pistas, como expressões faciais, Fala, padrões vocais, etc, e usar uma abordagem multimodal para combinar todas essas dicas com andadas. Atualmente, presumimos que o movimento de caminhada é natural e não envolve quaisquer acessórios (por exemplo, mala, celulares, etc.). Como parte do trabalho futuro, gostaríamos de coletar mais dados e treinar melhor nosso modelo de aprendizado profundo. Também tentaremos estender nossa metodologia para considerar mais atividades, como correr, gesticulando, etc. "
De acordo com Bera, ferramentas de reconhecimento de emoções percebidas em breve poderão ajudar a desenvolver robôs com navegação mais avançada, planejamento, e habilidades de interação. Além disso, modelos como o deles podem ser usados para detectar comportamentos anômalos ou padrões de caminhada de vídeos ou filmagens de CFTV, por exemplo, identificar indivíduos que estão em risco de suicídio e alertar autoridades ou profissionais de saúde. Seu modelo também pode ser aplicado na indústria de efeitos visuais e animação, onde poderia ajudar designers e animadores na criação de personagens virtuais que efetivamente expressam emoções particulares.
© 2019 Science X Network