Os modelos computacionais dinâmicos de Xiangliang podem analisar tweets para identificar os interesses dos usuários do Twitter. Crédito:KAUST
Suas postagens nas redes sociais revelam muito sobre você. Os pesquisadores da KAUST desenvolveram um modelo computacional dinâmico que pode analisar tweets para identificar os interesses dos usuários do Twitter e rastrear mudanças ao longo do tempo. "Compreender a evolução dos interesses dos usuários significa que podemos agrupá-los de acordo e recomendar amigos, notícia, eventos e outros serviços, "diz Xiangliang Zhang, que liderou a pesquisa na KAUST.
A criação de modelos de computador que possam identificar os interesses em evolução de uma pessoa a partir de suas postagens nas redes sociais é um problema multifacetado. O primeiro desafio é entender o significado do texto postado, uma área de pesquisa conhecida como Processamento de Linguagem Natural (PNL). "O objetivo da PNL é tornar os computadores tão inteligentes quanto os seres humanos no entendimento da linguagem, "Diz Zhang." É uma das tarefas mais desafiadoras da IA, " Ela adiciona.
Os modelos de PNL baseados em regras não têm tido muito sucesso em interpretar as nuances da linguagem da maneira como os humanos usam as palavras de maneiras diversas e criativas, de forma que o significado das palavras pode frequentemente ser altamente dependente do contexto. Uma abordagem alternativa é aplicar o aprendizado de máquina para representar palavras em um espaço semântico - onde palavras semanticamente relacionadas, por exemplo, Paris, Pequim e Riade - estão mapeados em conjunto.
Para identificar os interesses dos usuários do Twitter analisando seus tweets, o principal desafio é caracterizar os usuários individuais por suas palavras-chave mais importantes. Zhang e sua equipe criaram um modelo de incorporação em que palavras e usuários são tratados juntos. "Criamos um modelo de usuário dinâmico e de incorporação de palavras que pode aprender conjunta e dinamicamente as representações de usuário e palavra no mesmo espaço semântico, "Zhang diz.
Os pesquisadores melhoraram a saída do modelo, desenvolvendo e incorporando um componente de diversificação de palavras-chave de streaming, que pode identificar palavras-chave intimamente relacionadas e remover entradas redundantes da lista de palavras-chave principais. O modelo resultante pode capturar uma gama diversificada de interesses para cada usuário e se adaptar aos seus interesses em evolução ao longo do tempo.
Quando a equipe testou seu modelo em um conjunto de tweets, foi uma melhoria significativa em relação às abordagens anteriores, Zhang diz. "Nosso modelo supera significativamente muitos modelos de perfil de usuário de última geração." A equipe já produziu uma nova iteração de sua abordagem de modelo de incorporação, Ela adiciona, em que os relacionamentos usuário-usuário também são capturados para começar a identificar os interesses que os usuários têm em comum. "O próximo modelo será mais avançado e construirá vetores dinâmicos de co-incorporação que capturam a proximidade social usuário-usuário e relevância de atributo do usuário simultaneamente, "Zhang diz.