Crédito:Universidade da Califórnia - Riverside
Em fevereiro, o Departamento de Justiça acusou 13 russos de roubar identidades de cidadãos dos EUA e espalhar "notícias falsas" com a intenção de subverter a última eleição presidencial dos EUA. O caso ainda está se desenrolando, e pode fazer isso por anos. Enquanto isso, Os pesquisadores do UCR criaram uma solução baseada em tecnologia para a disseminação de desinformação maliciosa.
Laboratório de Dados Multi-Aspectos da UCR, liderado por Evangelos E. Papalexakis, professor assistente do departamento de Ciência da Computação e Engenharia, está desenvolvendo novas técnicas de ciência de dados para resolver uma variedade de problemas na análise de redes sociais, com financiamento do Naval Sea Systems Command, Consórcio de Educação em Engenharia Naval, a National Science Foundation, e Adobe.
Os pesquisadores estão construindo algoritmos para discernir padrões que indicam "notícias falsas". Por extrapolação, e comandos inseridos nos sistemas de gerenciamento de conteúdo dos editores, esses itens podem ser removidos antes de entrarem no ar e causar estragos. Crucialmente, o cálculo do UCR pode registrar a "pegada" de tais postos para apoiar os processos.
Artigo acadêmico mais recente de Papalexakis sobre este trabalho:"Identificação baseada em conteúdo não supervisionada de artigos de notícias falsas com conjuntos de decomposição de tensor, "co-escrito com o assistente de pesquisa graduado Seyed Mehdi Hosseini Motlagh, foi apresentado, e ganhou o "prêmio de melhor artigo, "no recente workshop MIS2:Misinformation and Misbehavior Mining on the Web, parte do WSDM 2018 (11ª Conferência Internacional ACM sobre Pesquisa na Web e Mineração de Dados).
"Estudos anteriores forneceram percepções úteis sobre a propagação de um artigo em uma rede social. No entanto, a detecção baseada apenas nisso apresenta o risco de um artigo de notícias falso 'infectar' uma série de usuários de mídia social antes de ser detectado, "Papalexakis disse." Em vez disso, nosso trabalho visa a detecção precoce de tais artigos, especialmente nos casos em que não temos conhecimento externo sobre a validade e veracidade de qualquer artigo. "
O monitoramento de rede humana depende de uma combinação de bom senso e experiência para saber se algo é legítimo. Por exemplo, os moderadores verificam se o título está em MAIÚSCULAS (código da cultura digital para "gritar"), use palavras-chave conhecidas em linguagem de crimes de ódio, e procure a falta de fontes verificadas para afirmações espúrias.
Mas como ensinar a um computador que esses atributos triangulados geralmente indicam "notícias falsas"?
A compreensão baseada em máquina depende puramente de conceitos matemáticos, então Papalexakis e seus pesquisadores usam o que é chamado de "Dados Multi-Aspectos". Simplificando, imagine um agrupamento social em que todos dentro da interação têm muitas maneiras de se conectar (por exemplo, telefone, texto, vídeo, mensagem instantânea, publicações nas redes sociais). O Multi-Aspect Data Lab então registra, examina, categoriza e modela todas essas entradas, com base no que é conhecido como "decomposições de tensores". Um "tensor" em ciência de dados significa uma estrutura multidimensional, como um cubo. Todos os múltiplos aspectos são capturados digitalmente como cubos multidimensionais para que o sistema possa investigar e "compreender" o que realmente está acontecendo - e se as notícias são falsas, ou não.
"As técnicas de decomposição de tensores que desenvolvemos são capazes de capturar padrões diferenciados que identificam com sucesso diferentes categorias de notícias falsas, sem usar nenhum conhecimento externo sobre a validade de qualquer artigo em particular ", disse Papalexakis.
Aproveitando a diversidade de todos os aspectos dos dados, o sistema UCR fornece um resultado mais preciso do que pesquisas publicadas anteriormente neste campo. Em seu jornal, os autores ilustram como eles compilam seu algoritmo, em seguida, publique os resultados de vários experimentos, demonstrando que o algoritmo proposto identificou até 80 por cento das notícias falsas.
A indústria tomou nota. Papalexakis disse que está buscando ativamente colaborações com grandes gigantes da tecnologia.