Para identificar notícias falsas, A nova ferramenta de aprendizado de máquina do Fraunhofer FKIE analisa texto e metadados. Crédito:Fraunhofer FKIE
Histórias inventadas, fatos distorcidos:notícias falsas estão se espalhando como um incêndio na internet e muitas vezes são compartilhadas sem pensar, particularmente nas redes sociais. Em resposta, Os pesquisadores da Fraunhofer desenvolveram um sistema que analisa automaticamente as postagens nas redes sociais, filtrar deliberadamente notícias falsas e desinformação. Para fazer isso, a ferramenta analisa conteúdo e metadados, classificando-o usando técnicas de aprendizado de máquina e aproveitando a interação do usuário para otimizar os resultados à medida que avança.
Notícias falsas são projetadas para provocar uma resposta específica ou incitar agitação contra um indivíduo ou grupo de pessoas. Seu objetivo é influenciar e manipular a opinião pública em tópicos específicos do dia. Essas notícias falsas podem se espalhar como um incêndio pela Internet, particularmente nas redes sociais como Facebook ou Twitter. O que é mais, identificá-lo pode ser uma tarefa complicada. É aí que uma ferramenta de classificação desenvolvida pelo Fraunhofer Institute for Communication, Processamento de Informação e Ergonomia A FKIE entra, analisando automaticamente postagens de mídia social e processando grandes quantidades de dados.
Além de processar texto, a ferramenta também fatora metadados em sua análise e apresenta suas descobertas de forma visual. "Nosso software se concentra no Twitter e em outros sites. Os tweets são onde você encontra os links que apontam para as páginas da web que contêm notícias falsas. Em outras palavras, a mídia social atua como um gatilho, se você gostar. Os itens de notícias falsas geralmente são hospedados em sites projetados para imitar a presença de agências de notícias na web e podem ser difíceis de distinguir dos sites originais. Em muitos casos, eles serão baseados em notícias oficiais, mas em que o texto foi alterado, "explica o Prof. Ulrich Schade da Fraunhofer FKIE, cujo grupo de pesquisa desenvolveu a ferramenta.
Schade e sua equipe começam o processo construindo bibliotecas compostas por notícias sérias e também textos que os usuários identificaram como notícias falsas. Estes, então, formam os conjuntos de aprendizagem usados para treinar o sistema. Para filtrar notícias falsas, os pesquisadores empregam técnicas de aprendizado de máquina que buscam automaticamente marcadores específicos em textos e metadados. Por exemplo, em um contexto político, podem ser formulações ou combinações de palavras que raramente ocorrem na linguagem cotidiana ou em reportagens jornalísticas, como "o atual chanceler da Alemanha". Erros linguísticos também são uma bandeira vermelha. Isso é particularmente comum quando o autor da notícia falsa está escrevendo em um idioma diferente de sua língua nativa. Em tais casos, pontuação incorreta, ortografia, as formas verbais ou a estrutura da frase são todos avisos de um item de notícias falso em potencial. Outros indicadores podem incluir expressões fora do lugar ou formulações complicadas.
"Quando fornecemos ao sistema uma série de marcadores, a ferramenta aprenderá a selecionar os marcadores que funcionam. Outro fator decisivo é escolher a abordagem de aprendizado de máquina que fornecerá os melhores resultados. É um processo muito demorado, porque você tem que executar os vários algoritmos com diferentes combinações de marcadores, "diz Schade.
Metadados fornecem pistas vitais
Os metadados também são usados como um marcador. De fato, ele desempenha um papel crucial na diferenciação entre fontes autênticas de informação e notícias falsas:por exemplo, com que frequência as postagens estão sendo emitidas, quando é agendado um tweet, e em que horas? O momento de uma postagem pode ser muito revelador. Por exemplo, pode revelar o país e o fuso horário da origem das notícias. Uma alta frequência de envio sugere bots, o que aumenta a probabilidade de uma notícia falsa. Os bots sociais enviam seus links para um grande número de usuários, por exemplo, para espalhar a incerteza entre o público. As conexões e seguidores de uma conta também podem ser um terreno fértil para analistas.
Isso porque permite que os pesquisadores construam mapas de calor e gráficos de envio de dados, enviar redes de frequência e seguidores. Essas estruturas de rede e seus nós individuais podem ser usados para calcular qual nó da rede circulou uma notícia falsa ou iniciou uma campanha de notícias falsas.
Outro recurso da ferramenta automatizada é a capacidade de detectar incitação ao ódio. Postagens que posam como notícias, mas também incluem incitação ao ódio, geralmente levam a notícias falsas. “O importante é desenvolver um marcador capaz de identificar casos claros de discurso de ódio. Os exemplos incluem expressões como 'escória política' ou 'negro', "diz o linguista e matemático.
Os pesquisadores são capazes de adaptar seu sistema a vários tipos de texto para classificá-los. Tanto órgãos públicos quanto empresas podem usar a ferramenta para identificar e combater notícias falsas. “Nosso software pode ser personalizado e treinado para atender às necessidades de qualquer cliente. Para órgãos públicos, pode ser um sistema de alerta precoce útil, "diz Schade.