• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • O algoritmo do detector de notícias falsas funciona melhor do que um humano

    Crédito CC0:domínio público

    Um sistema baseado em algoritmo que identifica pistas lingüísticas reveladoras em notícias falsas poderia fornecer agregadores de notícias e sites de mídia social como o Google News com uma nova arma na luta contra a desinformação.

    Os pesquisadores da Universidade de Michigan que desenvolveram o sistema demonstraram que ele é comparável e às vezes melhor do que os humanos na identificação correta de notícias falsas.

    Em um estudo recente, encontrou falsificações com sucesso até 76 por cento das vezes, em comparação com uma taxa de sucesso humano de 70%. Além disso, sua abordagem de análise linguística poderia ser usada para identificar artigos de notícias falsos que são muito novos para serem desmascarados por referências cruzadas de seus fatos com outras histórias.

    Rada Mihalcea, o professor de ciência da computação e engenharia da U-M por trás do projeto, disse que uma solução automatizada pode ser uma ferramenta importante para sites que estão lutando para lidar com um ataque de notícias falsas, frequentemente criado para gerar cliques ou manipular a opinião pública.

    Capturar histórias falsas antes que elas tenham consequências reais pode ser difícil, como agregadores e sites de mídia social, hoje dependem fortemente de editores humanos que muitas vezes não conseguem acompanhar o fluxo de notícias. Além disso, técnicas de desmascaramento atuais muitas vezes dependem de verificação externa de fatos, o que pode ser difícil com as histórias mais recentes. Muitas vezes, no momento em que uma história é comprovada como falsa, O dano já foi feito.

    A análise linguística tem uma abordagem diferente, analisar atributos quantificáveis, como estrutura gramatical, escolha de palavras, pontuação e complexidade. Ele funciona mais rápido do que os humanos e pode ser usado com uma variedade de tipos de notícias diferentes.

    "Você pode imaginar qualquer número de aplicativos para isso na frente ou no final de um site de notícias ou mídia social, "Mihalcea disse." Ele pode fornecer aos usuários uma estimativa da confiabilidade de histórias individuais ou de um site de notícias inteiro. Ou pode ser uma primeira linha de defesa no back-end de um site de notícias, sinalizando histórias suspeitas para análise posterior. Uma taxa de sucesso de 76 por cento deixa uma margem de erro bastante grande, mas ainda pode fornecer informações valiosas quando usado junto com humanos. "

    Algoritmos linguísticos que analisam a fala escrita são bastante comuns hoje, Disse Mihalcea. O desafio de construir um detector de notícias falsas não está na construção do algoritmo em si, mas em encontrar os dados certos com os quais treinar esse algoritmo.

    Notícias falsas aparecem e desaparecem rapidamente, o que torna difícil coletar. Também vem em muitos gêneros, complicando ainda mais o processo de coleta. Notícias satíricas, por exemplo, é fácil de coletar, mas seu uso de ironia e absurdo o torna menos útil para treinar um algoritmo para detectar notícias falsas destinadas a enganar.

    Em última análise, A equipe de Mihalcea criou seus próprios dados, crowdsourcing uma equipe online que fez a engenharia reversa de notícias genuínas verificadas em falsificações. É assim que a maioria das notícias falsas reais é criada, Mihalcea disse, por indivíduos que os escrevem rapidamente em troca de uma recompensa monetária.

    Participantes do estudo, recrutado com a ajuda da Amazon Mechanical Turk, foram pagos para ficarem vendidos, notícias reais em itens semelhantes, mas falsos, imitando o estilo jornalístico dos artigos. No final do processo, a equipe de pesquisa tinha um conjunto de dados de 500 notícias reais e falsas.

    Eles então alimentaram esses pares rotulados de histórias para um algoritmo que realizou uma análise linguística, ensinando-se a distinguir entre notícias reais e falsas. Finalmente, a equipe transformou os algoritmos em um conjunto de dados de notícias reais e falsas extraídas diretamente da web, alcançando a taxa de sucesso de 76%.

    Os detalhes do novo sistema e o conjunto de dados que a equipe usou para construí-lo estão disponíveis gratuitamente, e Mihalcea diz que eles podem ser usados ​​por sites de notícias ou outras entidades para construir seus próprios sistemas de detecção de notícias falsas. Ela diz que os sistemas futuros poderiam ser aprimorados pela incorporação de metadados, como links e comentários associados a um determinado item de notícias online.

    Um artigo detalhando o sistema será apresentado em 24 de agosto na 27ª Conferência Internacional de Lingüística Computacional em Santa Fé, N.M. Mihalcea trabalhou com a ciência da computação da U-M e a cientista pesquisadora assistente de engenharia Veronica Perez-Rosas, o pesquisador de psicologia Bennett Kleinberg da Universidade de Amsterdã e a estudante de graduação da U-M Alexandra Lefevre.

    O título do artigo é "Detecção automática de notícias falsas".


    © Ciência https://pt.scienceaq.com