Esta crítica sobre o restaurante foi escrita por uma máquina ou uma pessoa? Não tão fácil, é isso? Crédito:Aalto University
Os pesquisadores descobriram que as avaliações e comentários gerados pela IA representam uma ameaça significativa para os consumidores, mas o aprendizado de máquina pode ajudar a detectar as falsificações.
Sites como o TripAdvisor, O Yelp e a Amazon exibem avaliações de usuários de produtos e serviços. Os consumidores prestem atenção:nove em cada dez pessoas lêem essas avaliações por pares e confiam no que veem. Na verdade, até 40 por cento dos usuários decidem fazer uma compra com base em apenas alguns comentários, e ótimas avaliações fazem as pessoas gastarem 30% mais em suas compras.
No entanto, nem todas as avaliações são legítimas. Resenhas falsas escritas por pessoas reais já são comuns em sites de resenhas, mas a quantidade de falsificações geradas por máquinas provavelmente aumentará substancialmente.
De acordo com a estudante de doutorado Mika Juuti da Aalto University, revisões falsas baseadas em algoritmos são fáceis hoje em dia, preciso e rápido de gerar. A maior parte do tempo, as pessoas são incapazes de distinguir entre avaliações falsas genuínas e avaliações falsas geradas por máquina.
"As empresas que se comportam mal podem tentar aumentar suas vendas criando uma imagem de marca positiva artificialmente ou gerando comentários negativos falsos sobre um concorrente. A motivação é, claro, dinheiro:comentários online são um grande negócio para destinos turísticos, hotéis, prestadores de serviços e produtos de consumo, "diz Mika Juuti.
Em 2017, pesquisadores da Universidade de Chicago descreveram um método para treinar um modelo de aprendizado de máquina, uma rede neural profunda, usando um conjunto de dados de três milhões de avaliações reais de restaurantes no Yelp. Após o treinamento, o modelo gerava críticas falsas sobre restaurantes personagem por personagem.
Houve um ligeiro soluço no método, Contudo; foi difícil permanecer no tópico. Para uma resenha de um restaurante japonês em Las Vegas, a modelo poderia fazer referências a um restaurante italiano em Baltimore. Esses tipos de erros são, claro, facilmente detectado pelos leitores.
Para ajudar o gerador de avaliações a se manter atualizado, Juuti e sua equipe usaram uma técnica chamada tradução automática neural para dar ao modelo um senso de contexto. Usando uma sequência de texto de "avaliação de avaliação, nome do restaurante, cidade, Estado, e etiquetas de comida, "começaram a obter resultados verossímeis.
"No estudo de usuário que conduzimos, mostramos aos participantes análises reais escritas por humanos e análises falsas geradas por máquina e pedimos que identificassem as falsificações. Até 60 por cento das avaliações falsas foram consideradas por engano como reais, "diz Juuti.
Juuti e seus colegas criaram um classificador que seria capaz de detectar as falsificações. O classificador acabou tendo um bom desempenho, particularmente nos casos em que os avaliadores humanos tiveram mais dificuldade em dizer se uma revisão é real ou não.
O estudo foi conduzido em colaboração com o grupo de pesquisa de Sistemas Seguros da Aalto University e pesquisadores da Waseda University no Japão. Ele foi apresentado no Simpósio Europeu de Pesquisa em Segurança Informática 2018 em setembro.