Crédito CC0:domínio público
É possível extrair comentários "jornalísticos" em oposição a comentários "gerais" das redes sociais? Escrevendo no International Journal of Grid and Utility Computing, uma equipe de Portugal descreve uma abordagem para a extração humana e automática de atualizações e relatórios que podem ser descritos como provenientes de jornalistas cidadãos. Seu algoritmo é treinado em conjuntos de dados anotados automaticamente e anotados por humanos e mostra que a abordagem totalmente automatizada se concentra em dados "verdadeiros" com muito mais eficiência e eficácia do que quando os dados tiveram o toque humano.
Nuno Guimarães, Filipe Miranda, e Álvaro Figueira, da Universidade do Porto, explicam como as redes sociais e as redes sociais têm proporcionado os meios para uma conectividade constante e uma disseminação rápida de informação. Testemunhas de eventos e acontecimentos em todo o mundo podem compartilhar informações e percepções em tempo real de um evento esportivo ou outro entretenimento, da cena de um desastre, crime, ou outro acontecimento, de uma forma que é impossível para os membros da mídia convencional, a menos que eles próprios estejam no local. Além disso, jornalistas cidadãos podem adicionar uma perspectiva pessoal que é excluída da investigação independente de jornalistas.
O algoritmo automatizado constrói uma confiança interna que não é possível quando humano, subjetivo, a classificação é realizada. Depois de um número suficiente de pontos de dados de treinamento, o sistema pode discernir inequivocamente quais atualizações são baseadas em crenças pessoais e quais são verdadeiras.