Crédito CC0:domínio público
Uma equipe de cientistas da computação da Escola de Engenharia USC Viterbi decidiu desenvolver novas ferramentas para automatizar e organizar dados de ciências sociais. O que eles usaram como conjuntos de dados? Postagens no Twitter das capitais costeiras, Nova York e Los Angeles.
Os pesquisadores descobriram que podiam identificar tweets semelhantes que não têm hashtags usando processamento de linguagem natural e redes neurais para criar clusters de tweets semelhantes. "Ele está usando IA para criar um mapa de tweets semelhantes, "diz Mayank Kejriwal, um Professor Assistente de Pesquisa no Departamento de Engenharia Industrial e de Sistemas da USC, e um líder de pesquisa no Instituto de Ciências da Informação da USC, que é um especialista em gráficos de conhecimento.
A nova ferramenta pega os tweets e os converte em um vetor matemático usando uma rede neural, permitindo que você veja se dois pontos são semelhantes um ao outro. Assim, você pode ver grupos de postagens relacionadas. Por exemplo, a IA é capaz de dizer se tweets como "Descansando na praia, pensando na minha vida "e" Hoje é surf, banho de sol e atenção plena "são muito semelhantes, embora quase não tenham palavras em comum.
Ao comparar angelenos com nova-iorquinos, eles encontraram alguns posts de tendências interessantes.
Não. Angelenos não falava sobre o 405 mais do que os nativos de Nova York falavam sobre a LIE. E nenhum dos grupos falou sobre imóveis como um tópico importante.
O maior grupo de tweets em LA? Em torno do tópico 'empregos'.
Freqüentemente, existe a percepção de que LA é vaidosa. Nova York e Nova York estão entre as cinco coisas que os nova-iorquinos tweetam.
Que tal arte? A arte parece dominar a conversa em Los Angeles mais do que em Nova York. Mas divida pela população, e o nova-iorquino médio acaba sendo mais artístico.
Ao contrário da percepção popular, conectados, Angelenos tendia a falar sobre saúde, não bem-estar.
Nova york, a amostra de dados revela, pode na verdade, seja "A cidade que nunca dorme", como dizem os pesquisadores, seus habitantes ganham vida à noite. mas Angelenos, acredite ou não, têm bocas maiores - eles postam mais nas redes sociais. Durante o horário comercial, Angelenos tendem a postar entre 30-60% mais tweets do que os nova-iorquinos. Depois das 20h, não há diferença entre os dois.
Em Los Angeles e Nova York, áreas com maior renda tweetam mais.
O conjunto de dados foi selecionado a partir de outubro de 2016. A pesquisa foi documentada no Journal of Computational Social Science.
"Estudos como este nos permitem entender as nuances da vida cotidiana do século 21. Vivemos em um ultraje, cultura orientada para celebridades hoje que é fácil esquecer que a maioria de nós está apenas focada em fazer o nosso negócio:comer, pendulares, trabalhando, reclamando. Documentamos mais disso nas redes sociais do que imaginamos. Essa tecnologia nos permite ler a história de nossa sociedade - enquanto ela está sendo escrita, bem diante de nossos olhos, "diz Kejriwal.