O novo algoritmo de aprendizado de máquina pode prever idade e sexo apenas a partir do seu perfil do Twitter. Crédito:Shutterstock
Uma nova ferramenta de "inferência demográfica" desenvolvida por acadêmicos pode fazer previsões com base exclusivamente nas informações do perfil de mídia social de uma pessoa (ou seja, nome de tela, biografia, foto de perfil, e nome). A ferramenta - que funciona em 32 idiomas - pode abrir caminho para que as opiniões expressas nas redes sociais sejam levadas em consideração nos métodos de pesquisa populares.
Pesquisadores da Universidade de Oxford, Universidade de Michigan, Universidade de Massachusetts, GESIS - Instituto Leibniz de Ciências Sociais, o Instituto Max Planck, e a Stanford University desenvolveram um método para inferir informações sobre o proprietário de uma conta de mídia social com base nas informações divulgadas em suas informações de perfil do Twitter.
Um novo sistema de aprendizado de máquina - revelado na Web Conference em San Francisco esta semana - aprendeu os padrões associados a diferentes idades, gêneros, e entre organizações e indivíduos a partir de um conjunto de dados de mais de quatro milhões de contas do Twitter em 32 idiomas. Esta informação foi então combinada com os locais estimados e re-ponderada contra os dados do censo para produzir estimativas mais precisas da população em 1, 101 regiões estatísticas em toda a UE.
Isso pode abrir caminho para uma compreensão mais representativa das opiniões das pessoas sobre as principais questões e tópicos sociais, com base no que eles postam nas redes sociais e atribuídos a localizações geográficas e grupos demográficos específicos.
Dr. Scott Hale, Pesquisador Sênior, Oxford Internet Institute, University of Oxford disse:"Apesar de fornecer muitos pontos de dados, A mídia social tem sido uma ferramenta confiável para entender quais questões são mais importantes para uma população mais ampla, considerando como as pessoas se auto-selecionam para usar qualquer plataforma.
"Este primeiro estudo desse tipo realiza previsões demográficas sobre o proprietário de uma conta de mídia social com base puramente nas informações do perfil da conta em 32 idiomas e, em seguida, pondera novamente a amostra online para ser mais semelhante a uma população offline.
"Vemos isso como um passo significativo em direção ao uso da mídia social para obter uma imagem mais precisa sobre as questões e tópicos que mais interessam ao público e entender quais pontos de vista dos grupos estão super ou sub-representados."
Essas informações e dados que sustentam esta pesquisa foram disponibilizados em uma biblioteca de código aberto e você pode testar a ferramenta de inferência em www.euagendas.org/m3demo