p Crédito:Shutterstock
p O Facebook anunciou recentemente restrições drásticas de acesso a dados em seu aplicativo e site. A empresa enquadrou o bloqueio como uma tentativa de proteger as informações do usuário, em resposta ao clamor público após o escândalo Cambridge Analytica. p Mas a decisão está de acordo com as crescentes restrições impostas aos pesquisadores que estudam o Facebook e seu aplicativo de compartilhamento de fotos Instagram, que também começou imediatamente a restringir o acesso aos seus dados em 4 de abril.
p Na verdade, várias limitações foram postas em prática em fevereiro deste ano, antes do fiasco de Cambridge Analytica - no qual os dados foram supostamente coletados de 50 milhões de perfis do Facebook - estourou publicamente. API do Facebook, versão 2.5, estava programado para ser aposentado este mês, por - entre outras coisas - impedir o acesso ao ID de usuários que participam de fóruns públicos.
p As redes sociais oferecem dois pontos de entrada principais para a coleta de dados:funcionam como interfaces para usuários e interfaces de software destinadas ao consumo por programas de computador, conhecido como Application Programming Interfaces (APIs).
p Embora as APIs sejam destinadas a programadores que criam aplicativos que contribuem para o crescente ecossistema de serviços oferecidos por redes sociais, os pesquisadores também aproveitaram essas interfaces para estudar o comportamento social online.
p Dado o tamanho gigantesco da base de usuários do Facebook (2,13 bilhões na última contagem), o escrutínio externo do conteúdo na rede social é extremamente importante. Nos últimos anos, Contudo, pesquisadores têm travado uma batalha difícil com a empresa para fornecer acesso aos dados. Agora, sua última decisão tornou virtualmente impossível realizar pesquisas em grande escala no Facebook.
p As mudanças tornam software e bibliotecas extintos dedicados à pesquisa acadêmica no Facebook, incluindo netvizz, NodeXL, SocialMediaLab, fb_scrape_public e Rfacebook, todos os quais dependiam das APIs do Facebook para coletar dados.
p A pesquisa sistemática sobre o conteúdo do Facebook agora é insustentável, tornando o que já era preocupantemente opaco, rede social isolada em uma caixa preta que é indiscutivelmente ainda menos responsável perante os legisladores e o público - ambos os quais se beneficiaram com os acadêmicos que monitoraram os desenvolvimentos no site.
p Deen Freelon, o desenvolvedor de fb_scrape_public que analisa grandes, conjuntos de dados disponíveis publicamente no Facebook, nos disse por e-mail que "a decisão de restringir o acesso à API de páginas pode prejudicar gravemente a pesquisa do Facebook baseada em conteúdo, dependendo de como o Facebook está disposto a aprovar o acesso. Se não aprovar o acesso para a maioria dos propósitos de pesquisa, que poderia criar incentivos para os pesquisadores vasculharem o Facebook diretamente, o que viola seus termos de serviço. "A extração ou coleta de dados é um método pelo qual um programa de computador extrai informações de páginas da web.
p Bernhard Rieder, um professor associado da Universidade de Amsterdã que desenvolveu o netvizz - ferramenta que extrai dados do Facebook para fins de pesquisa - acredita que a mudança foi consequência do nível de acesso irrestrito concedido a qualquer pessoa até 2015 e que “há uma possibilidade real de que esses os serviços serão cada vez mais inescrutáveis e inobserváveis ”.
p Até três anos atrás, O Facebook permitiu que aplicativos de terceiros tivessem acesso a dados sobre amigos de usuários de aplicativos. Foi esta função que foi usada por Aleksandr Kogan, pesquisador da Universidade de Cambridge.
p Kogan - por meio de sua startup Global Science Research, que foi separado de seu trabalho acadêmico - supostamente coletou informações de perfil de 270, 000 usuários do Facebook e dezenas de milhões de seus amigos usando um aplicativo de teste de personalidade chamado "thisisyourdigitallife". Alega-se que Cambridge Analytica usou esses dados em uma tentativa de direcionar campanhas políticas, incluindo a eleição presidencial de 2016 nos EUA.
p Marc Smith, que liderou a equipe da Microsoft que criou o NodeXL, que analisa dados de redes sociais, nos disse que havia uma oportunidade de repensar as redes sociais que as pessoas optam por usar à luz do escândalo de dados.
p
Por que as APIs são importantes
p As APIs permitem que os pesquisadores recuperem dados em grande escala e organizem bancos de dados associados a eventos significativos. Sem eles, interfaces da web precisam ser raspadas para acessar os dados, que exige muito trabalho e limita drasticamente a quantidade de informações que podem ser coletadas e processadas.
p Bloquear os pesquisadores fora das APIs os restringe a meios intensivos de coleta de dados que não podem produzir amostras representativas de eventos do mundo real, como movimentos sociais, eleições e campanhas de desinformação.
p O Twitter opera três bem documentados, APIs públicas, além de suas ofertas premium e empresariais. A acessibilidade relativa do Twitter o leva a ser amplamente super-representado nas pesquisas de mídia social. Mas APIs públicas e abertas são uma exceção no ecossistema de mídia social. API de feed público do Facebook, por exemplo, é restrito a um conjunto limitado de editores de mídia.
p
Bloqueio de dados
p O bloqueio da API do Facebook aumentará a lacuna entre os pesquisadores da indústria contratados por redes sociais e os pesquisadores que trabalham fora das corporações. É uma divisão caracterizada como a lacuna entre "pesquisadores ricos em big data", who have access to proprietary data and might be working only in the interests of the company they are affiliated with, and the "big data poor" or the broad universe of academic researchers.
p Facebook's decision dramatically expands this pool of "big data poor". It limits research to projects sponsored by the network and potentially jeopardises research that is critical of Facebook.
p Shortly after the decision to drastically limit API access, Facebook vowed to help researchers gain access to social media data of public interest, starting with elections. The announcement was met with a mix of celebration and subdued support from researchers.
p Luca Rossi, who is associate professor at the IT University of Copenhagen, cautioned that the "data sharing model proposed by Facebook is deeply problematic and it will probably reinforce existing differences in terms of data access". The restriction is likely to continue the trend of researchers doing research they are able to as opposed to research they deem important.
p
p
p
p The impact on data science education is also considerable. If researchers are unable to access data from social networks, they will be unable to train students in data science, social science, computer sciences and digital humanities on methods of data collection and analysis that are rigorous, critical and ethical.
p Facebook's decision to render the API useless for meaningful research is a regrettable departure for collaboration between the social network giant and academics and it's already having an impact.
p The Events API, which researchers relied on to retrieve information about public events such as demonstrations, no longer permits access to users or posts on the event wall.
p Facebook's Groups API and Pages API were the endpoints researchers queried to study public discussions on Facebook, but the recent policy shift seals off those online conversations by restricting access to posts, comments or members participating in a public page or group.
p The changes made to Instagram's API are even more radical, with Facebook deciding to deprecate the API – a technical term for killing data access altogether.
p
Nasty side effect
p Facebook's decision to restrict researchers is ironic because academics have long discussed the problems that led to the Cambridge Analytica scandal. Rieder wrote about the risks of Facebook API's wide open data door back in 2013.
p He cautioned against how much data a third-party app could get from Facebook. Facebook, Contudo, ignored those concerns until 2015, when management and policies regulating the sharing of Facebook data took a sharp turn and became increasingly more restrictive for researchers.
p Desde então, Facebook has become increasingly more cautious about external scrutiny. In the wake of the Cambridge Analytica scandal, Facebook CEO Mark Zuckerberg told Wired that the feedback it received was that "having the data locked down is more important to people than having different kinds of experiences".
p The public uproar clearly underscores how users' data was poorly handled, but a lockdown is hardly the solution to a problem rooted in the weaponisation of social networks, where people use Facebook, Twitter and so on to spread disinformation.
p The Cambridge Analytica scandal has created a worrying side effect:restricting access to data is likely to facilitate further weaponisation, by turning Facebook into a de facto black box that is largely unaccountable to external oversight. p Este artigo foi publicado originalmente em The Conversation. Leia o artigo original.