Milhões de trabalhos de pesquisa são publicados em um ano. Como os cientistas se mantêm?
Alessia Iancarelli, estudante de doutorado no laboratório de Ciências Afetivas e do Cérebro do Nordeste. Crédito:Alyssa Stone / Northeastern University
Se você quer ser um cientista, vai ter que ler muito.
A ciência é um empreendimento focado em construir e compartilhar conhecimento. Pesquisadores publicam artigos detalhando suas descobertas, avanços e inovações para compartilhar essas revelações com colegas. E há milhões de artigos científicos a cada ano.
Acompanhar os últimos desenvolvimentos em seu campo é um desafio para pesquisadores em todos os momentos de suas carreiras, mas afeta especialmente os cientistas em início de carreira, pois eles também precisam ler os muitos artigos que representam a base de seu campo.
"É impossível ler tudo. Absolutamente impossível", Ajay Satpute, diretor do Affective and Brain Science Lab e professor assistente de psicologia na Northeastern. "E se você não sabe tudo o que aconteceu no campo, há uma chance real de reinventar a roda de novo e de novo." O desafio, diz ele, é descobrir como treinar economicamente a próxima geração de cientistas, equilibrando a necessidade de ler todos os artigos seminais com treiná-los como pesquisadores por direito próprio.
Essa tarefa está ficando cada vez mais difícil, diz Alessia Iancarelli, estudante de doutorado que estuda psicologia afetiva e social no laboratório de Satpute. "O volume de literatura publicada continua aumentando", diz ela. "Como os cientistas são capazes de desenvolver seus estudos em um campo, dada essa enorme quantidade de literatura?" Eles têm que escolher o que ler.
Mas abordagens comuns para essa priorização, diz Iancarelli, podem incorporar preconceitos e deixar de fora cantos cruciais do campo. Então, Iancarelli, Satpute e colegas desenvolveram uma abordagem de aprendizado de máquina para encontrar uma maneira melhor – e menos tendenciosa – de fazer uma lista de leitura. Seus resultados, que foram publicados na semana passada na revista
PLOS One , também ajudam a reduzir o preconceito de gênero.
"Há realmente um problema sobre como desenvolvemos bolsas de estudo", diz Satpute. No momento, os cientistas costumam usar uma ferramenta de pesquisa como o Google Scholar sobre um tópico e começar a partir daí, diz ele. "Ou, se você tiver sorte, terá um instrutor maravilhoso e terá um ótimo plano de estudos. Mas esse será basicamente o campo pelos olhos dessa pessoa. E acho que isso realmente preenche um nicho que pode ajudar a criar equilíbrio e bolsa de estudos interdisciplinar sem necessariamente ter acesso a um instrutor maravilhoso, porque nem todo mundo consegue isso."
O problema com algo como o Google Scholar, explica Iancarelli, é que ele lhe dará os artigos mais populares em um campo, medido por quantos outros artigos os citaram. Se houver subconjuntos desse campo que não são tão populares, mas ainda são relevantes, os artigos importantes sobre esses tópicos podem ser perdidos com essa pesquisa.
Tomemos, por exemplo, o tema da agressão (que é o assunto em que os pesquisadores se concentraram para desenvolver seu algoritmo). A mídia e os videogames são um tópico particularmente quente na pesquisa sobre agressão, diz Iancarelli, e, portanto, há muito mais artigos sobre esse subconjunto do campo do que sobre outros tópicos, como o papel da testosterona e agressão social.
Assim, Iancarelli decidiu agrupar trabalhos sobre o tema da agressão nas comunidades. Usando a análise da rede de citações, ela identificou 15 comunidades de pesquisa sobre agressão. Em vez de olhar para o número bruto de vezes que um artigo foi citado em outro artigo de pesquisa, o algoritmo determina uma comunidade de artigos que tendem a citar uns aos outros ou o mesmo conjunto principal de artigos. As maiores comunidades reveladas foram mídia e videogames, estresse, traços e agressão, ruminação e agressão deslocada, o papel da testosterona e agressão social. Mas também houve algumas surpresas, como uma comunidade menor de trabalhos de pesquisa focados em agressão e cavalos.
"Se você usar a detecção de comunidade, terá uma visão realmente rica e granular do campo de agressão", diz Satpute. "Você tem uma visão panorâmica de todo o campo, em vez de [parecer que] o campo da agressão é basicamente mídia, videogames e violência".
Além de diversificar os tópicos apresentados usando essa abordagem da comunidade, os pesquisadores também descobriram que o percentual de artigos com primeiras autoras mulheres consideradas influentes pelo algoritmo dobrou em comparação com quando se concentravam apenas na contagem total de citações. (Iancarelli acrescenta que pode haver alguns preconceitos nesse resultado, já que a equipe não pôde perguntar aos autores diretamente sobre sua identidade de gênero e, em vez disso, teve que confiar em suposições baseadas no nome do autor, na foto e em quaisquer pronomes usados para se referir a eles. .)
A equipe lançou o código por trás desse algoritmo para que outros possam usá-lo e replicar sua abordagem de análise de rede de citações em outros campos de pesquisa.
Para Iancarelli, há outra motivação:"Eu adoraria usar este trabalho para criar um plano de estudos e ministrar meu próprio curso sobre agressão humana. Eu realmente adoraria basear o plano de estudos nos trabalhos mais relevantes de cada comunidade diferente para dar uma verdadeira visão do campo de agressão humana."