p Crédito:Petr Kratochvil / Domínio Público
p Uma única mudança em um padrão estatístico centenário melhoraria drasticamente a qualidade da pesquisa em muitos campos científicos, diminuindo o número dos chamados falsos positivos, de acordo com um comentário publicado em 1º de setembro em
Nature Human Behavior . p O argumento, co-autoria do economista John List da Universidade de Chicago, representa o consenso de 72 acadêmicos de instituições em todo o mundo e disciplinas que vão da neurobiologia à filosofia. Suas recomendações podem ter um efeito importante na publicação de trabalhos acadêmicos e nas políticas públicas.
p "Anunciamos as intervenções como funcionando porque, estatisticamente, achamos que estão funcionando. Mas, na verdade, não estão funcionando. Isso está se tornando uma crise nas ciências, "disse a Lista, o Kenneth C. Griffin Distinguished Service Professor in Economics.
p List e seus co-autores sugerem que os cientistas precisam redefinir uma referência estatística conhecida como valor p porque os padrões de evidência para alegar novas descobertas em muitos campos são simplesmente muito baixos. A abordagem é prejudicial à credibilidade das afirmações científicas, eles disseram.
p Um padrão de valor p foi adotado no início da década de 1920, quando o estatístico britânico Ronald Fisher propôs um valor abaixo de 0,05 como limite para determinar a validade dos resultados da pesquisa. Se o valor p cair abaixo desse limite - significando que a probabilidade de as conclusões de um estudo serem devido ao acaso aleatório é inferior a 5 por cento - então a pesquisa é geralmente considerada estatisticamente significativa.
p Mas o limite do valor p tornou-se alvo de críticas em resposta a uma percepção de crise de replicação nas comunidades científicas. Os periódicos científicos freqüentemente usam significância estatística - e valores de p - como um teste para selecionar quais artigos publicar. List disse que o limite atual do valor p de 0,05 está permitindo que muitos estudos sejam publicados e influenciem as decisões econômicas e políticas, embora os resultados possam não ser reproduzíveis por outros pesquisadores.
p "Se Ronald Fisher soubesse que quase 100 anos depois, estaríamos usando o padrão 0,05 religiosamente para tomar decisões políticas 'informadas', Eu não acho que ele teria avançado, "List disse.
p
Estudos mais reproduzíveis
p Para ter certeza de que uma descoberta inicial funcionará quando colocada em prática, os resultados devem ser replicáveis. Estudos anteriores mostraram que apenas 24 por cento dos estudos de psicologia com um valor p de 0,05 puderam ser confirmados por outros experimentos, sugerindo que três em cada quatro estudos apresentaram resultados falso-positivos. De forma similar, apenas 44% dos artigos de economia com o mesmo valor p eram reproduzíveis.
p Os autores calcularam que reduzir o limite do valor p para 0,005 praticamente dobraria as taxas de replicação em psicologia e economia, e outros campos veriam resultados semelhantes. "Alterar o limite do valor p é simples, alinha-se com o treinamento realizado por muitos pesquisadores e pode rapidamente alcançar ampla aceitação, "disseram os autores.
p A lista concorda. "Você quer criar um mundo onde haja mais pessoas tentando se replicar, e você quer que a sociedade recompense essas pessoas, "disse ele." E você também quer que mais resultados que vão para a política sejam resultados verdadeiros, para ser replicável. Abaixo de 0,005 mais deles seriam. "
p Para incentivar ainda mais a publicação e replicação de estudos, os autores do artigo propõem que as novas descobertas que atualmente seriam chamadas de "significativas", mas não atendem ao valor de p de 0,005 revisado, deveriam ser chamadas de "sugestivas".
p List e seus coautores têm o cuidado de apontar que uma mudança no valor p não é o único passo para aprimorar a pesquisa científica. "Temos diversos pontos de vista sobre a melhor forma de melhorar a reprodutibilidade, e muitos de nós acreditam que outras maneiras de resumir os dados ... são preferíveis aos valores-p, " eles disseram.