• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  •  science >> Ciência >  >> Biologia
    Estudo revela falhas no método genético popular

    Avaliando a precisão do agrupamento de PCA para uma população de teste heterogênea em uma simulação de uma configuração GWAS. (A) A verdadeira distribuição da população de teste Cyan (n = 1000). (B) PCA da população de teste com oito amostras de tamanho par (n = 250) de populações de referência. (C) PCA da população de teste com Azul da análise anterior mostra uma sobreposição mínima entre as coortes. (D) PCA da população de teste com cinco amostras de tamanho par (n = 250) de populações de referência, incluindo Ciano (marcado por uma seta). As cores (B) de cima para baixo e da esquerda para a direita incluem:Amarelo [1,1,0], Vermelho claro [1,0,0,5], Roxo [1,0,1], Roxo escuro [0,5,0,0,5] ], Preto [0,0,0], Verde escuro [0,0.5,0], Verde [0,1,0] e Azul [1,0,0]. Crédito:Relatórios Científicos (2022). DOI:10.1038/s41598-022-14395-4

    O método analítico mais comum dentro da genética de populações é profundamente falho, de acordo com um novo estudo da Universidade de Lund, na Suécia. Isso pode ter levado a resultados incorretos e equívocos sobre etnia e relações genéticas. O método tem sido usado em centenas de milhares de estudos, afetando resultados dentro da genética médica e até mesmo testes de ancestralidade comercial. O estudo é publicado em Relatórios Científicos .
    A taxa na qual os dados científicos podem ser coletados está aumentando exponencialmente, levando a conjuntos de dados maciços e altamente complexos, apelidados de "revolução do Big Data". Para tornar esses dados mais gerenciáveis, os pesquisadores usam métodos estatísticos que visam compactar e simplificar os dados, mantendo a maioria das informações principais. Talvez o método mais utilizado seja o PCA (análise de componentes principais). Por analogia, pense no PCA como um forno com farinha, açúcar e ovos como entrada de dados. O forno pode sempre fazer a mesma coisa, mas o resultado, um bolo, depende criticamente das proporções dos ingredientes e de como eles são combinados.

    "Espera-se que este método dê resultados corretos porque é usado com tanta frequência. Mas não é garantia de confiabilidade nem produz conclusões estatisticamente robustas", diz o Dr. Eran Elhaik, professor associado de biologia celular molecular na Universidade de Lund.

    Segundo Elhaik, o método ajudou a criar antigas percepções sobre raça e etnia. Ela desempenha um papel na fabricação de contos históricos de quem e de onde as pessoas vêm, não apenas pela comunidade científica, mas também por empresas de ascendência comercial. Um exemplo famoso é quando um político americano proeminente fez um teste de ascendência antes da campanha presidencial de 2020 para apoiar suas reivindicações ancestrais. Outro exemplo é a concepção errônea dos judeus asquenazes como uma raça ou um grupo isolado impulsionado pelos resultados da PCA.

    "Este estudo demonstra que esses resultados não eram confiáveis", diz Eran Elhaik.

    O PCA é usado em muitos campos científicos, mas o estudo de Elhaik se concentra em seu uso em genética de populações, onde a explosão nos tamanhos dos conjuntos de dados é particularmente aguda, impulsionada pelos custos reduzidos do sequenciamento de DNA.

    O campo da paleogenômica, onde queremos aprender sobre povos antigos e indivíduos como os europeus da Idade do Cobre, depende fortemente do PCA. O PCA é usado para criar um mapa genético que posiciona a amostra desconhecida ao lado de amostras de referência conhecidas. Até agora, as amostras desconhecidas foram assumidas como relacionadas a qualquer população de referência que elas se sobreponham ou estejam mais próximas no mapa.

    No entanto, Elhaik descobriu que a amostra desconhecida poderia ser feita para ficar perto de praticamente qualquer população de referência apenas alterando os números e tipos das amostras de referência, gerando versões históricas praticamente infinitas, todas matematicamente "corretas", mas apenas uma pode ser biologicamente correta. .

    No estudo, Elhaik examinou as doze aplicações genéticas populacionais mais comuns do PCA. Ele usou dados genéticos simulados e reais para mostrar como os resultados de PCA podem ser flexíveis. Segundo Elhaik, essa flexibilidade significa que as conclusões baseadas em PCA não podem ser confiáveis, pois qualquer alteração na referência ou nas amostras de teste produzirá resultados diferentes.

    Entre 32.000 e 216.000 artigos científicos apenas em genética empregaram PCA para explorar e visualizar semelhanças e diferenças entre indivíduos e populações e basearam suas conclusões nesses resultados.

    "Acredito que esses resultados devem ser reavaliados", diz Elhaik.

    Ele espera que o novo estudo desenvolva uma abordagem melhor para questionar os resultados e, assim, ajudar a tornar a ciência mais confiável. Ele passou uma parte significativa da década passada sendo pioneiro em tais métodos, como a estrutura populacional geográfica (GPS), para prever a biogeografia a partir de DNA, e o Pairwise Matcher, que melhora as correspondências caso-controle usadas em testes genéticos e testes de drogas.

    "Técnicas que oferecem tal flexibilidade incentivam a ciência ruim e são particularmente perigosas em um mundo onde há intensa pressão para publicar. Se um pesquisador executa PCA várias vezes, a tentação será sempre selecionar a saída que produz a melhor história", acrescenta o Prof. • William Amos, da Universidade de Cambridge, que não participou do estudo. + Explorar mais

    Pesquisadores desenvolvem o primeiro método baseado em IA para datar vestígios arqueológicos




    © Ciência https://pt.scienceaq.com