Crédito CC0:domínio público
A sequência de DNA de cada pessoa é única. Mas para aqueles que desejam manter sua privacidade genética, pode não ser único o suficiente.
Um novo estudo argumenta que mais da metade dos americanos poderiam ser identificados pelo nome se tudo que você tivesse para começar fosse uma amostra de seu DNA e alguns fatos básicos, como onde eles moram e quantos anos eles podem ter.
Não seria simples, e não seria barato. Mas o fato de que se tornou factível forçará todos nós a repensar o significado da privacidade na era do DNA, especialistas disseram.
Há pouco tempo a perder. Os pesquisadores por trás do novo estudo dizem que, uma vez que 3 milhões de americanos carreguem seus genomas em sites públicos de genealogia, quase todos nos EUA seriam identificáveis apenas por seu DNA e apenas por algumas pistas adicionais.
Mais de 1 milhão de americanos já publicaram suas informações genéticas, e dezenas de outros fazem isso todos os dias.
"As pessoas estão se perguntando quanto tempo levará antes que você possa usar o DNA para detectar qualquer pessoa, "disse Ruth Dickover, diretor do programa de ciência forense da Universidade da Califórnia, Davis, que não participou do estudo. "Os autores estão dizendo que não vai demorar tanto."
Esta nova realidade representa a convergência de duas tendências de longa data.
Um deles é o aumento dos testes genéticos diretos ao consumidor. Empresas como Ancestry.com e 23andMe podem sequenciar o DNA de qualquer pessoa por cerca de US $ 100. Tudo o que você precisa fazer é fornecer uma amostra de saliva e colocá-la no correio.
O outro elemento essencial é a proliferação de bancos de dados de genealogia pesquisáveis publicamente, como o GEDmatch. Qualquer pessoa pode carregar um genoma completo para esses sites e computadores poderosos irão analisá-lo, procurando trechos de sequências de DNA correspondentes que possam ser usados para construir uma árvore genealógica.
Para testar o poder de crescimento desses sites, pesquisadores liderados pelo cientista da computação Yaniv Erlich da Universidade de Columbia decidiram ver se conseguiam encontrar o nome de uma pessoa - e, portanto, sua identidade - se tudo o que eles tivessem fosse um pedaço de seu DNA e uma pequena quantidade de informações biográficas.
Eles começaram com uma sequência completa de DNA de uma pessoa cujas informações genéticas foram publicadas anonimamente como parte de um estudo científico não relacionado. (Eles realmente identificaram esta mulher em um estudo anterior, mas para os fins deste trabalho, eles fingiram que não sabiam quem ela era.)
Erlich e seus colaboradores carregaram o código genético dela no GEDmatch e fizeram uma pesquisa para ver se ela tinha algum parente no site. Eles encontraram dois:um em Dakota do Norte e um em Wyoming.
Os pesquisadores perceberam que todos estavam relacionados porque compartilhavam uma série de polimorfismos de nucleotídeo único, ou SNPs. Estas são letras únicas em pontos específicos entre os cerca de 3 bilhões de A's, Cs, Ts e Gs que constituem o genoma humano.
Quanto mais SNPs as pessoas compartilham, quanto mais intimamente relacionados eles são.
Ao comparar o DNA de todos os três parentes, A equipe de Erlich conseguiu encontrar um casal ancestral comum que era os bisavós da mulher de Utah.
Próximo, os pesquisadores vasculharam sites genealógicos e outras fontes em busca de descendentes adicionais daquele casal de muito tempo atrás. Eles encontraram 10 filhos e centenas de netos e bisnetos.
Então eles começaram a selecionar sua enorme lista de descendentes. Eles eliminaram todos os homens da amostra, depois, aqueles que não estavam vivos quando o DNA da mulher de Utah foi sequenciado. Os autores também sabiam que seu sujeito era casado e quantos filhos ela tinha, o que os ajudou a se concentrar em seu objetivo.
Depois de um longo dia de trabalho árduo, os pesquisadores foram capazes de nomear corretamente o proprietário da amostra de DNA.
Os autores disseram que o mesmo processo funcionaria para cerca de 60 por cento dos americanos descendentes de europeus, quem são as pessoas com maior probabilidade de usar sites genealógicos, Erlich disse. Embora as chances de sucesso sejam menores para pessoas de outras origens, ainda seria esperado que funcionasse para mais da metade de todos os americanos, eles disseram.
Para chegar a esta conclusão, os pesquisadores analisaram um banco de dados diferente consistindo de 1,28 milhão de indivíduos anônimos que tiveram seu DNA sequenciado por MyHeritage, uma empresa de testes de DNA e história da família da qual Erlich é o diretor de ciências.
Se você pode encontrar o terceiro primo de uma pessoa em um banco de dados genealógico, então você deve ser capaz de identificar a pessoa com uma quantidade razoável de investigação, Erlich disse. Assim, a equipe verificou quantos parentes na ordem de um primo em terceiro grau ou mais próximo eles poderiam encontrar para cada indivíduo em seu conjunto de dados.
Eles encontraram muitos:60 por cento dos 1,28 milhão de pessoas foram pareados com um parente que era pelo menos tão próximo quanto um primo de terceiro grau, e 15% tinham um parente que era pelo menos tão próximo quanto um primo de segundo grau.
Os resultados foram publicados quinta-feira no jornal Ciência .
Até aqui, Joseph James DeAngelo, de 72 anos, é a pessoa mais famosa identificada dessa forma. Você pode conhecê-lo melhor como o suspeito do Golden State Killer, acusado de 13 acusações de homicídio e 13 acusações de tentativa de sequestro.
Quando os policiais usaram um banco de dados de DNA acessível ao público para capturar DeAngelo em abril, foi apenas a segunda vez na história da solução de crimes que a estratégia foi implementada com sucesso.
Desde então, pelo menos 13 suspeitos de crimes adicionais foram identificados da mesma forma.
"A resolução do caso Golden State Killer abriu este método como uma possibilidade e outros laboratórios criminais estão tirando vantagem disso, "Dickover disse." Claramente uma tendência começou. "
Os cidadãos privados também estão se beneficiando da tecnologia. Os adotados encontraram pais e irmãos biológicos, e outros encontraram primos distantes que podem lançar uma nova luz sobre as origens e herança de uma família.
Mas, à medida que mais de nós carregamos DNA para bancos de dados pesquisáveis publicamente, as implicações podem ser assustadoras.
"Quando a polícia prendeu o Golden State Killer, aquele foi um dia muito bom para a humanidade, "Erlich disse." O problema é que a mesma estratégia pode ser mal utilizada. "
Pense em governos estrangeiros usando essa técnica para rastrear cidadãos americanos, ele disse. Ou manifestantes e ativistas sendo perseguidos dessa forma.
Erlich e seus co-autores propuseram uma estratégia de mitigação que tornaria mais difícil carregar uma sequência de DNA desconhecida em um banco de dados genealógico e procurar uma correspondência.
Eles sugerem que as empresas de teste de DNA direto ao consumidor coloquem um código especial nos arquivos de dados brutos que enviam aos clientes. Os sites de genealogia poderiam então concordar em permitir que as pessoas carreguem sequências de DNA apenas se tiverem um código válido. Isso garantiria que as pessoas pudessem realizar pesquisas relacionadas apenas ao seu próprio DNA.
Um sistema como este não impediria a aplicação da lei de usar bancos de dados genealógicos para pesquisar suspeitos, Erlich disse.
O objetivo final é permitir que as pessoas usem seu DNA para descobrir mais sobre suas próprias famílias sem sacrificar sua privacidade, Erlich disse.
Só este ano, seu primo adotivo encontrou uma irmã biológica que vive do outro lado do mundo, ele disse.
"É por isso que temos essa técnica, " ele disse.
© 2018 Los Angeles Times
Distribuído pela Tribune Content Agency, LLC.