A tecnologia Nanopore dá um salto do sequenciamento de DNA para a identificação de proteínas
p Crédito:Universidade da Califórnia - San Diego
p Na edição de maio de
PLOS Biologia Computacional , cientistas da UC San Diego e da Universidade de Notre Dame relatam um estudo que pode abrir o campo para a identificação de proteínas baseadas em nanoporos - e, eventualmente, perfis proteômicos de um grande número de proteínas em misturas complexas de diferentes tipos de moléculas. p De acordo com o professor de engenharia e ciência da computação da UC San Diego, Pavel Pevzner, autor sênior no papel, a nova abordagem identifica proteínas analisando os sinais elétricos distintos produzidos quando as moléculas passam por um nanoporo (que atua como uma peneira). Em teoria, disse Pevzner, nanoporos podem permitir aos pesquisadores caracterizar um grande número de proteínas em misturas complexas.
p Embora os nanoporos funcionem extremamente bem na análise de moléculas individuais, eles são menos eficazes ao tentar caracterizar um grande número de proteínas em misturas complexas. Como resultado, a abordagem atualmente preferida para a triagem de misturas complexas envolve o uso de outras técnicas, notavelmente espectrometria de massa. (Pevzner e os professores de ciência da computação Vineet Bafna e Nuno Bandeira são os principais investigadores do Centro de Espectrometria de Massa Computacional da UC San Diego, financiado pelo NIH.)
p Recentemente, em 2016, Os principais desenvolvedores de nanoporos estavam pessimistas sobre a capacidade de aplicar os nanoporos a perfis de proteínas em grande escala no curto prazo. "Não estamos nem perto de fazer isso no momento, "O cofundador da Oxford Nanopore, Hagan Bayley, disse ao GenomeWeb, acrescentando que ele "não diria que é uma meta impossível, mas é um pouco forçado. "
p Pevzner da UC San Diego, Contudo, acredita que um avanço está próximo. "A chave é usar o aprendizado de máquina para analisar as informações geradas pelas proteínas quando elas se translocam através de um nanopore, "disse Pevzner." Ao aplicar técnicas de aprendizado de máquina, fomos capazes de identificar sinais distintos que poderiam levar a análises de proteínas nanoporos em larga escala. "
p Em entrevista ao GenomeWeb, Pevzner diz que, cedo, os obstáculos pareciam intratáveis. "Os dados eram tão barulhentos que quase pensamos que deveríamos desistir, "ele explicou." Trabalho há quase 10 anos com espectrometria de massa de cima para baixo, e em comparação com a identificação de proteínas por espectrometria de massa de cima para baixo, que agora é uma área quase madura, parecia que não havia esperança de que os nanoporos pudessem produzir um sinal comparável. "
p Então, quando os pesquisadores aplicaram uma ferramenta de análise de floresta aleatória de aprendizado de máquina para o problema, tudo mudou. Mikhail Kolmogorov lembrou-se, um estudante de pós-graduação no laboratório de Pevzner:"De repente, a estrutura do sinal surgiu. "
p Conforme declarado no artigo PLOS, os pesquisadores argumentam que "a tecnologia atual já é suficiente para combinar nanospectra com pequenos bancos de dados de proteínas, por exemplo., identificação de proteínas em proteomas bacterianos. "