Um nanoporo e software de reconhecimento de imagem podem sequenciar um glicosaminoglicano sulfatado em tempo real. Crédito:Rensselaer Polytechnic Institute
Usando um nanopore, pesquisadores demonstraram o potencial de reduzir o tempo necessário para o sequenciamento de um glicosaminoglicano - uma classe de moléculas de açúcar ligadas por cadeia longa tão importante para nossa biologia quanto o DNA - de anos para minutos.
Conforme publicado esta semana no Proceedings of the National Academies of Sciences , uma equipe do Rensselaer Polytechnic Institute mostrou que o software de aprendizado de máquina e reconhecimento de imagem pode ser usado para identificar cadeias de açúcar com rapidez e precisão, especificamente, quatro sulfatos de heparana sintéticos - com base nos sinais elétricos gerados à medida que passavam por um minúsculo orifício em uma pastilha de cristal.
"Os glicosaminoglicanos são um repertório complexo de sequências, já que a obra de Shakespeare ou um poema de Yates é uma coleção complexa de cartas. É preciso um especialista para escrevê-los e um especialista para lê-los, "disse Robert Linhardt, pesquisador principal e professor de química e biologia química no Rensselaer Polytechnic Institute. “Treinamos uma máquina para ler rapidamente o equivalente a palavras com quatro letras, como 'ababab' ou 'bcbcbc'. Estas são sequências simples que não têm nenhum significado, mas eles nos mostram que a máquina pode ser ensinada a ler. Se estendermos e desenvolvermos essa tecnologia, tem o potencial de sequenciar os glicanos ou mesmo proteínas em tempo real, eliminando anos de esforço. "
Dispositivos comerciais de sequenciamento de nanopore são usados para sequenciar DNA, que é composto por quatro unidades de ácido nucleico, conhecido pelas letras A, C, G, e T, amarrados em uma variedade infinita de configurações. O dispositivo depende de uma corrente iônica que atravessa um orifício de apenas alguns bilionésimos de metro de largura em uma membrana. Fios de DNA são colocados em um lado do buraco, e arrastado com o fluxo da corrente. Cada ácido nucleico bloqueia o orifício de alguma forma conforme ele passa, interromper a corrente e produzir um sinal particular associado a esse ácido nucleico. Os dispositivos, atualmente usado para trabalho de campo, são apenas uma das várias técnicas relativamente rápidas e automatizadas de sequenciamento de DNA.
Glicosaminoglicanos, ou GAGs, são uma classe estruturalmente complexa de glicanos - os açúcares essenciais presentes nos organismos vivos - encontrados nas superfícies celulares e na matriz extracelular de todos os animais e desempenham muitas funções no crescimento celular e na sinalização, anticoagulação e reparação de feridas, e manter a adesão celular. GAGs, atualmente extraído de animais abatidos, são usados como drogas e nutracêuticos.
Como DNA, Os GAGs podem ser subdivididos em suas unidades de açúcar dissacarídeo constituintes. Mas enquanto o DNA é feito de apenas quatro letras em uma cadeia linear, esses glicanos têm dezenas de unidades básicas, alguns com grupos sulfato ligados, grupos de ácido, e grupos amida. Por exemplo, mesmo uma molécula de sulfato de heparano de ocorrência natural relativamente pequena de seis unidades de açúcar poderia ter 32, 768 sequências possíveis. Por causa do desafio, o sequenciamento de glicano permanece oneroso, contando com trabalho de laboratório meticuloso e análises sofisticadas, envolvendo técnicas com nomes como espectrometria de massa em tandem de cromatografia líquida e espectroscopia de ressonância magnética nuclear.
Como parte de seu trabalho, Linhardt, um especialista em glicanos que desenvolveu uma variante sintética da heparina, um diluidor do sangue comum, sequencia GAGs para compreender formas de ocorrência natural e desenvolver variantes sintéticas.
"Usando métodos analíticos padrão, levamos dois anos para sequenciar o primeiro GAG simples, "disse Linhardt, membro do Centro Rensselaer de Biotecnologia e Estudos Interdisciplinares. "Temos outro em que trabalhamos na maior parte da sequência, e levamos mais de cinco anos - e provavelmente levaremos mais cinco anos para concluí-lo, "
Raciocinar que o sequenciamento de nanopore poderia ser usado para identificar as unidades de dissacarídeo em um GAG, a equipe de pesquisa construiu seu próprio dispositivo nanoporo e sintetizou quatro cadeias de heparan sulfato GAG usando o processo quimioenzimático desenvolvido pelo Laboratório Linhardt. Mais importante, esses quatro sulfatos de heparana eram muito simples - feitos com combinações de apenas quatro tipos diferentes de unidades de açúcar, montados em uma corrente de cerca de 40 unidades de comprimento, e com uma composição e sequência cuidadosamente controladas.
A equipe passou cada sulfato de heparana através do nanopore e produziu um gráfico que descreve a tensão ao longo do tempo de saída do dispositivo. Cada uma das quatro variantes foi executada através do dispositivo mais de 2, 000 vezes, aumentando a probabilidade estatística de uma leitura precisa, dado o design rudimentar do nanoporo experimental.
"O dispositivo sequenciou o sulfato de heparano mais simples em tempo real e produziu um padrão que nossos olhos poderiam reconhecer facilmente de imediato para cada uma das quatro amostras, "Linhardt disse." Você pode dizer imediatamente que eles são diferentes. "
Para garantir uma análise imparcial, a equipe alimentou os resultados em um software gratuito de aprendizado de máquina e reconhecimento de imagem usando a rede neural profunda do Google, treinar o software para distinguir entre os quatro padrões diferentes e identificar cada variante do sulfato de heparano. O modelo de aprendizado de máquina de maior sucesso produziu uma análise quase 97% precisa.
"O conteúdo de informação em uma sequência GAG pode ultrapassar muito o de uma quantidade semelhante de DNA ou RNA, o que significa que a capacidade de ler rapidamente as sequências GAG abre uma nova janela de compreensão da complexa bioquímica da vida ", disse Curt Breneman, reitor da Escola de Ciências Rensselaer. "Este estudo de prova de conceito vincula métodos inovadores de nanodetecção com ferramentas de aprendizado de máquina de última geração, e mostra o poder do pensamento interdisciplinar para expandir as fronteiras do conhecimento. "
Reduzir a velocidade com que os GAGs passam pelo nanopore pode aumentar a precisão, e o dispositivo pode ser treinado em unidades de açúcar adicionais, e sequências mais complexas, todos os quais são objetivos de pesquisas futuras. Linhardt disse que a máquina teria que aprender algo em torno de 10 a 20 unidades de açúcar para sequenciar totalmente um GAG.
"Esta é uma prova de conceito; fizemos com que fossem lidas palavras de duas letras, "Linhardt disse." Uma vez que ensinamos o alfabeto completo, será capaz de ler cada sequência diferente. Será capaz de ler todas as palavras. "