Armazenamento de informações no DNA:melhorando o armazenamento de DNA com poços de eletrodos em nanoescala
O armazenamento de dados de DNA requer maior rendimento de síntese do que é possível com as técnicas atuais. (A a D) Visão geral do pipeline de armazenamento de dados de DNA. (A) Os dados digitais são codificados a partir de sua representação binária em sequências de bases de DNA, com um identificador que os correlaciona com um objeto de dados, endereçando informações que são usadas para reordenar os dados na leitura e informações redundantes que são usadas para correção de erros. (B) Essas sequências são sintetizadas em oligonucleotídeos de DNA e armazenadas. (C) No momento da recuperação, as moléculas de DNA são selecionadas e copiadas via PCR ou outros métodos e sequenciadas de volta em representações eletrônicas das bases nessas sequências. (D) O processo de decodificação pega esse conjunto ruidoso e às vezes incompleto de leituras de sequenciamento, corrige erros e sequências ausentes e decodifica as informações para recuperar os dados. (E) Resumo dos processos de síntese comercial e correspondentes densidades de oligonucleotídeos estimadas, conforme relatado na literatura ou pelas próprias empresas. A densidade do nosso método eletroquímico é destacada em vermelho escuro. Crédito:Avanços Científicos , 10.1126/sciadv.abi6714
Os geneticistas podem armazenar dados em DNA sintético como meio de armazenamento de longo prazo devido à sua densidade, facilidade de cópia, longevidade e sustentabilidade. A pesquisa na área avançou recentemente com novos algoritmos de codificação, automação, preservação e sequenciamento. No entanto, o obstáculo mais desafiador na implantação do armazenamento de DNA continua sendo a taxa de transferência de gravação, que pode limitar a capacidade de armazenamento de dados. Em um novo relatório, Bichlien H. Nguyen e uma equipe de cientistas da Microsoft Research e ciência da computação e engenharia da Universidade de Washington, Seattle, EUA, desenvolveram o primeiro gravador de armazenamento de DNA em nanoescala. A equipe pretendia dimensionar a densidade de gravação de DNA para 25 x 10
6
sequências por centímetro quadrado, uma capacidade de armazenamento melhorada em comparação com as matrizes de síntese de DNA existentes. Os cientistas escreveram e decodificaram com sucesso uma mensagem no DNA para estabelecer um sistema prático de armazenamento de dados de DNA. Os resultados agora são publicados em Avanços da ciência . Arquivos de DNA de longo prazo
O ritmo atual de geração de dados excede as capacidades de armazenamento existentes, o DNA é uma solução promissora para este problema em uma densidade prática esperada de mais de 60 petabytes por centímetro cúbico. O material é durável sob uma série de condições, relevante e fácil de copiar, com a promessa de ser mais sustentável ou mais verde do que a mídia comercial. Durante o processo, os dados digitais na forma de sequências de bits podem ser codificados em sequências das quatro bases naturais do DNA – guanina, adenina, tiamina e citosina, embora bases adicionais também sejam possíveis. A equipe pode escrever as sequências em forma molecular por meio da síntese de novo de oligonucleotídeos de DNA para criar moléculas específicas com base em um conjunto de etapas químicas repetidas. Os oligonucleotídeos resultantes podem ser preservados e armazenados após a síntese. Para acessar os dados, o armazenamento de DNA pode ser amplificado usando reações em cadeia da polimerase e sequenciado para retornar as sequências de bases de DNA ao domínio digital, então as sequências de bases de DNA podem ser decodificadas para recuperar a sequência original de bits.
Visão geral da matriz de 650 nm com inclinação de 2 μm. (A) A análise de elementos finitos da geração e difusão de ácido anódico em um eletrodo de 650 nm de diâmetro com um poço de 200 nm é representada com uma vista em seção transversal ao longo do plano y =x e (B) vista de cima para baixo no z =0 plano. As cores azul e amarelo representam regiões com concentrações relativamente baixas e altas de ácido, respectivamente. (C) Uma visão geral da matriz de síntese de DNA em nanoescala com imagens de microscopia eletrônica de varredura da matriz de eletrodos de 650 nm e visão ampliada de um eletrodo. (D) Uma imagem fluorescente na qual o poço ao redor de cada ânodo ativado é padronizado com AAA-fluoresceína. O diagrama de desenho mostra quais eletrodos no layout foram ativados. (E) Ilustração dos poços padronizados com AAA-fluoresceína e AAA-AquaPhluor e (F) sobreposição de imagem correspondente dos dois fluoróforos no final do DNA sintetizado na mesma matriz de eletrodos de 650 nm. Crédito:Avanços Científicos , 10.1126/sciadv.abi6714 Um novo método para armazenamento de dados de DNA sintético
Neste estudo, Nguyen et al. produziu uma matriz de eletrodos que demonstrou controle específico de eletrodo independente da síntese de DNA com tamanhos de eletrodos e passos para estabelecer a densidade de síntese de 25 milhões de oligonucleotídeos por cm
2
. Este valor é estimado como a densidade do eletrodo necessária para atingir o alvo mínimo de kilobytes por segundo de armazenamento de dados no DNA. A equipe empurrou o estado da arte em controle químico eletrônico e forneceu evidências experimentais para a largura de banda de gravação necessária para o armazenamento de dados de DNA.
A equipe introduziu um controlador molecular de prova de conceito na forma de um minúsculo mecanismo de gravação de armazenamento de DNA em um chip. O chip poderia compactar a síntese de DNA em 3 ordens de magnitude maior do que antes para obter maior taxa de transferência de gravação de DNA. Armazenar informações no DNA na escala necessária para uso comercial exigia dois processos cruciais. Primeiro, a equipe teve que traduzir bits digitais (uns e zeros) em fitas de DNA sintético representando bits com software de codificação e um sintetizador de DNA. Em seguida, eles devem ser capazes de ler e decodificar as informações de volta aos seus bits para recuperar essas informações em formato digital novamente com um sequenciador de DNA e software de decodificação. Processo de armazenamento de DNA usando síntese de DNA. O software codifica bits digitais em uma representação eletrônica de sequências de DNA, e a síntese ocorre para gravar e preservar informações em moléculas de DNA. Para ler essas informações, as moléculas de DNA são sequenciadas e, em seguida, o software decodifica as informações de volta em bits digitais. Crédito de animação:Microsoft Research Blog, Crédito:Science Advances , 10.1126/sciadv.abi6714 Desenvolvimento de matrizes eletroquímicas para recursos em nanoescala
Durante a síntese tradicional de cadeias de DNA, os cientistas usam um método de várias etapas conhecido como química de fosforamidita, no qual uma cadeia de DNA pode ser cultivada sequencialmente pela adição de bases de DNA. Cada base de DNA contém um grupo de bloqueio para evitar múltiplas adições de bases de DNA à cadeia em crescimento. Na ligação a uma cadeia de DNA, o ácido pode ser entregue na configuração para clivar o grupo de bloqueio e preparar a cadeia de DNA para adicionar a próxima base. Durante a síntese eletroquímica de DNA, cada ponto na matriz contém um eletrodo e quando uma voltagem é aplicada, o ácido é gerado no eletrodo de trabalho (ânodo) para desbloquear as cadeias de DNA em crescimento, enquanto uma base equivalente é gerada no contra eletrodo (cátodo). . A equipe evitou a difusão de ácido na configuração projetando uma matriz de eletrodos, onde cada eletrodo de trabalho em torno do qual ocorreu a formação de ácido durante a síntese de DNA foi afundado em um poço e cercado por quatro contra eletrodos comuns, ou seja, cátodos que impulsionaram a formação de base, para confinar o ácido para regiões específicas. Nguyen et ai. verificaram a eficácia do projeto usando análise de elementos finitos. Durante os experimentos, quando apresentado em concentração suficiente, o ácido desbloqueou os nucleotídeos ligados à superfície para permitir o acoplamento do próximo nucleotídeo. Usando a configuração de chips contendo pontos de recursos para confinar ácidos, eles desenvolveram matrizes eletroquímicas com quatro eletrodos individuais para regular a síntese de DNA. A equipe então realizou experimentos com duas bases marcadas com fluorescência em verde e vermelho. Como prova de conceito, eles mostraram a capacidade do dispositivo de gravar dados sintetizando quatro fitas únicas de DNA, cada uma com 100 bases de comprimento com uma mensagem codificada, sem erros.
Erros decorrentes da síntese seguida de sequenciamento. (A) Inserções (Ins), deleções (Del) e substituições (Sub) por posição para uma sequência de 180 bases sintetizada e amplificada por PCR. (B) Imagem de eletroforese de produtos de síntese após amplificação por PCR. (C) Mensagem codificada em 64 bytes divididos em quatro sequências únicas de 104 bases (topo). Inserções, deleções e substituições por locus de cada uma das quatro sequências na execução de síntese multiplex. Em cada gráfico de análise de erro, as 20 bases terminais nas extremidades 3' e 5' vêm dos primers usados na PCR e não são representativas dos erros sintetizados. Crédito:Avanços Científicos , 10.1126/sciadv.abi6714
Dimensionamento do armazenamento de dados de DNA com poços de eletrodos em nanoescala. Pequeno mecanismo de gravação de armazenamento de DNA em um chip. Crédito:Microsoft Research Blog, Avanços na Ciência , 10.1126/sciadv.abi6714
Outlook:Sintetizando oligonucleotídeos curtos na matriz de eletrodos para armazenamento de dados
Usando a configuração, Nguyen et al. também demonstraram a síntese espacialmente controlada de oligonucleotídeos curtos na matriz de eletrodos para avaliar o comprimento máximo de DNA que pode ser formado. Os cientistas criaram uma única sequência de DNA com 180 nucleotídeos e vários produtos de comprimento amplificados por PCR a partir do comprimento completo dos oligonucleotídeos. À medida que o amplicon ficou mais longo, os produtos de PCR esperados apareceram mais fracos e menos definidos, enquanto os amplicons mais curtos mostraram bandas mais fortes e bem definidas, indicativas de erros de síntese mais altos. Com base nos resultados, os pesquisadores selecionaram o comprimento da sequência em 100 bases para facilitar a purificação para fornecer uma demonstração prática do armazenamento de dados de DNA sem otimização adicional. Desta forma, o método de prova de conceito demonstrado neste trabalho por Bichlien H. Nguyen e colegas abriu o caminho para gerar sequências de DNA em larga escala e únicas em paralelo para armazenamento de dados. O trabalho ultrapassou relatórios anteriores sobre sequências de DNA sintético denso para fornecer uma primeira indicação experimental para atingir a largura de banda de gravação necessária para armazenamento de dados em tamanhos de recursos em nanoescala. Os cientistas esperam aplicações imediatas dos dispositivos em tecnologia da informação e prevêem suas aplicações práticas em ciência de materiais, biologia sintética e ensaios de biologia molecular em larga escala. + Explorar mais