Duas instalações se unem para avanços na biologia estrutural com lasers de elétrons livres de raios X e computação em exaescala
O novo portal de dados, montado sob a iniciativa de Infraestrutura Integrada de Pesquisa do DOE, permitirá o processamento, reprocessamento e estudos multimodais em grande escala entre instalações do DOE. Os dados de dinâmica estrutural e molecular coletados no LCLS-II serão registrados em um registro central de fluxo de trabalho para facilitar a rápida colocação com dados coletados de outras instalações e recursos de computação de alto desempenho, como o supercomputador exascale Frontier. Crédito:Gregory Stewart/Laboratório Nacional de Aceleradores SLAC Os planos para unir as capacidades de duas instalações tecnológicas de ponta prometem inaugurar uma nova era de biologia estrutural dinâmica. Através da iniciativa de Infraestrutura de Pesquisa Integrada do DOE, ou IRI, as instalações complementarão as tecnologias umas das outras na busca pela ciência, apesar de estarem a quase 4.000 quilômetros de distância uma da outra.
A Linac Coherent Light Source, ou LCLS, localizada no Laboratório Nacional de Aceleradores SLAC do DOE, na Califórnia, revela a dinâmica estrutural de átomos e moléculas por meio de instantâneos de raios X fornecidos por um acelerador linear em escalas de tempo ultrarrápidas.
Com o lançamento da atualização LCLS-II no ano passado, o número máximo de seus instantâneos aumentará de 120 pulsos por segundo para 1 milhão de pulsos por segundo, fornecendo assim uma nova ferramenta poderosa para investigação científica. Isso também significa que os pesquisadores produzirão quantidades muito maiores de dados para serem analisados.
Frontier, o supercomputador científico mais poderoso do mundo, foi lançado em 2022 no Laboratório Nacional Oak Ridge do DOE, no Tennessee. Sendo o primeiro sistema da classe exascale – capaz de realizar um quintilhão ou mais de cálculos por segundo – ele executa simulações em escala e resolução sem precedentes.
No âmbito do IRI, uma equipe do ORNL e do SLAC está estabelecendo um portal de dados que permitirá à Frontier processar os resultados dos experimentos conduzidos pelo LCLS-II. Cientistas e usuários do LCLS aproveitarão o poder computacional do ORNL para estudar seus dados, conduzir simulações e informar mais rapidamente seus experimentos em andamento, tudo dentro de uma estrutura integrada.
Os desenvolvedores por trás desse fluxo de trabalho sinérgico pretendem torná-lo um roteiro para futuras colaborações científicas nas instalações do DOE, e descrevem esse fluxo de trabalho em um artigo publicado em Current Opinion in Structural Biology . Os autores incluem os pesquisadores Sandra Mous, Fred Poitevin e Mark Hunter do SLAC, e Dilip Asthagiri e Tom Beck do ORNL.
"É realmente um período emocionante de rápido crescimento simultâneo em instalações experimentais como LCLS-II e computação em exaescala com Frontier. Nosso artigo resume o recente progresso experimental e de simulação em estudos de dinâmica biomolecular em nível atômico e apresenta uma visão para integrar esses desenvolvimentos, " disse Beck, chefe da seção de Engajamento Científico do Centro Nacional de Ciências Computacionais do DOE no ORNL.
A colaboração germinou através de discussões entre Beck e Hunter sobre a missão mútua de seus laboratórios de lidar com a “grande” ciência e como reunir seus recursos.
"Temos esses supercomputadores incríveis entrando em operação, começando no ORNL, e o novo acelerador linear supercondutor de alta taxa de pulso no LCLS será transformador em termos de que tipo de dados seremos capazes de coletar. É difícil capturar esses dados, mas agora temos computação em uma escala que pode controlá-la.
“Se você combinar esses dois, a visão que estamos tentando mostrar é que essa combinação será transformadora para o avanço da biociência e de outras ciências”, disse Hunter, cientista sênior do LCLS e chefe do Departamento de Ciências Biológicas.
Quando o LCLS original começou a operar em 2009, apresentou uma tecnologia inovadora para estudar os arranjos atômicos de moléculas como proteínas ou ácidos nucléicos:lasers de elétrons livres de raios X, ou XFELs. Em comparação com métodos anteriores que usavam fontes de luz síncrotron, os XFELs aumentam significativamente o brilho, de modo que muitos mais fótons de raios X são usados para sondar a amostra.
Além disso, esses raios X são enviados na forma de pulsos de luz laser que duram apenas algumas dezenas de femtossegundos, e são muito mais comprimidos no tempo em comparação com outras fontes de luz.
Embora os raios X forneçam a resolução espacial para compreender onde os átomos estão no espaço, eles também são radiação ionizante, portanto são intrinsecamente prejudiciais às próprias estruturas que os cientistas estão tentando compreender. Quanto maior a exposição, mais danos serão causados à amostra.
"Historicamente, todas essas determinações de estrutura foram uma corrida. Você pode obter as informações necessárias em uma resolução espacial alta o suficiente para entendê-las antes de degradar essa amostra com os raios X a ponto de não ser mais representativa? " disse Caçador.
"O LCLS fez com que todos os raios X aparecessem mais rápido do que a molécula pode reagir a eles, e assim a corrida entre coletar informações e danificar a estrutura foi quebrada - a amostra não pode ser danificada no período de tempo que um único LCLS pulso chega."
Com a capacidade do LCLS-II de tirar rapidamente muito mais instantâneos de raios X de uma amostra, ele poderá capturar eventos raros que, de outra forma, poderiam ser inobserváveis.
“Existem estados de vida curta muito importantes na biologia, que infelizmente nem sempre captamos devido ao seu tempo de vida limitado”, disse Mous, cientista associado do SLAC e autor principal do artigo da equipa.
"Mas com o LCLS-II, poderemos realmente conseguir tirar muito mais fotos, permitindo-nos observar estes eventos raros e obter uma compreensão muito melhor da dinâmica e do mecanismo das biomoléculas."
A fonte de luz coerente Linac no Laboratório Nacional de Aceleradores SLAC do DOE, na Califórnia, revela a dinâmica estrutural de átomos e moléculas por meio de instantâneos de raios X em escalas de tempo ultrarrápidas. Na foto aqui está o túnel LCLS-II. Crédito:Jim Gensheimer/Laboratório Nacional de Aceleradores SLAC
Em um experimento típico, o LCLS original poderia enviar 120 pulsos de raios X por segundo para amostras, gerando assim cerca de 120 imagens por segundo – ou 1 a 10 gigabytes de dados de imagem por segundo – tudo isso gerenciado pela infraestrutura de computação interna do SLAC. .
Com as capacidades expandidas do novo acelerador linear supercondutor, ele pode enviar potencialmente 1 milhão de pulsos de raios X por segundo para amostras, criando assim até 1 terabyte de dados de imagem por segundo.
"Isso é pelo menos 1.000 vezes o que fazemos hoje, então com a quantidade de dados que estamos acostumados a lidar durante a semana, agora precisamos fazer isso dentro de uma hora. E simplesmente não podemos mais fazer isso localmente. Haverá Serão explosões onde precisaremos enviar os dados para algum lugar onde possamos realmente estudá-los - caso contrário, os perderemos", disse Poitevin, cientista da equipe da divisão de Sistemas de Dados do LCLS.
Poitevin lidera o desenvolvimento de ferramentas computacionais para a infraestrutura de dados do LCLS, incluindo a interface de programação de aplicativos para o novo portal de dados, que começou a ser testado no início deste ano no supercomputador da geração anterior do ORNL, Summit.
Tanto o Summit quanto o Frontier são gerenciados pelo Oak Ridge Leadership Computing Facility, que é uma instalação de usuário do DOE Office of Science localizada em ORNL. O projeto recebeu tempo de computação no Summit por meio do programa SummitPLUS do DOE, que estende a operação do supercomputador até outubro de 2024 com 108 projetos cobrindo toda a gama de investigação científica.
"Com as capacidades de alta taxa de repetição do novo acelerador linear, os experimentos agora estão acontecendo em um ritmo muito mais rápido. Precisamos obter algum feedback que seja útil para os usuários e não podemos nos dar ao luxo de esperar uma semana porque o experimento pode durar apenas alguns dias", disse Poitevin.
“Precisamos fechar o ciclo entre a análise e o controle do experimento. Como levamos os resultados da nossa análise para todo o país e depois trazemos de volta as informações necessárias a tempo de tomar as decisões corretas?”
Esse é o ponto no novo fluxo de trabalho onde entram os cientistas biomédicos computacionais seniores Asthagiri e Beck. Como parte do grupo de Computação Avançada para Ciências da Vida e Engenharia do ORNL, Asthagiri é especializado em simulações biomoleculares.
O poder computacional da Frontier permitirá que ele desenvolva métodos computacionais com dados LCLS-II que permitirão o envio rápido de informações oportunas aos cientistas do SLAC.
"A correspondência quase individual entre os experimentos XFEL e as simulações de dinâmica molecular abre possibilidades interessantes", disse Asthagiri.
"Por exemplo, as simulações fornecem informações sobre a resposta das macromoléculas a diversas condições externas, e isso pode ser investigado nos experimentos. Da mesma forma, tentar capturar os estados conformacionais vistos experimentalmente pode informar os modelos de simulação."
O LCLS-II está atualmente sendo comissionado, mas Hunter estima que as investigações biológicas do instrumento aumentarão em cerca de três anos, e a equipe usará o portal de dados do ORNL para vários projetos nesse meio tempo.
Com a capacidade amplamente aprimorada do LCLS-II de capturar uma variedade de movimentos moleculares e com a análise de dados da Frontier, Hunter está confiante no impacto do projeto na ciência. Obter uma nova compreensão da dinâmica estrutural das proteínas pode acelerar o desenvolvimento de alvos medicamentosos, por exemplo, ou levar à identificação de moléculas associadas a uma doença que pode ser tratável com um medicamento específico.
"Isso pode abrir uma maneira totalmente nova de tentar projetar terapêuticas. Cada ponto de tempo diferente de uma biomolécula poderia ser drogado de forma independente se você entendesse a aparência dessa molécula ou soubesse o que ela está fazendo", disse Hunter.
"Ou, se você optar pela biologia sintética ou pelas aplicações bioindustriais, talvez a compreensão de algumas partes das flutuações dessas moléculas possa ajudá-lo a projetar um catalisador melhor."
Fazer tais avanços científicos requer uma estreita integração entre instalações especializadas, e Hunter atribui a coesão das equipes ao IRI.
“Precisamos de ter o IRI por trás disto para que isso aconteça porque tais colaborações não funcionarão se todas as instalações falarem uma linguagem diferente. E penso que o que o IRI traz é esta linguagem comum que precisamos de construir”, disse ele.