• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Arquitetura acelerada do supercomputador mais rápido das Américas aumenta as simulações QCD
    p Uma ilustração conceitual do método multigrid para retículo QCD mostra grades finas e grossas. Os modos de energia de alta frequência de um próton aparecem como fuzz em uma grade fina (topo). O processo multigrid é projetado de maneira mais suave, modos de comprimento de onda mais longos que podem ser capturados com uma grade mais grossa, que requer menos trabalho para resolver (parte inferior). O processo multigrid faz um ciclo entre as grades para resolver o problema de forma otimizada. Crédito:Joanna Griffin, Jefferson Lab

    p Em busca de previsões numéricas para partículas exóticas, pesquisadores estão simulando partículas de quark e glúon que constroem átomos mais de 70 vezes mais rápido na Summit, o supercomputador científico mais poderoso do mundo, do que em seu antecessor Titan no Laboratório Nacional Oak Ridge (ORNL) do Departamento de Energia dos EUA (DOE). As interações de quarks e glúons são calculadas usando cromodinâmica quântica (QCD) - uma versão amigável da estrutura matemática que descreve essas interações de força forte. p Com novos algoritmos e otimizações para sistemas baseados em GPU como Summit, os físicos computacionais Balint Joo do Jefferson Lab do DOE e Kate Clark do desenvolvedor de GPU NVIDIA estão combinando dois códigos QCD de código aberto, Chroma e a biblioteca QUDA para GPUs, na Summit. Localizado no Oak Ridge Leadership Computing Facility (OLCF), Summit é um 200 petaflop, O sistema IBM AC922 foi lançado em junho como o sistema de melhor classificação na lista Top500.

    p Cálculos QCD podem ajudar a revelar indescritíveis, partículas de vida curta que são difíceis de capturar em experimentos. Os avanços nas aplicações QCD para esta nova geração de supercomputação irão beneficiar a equipe, liderado pelo físico Robert Edwards, do Jefferson Lab, em sua busca para descobrir as propriedades das partículas exóticas.

    p "Recebemos previsões do QCD, "Disse Joo." Onde há incógnitas teóricas, cálculos computacionais podem nos dar estados de energia e decaimentos de partículas para procurar em experimentos. "

    p Edwards e Joo trabalham em estreita colaboração com um experimento de acelerador de partículas no Jefferson Lab chamado GlueX, que está fazendo uma ponte entre as previsões teóricas do QCD e as evidências experimentais.

    p "GlueX é um experimento principal da atualização recentemente concluída de $ 338 milhões do Acelerador CEBAF de Jefferson Lab. O experimento no novo Hall D do laboratório está usando o feixe de elétrons para criar um feixe de fótons polarizado intenso para produzir partículas, incluindo possivelmente mésons exóticos, "Edwards disse." Nossos cálculos QCD estão informando e guiando essas pesquisas experimentais. "

    p Velocidade máxima a frente

    p A equipe recebeu acesso antecipado ao Summit para testar o desempenho de seu código na arquitetura do sistema. A Summit tem cerca de um quarto do número de nós do supercomputador Titan de 27 petaflop. Contudo, Os nós da Summit - compreendendo duas CPUs IBM Power9 e seis GPUs NVIDIA Tesla V100 - são excepcionalmente rápidos e com muita memória, incluindo 42 teraflops de desempenho e 512 gigabytes de memória por nó.

    p Por meio de uma combinação de avanços de hardware e otimizações de software, a equipe aumentou o rendimento na Summit nove vezes em comparação com as simulações anteriores do Titan, enquanto comprimem o tamanho do problema original para usar oito vezes menos GPUs para um aumento de desempenho total de cerca de 72 vezes.

    p Em simulações de rede QCD, espaço-tempo é representado por uma rede, e os cientistas geram instantâneos do campo de força forte nos links desta rede, conhecidas como configurações de medidor. Essa etapa inicial é chamada de geração de medidor. Então, em uma etapa conhecida como cálculo do propagador de quark, pesquisadores introduzem uma carga no campo de medição e resolvem um grande sistema de equações que representa como um quark se moveria através do espaço e do tempo. Em uma etapa de análise final, esses propagadores de quark são combinados em estados de partícula inicial e final, a partir do qual os espectros de energia podem ser calculados e relacionados ao experimento.

    p Para preparar seu código para a Summit, a equipe fez melhorias algorítmicas para aumentar a eficiência. Primeiro, eles desenvolveram um solucionador multigrid adaptável na biblioteca QUDA que gera grades grosseiras e finas com base em estados de energia de baixa e alta energia, respectivamente. O processo multigrid envolve uma fase de configuração, que é então usado nas etapas de solução.

    p "As GPUs Summit são muito bem adaptadas para este algoritmo multigrid, e vimos potencial de aceleração lá, "Clark disse.

    p Anteriormente, as etapas da solução foram otimizadas para as GPUs da Titan, e o solucionador multigrid foi usado para a fase de propagação do quark dos cálculos realizados para cada configuração de medidor. Para Summit, a equipe integrou o solucionador multigrid na fase inicial de geração do medidor.

    p “Na fase de geração do medidor, as configurações do medidor mudam rapidamente e exigem que o processo de configuração seja repetido com frequência, "Disse Joo." Portanto, uma etapa de otimização crucial foi mover essa fase de configuração inteiramente para as GPUs. "

    p A equipe viu outra oportunidade de acelerar a geração da configuração do medidor incorporando outras melhorias algorítmicas e de software junto com o solucionador multigrid.

    p Primeiro, para reduzir a quantidade de trabalho necessária para mudar de uma configuração de medidor para a próxima, a equipe implementou um integrador gradiente de força que utiliza um método de dinâmica molecular previamente adaptado para QCD.

    p "O processo é matematicamente semelhante à simulação de moléculas de um gás, então, um procedimento de dinâmica molecular é reaproveitado para gerar cada nova configuração de medidor da anterior, "Disse Joo.

    p Segundo, enquanto a biblioteca QUDA executa automaticamente os cálculos necessários para a geração de configuração de medidor em GPUs, o algoritmo completo tem muitas outras partes de código que podem causar um gargalo de desempenho, se não também acelerado por GPU. Para evitar esse gargalo e melhorar o desempenho, a equipe usou a versão QDP-Just-in-Time (JIT) da camada de software QDP ++ subjacente ao Chroma para direcionar todas as expressões matemáticas para execução total em GPUs.

    p "As melhorias na velocidade dessas otimizações nos permitiram iniciar uma série de simulações que simplesmente não podíamos pensar em realizar antes, "Disse Joo." Em Titã, já começamos uma nova corrida através do programa ASCR Leadership Computing Challenge com quarks que têm massas mais semelhantes às da natureza, que se destina diretamente ao nosso programa de espectroscopia no Jefferson Lab. "


    © Ciência https://pt.scienceaq.com