• Home
  • Química
  • Astronomia
  • Energia
  • Natureza
  • Biologia
  • Física
  • Eletrônicos
  • Desbloqueando efeitos de memória no pacote em núcleos científicos de computação de alto desempenho

    Densidade de probabilidade para desempenho alcançável (GFlop / s) usando 1024 amostras com diferentes ladrilhos e tamanhos de problema. Com eDRAM (DRAM =memória dinâmica de acesso aleatório), a curva da função como um todo muda para o canto superior direito, implicando que mais amostras podem chegar perto do pico (por exemplo, 90 por cento) desempenho. Em outras palavras, ter o eDRAM aumenta a chance de aplicativos menos otimizados alcançarem o desempenho "declarado pelo fornecedor". Contudo, o limite direito só se move um pouco, indicando que a eDRAM não pode melhorar significativamente o desempenho de pico bruto. Crédito:Departamento de Energia dos EUA

    A memória de alta largura de banda pode melhorar o desempenho de um computador. A memória on-package (OPM) é uma opção popular em muitos sistemas comerciais. Antes desse esforço, pouco se sabia sobre as implicações do OPM na velocidade e no uso de energia. A equipe caracterizou e analisou experimentalmente o armazenamento OPM moderno. Eles forneceram orientações sobre como ajustar a memória para acelerar os aplicativos de computação de alto desempenho (HPC).

    Este estudo sobre OPMs é essencial e fundamental para o avanço dos sistemas de computação. Por exemplo, motiva a exploração de co-design de arquitetura de software. Avançar, ele valida modelos e simulações. Também resultou em diretrizes gerais de otimização. O trabalho mostra como ajustar aplicativos e arquiteturas para obter o melhor desempenho em plataformas com determinados OPMs.

    Os pesquisadores realizaram uma avaliação experimental completa para discernir como os OPMs modernos afetaram o desempenho e a eficiência energética de importantes núcleos científicos da HPC, que compõem o sistema operacional central de um computador. Eles examinaram diferentes modos de ajuste do OPM e como eles influenciaram o ajuste do aplicativo para o melhor desempenho do sistema. A equipe do Pacific Northwest National Laboratory, Universidade de Copenhague, e Virginia Tech avaliaram diversos kernels HPC em dois Intel OPMs, eDRAM em multicore Broadwell e MCDRAM em manycore Knights Landing, com um grande conjunto de suas matrizes de entrada representativas (por exemplo, 968 matrizes para grãos esparsos). Este estudo permitiu que a equipe derivasse um modelo analítico visual intuitivo para explicar melhor cenários arquitetônicos complexos, além de fornecer diretrizes gerais para futuras otimizações de arquitetura e ajuste de eficiência.


    © Ciência https://pt.scienceaq.com