三台新型超级计算机荣登 Green500 榜单榜首

不仅仅是 过去几年超级计算已加速进入 百亿亿次级 时代——世界上最庞大的机器每秒能够执行超过十亿亿次运算。但除非能够大幅提高效率来阻止其指数增长曲线,否则预计计算也将需要越来越不切实际和不可持续的能源——甚至根据一项被广泛引用的研究,到 2040 年,需要 比当今世界总产量还要多

幸运的是,高性能计算社区现在的重点不仅是提高性能(以原始千万亿次浮点运算或百亿亿次浮点运算来衡量),而且还提高效率,从而增加每瓦的运算次数。

Green500 榜单中,有新晋者进入前三名,这表明世界上一些最新的高性能系统对效率的追求可能至少与对纯粹功率的追求一样多。

最新排名 500强 超级计算机(世界上最强大的机器列表)及其表亲 绿色500 (排名改为世界上效率最高的机器)上周发布。500 台最大超级计算机的前 10 名基本保持不变,由橡树岭国家实验室的 Frontier 百亿亿次级计算机前十名中只有一个新成员,位列第六:瑞士国家超级计算中心的 阿尔卑斯系统。与此同时,阿贡国家实验室的 极光 规模扩大了一倍,但仍保持第二级排名。

另一方面,Green500榜单上有新上榜者进入前三名,这表明世界上一些最新的高性能系统对效率的追求可能至少与对纯粹功率的追求一样多。

漏斗穿过它

Green500 榜单上的前三名系统有一个共同点——它们都采用 Nvidia 的 Grace Hopper 超级芯片,Hopper (H100) GPU 和 Grace CPU 的组合。Grace Hopper 架构如此高效的主要原因有两个, 迪翁·哈里斯英伟达加速数据中心上市战略总监。第一个是 Grace CPU,它受益于 ARM 指令集架构的卓越功率性能。此外,他说,它采用了一种内存结构,称为 LPDDR5X,通常用于手机中,并且针对能源效率进行了优化。

Nvidia 的 GH200 Grace Hopper 超级芯片部署在 Jülich 的 JEDI 机器中,目前为全球最高效的三大 HPC 系统提供支持。 于利希超级计算中心

Harris 表示,Grace Hopper 的第二个优势是 Hopper GPU 和 Grace CPU 之间新开发的互连。该连接利用了 CPU 和 GPU 在一块板上彼此接近的优势,实现了每秒 900 千兆位的带宽,大约是最新 PCIe gen5 互连。这使得 GPU 能够快速访问 CPU 的内存,这对于 AI 训练或图神经网络等高度并行的应用尤为重要,Harris 说。

JEDI 团队还列举了他们为适应 Green500 基准而进行的具体优化。除了使用所有最新的 Nvidia 设备外,JEDI 还通过其冷却系统降低了能源成本。JEDI 不使用空气或冷冻水,而是在其计算节点中循环热水以处理多余的热量。“在正常天气条件下,多余的热量可以通过免费冷却装置处理,而无需额外的冷水冷却,” 圣维特的本笃,于利希高性能计算部门负责人。

JUPITER 将采用与其原型 JEDI 相同的架构,von St. Vieth 表示,他的目标是让它保持原型的大部分能源效率 – 尽管随着规模的增加,他补充说,更多的能量可能会损失在互连结构上。

当然,最重要的是这些系统在实际科学任务上的表现,而不仅仅是在 Green500 基准上的表现。“看到这些系统上线真的令人兴奋,”Nvidia 的 Harris 说,“但更重要的是,我认为我们真的很高兴看到这些系统产生的科学成果,因为我认为 [the energy efficiency] 对应用程序的影响甚至会比对基准的影响更大。”

来自您的网站文章

网络上的相关文章

2024-05-24 15:45:14
1716819926

Leave a Reply

Your email address will not be published. Required fields are marked *

近期新闻​

编辑精选​