全球最快的10台超级计算机,正在获得新的加速“引擎”

计算
全球最快的10台超级计算机,正在获得新的加速“引擎”
麻省理工科技评论 2020-06-23

2020-06-23

科学计算的新时代将来临。
芯片 科学 人工智能
科学计算的新时代将来临。

近期的最新TOP500超级计算机榜单,展现了现代科学计算的整体情况:通过AI和数据分析进行扩展并使用NVIDIA技术提供加速。

目前,全球排名前十的超级计算机中有8台采用了NVIDIA GPU、InfiniBand网络技术,或同时采用了两种技术。其中包括美国、欧洲和中国最强大的超级计算机系统。

在TOP500榜单的所有系统中,有三分之二的系统(333套)采用了NVIDIA(现已与Mellanox合并)为其赋力。而在2017年6月发布的榜单上,采用两家公司的系统占比总和还不到一半(203套)。

如今,榜单上有将近四分之三(74%)的全新InfiniBand系统采用了NVIDIA Mellanox HDR 200G InfiniBand,这也展现了该最新智能高速数据互连技术的迅速普及。

自2019年11月以来,榜单上使用HDR InfiniBand的TOP500系统数量几乎增加了一倍。共有141台超级计算机使用了InfiniBand,自2019年6月以来增长了12%。

越来越多TOP500系统采用了NVIDIA GPU、Mellanox网络技术,或同时采用了这两种技术。

在TOP500超级计算机中,有305套系统使用了NVIDIA Mellanox InfiniBand和Ethernet网络(占61%),包括所有141套InfiniBand系统和164套(占63%)使用Ethernet的系统。

在能效方面,使用NVIDIA GPU的系统表现也都脱颖而出。与不使用NVIDIA GPU的系统相比,其能效(以gigaflops/watt为单位)平均高出2.8倍。

这也是为何排在TOP500榜单前25的超级计算机中有20台系统都选择采用NVIDIA GPU的原因之一。

image.pngNVIDIA GPU提高了TOP500超级计算机的能效。

最能够证明此能效表现的是NVIDIA内部研究集群的新成员—— Selene(如上图所示)。该系统在Linpack基准测试中以27.5  petaflops的性能表现,在最新Green500榜单中排名第二,在整个TOP500榜单中排名第七。

Selene的功耗为20.5 gigaflops/watt,与Green500榜单上的第一名相差甚微,但排名第一的系统体积更小,其性能表现仅排在第394位。

Selene是排名前100系统中唯一突破20 20 gigaflops/watt能效表现大关的系统,同时也是全球性能排名第二的工业超级计算机,仅次于意大利能源巨头Eni S.p.A.的No. 6 系统(同样使用了NVIDIA GPU)。

在能效方面,相比于未使用NVIDIA GPU的其它TOP500系统的平均能效表现,Selene的能效高出了6.8倍。Selene的优异性能和能效均要归功于NVIDIA A100 GPU中的第三代Tensor Core核心。该核心可以为传统的64位数学模拟及精度较低的AI工作提供加速。

Selene所取得的名次对于它来说已经是一项了不起的成就了,毕竟该系统只用了不到4周的时间就构建完成了。工程师们可以使用NVIDIA的模块化参照架构,快速构建Selene。

该参考架构既NVIDIA的DGX SuperPOD。该系统基于强大而灵活的现代数据中心构建模块 —— NVIDIA DGX A100系统。

高度灵活的DGX A100系统现已上市。该系统在一台6U服务器中集成了8颗A100 GPU以及NVIDIA Mellanox HDR InfiniBand网络技术,可以为高性能计算、数据分析和AI工作(包括训练和推理)等多种组合提供加速,并实现快速部署。Selene最重要的性能规格之一是可以提供超过1 exaflops的AI性能。此外,在TPCx-BB关键数据分析基准测试中,其仅使用了16台DGX A100系统就创造了新纪录,其性能表现高出其他系统20倍。

如今,AI和分析已成为科学计算中的新需求,因此这些结果也显得格外重要。

在全球各地,研究者正在使用深度学习和数据分析预测各种最具潜力的领域,并进而开展实验。这一方法能够帮助研究者减少成本高昂且费时的实验量,从而加快取得科学成果的速度。

例如,目前有6台在建系统虽然没有出现在此次TOP500榜单中,但它们都采用了NVIDIA于上月发布的A100 GPU。这些系统将被用于加速HPC和AI的融合,开辟科学研究的新时代。


麻省理工科技评论

From Tech to Deeptech