有了Summit超级计算机,美国可以重新夺回计算领域的头把交椅
橡树岭的200千万亿次超级计算机将于2018年年中投入使用
![说明:MCKIBILLO](http://www.hallspoultry.com/media-library/illustration-mckibillo.jpg?id=25584737&width=1200&height=900)
我2012年11月,在半年一次的世界超级计算机500强排名中,一台在美国制造的超级计算机名列前茅橡树岭国家实验室在田纳西州。这台机器被恰如其分地命名为Titan,其峰值性能超过27x1015每秒浮点运算,即每秒27千万亿次。对于政府、工业和学术界的研究人员来说,它是一个巨大的计算资源,并且处于超级计算堆的顶端,它有助于提高美国高性能计算社区的自豪感。
这种满足感是短暂的。仅仅7个月后,泰坦就把世界超级计算机的桂冠输给了中国的一台名为Tianhe-2(乳方法2)。3年过去了,中国又出现了另一个数字计算巨头——百度三维力控TaihuLight-获得了世界上最强大的超级计算机的头衔。它的最高性能是每秒125千万亿次。在那之后,土卫六看起来就不再像泰坦了。
利用神威太湖之光,中国研究人员捕捉到了2016年戈登·贝尔奖[PDF]以表彰他们模拟大气动力学的工作。“这表明它不仅仅是一台特技机器,”田纳西大学的Jack Dongarra说,他是Top500排行榜的创建者之一。
你可能想知道,为什么在过去的五年里,美国似乎已经放弃了夺回榜首的宝座。事实上,没有这样的投降。2014年,美国工程师起草了新一代超级计算机的提案。其中的第一个将在今年晚些时候结出果实一台名为Summit的超级计算机它将取代橡树岭的泰坦。几个月后,这台新机器上线时的峰值性能将达到每秒200千万亿次,这将使它成为地球上最强大的超级计算机。
也许吧。
“在美国,我们对我们的机器非常开放,”橡树岭领导力计算设施(Leadership Computing Facility)的项目主管阿瑟•“巴迪”•布兰德(Arthur“Buddy”Bland)说。也就是说,他相信Summit将按计划完成,它将成为美国最强大的超级计算机。但与此同时,中国或其他一些国家可能会推出新的超级计算机,或升级现有的超级计算机,以超越Summit的性能。这真的会发生吗?“我们不知道,”布兰德说。
他和他在橡树岭的同事们并没有因为这个问题而失眠——这些天他们需要尽可能多的睡眠,因为他们在努力用Summit取代Titan的过程中还有很多工作要做。然而,他们没有遵循建造泰坦的模式,泰坦是一系列越来越复杂的升级的结果叫做美洲虎的早期橡树岭超级计算机.
捷豹是在2005年安装的,当时计算机硬件很快就过时了(在那个时代购买个人电脑的人都可以证明这一点)。“我们每年都会升级一次,”布兰德回忆道。2009年,美洲虎成为世界上最强大的超级计算机。2011年开始的一次更重大的升级是允许的美洲虎将重生为泰坦在2012年。
为什么不直接升级机器的内部硬件,而不是建造一个全新的超级计算机呢?“我们认为可升级性是一个有效的目标,”布兰德说,但在这种情况下行不通,因为Titan使用的是Cray的硬件。“现在我们要用IBM的机器:回收利用是不可能的,也是不合理的。”因此,泰坦目前将继续运行,但它将在橡树岭的新超级计算机投入运行大约一年后关闭。
连线:一名技术人员在田纳西州橡树岭国家实验室为“巅峰”超级计算机的内部数据网络安装电缆。图片:橡树岭国家实验室
这台全新的超级计算机将给橡树岭带来的一个优势是能源效率的显著提高。“顶峰”应该能够以比“泰坦”快5到10倍的速度运行研究人员的模拟,而只需要两倍的功率。典型需求将在15兆瓦左右。幸运的是,电力将来自田纳西河谷管理局(Tennessee Valley Authority)资源丰富的电网。布兰德指出,其他人可能会发现为现代超级计算机提供动力更具挑战性。“去你当地的电力公司问,‘我在哪里可以把我的15兆瓦的电脑插进去?’看看他们怎么说,”他打趣道。
尽管“巅峰”将是最强大的超级计算机,但它并不是2018年唯一一台即将上线的美国超级计算机。一台名为塞拉,预计峰值性能将超过120千万亿次,将在加利福尼亚州的劳伦斯利弗莫尔国家实验室完成。阿贡国家实验室(Argonne National Laboratory)也计划在2018年开始运行一台新的超级计算机,其峰值性能为每秒180千万亿次。但伊利诺伊州实验室建造这台机器的计划被推迟到2021年,以试图实现这一目标扩展其能力并使其成为美国第一台“百亿亿次”(每秒1000千万亿次,或1百亿亿次)超级计算机。
这些巨大的数字指的是峰值性能,但实际应用程序只利用了这个潜力的一小部分。Dongarra说,经常引用的Linpack基准测试通常运行在超级计算机峰值的75%。“我们的小秘密是,大多数实际应用都是3%左右。”
显然,找出提高实际性能的聪明方法与理论上可用的峰值失败次数一样重要。橡树岭的超级计算机专家们也在这方面投入了大量精力。Joseph Oefelein,他将使用Summit来研究燃烧的物理和化学佐治亚理工学院他简洁地说:“这个游戏不仅仅是说你拥有最快的电脑。”
本文发表于2018年1月的纸质杂志《美国日报》超级计算反击。”