张云泉:下一代中国E级超算计划2020年完成,将采用国产芯片

来源:观察者网

2017-06-30 07:37

张云泉

张云泉作者

中国计算机学会高性能计算专业委员会秘书长

科工力量

科工力量作者

提供对中国高新技术企业和产品的专业点评

【本文转自微信公众号“科工力量”(ID:guanchacaijing)】

日前,国际TOP500组织发布新一期全球超级计算机500强榜单。中国超算“神威·太湖之光”与“天河二号”连续第三次占据榜单前两位,美国超算“泰坦”则被瑞士的“代恩特峰”挤到第四。这是20年来美国首次跌出前三名。

美国能源部近日宣布,将在未来3年拨给6家科技公司总额2.58亿美元的资金,以加速下一代超级计算机技术的研制,目标是到2021年交付至少一台每秒可进行百亿亿次计算的超级计算机系统。科工力量就此专访了中国计算机学会高性能计算专业委员会秘书长、国家超算济南中心主任张云泉,解读美国为何跌出TOP500前三,以及中美超算未来的发展。

科工力量:这次瑞士的“代恩特峰”超越美国的“泰坦”,美国超算跌出TOP500前三,对于这件事您怎么看?到底是美国超算技术逐渐跟不上时代了,还是另有原因?

张云泉这应该是一个大的周期吧,中国超算发展最好的时期,正好恰逢美国超算发展的低谷,这两个叠加在一块。显得中国很强,美国很弱。这是中国超算这几年发展较快的一个延续,中国最好的机器刚好在这个时间段。美国的机器布局太晚了,打了一个时间差。这也是国际超算发展经常出现的现象。

另外,美国在明年下半年会强力反弹,会拿出180P的机器,超越太湖之光。而中国将来要超越美国的这台机器,也要一个周期。

代恩特峰

科工力量:美国有诸多科技公司的技术很强,比如Intel、IBM、英伟达、AMD等,到底是什么原因导致美国的超算落后了?

张云泉美国超算技术依然非常强,也有能力研发更强的超算,只不过美国研制计划落后,使得中国可以打一个时间差,后来居上。从美国的计划来看,在明年下半年公布的下一代超算会采用很多新技术。比如全闪存技术、最新Power处理器、三维存储、克雷公司动态超算结构等等。美国下一代180P超算上会有很多中国超算上没有的技术。

科工力量:“代恩特峰”在芯片上采用了Intel的Xeon E5-2690v3和英伟达的NVIDIA Tesla P100 ,加上美国克雷公司在其中扮演了关键作用,有观点认为,“代恩特峰”其实是名为瑞士打造,但实为美国技术的超算。对这种观点您怎么看?

张云泉这个确实是美国为瑞士打造的。主要是因为欧洲的超算研制能力比较弱,一直用美国和日本的超算。除了法国稍微独立一些,能够研制自己的超算。由于欧洲市场很大,中国超算公司会打进欧洲,联想、浪潮、华为、曙光现在都在做这个事情,已经签了不少合同,将来可以看到欧洲用中国的超算做应用。

科工力量:欧洲超算制造能力相对一般,但超算应用能力却着实不弱,而中国近年来在超算制造能力上取得长足的进步,但在应用方面,虽然也有应用取得了戈登贝尔奖,但总体而言,和中国的超算制造能力相比,还是逊色一筹。这其中的原因何在?

张云泉欧洲超算的应用水平是比较强的,总体来说,中国超算应用水平还是比欧洲稍逊一筹。欧洲的商业化应用特别强,原因在于欧洲的超算制造能力弱,主要精力放在怎么把买来的超算尽可能用好。而且一直以来重视商业模式,超算都是很多大公司联合购买,因为公司花钱买了超算,有动力去充分挖掘超算潜能,把超算用好。

这方面对于中国也是有借鉴意义的。

科工力量:一直有网络舆论声称,美国不制造100P超算是因为美国够用就好,而中国为了夺第一,所以制造高性能超算。您对这种说法怎么看?

张云泉从历史上看,美国也一直追求性能,在有一段时间,美国和日本超算争霸,日本的地球模拟器曾经连续5次拿了冠军。美国就紧急拨款投资建设了蓝色基因。因此美国也是一直追求性能的,并不是说够用就好。

科工力量:美国的这一计划是不是驳斥了网络上一些人说的“因为现有的超算性能够用,所以美国不需要比拼超算”?

张云泉超算的性能是永远不够用的,学科需求、计算的精度和规模是无止境地向前发展,我们现在超算的性能是无法满足使用的。往往是超算应用降低精度要求、规模要求来配套现在超算的性能。

国家计算流体力学实验室基于“神威·太湖之光”超级计算机,对“天宫一号”飞行器两舱简化外形陨落飞行绕流状态大规模并行模拟

其实美国一直想把第一抢回去。奥巴马在下台前就发过总统令,只不过因为当时发总统令的时候快下台了,作用有限,本来3个月就应该做好的事情,结果1年才做完。川普虽然砍了很多科研经费和医疗方面的钱,但他没砍超算的钱,反而给超算增加钱。

这其实也可以看出超算的重要性。

科工力量:美国政府资助国际商用机器公司、超威半导体公司、克雷公司、惠普公司、英特尔公司和英伟达公司开发下一代1000P超算,而且美国在下一代超级计算机技术方面的研发总投资将达到至少4.3亿美元。对于美国1000P超算的发展,您怎么看?

张云泉超算是国家工程,计算机技术发展的龙头,需要的资金投入非常高。之前已经介绍了,超算非常重要,所以会有政府高额投资。很多技术都是现在超算里做出来,然后再民用化。而且超算研发回报也很高,投入一美元,可以获得十几美元,只不过回报周期会长一些,而且风险比较高。

科工力量:从媒体报道看,美国政府承担了1000P超算的60%研发成本,国际商用机器公司、超威半导体公司、克雷公司、惠普公司、英特尔公司和英伟达公司大约承担40%的项目经费。为何超算项目如此依赖政府资金投入?

张云泉超算的发展一定要政府投入,体现国家综合国力,仅仅靠公司创新去做,公司的动力不大,因为公司不会考虑国家战略需求。而且超算研发风险很大,一旦失败损失很大,这对于公司和股东都是非常不利的。所以世界各国超算都是政府主导,政府牵头,委托公司来做。美国的做法是政府投入60%,公司也投入一部分。而中国现在还是以政府投入为主,怎么把公司的财力用起来,这个其实也是中国可以借鉴的。

科工力量:神威太湖之光采用了申威26010芯片,下一代中国1000P超算还会采用国内单位自主研发的芯片么?

张云泉三台1000P超算原型机用的都是自主芯片。神威会用申威,曙光会用海光,天河会用飞腾。

一名研发工程师展示“神威太湖之光”所使用的“申威26010”众核处理器

科工力量:中国计划在2020年左右建成1000P超算,美国也计划在2021年建成1000P超算,日本也有这方面的规划,对于中美日1000P超算竞赛,您怎么看?

张云泉现在中美日欧竞争都是白热化的。现在来看中国的规划最早,在2020年前后,日本、欧洲、美国都在往后推。日本已经推迟到2021年,欧洲推迟到2022年,美国推迟的更远到2023-2025年。

但是美国部署了2条线,一条是成熟路线,用相对成熟的技术研发1000P超算,并保证商业应用。另一条是非常激进的1000P超算路线,不考虑任何商业目的和应用,任何能用的技术都用上去,争取在2021年抢第一。

我估计中国的1000P超算也可能会延期,因为功耗的要求太苛刻了。当然也不排除中国能按照计划在2020年建成1000P超算。

本文由“科工力量”内容团队制作,未经授权,不得转载,否则将追究法律责任。

责任编辑:宙斯
超算 超级计算机 计算机
观察者APP,更好阅读体验

“她下月访华,尽管特朗普团队表达了担忧”

“中国有能力让梦想照进现实,将赢得史诗般竞争”

美国政府“逃过一劫”

美媒感慨:基建狂魔发力,我们又要被超越了

还在扯皮中国,“涉华条款全删了”