张承义:飞腾2000已能局部替换英特尔CPU

来源:观察者网

2016-12-26 08:51

张承义

张承义作者

飞腾战略规划部总经理

【采访/观察者网 铁流】

在去年的第28届国际高性能微处理器研讨会上,飞腾公布了“火星”,在权威的Spec 2006测试中,成绩为整数672,浮点585,足以和英特尔的中高端服务器芯片Xeon E5-2699v3相媲美。虽然今年公布的测试成绩与模拟器成绩相比还稍逊一筹,但性能也十分强悍,在一些场景下也许可以替换掉Intel的E5。

目前,虽然在服务器CPU上X86占据统治地位,但由于“天下苦Intel久矣”,众多有实力的大厂商,诸如谷歌、百度等都在寻找替代Intel产品的方案,ARM则有可能在其中分走部分原本属于X86的市场份额,而飞腾、华为等中国ARM阵营IC设计公司则有可能从中获益。

观察者网专访飞腾战略规划部总经理张承义,向网友传递飞腾的声音,了解飞腾CPU研发的相关信息。

观察者网:虽然飞腾官方给出了FT2000的SPEC06测试成绩,但对于很多网友来说,可能无法看懂这个测试数据,也无法对FT2000的性能有个直观的感受,能用通俗的话语解释一下FT2000大约相当于Intel哪款产品,又那在哪些方面替换国外产品呢?

张承义:SPEC CPU2006是国际上通用的评测通用CPU综合性能的测试程序集,是由一系列典型应用程序组成的,分为整数测试集和浮点测试集两个子集。SPEC CPU2006的分值体现了被测整机系统相对于基准整机系统的平均性能提升。FT-2000初步实测的SPEC CPU2006全芯片测试分值为整数570,浮点482,整体性能与Intel Xeon E5-2695v3芯片相当。从性能上看,FT-2000能够胜任一些国产中高端服务器的业务需求。

模拟器成绩

观察者网:FT2000并没有实现当时模拟公布的分数,瓶颈在哪?

张承义:主要是模拟环境与真实系统之间的差异,首先模拟环境中存储系统是用模型来构建的,与真实芯片环境相比有差异,更加理想化;第二,在模拟平台上,由于模拟运行速度较慢,benchmark问题规模不能太大,都需裁剪简化。因此真实系统测试性能与模拟环境中得到的性能不一致是正常现象。后续我们会研究更高效的性能分析手段,降低模拟系统与真实系统的性能偏差,同时基于真实系统进一步开展编译调优工作,预计测试结果还有10%~30%的优化空间。

观察者网:FT2000的市场定位和市场前景怎么样?

张承义:FT-2000主要定位于云计算、互联网等行业的数据中心市场,作为政府和企业降低TCO(总拥有成本,Total Cost of Ownership)的一种解决方案。目前,国内数据中心建设如火如荼,TCO也成为各运营商关注的重要指标,我们看好这一市场。

观察者网:某国产32核A57服务器芯片采用台积电16nm制造工艺,而且国家对其还非常重视,是核高基项目,但性能却差强人意——据了解,这款服务器芯片采用了FT2000一半的功耗,达到了不到FT2000一半的性能,而且这还是制造工艺领先FT2000两代的前提下(32核A57是16nm,FT2000是28nm)。请问,飞腾是如何做到在制造工艺落后2代的情况下,做出比公版A57架构的服务器芯片更好的产品的?这其中有什么秘诀么?

张承义:一款CPU产品的设计规格是目标市场与成本共同驱动的,其实现方案是综合考量工艺、性能、功耗等因素后权衡制订的。我们对其他公司的产品细节并不了解,不宜直接作出评论。但从你提供的信息看,我们认为可能有两个方面的原因。

一方面A57本身的定位还是移动平台解决方案,功耗虽然比较低,但单核性能还是略有不足。飞腾采用的自研处理器核,微结构设计上比A57更为先进,因此单核性能更高。

另一方面服务器芯片的性能很大程度上还要受存储、互连等部件性能的影响。片上集成的核数越多,对存储和互连的设计平衡性要求越高。如果平衡性做得不好,并行性能的扩展性就会直线下降。飞腾团队在多核处理器设计领域具有丰富的技术积累,先后设计了我国第一款16核ARM处理器和第一款64核ARM处理器,在计算、访存、通信平衡的体系结构设计上有较多经验。所以我们在FT2000设计上比较好地实现了并行性能的提升。

观察者网:能否“现在”向潜在客户提供FT2000的测试机器?

张承义:目前已经开始FT-2000服务器的小批量生产和测试,很快可以向部分重要的合作伙伴提供样机。

观察者网:飞腾下一款微结构开始研发了么?设计目标大概是多少?

张承义:FTC66X系列处理器核的设计是一直在优化之中的,根据研发计划,我们大致每年会推出一个升级版本。近期目标是到2018年飞腾最新处理器核心SPEC CPU2006实测性能较目前提高1倍,实现SPEC CPU 2006绝对测试值达到20分~30分。

观察者网:飞腾有四核、16核研发计划么?会开发采用FTC661,主频达到2G以上的四核、16核CPU么?

张承义:目前飞腾已有16核和4核的FT-1500A产品,面向中低端服务器和桌面计算机,可以基本满足市场要求。后续飞腾团队会根据市场需求和竞争情况制定下一步服务器和桌面CPU的发展规划。所采用的处理器核心版本、工艺、主频和功耗等指标,与市场需求及上市时间密切相关。

观察者网:据说飞腾马上也要出面向嵌入式应用的飞腾芯片,基于FTC661核心的双核芯片,用于智能硬件,瘦客户端等领域。这款嵌入式芯片是否有计划向工控、网络安全方面应用?

张承义:飞腾主要是做高性能通用CPU的,但嵌入式领域一直是飞腾十分重视的领域,也有面向工控、网络安全等方面应用的相关产品规划,具体信息将在恰当的时机对外发布。

观察者网:飞腾在过去的研发经历中更换了几次指令集。换指令集等于软件生态要另起炉灶,代价巨大,像龙芯基于MIPS进行扩展指令,申威自主定义指令集,为何飞腾会更换指令集?指令集对CPU设计有多大影响?

张承义:与您说的情况正好相反,软件生态环境恰恰是飞腾团队更换指令集的主要动因。由于飞腾过去的业务主要集中在较为小众的应用领域,且拥有自己的编译器团队和合作紧密的操作系统合作伙伴,因此指令集的生态成熟度对这些小众业务影响很小。但对于目前飞腾进入的体量庞大的通用计算机领域而言,在本质上这是一场收复失地的战役,国际竞争对手占据绝对的先发优势。通用计算领域的软件生态涉及的范围十分广泛,如果从头开始“造轮子”、“造螺丝”,即便投入大量的人力、物力、财力,我们与国际水平的差距也只会越拉越大。

因此飞腾在这一领域市场策略的总体思路一个是换道超车,不能亦步亦趋,否则永远只是一个追赶者的角色;另一个是兼容国际主流生态设计CPU,轻装上阵。事实上,不管是MIPS还是Alpha,选择它们的目的也是希望能够借助一些已有的软件遗产,避免从零开始,否则大可自定义指令集了。只不过,飞腾的选择更主流,选择的是当前可获得的开发者最活跃的、生态环境相对更好的ARM指令集。

飞腾团队长期开展微处理器、操作系统、编译器、应用软件等方面的研究工作,积累了丰富的设计经验,具备较强的研发能力。飞腾CPU的成功实践也说明,只要具备稳定的设计团队和雄厚的CPU设计能力,更换指令集并不会给设计带来很大的挑战,生态环境才是决定技术路线的决定因素。飞腾CPU应用领域从原来的小众专用市场逐步扩展到通用市场,对生态环境成熟度的要求不断提高。飞腾CPU的几次技术路线变迁既符合技术发展趋势,也适应了这种对生态环境不断提高的要求。

观察者网:据说购买ARM指令集授权非常昂贵,而有消息称因为ARM想推广ARM 64指令集,所以给飞腾的授权非常优惠,能透露下飞腾购买的指令集授权的费用么?在ARM被日本软银收购的背景下,以现在中国和美国、日本并不算太和谐的关系,一旦发生制裁或ARM收紧授权,飞腾有什么措施应对?

张承义:由于合同受保密协议的法律约束,关于授权费等细节,我们不便透露。

软银收购并不能改变ARM是一家生态维护公司的本质,ARM的核心价值就在于它开放、共享、合作的商业模式。我想孙正义先生应该能看到这一点,在收购后的几次公开露面中,他也一直强调了延续ARM商业模式的重要性,并且强调软银收购ARM是在布局物联网领域,而物联网领域本身就是更开放的市场,更加需要合作共享的商业模式。

ARM大中华区高层也在今年成都的“中国芯”大会上,强调了中国市场对ARM举足轻重的地位,并展望了在不远的将来“ARM China”转变为“China ARM”的重大战略举措,我想ARM和中国的关系在软银收购后只会越来越紧密。飞腾获取的是ARM指令集架构授权,本质上是一种市场授权,在设计实现技术上并不受制于ARM。同时,国内华为、展讯、飞腾、华芯通都有ARM的指令集架构授权,作为一个整体所占的市场份额较大,因此对ARM在中国的商业授权政策具有较大的影响力和话语权。

本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。

责任编辑:宙斯
英特尔 芯片 国产芯片
观察者APP,更好阅读体验

“这是对西方的警告”,欧洲听到了

逮不逮捕?美西方“裂”得更严重了

不藏了?美防长自曝有“仁爱礁特遣队”

普京回应:是新型中程高超音速导弹

“中国在量子领域专利数第一,中美未来竞争更激烈”