成立3年后首发新品,壁仞科技7nm芯片不输英伟达4nm旗舰?
来源:观察者网
2022-08-10 19:14
【文/观察者网 吕栋 编辑/周远方】
全球通用GPU算力纪录首次由一家中国企业创造?
8月9日,在距离成立三周年还有一个月之际,壁仞科技在上海发布首款通用GPU芯片BR100。据该公司透露,这款采用台积电7nm制程的芯片,单芯片峰值算力可达到每秒千万亿次浮点运算,也就是PFLOPS级别。甚至与英伟达最新发布的4nm旗舰相比,BR100性能数据也毫不逊色。
图源:壁仞科技(下同)
由于具有灵活性高、应用场景广泛等特点,通用图形处理器(GPGPU)近几年引发大量资本和人才的追捧,国内也相继涌现出天数智芯、壁仞科技、摩尔线程等多家创企,业内融资纪录屡屡被刷新。但在一阵市场喧嚣过后,一家企业能否经受住考验最终还是要看技术和产品。
在壁仞科技之前,天数智芯已在去年3月发布首款7nm云端训练GPGPU产品,第二款产品7nm云边推理芯片“智铠100”也于今年5月成功点亮。更激进的是摩尔线程,成立不到300天,该公司便于去年11月宣布首颗国产全功能GPU研制成功,同时完成A轮20亿元融资。
在高技术壁垒领域,进展过快难免引发质疑。在摩尔线程宣布不到一年就研发出全功能GPU后,有自媒体撰文直言:“看到国产GPU快速发展,确实是一件振奋人心的好事,但是在振奋之余也应该有所警惕。仅仅300天就能从0开始研发出首颗国产全功能GPU芯片,这究竟是弯道超车还是一场骗局。”
但无论争议的结果如何,GPGPU芯片本身的价值并不容小觑。头豹研究院TMT行业高级分析师霍瀚松在接受观察者网采访时指出,GPGPU是云计算行业的关键芯片,而云计算是中国数字经济发展提供算力等资源的基础设施,掌握GPGPU技术及一定的行业主动权是推动中国信创乃至数字经济发展的关键。
首款产品不输英伟达旗舰?
与消费电子领域的图形GPU并不相同,通用GPU是略掉GPU中图形专用的硬件,保留通用计算的部分。
“BR100的正式发布,标志着全球通用GPU算力纪录第一次由一家中国企业创造,中国的通用GPU芯片正式迈入‘每秒千万亿次计算’新时代。”8月8日,壁仞科技创始人、董事长、CEO张文在发布会上说道。
当天,上海市闵行区区委书记陈宇剑,区委副书记、区长陈华文,上海市经济和信息化委员会一级巡视员傅新华,工信部科技司原司长胡燕,闵行区副区长李锐等人均参加了发布会。
壁仞科技成立于2019年9月,名字取于武夷山“壁立万仞”巨石。
从注册成立到2021年3月完成B轮融资,壁仞科技在短短18个月里融资额超过47亿元,并吸引了前AMD全球副总裁李新荣、高通GPU团队前负责人焦国方、海思自研GPU负责人和首席架构师洪洲等人加入。
作为公司掌舵人,张文本身并没有GPU技术背景。他拥有哈佛大学法学博士履历,曾担任商汤科技总裁,主导过商汤科技总部落地上海。2019年,在看到国内有巨大的AI芯片市场,但90%以上依赖国外产品后,张文决定创立壁仞科技。
凭借惊人“吸金”和“招揽人才”能力,张文在业内也获得“中国第一大猎头”、“融资机器”等称号。在这些称号背后,市场更期待经过三年研发后的壁仞科技,能拿出什么样的产品。
据壁仞科技披露,BR100系列今年3月一次点亮成功。该芯片采用台积电7nm制程,集成770亿晶体管,使用Chiplet(芯粒)技术,2.5D CoWos封装技术,芯片面积达到1000平方毫米。性能上,BR100芯片16位浮点算力达到1000T以上、8位定点算力达到2000T以上,单芯片峰值算力达到PFLOPS级别。
“大算力芯片创业至少要15亿元起。而且芯片行业本来就是资金密集、人才密集和资源密集的行业,壁仞科技经过了1065天研发,正式发布的首款GPU,打破了全球通用GPU算力纪录。”张文在发布会上说道。
根据发布会上的数据,壁仞科技BR100对比英伟达在售的7nm制程旗舰GPU“A100”,在Int8、BF16、TF32/TF32+、FP32数据格式下至少有3.3倍的峰值性能优势,在FP32数据格式下性能优势更是达到13.1倍。
即便与今年3月最新发布的英伟达H100 GPU相比,BR100在各种数据格式下也不乏性能优势。要知道,H100是英伟达专门为超级计算机设计的GPU,该芯片采用台积电4nm工艺,拥有800亿个晶体管。
在发布H100时表示,英伟达CEO黄仁勋曾表示,20个H100 GPU便可承托相当于全球互联网的流量,使其能够帮助客户推出先进的推荐系统以及实时运行数据推理的大型语言模型。
“BR100之所以能够实现国际领先的算力,最底层的支撑来源于自主原创的芯片架构。”张文在发布会上说道。
据壁仞科技联合创始人、CTO洪洲介绍,“壁立仞”架构以数据流为中心,对数据流进行深度优化,通过六大技术特性,比较完整地解决了数据搬移的瓶颈和并行度不足的问题,使得BR100芯片在给定的工艺下实现了性能和能效的跨越式进步。
洪洲还提到,BR100采用了Chiplet设计理念,让芯片总面积可以突破光罩尺寸对单芯片面积的限制,集成更多的算力和通用性逻辑;此外,通过缩小单个计算芯粒的面积,还可以同时提升产能与良率,进而极大地降低硅片的成本,并支持更灵活的产品策略。
在现场,壁仞科技还发布了BR100系列的另一款产品BR104,该款芯片同样基于“壁立仞”架构,拥有1个计算芯粒,性能约为BR100的一半,“同样超越了国际厂商的在售旗舰产品”。
除了BR100通用GPU芯片之外,壁仞科技还发布了OAM服务器——海玄,以及基于BR100的OAM模组——壁砺100,基于BR104的PCIe板卡产品——壁砺104,以及自主研发的BIRENSUPA软件平台,该平台支持主流深度学习框架。
壁仞科技联合创始人、总裁徐凌杰透露,BR100系列芯片以及相应硬件计算产品将于今年年底量产。
对于GPGPU这种大算力芯片来说,量产只是第一步,最重要的还是生态建设和商业化落地。
在本次发布会上,壁仞科技宣布加入由百度飞桨发起的硬件生态共创计划。除此之外,平安科技宣布将以平安云为基础,结合壁仞科技产品共同打造高端通用智能的算力平台,中国移动也“希望壁仞科技的新品与中国移动的算力网络整体的发展深度适配”。
生态建设方面,壁仞科技在兼容客户现有基础设施的同时,也试图打造自己的生态。据该公司披露,壁仞科技开发者云也已经正式上线,官网上已开放邀测。
“卖出去是另一个挑战”
在当前国内GPGPU赛道中,壁仞科技只是竞争者之一,天数智芯、沐曦集成电路、登临科技、摩尔线程等多个玩家同样涉足这个领域。而在他们背后,同样是大量的资本和人才。
就在上个月,天数智芯完成超10亿元人民币的C+轮及C++轮融资,其中C+轮由金融街资本领投,C++轮由厚朴投资和旗下的厚安创新基金领投。几乎同时,沐曦集成电路宣布完成10亿元人民币Pre-B轮融资。今年初,登临科技也宣布完成B轮融资,金额未披露。
而在去年11月,摩尔线程A轮20亿元融资中,上海国盛资本、五源资本、中银国际旗下渤海中盛基金、建银国际、前海母基金、招商证券等知名机构也纷纷现身。
由于GPGPU的技术门槛高,融资金额大,核心团队的能力和建制成为吸引投资的重要指标。
纵观目前国内的相关企业,无一不有精英团队加持,核心团队几乎全部来自行业巨头,如AMD、英伟达、三星、华为、高通等。
“技术密集、人才密集是芯片行业的特点。”头豹研究院TMT行业高级分析师霍瀚松在接受观察者网采访时指出,与此同时,GPGPU是一个门槛极高的领域,全球市场基本上被英伟达和AMD两家国际龙头掌控。
以中国云端AI训练芯片市场为例,英伟达2021年的市场份额在90%左右。
“从资本角度来看,GPGPU是一个规模巨大、回报丰厚的市场,极具投资价值,而高级人才经过过去将近二十多年的学习已形成了一定的积累,推动技术发展则离不开资金的投入。两者向该领域集中,实际上是打破该领域被国际龙头统治的僵局,从而实现国产替代的一次良好机遇。”霍瀚松表示。
从产品落地进度来看,成立于2015年底的天数智芯目前相对较快。据该公司披露,截至2022年3月底,其首款7nm云端训练通用GPU产品--天垓100已实现销售订单近2亿元。2022年5月,该公司第二款产品——7nm云边推理芯片“智铠100”成功点亮。
天数智芯7nm云端训练芯片BI 拍摄/观察者网
2017年底成立的登临科技,曾在去年6月发布过首款GPU+产品送样的消息。此后该公司还曾透露百度飞桨适配登临GPU+系列芯片、与视觉科技企业极视角达成战略合作等信息。
“深度学习算法,数据中心、智能驾驶等对算法需求高的行业,皆是GPGPU的目标应用领域,因此这种芯片也是数字经济时代不可或缺的一块芯片。在‘东数西算’工程及国家政策的驱动下,中国市场对GPGPU有着巨大需求。”霍瀚松指出。
第三方机构预测,到2025年,中国GPGPU芯片板卡的市场规模将达458亿元,年复合增长率高达32%。
但随着资本和人才的聚集,市场在关注GPGPU“烧钱”的同时也少不了质疑。毕竟落地速度最快的天数智芯,在成立六年多、融资数十亿后目前也仅实现了2亿元的订单,最终能有多少利润落袋不得而知。
“做出来本身就是挑战,卖出去又是另一个挑战。产品是否符合市场和客户的需求,是否有客户愿意为买单,可能比做产品的难度更高。”云岫资本董事总经理符志龙曾坦言。
在2021年世界人工智能大会上,天数智芯高管在接受观察者网采访时也曾表示,一个企业首先要考虑怎么自负盈亏,不能只想着去烧投资者的钱,最终还是要靠产品从市场上获取回报,这样才能可持续发展。现在不少企业都把产品规划做的很大,如果不能尽快实现造血机能的话,并不是什么好事情,负担会变得很重,再加上现在大家对估值期望都很高,如果业绩上支撑不了的话,就会变得很难办。