“祛魅”英伟达:华为昇腾与谷歌TPU

来源:观察者网

2024-09-05 08:17

心智观察所

心智观察所作者

以心智观察新质

杰·葛德伯格

杰·葛德伯格作者

D2D Advisory咨询公司CEO

【人工智能和多大模型的迅猛发展带动算力需求日益激增,AI芯片应用前景愈加广阔。面对美国高端AI芯片对华封锁禁运,国产AI芯片正在加速突围。日前,美国D2D Advisory咨询公司CEO杰·葛德伯格(Jay Goldberg)拜访观察者网,就美国“芯片法案”的实施,英伟达在华业务以及中国AI芯片的前景等一系列问题,与心智观察所首席经济学家李波展开了一场深入对话。】

李波:欢迎葛德伯格先生——D2D Advisory咨询公司首席执行官。此外,你还是Sovereign Technology Partners(主权技术合作伙伴)的管理合伙人。第一个问题,给公司起“主权技术合作伙伴”这个名的想法是什么?

葛德伯格:当前每个人都在谈论数据和技术,但是我们想向客户传达的想法是,你个人的确拥有所有权,对你的技术和数据拥有主权——这是我们试图传达的一个重要概念,这是真正与这些客户产生共鸣的东西。

李波:在我们开始严肃问题之前,我想问,5年之后你重新看到的中国有什么印象?这仍然是一个你之前熟悉的中国吗?或者你看到了有一些新的元素加入?

伯格:两者都有。这是我第一次真正体验中国高铁,而且厉害的是你只要用一个应用程序订票即可,是在我上车前10分钟订的票!这太棒了,这很容易、太方便了,可以去任何你想去的地方。这是中国现代化和进步的有力象征!

但与此同时,我仍然可以很方便的下车。我下火车去找到一家面馆,在那里我可以花10元买到一碗很好米线或水饺,就像以前一样,我很喜欢这里的食物。非常令人兴奋的是,价格和食物的质量都不错。

李波:关于网络连接问题,当你来到中国后,你仍然可以连接到你境外的WhatsApp应用是吧?因为你使用的是美国手机号码,并不会和原来的网络脱离。

葛德伯格:是的。这对我来说有一种很奇怪的感觉。当我还是个学生的时候,我在1991年至1992年去了北京大学一年。那是在互联网和手机电话出现之前,我曾经不得不手写信件与家人联系,信件沟通时间很长,常常来回要几个星期。

现在我每天都可以和我的孩子们说话,即使我在出差旅行中。我当时根本没想到过,有朝一日来到一个不同的世界,数字沟通真的容易多了,很美妙。

美国“芯片法案”难达预期

李波:我们进入主题。最近我们看到数百亿美元规模的现金以支付拨款赠款的形式提供给了如英特尔、台积电、和三星这样的公司。你判断美国政府用这样力度来推动《芯片法案》,预期的结果会是什么?

葛德伯格:我认为芯片的作用必须结合实际情况来理解,“芯片法案”资金总额超过500亿美元,分五年拨付。如果你看看中国台湾的大型半导体公司,比如台积电,他们一年的资本开支就已经达到了400亿美元。

因此在5年时间内向几十家芯片制造公司分期支付500亿美元并不是一个很大的数字。我认为“芯片法案”意义在于向美国公司发出信号,表明他们将得到美国政府的某些支持、特别是监管方面的支持,其作用是政府承认半导体产业对美国很重要。我认为这种信号甚至比实际的拨款更为重要,因为资金并不多。

美国“芯片法案”资金流向(截止到2024年4月)

李波:带有很强的象征性意义,但这笔钱是实实在在的现金。这是一种直接补贴。而不是那种政府通过减税承诺来帮助的项目,对吧?

葛德伯格:这是真金白银,真的现金。但这很奇怪,因为这对美国来说并不常见。据我所知在过去的五六十年里,美国政府都不曾想这样做。美国的政治精英以及我们的美国政府它并不擅长提供直接补贴,过去整个国家也一直在长期避免出现这种情况。

李波:所以我不认为会再有另一部“芯片法案”。

葛德伯格:但目前的政策力度足够大、至少可覆盖5年。然后,我们将可能观察到政府引入一种所谓的产业政策,用来制约市场力量的自然运作。

李波:对此,主要的批评的声音是什么?

葛德伯格:现在预测美国政治中的任何事情都是非常困难的。所以我不知道4个月后会发生什么,更别说5年了。但现在,感觉并没有很大的支持动力去推动“芯片法案2.0”或者围绕半导体建立真正的产业政策框架。美国过去并没有国家产业政策规划的经验。也许未来可能会改变,但我感觉周边的人们现在并不想把它放在重要的位置。所以我不认为会有更多这样类似的法案出台。

英特尔代工的困境

李波:当你在中国旅行的时候,你有没有听说过英特尔代工服务(IFS)想要进入中国市场竞争的传言?您对英特尔所谓的IFS的这一举措有何评价?

葛德伯格:英特尔作为一家公司的确面临着真正的挑战。按照他们的经济模型中,他们需要拥有更多的客户,以支持不断推进其制造流程所需的研发投入。多年来,他们以为只要目前这样多的客户就足够了。可现在已经不是这样了。他们事实上需要再加上另一个同等规模的外部收入,将自己收入规模增加一倍,才能保持在摩尔定律的轨道上继续前进。

对我来说,他们到处在寻找客户,这是完全合理的。他们需要和每个可能的潜在客户介绍自己的服务。我不仅听说他们正在向中国的客户推销,他们也正在向世界各地的客户推销。

但代工的舞台中已经有了台积电和中国大陆的中芯国际。那么他们会怎么做呢?他们需要降低价格。

如果你和英特尔谈论他们的代工计划,他们喜欢强调的一件事是,在进入新的下一代制程时候,他们会淘汰旧的。相比之下,台积电的模式不一样的,每当他们增加了一个新的制程工艺,他们仍然继续销售旧的产品,你可以在台积电得到8代、10代等不同的工艺制程。这使得生意模型非常有利可图:因为你已经在账面上折旧了所有的设备,而现实中它仍然在继续运行。英特尔已经意识到他们也需要这样做。

所以我认为他们的很多业务都是建立在英特尔16纳米工艺上的。他们仍然有很多这样的能力。虽然你们的个人电脑不需要这些旧工艺。他们不需要将其用于数据中心,但还有许多其他地方,许多其他客户可以很好地利用它。所以我认为他们的重点是要填满这些以往的节点。

英伟达替代方案的茁壮成长

李波:根据你最新的播客,你谈到了NPU在AI应用场景中的广泛采用。是大家对于人工智能能力限度的探索激发了NPU和DSP的热度吗?

葛德伯格:我在这里必须要精确表述一下,NPU或神经处理单元是集成到另一个芯片中的一组电路。

而这些NPU是专门为做人工智能的工作负载而构建的。我想我们已经看到了很多设备厂家都在往这个方向发展,比如iPhone就是如此,但是苹果不称它为NPU,而称为神经引擎,他们已经在iPhone中使用了5到6年了。

我认为这会变得越来越普遍。我们已经看到高通和联发科都推出了内置NPU的手机。我们看到所有笔记本电脑的CPU制造商都开始这样做。现在这些AI PC,其实他们只是将NPU以某种方式放入CPU中。

李波:NPU的应用将如何影响大模型的训练?

葛德伯格:我认为大模型训练仍然会在大芯片如GPU上进行。但如果你把NPU的定义扩大到包括AI加速器,因为我必须如此精确表述,即认为AI加速器将是一个用于模型训练重要的、且独立的类别。

但现在,今天真的只有两家公司有着成熟的芯片研发体系来训练人工智能模型。英伟达的H100,还有谷歌的TPU,TPU只是另一种描述NPU的方式,然后还有阿里巴巴,Facebook,Meta,微软。他们都在建造自己的AI训练加速器。

Trillium,谷歌第六代TPUs

但这些加速器都不是那么先进有效,大多都还是第一代的模样。谷歌目前正在开发的是第七代TPU,连他们也只有一个版本用于模型训练。我认为Facebook和微软很乐意用他们自己的芯片进行训练,但我不认为他们现在能做到,这还需要很多年的时间。

李波:是的,我曾经听说过,如果你改变模型,你必须使用GPU,因为你做了浮点运算。一旦你排除了基于人工智能的云,那么实际上你不需要太多的GPU来增强计算能力。

葛德伯格:关于这个我的确可以说一说的。谷歌在大约七八年前推出了他们的TPU。当他们宣布时,风险投资界就开始争相投资那些人工智能加速器或NPU公司。有一大堆公司都是从那时候冒出来的。他们中的大多数现在已经不存在了。他们花了一年时间的确开发了一种新的AI芯片。可当芯片出来的时候,软件已经改变了,模型也变了。我们实际上已经看到了这样的事情正在重复发生。

很多初创公司公司急于拥有NPU设计能力,他们制造了一些很棒的芯片,在今天的工作负载下表现得非常好,但需要一年的时间才能将芯片在生产中实现落地,而此刻,软件生态系统和人工智能模型发展得又如此迅速。

最终将会出现的情况是,如果你制造了一个芯片目的是设计ASIC(专用芯片),服务特殊目的的人工智能加速器,这的确比GPU更好,对那个独特的模型来说是效率会很高,但你一旦改变了模型,哪怕只是改一点点,这些性能提升就可能突然消失。在这种环境下,任何购买GPU来训练他们模型的人就可能在冒一些风险。但如果稍微改变一下,这种效率的差异就会消失,这很复杂。目前我只想购买英伟达的芯片。这是相对安全的解决方案。

我认为谷歌的不同之处在于,他们之所以有这么好的芯片,是因为他们可以控制自己的软件。他们的芯片设计团队,可以与他们的软件团队非常紧密地合作——他们拥有设计芯片本身的软件人员。将来对软件的任何更改,芯片团队可以提前知道。

正在赶超中的华为

李波:如果我们用谷歌的例子,我们可以给华为最新发布的昇腾910芯片的未来一种评价吗?因为对于给定的某些指标和基准,对于某些计算任务,对于某些计算集群,它们的性能已经可以匹敌上英伟达的H20。华为也有能力用最近发布的鸿蒙操作平台来构建软件生态系统,所以它与谷歌的TPU芯片是否具有可比性?


华为昇腾910b

葛德伯格:让我先给出技术方面的答案,然后可能还有一个政治方面的答案。

技术上的答案是,我们必须非常谨慎地对待所谓的衡量基准。每个人都明白对于计算机、尤其是人工智能时不存在完美基准,特别是每个人都有自己的基准,这取决于你的目的。

可以有一个基准评价我是否相貌英俊身材很好等等,但这是一个相当主观的指标,所以要很小心。所以我倾向于看低基准参数的说服力。一般来说,这在很大程度上取决于你要做什么。

第二,是关于政治上的答案,美国限制英伟达能够销售到中国的GPU以及其它什么AI加速器,这将为华为这样的公司创造更多市场。对于华为的能力,我一点都不想低估。多年来,他们拥有非常非常强大的工程人才,拥有好的芯片设计设计师,他们真的是在很多领域都很先进。

我一直认为,考虑到华为受到的种种限制与困难,他们取得的成绩令人印象深刻,真的无法在技术上低估华为做出的努力。所以我认为美国的限制这的确给了华为的AI芯片一个很好市场机会。

李波:具体到英伟达的H20,英伟达为进入中国大陆市场而专门设计的这款产品,符合了美国的监管规定要求。你认为这是一个好的营销或销售策略吗?因为英伟达想要达到100万的销售目标。

葛德伯格:现在整个世界都想要更多的GPU。每个软件公司都希望拥有GPU来建立他们的人工智能模型,包括阿里、百度和腾讯。

所以他们如果目前能得到的较大规模数量的芯片,那么他们就会去试图获取。不过我不知道英伟达这一战略的可持续性有多大,因为美国政府说他们会继续行动,他们会继续不断地审查出口限制规定的有效性,因此这肯定会与英伟达想实现的销售目标产生摩擦。

“AI泡沫”是否正在到来?

李波:当你拜访这些中国公司时,是否看到这种趋势,他们会寻求购买额外数量的英伟达芯片吗?

葛德伯格:可不仅仅是中国公司,世界上每个人都想买更多的英伟达AI芯片。目前没有足够的GPU来满足全球的需求。因此,这种情绪正在推高价格

李波:这样高的股价可持续2到3年吗?如果我们发现,模型训练需求改变了,模型进入到推广适应阶段,也许不再需要这么多的计算能力。大家对AI的期待太高了。

葛德伯格:所以我们需要个什么东西来满足所有人对AI的更高期待。有几种视角可以回答关于英伟达股价是否过高问题。我认为,一方面,我们不应该忘记观察长时间的市场走向。我观察了很长时间,半导体行业永远是周期性的。有繁荣时期,也有泡沫破裂时候,很多人还没有看到过泡沫破裂时的各种场景。以为从2020开始,所有的半导体股票都是向上一路挺拔,其实不是这样。

李波:这是个很长的周期了。

葛德伯格:对的,所以这已经是一个很长的周期。最终,它会掉头下降。但我认为必须承认人工智能是真实的,重要的。因此,即使有一天我们拥有的GPU超过了人们目前的需求,但我们仍然需要大量额外的GPU,所以,周期将会变化,但对于AI的看好这个基本趋势将仍然在那里。

现在,我认为软件带来的不确定性这个问题很有趣,我几个月前在我的播客上谈到这个。软件的魔力之一是,如果你是一个非常聪明的软件工程师,你可以找到更好的方法来做一些事情,然后你实际上可以大大减少对硬件和CPU的GPU的依赖。历史上,我们已经看到了很多次这样的事情。

李波:云计算实际上是基于软件的,它不一定需要最好的硬件。

葛德伯格:对的。因为谷歌创业起步并没有钱。亚马逊起初也没多少钱,阿里巴巴那时候也没钱去买高配置的硬件。

我再回顾一下30年前一个案例。那时候你制作计算机图形,你需要购买一台高配置的Silicon Graphics芯片图形公司的工作站,那个时候这是非常昂贵的。然后有个游戏开发工程师想出了非常聪明的办法,这个创新直接减少了两个数量级的三维图形所需的计算量。所以突然之间,人们不再需要昂贵的工作站来处理图形。你可以在你的笔记本上运行计算。像一个知名的游戏雷神之锤,它做得太好了,但这个软件创新干掉了所有其他搞图形计算的硬件公司。

李波:所以不能排除这种可能性的再次发生。

葛德伯格:但在这样的变化之前,英伟达仍将是所有这一切的主角。而且他们非常聪明。英伟达的CEO黄仁勋很聪明,也很有远见。所以他可能会预见到这一点,并找到一些新的策略。

中国“产能过剩”的另类叙事

李波:但另一方面,美国政府也在评估从中国进口的成熟半导体元器件,因为中国在成熟加工部分是具有明显优势的。你认为这种担心成立吗?

葛德伯格:我认为美国的政策制定者甚至没有意识到中国即将上线的成熟制造工艺产能的数量,他们不太知道这事。到目前为止,美国已经实施的大多数政策都是针对半导体制造领先技术的。

制定这些政策的人瞄准的实际上是16纳米以下的先进制程。对于16纳米以上的东西,就像一句英国谚语,谷仓的门早已经打开了,意思是试图困住的那匹马已经逃跑了,我们对此无能为力。但在美国和欧洲,人们确实越来越意识到,中国所谓的产能过剩是一个大话题。当你看到中国的半导体的不同规格的“后尾产能”(trailing)和制造能力时,有太多很成熟的产品规格的产能上线。所以这是一个从质量、成本、价格三方面中国大陆的竞争优势。

去年10月份美国新的出口管制决定出台,最初想法是围绕国家安全的,至少美国当局他们是这么说的。但是当我们开始谈论成熟工艺的“后尾产能”时,这是一个贸易问题。所要做的就是拿出旧的术语,比如倾销和反竞争。

李波:业内也不能轻易地在中国以外的地方获得这些成熟制程的芯片吧? 就连欧洲也依靠进口中国成熟的半导体组件。

葛德伯格:根据我粗略的数学计算,考虑到时间,成熟制成的组件制造市场也许仍然有平衡的可能,担忧的问题时中国有如此多的产能即将投产。在今天的美国政治舞台上,这不是一个主要问题,当然可能再过几年就会了。

东南亚与半导体供应链

李波:我们看到半导体行业越来越积极地走向东南亚。传统上马来西亚是该产业最受欢迎的目地点。那么,东南亚国家的独特优势是什么呢?他们真的能取代中国吗?


国际半导体大厂在东南亚的产业布局(Digitimes,2021)

葛德伯格:一个简短的回答是他们很难取代中国。中国在制造业方面的专长是目前世界上其他国家所没有的。如果你想制造任何电子产品,任何硬件,在中国以外的地方做都是困难的。

从我的第一手经验中了解到,我曾与一位客户合作,他想在美国制造一台设备,想进入到政府业务中。然后,这个过程的每一步都很痛苦,他们必须找到一个制造商,然后他们必须向制造商展示这个过程会是什么样子。

然后他们不得不让别人来做设计,让别人来做零配件。然后制造商找到了一些设备,他们不知道如何使用。所以我的客户必须租用设备,把它运到工厂,培训他们的员工如何使用。光是完成第一个原型就花了9个月。如果我们去深圳,我们可以在6周、8周内从设计到原型再到生产。世界上其他任何地方都无法做到这一点。

将生产转移到马来西亚、菲律宾或泰国时,这些国家中的每个都只能完成一小部分。所以,这会是个非常复杂的运营战略,把10个或12个国家组合在一起,把半成品搬运到各个地方处理,但这涉及到到很复杂的流程。我认为目前美国公司以及欧洲公司,已经认识到他们对中国有非常高的依赖度。从政治上讲,这对他们来说并不理想,但实际上也没有人愿意完全依赖一个供应商。

供应链有一些转移的迹象,某些公司将开始寻找替代供应链,并在某些地方移动小块业务。

中国花了40年才建成今天的成就。我认为把供应链转移到其他地方至少要花同样长的时间。对于马来西亚政府和泰国政府以及所有这些南亚和东南亚国家来说,当然这是一个好时机,他们会得到一些转移过去的制造环节。

李波:但这种行为是否对行业的人力资本投入也有特定的要求呢?

葛德伯格:这是一个非常重要的观点。没有地方能够像中国那样提供如此多有优质教育背景的工程人才,中国每年都有大量的STEM工程师走出校门。世界上没有一个地方有那么多工程师。在很多地方,即使能找到一些,质量也不高。所以这很难复制。

李波:这是一个非常有见地的结论。所以我们需要和政客沟通,保持供应链的顺畅运作,我们知道美国国家自己需要保护一些敏感的安全区域,但对于正常的商业部分来说,不需要再打贸易战。我们仍然想要一个正常运转的世界。所以这也是你这次旅行的任务,来中国调研,然后去其他国家看看。

葛德伯格:这里有很多有趣的公司,我很高兴我来此地参观。

李波:祝你在中国的旅行成功。感谢来到我们观察者网的演播室。

本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。

责任编辑:李昊
观察者APP,更好阅读体验

特朗普威胁巴拿马“收回”运河,还扯上中国

“朔尔茨对波兰总统怒吼,在场领导人都惊了”

被当面打脸,日铁急了

受中国影响,澳企要在稀土加工业务上发力了

挪用学生餐补、欠薪欠保…审计署发布报告涉5380多亿