对话DEEPX创始人:当AI芯片从云端走向现实物理世界
来源:观察者网
2026-01-27 09:54
2026年1月,拉斯维加斯的CES展会刚刚落幕,在展会上一家名为DEEPX的韩国AI芯片公司连续第二年被评为“Must-See Booth”。
继而,1月22日,在上海举行的“百度文心Moment”大会上,DEEPX创始人兼CEO 金錄元(Lokwon Kim)正在向中国开发者详述着一个不同寻常的演示:两块芯片上各放置一块黄油,运行相同的AI负载——几分钟后,竞品芯片上的黄油完全融化,而DEEPX的芯片上,黄油纹丝不动。
这个看似简单的“黄油测试”,背后隐藏着AI产业正在发生的一场深刻变革。当全球科技巨头们还在为数据中心投入数万亿美元,竞相建造更大规模的GPU集群时,DEEPX却选择了一条截然不同的道路:让AI从云端走下来,真正嵌入到物理世界的每一个角落。
在百度大会的间隙,观察者网·心智观察所与金錄元进行了一次深度对话。这位曾在Apple领导A11 Bionic芯片开发、在IBM T.J. Watson研究中心从事AI处理器研究的工程师,谈起AI时却像一位哲学家:“我曾读到一句话——人类的苦难源于缺乏智慧。2015年,我意识到AI可能是人类克服缺乏智慧的终极解决方案。”正是这个信念,让他在2018年创立了DEEPX,并将其定位为“帮助人类向真正智能文明演进的公司”。
DEEPX 创始人金錄元
从“不可能”到“必然”
当被问及DEEPX的核心技术突破时,金錄元并没有急于展示复杂的架构图或性能参数,而是从一个更本质的问题切入:“为什么今天的生成式AI只能存在于数据中心?”
答案显而易见:功耗、散热、成本。一块主流GPU运行AI推理需要消耗300瓦以上的功率,相当于三台家用电脑同时运行。这意味着你需要庞大的散热系统、稳定的电力供应,以及高昂的运营成本。“这种架构注定了AI只能是‘远程智能’——你必须通过云端访问它,承受延迟,支付数据传输费用,并且永远依赖网络连接。”金錄元向心智观察所阐述。
DEEPX的DX-M2芯片打破了这个魔咒。它能在5瓦功耗下运行200亿到1000亿参数的大语言模型,相当于一个手机充电器的功率。“5瓦不只是一个数字,”金錄元强调,“它是物理可行性的分水岭。在这个功耗水平下,设备可以用电池供电,不需要风扇或散热片,也不会出现热节流。它把讨论从‘理论性能’转向了‘安装可行性’。”
这种能效比的提升并非来自简单的工艺进步。金錄元解释道,DEEPX的方法论类似于从科学计算器到简易计算器的演进:“CPU就像科学计算器,可以执行各种类型的计算任务,但每个操作都很复杂。GPU专注于图形并行处理,减少了操作种类但增加了并行单元数量。而NPU则只专注于AI运算——我们深入研究AI数学运算的本质,剔除所有不必要的算子,针对每个应用场景,对处理器构架进行有针对性的剪裁与优化,这种“极简主义”哲学让DEEPX能够在相同工艺节点下实现数量级的能效提升。更重要的是,这家公司已经为这套方法论建立了坚固的专利护城河。据《福布斯》报道,DEEPX在美国注册的NPU专利数量已经超过高通、ARM、英特尔和英伟达,全球专利申请超过400项。“我们不只是保护具体的电路设计,”金錄元透露,“我们保护的是NPU的核心工作原理——就像高通当年用CDMA专利建立的地位一样。”
从演示到量产:50个项目的实战考验
技术演示与商业落地之间,横亘着一道巨大的鸿沟。在AI芯片领域,这道鸿沟尤其宽广——许多初创公司拥有漂亮的PPT和实验室数据,却无法通过量产的四道关口:稳定性、可复制性、供应链、软件维护。
DEEPX的第一代芯片DX-M1已经跨越了这道鸿沟。金錄元透露,基于DX-M1的产品已经在全球获得超过50个量产项目,覆盖机器人、国防、智能家电等领域。”量产验证的是供应链、质量控制和成本稳定性,“他说,“2026年将是DEEPX通过规模和实际案例建立信任的一年。”
这种信任正在转化为实实在在的订单。现代汽车机器人实验室将在2026年开始量产搭载DEEPX芯片的MobED和DAL-e平台,初期预计出货1万台。POSCO(浦项制铁)这家韩国钢铁巨头同时推进着9个量产项目,从工厂自动化到物流系统,从工业事故监控到自动叉车。
“POSCO DX制铁的案例很能说明问题,”金錄元解释,“他们之前尝试用GPU做工厂自动化,结果发现人工成本竟然比GPU卡便宜——这是很悲哀的现实。但当他们使用我们的芯片后,芯片价格已经低于人工成本,这才让大规模部署成为可能。”
最大规模的部署来自中国大陆。在与百度的合作中,DEEPX预计2026年将在中国市场出货约4万台,应用于OCR相机、数据解析系统和无人机等场景。“ 百度 PaddleOCR 团队长期在寻找 真正适配其模型与应用需求的 AI 芯片解决方案,”金錄元回忆,“当他们测试我们的芯片时,发现性能比300瓦的GPU卡高出近5倍,而功耗只有5瓦。这才让他们相信,AI真的可以从数据中心转移到边缘设备。”
这些量产项目的共同特点是:它们都在解决GPU无法解决的实际问题。“我们采访过全球700多家公司,每年与300家潜在客户深度交流,”金錄元说,“他们的需求很明确:功耗和成本最多比现有方案高20-30%,但必须达到GPU级别的性能。如果你要求他们接受双倍价格或双倍功耗,那就需要CEO级别的决策,因为这意味着整个系统架构要重新设计。”
理解这个“20-30%原则”是DEEPX成功的关键。它意味着技术必须适配现有的产品形态和成本结构,而不是要求客户为技术改变一切。
生态的力量:当芯片成为平台
在CES 2026上,DEEPX宣布了一个重要举措:与Ultralytics和百度共同建立“开源Physical AI联盟”。这不是一个简单的合作声明,而是对AI产业范式的深刻理解。
“生态系统不是靠公告建立的,而是靠实用性建立的,”金錄元说。他清楚地知道,一家芯片公司要想真正成功,必须让开发者能够像使用现有工具一样轻松地使用自己的产品。这就是为什么DEEPX选择与Ultralytics合作——后者在视觉AI工作流中拥有主导地位,而视觉是Physical AI的起点:从“看到”到“判断”再到“行动”。
与百度的合作则聚焦于“工业工具链和部署经验”。在百度“文心Moment”的演讲中,金錄元详细展示了这种合作的四个层次:首先,将百度的PaddleOCR模型移植到DEEPX的NPU上,实现比GPU高10倍的能效;其次,建立面向全球开发者的优化算法库;第三,利用生成式AI工作流如Comate,让非工程师也能开发AI应用;最后,准备在5瓦功耗下运行ERNIE这样的大规模生成模型。
这个生态策略背后有一个更宏大的愿景。金錄元在演讲中提出了一个引人深思的问题:“如果我们能在不按比例扩建数据中心的情况下,扩展AI能力呢?”他展示的数据显示,当更大规模的生成式AI模型能够在本地设备上运行时,必须发送回数据中心的AI流量会急剧下降:“换句话说,设备端模型能力的每一步进步,都会降低云依赖、降低成本、降低能源开销。”
这不仅仅是技术愿景,更是对全球AI基础设施困境的回应。当前,全球资本市场正在动员数万亿美元扩建AI数据中心,但这种轨迹带来了两个复合风险:不断增长的经济负担和环境足迹。“如果我们能在本地处理200亿到1000亿参数级别的模型,就能减少80%以上的数据中心流量,”金錄元说,“这相当于在不新增AI服务器的情况下,将全球AI基础设施虚拟扩展了五倍。”
为了实现这个愿景,DEEPX正在采用2纳米工艺设计第二代芯片。“我们是全球唯一一家获得2纳米技术设计权限的初创公司,”金錄元向心智观察所透露。这个选择并非偶然——当台积电因为客户优先级无法为DEEPX提供先进工艺时,三星看到了这家公司的潜力,特别批准了2纳米技术的使用权。“第一代产品5纳米的成功,证明了我们的能力,”金錄元强调,“我们需要最先进的工艺来实现最低功耗,否则市场不会认可我们的技术。”
中国大陆:Physical AI的最重要战场
当话题转向中国市场时,金錄元的语气变得格外认真。“坦率地说,我在美国工作了10年,在IBM、思科、博通和苹果都待过。在生成式AI模型、AGI和ASI层面,美国公司领先全球,因为他们拥有大量GPU。”他着重指出,“但在Physical AI和边缘AI领域——机器人、智能工厂、各类制造应用—— 随着人工智能进入新一轮发展阶段,中国正逐步成为全球公认的技术引领国家之一。”
这个判断基于几个关键观察。首先,中国拥有强大的AI平台生态。“DeepSeek、百度、阿里云的开源模型在我看来非常有竞争力,”金錄元说,“中国市场拥有Physical AI和边缘AI所需的高质量AI模型。”其次,中国拥有全球规模最大、种类最齐全的制造业。“这让中国能够将传统制造业转型为AI赋能的产业,最大化生产力——这正是中国政府想要通过AI实现的目标。”
但最重要的是,中国市场展现出了其他市场难以匹敌的执行速度和规模。金錄元分享了一个令他印象深刻的细节:“在韩国,我问PCB制造商一年能生产多少块板,他们说几千块。但在中国,答案是几十亿块。”这种规模差异直接影响了商业决策的灵活性。“在韩国,如果我要求更换一个价值1美元的元件,对方会问‘为什么要这么做?这才2000美元的订单’。但在中国,对方只会说‘好的,可以’,因为这可能是500万美元的订单。”
这就是为什么DEEPX把超过50%的资源投入中国市场。“ 从全球视角来看,中国在 Physical AI 和边缘 AI 领域已成为重要的技术与市场引领国家之一,尤其在产业化速度和应用广度方面表现突出。”。这种判断也体现在DEEPX的供应链布局上——虽然核心芯片在三星代工,但模组制造选择中国合作伙伴。公司已经与神州数码、大联大等中国顶级分销商建立了合作关系。
对于中国正在推进的“新质生产力”政策,金錄元表现出了浓厚兴趣。“这个政策强调的‘高技术、高效率、高质量’发展哲学,以及通过创新实现全要素生产力的提升和绿色发展,给我留下深刻印象,”他说,“对于像DEEPX这样的AI芯片公司,能源效率最大化和高性能计算能力,既是生存课题也是核心目标。”
他特别提到,DEEPX的技术方向与“新质生产力”的理念天然契合。“中国正在推进‘AI+’倡议和人形机器人等未来产业,构建庞大的算力基础设施。DEEPX的边缘AI解决方案旨在降低功耗的同时实现最高效率——这与新质生产力追求的资源消耗削减和环境影响最小化在技术上是一致的。”
在百度的演讲中,金錄元用一个清晰的定义解释了Physical AI:“让智能直接嵌入物理系统,使机器不仅能够感知,还能够在现实世界中自主推理和行动。”
DEEPX在“文心Moment”大会上获得“2025星河产业应用创新奖”
这个定义揭示了Physical AI与传统视觉AI或云端大模型的本质区别。“传统视觉AI主要专注于识别和分类等感知任务。大型云端模型则优先考虑规模和中心化计算能力,”金錄元解释,“Physical AI从根本上不同——它必须在严格的现实约束下运行,包括有限的功耗、实时响应性、安全性和长期可靠性。”
这就是为什么DEEPX将自己定位为“Physical AI基础设施公司”而非简单的芯片公司。“让Physical AI可规模化,仅有技术是不够的,”金錄元说,“它需要一个完整的生态系统——模型、工具、硬件和部署工作流无缝协作。”
在工业场景中,这种方法带来的价值是显而易见的:更低的延迟、更高的可靠性、降低的运营成本,以及能够在真实环境中持续运行的AI系统。“Physical AI就是智能不再停留在理论层面,而是成为可操作的基础设施,”金錄元总结道。
这个愿景正在照进现实。在POSCO DX制铁的工厂里,DEEPX的芯片正在监控危险作业场景;在现代汽车的实验室里,人形机器人搭载着这些芯片进行自主导航;在百度的合作项目中,无人机和机器人正在用5瓦功耗实现GPU级别的AI能力。
从芯片到文明:一个工程师的终极使命
采访接近尾声时,心智观察所请金錄元用一句话概括DEEPX对中国合作伙伴的核心价值。他的回答超出了商业范畴:
“我们都见证了计算的演进——从巨型主机到PC、笔记本电脑、智能手机,现在甚至是日常家电。AI也将走同样的道路——从大规模数据中心转向无处不在的小型设备。但对我来说,这些AI半导体代表的不仅仅是创新技术——它们是人类文明下一阶段的催化剂。是的,我们设计小芯片,但这些芯片内部蕴含着人类下一次伟大飞跃的种子——迈向真正智能的社会。”
这位曾在全球顶级科技公司工作的工程师,谈起自己的使命时曾经这样说:“我的抱负是推动人类历史上最伟大的转变——将智能带入物理世界的每一个角落。这就是为什么,如果有一天我决定让DEEPX在全球资本市场上市,我希望上市当天的横幅上写着:‘迈向人类文明的未来’。”
这不是空洞的口号。从CES的连续获奖,到EE Times的年度最佳产品,再到达沃斯世界经济论坛的邀请,DEEPX正在获得全球认可。公司已经吸引了来自纽交所、纳斯达克和新加坡交易所的上市邀请,并招募了前瑞银副总裁Young Cho担任CFO,以及来自波士顿咨询的战略人才。
但金錄元的焦点始终在业务基本面上:“重点仍然是业务基础——扩大量产规模、获得可重复的客户、扩展全球生态系统。”他把IPO视为责任的开始而非终点:“如果DEEPX上市,我们希望这是一次配得上‘迈向人类文明未来’使命的上市。”
在Physical AI这个全新战场上,一家来自韩国的初创公司,正在用5瓦特的功耗,撬动一个可能价值千亿美元的市场。但在CEO金錄元看来,这场革命的意义远超商业成功——它关乎人类如何从“无知”走向“智能”,如何让AI真正成为文明演进的基础设施。