通义千问主力模型降价85%,阿里云CTO:仍有大幅降价空间
来源:观察者网
2024-09-23 16:36
继5月阿里云通义千问GPT-4级主力模型Qwen-Long价格直降直降97%后,在今年的云栖大会上,阿里云再度官宣大降价。阿里云百炼平台上的三款通义千问主力模型再次降价,其中Qwen-Turbo价格直降85%,低至百万tokens 0.3元。
针对本次降价是否会引发价格战,阿里云CTO周靖人对观察者网表示,大模型价格并不存在“足够低”一说,并表示“相比未来庞大的应用,还太贵了”。
值得注意的是,除了降价外,阿里云也带来了通义千问模型的全方位升级,在本次云栖大会上,阿里通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o。通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API,权威评测显示Qwen-Max表现接近GPT-4o,数学能力、代码能力则超越了GPT-4o。
每一次降价都是“非常严肃的过程”
今年5月21日,阿里云抛出重磅炸弹:通义千问GPT-4级主力模型Qwen-Long,API输入价格从0.02元/千tokens降至0.0005元/千tokens,直降97%。这意味着,1块钱可以买200万tokens,相当于5本《新华字典》的文字量。这款模型最高支持1千万tokens长文本输入,降价后约为GPT-4价格的1/400,击穿全球底价。
而仅仅在不到4个月之后,阿里云百炼平台上的三款通义千问主力模型9月19日再次降价。Qwen-Turbo价格直降85%,低至百万tokens0.3元,Qwen-Plus和Qwen-Max分别再降价80%和50%。阿里云表示,降价后,Qwen-Plus同等规模较行业价格低84%。
针对降价的原因,阿里云CTO周靖人对观察者网表示:“我们降价主要是通过技术的优化,包括云的基础设施提升、模型本身结构化的提升,都能够把模型的推理成本进一步降下来。只有这样,才能更有效地展开各种各样的AI应用。”
周靖人还强调:“我们的每一次降价都是一个非常严肃的过程,要从整个产业发展,开发者、企业用户的反馈等各个方面进行权衡,这和我们的模型开源策略是一脉相承的。”
值得注意的是,自首次宣布降价后,阿里云百炼付费客户数较上一个季度增长超过200%,一批企业和开发者放弃私有化部署,选择直接在百炼上调用各类AI大模型。不过,包括阿里云在内,各个云厂商的竞相降价甚至免费的策略也在5月份让该行业迎来一波“价格战”。
对于阿里是否在主动挑起价格战的问题,周靖人认为这并不是价格战,并以手机上网资费进行了比喻:“今天上网多少钱一个月?我的手机上网套餐不到200元,今天200元能用几十个G的流量,要是在二十年前用这样的流量,估计得破产。所以,今天的价格不存在说已经足够低了,相对未来庞大的应用来说,还太贵了。”
阿里云副总裁张启对此补充道,现在的AI相当于1996年左右的互联网,也就是在BBS时代,那时的上网资费很贵,后来互联网和移动互联网持续发展,运营商大力去搞基建,现在我们也在搞AI大基建,把资费降下来,才有可能去谈未来应用的爆发,“所以这个长远的目标才是我们考虑更多的事情,而不是说今天一定要算一个账,马上就能够赚多少钱,或者马上又到什么样的一个目标。”
持续建设开源生态,阿里云发力AI大基建
除了大幅降价,阿里云在本次云栖大会上现场展示了AI驱动的阿里云全系列产品家族升级,包括最新上线的磐久AI服务器,阿里云ACS首次推出的GPU容器算力,阿里云CPFS文件存储,人工智能平台PAI等。
周靖人表示,阿里云正在围绕AI时代,树立一个AI基础设施的新标准,全面升级从服务器到计算、存储、网络、数据处理、模型训练和推理平台的技术架构体系,让数据中心成为一台超级计算机,为每个AI和应用提供高性能、高效的算力服务。
而开源则是实现这个AI新基建的最大推手。
目前,阿里云是中国大模型开源力度最大的大型科技公司,开源战略仍在持续。据周靖人介绍,当前阿里云开源的 Qwen 系列大模型,下载量突破 4000 万,衍生出超过 5 万款大模型,成为仅次于美国 Llama 的模型群。
过去两年,阿里云还在持续搭建开源模型社区魔搭,目前已经上架上万款各类开源模型供开发者下载,开发者数量超过 690 万。
而阿里云的开源也已经使得自己和产业深度绑定,并为具身智能和自动架势等新兴产业催化出了大量成果。
阿里云副总裁张启表示,“今天已经有很多机器人的创业公司在用通义的开源或闭源模型,把它装到机器人上变成机器人的五官、大脑,这就是我们跟产业的关系。不是说阿里云非要自己做自动驾驶、机器人,例如小鹏的P7+本次亮相云栖大会,其自动驾驶所有算力的解决方案都是在跟阿里云合作,我们为小鹏提供算力、提供座舱上的模型能力,这是阿里云今天的站位。”
对于阿里云的未来规划,周靖人表示:“为应对GPU算力的指数级增长需求,尤其是即将爆发的推理市场,阿里云已经准备好了。”
本文系观察者网独家稿件,未经授权,不得转载。