阿里云发布通义千问旗舰版模型Qwen2.5-Max

来源:观察者网

2025-01-29 10:54

1月29日凌晨,阿里云通义千问旗舰版模型Qwen2.5-Max全新升级发布。

据微信公众号“阿里云”消息,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新成果,预训练数据超过20万亿tokens。新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源MoE模型以及最大的开源稠密模型。

目前,开发者可在Qwen Chat平台免费体验模型,企业和机构也可通过阿里云百炼平台直接调用新模型API服务。

官方资料表示,由于无法访问GPT-4o和Claude-3.5-Sonnet等闭源模型的基座模型,通义团队将Qwen2.5-Max与目前领先的开源MoE模型 DeepSeek V3、最大的开源稠密模型Llama-3.1-405B,以及同样位列开源稠密模型前列的Qwen2.5-72B进行了对比。在所有11项基准测试中,Qwen2.5-Max全部超越了对比模型。

图源微信公众号阿里云

1月28日,阿里云通义千问开源全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。新的Qwen2.5-VL能够更准确地解析图像内容,突破性地支持超1小时的视频理解,无需微调就可变身为一个能操控手机和电脑的AI视觉智能体(Visual Agents),实现给指定朋友送祝福、电脑修图、手机订票等多步骤复杂操作。

本文系观察者网独家稿件,未经授权,不得转载。

责任编辑:周毅
观察者APP,更好阅读体验

“我们一定要有自己的大飞机”

“美国想将爱国者导弹量补充回战前水平,至少三年”

美国绕过英国“购岛”,为了“不给中国送大礼”?

向美递投名状!“台当局拟将限制扩至所有大陆企业”

比利时首相装上了:好怕呀,不敢点名中国