国产之光,科大讯飞挺进大模型“无人区”
来源:观察者网
2024-10-29 19:23
距离上个大版本更新仅仅4个月,讯飞星火大模型再次迎来升级。
10月24日,科大讯飞发布全新的讯飞星火4.0 Turbo大模型,数学能力、代码能力超过GPT-4o,并预计今年底可实现类o1的高难度数学能力显著提升。
同时,科大讯飞、华为、合肥市大数据资产运营有限公司三方联合打造的国产超大规模智算平台“飞星二号”也正式启动。
作为国内唯一采用全国产芯片进行训练的基座大模型企业,科大讯飞在挑战自主可控“无人区”的同时,性能上也紧紧追赶国际顶尖水平,这样的答卷已经足够优秀。
而凭借自主可控的独特生态位,星火大模型也成为央国企大模型合作的首选,让科大讯飞走通了一条可持续的商业落地道路。
讯飞+华为,走了一条没人走的路
早在去年1024开发者节上,科大讯飞就推出了联合华为打造的万卡规模国产算力平台“飞星一号”。今年,“飞星二号”又迎来了正式启动。
在英伟达垄断全球90%以上AI算力芯片份额的背景下,采用华为昇腾芯片、从硬件开始打造完全自主可控算力平台的科大讯飞,可谓是稳步迈入进入了大模型的“无人区”。
采用国产芯片架构,究竟难在哪?
一方面,国产芯片在单卡算力上同英伟达旗舰芯片仍存在差距,但考虑到性价比,这样的差距并非不可克服。事实上,同阉割版英伟达芯片相比,国产芯片的市场接受程度正越来越高。
但是更大的困难在于软硬件适配。
对于预训练大模型这样规模庞大的任务来说,硬件从来都不是即插即用,为了让算法更高效在硬件上运行,仍然需要做大量的开发工作。
因此,芯片国产化并不止取决于只靠芯片企业自身的努力,有没有下游企业使用成为关键所在。
飞星一号”的成功离不开科大讯飞和华为双方的共同努力,时隔一年,“飞星二号”相比于“飞星一号”, 从万卡算力到万P(PFLOPS,算力计算单位)算力,不断地引领国产大模型底座的发展,实现了质的跨越。
算力提升来自模型和硬件的更好适配。刘庆峰指出,在昇腾910B的基础上,一年来攻克了诸多疑难杂症,解决了500多次基础软硬件问题、模型适配问题等,使得大模型训练从对标A100/A800的20%~30%提升到90%以上。
得益于算力的持续提升,星火大模型也能够保持对OpenAI紧追不舍的追赶态势。
讯飞星火4.0 Turbo此次全新升级后,数学能力、代码能力超过GPT-4o。在数学能力上,讯飞星火4.0 Turbo已完成超长思维链、树搜索和自我反思评价等算法验证,预计今年底可实现类o1的高难度数学能力显著提升。
与GPT 4o、Claude 3.5 Sonnet、Genmini1.5 pro等美国三大主流大模型对比,星火4.0 Turbo在国内外中英文14项主流测试集上,实现了9项超越。
“主权大模型”,不止中国人需要
除了硬件上的自主可控,讯飞在大模型应用层面的探索,也离不开“自主”二字。
事实上,科大讯飞自1999年成立以来,一直致力于解决中文智能语音技术的自主可控。
历史上相当长的一段时间里,多语种智能语音技术一直掌握在谷歌、微软、Nuance等一众美国科技巨头手中,其中Nuance正是苹果语音助手Siri的语音技术供应商。
而到了2010年前后,以第一个推出中文语音输入法为标志,讯飞开始实现在中文语音技术上对西方的反超,并在多语种翻译上逐步达到世界领先水平。
而在星火大模型上,讯飞也体现出智能语音技术和翻译技术上的独特优势。
发布会上,科大讯飞首次发布星火多语言大模型,除中英文外,可支持俄、日、阿、法等8个语种,在汽车、家电、办公、翻译等行业的任务场景应用效果超过了GPT-4o。
大模型的多语种能力,不仅能够为普通人的日常生活提供便利,对于中国企业的出海更是意义重大。
深耕海外市场的奇瑞汽车,已于今年1月开始搭载讯飞车载语音系统,覆盖23个主要语种,相关车型销往亚洲、欧洲、中东、南美等地的60多个国家与地区。
不仅是中国,世界其它国家也对大模型的“自主可控”有着强烈需求。
“现在,很多国家和地区都希望在大模型上至少有一个备份,甚至能够拥有自己的主权大模型。”刘庆峰表示,讯飞星火底座能力要不断提升,对标全球最好水平,同时还要针对真实应用场景做到全球最好,不断扩大多语种范围,“我们一定要代表中国给世界第二种选择。”
AI for Science,大模型成为科技新引擎
在大模型能力不断提升的同时,科大讯飞还有另一个好消息,是财报层面重新盈利了。
科大讯飞近日发布的三季报显示,其三季度归母净利润为5696.14万元,同比上升120.87%,实现了当季度利润转正。
三季度,科大讯飞营业总支出进一步同比增长17.33%至155.17亿元,年内研发费用总计达到30.371亿。
在这样的投入强度下,科大讯飞能够迅速扭亏为盈,说明在大模型的落地应用上确有过人之处。
在三季报沟通会上,讯飞这样描述自己的商业化路径:一是在提升公司既有业务相关优势加快规模化落地;二是对外尤其是与央国企深度合作赋能,在越来越多刚需领域落地;三是面向企业打造大模型标准化产品,持续推广运营。
“自主可控”的独特站位,显然让科大讯飞在央国企市场具有了显著优势。根据智能超参数统计报道,2024年1-9月份,科大讯飞中标项目达到38个,中标金额达21607万元,在大模型市场的中标数量、中标金额位列第一。
垂直领域的深度赋能,是科大讯飞在大模型落地的另一个特点。此次开发者节上,科大讯飞面向教育、医疗、司法、政务服务、企业办公等多个行业场景发布了最新的产品应用。
近期,科大讯飞与中石油合作的“昆仑大模型”、与中海油合作的“海能”人工智能模型先后发布,核心功能包括“员工助手”、“行业大家”等,在日常办公和专业场景下都能给员工提供AI支持。
在医疗行业,基于讯飞星火医学影像大模型打造的智能医学影像助手也正式发布,在智能质控环节,可帮助影像技师快速评估图像质量,及时纠正检查问题;在智能诊断环节,可帮助影像医师快速生成诊断报告,解释溯源并多期对比;在智能读片环节,可接入医学影像大模型,通过相关问答,帮助临床医师制定诊疗方案。
讯飞星火也在持续为高校提供基础科研提效服务,AI for Science成为重点赋能方向。
“今年的诺贝尔物理学奖、化学奖,都颁发给了与AI强相关的科学家,一个是AI for Science ,一个是Science for AI”,刘庆峰表示,AI for Science带来科研范式的根本变革,正在成为科技发展的新引擎。“AI for Science决定了中国科技发展的速度,赋能科研是讯飞星火的重要使命。”
科大讯飞正在大模型+科研领域进行诸多探索,如联合中国科学技术大学刘海燕教授团队,成功设计了48个自然界不存在的全新蛋白质;联合中科院动物研究所李鑫团队,研究单细胞基因表达课题;联合中科院等离子体物理研究所李建刚院士团队,研究托卡马克等离子体控制。
从软硬件的全栈自研,到科研和产业一线的深度应用,自主可控大模型的“无人区”,正在由讯飞和华为等企业联手征服。