中国人工智能(AI)公司深度求索(DeepSeek)发布最新旗舰AI模型的预览版后,中国央视旗下新媒体账号《玉渊谭天》发文称,当中国国产晶片开始在具体场景里能够接住原本由外国晶片承担的计算任务,企业就可以不再依赖特定进口型号,并指中国AI更需要活在自己的节奏里。
玉渊谭天星期天(4月26日)凌晨在微信公众号发布题为《沉默的DeepSeek,和不被定义的中国大模型》的文章。文章称,在这个国外主流大模型平均91.4天就迭代一个版本的时代,DeepSeek的“静默”,在很多人眼里几乎等同于落后,甚至掉队。
文章续称,沉默的DeepSeek,让人很不习惯;2025年初的横空出世、用更少的算力实现更优的性能、打破美西方营造的“算力焦虑”。“这些标签,让它的意义不止于一个公司的一款产品”。
文章说,此次DeepSeek与中国科技巨头华为昇腾国产晶片体系深度适配,并不令人意外。文章进一步写道,去年8月,DeepSeek发布DeepSeek-V3.1时就宣布采用UE8M0 FP8 Scale参数精度,特别表示这一数据格式是针对即将发布的下一代国产晶片设计。
文章接着称,软件主动适配硬件特性,本质上是在为国产晶片“量体裁衣”;这背后的难度超乎想象,需要大量改写调用晶片的软件代码,使其与目标系统在各个环节都实现兼容。
文章也提到,当国产晶片开始在具体场景里能够接住原本由外国晶片承担的计算任务,企业就可以不再依赖特定进口型号。
文章还指出,中国大模型要想实现真正的自主,就必须形成软硬件一体化的协同能力。DeepSeek-V4模型在适配昇腾晶片后,实现了高吞吐、低时延的推理部署。“这是技术上的新探索,也是我们在软硬件协同领域的一种进步信号”。
文章称,今年初,智谱GLM-5也宣布完成与七家主流中国国产晶片平台的深度适配,可以在国产算力集群之上实现稳定运行。在大模型训练中,也出现了“纯国产”的实践样本。同时,一些企业的大模型,训练过程基于国产算力体系完成。
文章引述科技与战略风云学会副会长陈经分析称,这意味着一套国产软硬件协同的AI研发生态正在逐渐完善。
文章最后写道,当讨论中国AI企业时,讨论的其实不只是企业本身,更是一个行业,以及背后代表的一种发展模式。“率道而行,端然正己。中国AI,更需要活在自己的节奏里”。
DeepSeek星期五(4月24日)在社媒平台公布,全新系列模型DeepSeek-V4的预览版本正式上线并同步开源。官方称,V4有能力处理长达百万字的超长上下文,在智能体能力、世界知识和推理性能方面处在中国和开源领域的领先地位。
V4按模型大小分为“Pro”与“Flash”两个版本,分别对应“专家模式”和“快速模式”。DeepSeek称,V4-Pro在世界知识测评中大幅领先其他开源模型,但稍逊于谷歌的顶尖闭源模型Gemini-Pro-3.1。
华为同日发文称,昇腾一直同步支持DeepSeek系列模型,此次通过双方“芯模技术紧密协同”,实现昇腾超节点全系列产品支持V4系列模型。
大多数主流AI模型都是在英伟达晶片上进行训练和运行的。美国外交关系协会中国与新兴技术高级研究员麦奎尔(Chris McGuire)发文分析,DeepSeek并未像以往般公开提及V4的训练成本或使用晶片数量,很可能是因为训练所用的晶片,是美国晶片巨头英伟达最先进的Blackwell晶片。这款晶片已被美国禁止对华出口。
