星期一, 6 4 月

DeepSeek V4 下周发布!:原生支持影音图文生成 适配华为等国产算力

大陆AI新创公司深度求索(DeepSeek),将于下周发布全新多模态大语言模型 V4。该模型原生支持图片、影音与文本生成,适配华为、寒武纪等国产算力。

DeepSeek V4是继今年1月 R1推理模型发布后的首次重大更新,目的在填补境内高性能、低成本开源多模态模型的市场空白,也将再次验证大陆在AI领域挑战美国竞争对手的雄心,降低对辉达的依赖。。

金融时报报导,根据路线图,DeepSeek 将在发布初期提供简要技术说明,并于一个月后公开详尽工程报告。在底层生态上,V4模型已联合华为、寒武纪完成深度硬体适配优化。此举不仅将大幅带动本土算力需求,更代表AI 模型推理环节正加速向国产晶片阵列迁移。

作为开源界的有力竞争者,DeepSeek V4的面世预示著多模态技术门槛的进一步下探,对构建自主可控的本土 AI 算力生态具有重要风向标意义。

路透先前报导,DeepSeek 在即将发布新版旗舰模型前,刻意打破业界惯例,没有提前让美国晶片大厂 辉达和 AMD 取得模型进行效能优化,而是将这个机会留给了包括华为在内的大陆本土晶片供应商,让华为提前数周开始针对自家处理器进行软体调校。

按照 AI 产业标准做法,重大模型发布前,开发商通常会提前让辉达、AMD 等主流晶片厂商测试预发行版本,确保模型能在大规模部署的硬体上高效运行。DeepSeek 先前也曾与 辉达 技术团队密切合作,此次转向因此格外引人瞩目。

大陆AI新创公司深度求索(DeepSeek),将于下周发布全新多模态大语言模型 ...
大陆AI新创公司深度求索(DeepSeek),将于下周发布全新多模态大语言模型 V4。该模型原生支持图片、影音与文本生成,适配华为、寒武纪等国产算力。(路透)