星期一, 6 4 月

DeepSeek 新模型 本周亮相

大陆AI新创公司深度求索(DeepSeek),将于本周发布全新多模态大语言模型V4。该模型原生支持图片、影音与文本生成,适配华为、寒武纪等国产算力。

DeepSeek V4是继今年1月 R1推理模型发布后的首次重大更新,目的在填补境内高性能、低成本开源多模态模型的市场空白,也将再次验证大陆在AI领域挑战美国竞争对手的雄心,降低对辉达的依赖。

金融时报报导,根据路线图,DeepSeek将在发布初期提供简要技术说明,并于一个月后公开详尽工程报告。在底层生态上,V4模型已联合华为、寒武纪完成深度硬体适配优化。此举不仅将大幅带动本土算力需求,更代表AI模型推理环节正加速向国产晶片阵列迁移。

作为开源界的有力竞争者,DeepSeek V4的面世预示著多模态技术门槛的进一步下探,对构建自主可控的本土AI算力生态具有重要意义。

路透先前报导,DeepSeek在即将发布新版旗舰模型前,刻意打破业界惯例,没有提前让美国晶片大厂辉达和AMD取得模型进行效能优化,而是将这个机会留给了包括华为在内的大陆本土晶片供应商,让华为提前数周开始针对自家处理器进行软体调校。