星期五, 3 4 月

路透:DeepSeek没先提供新AI模型给辉达 仅先给华为等陆晶片商

大陆人工智慧实验室DeepSeek据报在重大模型更新前打破了产业标准惯例,并未向美国晶片制造商展示其即将推出的旗舰模型。分析认为,此举目的是要让美国的硬体和模型在大陆处于不利地位。

路透引述2位知情人士称,AI开发商通常会将主要模型的预发布版本,分享给辉达和超微等领先晶片制造商,以确保其软体能在广泛使用的硬体上高效运作。先前,DeepSeek曾与辉达的技术团队密切合作。

消息人士称,对于预计在农历新年假期前后发布的新模型,DeepSeek并未向辉达和超微提供存取权,而是让华为等大陆晶片制造商提前数周取得资料,以便针对其处理器优化软体。

研究公司Creative Strategies执行长巴加林(Ben Bajarin)表示,这对辉达和AMD在通用数据加速器方面的影响微乎其微,因为大多数企业并未运行DeepSeek,它更多是作为基准测试模型。

巴加林指出,该举措的目的可能是中国政府更广泛策略的一部分,想让美国的硬体和模型在中国处于不利地位。

川普政府1名高级官员日前透露,DeepSeek最新的AI模型,是在中国境内、使用辉达最先进的Blackwell晶片集群进行训练,此举显然违反了美国的出口管制。DeepSeek可能会试图移除显示其使用美国AI晶片的技术指标,并计划公开声称其模型使用华为晶片训练。

去年,美国政府允许辉达的H20、AMD的MI308晶片恢复向中国出货,这些晶片主要适用于AI模型推论,但更先进处理器的许可仍受限制。目前尚不清楚DeepSeek是否已获得购买这些美国晶片的批准。

外媒指,大陆人工智慧实验室DeepSeek在重大模型更新前打破产业标准惯例,并未...
外媒指,大陆人工智慧实验室DeepSeek在重大模型更新前打破产业标准惯例,并未向美国晶片制造商展示其即将推出的旗舰模型。(路透)