资深科技投资人贝克(Gavin Baker)日前在访谈中表示,Google的张量处理器(TPU)目前暂居上风,但长期而言,辉达(Nvidia)的绘图处理器(GPU)凭借更全面的生态系,仍较具优势。
科技基金Atreides Management经理人贝克9日在Invest Like The Best播客节目中说,从Hopper晶片转换到Blackwell,「是目前为止我们在科技领域经历过最复杂的产品转换」,而Blackwell的大规模部署近几个月才开始。
辉达的Blackwell平台大幅延迟,是因为这个转换需从根本上调整基础设施,难题包含更高的用电量、液冷系统、更重的资料中心机架,以及散热管理等,而Blackwell的延迟,意外为Google创造了有利窗口。
贝克说,Google在短期内取得优势,是藉著其TPU晶片,成为人工智慧(AI)词元(token)的最低成本生产者。在结合其他如搜寻引擎等业务下,这让Google得以在负30%的利润率下营运。他说,Google不断「抽走AI生态系的经济氧气」,是合理的策略,但可能只是暂时性的。
他也强调,随著辉达的Blackwell晶片明年初开始用于训练,还有随后更易部署的GB300晶片,这种局面即将改变。他说,一旦Google失去成本优势,可能会重塑AI产业的竞争格局与经济模式,「那迟早会发生」,而Rubin晶片的推出,可能会进一步拉大与TPU和其他客制化AI晶片的效能与成本差距。
另外,贝克认为,第一款由Blackwell晶片驱动的模型将由马斯克的xAI推出,原因很简单,因为黄仁勋公开说过,马斯克建造资料中心的速度无人能比。而即便有了Blackwell晶片,仍需六到九个月才能将效能提升到Hopper的水准。
贝克强调,xAI对辉达具有关键作用。xAI快速部署的速度,让辉达能在资料中心内尽可能部署更多的GPU,形成协同运作的晶片群,进而为所有客户进行除错。
贝克的访谈著眼于主要AI基建业者间日益激烈的竞争。马斯克隔日在X上发文表示:「AI是有史以来最顶尖的对决。硬体的部署速度,尤其是机器人领域,是关键所在。」
贝克指出,从Hopper、Blackwell到未来的Rubin,辉达的GPU强调的是全端平台,从GPU、网路卡、交换器到 CUDA等软体层,一手包办。企业买了GPU后,可取得一整套能直接投入训练和推论的完整系统,不需自行组装网路或重写软体。
相较下,Google TPU的本质是特殊应用IC(ASIC)。Google负责前端设计,后端由博通制作,再交由台积电生产。TPU其他不可或缺的零件,如交换器、网卡和软体,Google都得自己整合,供应链协作比GPU复杂许多。
整体来说,GPU的优势不在於单颗晶片的效能,而是整个平台与生态系的完整度。
$(document).ready(function () {nstockStoryStockInfo();});