不只卖GPU!辉达AI版图再扩张 Vera CPU正式交付四大客户

辉达 (NVDA-US) 宣布,旗下首款专为代理式 AI(Agentic AI) 设计的 Vera CPU 已完成首批交付,客户包括 Anthropic、OpenAI、SpaceX AI 以及甲骨文 (ORCL-US) 云端基础设施 (OCI)。这也意味着辉达执行长黄仁勋先前所称的下一个数十亿美元级业务,已从产品展示阶段进入实际商业部署。

(图:REUTERS/TPG)

根据辉达公布资讯,负责超大规模运算与高效能运算业务的副总裁 Ian Buck 亲自将首批 Vera 系统送往各家公司。首站为 Anthropic 位于旧金山的办公室,其后交付至 OpenAI、SpaceX AI 及 OCI。


市场分析认为,Vera 的重要性不在于推出另一款 CPU,而是代表 AI 产业需求正从单纯模型训练,进一步转向能执行複杂任务的代理式 AI 架构。与传统生成式 AI 主要负责回答问题、生成内容不同,代理式 AI 需要自主规划流程、呼叫外部工具、执行程式码、搜寻资料并完成多步骤工作,因此对 CPU 运算、记忆体管理及资料调度能力提出更高要求。

辉达表示,Vera 是首款完全由公司自行设计的 CPU,搭载 88 个自研 Olympus 核心,记忆体频宽达 1.2TB/s,单核心效能较传统 CPU 提升 50%,整体效率则提高至两倍。Vera 主要作为 AI 系统中的主机 CPU,负责资料搬移、记忆体管理与系统控制,使 GPU 可维持高速运作。

Vera 的设计也反映 AI 基础建设架构正在改变。过去市场焦点集中于 GPU 运算能力,但在代理式 AI 时代,CPU 重新成为关键元件。辉达指出,长上下文推理、工具呼叫、强化学习沙盒以及多层代理流程,大量工作实际上发生在 CPU 层。

在首批客户中,甲骨文态度尤其积极。OCI 资深副总裁 Karan Batta 表示,OCI 预计自 2026 年起部署数十万颗 Vera CPU,以支援企业级 AI 工作负载。OCI 指出,代理式 AI 需要长时间高负载推理能力,而 Vera 在效率、密度及空间利用率方面符合需求。

分析人士指出,甲骨文的大规模採购承诺显示市场需求已不只是技术展示,而是开始转化为实际订单与资本支出。尤其目前超大型云端业者正加速扩建 AI 资料中心,市场对 AI 基础设施的投资规模持续攀升。部分产业研究预估,美国五大云端与 AI 基础设施业者 2026 年资本支出可能接近 7,000 亿美元。

值得注意的是,Vera 并非单独运作产品,而是辉达新一代 AI 工厂架构的重要一环。未来 Vera 将与 Rubin GPU、BlueField 4 DPU、Spectrum-X 乙太网路平台以及 MGX 机架系统共同构成完整架构。

在 Vera Rubin NVL72 系统中,Vera 可透过第二代 NVLink-C2C 直接连接 Rubin GPU,形成统一记忆体架构,大幅提升资料供应效率与整体运算能力。

此外,先前公布的合作名单显示,除甲骨文外,包括 Meta Platforms (META-US)、阿里巴巴 (BABA-US)、CoreWeave(CRWV-US) 及其他大型云端业者也正规划导入 Vera 平台。製造伙伴则涵盖戴尔科技 (DELL-US)、慧与科技 (HPE-US)、联想、美超微 (SMCI-US)、鸿海、广达、和硕及纬创等供应链厂商。

市场观察人士认为,Vera 正式进入商业部署,代表辉达 AI 战略已从 GPU 进一步扩展至 CPU、网路与机架系统层级。随着 AI 资料中心建设热潮延续,辉达在生成式 AI 与代理式 AI 基础设施市场的主导地位,可能进一步巩固。

发布于 2026-05-20 10:46
收藏
1
上一篇:彭博:美军考虑採购乌克兰防务装备 準备军用 下一篇:OpenAI创始成员、「Vibe Coding」之父卡帕西加入Anthropic!AI人才战再升级