5倍Token吞吐量 能源效率4倍!辉达发布BlueField-4 STX架构 抢攻AI算力市场
辉达 (NVDA-US) 在年度 GTC 大会上宣布推出全新的 BlueField-4 STX 储存架构,主打为需要长上下文推理能力的人工智慧 (AI) 工作负载打造,试图解决大型 AI 模型在运算与资料存取上的瓶颈。公司表示,随着 AI 系统逐步走向能够长时间推理与持续学习的新阶段,资料储存与运算基础架构也必须同步升级。
根据辉达发布的新闻稿,STX 参考架构相较于传统储存系统,最高可提供 5 倍的 Token 吞吐量,能源效率最高提升 4 倍,企业 AI 资料的汇入速度也可提升 2 倍。这套架构的核心目标是支援需要大量上下文记忆与高速资料存取的 AI 模型,尤其是近年快速发展的长上下文推理系统。
STX 架构整合辉达的 CMX 上下文记忆储存平台,该平台透过高效能的上下文层来扩展 GPU 记忆体容量,使 AI 模型能够处理更大规模的资料与更长的推理上下文。整体系统採用 BlueField-4 处理器,结合辉达 Vera CPU 与 ConnectX-9 SuperNIC,并搭配 Spectrum-X 乙太网路架构,以提供高速资料传输与运算能力。
辉达创办人兼执行长黄仁勋表示:Agentic AI 正在重新定义软体的能力,而支撑这些系统的运算基础架构也必须重新设计。能够在庞大上下文中进行推理并持续学习的 AI 系统,需要一种全新的储存架构。
目前已有多家云端与 AI 基础设施企业计画採用 STX 架构作为上下文记忆储存解决方案,早期採用者包括 CoreWeave、Crusoe、IREN、Lambda、Mistral AI、Nebius、Oracle Cloud Infrastructure 以及 Vultr 等。
同时,多家储存与系统製造商也将基于 STX 设计开发相关基础设施产品,包括 AIC、Cloudian、DDN、戴尔科技 (DELL-US)、Everpure、Hitachi Vantara、慧与科技 (HPE-US)、IBM(IBM-US)、MinIO、NetApp(NTAP-US)、Nutanix(NTNX-US)、美超微 (SMCI-US)、Quanta Cloud Technology、VAST Data 以及 WEKA 等。
辉达表示,基于 STX 架构打造的平台预计将由合作伙伴于今年下半年正式推出,未来将用于支援需要长上下文推理能力的新一代 AI 系统与大型模型应用。