黄仁勋野心不止GB200!辉达砸数十亿美元 2028千颗GPU光子架构曝光
若认为辉达 (NVDA-US) GB200 机架系统已达算力巅峰,那只是起点。执行长黄仁勋在 GTC 大会揭示更大蓝图:目标在 2028 年前,透过光子互连技术将逾千颗 GPU 整合于单一巨型运算系统。这不仅是规模扩张,更是突破传统电讯号瓶颈、迈向光通讯的新典範,预示 AI 基础设施将进入以光为核心的全新世代。

为了确保这一愿景如期实现,辉达并未坐视供应链自然成熟。在过去的几个月内,这家 GPU 龙头已向 Marvell、Coherent 和 Lumentum 等专注于光学与互连技术的关键厂商投资数十亿美元。
黄仁勋在演讲中直言不讳地指出,生态系统中的所有参与者都需要更大的产能,无论是铜缆、光学元件还是共封装光学元件(CPO),辉达正与全球顶尖厂商合作,为未来爆炸性的增长水平奠定坚实基础。
这种从供应链源头开始的布局,显示出辉达将光视为解决 AI 算力瓶颈的终极答案。
回溯辉达的发展历程,早在 2022 年底 ChatGPT 引发全球热潮时,辉达便敏锐地察觉到传统架构的侷限性。当时最强大的系统仅包含 8 个 GPU,然而训练现代大型语言模型需要数千个处理器的协作。
辉达意识到,仅靠提升单一晶片的效能已不足够,更需要一个能够高效分配负载、极速连接数十个甚至上百个晶片的网路系统。
2024 年亮相的 Grace Blackwell NVL72 便是这种思考下的产物,这台功率达 120 千瓦、内部布满数英里铜缆的巨型机器,让 72 个 GPU 能像一个超大型加速器般运作,虽然目前仍以铜质背板为主流,但物理极限已隐约显现。
儘管铜线在低功耗、高可靠度与经济实惠上具有天然优势,但当传输速率达到 1.8 TB/s 的惊人水平时,电讯号在铜线中的衰减问题变得不可忽视,这限制了 GPU 之间的通讯距离仅能维持在几英尺内。
为了组装更庞大的系统,辉达必须转向光学技术。过去,光学元件多以可插拔形式存在,虽然在资料中心网路中行之有年,但对 NVLink 这种需要极高频宽的运算架构而言,过多的元件会导致功耗暴增。
为了解决这项难题,共封装光学元件(CPO)技术应运而生,透过将光引擎直接整合在交换器 ASIC 旁边,能显着降低功耗并提升效能。
辉达正迅速推进这一转型。在 2025 年,辉达成为首批将 CPO 技术整合至乙太网路与 InfiniBand 交换器的厂商,并逐步将此技术引入其核心的 NVLink 架构。最新的 Vera Rubin 与下下一代的 Rosa Feynman 系统,便是这一战略的具体展现。
根据辉达的技术蓝图,未来的网路架构将採取混合策略:机架内部维持铜缆互连以节省成本,而跨机架的主干网路则採用光纤。这种内铜外光的设计,既能保留电讯号的稳定性,又能利用光讯号长距离传输的优势。
更令人期待的是预计 2028 年问世的 Feynman 一代产品,这将是辉达彻底拥抱 CPO 技术的关键节点。届时,辉达可能将光模组直接整合进 GPU 封装中,从而简化网路层级并降低延迟。
辉达网路高级副总裁 Gilad Shainer 强调,减少运算引擎之间的层级与延迟是提升效能的核心,而光子互连正是达成此目标的最佳途径。
除了技术研发,辉达对供应链的掌控同样展现了其战略定力。透过对雷射模组大厂 Coherent 和 Lumentum 的巨额投资,以及与 Marvell 针对光纤 I/O 技术的深度合作,辉达正在建构一个从雷射源、光引擎到高速互连授权技术的完整版图。
甚至连 AWS 等云端巨头也开始计画在下一代训练集群中採用类似的技术方案,这印证了辉达所引领的光学扩展方向已成为行业共识。
辉达正从一家晶片公司转变为一家光电系统整合巨头。透过加速光晶片与 CPO 技术的研发与部署,辉达不仅解决了数据传输的物理瓶颈,更为未来数兆参数模型的训练提供了无限可能。
在光与电的交织中,辉达的野心不仅是製造更强大的晶片,而是建造一个能吞吐全球数据的光子算力帝国。