北美CSP扫货辉达GB/Rubin机柜 今年AI推论算力跃升1.2倍

研调机构 TrendForce 今 (20) 日公布最新 AI 产业研究,北美五大云端服务供应商 (CSP) 为扩大 AI 训练和推论应用部署,2026 年对整柜式 (rack-scale)AI 伺服器的採购意愿明显提高,不仅有望占据全球 60% 以上的辉达 (NVDA-US) GB/VR 需求量,更将同步带动五大业者 AI 总训练算力年增逾 56%、AI 总推论算力年成长高达 122%。

伺服器示意图。(图:REUTERS/TPG)

TrendForce 预估,2026 年 AI 伺服器出货将年增 28% 以上,仍以高阶 AI 训练机种为主力,占比约 55%。然中长期内将改由 AI 推论机种主导,主因是 CSP 将积极推展 AI 应用以加速实现 AI 云端服务商用化,辉达也将拓展更多 AI 推论方案或使用情境,包括推动今年主力 AI 伺服器方案 GB/VR 系统,也特别强调该方案除 AI 训练用途外,也可支援 AI 推论相关工作负载。


据 TrendForce 估计,2026 年 Google、Amazon、Microsoft、Meta、Oracle 的合计资本支出将逾 7,700 亿美元,年增近 87%。分析北美五大 CSP 购置辉达 GB/VR 系列获得的运算能力,针对 AI 训练部分,若以 FP16/BF16 为估算基础,2025 年五大业者的总算力达逾 9 ExaFLOPS,2026 年另将成长 56% 以上。

针对 AI 推论,若以 FP4/NVFP4 运算效能为估算基础,2025 年五大 CSP 的总算力逾 37 ExaFLOPS,预计 2026 年将大幅成长近 122%,显着高于 AI 训练,反映出 NVIDIA 此次软硬体系统调校特别着重 AI 推论效能,并落实在新一代的 GB300、VR200 整柜式方案中。

除 GPU 方案外,CSP 业者同步推进自研 ASIC 整柜产品,以 Google 布局最积极。TrendForce 预估,2026 年 Google 对自家 TPU 晶片需求量将年增近 80%,并于下半年后将从 v7 逐渐升级至 v8 世代。Amazon 自研 ASIC 的力道仅次于 Google,预计 2026 年其 Trainium 系列于自家 AI 伺服器占比将达 40% 以上。

TrendForce 表示,NVIDIA、AMD 和 CSP 自研 ASIC 的新世代机柜皆整合液冷散热系统,有助降低 AI 伺服器的 U 数,提高单一机柜可容纳的加速器数量。在单颗 AI GPU 或 ASIC 的热设计功耗 (TDP) 同步提高的情况下,AI 伺服器系统功耗呈结构性放大。

据 TrendForce 估算,2023 年北美五大 CSP 的 server 功耗合计年增 2.8GW,至 2026 年跃升至 18GW,2025 至 2026 年的年成长率高达 116%,主因即 AI 竞赛白热化,NVIDIA GB300、AMD Helios 和 CSP 自研 ASIC 平台将同步放量。

发布于 2026-05-20 15:46
收藏
1
上一篇:辉达与亚马逊联手颠覆AI架构!GPU将直接控制SSD、HBF有望取代部分HBM需求 下一篇:裕民迎首艘液化天然气运输船 跨足能源运输新里程碑