大摩:辉达Blackwell比谷歌TPU、亚马逊Trn3贵两倍 但长期总体拥有成本优势明显
摩根士丹利 (下称大摩) 出具最新研究报告指出,超大规模资料中心业者若採用辉达现役 Blackwell AI GPU 兴建一座容量达 1 GW 的资料中心,建造成本将是使用谷歌 TPU 或亚马逊 Trainium 晶片的两倍,初期投入虽高,但 Blackwell 在计算效率上明显优于客製化晶片,整体性价比仍具竞争力。
大摩在报告中比较辉达多款 GPU 与亚马逊、谷歌专用 ASIC 在每瓦 TFLOPS(每秒兆次浮点运算) 表现,结果显示,辉达晶片的能源效率比竞争对手高出 2 至 8 倍。
在未来产品线方面,辉达打算推出的下一代 Vera Rubin 架构 (FP4) 得分高达 19.5,居榜单首位,Vera Rubin(FP8)与 GB300(FP8)分别为 6.8 与 6.0,现役旗舰 H100(FP8)则为 3.1。
相较之下,谷歌 TPUv7(FP8) 得分 4.3,亚马逊 Trn3(FP8) 仅 2.5,效能大致落在 Blackwell 与上代 Hopper 之间,部分指标甚至低于 Hopper。
不过,评估 AI 晶片不能只看算力与能耗。
AI 基础设施业者 Nebius 指出,每百万 Token 生成成本与 GPU 每小时运行成本的比率同样关键。测算显示,Groq 晶片每百万 Token 成本约 5 至 10 美分,生成速度每秒 800 Token,Blackwell 成本则为 25 美分,速度每秒约 450 Token。
专家认为,随着 AI 模型规模持续扩大,高效能与总体拥有成本 (TCO) 的平衡,将决定未来资料中心的晶片选型策略。