OpenAI携手博通推出首款AI晶片 测试显示成本可降50%
OpenAI 周三 (24 日) 宣布,与博通 (AVGO-US) 合作开发的首款客製化人工智慧 (AI) 晶片已完成首批样品製造并开始测试,象徵这家 ChatGPT 开发商正式跨出自研 AI 晶片的重要一步,藉此降低对辉达 (NVDA-US) 的依赖,并进一步提升 AI 模型运算效率与成本竞争力。
这款代号为Jalapeno的 AI 加速器专为执行大型语言模型 (LLM) 推论 (Inference) 工作负载设计。博通执行长陈福阳 (Hock Tan) 表示,目前测试结果显示,Jalapeno 的运算成本较传统 AI GPU 低约 50%,展现相当可观的成本优势。
双方指出,正式版晶片预计今年稍晚开始部署至微软 (MSFT-US) 及其他合作伙伴的大型资料中心。陈福阳表示,随着市场需求持续攀升,OpenAI 与博通明年部署的 AI 晶片规模有望超越先前预估的 1.3GW(百万瓩)运算容量。
虽然 OpenAI 目前仍大量採用辉达晶片训练与执行 AI 模型,但近年来也积极分散供应链风险,陆续与超微 (AMD-US)、Cerebras(CBRS-US) 等业者签署数十亿美元合作协议,以满足快速成长的 AI 服务需求。
事实上,OpenAI 早在去年 10 月便宣布与博通合作设计专属 AI 加速器。根据先前报导,OpenAI 计划未来投入数百亿美元採购博通晶片,以支撑资料中心与 AI 基础建设扩张需求。
OpenAI 硬体主管 Richard Ho 表示,Jalapeno 从零开始开发,并以创纪录速度完成设计与试产。初步测试结果显示,该晶片在每瓦效能 (performance per watt) 方面明显优于现有最先进产品,不仅针对当前大型语言模型最佳化,也具备支援未来模型架构演进的能力。
Ho 指出,Jalapeno 虽然主要聚焦推论运算,但本质上仍属通用型 AI 晶片,未来不排除应用于更多 AI 工作负载。他也透露,OpenAI 尚未决定是否开放其他 AI 模型开发商使用这款晶片。
在 AI 产业中,部分晶片强调大规模平行运算能力,另一些则专注于快速回应使用者查询。OpenAI 表示,其目标是结合两者优势,兼具高效能运算与快速推论能力,同时透过降低资料传输量提升整体效率。
陈福阳透露,OpenAI 与博通已规划后续产品蓝图,下一代晶片预计于 2028 年推出,此后将以每年更新节奏持续推出新产品。他认为,随着 AI 产业竞争加剧,未来全球主要 AI 模型开发商都将打造专属客製化 AI 晶片与网路架构,以掌握关键基础设施主导权。