AI投资获利或比预期早到来!高盛:「AI代理」改变一切、建议「这样」布局
高盛近日发布的研究报告《解码代理经济:AI 使用量与利润率的即将拐点》(Decoding the Agentic Economy:The Coming Inflection in AI Usage and Margins )针对外界最关切的核心问题作出回应,指出 AI 的庞大基础建设投入开始获利的时间或许比市场预期来得更早。

过去两年,AI 产业的主流叙事围绕着烧钱二字。推论负载越重,意味着需要更多加速晶片、更大的电力消耗,以及更高的资本支出。
然而,高盛指出,这套逻辑正在发生根本性转变。
关键在于两条曲线的走势出现分歧:
主流大型语言模型的 Token 定价,历经长期快速下滑后已逐渐趋于稳定,部分应用场景甚至出现回涨; 另一方面,基于辉达 (NVDA-US) 、超微半导体 (AMD-US) 、Google(GOOGL-US) TPU 与 Trainium 等晶片平台的底层算力成本,仍以每年 60% 至 70% 的速度持续压缩。 价格企稳、成本继续下降,这个看似简单的经济学现象,却带来意义深远的结论:Token 的边际利润率正在改善。高盛预估,正向毛利率的拐点很可能在 2026 年上半年内出现。这意味着,接下来 AI 使用量的爆发性成长,不再只是一个收入故事,更将是一个利润故事。
AI 代理:不是更好的聊天机器人,而是全新使用範式报告的核心研究对象是AI 代理。与传统聊天机器人仅能被动回应不同,AI 代理能够自主规划、执行、监控并反覆修正,以完成複杂任务。
高盛将其分为消费级与企业级两大类,并分别进行深入的量化分析。
消费级代理:从一问一答到永远在线
高盛数据显示,2025 年平均每次 AI 查询消耗约 1,715 个 Token,大致相当于 3 至 5 分钟的对话。但这种模式正在被颠覆。
消费级代理分为两种形态:
按需型代理(On-Demand):由用户主动发起任务。以旅游订票为例,代理需依序完成意图解析、资讯补全、多轮搜寻筛选、用户回馈整合、预订前验证等十余个步骤,Token 消耗量远超一般对话。 常驻型代理(Always-On):持续在背景运作,无需用户主动触发,负责监控信箱、管理行程、追蹤价格等任务。高盛模拟显示,一个全天运作的邮件助理每日消耗超过 10 万个 Token,是传统对话的近百倍。高盛预估,至 2030 年,全球每日 AI 查询量将从 2025 年的约 50 亿次成长至约 230 亿次,其中高达 30% 可能由代理处理;消费级代理工作负载将推动全球 Token 消耗量较现行水準成长约 12 倍,每月新增约 60 千兆(peta)个 Token。
企业级代理:精确性驱动,Token 消耗高度不对称企业级代理的核心诉求不在便利,而在精确。每一项输出都必须经过多轮推理、验证、纠错与审计,才能真正嵌入业务流程。
高盛针对 AI 暴露度最高的职业,逐一构建模拟代理,拆解具体工作步骤与模型调用逻辑,揭示了一个重要的不对称性:Token 消耗量与实际 API 成本并不总是成正比:
应用场景
每日 Token 消耗
每日 API 成本
对应人工成本
程式开发代理
约 700 万
约 13 美元
-
呼叫中心代理
约 200 万
约 92 美元
约 90 美元
资料输入代理
约 2,500 万
约 60 美元
约 80 美元
值得注意的是,呼叫中心代理因依赖即时语音处理,每日 API 成本已略高于人工外包成本,短期内规模化部署仍面临挑战;而程式开发与资料输入场景的经济可行性则相当显着,也解释了为何软体开发目前是代理採用速度最快的领域。
历史採用曲线给出的启示为预测代理的普及节奏,高盛引用了横跨 161 个国家、101 种技术、逾 200 年的历史技术扩散数据库,从中提炼出三项规律:
不同技术从问世到渗透率达峰的时间差异悬殊,铁路与固定电话耗时逾百年,ATM 与微创手术技术不到 20 年,中位数为 29 年。 採用曲线形态各异,有 J 型(如 1990 年代的网际网路爆发)、S 型、线性等多种模式。 新技术的峰值渗透率往往高于旧技术,因其倾向于扩大整体市场,而非单纯取代既有技术。据此,高盛做出基线假设:企业级代理採用将呈 S 型曲线,从目前试验期到 2030 年前后进入加速扩散;达到峰值渗透率约需 15 年,快于历史中位数。
在峰值状态(约 2040 年),全球知识工作者中约 37% 的工作流程将由代理处理,届时全球 Token 消耗量将达到当前水準的 55 倍。
至 2030 年,消费级与企业级代理合计将推动全球 Token 消耗量达到现行水準的 24 倍以上,即每月约 120 千兆个 Token。
一个自我强化的正向飞轮高盛在报告中描绘了一个正回馈循环:算力成本下降,使更複杂的代理在经济上可行;更複杂的代理消耗更多 Token;更高的使用率改善 AI 基础建设的经济性;更好的经济性又为模型品质与分发能力的持续投入创造空间。
这套逻辑与市场过往的主流担忧形成鲜明对比:AI 使用量越大、亏损越多的旧叙事,正在被使用量越大、单位利润越高的新逻辑所取代。
高盛也提醒,并非所有 AI 工作负载都能享受此一正向拐点。激烈竞争可能迫使部分标準化聊天产品的 Token 定价继续走低,降幅甚至超过成本的压缩速度。
投资布局三条主线基于上述分析框架,高盛在三大领域提出投资建议:
半导体:首选博通 (AVGO-US) 、辉达与超微半导体。Token 成本持续下降将扩大可寻址的算力市场,而下游客户利润率的改善将为持续资本支出创造更多空间。
网路与云端运算:首选 Alphabet、亚马逊 (AMZN-US) 与 Meta(META-US) 。高盛特别指出,亚马逊 AWS 营收增速重新加速至年增 28%,Google Cloud 增速达 63%,Alphabet 营收积压订单接近 4,600 亿美元。
软体与 IT 服务:首选微软 (MSFT-US) 、Cloudflare(NET-US) 与埃森哲 (ACN-US) 。微软 Copilot 用户回馈持续改善;Cloudflare 凭藉其网路架构优势,有望在 AI 推理工作负载中取得超额市场佔有率;埃森哲则将受惠于企业从 AI 试点迈向规模化代理部署过程中,对系统整合与流程再造的庞大需求。