AI投资获利或比预期早到来！高盛：「AI代理」改变一切、建议「这样」布局

匿名

作者

高盛近日发布的研究报告《解码代理经济：AI 使用量与利润率的即将拐点》（Decoding the Agentic Economy：The Coming Inflection in AI Usage and Margins ）针对外界最关切的核心问题作出回应，指出 AI 的庞大基础建设投入开始获利的时间或许比市场预期来得更早。

过去两年，AI 产业的主流叙事围绕着烧钱二字。推论负载越重，意味着需要更多加速晶片、更大的电力消耗，以及更高的资本支出。

‌

然而，高盛指出，这套逻辑正在发生根本性转变。

关键在于两条曲线的走势出现分歧：

主流大型语言模型的 Token 定价，历经长期快速下滑后已逐渐趋于稳定，部分应用场景甚至出现回涨；另一方面，基于辉达 (NVDA-US) 、超微半导体 (AMD-US) 、Google(GOOGL-US) TPU 与 Trainium 等晶片平台的底层算力成本，仍以每年 60% 至 70% 的速度持续压缩。价格企稳、成本继续下降，这个看似简单的经济学现象，却带来意义深远的结论：Token 的边际利润率正在改善。

高盛预估，正向毛利率的拐点很可能在 2026 年上半年内出现。这意味着，接下来 AI 使用量的爆发性成长，不再只是一个收入故事，更将是一个利润故事。

AI 代理：不是更好的聊天机器人，而是全新使用範式

报告的核心研究对象是AI 代理。与传统聊天机器人仅能被动回应不同，AI 代理能够自主规划、执行、监控并反覆修正，以完成複杂任务。

高盛将其分为消费级与企业级两大类，并分别进行深入的量化分析。

消费级代理：从一问一答到永远在线

高盛数据显示，2025 年平均每次 AI 查询消耗约 1,715 个 Token，大致相当于 3 至 5 分钟的对话。但这种模式正在被颠覆。

消费级代理分为两种形态：

按需型代理（On-Demand）：由用户主动发起任务。以旅游订票为例，代理需依序完成意图解析、资讯补全、多轮搜寻筛选、用户回馈整合、预订前验证等十余个步骤，Token 消耗量远超一般对话。常驻型代理（Always-On）：持续在背景运作，无需用户主动触发，负责监控信箱、管理行程、追蹤价格等任务。高盛模拟显示，一个全天运作的邮件助理每日消耗超过 10 万个 Token，是传统对话的近百倍。

高盛预估，至 2030 年，全球每日 AI 查询量将从 2025 年的约 50 亿次成长至约 230 亿次，其中高达 30% 可能由代理处理；消费级代理工作负载将推动全球 Token 消耗量较现行水準成长约 12 倍，每月新增约 60 千兆（peta）个 Token。

企业级代理：精确性驱动，Token 消耗高度不对称

企业级代理的核心诉求不在便利，而在精确。每一项输出都必须经过多轮推理、验证、纠错与审计，才能真正嵌入业务流程。

高盛针对 AI 暴露度最高的职业，逐一构建模拟代理，拆解具体工作步骤与模型调用逻辑，揭示了一个重要的不对称性：Token 消耗量与实际 API 成本并不总是成正比：

应用场景

每日 Token 消耗

每日 API 成本

对应人工成本

程式开发代理

约 700 万

约 13 美元

呼叫中心代理

约 200 万

约 92 美元

约 90 美元

资料输入代理

约 2,500 万

约 60 美元

约 80 美元

值得注意的是，呼叫中心代理因依赖即时语音处理，每日 API 成本已略高于人工外包成本，短期内规模化部署仍面临挑战；而程式开发与资料输入场景的经济可行性则相当显着，也解释了为何软体开发目前是代理採用速度最快的领域。

历史採用曲线给出的启示

为预测代理的普及节奏，高盛引用了横跨 161 个国家、101 种技术、逾 200 年的历史技术扩散数据库，从中提炼出三项规律：

不同技术从问世到渗透率达峰的时间差异悬殊，铁路与固定电话耗时逾百年，ATM 与微创手术技术不到 20 年，中位数为 29 年。採用曲线形态各异，有 J 型（如 1990 年代的网际网路爆发）、S 型、线性等多种模式。新技术的峰值渗透率往往高于旧技术，因其倾向于扩大整体市场，而非单纯取代既有技术。

据此，高盛做出基线假设：企业级代理採用将呈 S 型曲线，从目前试验期到 2030 年前后进入加速扩散；达到峰值渗透率约需 15 年，快于历史中位数。

在峰值状态（约 2040 年），全球知识工作者中约 37% 的工作流程将由代理处理，届时全球 Token 消耗量将达到当前水準的 55 倍。

至 2030 年，消费级与企业级代理合计将推动全球 Token 消耗量达到现行水準的 24 倍以上，即每月约 120 千兆个 Token。

一个自我强化的正向飞轮

高盛在报告中描绘了一个正回馈循环：算力成本下降，使更複杂的代理在经济上可行；更複杂的代理消耗更多 Token；更高的使用率改善 AI 基础建设的经济性；更好的经济性又为模型品质与分发能力的持续投入创造空间。

这套逻辑与市场过往的主流担忧形成鲜明对比：AI 使用量越大、亏损越多的旧叙事，正在被使用量越大、单位利润越高的新逻辑所取代。

高盛也提醒，并非所有 AI 工作负载都能享受此一正向拐点。激烈竞争可能迫使部分标準化聊天产品的 Token 定价继续走低，降幅甚至超过成本的压缩速度。

投资布局三条主线

基于上述分析框架，高盛在三大领域提出投资建议：

半导体：首选博通 (AVGO-US) 、辉达与超微半导体。Token 成本持续下降将扩大可寻址的算力市场，而下游客户利润率的改善将为持续资本支出创造更多空间。

网路与云端运算：首选 Alphabet、亚马逊 (AMZN-US) 与 Meta(META-US) 。高盛特别指出，亚马逊 AWS 营收增速重新加速至年增 28%，Google Cloud 增速达 63%，Alphabet 营收积压订单接近 4,600 亿美元。

软体与 IT 服务：首选微软 (MSFT-US) 、Cloudflare(NET-US) 与埃森哲 (ACN-US) 。微软 Copilot 用户回馈持续改善；Cloudflare 凭藉其网路架构优势，有望在 AI 推理工作负载中取得超额市场佔有率；埃森哲则将受惠于企业从 AI 试点迈向规模化代理部署过程中，对系统整合与流程再造的庞大需求。

发布于 2026-05-13 13:46

喜欢 0

上一篇：估值冲破9000亿美元！Anthropic拟募资300亿美元身价有望超越OpenAI 下一篇：台积电、索尼联手挑战辉达！3奈米自驾晶片剑指L5完全自动驾驶

推荐阅读