图灵奖得主杨立昆给出AI模型的下一步!重砲批判LLM:无法通往AGI

图灵奖得主、着名 AI 科学家杨立昆(Yann LeCun)近日接受访谈时,对当前大型语言模型(LLM)的发展路线提出系统性批评。他明确指出,LLM 虽是极具价值的技术,却并非通往通用人工智慧(AGI)的正确路径,真正的突破有赖于能够预测行动后果、在抽象空间中进行规划的世界模型架构。

图灵奖得主杨立昆给出AI模型的下一步!重砲批判LLM:无法通往AGI。(图:Shutterstock)

杨立昆并不否认 LLM 的实用价值。他本人也在日常中使用这类系统。但他强调,单靠预测下一个词的机制,无法产生类人智慧,甚至难以达到许多动物所具备的基本理解与规划能力。


他指出,LLM 的成功建立在语言本身的特殊性上:语言由有限的离散符号组成,训练目标明确,回馈讯号清晰。然而,这正是问题所在,真实世界是连续的、高维的、充满不确定性的,无法被切割成离散符号来处理。

例如,当有人问洗车店在 100 公尺外,我应该走路去吗?,不少 LLM 会建议步行,理由是距离很近,但却忽略了车必须被开进洗车店这个最基本的物理前提。

这并非一般所说的幻觉问题,而是模型根本缺乏对物理世界因果关係的内部建模能力。

两个架构性缺口

杨立昆认为,LLM 存在两个无法靠打补丁修复的根本缺陷。

第一,缺乏预测行动后果的能力。 人类在过马路前会自动模拟现在走过去会有车吗?等几秒更安全吗?,这是一种内部的前瞻模拟机制。

但 LLM 没有这样的模拟器,它能说出如果我这样做可能会发生什么,但那是在複现训练资料中的语言模式,而非真正在内部模拟世界的运作。

第二,缺乏基于搜寻的多步规划能力。 LLM 的推理链(如 Chain-of-Thought)虽然有助于在语言空间找到更合理的表达,但本质上比较的是哪段话听起来更像一个好计画,而非执行这个行动后,现实世界的状态会如何改变。两者之间存在一道始终未被填上的鸿沟。

RAG、工具呼叫、反思链路等常见补强方案,杨立昆认为都是在外部叠加能力,并未改变模型学习和理解世界的根本方式。

VLA 路线基本上已告失败

将 LLM 能力延伸至物理行动的视觉 - 语言 - 动作模型(VLA),曾被视为具身智慧的最有力解法。然而杨立昆在访谈中直言,VLA 现在基本上已失败。

学术研究也印证了这一判断。2025 年发表于软体工程顶会 FSE 的研究VLATest,对七个代表性 VLA 模型进行系统测试后发现,这些模型缺乏实际部署所需的稳健性,光照条件改变、相机视角偏移,都能让成功率大幅下滑。

更值得警惕的是,部分研究发现 VLA 模型在很大程度上忽略了语言指令,主要依赖视觉线索进行决策,本质上仍是模式匹配,而非真正建立起指令与动作之间的因果关联。

杨立昆指出,VLA 继承了 LLM 的所有不可靠性,却要在物理世界中承担后果。语言模型输出错误,使用者可以重试;机器人输出错误动作,后果往往不可撤回。

VLA 的资料效率问题是 LeCun 批评的核心之一:它们是用海量资料训练的,需要大量资料来训练这些系统进行模仿,这变得很昂贵,而且有点脆弱。换句话说,想让机器人解决的每个任务,需要收集大量资料。

这与 LLM 形成了鲜明对比。 LLM 的预训练资料具有普遍的迁移性,在网路文字上学到的语言能力,可以被微调到无数下游任务。

但 VLA 的模仿学习资料没有这种迁移性。每个新任务、每个新环境、每个新操作对象,往往需要重新收集演示资料。扩展到新任务时,成本不是次线性的,而是线性甚至超线性成长。

JEPA:在抽象空间中预测,而非在像素中重建

杨立昆提出的替代路径是联合嵌入预测架构(JEPA)。

其核心哲学可以用一个直觉例子说明:当你推一个装满水的无盖瓶子,你知道它可能会倒,但无法预测它倒向哪个方向,更不可能在像素层级预测瓶身的每个光影变化。

人类的直觉物理运作在一个去噪后的抽象层,知道大概会发生什么,但不需要模拟每个分子的运动。

JEPA 正是基于这个道理。它不要求模型重建或生成每个像素,而是在语义表征空间中预测未来状态的抽象表示。这让模型能够聚焦于真正与决策相关的资讯,而非浪费运算能力在纹理、光照等无关细节上。

2026 年 3 月发表的论文LeWorldModel是目前 JEPA 路线最具代表性的工程验证。这个仅有 1,500 万参数的小型模型,在 Push-T 等控制任务上成功率达 96%,且规划速度较现有方法最高提升近 50 倍。

更重要的是,整个训练过程从原始像素开始、无需庞大预训练,且损失函数稳定收敛,解决了先前 JEPA 架构难以稳定训练的问题。

LLM 本质上不安全

杨立昆对 LLM 的安全性做出了强烈的定性判断:大型语言模型本质上是不安全的。我认为它们无法变得可靠和安全。

他的理由有二。其一,幻觉问题无法根除。自回归生成架构中,模型永远只是在预测可能的下一个词,没有任何内建机制验证输出是否符合事实。

其二,当 LLM 被赋予 AI 代理能力时,无法保证它不会採取后果难以预料的行动。他举例,已有程式码智慧体误删硬碟的真实案例,而程式设计领域还是 LLM 相对最可靠的场域,因为程式码至少可以事后验证。

现有的 RLHF、宪法 AI 等对齐方案,杨立昆认为都是事后施加的软约束,本质上只是降低危险输出的发生机率,无法提供架构层面的硬性保证。训练分布之外的输入,始终可能触发系统的危险行为。

目标驱动 AI:让安全成为系统的内生属性

杨立昆提出的替代方向是目标驱动 AI。这个架构的核心转变在于:系统的行为不再由预测下一个 token驱动,而是由寻找能满足目标与安全约束的行动序列驱动。

在这个框架下,系统在执行任何行动前,会先用世界模型模拟各种可能行动序列的后果,排除所有违反安全约束的选项,再选择最接近目标的路径。

安全约束被内嵌为目标函数的一部分,系统从构造上就无法违反这些限制,而非依赖外部过滤或事后纠正。

杨立昆坦承这个架构仍有失败模式:代价函数可能设计有误,世界模型的预测可能不够準确。但他强调,这些失败是可调试、可验证的,与 LLM 幻觉的黑箱性质截然不同。

未来图景:三层分工,而非二选一

杨立昆并不主张用世界模型取代LLM,而是为两者划定清晰的分工边界。

在他描绘的三层架构中,LLM 作为语言接口层,负责自然语言的理解与生成、知识调用,以及在语言即推理基底的领域(程式码、数学、文书)中直接完成任务;世界模型层负责在抽象表征空间中建模物理世界、预测行动后果、进行多步规划;目标驱动决策层则维护全局的代价函数与安全约束,确保系统行为从架构上不可越界。

他以认知科学的双系统理论作类比:LLM 对应系统一(快速、直觉、模式匹配),世界模型对应系统二(缓慢、深思、后果模拟)。

人类智慧的关键特徵之一,正是能在两种模式间按需切换,而当前的 LLM 只有系统一。

对于範式转变的时间点,杨立昆给出了罕见的具体预测:到 2027 年初,对于需要範式转变的认识,将对所有人变得不言而喻。

不过,他也同时强调,这不意味着到那时我们就会有解决方案,认知的转变与技术方案的成熟,是两件截然不同的事。

发布于 2026-06-09 14:31
收藏
1
上一篇:AI资金重新回流!日韩半导体强弹 SpaceX挂牌恐让市场持续波动 下一篇:英特尔该紧张?AMD Windows游戏电脑CPU占比逼近45% 创历史新高