图灵奖得主杨立昆给出AI模型的下一步！重砲批判LLM：无法通往AGI

匿名

作者

图灵奖得主、着名 AI 科学家杨立昆（Yann LeCun）近日接受访谈时，对当前大型语言模型（LLM）的发展路线提出系统性批评。他明确指出，LLM 虽是极具价值的技术，却并非通往通用人工智慧（AGI）的正确路径，真正的突破有赖于能够预测行动后果、在抽象空间中进行规划的世界模型架构。

图灵奖得主杨立昆给出AI模型的下一步！重砲批判LLM：无法通往AGI。(图：Shutterstock)

杨立昆并不否认 LLM 的实用价值。他本人也在日常中使用这类系统。但他强调，单靠预测下一个词的机制，无法产生类人智慧，甚至难以达到许多动物所具备的基本理解与规划能力。

‌

他指出，LLM 的成功建立在语言本身的特殊性上：语言由有限的离散符号组成，训练目标明确，回馈讯号清晰。然而，这正是问题所在，真实世界是连续的、高维的、充满不确定性的，无法被切割成离散符号来处理。

例如，当有人问洗车店在 100 公尺外，我应该走路去吗？，不少 LLM 会建议步行，理由是距离很近，但却忽略了车必须被开进洗车店这个最基本的物理前提。

这并非一般所说的幻觉问题，而是模型根本缺乏对物理世界因果关係的内部建模能力。

两个架构性缺口

杨立昆认为，LLM 存在两个无法靠打补丁修复的根本缺陷。

第一，缺乏预测行动后果的能力。人类在过马路前会自动模拟现在走过去会有车吗？等几秒更安全吗？，这是一种内部的前瞻模拟机制。

但 LLM 没有这样的模拟器，它能说出如果我这样做可能会发生什么，但那是在複现训练资料中的语言模式，而非真正在内部模拟世界的运作。

第二，缺乏基于搜寻的多步规划能力。 LLM 的推理链（如 Chain-of-Thought）虽然有助于在语言空间找到更合理的表达，但本质上比较的是哪段话听起来更像一个好计画，而非执行这个行动后，现实世界的状态会如何改变。两者之间存在一道始终未被填上的鸿沟。

RAG、工具呼叫、反思链路等常见补强方案，杨立昆认为都是在外部叠加能力，并未改变模型学习和理解世界的根本方式。

VLA 路线基本上已告失败

将 LLM 能力延伸至物理行动的视觉 - 语言 - 动作模型（VLA），曾被视为具身智慧的最有力解法。然而杨立昆在访谈中直言，VLA 现在基本上已失败。

学术研究也印证了这一判断。2025 年发表于软体工程顶会 FSE 的研究VLATest，对七个代表性 VLA 模型进行系统测试后发现，这些模型缺乏实际部署所需的稳健性，光照条件改变、相机视角偏移，都能让成功率大幅下滑。

更值得警惕的是，部分研究发现 VLA 模型在很大程度上忽略了语言指令，主要依赖视觉线索进行决策，本质上仍是模式匹配，而非真正建立起指令与动作之间的因果关联。

杨立昆指出，VLA 继承了 LLM 的所有不可靠性，却要在物理世界中承担后果。语言模型输出错误，使用者可以重试；机器人输出错误动作，后果往往不可撤回。

VLA 的资料效率问题是 LeCun 批评的核心之一：它们是用海量资料训练的，需要大量资料来训练这些系统进行模仿，这变得很昂贵，而且有点脆弱。换句话说，想让机器人解决的每个任务，需要收集大量资料。

这与 LLM 形成了鲜明对比。 LLM 的预训练资料具有普遍的迁移性，在网路文字上学到的语言能力，可以被微调到无数下游任务。

但 VLA 的模仿学习资料没有这种迁移性。每个新任务、每个新环境、每个新操作对象，往往需要重新收集演示资料。扩展到新任务时，成本不是次线性的，而是线性甚至超线性成长。

JEPA：在抽象空间中预测，而非在像素中重建

杨立昆提出的替代路径是联合嵌入预测架构（JEPA）。

其核心哲学可以用一个直觉例子说明：当你推一个装满水的无盖瓶子，你知道它可能会倒，但无法预测它倒向哪个方向，更不可能在像素层级预测瓶身的每个光影变化。

人类的直觉物理运作在一个去噪后的抽象层，知道大概会发生什么，但不需要模拟每个分子的运动。

JEPA 正是基于这个道理。它不要求模型重建或生成每个像素，而是在语义表征空间中预测未来状态的抽象表示。这让模型能够聚焦于真正与决策相关的资讯，而非浪费运算能力在纹理、光照等无关细节上。

2026 年 3 月发表的论文LeWorldModel是目前 JEPA 路线最具代表性的工程验证。这个仅有 1,500 万参数的小型模型，在 Push-T 等控制任务上成功率达 96%，且规划速度较现有方法最高提升近 50 倍。

更重要的是，整个训练过程从原始像素开始、无需庞大预训练，且损失函数稳定收敛，解决了先前 JEPA 架构难以稳定训练的问题。

LLM 本质上不安全

杨立昆对 LLM 的安全性做出了强烈的定性判断：大型语言模型本质上是不安全的。我认为它们无法变得可靠和安全。

他的理由有二。其一，幻觉问题无法根除。自回归生成架构中，模型永远只是在预测可能的下一个词，没有任何内建机制验证输出是否符合事实。

其二，当 LLM 被赋予 AI 代理能力时，无法保证它不会採取后果难以预料的行动。他举例，已有程式码智慧体误删硬碟的真实案例，而程式设计领域还是 LLM 相对最可靠的场域，因为程式码至少可以事后验证。

现有的 RLHF、宪法 AI 等对齐方案，杨立昆认为都是事后施加的软约束，本质上只是降低危险输出的发生机率，无法提供架构层面的硬性保证。训练分布之外的输入，始终可能触发系统的危险行为。

目标驱动 AI：让安全成为系统的内生属性

杨立昆提出的替代方向是目标驱动 AI。这个架构的核心转变在于：系统的行为不再由预测下一个 token驱动，而是由寻找能满足目标与安全约束的行动序列驱动。

在这个框架下，系统在执行任何行动前，会先用世界模型模拟各种可能行动序列的后果，排除所有违反安全约束的选项，再选择最接近目标的路径。

安全约束被内嵌为目标函数的一部分，系统从构造上就无法违反这些限制，而非依赖外部过滤或事后纠正。

杨立昆坦承这个架构仍有失败模式：代价函数可能设计有误，世界模型的预测可能不够準确。但他强调，这些失败是可调试、可验证的，与 LLM 幻觉的黑箱性质截然不同。

未来图景：三层分工，而非二选一

杨立昆并不主张用世界模型取代LLM，而是为两者划定清晰的分工边界。

在他描绘的三层架构中，LLM 作为语言接口层，负责自然语言的理解与生成、知识调用，以及在语言即推理基底的领域（程式码、数学、文书）中直接完成任务；世界模型层负责在抽象表征空间中建模物理世界、预测行动后果、进行多步规划；目标驱动决策层则维护全局的代价函数与安全约束，确保系统行为从架构上不可越界。

他以认知科学的双系统理论作类比：LLM 对应系统一（快速、直觉、模式匹配），世界模型对应系统二（缓慢、深思、后果模拟）。

人类智慧的关键特徵之一，正是能在两种模式间按需切换，而当前的 LLM 只有系统一。

对于範式转变的时间点，杨立昆给出了罕见的具体预测：到 2027 年初，对于需要範式转变的认识，将对所有人变得不言而喻。

不过，他也同时强调，这不意味着到那时我们就会有解决方案，认知的转变与技术方案的成熟，是两件截然不同的事。

发布于 2026-06-09 14:31

喜欢 0

上一篇：AI资金重新回流！日韩半导体强弹 SpaceX挂牌恐让市场持续波动下一篇：英特尔该紧张？AMD Windows游戏电脑CPU占比逼近45% 创历史新高

推荐阅读