AI 真有产值吗？MIT 新研究：AI 写程式产量暴增 180%，能用的只增加 30%

匿名

作者

麻省理工学院（MIT）涵盖逾 10 万名开发者的研究显示，AI 程式代理虽然大幅推高程式产量，但真正进入生产环境的软体增幅远不如表面数字亮眼。AI 工具让程式量约增加 180%，但实际上线的程式仅约增加 30%。

新创公司在早期产品出现后共计已投资 AI 程式工具数十亿美元，因代理程式在各项软体基準测试表现亮眼：早期仅能解决部分任务，短时间内进步到取得高分，使不少投资人误以为软体工程已攻克。但研究与业界观察都显示，可测试验证的能写程式与真正能交件的落差仍十分明显。

研究与分析指出，AI 写程式之所以进展顺利，是因可验证性高：编译器能直接判定输出是否通过，测试套件也能立即得知对错，模型可反覆以基準为目标最佳化。但真实企业环境，最难的往往不是写出可执行的程式，而是判断变更是否适合某个特定、文件不完整且複杂的生产系统。这类正确性无法只靠数字榜衡量，系统通常必须真实负载运作够长时间才能确认。

投资人与业界人士强调，真正有价值的不是通用回答，而是能基于企业资料正确推论。能回答一般问题的 token 价值有限，若 AI 必须以特定公司资料、工作流程与权限架构顺利推理，价值就会大幅提高。这也代表资料存取、信任关係与企业整合成本，可能比模型功能高低更能形成长期护城河。

多家 AI 公司也以这种逻辑设计商业模式。部分业者採取成功才收费方式，如只有代理程式完整解决客户问题时才计费；另一些则保证某种结果。这类定价模式之所以可行，前提是业者取得足够系统权限，能判断任务是否真正完成。法律领域也出现类似情况，部分公司以自家基準与实际经验，反过来定义什么才算合格的 AI 输出，显示标準形成更依赖市场回馈，而不只是关起门来的模型训练。

整体来看，AI 程式工具开发速度确实有提升，但不是线性加速，而是将瓶颈往下游推：程式写更快，审查、测试、整合、上线与产品化压力会跟着升高。对投资人而言，这代表应更关注需要公司资料、长期信任与深度整合才能交件的企业，而不是只看基準分数的表面胜利。

The Untrainable
How much value is AI really creating?
AI Coding Agents Write 180% More Code But Ship Only 30% More Software
WRITING CODE VS. SHIPPING CODE: PRODUCTIVITY EFFECTS ACROSS GENERATIONS OF AI CODING TOOLS
AI can write code. Enterprise delivery is harder
AI Is Fueling a Product Marketing Crisis

（首图来源：Pixabay）

发布于 2026-06-11 14:47

喜欢 0

上一篇：第二季进入清洗排程，天品看好 AI 液冷需求续强下一篇：自驾电动卡车夯 Einride 挂牌首日飙涨 57%

推荐阅读