AI 真有产值吗?MIT 新研究:AI 写程式产量暴增 180%,能用的只增加 30%

麻省理工学院(MIT)涵盖逾 10 万名开发者的研究显示,AI 程式代理虽然大幅推高程式产量,但真正进入生产环境的软体增幅远不如表面数字亮眼。AI 工具让程式量约增加 180%,但实际上线的程式仅约增加 30%。

新创公司在早期产品出现后共计已投资 AI 程式工具数十亿美元,因代理程式在各项软体基準测试表现亮眼:早期仅能解决部分任务,短时间内进步到取得高分,使不少投资人误以为软体工程已攻克。但研究与业界观察都显示,可测试验证的能写程式与真正能交件的落差仍十分明显。

研究与分析指出,AI 写程式之所以进展顺利,是因可验证性高:编译器能直接判定输出是否通过,测试套件也能立即得知对错,模型可反覆以基準为目标最佳化。但真实企业环境,最难的往往不是写出可执行的程式,而是判断变更是否适合某个特定、文件不完整且複杂的生产系统。这类正确性无法只靠数字榜衡量,系统通常必须真实负载运作够长时间才能确认。

投资人与业界人士强调,真正有价值的不是通用回答,而是能基于企业资料正确推论。能回答一般问题的 token 价值有限,若 AI 必须以特定公司资料、工作流程与权限架构顺利推理,价值就会大幅提高。这也代表资料存取、信任关係与企业整合成本,可能比模型功能高低更能形成长期护城河。

多家 AI 公司也以这种逻辑设计商业模式。部分业者採取成功才收费方式,如只有代理程式完整解决客户问题时才计费;另一些则保证某种结果。这类定价模式之所以可行,前提是业者取得足够系统权限,能判断任务是否真正完成。法律领域也出现类似情况,部分公司以自家基準与实际经验,反过来定义什么才算合格的 AI 输出,显示标準形成更依赖市场回馈,而不只是关起门来的模型训练。

整体来看,AI 程式工具开发速度确实有提升,但不是线性加速,而是将瓶颈往下游推:程式写更快,审查、测试、整合、上线与产品化压力会跟着升高。对投资人而言,这代表应更关注需要公司资料、长期信任与深度整合才能交件的企业,而不是只看基準分数的表面胜利。

  • The Untrainable
  • How much value is AI really creating?
  • AI Coding Agents Write 180% More Code But Ship Only 30% More Software
  • WRITING CODE VS. SHIPPING CODE: PRODUCTIVITY EFFECTS ACROSS GENERATIONS OF AI CODING TOOLS
  • AI can write code. Enterprise delivery is harder
  • AI Is Fueling a Product Marketing Crisis

(首图来源:Pixabay)

发布于 2026-06-11 14:47
收藏
1
上一篇:第二季进入清洗排程,天品看好 AI 液冷需求续强 下一篇:自驾电动卡车夯 Einride 挂牌首日飙涨 57%