代号「卡皮巴拉」意外曝光!Anthropic最强AI提前现形 能力太强不敢发?
AI 公司 Anthropic 因内容管理系统配置失误,意外曝光代号Capybara的全新模型 Claude Mythos 相关内部文件,揭露一款被形容为能力飞跃、却也带来前所未见网路安全风险的下一代 AI 系统。Claude Mythos 是一款具有划时代意义的全新模型。

Anthropic 此次外洩文件近 3000 份,包含未发布的部落格草稿与产品规划,迅速在科技圈掀起波澜。
根据《财富 (Fortune)》杂誌取得的资料,Claude Mythos 已完成训练,定位为超越现行最强模型 Opus 的全新层级,在程式编写、学术推理与网路安全等测试中表现远优于 Claude Opus 4.6。
然而,Claude Mythos 强大的网路攻防能力却令 Anthropic 自身感到担忧。
文件显示,Anthropic 公司内部评估指出,Mythos预示着即将出现一波新型模型,其利用漏洞的能力将远超过防御者的应对速度,因此决定採取较过往更谨慎的发布策略。
外洩的部落格草稿进一步说明,由于 Mythos 属于大型且计算密集的模型,运作成本极高,公司将先以早期体验形式提供给特定组织,尤其侧重于网路防御应用,旨在协助相关单位在 AI 驱动的攻击浪潮来临前,强化其程式码库的稳健性。
此外,文件亦意外披露执行长 Dario Amodei 将参与一场于英国庄园举办的欧洲企业执行长闭门峰会,疑似为新产品进行高端推广。
Anthropic 已向《财富》证实确有开发此模型,并将其描述为 AI 能力的重大飞跃,但强调因配置疏失而外洩的内容包含未定稿资讯与废弃素材。
Anthropic 发言人表示,此次事件源于一个外部内容管理工具的设定错误,目前已封锁相关资料存取路径。
此次外洩不仅提前揭露 AI 竞赛的下一阶段进展,更突显尖端技术的双面刃本质,也就是当模型的智慧与能力达到新高度,其潜在风险与社会影响也将同步加剧,迫使开发者必须在创新与安全之间取得更艰难的平衡。