据 1M AI News 监测,Anthropic 正在测试一款名为「Claude Mythos」的新模型,
因内容管理系统配置失误,一份未发布的博客草稿被存储在公开可搜索的数据库中,
意外暴露了该模型的存在。Anthropic 随后确认了这款模型,称其代表「能力的阶跃式提升」(step change),
是「我们迄今构建的最强模型」。
泄露的草稿显示,Mythos 是一个全新的模型层级,定位高于 Opus 系列。
草稿称「与此前最佳模型 Claude Opus 4.6 相比,该模型在软件编程、学术推理和网络安全等测试中的得分大幅提升」。
草稿中还出现了「Capybara」这一代号,与 Mythos 指向同一底层模型。
Anthropic 对该模型的网络安全能力尤为警惕,
草稿称其「在网络安全能力方面目前远远领先于任何其他 AI 模型」,
并「预示着即将到来的一波模型浪潮,其漏洞利用能力将远超防御者的应对速度」。
因此,Anthropic 采取了比以往更缓慢的发布策略:首先向少量早期客户开放,
聚焦网络安全防御场景,帮助组织在 AI 驱动的攻击浪潮到来前加固代码库。
该模型运行成本极高,短期内不会面向公众开放。
此次泄露源于 Anthropic 外部 CMS 工具的「人为错误」,
导致近 3000 项未发布资产(包括博客草稿、图片和 PDF)被公开存储在未加密的数据库中。
剑桥大学网络安全研究员 Alexandre Pauwels 和 LayerX Security 高级 AI 安全研究员 Roy Paz 分别独立发现了这些文件。
泄露内容还包括 Anthropic 即将在英国举办的欧洲企业 CEO 闭门峰会细节,
CEO Dario Amodei 将出席,地点为英国乡间一座 18 世纪庄园酒店。
Anthropic 发言人表示:「我们正在开发一款通用模型,在推理、编程和网络安全方面有重大进展。
鉴于其能力的强度,我们在发布方式上会非常审慎。」