Anthropic宣布顶级AI《克劳德寓言5》。 “神话级”模型首次向公众发布

当地时间 6 月 9 日,Anthropic 宣布推出新的大规模语言模型(LLM)“Claude Fable 5”和“Claude Mythos 5”。 《克劳德寓言5》是一款面向普通用户的顶级模型,首次将仅限于公众的“神话级”能力向广泛开放。另一方面,Claude Mythos 5 将提供给网络防御和生命科学研究等特定领域的值得信赖的组织。

在Anthropic的模型体系中,寓言和神话被定位为继俳句、十四行诗、作品之后的新顶级类。据说它的性能比之前的旗舰型号 Opus 级更高,该公司将其描述为“比迄今为止向公众提供的任何型号的性能都要高”。

此次发布的《神鬼寓言5》和《神话5》使用相同的基础模型,性能上没有差异。区别在于是否存在安全功能:《神鬼寓言 5》内置了可供公开发布的保护功能,而《神话 5》的配置则删除了一些保护功能。

这背后是2026年4月公布的“Claude Mythos Preview”的存在。虽然该模型具有先进的网络安全能力,在发现漏洞和分析攻击方法方面表现出了强大的能力,但被判断为如果被滥用会带来很高的风险,因此仅提供给政府机构、关键基础设施运营商和安全研究人员等有限数量的组织。

在接下来的几个月里,人为增加了安全措施。在建立了检测和控制高风险应用程序的机制后,我们决定普遍使用 Mythos 级模型。

《神鬼寓言 5》拥有独立的分类系统,当检测到与网络安全、生物/化学和模型蒸馏相关的请求时,会自动将响应切换到 Claude Opus 4.8。用户将收到有关切换的通知。

此外,Anthropic 对支持 Frontier LLM 开发的应用程序有其自身的限制。这种情况下,不会通知用户或者切换模型,而是通过修改提示、调整响应内容来限制能力。据该公司称,这一限制将影响大约 0.03% 的总流量,或者在组织基础上影响不到 0.1%。

尽管保护设置相对保守,但 Anthropic 声称回退发生在不到 5% 的会话中,而《神鬼寓言 5》的原始性能可用于超过 95% 的使用。

两款车型之间的关系也体现在名字上。 “寓言”源自拉丁语“fabula”(讲述的事物),“Mythos”在希腊语中是神话的意思。该公司表示,通过使用具有相似含义的词语,表明它们基于相同的基本模型。

《神鬼寓言 5》于同日发售。它在 API 和即用即付企业计划中完全可用,并且还可以在 Amazon Bedrock、Microsoft Foundry、GitHub Copilot 等上使用。

虽然它可以与 Claude 的免费计划和其他计划一起使用,但在 6 月 22 日之前,它可以在 Pro、Max、Team 和基于席位的 Enterprise 计划上免费使用,并将从 6 月 23 日起过渡到使用积分系统。由于难以预测需求,该公司正在采取分阶段推出的方式,并计划在获得足够的供应能力后将其纳入标准功能。

API 中的模型名称是“claude-fable-5”。费用定为每百万输入代币 10 美元,每百万输出代币 50 美元。

宣扬从软件开发到科学研究的最高水平性能

据 Anthropic 称,《神鬼寓言 5》和《神话 5》在软件开发、知识工作、图像识别和科学研究等广泛领域都取得了最先进的性能。

在软件开发领域,我们在编码评估指标“SWE-Bench Pro”中得分为80.3%。在支付服务公司 Stripe 的初步评估中,一天之内可以迁移 5000 万行 Ruby 代码库。如果手动完成,整个团队估计需要两个多月的时间才能完成这项工作。

在复杂的知识任务中,性能也得到了提高,跨文档推理、图表解释和解决问题的能力也得到了提高。

图像识别能力也得到了很大的提高。作为演示,Anthropic 发布了一个案例研究,其中玩家仅使用游戏屏幕截图作为输入信息,从头到尾完成了“Pokémon Firered”。它不提供地图信息、导航辅助或内部游戏状态数据。

还可以从科学图表中提取数值,并仅从屏幕截图中重建 Web 应用程序的源代码。

长时间自主工作的能力也被认为是一种优势。 Anthropic 声称,当涉及多天的研究工作和复杂的项目时,新模型与之前模型的差异将会增加。

在科学研究领域,使用 Mythos 5 的示例包括组装 138 个动物物种的单细胞数据以及设计独特的机器学习模型。在生命科学领域,他在蛋白质设计和寻找候选药物发现方面也取得了成果。

Mythos 5 最初将提供给参与网络防御计划 Project Glasswing 的组织。大约 200 个组织正在参与该计划,Anthropic 计划与美国政府合作,通过可信访问计划逐步扩大其影响范围。

我们还将准备一个框架,为生命科学研究人员提供不受生物和化学领域限制的Mythos类模型。希望能够加速药物发现和新疗法的研究。

在安全性评估中,虽然模型对齐总体上与 Opus 4.8 相当,但在一些与自残/自杀相关的响应以及与儿童安全相关的一些领域还有改进的空间。 Anthropic表示,大部分问题已经通过claude.ai系统提示的更新得到解决,这将在未来的学习中得到体现。

至于保护功能的鲁棒性,经过外部研究人员超过 1000 小时的错误赏金计划和红队验证,没有找到可以在所有情况下禁用安全功能的通用越狱方法。

请注意,保护功能启动时的行为因使用环境而异。网页版、桌面版和移动应用程序将自动回退到 Opus 4.8,但消息 API 将使用默认设置阻止响应。开发人员必须实现重试处理和回退功能,或者在服务器端启用自动回退功能。

此外,Anthropic 还推出了一项新政策,将在 Mythos 级和更高性能的未来型号上保留所有流量 30 天。收集的数据不会用于模型学习,而是用于针对网络攻击和越狱的对策以及改进安全功能。

信息来源

(画像:Anthropic)