Anthropic宣布顶级AI《克劳德寓言5》。 “神话级”模型首次向公众发布

当地时间 6 月 9 日，Anthropic 宣布推出新的大规模语言模型（LLM）“Claude Fable 5”和“Claude Mythos 5”。《克劳德寓言5》是一款面向普通用户的顶级模型，首次将仅限于公众的“神话级”能力向广泛开放。另一方面，Claude Mythos 5 将提供给网络防御和生命科学研究等特定领域的值得信赖的组织。

在Anthropic的模型体系中，寓言和神话被定位为继俳句、十四行诗、作品之后的新顶级类。据说它的性能比之前的旗舰型号 Opus 级更高，该公司将其描述为“比迄今为止向公众提供的任何型号的性能都要高”。

此次发布的《神鬼寓言5》和《神话5》使用相同的基础模型，性能上没有差异。区别在于是否存在安全功能：《神鬼寓言 5》内置了可供公开发布的保护功能，而《神话 5》的配置则删除了一些保护功能。

这背后是2026年4月公布的“Claude Mythos Preview”的存在。虽然该模型具有先进的网络安全能力，在发现漏洞和分析攻击方法方面表现出了强大的能力，但被判断为如果被滥用会带来很高的风险，因此仅提供给政府机构、关键基础设施运营商和安全研究人员等有限数量的组织。

在接下来的几个月里，人为增加了安全措施。在建立了检测和控制高风险应用程序的机制后，我们决定普遍使用 Mythos 级模型。

《神鬼寓言 5》拥有独立的分类系统，当检测到与网络安全、生物/化学和模型蒸馏相关的请求时，会自动将响应切换到 Claude Opus 4.8。用户将收到有关切换的通知。

此外，Anthropic 对支持 Frontier LLM 开发的应用程序有其自身的限制。这种情况下，不会通知用户或者切换模型，而是通过修改提示、调整响应内容来限制能力。据该公司称，这一限制将影响大约 0.03% 的总流量，或者在组织基础上影响不到 0.1%。

尽管保护设置相对保守，但 Anthropic 声称回退发生在不到 5% 的会话中，而《神鬼寓言 5》的原始性能可用于超过 95% 的使用。

两款车型之间的关系也体现在名字上。 “寓言”源自拉丁语“fabula”（讲述的事物），“Mythos”在希腊语中是神话的意思。该公司表示，通过使用具有相似含义的词语，表明它们基于相同的基本模型。

《神鬼寓言 5》于同日发售。它在 API 和即用即付企业计划中完全可用，并且还可以在 Amazon Bedrock、Microsoft Foundry、GitHub Copilot 等上使用。

虽然它可以与 Claude 的免费计划和其他计划一起使用，但在 6 月 22 日之前，它可以在 Pro、Max、Team 和基于席位的 Enterprise 计划上免费使用，并将从 6 月 23 日起过渡到使用积分系统。由于难以预测需求，该公司正在采取分阶段推出的方式，并计划在获得足够的供应能力后将其纳入标准功能。

API 中的模型名称是“claude-fable-5”。费用定为每百万输入代币 10 美元，每百万输出代币 50 美元。

宣扬从软件开发到科学研究的最高水平性能

据 Anthropic 称，《神鬼寓言 5》和《神话 5》在软件开发、知识工作、图像识别和科学研究等广泛领域都取得了最先进的性能。

在软件开发领域，我们在编码评估指标“SWE-Bench Pro”中得分为80.3%。在支付服务公司 Stripe 的初步评估中，一天之内可以迁移 5000 万行 Ruby 代码库。如果手动完成，整个团队估计需要两个多月的时间才能完成这项工作。

在复杂的知识任务中，性能也得到了提高，跨文档推理、图表解释和解决问题的能力也得到了提高。

图像识别能力也得到了很大的提高。作为演示，Anthropic 发布了一个案例研究，其中玩家仅使用游戏屏幕截图作为输入信息，从头到尾完成了“Pokémon Firered”。它不提供地图信息、导航辅助或内部游戏状态数据。

还可以从科学图表中提取数值，并仅从屏幕截图中重建 Web 应用程序的源代码。

长时间自主工作的能力也被认为是一种优势。 Anthropic 声称，当涉及多天的研究工作和复杂的项目时，新模型与之前模型的差异将会增加。

在科学研究领域，使用 Mythos 5 的示例包括组装 138 个动物物种的单细胞数据以及设计独特的机器学习模型。在生命科学领域，他在蛋白质设计和寻找候选药物发现方面也取得了成果。

Mythos 5 最初将提供给参与网络防御计划 Project Glasswing 的组织。大约 200 个组织正在参与该计划，Anthropic 计划与美国政府合作，通过可信访问计划逐步扩大其影响范围。

我们还将准备一个框架，为生命科学研究人员提供不受生物和化学领域限制的Mythos类模型。希望能够加速药物发现和新疗法的研究。

在安全性评估中，虽然模型对齐总体上与 Opus 4.8 相当，但在一些与自残/自杀相关的响应以及与儿童安全相关的一些领域还有改进的空间。 Anthropic表示，大部分问题已经通过claude.ai系统提示的更新得到解决，这将在未来的学习中得到体现。

至于保护功能的鲁棒性，经过外部研究人员超过 1000 小时的错误赏金计划和红队验证，没有找到可以在所有情况下禁用安全功能的通用越狱方法。

请注意，保护功能启动时的行为因使用环境而异。网页版、桌面版和移动应用程序将自动回退到 Opus 4.8，但消息 API 将使用默认设置阻止响应。开发人员必须实现重试处理和回退功能，或者在服务器端启用自动回退功能。

此外，Anthropic 还推出了一项新政策，将在 Mythos 级和更高性能的未来型号上保留所有流量 30 天。收集的数据不会用于模型学习，而是用于针对网络攻击和越狱的对策以及改进安全功能。

信息来源

克劳德寓言 5 和克劳德神话 5 \ 人择

(画像：Anthropic)

宣扬从软件开发到科学研究的最高水平性能

Related articles