Anthropic推出Claude Fable 5公众版模型

Anthropic于周二正式发布了Claude Fable 5，这是其最强大AI模型Mythos的首个公开版本。这一举措标志着Anthropic首次将顶级AI能力面向普通用户开放，但同时设置了严格的安全防护措施。

Claude Fable 5在软件工程、知识工作和视觉识别领域表现出色。Anthropic表示，该模型能够高效处理复杂的编程任务、深度分析大量文本信息，并具备强大的图像理解能力。然而，为了防范潜在风险，Anthropic在模型中嵌入了硬性安全限制。在网络安全、生物学、化学和模型蒸馏等高风险领域，Fable 5会主动阻止响应，并回退到Claude Opus 4.8模型进行处理。

Claude Fable 5 界面

Mythos模型最初于4月以预览形式推出，当时仅限少数合作伙伴使用，主要原因是网络安全方面的顾虑。上周，Anthropic将访问权限扩展到15个国家的数百家组织，重点覆盖管理关键基础设施的机构。如今，通过Anthropic的Claude API和基于消耗的企业计划，普通用户也能体验到这一技术。

在订阅计划方面，Anthropic采取了分阶段推出的策略。截至6月22日，Fable 5将免费包含在Pro、Max、Team和基于座位的企业计划中。从6月23日起，Anthropic将从这些计划中移除Fable 5，用户需使用积分才能继续访问，不过公司计划尽快将其恢复为标准的订阅功能。此外，Anthropic还面向已获准访问高级模型的机构推出了新版本的Mythos 5。

Fable 5的发布恰逢Anthropic准备进入公开市场的关键时期，与OpenAI和Elon Musk的SpaceX同台竞技。此前，Anthropic曾呼吁全球主要AI实验室建立协调机制，为前沿AI开发设置“刹车踏板”。公司警告称，AI系统发展速度过快，可能很快实现递归自我改进（RSI），即在无需人类干预的情况下自主提升能力。

为了确保安全，Anthropic在发布Fable 5前对其分类器进行了严格的压力测试，包括模拟越狱攻击。公司透露，内部开展的漏洞悬赏计划在超过1000小时的测试中未发现任何通用越狱方法。随后与外部红队组织的合作也未找到通用越狱途径。尽管如此，Anthropic承认仍可能存在新型攻击方式。

因此，随着Fable 5和Mythos 5的推出，Anthropic要求所有流量保留30天，即使企业此前拥有零保留协议。公司强调不会将数据用于训练，仅用于“防御复杂的新型攻击，包括新的越狱方法”以及“识别并减少误报”。这一政策可能开创行业先例，即访问越来越强大的模型需要强制实施数据保留策略，并将其作为安全措施的一部分。

对于持续使用模型的用户，并非所有问题都会得到Fable 5的回答。Anthropic表示，Fable需要回退到Opus 4.8的情况较为罕见，早期数据显示至少95%的Fable会话完全由该模型运行。这一比例表明，Fable 5在绝大多数场景下都能独立完成任务，仅在极少数高风险领域需要降级处理。