Anthropic推出Claude Fable 5公众版模型
「Anthropic发布Claude Fable 5,这是其最强模型Mythos的首个公开版本,在软件工程、知识工作和视觉方面表现卓越,并内置严格安全限制。」
Anthropic于周二正式发布了Claude Fable 5,这是其最强大AI模型Mythos的首个公开版本。这一举措标志着Anthropic首次将顶级AI能力面向普通用户开放,但同时设置了严格的安全防护措施。
Claude Fable 5在软件工程、知识工作和视觉识别领域表现出色。Anthropic表示,该模型能够高效处理复杂的编程任务、深度分析大量文本信息,并具备强大的图像理解能力。然而,为了防范潜在风险,Anthropic在模型中嵌入了硬性安全限制。在网络安全、生物学、化学和模型蒸馏等高风险领域,Fable 5会主动阻止响应,并回退到Claude Opus 4.8模型进行处理。
Mythos模型最初于4月以预览形式推出,当时仅限少数合作伙伴使用,主要原因是网络安全方面的顾虑。上周,Anthropic将访问权限扩展到15个国家的数百家组织,重点覆盖管理关键基础设施的机构。如今,通过Anthropic的Claude API和基于消耗的企业计划,普通用户也能体验到这一技术。
在订阅计划方面,Anthropic采取了分阶段推出的策略。截至6月22日,Fable 5将免费包含在Pro、Max、Team和基于座位的企业计划中。从6月23日起,Anthropic将从这些计划中移除Fable 5,用户需使用积分才能继续访问,不过公司计划尽快将其恢复为标准的订阅功能。此外,Anthropic还面向已获准访问高级模型的机构推出了新版本的Mythos 5。
Fable 5的发布恰逢Anthropic准备进入公开市场的关键时期,与OpenAI和Elon Musk的SpaceX同台竞技。此前,Anthropic曾呼吁全球主要AI实验室建立协调机制,为前沿AI开发设置“刹车踏板”。公司警告称,AI系统发展速度过快,可能很快实现递归自我改进(RSI),即在无需人类干预的情况下自主提升能力。
为了确保安全,Anthropic在发布Fable 5前对其分类器进行了严格的压力测试,包括模拟越狱攻击。公司透露,内部开展的漏洞悬赏计划在超过1000小时的测试中未发现任何通用越狱方法。随后与外部红队组织的合作也未找到通用越狱途径。尽管如此,Anthropic承认仍可能存在新型攻击方式。
因此,随着Fable 5和Mythos 5的推出,Anthropic要求所有流量保留30天,即使企业此前拥有零保留协议。公司强调不会将数据用于训练,仅用于“防御复杂的新型攻击,包括新的越狱方法”以及“识别并减少误报”。这一政策可能开创行业先例,即访问越来越强大的模型需要强制实施数据保留策略,并将其作为安全措施的一部分。
对于持续使用模型的用户,并非所有问题都会得到Fable 5的回答。Anthropic表示,Fable需要回退到Opus 4.8的情况较为罕见,早期数据显示至少95%的Fable会话完全由该模型运行。这一比例表明,Fable 5在绝大多数场景下都能独立完成任务,仅在极少数高风险领域需要降级处理。
来源:Heooo AI工具导航