Anthropic调整Claude Fable5限制机制

AI企业Anthropic近日推出的全新模型Claude Fable5，原本设置了一套多重安全防护机制，针对网络安全、生物、化学等高危领域问题，会自动切换至性能更低的模型，以规避技术滥用风险。然而，该模型还包含一项隐蔽限制措施：当检测到用户试图利用该模型研发竞品AI时，平台会在用户不知情的情况下刻意降低模型性能，暗中进行限制。这一做法在AI研究社区引发了强烈反对。

不少研究者认为，这种隐性限制方案不利于行业发展，可能造成AI领域资源垄断。面对舆论压力，Anthropic公开致歉并宣布全面整改。调整后，平台相关安全防护措施将全部对外透明化。一旦检测到用户尝试利用模型研发高性能竞品AI，系统会主动发出提醒，并明确拒绝相关请求，或是直接切换至低配模型，不再采用暗中降性能的方式管控。

Anthropic的这一调整，体现了社区反馈对AI企业决策的重要影响。从技术角度看，模型安全机制的设计需要在保护知识产权和促进开放研究之间取得平衡。Claude Fable5的案例表明，透明度是建立用户信任的关键。未来，AI行业可能会更倾向于采用公开、可解释的安全措施，而非隐藏限制。

此外，这一事件也引发了对AI模型使用条款的讨论。Anthropic的服务条款本就禁止用户利用Claude训练同类竞争模型，但如何在不损害用户体验的前提下执行这些条款，是一个需要精细设计的问题。Anthropic的整改方案——从暗中降性能到公开提醒和拒绝——提供了一个值得参考的范例。