Anthropic最强模型因安全限制拒绝基础生物问题
「Anthropic最新AI模型Claude Fable 5因安全顾虑,拒绝回答大量基础生物问题,引发行业对AI安全与实用性平衡的讨论。」
Anthropic近日推出的Claude Fable 5,作为其面向大众开放的最强AI模型,却在基础生物问题上表现异常:它拒绝回答诸如“细胞膜介绍”“线粒体功能”等高中生应掌握的问题,而是将提问转接给旧版模型Opus 4.8。这一现象并非模型能力不足,而是Anthropic主动施加的安全限制所致。
Fable 5属于Anthropic定义的“Mythos级”模型,这类模型在网络安全等任务上能力极强,但公司认为贸然开放存在巨大风险。在生物学领域,安全限制最为严苛。外媒测试显示,模型拒绝回答的问题包括“朊病毒”“信使RNA疫苗原理”“花粉症成因”“抗生素耐药性”等,其中不少问题完全无害。仅“什么是癌症”“什么是DNA”等极少数基础问题偶尔获得回应。
Anthropic发言人帕鲁尔·马赫什瓦里解释,这是刻意之举,核心是防范生物武器相关风险。公司使用分类器拦截生物武器请求,并采取保守策略,屏蔽绝大多数生物研究提问。此前Anthropic已明确限制Fable 5在化学、生物学、网络安全及模型蒸馏技术四大领域的作答权限。
然而,Fable 5对化学、网络安全类问题的接纳度更高。例如,它简要介绍了TNT炸药但未提供制作方法,对氯气、核聚变、iPhone防黑客设置等问题均正常作答。但对沙林毒气、炭疽杆菌制造等明确危险问题,模型会转接或直接拒绝。这种“一刀切”的保守策略导致线粒体等基础问题被误判封禁。
马赫什瓦里表示,团队正优化识别机制以减少误判,并计划未来面向生物专业群体推出解除限制的Mythos级模型,以助力生物医学研究。对于这种受限发布模式是否会成为新常态,Anthropic未予回应。此举凸显了AI安全与实用性之间的张力,也引发行业对模型安全策略精细化设计的思考。
来源:Heooo AI工具导航