Anthropic最强模型因安全限制拒绝基础生物问题

Anthropic近日推出的Claude Fable 5，作为其面向大众开放的最强AI模型，却在基础生物问题上表现异常：它拒绝回答诸如“细胞膜介绍”“线粒体功能”等高中生应掌握的问题，而是将提问转接给旧版模型Opus 4.8。这一现象并非模型能力不足，而是Anthropic主动施加的安全限制所致。

Fable 5属于Anthropic定义的“Mythos级”模型，这类模型在网络安全等任务上能力极强，但公司认为贸然开放存在巨大风险。在生物学领域，安全限制最为严苛。外媒测试显示，模型拒绝回答的问题包括“朊病毒”“信使RNA疫苗原理”“花粉症成因”“抗生素耐药性”等，其中不少问题完全无害。仅“什么是癌症”“什么是DNA”等极少数基础问题偶尔获得回应。

Anthropic发言人帕鲁尔·马赫什瓦里解释，这是刻意之举，核心是防范生物武器相关风险。公司使用分类器拦截生物武器请求，并采取保守策略，屏蔽绝大多数生物研究提问。此前Anthropic已明确限制Fable 5在化学、生物学、网络安全及模型蒸馏技术四大领域的作答权限。

然而，Fable 5对化学、网络安全类问题的接纳度更高。例如，它简要介绍了TNT炸药但未提供制作方法，对氯气、核聚变、iPhone防黑客设置等问题均正常作答。但对沙林毒气、炭疽杆菌制造等明确危险问题，模型会转接或直接拒绝。这种“一刀切”的保守策略导致线粒体等基础问题被误判封禁。

马赫什瓦里表示，团队正优化识别机制以减少误判，并计划未来面向生物专业群体推出解除限制的Mythos级模型，以助力生物医学研究。对于这种受限发布模式是否会成为新常态，Anthropic未予回应。此举凸显了AI安全与实用性之间的张力，也引发行业对模型安全策略精细化设计的思考。