安全枷锁下的最强AI：Claude Fable 5为何答不上基础题

Anthropic近日正式发布了其最新一代人工智能模型Claude Fable 5。然而，这款号称“最强”的模型在实际测试中却表现出令人意外的局限性——它连基础生物题也答不上来。这一现象并非源于模型能力的缺失，而是Anthropic出于极高安全标准所做的刻意限制。

在实际测试中，这种保守策略的副作用显而易见。无论是关于细胞线粒体功能的科普、花粉症成因的探讨，还是哮喘药物原理等无害医学常识，Claude Fable 5均予以驳回。甚至连埃博拉病毒这类公共卫生相关话题，也触发了其屏蔽机制。这种“无差别拦截”导致原本具备学术价值和科普意义的交流被迫中断。

Anthropic对此回应称，此举核心目的是为了防范恶意用户利用先进AI从事高风险生物研究，例如开发生物武器。公司发言人帕鲁尔・马赫什瓦里表示，为了让模型能够尽早上线，团队选择了极端保守的防护路线，并承认目前存在较多的识别误判。

对比来看，Claude Fable 5在化学与网络安全领域的限制则显得更加灵活。虽然它会拒绝提供炸药制造工艺或炭疽杆菌培养方式等危险信息，但对于氯气用途、密码安全及物理学原理等中性技术问题，模型能够正常作答。只有在涉及剧毒物质等极端场景时，它才会调用上一代模型进行辅助处理。

目前，Anthropic正致力于优化识别机制以减少误判，并计划在未来针对生物医学领域的专业用户，推出能够解锁这些限制的特定版本，旨在平衡科研效率与社会安全。这一“受限发布”模式，或许正是当前顶尖AI模型在追求强大性能与严苛安全之间寻找平衡的一个缩影。