行业资讯

安全枷锁下的最强AI:Claude Fable 5为何答不上基础题

Heooo 06月11日11时00分 2 阅读

「Anthropic发布Claude Fable 5,因极高安全限制拒绝回答基础生物问题,引发对AI安全与能力平衡的讨论。」

Anthropic近日正式发布了其最新一代人工智能模型Claude Fable 5。然而,这款号称“最强”的模型在实际测试中却表现出令人意外的局限性——它连基础生物题也答不上来。这一现象并非源于模型能力的缺失,而是Anthropic出于极高安全标准所做的刻意限制。

在实际测试中,这种保守策略的副作用显而易见。无论是关于细胞线粒体功能的科普、花粉症成因的探讨,还是哮喘药物原理等无害医学常识,Claude Fable 5均予以驳回。甚至连埃博拉病毒这类公共卫生相关话题,也触发了其屏蔽机制。这种“无差别拦截”导致原本具备学术价值和科普意义的交流被迫中断。

Anthropic对此回应称,此举核心目的是为了防范恶意用户利用先进AI从事高风险生物研究,例如开发生物武器。公司发言人帕鲁尔・马赫什瓦里表示,为了让模型能够尽早上线,团队选择了极端保守的防护路线,并承认目前存在较多的识别误判。

对比来看,Claude Fable 5在化学与网络安全领域的限制则显得更加灵活。虽然它会拒绝提供炸药制造工艺或炭疽杆菌培养方式等危险信息,但对于氯气用途、密码安全及物理学原理等中性技术问题,模型能够正常作答。只有在涉及剧毒物质等极端场景时,它才会调用上一代模型进行辅助处理。

目前,Anthropic正致力于优化识别机制以减少误判,并计划在未来针对生物医学领域的专业用户,推出能够解锁这些限制的特定版本,旨在平衡科研效率与社会安全。这一“受限发布”模式,或许正是当前顶尖AI模型在追求强大性能与严苛安全之间寻找平衡的一个缩影。

# Claude Fable 5 # AI安全 # Anthropic # 模型限制

来源:Heooo AI工具导航