Anthropic拟公开上线最强模型Mythos
「Anthropic计划公开其曾因能力过强而被限制的模型Claude Mythos,通过Project Glasswing计划将其转化为安全工具,已发现超1万个高危漏洞。」
Anthropic近期在后端代码中的频频动作显示,代号为“claude-mythos-1-preview”的模型正处于公开上线的前夜。这款曾因“能力过强”而遭到严格限制的前沿模型,正逐渐从实验室的受控环境走向开发者工具,标志着AI安全治理迈出了从“防御性限制”到“主动式工具化”的关键一步。
自4月7日预览版发布以来,Claude Mythos始终笼罩在巨大的安全争议中。其核心能力不仅仅是“写代码”,而是具备了专业的自动化网络攻击能力:在红队测试中,Mythos被证实能够独立发现并利用主流操作系统和浏览器中的“零日漏洞”;相比旗舰模型Opus4.7,Mythos在代码逻辑、自主执行与推理深度上实现了质的跨越;研究发现,即使是缺乏专业安全背景的人员,在Mythos的引导下也能编写出完整的恶意指令,这使其在被滥用时可能引发全球数字基础设施的系统性灾难。因此,Anthropic此前一直将该模型锁在“防火墙”内,仅供经过授权的有限合作伙伴使用。
为了缓解Mythos带来的安全焦虑,Anthropic发起了“Project Glasswing”计划。该计划并非为了让模型“下岗”,而是通过生态协同,将其转化为防御者的利器。Anthropic联手约50家核心技术合作伙伴(包括操作系统厂商、开源基金会等),利用Mythos Preview主动对全球关键软件进行漏洞扫描。在项目启动的首月,Mythos Preview就协助合作伙伴定位了超10,000个高危或严重漏洞。这标志着软件安全进度从受限于人类发现漏洞的速度,转变为受限于“验证与修复漏洞”的速度——这是由AI带来的巨大效率红利。
目前,Mythos的公开化已不再是“是否”,而是“如何”的问题。最新的迹象表明:用户在Claude Code和Claude Security后端接口中捕捉到的模型切换开关,预示着Anthropic正在构建一套更加完善的“安全护栏系统”。一旦这套系统的合规与限制机制成熟,Mythos-class模型将进入更广泛的商用阶段。同时,Claude Security正在开发全新的可视化仪表盘,用于直观呈现漏洞趋势、历史扫描结果及修复进度,这被看作是其向商业级安全套件转型的信号。虽然目前仍有发布限制,但Anthropic已明确表示,只要研发出更强大的安全护栏,他们期待实现该类模型的通用发布。
Claude Mythos的出现重写了网络安全的逻辑:在未来,谁能率先掌握利用AI挖掘漏洞的能力,谁就能掌握系统防御的主动权。对于开发者而言,Claude Mythos的上线意味着“自主化安全审计”将成为标准工作流。但对于整个互联网而言,这也意味着一种“军备竞赛”的开启——当AI能自动发现并修复漏洞时,防守者与攻击者之间的博弈将发生在纳秒级的时间跨度内。Anthropic的这一动作,无疑是在“释放野兽”与“加固围栏”之间寻找平衡。随着6月份各家AI巨头集中发力,Mythos的每一次更新,都将是全球网络基础设施安全防线的关键风向标。
来源:Heooo AI工具导航