Anthropic拟公开上线最强模型Mythos

Anthropic近期在后端代码中的频频动作显示，代号为“claude-mythos-1-preview”的模型正处于公开上线的前夜。这款曾因“能力过强”而遭到严格限制的前沿模型，正逐渐从实验室的受控环境走向开发者工具，标志着AI安全治理迈出了从“防御性限制”到“主动式工具化”的关键一步。

自4月7日预览版发布以来，Claude Mythos始终笼罩在巨大的安全争议中。其核心能力不仅仅是“写代码”，而是具备了专业的自动化网络攻击能力：在红队测试中，Mythos被证实能够独立发现并利用主流操作系统和浏览器中的“零日漏洞”；相比旗舰模型Opus4.7，Mythos在代码逻辑、自主执行与推理深度上实现了质的跨越；研究发现，即使是缺乏专业安全背景的人员，在Mythos的引导下也能编写出完整的恶意指令，这使其在被滥用时可能引发全球数字基础设施的系统性灾难。因此，Anthropic此前一直将该模型锁在“防火墙”内，仅供经过授权的有限合作伙伴使用。

为了缓解Mythos带来的安全焦虑，Anthropic发起了“Project Glasswing”计划。该计划并非为了让模型“下岗”，而是通过生态协同，将其转化为防御者的利器。Anthropic联手约50家核心技术合作伙伴（包括操作系统厂商、开源基金会等），利用Mythos Preview主动对全球关键软件进行漏洞扫描。在项目启动的首月，Mythos Preview就协助合作伙伴定位了超10，000个高危或严重漏洞。这标志着软件安全进度从受限于人类发现漏洞的速度，转变为受限于“验证与修复漏洞”的速度——这是由AI带来的巨大效率红利。

目前，Mythos的公开化已不再是“是否”，而是“如何”的问题。最新的迹象表明：用户在Claude Code和Claude Security后端接口中捕捉到的模型切换开关，预示着Anthropic正在构建一套更加完善的“安全护栏系统”。一旦这套系统的合规与限制机制成熟，Mythos-class模型将进入更广泛的商用阶段。同时，Claude Security正在开发全新的可视化仪表盘，用于直观呈现漏洞趋势、历史扫描结果及修复进度，这被看作是其向商业级安全套件转型的信号。虽然目前仍有发布限制，但Anthropic已明确表示，只要研发出更强大的安全护栏，他们期待实现该类模型的通用发布。

Claude Mythos的出现重写了网络安全的逻辑：在未来，谁能率先掌握利用AI挖掘漏洞的能力，谁就能掌握系统防御的主动权。对于开发者而言，Claude Mythos的上线意味着“自主化安全审计”将成为标准工作流。但对于整个互联网而言，这也意味着一种“军备竞赛”的开启——当AI能自动发现并修复漏洞时，防守者与攻击者之间的博弈将发生在纳秒级的时间跨度内。Anthropic的这一动作，无疑是在“释放野兽”与“加固围栏”之间寻找平衡。随着6月份各家AI巨头集中发力，Mythos的每一次更新，都将是全球网络基础设施安全防线的关键风向标。

Anthropic拟公开上线最强模型Mythos

相关资讯

AI基础设施投资回报的万亿级挑战

Character.ai进军微短剧，AI角色可互动

OpenAI宣布GPT 5.6成微软Copilot首选模型

AI巨头IPO规模超越25年科技退出总和

Meta AI图像生成工具引发隐私争议