行业资讯

OpenAI推出GPT-5.5-Cyber刷新网络安全评测纪录

Heooo 06月23日18时01分 3 阅读

「OpenAI发布网络安全专用模型GPT-5.5-Cyber,在CyberGym测试中超越Claude Mythos 5,取得85.6%的最高成绩,并面向防御团队有限开放。」

OpenAI公司近日宣布扩展其Daybreak网络安全项目,向安全防御团队有限开放完整版GPT-5.5-Cyber,这是一款专为网络安全场景优化的AI模型。该模型在多项专业评测中展现出显著优势,尤其刷新了GPT系列在CyberGym测试中的得分纪录。

Daybreak是OpenAI推出的网络安全计划,类似于Anthropic的Project Glasswing项目,旨在帮助防御团队更高效地发现、验证和修复漏洞,从而缩短漏洞从发现到修复的处置周期。OpenAI在博文中指出,强大AI模型已显著加快漏洞发现速度,但行业当前的痛点和瓶颈已转向修复环节——对于软件团队而言,评估漏洞影响、编写修复代码、完成测试并最终发布补丁,整个链条依然耗时。GPT-5.5-Cyber正是为解决这一瓶颈而设计。

在模型能力方面,根据CyberGym(网络安全评测集)的单模型成绩,GPT-5.5-Cyber取得了85.6%的最高成绩,刷新了GPT系列模型在CyberGym测试中的得分纪录。作为对比,GPT-5.5模型得分为81.8%,而Anthropic的Claude Mythos 5模型得分为83.8%。这意味着GPT-5.5-Cyber在网络安全领域的专项能力已超越当前最强的通用模型之一。

在更具体的测试场景中,GPT-5.5-Cyber同样表现突出。在ExploitGym测试中,该测试考验智能体能否将已知漏洞转化为可执行的攻击代码,GPT-5.5-Cyber的得分为39.5%,而GPT-5.5仅为25.95%,提升幅度超过50%。在SEC-bench Pro测试中,该测试用于评估智能体在复杂软件目标上的长期漏洞发现能力和概念验证生成能力,GPT-5.5-Cyber的得分为69.8%,而GPT-5.5得分为63.1%。这些数据表明,针对网络安全领域进行专项优化的模型,在漏洞发现、漏洞利用验证等关键任务上具有明显优势。

OpenAI的Daybreak项目不仅关注模型本身,还致力于构建完整的网络安全AI生态。通过向防御团队有限开放GPT-5.5-Cyber,OpenAI希望在实际攻防场景中收集反馈,进一步优化模型表现。这一举措也反映出AI在网络安全领域的应用正从通用能力向专用能力深化,未来可能催生更多垂直领域的AI安全工具。

# OpenAI # 网络安全 # GPT-5.5-Cyber # Daybreak # AI模型

来源:Heooo AI工具导航