技术进展

Claude Opus 4.8发布：代码缺陷锐减75%性能飙升

Heooo 05月29日12时00分 21 阅读

「Anthropic推出Claude Opus 4.8，代码缺陷率降低75%，运行速度提升2.5倍，成本降至三分之一，多项基准超越竞品。」

人工智能领域的代码可靠性迎来重大技术突破。AI巨头Anthropic近日正式发布了其旗舰模型的微调升级版Claude Opus 4.8，该版本主打更强悍的智能体编程、多领域推理以及知识工作能力。新模型不仅在多项核心基准测试中超越了GPT-5.5，更在解决“AI睁眼说瞎话”这一行业顽疾上取得了长足进步。

根据早期测试方的反馈，升级后的Opus 4.8在处理复杂的多步骤任务时表现得更加稳健。官方评估数据显示，新模型放任自己所写代码存在缺陷却不加说明的概率大幅降低了四分之三。它现在更倾向于主动标出自身的不确定性，不仅能主动识别错误，还会在发现用户的初始计划不合理时果断提出异议。这一改进显著提升了AI编程的可靠性和可信任度，开发者可以更放心地将复杂任务交给模型处理。

在大幅提升逻辑严密性的同时，Anthropic还对该模型的运行效率进行了深度优化。Opus 4.8的快速模式运行速度直接飙升至此前的2.5倍，而模型的使用成本却大幅削减到了老版本的仅三分之一。这意味着开发团队可以在更短时间内获得更高质量的代码输出，同时大幅降低云服务开支。在行业公认的SWE-Bench Pro编程基准测试中，Opus 4.8斩获了69.2%的高分，在多个核心维度上成功反超了Gemini 3.1 Pro等强劲对手，进一步巩固了其在AI编程领域的领先地位。

此次升级不仅聚焦于编程能力，还强化了多领域推理和知识工作场景的表现。无论是处理复杂的数学问题、进行逻辑推导，还是协助科研人员分析数据，Opus 4.8都展现出更高的准确性和效率。Anthropic通过这种“质量+速度+成本”三位一体的优化策略，为AI开发者生态注入了新的活力，也为企业级AI应用提供了更具性价比的选择。

# Anthropic # Claude Opus 4.8 # AI编程 # 代码可靠性 # 模型升级

来源：Heooo AI工具导航

热门工具

起号兽

# 生产力工具

起号兽

起号兽，你的AI短视频运营助手。智能规划内容、生成脚本、指导拍摄、优化发布，一站式帮你打造个人IP。支持抖音、快手、小红书、视频号多平台运营。

# 生产力工具访问官网

豆包

# 对话机器人

豆包

豆包是你的 AI 聊天智能对话问答助手，写作文案翻译编程全能工具。豆包为你答疑解惑，提供灵感，辅助创作，也可以和你畅聊任何你感兴趣的话题。

# 对话机器人访问官网

巨量创意（字节跳动）

# 视频生成

巨量创意（字节跳动）

抖音/巨量引擎官方AI创意平台，支持图文/视频广告自动生成、A/B测试与智能优化。

# 视频生成访问官网

TRAE - IDE

# 代码助手

TRAE - IDE

TRAE AI IDE | 国内首款 AI 原生集成开发环境，深度集成 Doubao-1.5-pro 与 DeepSeek 模型，支持中文自然语言一键生成完整代码框架，实时预览前端效果并智能修复 BUG。首创 Builder 模式实现需求到代码的自动化开发，兼容 Windows/macOS 系统，官网下载即用。

# 代码助手访问官网