技术进展
Claude Opus 4.8发布:编程能力飙升成本骤降
Heooo 05月29日12时00分 2 阅读
「Anthropic发布Claude Opus 4.8,强化智能体编程与推理能力,在多项基准测试中超越GPT-5.5,速度提升2.5倍,成本仅为前代三分之一。」
Anthropic于近日正式发布了其最新旗舰大模型Claude Opus 4.8。作为一次针对用户核心痛点的精准升级,新模型在保持原有价格体系的基础上,全面强化了智能体编程、复杂逻辑推理以及多领域知识工作能力。
在核心的AI编程和智能体表现上,新版模型带来了显著突破。多家早期测试机构的反馈表明,Opus 4.8的日常表现更为稳健,判断也更加敏锐。在处理复杂的多步骤任务时,它不仅展现出了极高的可靠性,还能在计划不合理时主动向用户提出异议并标出不确定性。
评估数据显示,该模型放任自己所写代码出现缺陷却不加说明的概率直接暴跌至前代的四分之一,这大幅减少了无依据结论的产生。在业界备受瞩目的基准测试中,新模型展现出了极强的统治力。官方数据显示,Opus 4.8在知名编程基准测试SWE-Bench Pro上取得了69.2%的优秀成绩,并在多项核心主流基准测试中成功超越了GPT-5.5与Gemini 3.1 Pro,进一步巩固了其在行业内的第一梯队地位。
除了能力层面的跃升,本次升级在用户体验与计算成本上也带来了巨大惊喜。全新的Claude平台特别新增了“努力程度”控制功能,用户可以在追求卓越质量与追求极致响应速度之间自由切换。更具颠覆性的是,新模型在快速模式下的运行速度直接飙升至此前的2.5倍,而实际消耗的模型成本却大幅压缩,仅为先前模型的三分之一。这种加量还降本的升级策略,无疑将为开发者提供更有力的生产力支持。
# Claude Opus 4.8 # AI编程 # 模型评测
来源:Heooo AI工具导航