Anthropic发布Claude Sonnet 5降低智能体运行成本
「Anthropic推出Claude Sonnet 5,以更低价格提供接近旗舰模型的智能体能力,推动智能体功能成为各价位模型标配。」
随着智能体能力成为基础模型厂商的竞争标配,Anthropic正式发布了Claude Sonnet 5。这款中端模型在性能和自主性上大幅提升,能够以更低的成本执行复杂的智能体任务。Anthropic在官方博客中表示:“Sonnet 5可以制定计划、使用浏览器和终端等工具,并自主运行,其水平在几个月前还需要更大、更昂贵的模型才能实现。”
这一表述与OpenAI和Google近期的发布策略高度一致。OpenAI上周预览的GPT-5.6 Sol同样主打智能体特性,允许用户将工作拆分为子智能体以完成更长的自主任务。Google于5月发布的Gemini 3.5 Flash也被定位为从对话式聊天机器人向智能体工具的转变,能够在最少人工干预下进行规划、构建和迭代实际工作。
Sonnet 5的推出进一步确认了智能体能力已成为各价位模型的新基准。当前竞争的关键已不再是“谁能更好地完成智能体工作”,而是“谁能以更低成本、更可靠地实现自主运行”。Anthropic强调,Sonnet 5在性能上接近旗舰模型Opus 4.8,但成本大幅降低。从周二起,Sonnet 5将成为免费版和Pro版的默认模型,所有订阅用户均可使用。
在定价方面,Sonnet 5在8月31日前的促销价为每百万输入token 2美元、每百万输出token 10美元;之后价格调整为每百万输入token 3美元、每百万输出token 10美元。这一价格低于Opus 4.8、OpenAI的GPT-5.5以及Google的Gemini 3.1 Pro,但仍高于Gemini 3.5 Flash。
根据Anthropic公布的基准测试数据,Sonnet 5在智能体编码任务上得分为63.2%,而Opus 4.8为69.2%、前代Sonnet 4.6为58.1%。在知识工作基准上,Sonnet 5甚至略微超越了以解决高难度问题著称的Opus 4.8。Anthropic表示:“Opus 4.8仍是这些任务中更高精度的选择,但Sonnet 5为开发者提供了价格更低、质量远胜以往的选择。用户可以在Sonnet 5和Opus 4.8之间调整努力程度,以找到成本与性能的最佳平衡。”
测试者反馈显示,Sonnet 5在完成复杂任务时表现尤为突出。前代模型常在中途停止的任务,Sonnet 5能够顺利执行到底,并且会在未被明确要求的情况下自动检查自己的输出。Zapier高级工程师Daniel Shepard在声明中分享了一个案例:“我们交给Claude Sonnet 5一个两部分任务——更新Salesforce账户层级并向企业联系人发送发布公告——它从头到尾完成了所有步骤。这在过去需要多次人工干预。”
Sonnet 5的发布标志着智能体能力正从高端模型向中端市场快速渗透。随着定价持续下降,开发者将能以更低成本部署自主工作流,推动AI从辅助工具向真正的执行者进化。Anthropic通过Sonnet 5与Opus 4.8的组合,为用户提供了更灵活的成本-性能选择,进一步巩固了其在智能体模型竞争中的领先地位。
来源:Heooo AI工具导航