技术进展

Step 3.7 Flash发布，Agent效率新突破

Heooo 05月30日04时00分 44 阅读

「Step 3.7 Flash开源模型发布，以400TPS推理速度、98%+工具调用成功率，为Agent任务、代码生成和多模态执行带来高效、可靠的新选择。」

今日，Step 3.7 Flash 正式亮相，这款开源模型直指 Agent 时代核心痛点——效率、可靠性和多模态执行能力，以开放权重（Apache 2.0协议）的方式迅速引发业界关注。作为一款专为 Agentic、代码、搜索和多模态工作流设计的模型，Step 3.7 Flash 在速度与效能上实现显著突破。

基准测试领跑，实战能力突出

Step 3.7 Flash 在多项关键评测中取得亮眼成绩：在 ClawEval-1.1 中排名第一（67.1分），SimpleVQA Search 排名第一（79.2分），SWE-PRO 排名第二（56.3分），V* Python 得分高达95.3。这些成绩显示其在 Agent 任务、代码生成、视觉搜索等复杂场景中具备领先竞争力。

核心参数：速度、成本与能力的均衡之作

该模型推理速度达到 400TPS，采用 198B 稀疏 MoE 结构，活跃参数约 11B，支持 256K 上下文长度，并提供 3 种推理级别。在保持高性能的同时，显著降低了实际部署成本，为开发者提供了高效选择。

多模态理解 + 可靠执行，真正“看见就能做”

Step 3.7 Flash 的最大亮点在于其强大的感知 - 行动闭环能力。它能够理解 UI 界面、图表、文档和图像等视觉内容，并据此自主编写代码或调用工具完成操作。其增强的 Web+ 视觉搜索功能可触达更多信息源，并支持深度跟进查询。同时，工具调用可靠性大幅提升，在 τ²-bench 全难度级别上达到 98%+ 成功率，有效减少了常见的目标漂移和工具调用失败问题。

生态兼容与本地部署友好

模型已与 Claude Code、KiloCode、Hermes Agent、OpenClaw 等主流 Agent 框架及 MCP 等协议实现良好兼容。同时，它支持在 Mac Studio M4 Max、DGX Spark、AMD AI Max+395 等硬件上本地运行，为本地化部署和隐私敏感场景提供了便利。

Step 3.7 Flash 的发布，标志着开源 Agent 模型从“能用”向“好用、可靠、高效”迈出了重要一步。在 Agent 成为 AI 核心应用形态的当下，这类平衡了速度、成本与执行可靠性的模型，或将成为开发者构建下一代智能工作流的重要基石。

# 开源模型 # Agent # 多模态

来源：Heooo AI工具导航

热门工具

起号兽

# 生产力工具

起号兽

起号兽，你的AI短视频运营助手。智能规划内容、生成脚本、指导拍摄、优化发布，一站式帮你打造个人IP。支持抖音、快手、小红书、视频号多平台运营。

# 生产力工具访问官网

豆包

# 对话机器人

豆包

豆包是你的 AI 聊天智能对话问答助手，写作文案翻译编程全能工具。豆包为你答疑解惑，提供灵感，辅助创作，也可以和你畅聊任何你感兴趣的话题。

# 对话机器人访问官网

巨量创意（字节跳动）

# 视频生成

巨量创意（字节跳动）

抖音/巨量引擎官方AI创意平台，支持图文/视频广告自动生成、A/B测试与智能优化。

# 视频生成访问官网

TRAE - IDE

# 代码助手

TRAE - IDE

TRAE AI IDE | 国内首款 AI 原生集成开发环境，深度集成 Doubao-1.5-pro 与 DeepSeek 模型，支持中文自然语言一键生成完整代码框架，实时预览前端效果并智能修复 BUG。首创 Builder 模式实现需求到代码的自动化开发，兼容 Windows/macOS 系统，官网下载即用。

# 代码助手访问官网