Step 3.7 Flash 重磅发布：Agent 效率新时代真正到来

来源：互联网时间：2026-05-29 16:50:13

今日，Step3.7Flash 正式亮相，这款开源模型直接瞄准了 Agent 时代最核心的痛点——效率、可靠性和多模态执行能力。以开放权重（Apache2.0协议）的方式发布，迅速在业界激起了不小的水花。

⚡️ Step 3.7 Flash is here_ The new frontier is age.jpg

基准测试领跑，实战能力突出

先看一组硬核数据：Step3.7Flash 在多项关键评测中的表现相当亮眼——

ClawEval-1.1 排名第一（67.1分）
SimpleVQA Search 排名第一（79.2分）
SWE-PRO 排名第二（56.3分）
V* Python 得分高达95.3

这些成绩意味着什么？它在 Agent 任务、代码生成、视觉搜索这类复杂场景里，已经具备了不容小觑的竞争力。

核心参数：速度、成本与能力的均衡之作

作为一款专为 Agentic、代码、搜索和多模态工作流设计的模型，Step3.7Flash 在速度与效能之间找到了一个相当聪明的平衡点：

推理速度
：达到400TPS
架构
：198B 稀疏 MoE 结构，活跃参数约11B
上下文长度
：支持256K
推理层级
：提供3种级别可选

关键是，在保持高性能的同时，它的实际部署成本明显降了下来——这对开发者来说，意味着更高效的选择，而不是“好看但用不起”。

多模态理解 + 可靠执行，真正“看见就能做”

这款模型最大的亮点，在于它打通了感知到行动的闭环。它能理解 UI 界面、图表、文档甚至图像这类视觉内容，然后据此自主编写代码或调用工具完成操作——不是“看懂就行”，而是“看懂就做”。

增强的 Web+ 视觉搜索功能可以触及更多信息源，并支持深度追问。更值得关注的是工具调用的可靠性：在 τ²-bench 全难度级别上，成功率达到了98%以上，目标漂移和调用失败这类老问题得到了有效控制。

生态兼容与本地部署友好

模型已经与 Claude Code、KiloCode、Hermes Agent、OpenClaw 等主流 Agent 框架及 MCP 协议实现了良好兼容。同时，它支持在 Mac Studio M4Max、DGX Spark、AMD AI Max+395 这类硬件上本地运行——对于注重隐私或需要本地化部署的场景，这无疑是个实用的加分项。

AIbase 点评

：Step3.7Flash 的发布，意味着开源 Agent 模型从“勉强能用”真正跨入了“好用、可靠、高效”的阶段。在 Agent 逐渐成为 AI 核心应用形态的当下，像这样在速度、成本和执行可靠性之间找到平衡的模型，很可能成为开发者构建下一代智能工作流的重要基石。