Step 3.7 Flash 重磅发布:Agent 效率新时代真正到来
来源:互联网
时间:2026-05-29 16:50:13
今日,Step3.7Flash 正式亮相,这款开源模型直接瞄准了 Agent 时代最核心的痛点——效率、可靠性和多模态执行能力。以开放权重(Apache2.0协议)的方式发布,迅速在业界激起了不小的水花。

基准测试领跑,实战能力突出
先看一组硬核数据:Step3.7Flash 在多项关键评测中的表现相当亮眼——
- ClawEval-1.1 排名第一(67.1分)
- SimpleVQA Search 排名第一(79.2分)
- SWE-PRO 排名第二(56.3分)
- V* Python 得分高达95.3
这些成绩意味着什么?它在 Agent 任务、代码生成、视觉搜索这类复杂场景里,已经具备了不容小觑的竞争力。
核心参数:速度、成本与能力的均衡之作
作为一款专为 Agentic、代码、搜索和多模态工作流设计的模型,Step3.7Flash 在速度与效能之间找到了一个相当聪明的平衡点:
- :达到400TPS
推理速度
- :198B 稀疏 MoE 结构,活跃参数约11B
架构
- :支持256K
上下文长度
- :提供3种级别可选
推理层级
关键是,在保持高性能的同时,它的实际部署成本明显降了下来——这对开发者来说,意味着更高效的选择,而不是“好看但用不起”。
多模态理解 + 可靠执行,真正“看见就能做”
这款模型最大的亮点,在于它打通了感知到行动的闭环。它能理解 UI 界面、图表、文档甚至图像这类视觉内容,然后据此自主编写代码或调用工具完成操作——不是“看懂就行”,而是“看懂就做”。
增强的 Web+ 视觉搜索功能可以触及更多信息源,并支持深度追问。更值得关注的是工具调用的可靠性:在 τ²-bench 全难度级别上,成功率达到了98%以上,目标漂移和调用失败这类老问题得到了有效控制。
生态兼容与本地部署友好
模型已经与 Claude Code、KiloCode、Hermes Agent、OpenClaw 等主流 Agent 框架及 MCP 协议实现了良好兼容。同时,它支持在 Mac Studio M4Max、DGX Spark、AMD AI Max+395 这类硬件上本地运行——对于注重隐私或需要本地化部署的场景,这无疑是个实用的加分项。