首页 > 教程攻略 > ai资讯 >​Step 3.7 Flash 重磅发布:Agent 效率新时代真正到来

​Step 3.7 Flash 重磅发布:Agent 效率新时代真正到来

来源:互联网 时间:2026-05-29 16:50:13

今日,Step3.7Flash 正式亮相,这款开源模型直接瞄准了 Agent 时代最核心的痛点——效率、可靠性和多模态执行能力。以开放权重(Apache2.0协议)的方式发布,迅速在业界激起了不小的水花。

⚡️ Step 3.7 Flash is here_ The new frontier is age.jpg

基准测试领跑,实战能力突出

先看一组硬核数据:Step3.7Flash 在多项关键评测中的表现相当亮眼——

  • ClawEval-1.1 排名第一(67.1分)
  • SimpleVQA Search 排名第一(79.2分)
  • SWE-PRO 排名第二(56.3分)
  • V* Python 得分高达95.3

这些成绩意味着什么?它在 Agent 任务、代码生成、视觉搜索这类复杂场景里,已经具备了不容小觑的竞争力。

核心参数:速度、成本与能力的均衡之作

作为一款专为 Agentic、代码、搜索和多模态工作流设计的模型,Step3.7Flash 在速度与效能之间找到了一个相当聪明的平衡点:

  • 推理速度

    :达到400TPS
  • 架构

    :198B 稀疏 MoE 结构,活跃参数约11B
  • 上下文长度

    :支持256K
  • 推理层级

    :提供3种级别可选

关键是,在保持高性能的同时,它的实际部署成本明显降了下来——这对开发者来说,意味着更高效的选择,而不是“好看但用不起”。

多模态理解 + 可靠执行,真正“看见就能做”

这款模型最大的亮点,在于它打通了感知到行动的闭环。它能理解 UI 界面、图表、文档甚至图像这类视觉内容,然后据此自主编写代码或调用工具完成操作——不是“看懂就行”,而是“看懂就做”。

增强的 Web+ 视觉搜索功能可以触及更多信息源,并支持深度追问。更值得关注的是工具调用的可靠性:在 τ²-bench 全难度级别上,成功率达到了98%以上,目标漂移和调用失败这类老问题得到了有效控制。

生态兼容与本地部署友好

模型已经与 Claude Code、KiloCode、Hermes Agent、OpenClaw 等主流 Agent 框架及 MCP 协议实现了良好兼容。同时,它支持在 Mac Studio M4Max、DGX Spark、AMD AI Max+395 这类硬件上本地运行——对于注重隐私或需要本地化部署的场景,这无疑是个实用的加分项。

AIbase 点评

:Step3.7Flash 的发布,意味着开源 Agent 模型从“勉强能用”真正跨入了“好用、可靠、高效”的阶段。在 Agent 逐渐成为 AI 核心应用形态的当下,像这样在速度、成本和执行可靠性之间找到平衡的模型,很可能成为开发者构建下一代智能工作流的重要基石。