首页 > 教程攻略 > ai资讯 >阶跃星辰发布 Step 3.7 Flash:面向真实 Agent 场景的高效率多模态模型

阶跃星辰发布 Step 3.7 Flash:面向真实 Agent 场景的高效率多模态模型

来源:互联网 时间:2026-05-29 15:32:42

2026年5月29日,阶跃星辰发布了新一代的高效率Flash模型——Step 3.7 Flash。如果说之前的模型更像是问答之间的单向交流,那么这一次,Step 3.7 Flash的重点显然放在了“理解之后去执行”这件事上。它不再满足于给出答案,而是围绕多模态感知、网页与视觉搜索、工具调用、代码执行和完整的Agent工作流,做了一套相当系统的升级。

从技术架构上看,Step 3.7 Flash采用的是稀疏MoE视觉语言模型设计,文本、图像、代码、搜索和工具调用都集成在一起。官方信息显示,它能理解产品界面、文档、图表以及各种自然场景的视觉输入,然后基于看到的内容生成代码或调用工具来完成任务。对于AI Agent来说,这意味着模型不再是“纸上谈兵”——它可以在浏览器里操作页面、在终端执行命令、和Office工具打交道、利用搜索工具不断获取反馈,然后根据结果迭代下一步行动。

编程能力是这次升级的重头戏。Step 3.7 Flash针对Agentic Coding场景做了专门优化,覆盖代码生成、Bug修复、多文件项目理解、终端操作以及自动化开发任务。数据也能说明问题:相比上代Step 3.5 Flash,新版本在SWE-Bench Pro和Terminal-Bench 2.1等编码评测中都有明显提升,而且在多个主流Agent框架上的表现更加均衡,不再会出现“偏科”的情况。

搜索能力的强化也值得一提。模型在搜索规划、证据筛选和信息综合这些环节上有了实质性改进,可以应对更复杂的网页搜索、视觉搜索以及跨来源信息的整合。如果用户的任务涉及实时信息获取、长尾实体识别、资料核验或者深度研究,Step 3.7 Flash更像一个会主动检索、筛选和整理信息的助手,而不是被动等待关键词匹配的搜索引擎。

在企业级应用方面,Step 3.7 Flash对文档、表格、截图、业务资料和专业知识类工作同样做了针对性优化。它能处理混合输入,结合搜索、工具调用和视觉理解,完成步骤更长的任务链条。从企业报告分析、数据整理,到财务会计辅助、制造工程任务,再到办公自动化和多工具协作,都派得上用场。

生态兼容性也是Step 3.7 Flash考虑的重点。它支持Claude Code、KiloCode、Hermes Agent、OpenClaw等主流Agent框架和Skills,开发者可以相对轻松地将它接入现有工作流。在部署上,既可以通过阶跃星辰开放平台直接调用,也能在Web端和App中体验,同时支持OpenRouter、NVIDIA NIM等合作平台。对于企业团队来说,云端、数据中心或本地高内存设备都能部署,灵活度足够应对不同规模的需求。

整体来看,Step 3.7 Flash的发布不只是简单的版本迭代,更像是阶跃星辰把Flash模型推向真实Agent应用的一次关键尝试。它在多模态理解、搜索增强、工具调用、智能编程和本地部署这几个维度上,建立了一套较为完整的能力组合。对于正在构建AI Agent、企业自动化工具或者多模态应用的开发者来说,这款国产高效率模型确实值得认真关注。