首页 > 教程攻略 > ai资讯 >阶跃星辰发布 Step 3.7 Flash：面向真实 Agent 场景的高效率多模态模型

阶跃星辰发布 Step 3.7 Flash：面向真实 Agent 场景的高效率多模态模型

来源：互联网时间：2026-05-29 15:32:42

2026年5月29日，阶跃星辰发布了新一代的高效率Flash模型——Step 3.7 Flash。如果说之前的模型更像是问答之间的单向交流，那么这一次，Step 3.7 Flash的重点显然放在了“理解之后去执行”这件事上。它不再满足于给出答案，而是围绕多模态感知、网页与视觉搜索、工具调用、代码执行和完整的Agent工作流，做了一套相当系统的升级。

从技术架构上看，Step 3.7 Flash采用的是稀疏MoE视觉语言模型设计，文本、图像、代码、搜索和工具调用都集成在一起。官方信息显示，它能理解产品界面、文档、图表以及各种自然场景的视觉输入，然后基于看到的内容生成代码或调用工具来完成任务。对于AI Agent来说，这意味着模型不再是“纸上谈兵”——它可以在浏览器里操作页面、在终端执行命令、和Office工具打交道、利用搜索工具不断获取反馈，然后根据结果迭代下一步行动。

编程能力是这次升级的重头戏。Step 3.7 Flash针对Agentic Coding场景做了专门优化，覆盖代码生成、Bug修复、多文件项目理解、终端操作以及自动化开发任务。数据也能说明问题：相比上代Step 3.5 Flash，新版本在SWE-Bench Pro和Terminal-Bench 2.1等编码评测中都有明显提升，而且在多个主流Agent框架上的表现更加均衡，不再会出现“偏科”的情况。

搜索能力的强化也值得一提。模型在搜索规划、证据筛选和信息综合这些环节上有了实质性改进，可以应对更复杂的网页搜索、视觉搜索以及跨来源信息的整合。如果用户的任务涉及实时信息获取、长尾实体识别、资料核验或者深度研究，Step 3.7 Flash更像一个会主动检索、筛选和整理信息的助手，而不是被动等待关键词匹配的搜索引擎。

在企业级应用方面，Step 3.7 Flash对文档、表格、截图、业务资料和专业知识类工作同样做了针对性优化。它能处理混合输入，结合搜索、工具调用和视觉理解，完成步骤更长的任务链条。从企业报告分析、数据整理，到财务会计辅助、制造工程任务，再到办公自动化和多工具协作，都派得上用场。

生态兼容性也是Step 3.7 Flash考虑的重点。它支持Claude Code、KiloCode、Hermes Agent、OpenClaw等主流Agent框架和Skills，开发者可以相对轻松地将它接入现有工作流。在部署上，既可以通过阶跃星辰开放平台直接调用，也能在Web端和App中体验，同时支持OpenRouter、NVIDIA NIM等合作平台。对于企业团队来说，云端、数据中心或本地高内存设备都能部署，灵活度足够应对不同规模的需求。

整体来看，Step 3.7 Flash的发布不只是简单的版本迭代，更像是阶跃星辰把Flash模型推向真实Agent应用的一次关键尝试。它在多模态理解、搜索增强、工具调用、智能编程和本地部署这几个维度上，建立了一套较为完整的能力组合。对于正在构建AI Agent、企业自动化工具或者多模态应用的开发者来说，这款国产高效率模型确实值得认真关注。

阶跃星辰发布 Step 3.7 Flash：面向真实 Agent 场景的高效率多模态模型

相关阅读

相关下载