Qwen3.6-35B-A3B – 阿里通义开源的混合专家 MoE 模型
来源:互联网
时间:2026-07-04 15:14:07
Qwen3.6-35B-A3B是什么
在开源大模型领域,一个名字最近频繁被提及:Qwen3.6-35B-A3B。这是阿里通义千问团队交出的最新答卷,一款采用混合专家(MoE)架构的开源模型。别看它总参数量达到350亿,但在实际推理时,每次激活的参数只有30亿。这种设计思路很明确——用更少的计算资源,撬动更强的性能。
效果如何?数据说话。在多项编程基准测试中,它不仅超越了自家参数规模更大的稠密模型Qwen3.5-27B,更是显著优于谷歌最新发布的Gemma 4系列。作为Qwen3.6系列的开源先锋,它还原生集成了多模态感知与推理能力,其视觉语言表现已能与Claude Sonnet 4.5这样的顶级闭源模型持平,甚至在部分任务上实现反超。可以说,这是当前通用性最强的开源模型之一。
Qwen3.6-35B-A3B的主要功能
-
:它的Agentic Coding能力堪称卓越。在SWE-bench、Terminal-Bench等硬核编程基准上表现优异,这意味着它可以无缝集成到OpenClaw、Claude Code、Qwen Code等第三方编程助手中,成为开发者的得力副驾。
智能体编程
-
:视觉理解是它的另一大亮点。原生支持意味着无需额外适配,在MMMU、RealWorldQA等视觉问答基准上成绩突出,尤其在空间智能(如RefCOCO 92.0)和开放域图像理解(ODInW13 50.8)上优势显著。
多模态感知与推理
-
:这设计很贴心。支持在“思考模式”和“非思考模式”间灵活切换。面对复杂推理任务时启用思考链,追求快速响应时则关闭,完美适应不同场景的需求。
双模式推理
-
:这就是MoE架构的精髓所在。仅激活30亿参数,就能实现与数倍规模的稠密模型相当的智能水平,直接大幅降低了推理成本,让高性能模型部署的门槛不再高不可攀。
高效推理
-
:要成为真正的智能体,连接外部世界的能力必不可少。它支持函数调用、代码解释器及MCP(Model Context Protocol),可以轻松连接各种外部工具和API,完成更复杂的任务。
工具调用与MCP支持
-
:200K的上下文窗口,足以应对长文档深度理解、超长代码库生成等挑战性任务,为处理复杂信息提供了充足的空间。
长上下文处理
如何使用Qwen3.6-35B-A3B
-
最快捷的方式是访问Qwen Studio官网(https://chat.qwen.ai/)。无需注册,打开即用,支持文本和图片输入,可以即时感受它的编程和多模态能力到底有多强。
在线体验:
-
API 调用(生产部署)
- :对于需要集成到生产环境的开发者,登录阿里云百炼控制台,选择模型
阿里云百炼平台
qwen3.6-flash创建 API Key 即可。它兼容标准 OpenAI 协议和 Anthropic 协议,这意味着替换现有的 GPT 或 Claude 接口几乎可以无缝进行。有个小技巧:调用时建议开启preserve_thinking参数,这样可以保留模型的思维链,对于智能体类任务的性能提升非常明显。 - :模型权重完全开源,可以从 Hugging Face 下载,使用 vLLM、Ollama 或 Transformers 等主流框架加载运行。
本地部署
-
第三方工具集成
- :在配置文件中,将 Base URL 设置为阿里云百炼的端点,填入 API Key,模型名称选择
OpenClaw
qwen3.6-flash,就能在终端里用它替代默认的编码助手了。 - :这是为 Qwen 系列优化的开源终端智能体。首次运行时输入
Qwen Code
/auth完成阿里云百炼认证,系统会自动识别并调用 Qwen3.6-35B-A3B 来处理代码生成和工具调用。 - :得益于对 Anthropic 协议的兼容,你甚至可以直接在 Claude Code 的配置中替换端点地址和模型名称,获得一个具备视觉能力的“Claude”编码体验。
Claude Code
Qwen3.6-35B-A3B的关键信息和使用要求
- :Apache 2.0 协议,权重完全开源,支持本地部署与商业用途,在 Hugging Face 和 ModelScope 平台都能下载。
开源协议
- :通过 Qwen Studio 可以直接进行交互对话,零门槛体验完整功能。
在线体验
- :即将通过阿里云百炼平台提供 API 服务,调用名称为
API调用
qwen3.6-flash。它同时兼容 OpenAI 规范的 Chat Completions/Responses API 以及 Anthropic API 协议,灵活性很高。 - :这是其巨大优势之一。相比需要全量加载的稠密模型,它大幅降低了本地部署门槛,仅需支撑30亿激活参数的显存即可流畅运行,对个人开发者非常友好。
硬件要求
- :已经适配了 OpenClaw(Moltbot)、Qwen Code、Claude Code 等主流 AI 编程助手,接入现有开发工作流几乎无需额外成本。
第三方集成
- :API 支持
特色功能
preserve_thinking参数,可以在消息中保留前序轮次的思维内容。这个功能对于复杂的智能体任务来说,简直是神器,强烈推荐开启。
Qwen3.6-35B-A3B的核心优势
- :用3B的激活参数,在编程、推理任务上干掉了27B的稠密模型,真正实现了“小身材,大能量”,推理经济性拉满。
极致参数效率
- :看看权威基准的成绩:SWE-bench Verified(73.4)、Terminal-Bench 2.0(51.5)。这些数字表明,它在编程智能体任务上,已经领先于同规模甚至更大规模的对手。
顶尖智能体编程能力
- :多模态表现直接向 Claude Sonnet 4.5 看齐,尤其是在空间智能(RefCOCO 92.0)和文档理解方面,表现尤为突出。
视觉能力对标闭源模型
- :同时支持 OpenAI 与 Anthropic 两套主流 API 协议,这意味着你可以用它几乎无缝替换现有工作流中的模型,迁移成本极低。
全场景生态兼容
Qwen3.6-35B-A3B的项目地址
- :https://huggingface.co/Qwen/Qwen3.6-35B-A3B
HuggingFace模型库
Qwen3.6-35B-A3B的同类竞品对比
| 对比维度 | Qwen3.6-35B-A3B | Qwen3.5-27B | Gemma 4-31B |
|---|---|---|---|
架构类型 |
MoE(稀疏) | Dense(稠密) | Dense(稠密) |
总参数量 |
35B | 27B | 31B |
激活参数量 |
3B | 27B(全激活) | 31B(全激活) |
SWE-bench Verified |
73.4 | 75.0 | 52.0 |
Terminal-Bench 2.0 |
51.5 | 41.6 | 42.9 |
MMMU(多模态) |
81.7 | 82.3 | 80.4 |
RealWorldQA |
85.3 | 83.7 | 72.3 |
开源协议 |
Apache 2.0(可商用) | Apache 2.0 | Apache 2.0 |
上下文长度 |
200K | 128K | 128K |
多模态支持 |
原生支持 | 需额外适配 | 部分支持 |
智能体优化 |
深度优化 | 基础支持 | 基础支持 |
部署成本 |
低(仅需3B显存) | 高(需27B显存) | 高(需31B显存) |
Qwen3.6-35B-A3B的应用场景
- :自动化代码生成、Bug修复、代码重构及审查,可以直接集成到IDE中,作为全天候的智能编程助手。
AI辅助编程
- :构建能够自主调用工具、浏览网页、执行代码的智能体(Agent),非常适合用于自动化运维、数据分析等复杂工作流。
智能体开发
- :处理图文混合的文档分析、图表解读、视觉问答乃至视频内容理解,让机器真正“看懂”复杂信息。
多模态内容理解
- :得益于其少激活参数、高推理效率的特性,它非常适合部署在资源受限的端侧设备或边缘服务器上,提供本地化、低延迟的AI服务。
端侧与边缘部署
- :作为性能强大的开源基座模型,它也是学术研究、算法教学或进行领域特定微调训练的绝佳选择。
教育科研