首页 > 教程攻略 > ai资讯 >Qwen3.6-35B-A3B – 阿里通义开源的混合专家 MoE 模型

Qwen3.6-35B-A3B – 阿里通义开源的混合专家 MoE 模型

来源:互联网 时间:2026-07-04 15:14:07

Qwen3.6-35B-A3B是什么

在开源大模型领域,一个名字最近频繁被提及:Qwen3.6-35B-A3B。这是阿里通义千问团队交出的最新答卷,一款采用混合专家(MoE)架构的开源模型。别看它总参数量达到350亿,但在实际推理时,每次激活的参数只有30亿。这种设计思路很明确——用更少的计算资源,撬动更强的性能。

效果如何?数据说话。在多项编程基准测试中,它不仅超越了自家参数规模更大的稠密模型Qwen3.5-27B,更是显著优于谷歌最新发布的Gemma 4系列。作为Qwen3.6系列的开源先锋,它还原生集成了多模态感知与推理能力,其视觉语言表现已能与Claude Sonnet 4.5这样的顶级闭源模型持平,甚至在部分任务上实现反超。可以说,这是当前通用性最强的开源模型之一。

Qwen3.6-35B-A3B – 阿里通义开源的混合专家 MoE 模型

Qwen3.6-35B-A3B的主要功能

  • 智能体编程

    :它的Agentic Coding能力堪称卓越。在SWE-bench、Terminal-Bench等硬核编程基准上表现优异,这意味着它可以无缝集成到OpenClaw、Claude Code、Qwen Code等第三方编程助手中,成为开发者的得力副驾。

  • 多模态感知与推理

    :视觉理解是它的另一大亮点。原生支持意味着无需额外适配,在MMMU、RealWorldQA等视觉问答基准上成绩突出,尤其在空间智能(如RefCOCO 92.0)和开放域图像理解(ODInW13 50.8)上优势显著。

  • 双模式推理

    :这设计很贴心。支持在“思考模式”和“非思考模式”间灵活切换。面对复杂推理任务时启用思考链,追求快速响应时则关闭,完美适应不同场景的需求。

  • 高效推理

    :这就是MoE架构的精髓所在。仅激活30亿参数,就能实现与数倍规模的稠密模型相当的智能水平,直接大幅降低了推理成本,让高性能模型部署的门槛不再高不可攀。

  • 工具调用与MCP支持

    :要成为真正的智能体,连接外部世界的能力必不可少。它支持函数调用、代码解释器及MCP(Model Context Protocol),可以轻松连接各种外部工具和API,完成更复杂的任务。

  • 长上下文处理

    :200K的上下文窗口,足以应对长文档深度理解、超长代码库生成等挑战性任务,为处理复杂信息提供了充足的空间。

如何使用Qwen3.6-35B-A3B

  • 在线体验:

    最快捷的方式是访问Qwen Studio官网(https://chat.qwen.ai/)。无需注册,打开即用,支持文本和图片输入,可以即时感受它的编程和多模态能力到底有多强。

  • API 调用(生产部署)

    • 阿里云百炼平台

      :对于需要集成到生产环境的开发者,登录阿里云百炼控制台,选择模型 qwen3.6-flash 创建 API Key 即可。它兼容标准 OpenAI 协议和 Anthropic 协议,这意味着替换现有的 GPT 或 Claude 接口几乎可以无缝进行。有个小技巧:调用时建议开启 preserve_thinking 参数,这样可以保留模型的思维链,对于智能体类任务的性能提升非常明显。

    • 本地部署

      :模型权重完全开源,可以从 Hugging Face 下载,使用 vLLM、Ollama 或 Transformers 等主流框架加载运行。

  • 第三方工具集成

    • OpenClaw

      :在配置文件中,将 Base URL 设置为阿里云百炼的端点,填入 API Key,模型名称选择 qwen3.6-flash,就能在终端里用它替代默认的编码助手了。

    • Qwen Code

      :这是为 Qwen 系列优化的开源终端智能体。首次运行时输入 /auth 完成阿里云百炼认证,系统会自动识别并调用 Qwen3.6-35B-A3B 来处理代码生成和工具调用。

    • Claude Code

      :得益于对 Anthropic 协议的兼容,你甚至可以直接在 Claude Code 的配置中替换端点地址和模型名称,获得一个具备视觉能力的“Claude”编码体验。

Qwen3.6-35B-A3B的关键信息和使用要求

  • 开源协议

    :Apache 2.0 协议,权重完全开源,支持本地部署与商业用途,在 Hugging Face 和 ModelScope 平台都能下载。

  • 在线体验

    :通过 Qwen Studio 可以直接进行交互对话,零门槛体验完整功能。

  • API调用

    :即将通过阿里云百炼平台提供 API 服务,调用名称为 qwen3.6-flash。它同时兼容 OpenAI 规范的 Chat Completions/Responses API 以及 Anthropic API 协议,灵活性很高。

  • 硬件要求

    :这是其巨大优势之一。相比需要全量加载的稠密模型,它大幅降低了本地部署门槛,仅需支撑30亿激活参数的显存即可流畅运行,对个人开发者非常友好。

  • 第三方集成

    :已经适配了 OpenClaw(Moltbot)、Qwen Code、Claude Code 等主流 AI 编程助手,接入现有开发工作流几乎无需额外成本。

  • 特色功能

    :API 支持 preserve_thinking 参数,可以在消息中保留前序轮次的思维内容。这个功能对于复杂的智能体任务来说,简直是神器,强烈推荐开启。

Qwen3.6-35B-A3B的核心优势

  • 极致参数效率

    :用3B的激活参数,在编程、推理任务上干掉了27B的稠密模型,真正实现了“小身材,大能量”,推理经济性拉满。

  • 顶尖智能体编程能力

    :看看权威基准的成绩:SWE-bench Verified(73.4)、Terminal-Bench 2.0(51.5)。这些数字表明,它在编程智能体任务上,已经领先于同规模甚至更大规模的对手。

  • 视觉能力对标闭源模型

    :多模态表现直接向 Claude Sonnet 4.5 看齐,尤其是在空间智能(RefCOCO 92.0)和文档理解方面,表现尤为突出。

  • 全场景生态兼容

    :同时支持 OpenAI 与 Anthropic 两套主流 API 协议,这意味着你可以用它几乎无缝替换现有工作流中的模型,迁移成本极低。

Qwen3.6-35B-A3B的项目地址

  • HuggingFace模型库

    :https://huggingface.co/Qwen/Qwen3.6-35B-A3B

Qwen3.6-35B-A3B的同类竞品对比

对比维度 Qwen3.6-35B-A3B Qwen3.5-27B Gemma 4-31B

架构类型

MoE(稀疏) Dense(稠密) Dense(稠密)

总参数量

35B 27B 31B

激活参数量

3B 27B(全激活) 31B(全激活)

SWE-bench Verified

73.4 75.0 52.0

Terminal-Bench 2.0

51.5 41.6 42.9

MMMU(多模态)

81.7 82.3 80.4

RealWorldQA

85.3 83.7 72.3

开源协议

Apache 2.0(可商用) Apache 2.0 Apache 2.0

上下文长度

200K 128K 128K

多模态支持

原生支持 需额外适配 部分支持

智能体优化

深度优化 基础支持 基础支持

部署成本

低(仅需3B显存) 高(需27B显存) 高(需31B显存)

Qwen3.6-35B-A3B的应用场景

  • AI辅助编程

    :自动化代码生成、Bug修复、代码重构及审查,可以直接集成到IDE中,作为全天候的智能编程助手。

  • 智能体开发

    :构建能够自主调用工具、浏览网页、执行代码的智能体(Agent),非常适合用于自动化运维、数据分析等复杂工作流。

  • 多模态内容理解

    :处理图文混合的文档分析、图表解读、视觉问答乃至视频内容理解,让机器真正“看懂”复杂信息。

  • 端侧与边缘部署

    :得益于其少激活参数、高推理效率的特性,它非常适合部署在资源受限的端侧设备或边缘服务器上,提供本地化、低延迟的AI服务。

  • 教育科研

    :作为性能强大的开源基座模型,它也是学术研究、算法教学或进行领域特定微调训练的绝佳选择。