阿里通义千问重磅升级:新旗舰Qwen3. 7 预览版全球首发亮相
阿里云通义千问大模型家族最近又有了新动静。两款全新的预览版模型——Qwen3.7-Max-Preview和Qwen3.7-Plus-Preview,已经悄然登陆大模型竞技场Arena AI以及官方的Qwen Chat平台。这通常意味着,在接下来即将举办的阿里云峰会上,我们很可能会看到它们的正式亮相。
根据目前公开的产品信息,这次上线的预览版主打一个“纯粹”。它们暂时只开放了“思考模式”,换句话说,就是把所有算力都集中在了攻克高难度的逻辑推理和深度计算任务上。至于大家熟悉的网页搜索、代码解释器等辅助工具,在这一阶段还不会开放使用。这种“单点突破”的策略,显然是为了在最核心的智能基准上接受最严苛的检验。
权威基准斩获佳绩
那么,检验结果如何?用“惊艳”来形容并不为过。在衡量大模型综合文本能力的权威基准测试中,Qwen3.7 Max Preview的全球综合排名已经冲到了第13位。这个成绩直接带动阿里通义千问的实验室整体排名,一举进入了全球前六的阵营。
光有综合排名还不够,在真正体现技术硬实力的细分领域,这款模型的表现更具说服力。数据显示,它在数学能力榜单上高居全球第7。此外,在专家级应用、软件与IT、以及纯编程能力这几个关键的技术子榜单上,它也都稳稳地占据了全球前十的位置。这足以说明,其能力结构不仅全面,而且在需要深度思考和专业知识的领域尤为突出。
视觉与专家领域实现突破
文本和逻辑推理能力强,是不是就“偏科”了?另一款同步亮相的Qwen3.7 Plus Preview给出了答案。这款高性能模型在视觉能力基准测试中,综合排名位列全球第16。正是凭借它在视觉领域的优异表现,通义千问在视觉榜单的实验室总排名也随之跃升至全球第5。
更有意思的是,在一个专门模拟高难度、复杂指令执行的“专家竞技场”测试中,Qwen3.7 Max Preview再次证明了其解决棘手问题的能力,排名稳定在全球第9。这一系列从综合到细分、从文本到多模态的硬核成绩,清晰地传递出一个信号:阿里云在大模型,尤其是在多模态和深度垂直应用的技术攻坚上,已经具备了全球一线的竞争力。