首页 > 教程攻略 > ai资讯 >模型变小，能力不减：新浪VibeThinker-3B 开源，AI 推理迎来“轻量化”新思路

模型变小，能力不减：新浪VibeThinker-3B 开源，AI 推理迎来“轻量化”新思路

来源：互联网时间：2026-06-30 15:49:08

人工智能模型的参数量是否一定要“越大越好”？最近，新浪开源的一个仅有3B参数量的模型，可以说是一份颇具启发性的答卷。

这个模型名叫 VibeThinker-3B，别看它只有区区30亿参数，在数学、编程等高难度基准测试中，它的表现竟然能媲美那些规模大上百倍的主流大模型。更让人意外的是，甚至在一些竞赛级任务里，它已经超过了多款行业顶尖产品。

VibeThinker-3B 的优异表现并非偶然，关键就在于它独特的训练策略。该模型以阿里 Qwen2.5-Coder-3B 为基底，通过多阶段的精细化“后训练”——涵盖了监督微调、强化学习、自蒸馏及指令微调等环环相扣的环节，从而将大模型的逻辑推理能力，巧妙地浓缩进了这个3B参数的轻量化架构中。实际测试更有说服力：在 LeetCode 竞赛题目中，它能高效完成128道题中的123道，这一成绩已经超过了 GPT-5.2 等行业标杆。

目前，VibeThinker-3B 已在 Hugging Face 和 GitHub 正式开源。这一动作不仅为开发者带来了一个轻量又高效的工具选择，更是为 AI 行业提供了一种全新的优化思路：在某些特定任务领域，通过精耕细作的后训练，完全有可能用极低的算力成本，换取堪比“行业巨头”的性能表现。这才是真正值得关注的信号——用更聪明的训练方法，而不是单纯的堆参数。

模型变小，能力不减：新浪VibeThinker-3B 开源，AI 推理迎来“轻量化”新思路

相关阅读

相关下载