DeepSeek昨夜上新,新旧版V3对比实测,代码能力飙升,震惊海外用户
来源:互联网
时间:2026-06-29 07:20:04
昨晚,DeepSeek安静地在开源平台上扔了一个“更新”——升级后的DeepSeek-V3模型悄然上线了。
新模型的版本号是DeepSeek-V3-0324,参数规模从原来的6710亿小幅提升到了6850亿。不过,目前官方还没放出系统卡,很多细节暂时还是个谜。
开源地址:https://huggingface.co/deepseek-ai/DeepSeek-V3-0324
更有意思的是,这次DeepSeek把开源协议改成了与R1一致的MIT协议。这个协议更宽松,允许模型蒸馏、商用等操作,等于给开发者们松了绑。
智东西第一时间对新版V3做了代码、数学和通用能力等多方面的实测,也留意到了社区里不少网友的反馈。从目前的信息来看,升级后的V3在代码和数学等领域确实有肉眼可见的提升。
有海外AI博主直接表示,DeepSeek终于能在代码这块和Anthropic的Claude Sonnet 3.5正面刚了。要知道,Claude Sonnet 3.5在程序员群体里可是长期封神的存在——不管其他模型刷榜刷得多猛,真实写代码的这群人还是更倾向于打开Claude。
在新版DeepSeek-V3的测试中,网站开发和UI设计方面的进步最让人眼前一亮。输入“设计一个美观的个人博客网站,带有科技感,直接开发成可用网页”这种指令后,它直接交出了一份令人惊艳的答卷。
新版V3仅仅用了2分钟,就生成了一整个400多行代码、设计精良的网站。据它自己说,用上了粒子背景动画、赛博朋克UI(霓虹光效、悬浮动画、科技感配色这些),标题带着打字机动画效果,按钮还带光波扩散。
更难得的是,这个网站用了响应式设计,能自动适配手机和桌面端。
而旧版DeepSeek-V3在接到同样的指令时,吭哧吭哧只能输出100多行代码,审美上更是被新版甩开了一个档次。
有社区用户评价说,这次“小更新”比预期的要大得多,尤其在数学方面的改进相当明显。
之前我们测试时,有道数学题曾经难倒过旧版V3和R1。这次拿给新版V3一试,输出的token总量明显变长,单次输出直接打到了上限。点了“继续生成”之后,它也还在接着思考——不过,最终答案依然是错的。
但有意思的是,即使答案是错的,也能看出一些新变化:新版V3在给出答案后会进行反思,甚至自动修改自己的解题过程。
在文科类问题上,表现也有明显提升。比如我们之前问过“布须曼人喝不喝牛奶”,旧版V3只给了三小段话,信息量有限。新版V3则采用了更结构化的回答模式,分析更全面,补充了更多背景信息,同时生成速度依然理想。
这也印证了不少网友的总结:新版V3像V3和R1的结合体,更倾向于用长输出解决问题。
新版V3一发布,网友们的想象力又飞起来了:V3都来了,R2和V4还会远吗?