GLM-5.2开源模型实测:国产AI工程能力提升,支持百万token上下文
近期,全球AI模型领域出现新的变化趋势。一方面,部分前沿闭源模型开始收紧访问权限,另一方面,开源模型阵营正积极提供替代方案。这一变化直接影响到开发者、研究机构以及依赖AI技术进行创新的企业,他们需要稳定、可访问且能力强大的工具来支撑项目开发。

在此背景下,智谱最新发布的GLM-5.2模型宣布开源,并支持高达100万token的上下文长度。该模型采用MIT开源协议,无地域使用限制,旨在为全球开发者提供一个不受外部因素干扰的AI编程助手选择。其实际表现如何,需要通过具体的项目测试来验证。
实测一:生成复杂SVG机械天文钟
在首个测试中,GLM-5.2被要求生成一个单HTML文件的机械天文钟。模型一次性写出了约925行纯前端代码,实现了零外部依赖。代码构建了五层同心SVG、七颗齿轮、60分钟刻度、椭圆星轨、月相盘、三速度指针及控制面板,首版生成即可运行。
值得注意的是,模型具备自我审查和修复能力。它在生成后自动审查代码,发现了三个真实存在的bug并逐一修复。例如,在月相显示功能上,初始版本采用mask方案效果不佳,
GLM-5.2没有选择在原有错误代码上修补,而是直接推倒重写,换用了terminator双弧path方案
实测二:构建3D物理互动足球游戏
第二个测试项目是创建一个使用Three.js和Cannon.js的3D点球大战游戏。GLM-5.2成功生成了包含五轮攻防、三档AI难度、拖拽射门与马格努斯弧线物理模拟、AI守门员预判扑救等完整功能的游戏代码。
模型展现了清晰的开发思路和问题诊断能力。例如,它准确诊断出CapsuleGeometry在特定Three.js版本中不存在,并给出了正确的替代方案。在解决“球穿门将”的物理碰撞bug时,它巧妙地避开了Cannon.js引擎的复杂模拟,采用了手写距离检测的逻辑。
更令人印象深刻的是其优化方式。为了改进守门员扑救动画的生硬感,
GLM-5.2没有凭感觉调整,而是直接引用了Ibrahim等人(2019)关于西甲精英门将扑救生物力学的研究论文
实测三:在浏览器中复刻Excel核心功能
第三个综合性测试是创建一个零依赖、单文件HTML的简化版Excel。GLM-5.2花费约一小时,成功在浏览器环境中还原了桌面端Excel的核心体验。
实现的功能包括:网格、完整的公式引擎(支持递归下降解析、相对/绝对/混合引用及30多种函数)、撤销重做(60步)、剪贴板操作以及CSV导入导出。同时,它也实现了全套键盘快捷键和常用的格式化工具栏。
优势与待改进之处
综合来看,GLM-5.2展现了扎实的工程架构能力和深度思考的倾向。它能够在复杂任务中自主定位技术问题,并引用真实、专业的文献资料进行优化。其“推倒重来”而非“堆砌补丁”的纠错方式,也体现了较高的代码质量追求。
然而,测试也暴露出模型的一些不足。例如,其生成的界面在视觉审美上仍有提升空间。在部分复杂任务中,模型有时会陷入长时间的思考,导致产出节奏失衡,出现过14分钟内仅停留在“设计讨论”阶段而未输出可运行代码的情况,这可能会影响开发效率的预期。
尽管如此,