首页 > 教程攻略 > web3.0 >GLM 5.2复现学术论文成本仅为Opus 4.8的约八分之一

GLM 5.2复现学术论文成本仅为Opus 4.8的约八分之一

来源:互联网 时间:2026-06-27 21:53:04

学术复现的“性价比”之争,最近有了一个很有意思的参考案例。6月26日,科研平台alphaXiv团队做了一轮自动化测试,核心是看看不同大模型在复现前沿论文时的真实表现——不只是读论文,还得自己跑通实验。

测试的论文是一篇关于自蒸馏强化学习的工作(SDPO),模型需要自主阅读原文、理解方法,然后在一个开源库VeRL上跑通消融实验。这个过程中,还得面对各种复杂的环境报错。结果如何?开源模型GLM 5.2给出了一个相当亮眼的成绩单。

GLM 5.2复现学术论文成本仅为Opus 4.8的约八分之一

具体来看,GLM 5.2在经历了14次运行失败后,最终成功复现了实验结果。整个过程中消耗了265万tokens,总花费仅6.21美元。作为对比,闭源的旗舰模型Claude Opus 4.8 Max虽然经历9次失败后就成功了,但消耗了453万tokens,花费高达46.35美元——成本算下来,GLM 5.2大约只有Opus 4.8的八分之一。

当然,这里并不是说GLM 5.2在成功率上已经超越闭源强者,毕竟Opus 4.8的失败次数更少。但从投入产出比来看,开源模型在学术复现这种长链条、高消耗的任务场景下,已经展现出相当惊人的性价比。对于预算有限的科研团队来说,这无疑是个值得关注的信号。