美企大规模采用中国开源大模型降本增效
来源:互联网
时间:2026-07-05 22:18:52
近期一个值得关注的现象是,多家美国科技企业正在把中国开源AI大模型部署到核心生产系统里。这背后有个关键原因——主流商业模型服务价格持续走高,让不少企业开始算这笔账。
以某加密货币交易所为例,他们已将智谱的GLM 5.2和月之暗面的Kimi K2.7设为全体工程师的默认大模型。这个调整通过内部大语言模型网关完成,没有限制工程师的调用额度,但整体AI运营成本却显著降低。
该公司的CEO在社交平台公开表态,在模型调用量指数级增长的背景下,通过更换默认模型、优化请求路由策略以及增强缓存机制,AI相关支出降幅接近50%。他强调,这条路径不需要特殊技术门槛或定制化基础设施,其他企业完全可以照搬。
值得注意的是,这次调整并没有削减工程师原有的Token配额。数据显示,超过九成的工程师此前从未触及调用上限。所以,公司只是把代码审查、技术文档摘要这些常规开发任务依赖的默认模型,从原先的国际头部闭源模型,平稳切换到了上述两款中国开源模型。
其实,类似策略早有先例:一家全球在线住宿平台把客服系统模型从GPT系列换成了通义千问;另一家专注AI工作流自动化的企业,因为AI支出已经超过人力薪酬总和,索性把核心模型从Claude迁移到了DeepSeek V4。还有云数据平台企业测算过,GLM 5.2在多项关键指标上接近Claude,但单位调用成本明显更低。
在主流大模型调用平台的文本生成类榜单上,中国开源模型长期稳居前列。DeepSeek、小米MiMo、MiniMax、腾讯混元以及智谱GLM等均处于第一梯队,这反映出它们在实际应用场景中的稳定性和成熟度。