亚马逊关闭开发者"刷Token"排行榜以控制成本
不知道你有没有注意到,现在很多大公司内部都在玩一个有点“卷”的新游戏——鼓励员工用AI,然后搞个排行榜,比谁用的Token多。这事儿初衷听着挺正向,但实际执行起来,往往就演变成了另一种形式的“内卷”,甚至有点哭笑不得。最近亚马逊就结结实实地踩了这么个坑。

根据《金融时报》的报道,亚马逊内部曾流传着一个名为Clauderank的非官方排行榜,专门用来追踪旗下Claude AI工具的使用情况,并按员工的活跃度进行排名。初衷是想看看谁在用AI、用得多不多,能不能起到激励作用。
结果呢?你猜怎么着?为了在排行榜上“刷脸”,员工们开始琢磨怎么钻空子了。他们创建了一大堆AI智能体,专门去执行那些毫无实际意义的任务,目的只有一个:提高自己的Token消耗量,把排名刷上去。这种行为在内部被形象地称为“刷Token”(tokenmaxxing)。可想而知,这么搞下去,计算成本直接起飞了。最终,这个排行榜不得不被关闭。
亚马逊的一位高级副总裁在接受采访时也坦承,这个排行榜的立意确实是想推动大家多尝试AI,但随之而来的算力开销实在太高,有点扛不住了。
有意思的是,亚马逊不是唯一一个踩坑的。今年4月,Meta也关了一个类似的非官方排名系统,叫Claudeoconomics,原因一模一样:大规模的刷Token行为让成本失控了。
这就引出了一个更深层的问题:Token使用量这个指标太好量化了,但用它来衡量AI带来的实际业务价值,几乎是不可能的。AI大厂们一直在琢磨怎么找到更好的评估方式,但从目前来看,收效甚微。Salesforce尝试过开发新的评估指标,但反响平平,市场并不买账。
所以,企业现在面临的是一个很微妙的平衡难题:一方面要鼓励员工大胆去用AI,别畏手畏脚;另一方面又得把计算成本这匹野马给拴住,不能让它失控。今年3月,普华永道美国CEO保罗·格里格斯跟高管们强调过,不积极拥抱AI的员工,未来在公司里会很难立足。可现在,传递给员工的信息似乎又得补上一句:请多用AI,但可别“用过了头”。
这事儿说到底,考验的还是企业管理的智慧。用Token数量当KPI,就像用代码行数来衡量程序员的价值一样,容易走偏。
Q&A
我看到有人问了几个有意思的问题,这里一并回答一下:
Q1:什么是“刷Token”?为什么会出现这种奇怪的行为?
A:简单说,就是员工为了在公司内部的AI使用排行榜上拿个好名次,故意去让AI干一些没有实际意义的事,比如让智能体之间互相聊天、生成一堆没用的文档,以此来堆高Token使用量。根源在于,排行榜把“用了多少Token”当成了唯一评价标准,员工自然就会去“卷”这个数字,而不是去关心这个AI工具到底解决了什么业务问题。
Q2:亚马逊的Clauderank排行榜为什么非得关掉?
A:直接原因就是成本扛不住了。因为这个排行榜是纯按Token使用量排名,结果鼓励出了大量的无效调用,把算力成本推到了一个无法承受的高度。亚马逊的高管形容得很直白:出发点挺好,但代价太大。
Q3:那企业到底该怎么平衡这个矛盾呢?
A:这是个很现实的难题。单纯用Token量来考核,很容易引发滥用;但要说用业务价值来衡量,又太难量化了。目前整个行业都还在摸索阶段,没有特别成熟的方案。比较务实的做法可能是:在积极推广AI应用的大前提下,建立更精细、更科学的评估体系,不能只看消耗量,还得看产出和应用场景。毕竟,管好工具的使用方式,比单纯控制一个数字要有效得多。
-
- 亚马逊app官方版(更名亚马逊购物)下载
- 热门软件 | 未知