300个Agent预测104场比赛,Kimi拿世界杯做一场AI公开实验
德国爆冷夺冠!
看到Kimi这份世界杯预测报告,很多球迷的第一反应,大概都是同一个问题:这AI,真的懂球吗?

足球最迷人的地方,恰恰就是它的不确定性。强队会翻车,弱队能爆冷,门将的一次脱手,或者裁判的一张红牌,都可能让整场比赛的走向彻底偏离预期。
但Kimi这次偏偏挑了这个“高不确定性”的题目,做了一场大型实验。

2026年世界杯,注定是最复杂的一届。赛事首次扩容到48支球队、12个小组、104场比赛,横跨美国、加拿大和墨西哥三个国家。从小组出线、淘汰赛对阵,到球员伤病、旅途消耗、天气变化,甚至舆论压力,每一项因素都可能影响最终结果。光是让一个人完整看完所有比赛,就已经够累了。
Kimi的做法是:干脆派出最多300个Agent,把这些变量拆开,分头研究。

有的Agent专门分析战术,有的盯着球员状态和伤病,有的算赛程和旅途消耗。更有意思的是,还有一类Agent专门负责“唱反调”——它的任务,是找出预测里可能被忽略的风险点。这些Agent累计完成了超过10万次模拟推演,最终生成了一份让人意外的224页世界杯预测报告。
这场活动叫Kimi Token Goal。Kimi会围绕全部104场比赛,进行赛前预测和赛后复盘,把自己的判断放到真实赛果面前接受检验。这当然是一次带有娱乐性质的世界杯预测活动,但背后考验的,是Kimi目前最新、最强的能力:Agent集群和Kimi Work。前者让300个Agent像一支研究团队一样分头协作,后者则把这种能力放到了普通用户的电脑桌面上。
今天它们研究的是世界杯,明天就能帮用户做行业研究、数据分析、报告生成和工作流自动化。可以说,Kimi这次不只是想当“数字章鱼保罗”,它更想让我们看到:Agent不只会聊天,还能围绕一个复杂任务持续干活、反复修正,并让结果接受真实世界的检验。
一、看衰阿根廷,德国成“最大黑马”?是300个Agent算出来的
Kimi这次最引人关注的预测之一,是直接给卫冕冠军阿根廷敲了警钟,同时公开预测德国队会爆冷夺冠。
阿根廷有梅西,德国这几年大赛表现又不稳定,为什么Kimi会给出这样的判断?这源于Agent集群的多轮推演。
Agent集群累计完成了超过10万次世界杯模拟,评估阿根廷在淘汰赛首轮(32强赛)出局的概率约为15%。而在乐观情景下,德国队的夺冠概率达到18%。
具体来看,针对阿根廷,Kimi设置了悲观情景推演,重点跟踪10名存在伤病隐患的国脚,也考虑了梅西、奥塔门迪等老将年龄增长的影响。而在德国这边,关注的则是穆西亚拉、维尔茨等新生代球员的状态,以及德国队在特定情景下可能被低估的概率。
为了避免模型只强化主流观点,Kimi还引入了反方Agent机制。这些Agent专门负责找漏洞、找反例、找翻车风险。它们把阿根廷过去64年未曾消失的“卫冕冠军魔咒”等历史规律纳入分析。
所以,这个看似“出奇”的结论,其实是300个Agent大量模拟、交叉验证,以及正反观点博弈后的结果。
二、变量多、信息杂、分歧大,世界杯成了Agent集群的天然考场
本届世界杯有104场比赛,比赛数量比往届更多,变量也更为复杂。无论是资深球迷,还是“初出茅庐”的Agent集群,想要准确预测结果,都不是一个只看历史胜率就能解决的问题。
但Agent集群恰恰适合这类任务。战术Agent看阵型和打法,球员Agent追踪状态和伤病,赛程Agent计算旅途和休息,历史Agent分析过往交锋,反方Agent提出不同意见,合规Agent则确保内容停留在体育研究和娱乐讨论的范畴内。
更关键的是,世界杯有一个特殊机制:结果天然公开。预测正确与否、哪些变量判断失误、哪些因素被低估,都能在赛后直接复盘并反馈给系统。对于Agent来说,世界杯既有足够复杂的信息环境,也有明确的结果反馈机制,是观察其复杂任务处理能力的绝佳场景。
三、世界杯之外,Agent集群还能做什么?
当然,预测世界杯是我们最容易理解的场景之一。但Kimi真正的野心,其实就在你的电脑桌面上。
世界杯预测背后的核心能力——任务拆解、并行研究、信息整合和持续修正,这套能力同样适用于行业研究、财报分析、商业尽调等复杂工作。
Kimi Work是Kimi电脑客户端新增的本地通用Agent模式。

它的关键能力,就是支持Agent集群。可以自主创建300个分身,并行完成原本耗时较久的复杂工作。

以前,程序员用Coding Agent在终端里让AI写代码;现在,知识工作者可以在电脑桌面上用Kimi Work,让AI做调研、分析、整理文件、生成报告,并跨工具完成一整套任务。

此外,Kimi Work内置了专业数据源和Kimi WebBridge,能够操作用户自己的浏览器和登录态,可以“上手处理”用户日常工作桌面上的各种内容,包括网页、表格、PPT、本地文件和零散资料。

世界杯只是前菜,Agent集群真正面向的,是更广泛的知识工作场景。
与此同时,Kimi还围绕世界杯推出了一系列互动活动:用户可以选择一支球队作为主队,参与冠军预测;德国队或所选主队每赢一场,均可参与瓜分10亿token池。
结语:一场AI能力的世界杯公开考
Kimi Token Goal,并非要证明AI能100%猜中世界杯。
足球的魅力,恰恰来自它的不确定性。任何因素都可能在一瞬间改写比赛走向。
所以,如何组织300个Agent一起研究一件复杂事情,或许才是更值得关注的点。世界杯提供了一个天然的实验场——每一场比赛都会给出真实结果,每一次预测都能接受检验,每一次判断失误也能被拿出来复盘。
对于Kimi来说,这次活动真正的意义,不只是预测冠军归属,而是把分析过程、预测结果和赛后复盘放在同一个“透明框”里,向外界展示Agent集群如何处理复杂任务,以及当前AI能力究竟能做到什么、还有哪些边界。
今天,300个Agent研究的是世界杯;明天,它们研究的,或许就是你的下一份行业报告。