你的Agent几级?知名风投BVP定义Agent七大等级~
在AI智能体(Agent)的发展路径上,知名风投机构Bessemer Venture Partners(BVP)最近发布了一份颇有见地的报告。他们借鉴了自动驾驶领域的分级思路,给Agent从L0到L6划分了七个等级。这不仅是技术能力的标尺,更像是一张未来发展路线图。今天,我们就围绕这份报告的核心内容,一层层剥开来看。
先看Bessemer对AI Agent的定义:
能够执行链式思维推理,以准确地对序列化工作流采取行动的基础模型的软件应用程序。
在他们看来,一个合格的Agent,需要具备哪些核心能力?简单来说,至少要有这么几个维度:
- 不能只是一个空壳,无论是基于大模型还是软件应用,它必须能感知和理解周围的环境。
实体(State):
- 光有感知不够,还得会"思考"。这个"思考"指的就是链式思维推理——包含了规划、反思、学习、自我审查、记忆等一系列高级认知活动。
智能(Intelligence):
- 想好了就得"动手干活"。比如,自动部署一段AI生成的代码,或者起草并发送一封邮件。
执行动作(Execute actions):
- 能够处理那些需要一步步来、动态变化或形成序列的复杂工作流,而不是只做简单的单步指令。
复杂任务(Complex tasks):
- 干活必须靠谱,并且清楚地知道自己代表谁、有哪些权限,不能越界行事。
可靠性(Reliability and Entitlements):

Agent的7个等级
Bessemer的分级体系,从L0到L6,层层递进。下面我们逐一拆解:
L0:无智能 (No agency)
这个阶段最简单——完全依赖人工操作的AI系统。比如你手动去Prompt一个LLM,或者用一些基于规则的自动化工具。在Bessemer看来,这些还算不上严格意义上的Agent。
L1:思维链推理 (Chain-of-thought reasoning)
到了这个层级,Agent开始展现出"智能"的雏形。它能进行链式思考,理解上下文并进行自我评估,就像我们交作业前会自己检查一遍一样。这个能力为后续的可靠性打下了基础,也方便我们追踪它的"思考过程"。
L2:AI副驾驶 (Conditional agency as co-pilot)
L2的Agent不仅能提供信息,还能准确理解信息并感知环境,然后主动"提议"一些行动。不过,最终决策权仍然掌握在人类"主驾驶"手里——由人来批准或授权执行。
- 典型的例子就是编程助手(Co-pilot):它能在IDE里给出代码补全建议,但最终部署代码,或者允许AI直接修改代码库,还是得程序员自己操作或由人类经理批准。
L3:任务执行小能手 (High autonomy to act on tasks)
这一层的AI Agent拥有了操作系统层面的权限和资格,可以高度自主地完成任务,并且表现出很强的可靠性。简单说,它不仅能想,还能做了。
- 举个例子:代码Agent能够自己生成代码,并且直接、正确地修改代码库,整个过程无需人的审查。
L4:AI打工人上线 (Perform job)
完全自主的AI员工就此诞生。它们能够理解环境,设定并完成目标,处理复杂的、序列化的工作流程,甚至能搞定以前从未见过的新任务。一个典型的场景是:AI Agent完全可以像一个初级软件工程师一样独立工作。
L5:AI梦之队 (Teams of agents)
单个Agent牛还不够,L5要求它们能组成团队。Agent之间可以成功地进行互动、协作、共享信息,共同完成一个大目标。
- 好比:一群AI Agent像一个软件工程师突击队,协同作战完成一个完整的项目。
L6:AI当领导 (Manage teams of agents)
这是最高境界。这里的Agent不仅能协同工作,还能"管人"——招募、评估其他AI,指导、给予反馈,甚至在必要时替换掉不给力的"下属"。
- 实际应用场景:AI工程经理或AI产品经理,负责协调和评估其他AI的工作,以确保某个功能顺利上线。
从这条路径来看,未来AI有可能改进甚至自动化人类所做的每一项信息工作——包括投资人的工作。这不仅会带来生产力的巨大提升,更可能催生劳动力向"AI Agent为主"的重大转变。如果你对人工智能即将带来的可能性还存有疑虑,Bessemer的提醒很值得注意:或许,这只是我们自己一厢情愿的"错觉"(intelusional - intelligent + delusional,指对AI能力和风险的误判)。