阿里开源多Agent框架agentUniverse:10+组件、PEER与DOE协同、RAG注入领域知识!
在AI agent领域,最近常常被提起的一个名字是 agentUniverse。这是一个基于大型语言模型的多智能体框架,核心价值在于帮助开发者和企业,相对轻松地构建出具备领域专家级别的协作智能体。
核心特性
它的一大亮点,是提供了多种经过产业验证的多智能体协同模式。比如 PEER 模式,包含 Plan、Execute、Express、Review 四个环节,特别适合事件解读和行业分析这类任务;而 DOE 模式,涵盖 Data-fining、Opinion-inject、Express,在财报生成等场景中表现不错。当然,用户也可以根据自己的需求,自定义编排新的协作模式。
另一个值得关注的点是,框架中几乎所有组件都是可定制的。无论是 LLM、知识库、工具、记忆,还是 Planner 模块,都支持用户进行个性化增强。
与此同时,agentUniverse 在融入领域经验方面也做了功课。它支持领域提示词的构建与管理,并且能够将领域级别的标准操作流程(SOP)注入到智能体中,从而让智能体在对齐到专家水平时更加顺畅。
法律咨询案例
先看一个法律咨询的例子。通过 RagPlanner,可以快速搭建一个法律咨询智能体。它的工作方式,是检索民法典和刑法中的相关条例,再结合具体的案件背景,给出相应的法律建议。
Python自动执行案例
再来看看 Python 自动执行的场景。利用 ReactPlanner,搭建了一个能够自动生成 Python 代码并执行的智能体。从图片中的执行过程可以看出,它一共走了三步:第一步,模型根据问题生成了一段代码,交给 python_runner 工具执行,但失败了——原因是没有使用 print 打印结果;第二步,模型意识到问题,主动修改代码,再次执行,这次成功了;第三步,模型将执行成功的代码返回给用户。整个过程展现了 agent 在错误中自我修正的能力。
多智能体讨论组案例
多智能体的讨论组功能也很有意思。它设置了两类角色:一位讨论组主持人,以及若干讨论组成员。用户发起一个话题后,主持人会组织成员们开始讨论。每一轮,每位成员根据议题发表观点——有趣的是,这些观点并非一成不变,而是会随着讨论的推进不断调整。几轮下来,主持人会对整个过程进行总结,并将经过多轮碰撞后的结果返回给用户。文中还给出了两个示例:“甜粽子好吃还是咸粽子好吃”和“中医好还是西医好”的讨论案例,可以作为理解这种互动方式的参照。
金融事件分析案例
最后是一个金融事件分析案例。基于 PeerPlanner,构建了一个专门用于金融事件分析的多智能体协作系统。以“巴菲特2023年减持比亚迪”这一事件为例,可以清晰地看到 PEER 模式中每种智能体的配置方式和输出结果。Planning Agent 负责将原始的金融问题拆解成多个可单独分析的子问题;Executing Agent 则针对这些子问题逐一执行;Expressing Agent 将所有执行结果汇总,并根据设定的要求,形成对原始问题的最终回答;最后,Reviewing Agent 会对表达结果进行评估,判断其是否有效回应了最初的问题。整个流程环环相扣,挺有实际应用价值。