PilotDeck - 清华联合面壁智能开源的 Agent 操作系统
来源:互联网
时间:2026-05-29 21:26:27
PilotDeck是什么
先说一个判断:在AI Agent遍地开花的今天,真正能称得上“操作系统”的产品并不多。而PilotDeck,是其中相当有分量的一款。
这个名字可能对很多人来说还比较陌生,但它的背景可一点也不简单——由清华大学THUNLP实验室、面壁智能、OpenBMB与AI9stars联合开源。它的核心理念,用一个词概括就是“WorkSpace工作舱”。怎么理解呢?就是为每个项目建立一个独立的“生存空间”,里面有自己的文件系统、记忆存储和技能集。这样一来,多任务并行时,物理隔离做得好,A项目不会和B项目“串门”。
除此之外,它还支持记忆白盒化(记忆全过程可见可控)、智能路由动态分配模型(复杂活给大模型,简单活给小模型),以及一个听起来就很厉害的24小时Always-on常驻任务能力。实测下来,成本能省70%以上,同时还支持端云协同与端侧模型自动部署。说到底,它的目标就是让AI从“聊两句就忘”的对话玩具,彻底进化为真正的生产力工具。
PilotDeck的主要功能
那么,具体怎么玩?这几个核心功能值得细看:
- :每个项目拥有专属文件系统、记忆和技能,实现项目级的物理隔离,互不干扰。
WorkSpace 工作舱
- :不再是个黑匣子。记忆全链路可见、可控、可追溯,出了错误可以精准定位、一键修正或删除。
记忆白盒化
- :系统自动识别任务难度并动态分配模型。简单任务调用端侧轻量模型,复杂任务再上云端大模型,把钱花在刀刃上。
智能路由
- :Agent会主动发现未完成的任务并自主推进,不需要人工时不时去“戳”一下。真正实现了7x24小时在线工作。
Always-on 常驻任务
- :不仅能调用云端,还能调用端侧模型作为子Agent执行特定任务,比如自动部署VoxCPM这类端侧模型来完成语音生成,非常灵活。
端云协同
PilotDeck的技术原理
技术层面,PilotDeck有自己的一套底层设计逻辑:
- :每个WorkSpace由专属的文件系统、记忆存储和技能集三部分组成,从根上保证了项目级资源的边界隔离。
工作舱三层架构
- :全链路存储加可视化追溯,外加“任务制Dream”自动整理优化。更关键的是,它支持一键回滚,防止坏记忆污染全局。
记忆白盒机制
- :基于任务复杂度自动分级,通过主Agent与子Agent的编排,实现强弱模型的动态调度,兼顾了性能与成本。
智能路由算法
- :核心在于赋予Agent主动性,让它能自主扫描项目状态、发现待办事项、独立执行操作并产出文件,而非被动等待指令。
常驻任务引擎
- :技能不是固定死的,而是可以随任务推进沉淀进化,还能在不同WorkSpace之间实现可控的知识迁移与复用。
跨项目知识迁移
如何使用PilotDeck
上手流程相当简洁,几个步骤就能跑起来:
- :在macOS或Linux终端,运行官方curl命令完成安装,没什么门槛。
一键安装
- :执行
启动服务
pilotdeck命令,浏览器访问http://localhost:3001进入控制台。 - :在Web界面新建WorkSpace,设定项目名称与文件边界,就像创建一个新的“项目文件夹”。
创建工作舱
- :一键安装项目所需的技能包,Agent会随着任务推进自动沉淀专属能力。
配置技能
- :直接在对话框里输入自然语言任务就行,Agent会自主规划、执行并持续推进。你随时可以查看它的记忆与进度,全程透明。
下达指令
PilotDeck的项目地址
- :https://pilotdeck.openbmb.cn/pilotdeck.github.io/
项目官网
- :https://github.com/OpenBMB/PilotDeck
GitHub仓库
PilotDeck的同类竞品对比
拿它和目前比较知名的开源Agent框架OpenClaw做个对比,差异一目了然:
| 维度 | PilotDeck | OpenClaw |
|---|---|---|
架构核心 |
WorkSpace工作舱 = 项目级OS | Gateway网关 = 消息通道枢纽 |
权限模型 |
工作舱内自由操作,舱间物理隔离 | 全系统权限,风险与能力并存 |
记忆策略 |
白盒记忆+自动整理+一键回滚 | 黑盒向量记忆,长期持久 |
主动性 |
Agent主动发现任务并推进 | 心跳定时触发+消息驱动 |
成本 |
内置智能路由自动省钱 | 依赖用户手动选择模型 |
端侧 |
原生自动部署端侧模型 | 需手动配置Ollama |
安全 |
边界清晰,误操作影响范围可控 | 权限过大,需自行加固 |
PilotDeck的应用场景
说了这么多,它能做什么?实际案例已经不少了:
- :有人一天之内就用端侧模型生成了一个可交互的3D开放世界游戏,塞尔达风格,包含丰富元素与物理交互。
游戏开发
- :联动VoxCPM语音大模型,一键生成支持30种语言的多语种播客内容。
多语种播客生成
- :快速开发手机陀螺仪小游戏等轻量级应用原型,验证想法非常快。
移动应用开发
- :自动化执行模型训练流程,支持长周期任务的后台持续运行与进度追踪。
AI模型训练
- :行业白皮书撰写、剧本创作等需要持续迭代、记忆沉淀的复杂文档项目,正是它的用武之地。
长周期内容创作
总而言之,PilotDeck在Agent系统层面做出了不少值得关注的创新点,尤其在项目隔离、记忆管理和成本控制上,都给出了相当务实且有效的解决方案。有兴趣的朋友,不妨直接上手试试。