Hermes Agent接入QQ的超详细实战指南
一、背景:为什么要把“爱马仕(Hermes Agent)”接入 QQ?
如果你已经接触过 Hermes Agent,你会发现它远不止是一个普通的聊天机器人。它是一个
具备长期记忆 + 工具调用 + 自我进化能力的 AI Agent

官方定义很明确:
Hermes 是一个“会成长”的 AI
- 单纯跑在命令行(CLI)里,没有“入口”,价值十分有限
- 真正的使用场景,一定是在上落地
通讯平台
为什么优先选择 QQ?国内用户基数大、群聊生态成熟,而且自动化空间巨大——不管是做客服、社群运营还是工具助手,QQ 都相当合适。
所以这篇文章的核心目标很简单:
把 Hermes 变成一个真正能用的 QQ AI 助手
---
二、整体架构:Hermes + QQ Bot 是怎么工作的?
在动手之前,先把架构讲清楚。这能帮你理解原理,而不仅仅是“照着做”。
1. 核心组件
可以把它理解为三层结构:
QQ用户 → QQ官方Bot → Hermes Gateway → Hermes Agent → LLM
详细拆解:
QQ 官方 Bot API
- 负责接收消息(WebSocket)
- 发送消息(HTTP REST)
Hermes Messaging Gateway
- Hermes 的“中间层”
- 把 QQ 消息转成 Agent 可理解的输入
Hermes Agent
- 处理逻辑、调用工具、记忆上下文
LLM(模型)
- GPT / Claude / GLM / 本地模型等
2. 数据流
从外面看,整个链路是这样的:
用户发消息 → QQ Gateway →
Hermes Gateway(解析) →
Hermes Agent(思考 + 工具调用) →
返回结果 →
QQ Bot API →
用户看到回复
3. Hermes 的关键优势
和普通 QQ Bot 最大的区别在哪里?看这张表:
| 能力 | 普通机器人 | Hermes |
|---|---|---|
| 上下文记忆 | ❌ | ✅ |
| 工具调用 | ❌ | ✅ |
| 多平台 | ❌ | ✅ |
| 自学习 | ❌ | ✅ |
普通机器人只能做“触发-回复”的简单循环,而 Hermes 是一个有记忆、能调工具、能跨平台的系统。
---
三、官方能力解析(重点)
根据官方文档,QQ Bot Adapter 提供了以下核心能力。容我细说——
1. 消息能力
支持的场景:
- 私聊(C2C)
- 群 @ 消息
- 频道消息(Guild)
- Direct Message
这意味着,你完全可以用它做
企业级客服 / 社群助手
2. 多媒体能力
Hermes 能处理:
- 图片
- 语音(自动转文字)
- 文件
语音识别流程很讲究:优先使用 QQ 自带的 ASR,如果不行,fallback 到外部方案(如 Whisper)。这个设计在极端场景下很救命。
3. 通信机制
- WebSocket(收消息)
- HTTP(发消息)
这一点很关键——说明是
实时通信
---
四、接入前准备
1. 注册 QQ Bot
去官方网址 https://q.qq.com,你需要准备:
- App ID
- App Secret
- 开启所需权限(intents)
必须开启的权限:
- 私聊消息
- 群 @ 消息
- Guild 消息
2. 安装 Hermes
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
3. 安装依赖
pip install aiohttp httpx
这是 QQ adapter 必需的库,少一个都会出问题。
---
五、核心接入步骤(重点)
流程不算复杂,但请跟着一步步走。
Step 1:启动 Gateway 配置
hermes gateway setup
在配置选项中选择:
QQ Bot
Step 2:填写配置
你会被要求输入:
QQ_APP_ID=xxx
QQ_CLIENT_SECRET=xxx
也可以手动写入文件:
~/.hermes/.env
Step 3:启动服务
hermes gateway start
Step 4:测试
在 QQ 里:
- 私聊机器人
- 群里 @机器人
如果配置正确,机器人会直接回复。
---
六、高级配置(真正拉开差距的地方)
基础接入只是热身,真正的精髓在于“调教” Hermes。
1. config.yaml 配置
路径:
~/.hermes/config.yaml
示例:
platforms:
qq:
enabled: true
extra:
markdown_support: true
dm_policy: "open"
group_policy: "open"
2. 权限控制
allow_from:
- "user_openid"
你可以构建白名单系统,限制谁能使用。
3. 群控制
group_allow_from:
- "group_id"
只允许指定的群使用,适合企业内部项目。
4. 语音识别增强
默认使用腾讯 ASR,高级玩法则是接入 OpenAI Whisper:
QQ_STT_API_KEY=xxx
QQ_STT_MODEL=whisper-1
---
七、实战案例:做一个“QQ AI 助手”
这里提供一个真实可用的场景——
社群运营助手
功能设定:
- 自动回复常见问题
- 总结聊天内容
- 定时推送消息
实现方式
1. 使用 Hermes cron 定时任务
hermes cron add "每天10点总结群聊"
2. 使用技能(skills)
Hermes 会自动创建技能,包括:
- FAQ回答
- 数据分析
- 自动回复模板
3. 群聊触发
用户发一句:
@机器人 总结今天内容
Hermes 自动分析历史上下文,输出当日总结。
---
八、进阶玩法(核心价值)
1. 多平台统一
Hermes 原生支持:Telegram、Discord、QQ,甚至可以扩展微信。一个 Agent,多入口,企业在不同平台之间实现统一服务。
2. Agent 自动工作
你可以让它:自动写日报、自动爬取数据、自动分析报告。完全是“数字员工”的干活方式。
3. 子 Agent
Hermes 支持多 Agent 并行与任务分解。这才是真正意义上的“AI 助手”——不是单打独斗,是团队协作。
---
九、常见问题(踩坑总结)
1. 机器人连不上
排查原因:App ID 写错了?Secret 不对?
2. 收不到消息
检查两点:intents 是否开启?群里是否 @ 了机器人?
3. 语音不识别
确认是否有 asr_refer_text,以及 STT API 是否配置正确。
4. 只能沙盒用
如果应用还没发布,只能跑在沙盒环境,要开放到生产需要走发布流程。
---
十、架构升级建议(非常重要)
如果你想做“商业级”产品,下面这几条建议是必须考虑的:
1. 部署在服务器
推荐方案:VPS($5/月就够) + Docker 容器化部署。
2. 使用 OpenRouter
优点:多模型切换灵活,成本低。不用绑定单一模型。
3. 加一层 API
架构升级为:QQ → Hermes → 你自己的 API → LLM。这样能控制成本、做缓存、加业务逻辑。
---
十一、总结
一句话总结:
Hermes + QQ Bot = 一个真正能干活的 AI 员工
它的核心价值不是“聊天机器人”,而是一个
自动化执行系统
---
十二、未来扩展
从 QQ 出发,你能继续做:
- 接入微信(企业级场景)
- 接入飞书(办公协同)
- 做成 SaaS 平台
- 搭建 AI 中台
最后说一句:如果你只是接入 QQ,它只是一个“机器人”;但如果你用好 Hermes,它就是你的