Hermes Agent + Ollama本地安装指南
想在本地部署一个能持续学习、真正记住你的AI助手吗?Hermes Agent与Ollama的组合,或许能给你一个惊喜。这篇指南将带你从零开始,完成环境搭建与核心功能体验。

自从OpenClaw问世,AI Agent领域几乎每周都有新项目涌现,让人眼花缭乱。不过,最近有个项目确实引起了不小的关注——Hermes Agent。
它在GitHub上的星标数或许不及OpenClaw,但其设计思路并非单纯比拼“内存”大小,而是更侧重于性能与学习能力的进化。可以说,它走的不是替代路线,而是开辟了另一条值得关注的产品路径。
2026年3月,Nous Research正式推出了Hermes Agent。这是一个开源的Agent框架,核心目标直指两大痛点:“AI失忆症”和“长期个性化缺失”。
如果你以为这只是一个新的聊天机器人,那就理解偏了。Hermes更接近一个
具备学习能力的AI智能体
它还支持多平台接入,包括Telegram、Discord、Slack、WhatsApp、Signal和命令行界面,并能兼容超过200个模型端点,例如OpenRouter、Nous Portal、OpenAI和Anthropic。部署方式也极其灵活,从5美元的VPS到GPU集群,再到近乎零空闲成本的Serverless架构,都能胜任。
Hermes Agent的三个关键特性
1. 自动学习技能:越用越聪明
这是Hermes最具辨识度的能力之一。
举个例子,如果你让Hermes“用Docker部署一个服务”,任务完成后,它会自动将执行过程中的关键步骤保存为一个技能。下次再遇到类似任务时,它就能更快、更稳定地复用此前积累的经验。
更重要的是,这些技能并非一成不变,它们会随着使用被持续修正和更新。
相比之下,许多其他Agent的技能更多依赖于人工编写和维护。而Hermes的思路更接近于“将你的真实使用过程,逐步沉淀为机器自身的能力资产”。
2. 三层记忆结构:告别“金鱼脑”AI
很多AI一旦会话结束,就仿佛“失忆”。Hermes则试图从结构上根治这个问题。
它的记忆系统分为三层:
- :由Agent维护的长期备忘录,记录你的工作环境、项目详情和个人偏好。
MEMORY.md
- :更偏向静态的用户画像,例如姓名、时区、沟通风格等。
USER.md
- :将历史对话保存至SQLite数据库,支持后续全文检索。
会话搜索(FTS5)
因此,当你问它“还记得上周我们讨论的Nginx配置吗?”,它能够搜索历史会话来回答,而不是每次都从零开始。
3. 多平台一致接入:一个Agent,随处可用
Hermes支持Telegram、Discord、Slack、WhatsApp、Signal、电子邮件/SMS、Home Assistant、Matrix/Mattermost、钉钉和命令行等多种入口。
关键不在于“接入平台多”,而在于:
所有这些平台共享的是同一个Agent及其完整的记忆体系
这意味着,你可以早上在Telegram上给它布置任务,晚上在Discord上追问进展,它依然清楚自己的身份,也记得你们之前进行到哪一步。
它的记忆系统究竟如何运作?
Hermes的记忆并非简单的历史归档,而更像一套服务于“执行与个性化”的基础设施。
它将记忆分为短期记忆、长期记忆和技能记忆,每层职责分明:
- :保存最近的对话上下文。
短期记忆
- :保存用户偏好、行为模式和长期信息。
长期记忆
- :将重复性任务自动沉淀为可复用的技能。
技能记忆
其中最有趣的是“技能记忆”。
例如,如果你多次要求它“每周一生成进度报告”,Hermes会在内部逐渐将这套流程总结成一个稳定的技能。此后,它不仅执行速度更快,输出格式也会越来越贴合你的习惯。
这就是其“自我改进”的核心:并非模型本身自动升级,而是执行经验在被持续地结构化。
多平台兼容:一个很现实的优势
Hermes能够在Telegram、Discord、Slack、WhatsApp和命令行等不同入口运行。
这带来的直接好处是,你无需为每个平台单独培养一个Agent。你面对的是同一个了解你偏好、记得你上下文的AI,只是交互入口发生了变化。
实际体验中,虽然命令行方式便于测试,但Telegram机器人可能是更实用的方案。毕竟,你可以直接用手机对话,并且上下文还能保持连续。
OpenClaw与Hermes Agent,如何选择?
Hermes更适合以下场景:
- 希望将其作为长期的个人智能伴侣使用。
- 需要持续自动化重复任务,让技能学习机制发挥作用。
- 在意语音支持、多平台接入和更轻量级的运行方式。
- 更看重“长期记忆”和“越用越个性化”的特性。
OpenClaw则更适合这些场景:
- 需要实现多Agent协同工作。
- 希望依赖更庞大的社区与开发生态。
- 需要浏览器自动化或更丰富的插件能力。
- 更看重经过大量用户验证的成熟度与稳定性。
所以,这两个项目并非非此即彼。它们完全可以共存:一个更偏向“舰队级协同作战”,另一个则更侧重“个人长期助理”。
开始安装Hermes Agent
下面进入实际的安装环节。
Hermes支持Linux、macOS和Windows(包括WSL)。最理想的部署方式是在VPS或闲置设备上长期运行;不过本次演示在本地Mac上完成,体验同样顺畅。
安装命令只有一条:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
该命令会自动创建虚拟环境,并安装所需的Python与Node.js依赖。
安装完成后,首先会进入一个设置向导,整体分为五个步骤:
- 选择模型与提供商
- 配置终端后端
- 调整Agent设置
- 连接消息平台
- 配置工具
你只需按流程操作即可。
如果机器上已安装过OpenClaw,它会自动检测~/.openclaw目录下的现有数据,并询问你是否迁移配置、记忆、技能和API密钥。
如果你是OpenClaw的老用户,直接迁移能节省大量时间;如果想全新开始,也可以先跳过,后续再补做迁移。
选择Ollama作为本地推理后端
在提供商选择阶段,我们可以直接选择
Custom OpenAI-compatible endpoint
随后输入Ollama的本地地址:
http://localhost:11434/v1
这里的11434是Ollama默认端口,/v1是其兼容OpenAI风格API的路径。
如果完全在本地运行,API密钥可以留空。模型名称则填入你已提前拉取到本地的模型,例如gpt-oss:20b,上下文长度可以让Hermes自动识别。
调整Agent设置
在Agent设置环节,可以重点关注以下三项:
- :例如设置为60,表示单个任务最多允许进行60次工具调用。
最大迭代次数(Max iterations)
- :建议设为“all”,这样可以更直观地看到Agent正在执行什么操作。
工具进度显示(Tool Progress Display)
- :例如设为0.5,表示当上下文使用到一半容量时,就开始压缩旧消息。
上下文压缩(Context Compression)
在会话重置策略(Session Reset Policy)中,可以启用按空闲时间或每日固定时间自动重置。这样能防止会话无限膨胀,同时确保重要信息被优先保存。
一个相对稳妥的默认组合是:24小时无操作自动重置,加上每天凌晨固定重置一次。
消息平台与工具配置
消息平台部分,如果暂时只想在本地试运行,可以先全部跳过,后续有需要时再配置Telegram、Discord、Slack、Matrix或WhatsApp。
工具配置阶段,Hermes的能力会变得完整起来:网页搜索、浏览器控制、终端访问、文件处理、代码执行、视觉识别、记忆管理等,大多数功能默认已开启。
对于浏览器自动化,可以选择Local Browser;对于文本转语音,可以保留默认的Microsoft Edge TTS;对于网页搜索,如果不想接入付费服务,也可以先用内置的DuckDuckGo。
启动Hermes并切换到本地模型
安装配置完成后,直接输入:
hermes
你会看到控制面板以及已加载的工具和技能。不过,有时状态栏默认显示的仍是Claude,而非本地模型。
此时,退出后执行:
hermes model
然后选择刚刚保存的本地端点,将模型设置为gpt-oss:20b,URL仍然使用本地Ollama地址即可。
重新启动Hermes后,状态栏就会显示gpt-oss:20b,这表明当前已完全在本地运行,不再依赖云端服务。
此时,你可以输入一句简单的问候,比如“hey, how are you doing today?”,观察它是否能快速返回正常响应。状态栏中的模型名称和上下文大小,也能帮助你确认整个链路确实运行在本机上。
实际体验与观察
平心而论,作为一个早期版本的项目,它确实还存在一些粗糙之处。例如,记忆的准确性并非总是稳定,技能生成偶尔也会偏离预期。
但即便如此,它所选择的产品路线本身极具价值。
如今,许多人对AI工具最大的不满,往往不是模型能力不足,而是“上下文总是断掉”。每次开启新对话,都需要重新解释项目背景、个人偏好和团队规则,整个过程效率低下。
Hermes Agent试图正面解决的,正是这个问题。
而且,它还是开源的,数据也掌握在你自己手中。从隐私和可控性的角度来看,这一点会让许多团队感到更加安心。
如果说下一代AI助手真正的竞争焦点是什么,那很可能是