阿里云2026保姆级教程:Hermes Agent与OpenClaw部署及Token Plan配置完整步骤
一、整体方案概述
2026年,要是想快速搭一套能7×24小时自己跑代码、处理文档、调工具、干多步活儿的AI智能体,Hermes Agent和OpenClaw绝对是绕不开的两个框架。这两个本地自治智能体框架,配合阿里云服务器的算力,再挂上百炼Token Plan的统一积分计费,就能做到稳定、低成本、可规模化。整个落地流程拆成四个核心阶段:创建阿里云服务器资源→开通百炼Token Plan并拿到密钥→分别部署Hermes Agent和OpenClaw→把智能体跟Token Plan绑定,最后跑通验证。这篇文章是个保姆级的手把手教程,覆盖了轻量应用服务器和ECS云服务器两种主流载体,零基础新手和有一定运维基础的人都能跟上,全程附完整命令、配置参数和故障排查方案。









Token Plan采用积分订阅模式,一套积分通吃平台上的所有大模型,支持多模型灵活切换。用于多模态模型调用时,可以实现多模型、多工具、多场景下的额度共享与统一管理,兼顾灵活性、稳定性与安全性,大幅降低企业使用大模型的门槛与成本。





二、部署前置准备工作
2.1 账号与实名认证要求
账号方面,先确认阿里云账号已完成实名认证。个人用户走人脸识别或快捷渠道,企业用户则需要提交资质材料。如果团队多人协作,强烈建议用RAM子账号分配权限,只给云服务器和百炼平台相关操作的权限,遵循最小权限原则,避免主账号凭证泄露。子账号提前分配的权限要涵盖云服务器实例管理、安全组编辑、百炼模型调用、API密钥查看等,缺了谁都会在后续操作中报错——比如服务器创建失败,或者模型调用时鉴权通不过。
2.2 百炼Token Plan基础说明与开通流程
Token Plan是百炼平台推出的订阅式统一计费服务,用Credits积分作为通用消耗单位。和传统按Token计费相比,这种模式的好处是预算可控,特别适合智能体长期高频调用的场景。具体开通步骤:
- 进入阿里云百炼大模型服务平台,找到Token Plan订阅入口,根据使用规模选择档位。个人日常开发选标准坐席就行,团队并行跑多个高频智能体的话,建议选高级或尊享坐席。
- 完成订阅后去API密钥管理页面,创建Token Plan专属密钥。密钥标识以
sk-sp开头,和普通按量付费的API Key不一样。创建后务必完整复制保存,关闭弹窗后就再也看不到了。 - 记录Token Plan专属的OpenAI兼容接口地址。这个地址是Hermes和OpenClaw接入的核心参数,后续配置智能体时必须填写,不能用普通模型的通用地址代替。
2.3 本地操作工具准备
远程连接工具用来SSH登录阿里云服务器,市面上主流的客户端都能用。另外准备一个文本编辑器,单独存放API密钥、智能体访问凭证等敏感信息,别直接写在脚本里,防止泄露。地域选择上,国内华北2网络稳定性高,适合常规业务;如果选海外地域则无需备案,公网访问没限制,智能体的联网搜索功能也能正常用。
三、阿里云服务器创建与基础环境初始化
这里提供两种主流部署方案:轻量应用服务器适合零基础用户,内置简化流程;ECS云服务器适合需要自定义系统、资源扩容的进阶使用者。
零基础部署AI Agent:OpenClaw/Hermes Agent喂饭级步骤流程
第一步:访问阿里云镜像市场,选择预装OpenClaw或Hermes Agent的镜像(如果已经买了服务器,可以重置系统重新选择镜像)。









第二步:配置实例参数——镜像选择OpenClaw(或Hermes Agent)镜像;内存必须2GiB及以上;地域默认选美国(弗吉尼亚),因为当前中国内地地域(除香港)的轻量应用服务器联网搜索功能受限;时长按预算自选。完成后确认提交,等几分钟实例状态变成运行中。



第三步:进入阿里云百炼大模型控制台,找到密钥管理,创建API-Key。

然后去轻量应用服务器控制台,找到安装了OpenClaw的实例,进入“应用详情”放行18789端口、配置百炼API-Key、执行命令,生成访问OpenClaw的Token。

- 端口放通:需要放通对应端口的防火墙,单击一键放通即可。
- 配置百炼API-Key:单击一键配置,输入百炼的API-Key,然后执行命令写入。
- 配置OpenClaw/Hermes:执行命令,生成访问Token。
- 访问控制页面:单击打开网站页面进入对话界面。
阿里云百炼Coding Plan API-Key 获取、配置保姆级教程
创建API-Key,推荐使用阿里云百炼Coding Plan——这是一个按次计费的套餐,每天两场抢购活动,从按tokens计费升级为按次收费,能进一步节省费用。

- 购买后在控制台生成API Key。注意复制并保存好,后面要用。

- 回到轻量应用服务器控制台,单击服务器卡片中的实例ID,进入服务器概览页。

- 在服务器概览页面单击“应用详情”页签。

- 端口放通:在OpenClaw使用步骤区域,单击“端口放通”下的执行命令,开放OpenClaw服务运行端口的防火墙。

- 系统会列出已创建的Coding Plan API Key,直接选择。

- 获取访问地址:单击“访问Web UI面板”下的执行命令,获取OpenClaw WebUI的地址。


3.1 方案一:轻量应用服务器(新手首选)
- 进入轻量应用服务器控制台,点击创建实例,镜像分类选“应用镜像”,里面自带Hermes Agent预装镜像,省去手动下载依赖环境的麻烦。
- 实例规格最低2核2G内存,如果打算同时跑Hermes和OpenClaw两个智能体,建议升级到4核4G。系统盘默认40G以上高效云盘,带宽选5M及以上,保证公网访问流畅。
- 设置登录密码,选择订阅时长,确认配置后提交,等几分钟实例状态变成运行中。
- 端口放行:进入实例应用详情页面,一键放行22端口(SSH远程连接)和18789端口(智能体Web可视化页面访问)。测试阶段可以开放全部公网访问,正式上线后建议改成白名单模式,只允许固定IP接入,提升安全性。
3.2 方案二:ECS云服务器(自定义进阶部署)
- 进入ECS控制台创建实例,操作系统可选Alibaba Cloud Linux 3或Ubuntu 20.04及以上。选择专有网络,开启公网IP,设置登录密码或密钥对。
- 实例规格基础要求2核2G,多智能体并行推荐4核8G及以上。系统盘用ESSD云盘,容量不低于40G。
- 安全组规则新增放行TCP 22和18789端口,临时来源设为0.0.0.0/0,生产环境务必限制到指定IP段。
- 用SSH工具连接服务器,执行系统更新和基础依赖安装。Ubuntu系统:
Alibaba Cloud Linux系统:sudo apt update && sudo apt upgrade -y sudo apt install python3 python3-pip git docker.io nodejs -ysudo yum update -y sudo yum install python3 python3-pip git docker nodejs -y
3.3 服务器通用基础优化
- 时区校准:统一服务器时区,避免日志和任务执行时间错乱。
- 关闭不必要的系统自带服务,释放内存和CPU资源,保障智能体运行算力。
- 配置磁盘自动扩容,防止长期运行后日志和缓存把磁盘塞满导致服务崩溃。
四、Hermes Agent完整部署与Token Plan绑定配置
4.1 Hermes一键安装脚本执行
SSH登录服务器终端,执行官方一键安装脚本,脚本会自动拉取程序并配置运行环境:
curl -fsSL https://hermes.ai/install.sh | bash
安装完成后查看版本号,确认是否成功:
hermes -v
如果能输出版本号,说明安装没问题;如果提示命令不存在,重新执行脚本或检查网络连通性。
4.2 命令行绑定百炼Token Plan参数
逐条执行配置指令,把其中API Key和接口地址换成你自己的:
hermes config set model.provider custom
hermes config set model.base_url https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1
hermes config set model.api_mode openai_messages
hermes config set model.api_key sk-sp-替换为自己的密钥
hermes config set model.default qwen3.7-plus
hermes config set gateway.port 18789
参数说明:默认模型推荐Qwen3.7 Plus,文本推理和多模态能力都比较均衡;如果纯处理超长文本文档,可以改成qwen3.7-max。
4.3 启动服务并生成Web访问凭证
配置完成后启动Hermes后台服务:
hermes run
在新开终端窗口生成管理员访问Token,用于浏览器登录可视化后台:
hermes token generate
复制生成的长字符串妥善保存,没有这个凭证进不了智能体管理页面。
4.4 手动配置文件精细化调整(高级自定义)
如果要调整模型随机度、单次最大输出长度等参数,直接编辑本地配置文件,路径是~/.hermes/config.yaml,改完后重启服务:
hermes restart
举个例子:temperature在严谨公文、数据分析场景设0.2,创意内容生成场景设0.7;max_tokens根据业务需要调整上限。
4.5 Hermes开机自启配置
为防止服务器重启后智能体中段,配置开机自动运行:
sudo vim /etc/rc.local
在文件末尾新增指令:
cd /root/.hermes
nohup hermes run > hermes_log.log 2>&1 &
保存退出后赋予执行权限:
sudo chmod +x /etc/rc.local
重启服务器测试,重启后不用手动执行hermes run就能正常访问Web页面了。
五、OpenClaw完整部署与Token Plan绑定配置
OpenClaw采用容器化部署,依赖Docker环境。轻量服务器预装镜像可以跳过Docker安装,ECS手动部署要先确认Docker服务正常运行。
5.1 容器拉取与启动基础容器
拉取OpenClaw核心镜像并启动容器:
docker pull openclaw/core
docker run -d --name openclaw-core -p 18789:18789 openclaw/core
进入容器内部执行配置:
docker exec -it openclaw-core /bin/bash
5.2 容器内配置Token Plan相关参数
依次执行配置命令,填入专属密钥和接口地址:
openclaw config set models.providers.bailian-token.apiKey "sk-sp-替换为自身密钥"
openclaw config set models.providers.bailian-token.baseUrl "https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1"
openclaw config set agents.defaults.model.primary "bailian-token/qwen3.7-plus"
openclaw config set models.providers.bailian-token.token_plan_enabled true
特别注意:token_plan_enabled参数必须设为true,否则调用模型时不会走积分抵扣,自动切到按量付费模式,产生额外开销。
5.3 重启服务并生成管理员访问凭证
配置完成后重启网关服务:
openclaw gateway restart
生成Web后台登录Token:
openclaw token generate --admin
保存生成的凭证,浏览器登录后用它可以查看任务队列、工具调用记录、模型消耗统计等。
5.4 OpenClaw容器开机自启设置
配置Docker容器随服务器自动启动:
docker update --restart always openclaw-core
重启服务器验证,重启后容器自动运行,不需要手动执行docker run。
六、智能体功能验证与Token Plan额度消耗校验
6.1 Web可视化页面访问测试
浏览器输入 http://服务器公网IP:18789,输入生成的访问Token登录。分别进Hermes和OpenClaw的后台页面,正常能看到模型选择列表、技能开关、任务执行日志、用量统计面板。
6.2 基础对话与工具调用验证
- 简单文本测试:输入“简要介绍百炼Token Plan计费模式”,看模型是否正常返回回答,不报错、不超时就说明接口连通正常。
- 工具调用测试:输入“编写一段两数求和Python脚本并执行”,智能体应该自动生成代码、运行并返回结果,代表工具调用链路完整。
- 多模态测试(仅Qwen3.7 Plus支持):上传一张本地图片,下达分析指令,图片能被正常解析就说明多模态配置没问题。
6.3 Token Plan积分消耗校验
登录阿里云百炼平台,进Token Plan用量统计页面,查看Credits实时扣除记录。正常情况下每次模型调用都会从套餐积分里抵扣,不会产生按量付费账单。如果没看到积分消耗记录,排查三点:API Key是不是sk-sp开头的专属密钥;base_url是不是Token Plan专属地址;智能体配置里token_plan_enabled是否已开启。
七、智能体优化配置与安全管控方案
7.1 技能扩展配置
Hermes和OpenClaw都内置了文件处理、代码执行、联网检索、数据查询等通用技能,在Web后台的技能管理面板一键启用就行。所有技能调用模型都统一消耗Token Plan积分,省去单独配置计费的麻烦。还可以自定义专属工作流技能,把重复的业务流程固化下来,一键调用,减少重复输入指令。
7.2 性能优化手段
- 模型分层调度:简单问答、文本过滤用Qwen3.7 Flash,积分消耗低;图文和自动化任务用Plus;超长复杂逻辑推理时临时切到Max。
- 精简上下文记忆长度:自动清理无用的历史对话,减少单次输入Token数量。
- 批量文件处理启用批量推理模式,降低单位Credits消耗。
- 定期更新智能体版本,修复运行bug,提升工具调用稳定性。
7.3 服务器安全加固
- 安全组改成IP白名单模式,关掉全网公网访问权限。
- 定期轮换Token Plan API Key和智能体Web访问Token,防止凭证泄露。
- 别把密钥硬编码到脚本和配置文件里,优先用环境变量存储敏感参数。
- 开启服务器日志持久化存储,记录所有智能体调用行为,便于异常时溯源。
八、高频故障排查指南
8.1 智能体无法连接Token Plan模型接口
- 核对API Key前缀,必须是
sk-sp,普通按量付费密钥不能抵扣套餐积分。 - 确认接口地址填写完整,不能用通用dashscope基础地址代替。
- 检查服务器网络出口有没有访问拦截,可以用ping命令测试接口域名连通性。
- 检查Token Plan套餐是否过期,Credits积分是否还有剩余。
8.2 Web页面无法打开访问
- 确认安全组已放行18789端口,没有防火墙拦截。
- 检查智能体服务是否正常运行,重启服务后重试。
- 核对访问Token输入无误,没有字符缺失或多余空格。
8.3 Credits积分消耗异常过快
- 对话上下文堆积过多,长期没清理历史记录。
- 频繁用Max旗舰模型处理简单轻量任务。
- 上传超大尺寸图片、长视频素材,大幅增加输入Token消耗。
- 适当调低temperature参数,减少模型冗余输出内容。
8.4 OpenClaw容器启动失败
- 检查Docker服务是否设了开机自启,执行
systemctl start docker手动启动。 - 端口被占用了就修改网关端口配置,换一个没占用的端口。
- 服务器内存不足,建议升级实例内存规格,或者关掉后台闲置程序释放资源。
8.5 Hermes执行工具调用报错
- 服务器可能没装对应运行依赖(Python、Node等),重新执行依赖安装命令。
- 权限不足,切换root用户运行服务。
- 模型参数max_tokens设得太小,装不下完整工具执行返回的内容。
九、整体落地总结
2026年,在阿里云上部署Hermes Agent和OpenClaw,再接入百炼Token Plan,算是低成本、稳定运行自治AI智能体的标准答案了。轻量应用服务器适合零基础快速搭建,开箱即用;ECS云服务器则适合需要自定义资源、多智能体并行跑的进阶场景。整套流程的核心就是四个模块:服务器资源搭建、Token Plan订阅与密钥获取、两款智能体分别部署并绑定计费、功能验证与成本管控。全程配有可直接复制的终端命令,新手也能跟着走下来。Token Plan用统一Credits积分计费,解决了传统按量付费账单波动、预算不可控的痛点,一套积分自由切换平台全部大模型,适配智能体多场景混合调用。再加上开机自启、白名单安全加固、模型分层调度、用量告警等优化手段,智能体长期稳定运行、数据安全和成本控制就都照顾到了。实际落地时,根据业务负载灵活调整服务器配置和模型选型,定期查一查Token Plan用量统计,及时优化调用逻辑,就能让智能体的自动化能力发挥到最大,同时把AI算力开销控制在合理范围。