首页 > 教程攻略 > ai资讯 >阿里云2026保姆级教程：Hermes Agent与OpenClaw部署及Token Plan配置完整步骤

阿里云2026保姆级教程：Hermes Agent与OpenClaw部署及Token Plan配置完整步骤

来源：互联网时间：2026-06-17 13:00:15

一、整体方案概述

2026年，要是想快速搭一套能7×24小时自己跑代码、处理文档、调工具、干多步活儿的AI智能体，Hermes Agent和OpenClaw绝对是绕不开的两个框架。这两个本地自治智能体框架，配合阿里云服务器的算力，再挂上百炼Token Plan的统一积分计费，就能做到稳定、低成本、可规模化。整个落地流程拆成四个核心阶段：创建阿里云服务器资源→开通百炼Token Plan并拿到密钥→分别部署Hermes Agent和OpenClaw→把智能体跟Token Plan绑定，最后跑通验证。这篇文章是个保姆级的手把手教程，覆盖了轻量应用服务器和ECS云服务器两种主流载体，零基础新手和有一定运维基础的人都能跟上，全程附完整命令、配置参数和故障排查方案。

Token Plan采用积分订阅模式，一套积分通吃平台上的所有大模型，支持多模型灵活切换。用于多模态模型调用时，可以实现多模型、多工具、多场景下的额度共享与统一管理，兼顾灵活性、稳定性与安全性，大幅降低企业使用大模型的门槛与成本。

二、部署前置准备工作

2.1 账号与实名认证要求

账号方面，先确认阿里云账号已完成实名认证。个人用户走人脸识别或快捷渠道，企业用户则需要提交资质材料。如果团队多人协作，强烈建议用RAM子账号分配权限，只给云服务器和百炼平台相关操作的权限，遵循最小权限原则，避免主账号凭证泄露。子账号提前分配的权限要涵盖云服务器实例管理、安全组编辑、百炼模型调用、API密钥查看等，缺了谁都会在后续操作中报错——比如服务器创建失败，或者模型调用时鉴权通不过。

2.2 百炼Token Plan基础说明与开通流程

Token Plan是百炼平台推出的订阅式统一计费服务，用Credits积分作为通用消耗单位。和传统按Token计费相比，这种模式的好处是预算可控，特别适合智能体长期高频调用的场景。具体开通步骤：

进入阿里云百炼大模型服务平台，找到Token Plan订阅入口，根据使用规模选择档位。个人日常开发选标准坐席就行，团队并行跑多个高频智能体的话，建议选高级或尊享坐席。
完成订阅后去API密钥管理页面，创建Token Plan专属密钥。密钥标识以sk-sp开头，和普通按量付费的API Key不一样。创建后务必完整复制保存，关闭弹窗后就再也看不到了。
记录Token Plan专属的OpenAI兼容接口地址。这个地址是Hermes和OpenClaw接入的核心参数，后续配置智能体时必须填写，不能用普通模型的通用地址代替。

2.3 本地操作工具准备

远程连接工具用来SSH登录阿里云服务器，市面上主流的客户端都能用。另外准备一个文本编辑器，单独存放API密钥、智能体访问凭证等敏感信息，别直接写在脚本里，防止泄露。地域选择上，国内华北2网络稳定性高，适合常规业务；如果选海外地域则无需备案，公网访问没限制，智能体的联网搜索功能也能正常用。

三、阿里云服务器创建与基础环境初始化

这里提供两种主流部署方案：轻量应用服务器适合零基础用户，内置简化流程；ECS云服务器适合需要自定义系统、资源扩容的进阶使用者。

零基础部署AI Agent：OpenClaw/Hermes Agent喂饭级步骤流程

第一步：访问阿里云镜像市场，选择预装OpenClaw或Hermes Agent的镜像（如果已经买了服务器，可以重置系统重新选择镜像）。

第二步：配置实例参数——镜像选择OpenClaw（或Hermes Agent）镜像；内存必须2GiB及以上；地域默认选美国（弗吉尼亚），因为当前中国内地地域（除香港）的轻量应用服务器联网搜索功能受限；时长按预算自选。完成后确认提交，等几分钟实例状态变成运行中。

第三步：进入阿里云百炼大模型控制台，找到密钥管理，创建API-Key。

然后去轻量应用服务器控制台，找到安装了OpenClaw的实例，进入“应用详情”放行18789端口、配置百炼API-Key、执行命令，生成访问OpenClaw的Token。

端口放通：需要放通对应端口的防火墙，单击一键放通即可。
配置百炼API-Key：单击一键配置，输入百炼的API-Key，然后执行命令写入。
配置OpenClaw/Hermes：执行命令，生成访问Token。
访问控制页面：单击打开网站页面进入对话界面。

阿里云百炼Coding Plan API-Key 获取、配置保姆级教程

创建API-Key，推荐使用阿里云百炼Coding Plan——这是一个按次计费的套餐，每天两场抢购活动，从按tokens计费升级为按次收费，能进一步节省费用。

购买后在控制台生成API Key。注意复制并保存好，后面要用。

回到轻量应用服务器控制台，单击服务器卡片中的实例ID，进入服务器概览页。

在服务器概览页面单击“应用详情”页签。

端口放通：在OpenClaw使用步骤区域，单击“端口放通”下的执行命令，开放OpenClaw服务运行端口的防火墙。

系统会列出已创建的Coding Plan API Key，直接选择。

获取访问地址：单击“访问Web UI面板”下的执行命令，获取OpenClaw WebUI的地址。

3.1 方案一：轻量应用服务器（新手首选）

进入轻量应用服务器控制台，点击创建实例，镜像分类选“应用镜像”，里面自带Hermes Agent预装镜像，省去手动下载依赖环境的麻烦。
实例规格最低2核2G内存，如果打算同时跑Hermes和OpenClaw两个智能体，建议升级到4核4G。系统盘默认40G以上高效云盘，带宽选5M及以上，保证公网访问流畅。
设置登录密码，选择订阅时长，确认配置后提交，等几分钟实例状态变成运行中。
端口放行：进入实例应用详情页面，一键放行22端口（SSH远程连接）和18789端口（智能体Web可视化页面访问）。测试阶段可以开放全部公网访问，正式上线后建议改成白名单模式，只允许固定IP接入，提升安全性。

3.2 方案二：ECS云服务器（自定义进阶部署）

进入ECS控制台创建实例，操作系统可选Alibaba Cloud Linux 3或Ubuntu 20.04及以上。选择专有网络，开启公网IP，设置登录密码或密钥对。
实例规格基础要求2核2G，多智能体并行推荐4核8G及以上。系统盘用ESSD云盘，容量不低于40G。
安全组规则新增放行TCP 22和18789端口，临时来源设为0.0.0.0/0，生产环境务必限制到指定IP段。

用SSH工具连接服务器，执行系统更新和基础依赖安装。Ubuntu系统：

sudo apt update && sudo apt upgrade -y
sudo apt install python3 python3-pip git docker.io nodejs -y

Alibaba Cloud Linux系统：

sudo yum update -y
sudo yum install python3 python3-pip git docker nodejs -y

3.3 服务器通用基础优化

时区校准：统一服务器时区，避免日志和任务执行时间错乱。
关闭不必要的系统自带服务，释放内存和CPU资源，保障智能体运行算力。
配置磁盘自动扩容，防止长期运行后日志和缓存把磁盘塞满导致服务崩溃。

四、Hermes Agent完整部署与Token Plan绑定配置

4.1 Hermes一键安装脚本执行

SSH登录服务器终端，执行官方一键安装脚本，脚本会自动拉取程序并配置运行环境：

curl -fsSL https://hermes.ai/install.sh | bash

安装完成后查看版本号，确认是否成功：

hermes -v

如果能输出版本号，说明安装没问题；如果提示命令不存在，重新执行脚本或检查网络连通性。

4.2 命令行绑定百炼Token Plan参数

逐条执行配置指令，把其中API Key和接口地址换成你自己的：

hermes config set model.provider custom
hermes config set model.base_url https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1
hermes config set model.api_mode openai_messages
hermes config set model.api_key sk-sp-替换为自己的密钥
hermes config set model.default qwen3.7-plus
hermes config set gateway.port 18789

参数说明：默认模型推荐Qwen3.7 Plus，文本推理和多模态能力都比较均衡；如果纯处理超长文本文档，可以改成qwen3.7-max。

4.3 启动服务并生成Web访问凭证

配置完成后启动Hermes后台服务：

hermes run

在新开终端窗口生成管理员访问Token，用于浏览器登录可视化后台：

hermes token generate

复制生成的长字符串妥善保存，没有这个凭证进不了智能体管理页面。

4.4 手动配置文件精细化调整（高级自定义）

如果要调整模型随机度、单次最大输出长度等参数，直接编辑本地配置文件，路径是~/.hermes/config.yaml，改完后重启服务：

hermes restart

举个例子：temperature在严谨公文、数据分析场景设0.2，创意内容生成场景设0.7；max_tokens根据业务需要调整上限。

4.5 Hermes开机自启配置

为防止服务器重启后智能体中段，配置开机自动运行：

sudo vim /etc/rc.local

在文件末尾新增指令：

cd /root/.hermes
nohup hermes run > hermes_log.log 2>&1 &

保存退出后赋予执行权限：

sudo chmod +x /etc/rc.local

重启服务器测试，重启后不用手动执行hermes run就能正常访问Web页面了。

五、OpenClaw完整部署与Token Plan绑定配置

OpenClaw采用容器化部署，依赖Docker环境。轻量服务器预装镜像可以跳过Docker安装，ECS手动部署要先确认Docker服务正常运行。

5.1 容器拉取与启动基础容器

拉取OpenClaw核心镜像并启动容器：

docker pull openclaw/core
docker run -d --name openclaw-core -p 18789:18789 openclaw/core

进入容器内部执行配置：

docker exec -it openclaw-core /bin/bash

5.2 容器内配置Token Plan相关参数

依次执行配置命令，填入专属密钥和接口地址：

openclaw config set models.providers.bailian-token.apiKey "sk-sp-替换为自身密钥"
openclaw config set models.providers.bailian-token.baseUrl "https://token-plan.cn-beijing.maas.aliyuncs.com/compatible-mode/v1"
openclaw config set agents.defaults.model.primary "bailian-token/qwen3.7-plus"
openclaw config set models.providers.bailian-token.token_plan_enabled true

特别注意：token_plan_enabled参数必须设为true，否则调用模型时不会走积分抵扣，自动切到按量付费模式，产生额外开销。

5.3 重启服务并生成管理员访问凭证

配置完成后重启网关服务：

openclaw gateway restart

生成Web后台登录Token：

openclaw token generate --admin

保存生成的凭证，浏览器登录后用它可以查看任务队列、工具调用记录、模型消耗统计等。

5.4 OpenClaw容器开机自启设置

配置Docker容器随服务器自动启动：

docker update --restart always openclaw-core

重启服务器验证，重启后容器自动运行，不需要手动执行docker run。

六、智能体功能验证与Token Plan额度消耗校验

6.1 Web可视化页面访问测试

浏览器输入 http://服务器公网IP:18789，输入生成的访问Token登录。分别进Hermes和OpenClaw的后台页面，正常能看到模型选择列表、技能开关、任务执行日志、用量统计面板。

6.2 基础对话与工具调用验证

简单文本测试：输入“简要介绍百炼Token Plan计费模式”，看模型是否正常返回回答，不报错、不超时就说明接口连通正常。
工具调用测试：输入“编写一段两数求和Python脚本并执行”，智能体应该自动生成代码、运行并返回结果，代表工具调用链路完整。
多模态测试（仅Qwen3.7 Plus支持）：上传一张本地图片，下达分析指令，图片能被正常解析就说明多模态配置没问题。

6.3 Token Plan积分消耗校验

登录阿里云百炼平台，进Token Plan用量统计页面，查看Credits实时扣除记录。正常情况下每次模型调用都会从套餐积分里抵扣，不会产生按量付费账单。如果没看到积分消耗记录，排查三点：API Key是不是sk-sp开头的专属密钥；base_url是不是Token Plan专属地址；智能体配置里token_plan_enabled是否已开启。

七、智能体优化配置与安全管控方案

7.1 技能扩展配置

Hermes和OpenClaw都内置了文件处理、代码执行、联网检索、数据查询等通用技能，在Web后台的技能管理面板一键启用就行。所有技能调用模型都统一消耗Token Plan积分，省去单独配置计费的麻烦。还可以自定义专属工作流技能，把重复的业务流程固化下来，一键调用，减少重复输入指令。

7.2 性能优化手段

模型分层调度：简单问答、文本过滤用Qwen3.7 Flash，积分消耗低；图文和自动化任务用Plus；超长复杂逻辑推理时临时切到Max。
精简上下文记忆长度：自动清理无用的历史对话，减少单次输入Token数量。
批量文件处理启用批量推理模式，降低单位Credits消耗。
定期更新智能体版本，修复运行bug，提升工具调用稳定性。

7.3 服务器安全加固

安全组改成IP白名单模式，关掉全网公网访问权限。
定期轮换Token Plan API Key和智能体Web访问Token，防止凭证泄露。
别把密钥硬编码到脚本和配置文件里，优先用环境变量存储敏感参数。
开启服务器日志持久化存储，记录所有智能体调用行为，便于异常时溯源。

八、高频故障排查指南

8.1 智能体无法连接Token Plan模型接口

核对API Key前缀，必须是sk-sp，普通按量付费密钥不能抵扣套餐积分。
确认接口地址填写完整，不能用通用dashscope基础地址代替。
检查服务器网络出口有没有访问拦截，可以用ping命令测试接口域名连通性。
检查Token Plan套餐是否过期，Credits积分是否还有剩余。

8.2 Web页面无法打开访问

确认安全组已放行18789端口，没有防火墙拦截。
检查智能体服务是否正常运行，重启服务后重试。
核对访问Token输入无误，没有字符缺失或多余空格。

8.3 Credits积分消耗异常过快

对话上下文堆积过多，长期没清理历史记录。
频繁用Max旗舰模型处理简单轻量任务。
上传超大尺寸图片、长视频素材，大幅增加输入Token消耗。
适当调低temperature参数，减少模型冗余输出内容。

8.4 OpenClaw容器启动失败

检查Docker服务是否设了开机自启，执行systemctl start docker手动启动。
端口被占用了就修改网关端口配置，换一个没占用的端口。
服务器内存不足，建议升级实例内存规格，或者关掉后台闲置程序释放资源。

8.5 Hermes执行工具调用报错

服务器可能没装对应运行依赖（Python、Node等），重新执行依赖安装命令。
权限不足，切换root用户运行服务。
模型参数max_tokens设得太小，装不下完整工具执行返回的内容。

九、整体落地总结

2026年，在阿里云上部署Hermes Agent和OpenClaw，再接入百炼Token Plan，算是低成本、稳定运行自治AI智能体的标准答案了。轻量应用服务器适合零基础快速搭建，开箱即用；ECS云服务器则适合需要自定义资源、多智能体并行跑的进阶场景。整套流程的核心就是四个模块：服务器资源搭建、Token Plan订阅与密钥获取、两款智能体分别部署并绑定计费、功能验证与成本管控。全程配有可直接复制的终端命令，新手也能跟着走下来。Token Plan用统一Credits积分计费，解决了传统按量付费账单波动、预算不可控的痛点，一套积分自由切换平台全部大模型，适配智能体多场景混合调用。再加上开机自启、白名单安全加固、模型分层调度、用量告警等优化手段，智能体长期稳定运行、数据安全和成本控制就都照顾到了。实际落地时，根据业务负载灵活调整服务器配置和模型选型，定期查一查Token Plan用量统计，及时优化调用逻辑，就能让智能体的自动化能力发挥到最大，同时把AI算力开销控制在合理范围。