怎么写专业的 Skill
如何写出稳定可靠、触发精准的AI Skill?这篇文章分享的,是从10万行代码实践中提炼出来的专业方法论。
核心内容:
1. Skill的准确定义与核心结构 2. 入门级与专业级Skill的对比分析 3. 从脚本到专业工作手册的进阶路径
有没有过这种经历:给AI Agent写了一个Skill,它能跑,但总是触发不准、执行不稳、隔两天就出bug?就好比做菜——照着网上的菜谱做,味道是有了,但总觉得跟大厨做的差了点什么。
差的那点东西,就是
专业性
维护过一个10万行级别的Skill(WeWrite公众号全流程助手),从最初的一个简单脚本一路迭代至今。过程中踩过的坑、总结出的方法论,今天系统性地梳理出来。
先搞清楚:Skill 是什么
30秒版本:
Skill = 给AI Agent的工作手册
它不是提示词(prompt),也不是API文档,而是一份
结构化的操作指南
- 该被触发(trigger)
什么时候
- 一步步完成任务(workflow)
怎么
- 下会出错以及怎么处理(pitfall)
什么情况
- 做完之后结果(verification)
怎么验证
一个Skill的物理结构大概长这样:
my-skill/
├── SKILL.md # 核心指令(必需)
├── scripts/ # 可执行脚本
│ └── helper.py
├── references/ # 参考文档
│ ├── api.md
│ └── best-practices.md
└── templates/ # 模板文件
└── output.md
SKILL.md是唯一必需的文件,其他都是辅助。但
专业的Skill和入门级Skill的差距,恰恰就在这些辅助文件里
能跑 vs 专业:一个对比
用两个真实案例来说明差距。
案例 A:入门级 Skill(aihot)
这是一个查询AI资讯的Skill,核心功能正确,结构也算清晰。它的frontmatter长这样:
---
name: aihot
description: AI HOT 资讯查询 Skill。当用户想知道"今天 AI 圈有什么"时使用。
---
工作流部分只有一段核心命令:
since=$(date -u -v-24H +%Y-%m-%dT%H:%M:%SZ)
curl -s "https://aihot.virxact.com/api/public/items?mode=selected&since=$since"
能用吗?完全能用。
案例 B:专业级 Skill(WeWrite)
同样是完成一个任务,WeWrite这个公众号写作Skill多了不少东西:
| 维度 | 入门级 (aihot) | 专业级 (WeWrite) |
|---|---|---|
| Frontmatter | name + description | 完整元数据 + tags + related_skills + version |
| 触发条件 | 一句话描述 | 20+ 触发关键词 + 反向触发词(何时不 |
| 工作流 | 1 个主路径 | 8 步流水线,每步有输入输出定义 |
| 错误处理 | 无 | 每个步骤有 fallback + 已知坑位手册 |
| 辅助文件 | 无 | references/ (7个文档) + scripts/ (5个脚本) + personas/ (人格库) |
| 验证方法 | 手动测试 | 自动化质量检查(禁用词扫描、human-ness 评分) |
| 迭代机制 | 无 | history.yaml 记录每篇文章的元数据,避免重复 |
文件大小:11KB vs 103KB+。
专业 Skill 的五个关键维度
1. Frontmatter:Agent 决定是否加载你的 Skill 的唯一依据
这是最重要,也最容易被忽视的部分。
Agent在加载Skill之前,只能看到frontmatter里的 name 和 description。
入门级写法:
---
name: my-skill
description: 帮我做 X 事
---
问题在于:太泛了。"帮我做X事"可以匹配任何请求,结果要么是
过度触发
触发不准
专业级写法:
---
name: commit-message-generator
description: |
Use when the user wants to generate conventional commit messages based on
staged git changes. Covers feat/fix/docs/refactor/test/chore types.
Triggers on: "commit message", "生成提交信息", "git commit", "提交说明".
Do NOT use for: general text writing, PR descriptions, or changelogs.
version: 1.2.0
author: your-name
license: MIT
metadata:
hermes:
tags: [git, commit, conventional-commits, automation]
related_skills: [github-pr-workflow, github-code-review]
---
关键改进在哪里:
- (Hermes硬性限制),但需要把触发条件写清楚
description ≤ 1024 字符
- (Do NOT use for):减少误触发
明确反向触发词
- :tags用于分类检索,related_skills用于关联推荐
添加 metadata
- :方便后续迭代追踪
版本号
2. 结构化指令:让 Agent 能"按图施工"
入门级的指令通常是段落式的:
先拉数据,然后处理一下,最后输出
问题在于,Agent对"处理一下"的理解可能跟你完全不同。
专业级用的是
分步骤 + 表格 + 代码块
| 参数 | 值 | 说明 |
|---|---|---|
| 端点 | /api/public/items |
主数据接口 |
| mode | selected |
精选模式(默认) |
| since | 动态计算 | 最近 24 小时 |
# 计算时间窗口(兼容 macOS 和 Linux)
if [[ "$OSTYPE" == "darwin"* ]]; then
since=$(date -u -v-24H +%Y-%m-%dT%H:%M:%SZ)
else
since=$(date -u -d '24 hours ago' +%Y-%m-%dT%H:%M:%SZ)
fi
curl -sH "User-Agent: $UA" \
"https://example.com/api/public/items?mode=selected&since=$since&take=50"
输出格式
{id, title, category, url, published_at}。下一步将输出传入Step 2进行过滤。
注意这几个细节:
- :Agent不需要猜
表格定义参数
- :不省略任何参数
代码块可直接复制运行
- :下一步知道该怎么接
明确输出格式
- :macOS和Linux的date命令不同
兼容性处理
3. 错误处理:专业和业余的分水岭
入门级Skill假设一切顺利。专业级Skill假设
一定会出错
下面是一段pitfalls章节的写法示例——每个坑都按"现象→原因→处理"三段式展开:
Pitfall 1:API返回空结果
items 数组为空,但HTTP状态码是200。原因:时间窗口内无数据,或 since 参数格式错误。
# 检查返回是否为空
response=$(curl -s "...")
count=$(echo "$response" | python3 -c "import sys,json; print(len(json.load(sys.stdin)))")
if [ "$count" -eq 0 ]; then
echo "⚠️ 无数据,尝试扩大时间窗至 7 天"
since=$(date -u -v-7d +%Y-%m-%dT%H:%M:%SZ)
# 重试...
fi
Pitfall 2:User-Agent 被 403
直接curl返回403 Forbidden。原因:API端点有UA黑名单。处理:所有curl必须带浏览器UA。
Pitfall 3:编码问题
中文显示乱码。原因:远程终端locale不是UTF-8。处理:传递数据用纯ASCII JSON文件,不在命令行中硬编码中文。
专业Skill的pitfalls不是事后补的,而是边写边记录的。
4. 辅助文件体系:把 SKILL.md 控制在合理大小
SKILL.md有
100,000字符的硬性限制
当Skill复杂度上升时,解决方案不是把SKILL.md写得更长,而是
拆分到辅助文件
professional-skill/
├── SKILL.md # 核心(控制在 8-15K 字符)
├── references/
│ ├── api-reference.md # API 完整文档
│ ├── error-codes.md # 错误码对照表
│ └── best-practices.md # 最佳实践
├── scripts/
│ ├── validate.sh # 自动化验证脚本
│ └── deploy.sh # 部署脚本
└── templates/
└── output-template.md # 输出模板
SKILL.md里只保留简短引用指向细节,比如API文档部分可以这样写:
详见 `references/api-reference.md`,覆盖以下端点:
- 数据采集(3 个端点)
- 内容发布(2 个端点)
- 媒体上传(1 个端点)
| 端点 | 用途 | 认证 |
|---|---|---|
/api/data |
数据采集 | 无 |
/api/publish |
发布内容 | OAuth |
/api/media |
上传图片 | OAuth |
原则:SKILL.md放决策逻辑和关键路径,references放参考信息,scripts放可执行逻辑。
5. 验证机制:能自动检查就不要靠人眼
专业Skill都有自检能力。最基础的是
验证清单
- [ ] Frontmatter 以
---开头,无前导空白行 - [ ]
name≤ 64 字符,仅小写字母 + 连字符 - [ ]
description≤ 1024 字符,包含触发词 + 反向触发词 - [ ] 所有代码块可直接复制运行(已实测)
- [ ]
curl命令都带了正确的 User-Agent - [ ] 时间窗口计算兼容 macOS 和 Linux
- [ ] pitfalls 至少覆盖 3 个已知错误场景
- [ ] 总文件大小 ≤ 100,000 字符
- [ ]
related_skills引用的 Skill 确实存在
进阶做法是写一个
自动化验证脚本
#!/usr/bin/env python3
"""Skill 质量检查工具"""
import yaml, re, pathlib
def validate_skill(skill_path: str) -> dict:
path = pathlib.Path(skill_path)
content = path.read_text()
issues = []
# 检查 1: frontmatter 格式
if not content.startswith("---"):
issues.append("❌ 必须以 --- 开头")
# 检查 2: description 长度
fm = yaml.safe_load(content.split("---")[1])
desc_len = len(fm.get("description", ""))
if desc_len > 1024:
issues.append(f"❌ description {desc_len} 字符,超过 1024 限制")
# 检查 3: 代码块数量(教程型 Skill 要求 ≥ 5)
code_blocks = re.findall(r"```[\s\S]*?```", content)
if len(code_blocks) < 5:
issues.append(f"⚠️ 只有 {len(code_blocks)} 个代码块,建议 ≥ 5")
# 检查 4: 是否有 pitfalls 章节
if "## Common Pitfalls" not in content and "## pitfalls" not in content.lower():
issues.append("⚠️ 缺少 pitfalls 章节")
return {
"skill": skill_path,
"valid": len([i for i in issues if i.startswith("❌")]) == 0,
"issues": issues,
"stats": {
"size_chars": len(content),
"code_blocks": len(code_blocks),
"has_pitfalls": "pitfalls" in content.lower(),
}
}
if __name__ == "__main__":
import sys, json
result = validate_skill(sys.argv[1] if len(sys.argv) > 1 else "SKILL.md")
print(json.dumps(result, indent=2, ensure_ascii=False))
运行效果:
$ python3 validate_skill.py SKILL.md
{
"skill": "SKILL.md",
"valid": true,
"issues": [],
"stats": {
"size_chars": 12458,
"code_blocks": 7,
"has_pitfalls": true
}
}
实战:从零写一个专业 Skill
理论讲完了,动手写一个。场景:
Git提交信息自动生成器
第一步:创建目录结构
mkdir -p commit-gen/{scripts,references,templates}
touch commit-gen/SKILL.md
第二步:写 Frontmatter
---
name: commit-message-generator
description: |
Use when user wants to generate conventional commit messages from staged
git changes. Supports feat/fix/docs/refactor/test/chore/style/ci/perf/revert
types. Triggers on: "commit message", "提交信息", "git commit", "生成提交",
"commit msg". Do NOT use for: PR descriptions, changelogs, release notes.
version: 1.0.0
author: your-name
license: MIT
metadata:
hermes:
tags: [git, commit, conventional-commits, automation]
related_skills: [github-pr-workflow]
---
第三步:写核心工作流
Skill的主体部分从获取diff开始。如果没有staged变化,先提示用户 git add:
git diff --cached --no-color
然后根据变更内容判断commit type:
| 变更特征 | type | 示例 |
|---|---|---|
| 新功能/新文件 | feat |
feat: add user login endpoint |
| Bug 修复 | fix |
fix: null pointer in auth middleware |
| 文档变更 | docs |
docs: update API reference |
| 重构(不改变行为) | refactor |
refactor: extract validation logic |
| 测试相关 | test |
test: add coverage for auth flow |
| 构建/CI 相关 | ci |
ci: upgrade node version to 20 |
| 性能优化 | perf |
perf: reduce DB queries by 50% |
生成的commit message遵循Conventional Commits规范:第一行 type(scope): subject(≤ 50字符),第二行空行,正文可选(说明why不是what),页脚可选(Breaking Change / Closes #123)。示例输出:
feat(auth): add OAuth2 Google login
- Integrate with Google Identity Platform
- Support token refresh flow
- Add unit tests for token validation
Closes #42
最后用户确认后执行:
git commit -e -F /tmp/commit-msg.txt
第四步:补充 Pitfalls 和 Checklist
Pitfall 1:空diff
git add 就触发了Skill。处理:检测staged变化数量,为0时提示而非报错。
Pitfall 2:subject过长
Pitfall 3:scope歧义
Verification Checklist:
- [ ] 支持 9 种 commit type
- [ ] subject 长度检查(≤ 50 字符)
- [ ] 空 diff 优雅降级
- [ ]
-eflag 允许用户编辑 - [ ] 兼容 Git 2.0+
运行验证:
python3 scripts/validate_skill.py commit-gen/SKILL.md
这就是一个完整的、专业的Skill scaffold。
从能跑到专业的检查清单
最后,给你一个速查表。下次写Skill的时候逐项打勾:
| 层次 | 检查项 | 入门 | 专业 |
|---|---|---|---|
| Frontmatter | name/description 清晰 | ✅ | ✅ |
| 包含触发词 + 反向触发词 | ❌ | ✅ | |
| 有 version/author/metadata | ❌ | ✅ | |
| 结构 | 分步骤工作流 | ✅ | ✅ |
| 表格定义参数 | ❌ | ✅ | |
| 代码块可直接运行 | ⚠️ | ✅ | |
| 明确输入输出格式 | ❌ | ✅ | |
| 鲁棒性 | 有 pitfalls 章节 | ❌ | ✅ |
| 覆盖 ≥ 3 个错误场景 | ❌ | ✅ | |
| 兼容性处理(OS/版本) | ❌ | ✅ | |
| 工程化 | 拆分 references/ | ❌ | ✅ |
| 有验证脚本 | ❌ | ✅ | |
| 有历史记录机制 | ❌ | ✅ | |
| 总工作量 | 30 分钟 | 2-4 小时 |
结论:入门级Skill解决"能不能做",专业级Skill解决"能不能稳定地做100次"。
如果你的Skill只用一次,入门级就够了。但如果它会被反复调用、给别人用、或者承载关键业务流程,花时间做到专业级是值得的——回报是调试时间的数量级减少。
本文基于Hermes Agent Skill系统(hermes.nousresearch.com)和WeWrite公众号流水线的实战经验写成。文中所有代码片段均可直接复制运行。