首页 > 教程攻略 > ai资讯 >怎么写专业的 Skill

怎么写专业的 Skill

来源:互联网 时间:2026-06-19 13:48:06

如何写出稳定可靠、触发精准的AI Skill?这篇文章分享的,是从10万行代码实践中提炼出来的专业方法论。

核心内容:

1. Skill的准确定义与核心结构 2. 入门级与专业级Skill的对比分析 3. 从脚本到专业工作手册的进阶路径 怎么写专业的 Skill

有没有过这种经历:给AI Agent写了一个Skill,它能跑,但总是触发不准、执行不稳、隔两天就出bug?就好比做菜——照着网上的菜谱做,味道是有了,但总觉得跟大厨做的差了点什么。

差的那点东西,就是

专业性

维护过一个10万行级别的Skill(WeWrite公众号全流程助手),从最初的一个简单脚本一路迭代至今。过程中踩过的坑、总结出的方法论,今天系统性地梳理出来。

先搞清楚:Skill 是什么

30秒版本:

Skill = 给AI Agent的工作手册

它不是提示词(prompt),也不是API文档,而是一份

结构化的操作指南

,告诉Agent:

  • 什么时候

    该被触发(trigger)
  • 怎么

    一步步完成任务(workflow)
  • 什么情况

    下会出错以及怎么处理(pitfall)
  • 做完之后

    怎么验证

    结果(verification)

一个Skill的物理结构大概长这样:

my-skill/
├── SKILL.md              # 核心指令(必需)
├── scripts/              # 可执行脚本
│   └── helper.py
├── references/           # 参考文档
│   ├── api.md
│   └── best-practices.md
└── templates/            # 模板文件
    └── output.md

SKILL.md是唯一必需的文件,其他都是辅助。但

专业的Skill和入门级Skill的差距,恰恰就在这些辅助文件里

能跑 vs 专业:一个对比

用两个真实案例来说明差距。

案例 A:入门级 Skill(aihot)

这是一个查询AI资讯的Skill,核心功能正确,结构也算清晰。它的frontmatter长这样:

---
name: aihot
description: AI HOT 资讯查询 Skill。当用户想知道"今天 AI 圈有什么"时使用。
---

工作流部分只有一段核心命令:

since=$(date -u -v-24H +%Y-%m-%dT%H:%M:%SZ)
curl -s "https://aihot.virxact.com/api/public/items?mode=selected&since=$since"

能用吗?完全能用。

239行代码,11KB大小,功能完整。

案例 B:专业级 Skill(WeWrite)

同样是完成一个任务,WeWrite这个公众号写作Skill多了不少东西:

维度 入门级 (aihot) 专业级 (WeWrite)
Frontmatter name + description 完整元数据 + tags + related_skills + version
触发条件 一句话描述 20+ 触发关键词 + 反向触发词(何时

用)
工作流 1 个主路径 8 步流水线,每步有输入输出定义
错误处理 每个步骤有 fallback + 已知坑位手册
辅助文件 references/ (7个文档) + scripts/ (5个脚本) + personas/ (人格库)
验证方法 手动测试 自动化质量检查(禁用词扫描、human-ness 评分)
迭代机制 history.yaml 记录每篇文章的元数据,避免重复

文件大小:11KB vs 103KB+。

不是故意写长,而是每个字节都在解决一个实际问题。

专业 Skill 的五个关键维度

1. Frontmatter:Agent 决定是否加载你的 Skill 的唯一依据

这是最重要,也最容易被忽视的部分。

Agent在加载Skill之前,只能看到frontmatter里的 namedescription

如果这两个字段写得不好,你的Skill就像一本没有封面的书——再好也没人打开。

入门级写法:

---
name: my-skill
description: 帮我做 X 事
---

问题在于:太泛了。"帮我做X事"可以匹配任何请求,结果要么是

过度触发

(在不该用的时候被加载),要么是

触发不准

(在该用的时候没被选中)。

专业级写法:

---
name: commit-message-generator
description: |
  Use when the user wants to generate conventional commit messages based on
  staged git changes. Covers feat/fix/docs/refactor/test/chore types.
  Triggers on: "commit message", "生成提交信息", "git commit", "提交说明".
  Do NOT use for: general text writing, PR descriptions, or changelogs.
version: 1.2.0
author: your-name
license: MIT
metadata:
  hermes:
    tags: [git, commit, conventional-commits, automation]
    related_skills: [github-pr-workflow, github-code-review]
---

关键改进在哪里:

  • description ≤ 1024 字符

    (Hermes硬性限制),但需要把触发条件写清楚
  • 明确反向触发词

    (Do NOT use for):减少误触发
  • 添加 metadata

    :tags用于分类检索,related_skills用于关联推荐
  • 版本号

    :方便后续迭代追踪

2. 结构化指令:让 Agent 能"按图施工"

入门级的指令通常是段落式的:

先拉数据,然后处理一下,最后输出

问题在于,Agent对"处理一下"的理解可能跟你完全不同。

专业级用的是

分步骤 + 表格 + 代码块

的组合。下面是一个工作流片段的写法示例——先定义参数表,再给命令:

参数 说明
端点 /api/public/items 主数据接口
mode selected 精选模式(默认)
since 动态计算 最近 24 小时
# 计算时间窗口(兼容 macOS 和 Linux)
if [[ "$OSTYPE" == "darwin"* ]]; then
  since=$(date -u -v-24H +%Y-%m-%dT%H:%M:%SZ)
else
  since=$(date -u -d '24 hours ago' +%Y-%m-%dT%H:%M:%SZ)
fi

curl -sH "User-Agent: $UA" \
  "https://example.com/api/public/items?mode=selected&since=$since&take=50"

输出格式

:JSON数组,每项包含 {id, title, category, url, published_at}。下一步将输出传入Step 2进行过滤。

注意这几个细节:

  • 表格定义参数

    :Agent不需要猜
  • 代码块可直接复制运行

    :不省略任何参数
  • 明确输出格式

    :下一步知道该怎么接
  • 兼容性处理

    :macOS和Linux的date命令不同

3. 错误处理:专业和业余的分水岭

入门级Skill假设一切顺利。专业级Skill假设

一定会出错

下面是一段pitfalls章节的写法示例——每个坑都按"现象→原因→处理"三段式展开:

Pitfall 1:API返回空结果

items 数组为空,但HTTP状态码是200。原因:时间窗口内无数据,或 since 参数格式错误。

# 检查返回是否为空
response=$(curl -s "...")
count=$(echo "$response" | python3 -c "import sys,json; print(len(json.load(sys.stdin)))")
if [ "$count" -eq 0 ]; then
  echo "⚠️ 无数据,尝试扩大时间窗至 7 天"
  since=$(date -u -v-7d +%Y-%m-%dT%H:%M:%SZ)
  # 重试...
fi

Pitfall 2:User-Agent 被 403

直接curl返回403 Forbidden。原因:API端点有UA黑名单。处理:所有curl必须带浏览器UA。

Pitfall 3:编码问题

中文显示乱码。原因:远程终端locale不是UTF-8。处理:传递数据用纯ASCII JSON文件,不在命令行中硬编码中文。

专业Skill的pitfalls不是事后补的,而是边写边记录的。

每次踩坑就记一条,积累下来就是竞争力。

4. 辅助文件体系:把 SKILL.md 控制在合理大小

SKILL.md有

100,000字符的硬性限制

(约36K tokens)。超过这个值,Agent加载时就会截断。

当Skill复杂度上升时,解决方案不是把SKILL.md写得更长,而是

拆分到辅助文件

professional-skill/
├── SKILL.md                 # 核心(控制在 8-15K 字符)
├── references/
│   ├── api-reference.md     # API 完整文档
│   ├── error-codes.md       # 错误码对照表
│   └── best-practices.md    # 最佳实践
├── scripts/
│   ├── validate.sh          # 自动化验证脚本
│   └── deploy.sh            # 部署脚本
└── templates/
    └── output-template.md   # 输出模板

SKILL.md里只保留简短引用指向细节,比如API文档部分可以这样写:

详见 `references/api-reference.md`,覆盖以下端点:
- 数据采集(3 个端点)
- 内容发布(2 个端点)
- 媒体上传(1 个端点)
端点 用途 认证
/api/data 数据采集
/api/publish 发布内容 OAuth
/api/media 上传图片 OAuth

原则:SKILL.md放决策逻辑和关键路径,references放参考信息,scripts放可执行逻辑。

5. 验证机制:能自动检查就不要靠人眼

专业Skill都有自检能力。最基础的是

验证清单

,发布前逐项确认:

  • [ ] Frontmatter 以 --- 开头,无前导空白行
  • [ ] name ≤ 64 字符,仅小写字母 + 连字符
  • [ ] description ≤ 1024 字符,包含触发词 + 反向触发词
  • [ ] 所有代码块可直接复制运行(已实测)
  • [ ] curl 命令都带了正确的 User-Agent
  • [ ] 时间窗口计算兼容 macOS 和 Linux
  • [ ] pitfalls 至少覆盖 3 个已知错误场景
  • [ ] 总文件大小 ≤ 100,000 字符
  • [ ] related_skills 引用的 Skill 确实存在

进阶做法是写一个

自动化验证脚本

#!/usr/bin/env python3
"""Skill 质量检查工具"""
import yaml, re, pathlib

def validate_skill(skill_path: str) -> dict:
    path = pathlib.Path(skill_path)
    content = path.read_text()
    
    issues = []
    
    # 检查 1: frontmatter 格式
    if not content.startswith("---"):
        issues.append("❌ 必须以 --- 开头")
    
    # 检查 2: description 长度
    fm = yaml.safe_load(content.split("---")[1])
    desc_len = len(fm.get("description", ""))
    if desc_len > 1024:
        issues.append(f"❌ description {desc_len} 字符,超过 1024 限制")
    
    # 检查 3: 代码块数量(教程型 Skill 要求 ≥ 5)
    code_blocks = re.findall(r"```[\s\S]*?```", content)
    if len(code_blocks) < 5:
        issues.append(f"⚠️ 只有 {len(code_blocks)} 个代码块,建议 ≥ 5")
    
    # 检查 4: 是否有 pitfalls 章节
    if "## Common Pitfalls" not in content and "## pitfalls" not in content.lower():
        issues.append("⚠️ 缺少 pitfalls 章节")
    
    return {
        "skill": skill_path,
        "valid": len([i for i in issues if i.startswith("❌")]) == 0,
        "issues": issues,
        "stats": {
            "size_chars": len(content),
            "code_blocks": len(code_blocks),
            "has_pitfalls": "pitfalls" in content.lower(),
        }
    }

if __name__ == "__main__":
    import sys, json
    result = validate_skill(sys.argv[1] if len(sys.argv) > 1 else "SKILL.md")
    print(json.dumps(result, indent=2, ensure_ascii=False))

运行效果:

$ python3 validate_skill.py SKILL.md
{
  "skill": "SKILL.md",
  "valid": true,
  "issues": [],
  "stats": {
    "size_chars": 12458,
    "code_blocks": 7,
    "has_pitfalls": true
  }
}

实战:从零写一个专业 Skill

理论讲完了,动手写一个。场景:

Git提交信息自动生成器

第一步:创建目录结构

mkdir -p commit-gen/{scripts,references,templates}
touch commit-gen/SKILL.md

第二步:写 Frontmatter

---
name: commit-message-generator
description: |
  Use when user wants to generate conventional commit messages from staged
  git changes. Supports feat/fix/docs/refactor/test/chore/style/ci/perf/revert
  types. Triggers on: "commit message", "提交信息", "git commit", "生成提交",
  "commit msg". Do NOT use for: PR descriptions, changelogs, release notes.
version: 1.0.0
author: your-name
license: MIT
metadata:
  hermes:
    tags: [git, commit, conventional-commits, automation]
    related_skills: [github-pr-workflow]
---

第三步:写核心工作流

Skill的主体部分从获取diff开始。如果没有staged变化,先提示用户 git add

git diff --cached --no-color

然后根据变更内容判断commit type:

变更特征 type 示例
新功能/新文件 feat feat: add user login endpoint
Bug 修复 fix fix: null pointer in auth middleware
文档变更 docs docs: update API reference
重构(不改变行为) refactor refactor: extract validation logic
测试相关 test test: add coverage for auth flow
构建/CI 相关 ci ci: upgrade node version to 20
性能优化 perf perf: reduce DB queries by 50%

生成的commit message遵循Conventional Commits规范:第一行 type(scope): subject(≤ 50字符),第二行空行,正文可选(说明why不是what),页脚可选(Breaking Change / Closes #123)。示例输出:

feat(auth): add OAuth2 Google login

- Integrate with Google Identity Platform
- Support token refresh flow
- Add unit tests for token validation

Closes #42

最后用户确认后执行:

git commit -e -F /tmp/commit-msg.txt

第四步:补充 Pitfalls 和 Checklist

Pitfall 1:空diff

— 用户忘记 git add 就触发了Skill。处理:检测staged变化数量,为0时提示而非报错。

Pitfall 2:subject过长

— Conventional Commits建议subject ≤ 50字符。处理:生成后自动检查长度,超长则拆分。

Pitfall 3:scope歧义

— 同一个diff可能涉及多个模块。处理:取变化文件最多的目录作为scope,或省略scope。

Verification Checklist:

  • [ ] 支持 9 种 commit type
  • [ ] subject 长度检查(≤ 50 字符)
  • [ ] 空 diff 优雅降级
  • [ ] -e flag 允许用户编辑
  • [ ] 兼容 Git 2.0+

运行验证:

python3 scripts/validate_skill.py commit-gen/SKILL.md

这就是一个完整的、专业的Skill scaffold。

从这里出发,根据实际需求迭代即可。

从能跑到专业的检查清单

最后,给你一个速查表。下次写Skill的时候逐项打勾:

层次 检查项 入门 专业
Frontmatter name/description 清晰
包含触发词 + 反向触发词
有 version/author/metadata
结构 分步骤工作流
表格定义参数
代码块可直接运行 ⚠️
明确输入输出格式
鲁棒性 有 pitfalls 章节
覆盖 ≥ 3 个错误场景
兼容性处理(OS/版本)
工程化 拆分 references/
有验证脚本
有历史记录机制
总工作量 30 分钟 2-4 小时

结论:入门级Skill解决"能不能做",专业级Skill解决"能不能稳定地做100次"。

如果你的Skill只用一次,入门级就够了。但如果它会被反复调用、给别人用、或者承载关键业务流程,花时间做到专业级是值得的——回报是调试时间的数量级减少。

本文基于Hermes Agent Skill系统(hermes.nousresearch.com)和WeWrite公众号流水线的实战经验写成。文中所有代码片段均可直接复制运行。

相关下载