最近做了一个给文章配图的 Codex Skill,让文章配图变成可复用的视觉系统
写技术文章最头疼的事情之一,就是配图。不是画不出来,而是画出来总不对劲:第一张还像手绘,第二张突然变成商业海报风格,第三张又成了3D渲染——风格完全不统一。更麻烦的是,你想让一个固定角色贯穿全文,可每次生成出来都像换了个人。而且,文章真正想传递的是某个判断、流程、坑点或取舍,配图却沦为泛泛的装饰画。
为了解决这些问题,最近有人在打磨一个专门的 Codex Skill(基于原版小黑 skill 二开)。它的思路很直接:先读完整篇文章,找出那些最适合视觉化的“认知锚点”,再把锚点转化为插图。这样一来,配图就不再是随机的装饰,而是内容的延伸。
这个 Skill 支持多条视觉 IP 路线,你可以根据文章主题自由切换:
- :默认路线,适合方法论、判断、流程、系统视角
小黑
- :纸盒角色,适合整理、收纳、交付、修补类隐喻
小盒
- :Rust 社区吉祥物,适合 Rust、系统工程、可靠性主题
Ferris
- :Go 语言吉祥物,适合 Go 技术文章
Go Gopher
- :连帽衫海豹,适合产品中立、评审、优先级、协作主题
Seal
- :适合 OpenClaw 相关工作流和项目解释
OpenClaw
下面是各 IP 的示例效果,可以直观感受一下不同角色的视觉风格:
| Xiaohei | Littlebox | Tom | Ferris | Seal | OpenClaw | Go Gopher |
|---|---|---|---|---|---|---|
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
当然,任何文章都可以使用任意 IP 形象,没有硬性标准,看个人偏好。
它输出的内容也很完整:一篇文章可以生成 4 到 8 张插图规划,每张图都会包含放置位置、画面主题、核心意思、角色动作、可见文字标签,最后再生成 PNG 图片。这里有两个关键优势:
第一,插图服务内容。优先画清楚一个判断、一个流程、一个状态变化,而不是单纯追求视觉好看。
第二,视觉 IP 可以长期复用。当同一个角色在多篇文章里反复出现,读者会慢慢建立熟悉感。对个人写作者、技术博客、产品团队来说,这种稳定的视觉语言能形成独特的品牌识别度。
安装与使用
安装非常简单,在终端里执行一行命令即可:
npx skills add yangchuansheng/visual-ip-illustrations --skill visual-ip-illustrations
使用方式更直接——在 Codex 中调用 Skill,然后把文章内容和期望的视觉 IP 交给它。例如:
- “用小黑给这篇文章生成 6 张正文插图。”
- “用 Go Gopher 给这篇 Go 技术文章做插图。”
- “用 Ferris 做一组 Rust 编译流程的解释图。”
这个项目已经开源,任何人都可以尝试。如果你经常写技术文章、产品文章、方法论文章,不妨拿来试试,看看在真实写作场景里会碰撞出什么效果。
配图这件事,未来应该会从一次性生成,慢慢变成一套可复用的视觉系统。这个项目就是朝这个方向的一次尝试。






