首页 > 教程攻略 > ai资讯 >写个 Hook 截胡大模型：将零散的 AI 对话重塑为本地知识资产

写个 Hook 截胡大模型：将零散的 AI 对话重塑为本地知识资产

来源：互联网时间：2026-06-11 13:58:31

一

同时开着好几个 Claude Code 的会话窗口。

一个在推敲怎么为独立开发的 App 接入用户反馈功能，一个在创建 logging-session skill，还有一个，正在基于 Obsidian 仓库中的工作资料，生成给领导的演讲稿。每个窗口都聊了多轮，调整代码、优化流程、纠正语感。

说实话，人并不是擅长多线程处理的生物，但在 AI 时代，为了不在等待模型「吐字」的间隙去无脑刷微博，被迫习惯了同时开几个窗口「压榨」时间。

不过伴随而来的问题，是对过程的记忆会变得相当模糊。也许最终会实现这个反馈功能，有一个好用的 skill，拿出一份能交差的演讲稿，但过程中和 AI 对于实现方案的探讨、权衡取舍、最终的妥协，都会在关闭终端的那一刻抛诸脑后。

另一方面，有定期复盘的习惯。当前复盘的上下文，来自 dailylog 文档、番茄钟数据以及 GitHub 上的 commit 记录。基于这些信息，能够让 AI 帮助总结出每周的成果，但仍然缺乏对于实现细节的分析。

在 AI 工具中产生的对话，是当下最真实的工作快照，但很少有人会去翻看它们，并且包含多轮交互的对话，期间夹杂着大量执行记录，并不适宜阅读。

面对这种算力与心力的双重浪费，于是决定写一个工具。它必须能在每次对话结束时，自动把「问了什么、想了什么、结果是什么」无感提取并保存下来。

二

保存会话的方式得满足两个条件。第一，支持记录多个项目的会话，独立开发、Obsidian 仓库或是自建的 skill，这些不同路径的项目会话应当能统一保存并加以区分；第二，得方便检索，而不是在一堆文本文件里 grep。

一开始也想过存 Markdown，每个项目一个文件夹，每次对话写一个文件。但试了试发现不行，一旦想跨项目做聚合，比如「过去 7 天做了什么」，就得写脚本遍历所有文件夹、解析每个文件的前置元数据、再拼接在一起。太折腾了。

也考虑过 JSON，一个项目一个大数组，往里追加就行。但 JSON 文件读多了要全量加载到内存，而且查「项目 A 最近 7 天的 bugfix 有几个」这种条件查询，还是得写代码遍历。

最终选了 SQLite。一个数据库文件，一张表，所有项目的会话记录都在里面。想查「这周项目 A 做了什么」，一条 SQL 搞定。而且 SQLite 是单文件数据库，放在 Obsidian 的 vault 里，iCloud 自动同步，走到哪都能用。

每次会话存储的信息，应当包括以下几个方面：

标识信息，比如唯一性 id，创建时间，项目名称，git commit 的哈希值；
完整内容，包括提出的问题，Agent 的思考过程，以及最终输出的结果；
关联性（parent_id），有些会话是上一次的延续，串起来才能看到完整的线索；
分类（task_category），bugfix、feature、refactor 之类，后面做统计的时候按分类汇总很方便。

CREATE TABLE dev_logs (
    id INTEGER PRIMARY KEY AUTOINCREMENT,
    created_at DATETIME DEFAULT CURRENT_TIMESTAMP,
    project_name TEXT NOT NULL,
    session_id TEXT NOT NULL,
    parent_id INTEGER DEFAULT NULL,
    task_category TEXT,
    user_query TEXT NOT NULL,
    thought_process TEXT,
    final_result TEXT,
    file_paths TEXT,
    git_hash TEXT,
    extra_metadata TEXT
);

git commit 的哈希值本来是一个顺手记录的信息，但它居然真的发挥了作用：在 Claude Code 中使用 rewind 命令多返回了一个 checkpoint，导致最后一次提交的内容也被撤销了。

通过会话记录查询到了当时提交的 commit 哈希值，AI 在本地的 reflog 中找到了记录，并帮助恢复了文件改动。

三

想好了存哪，存什么，还得解决怎么存。

部分环境信息可以通过脚本来生成和获取，比如唯一性 id、项目名称等等，但 Agent 的执行过程只有它自己最清楚。

让 Claude Code 写了一个叫 logging-session 的 skill。在这份操作手册里写清楚了，对话结束时要提炼哪些字段、怎么生成会话 ID、项目名从哪里获取、查询脚本怎么调用。

实际效果是这样的。对话结束，输入 /logging-session，Claude Code 会自动从当前对话中提炼出三个东西：用户的问题是什么、中间的思考过程是怎样的、最终做到了什么。然后生成一个会话 ID，从当前目录拿到项目名和 git hash，调用写入脚本，一条记录就存进数据库了。

比如刚修完一个登录页的 bug，记录下来长这样：

python3 scripts/sa ve_log.py 
   --db ~/Library/Mobile Documents/.../dev_knowledge.db 
   --project "my-app" 
   --session "20260514_a3f2" 
   --query "修复登录页面特殊字符崩溃" 
   --thought "排查发现是正则表达式写错，特殊字符匹配时抛出未捕获异常" 
   --result "修改了 src/auth/validator.ts 中的正则" 
   --category "bugfix" 
   --files src/auth/validator.ts

查的时候更简单。想看这周做了什么，一条命令出结果，还能直接导出成 Markdown 文件塞进 Obsidian。

python3 scripts/query_logs.py 
   --db ~/Library/Mobile Documents/.../dev_knowledge.db 
   --project "my-app" 
   --days 7 
   --format markdown

输出是按日期分组的 Markdown，每个条目包含问题、思考过程和结果。导出的效果大概长这样：

## 2026-05-14
### 修复登录页面特殊字符崩溃- 项目：my-app- 分类：bugfix
思考过程：排查发现是正则表达式写错，特殊字符匹配时抛出未捕获异常
最终结果：修改了 src/auth/validator.ts 中的正则
---### JWT 迁移到 session 方案- 项目：my-app- 分类：refactor
思考过程：先试了无状态方案但与权限中间件冲突，换有状态方案，踩了 Cookie SameSite 的坑
最终结果：完成迁移，修改了 src/middleware/auth.ts 和 src/config/session.ts

直接在 Obsidian 里就能看。如果想把每周的总结存下来，加一个 --output 参数指定文件路径，Markdown 文件就直接写进 Obsidian vault 了。

使用过程中，观察到一个有趣的现象：让 Agent 执行一个分阶段的任务，要求它每次执行完之后停止并等待指令。在它停止后，手动执行 logging-session 。

在同一个会话中连续重复这一过程 3 次后，它在第 4 次直接执行了 skill 中的脚本，甚至没有调用 skill 本身。

这大概率是因为当前会话上下文中「对话结束 -> 调用记录工具」这种高度重复的模式，让模型在预测下一个动作时，「调用工具」这一行为的概率被历史记录无限放大。虽然这让模型看起来很「聪明」，仿佛已经具备了主观能动性，但却造成了麻烦——仍然手动执行了 skill，导致会话记录重复，反倒显得迟钝一点。

到这里，手动记录的链路跑通了。但有个问题，手动记录靠的是人记得去执行。而人，是会忘的。

四

需要让记录变成一个不需要人记得的动作。

Claude Code 有一个 hooks 机制，可以在特定事件发生时触发自定义行为。其中有一个事件叫 Stop，在 Claude 完成回复时触发。一开始想的是，在对话结束时自动跑一段 shell 脚本，把记录写进去。但翻了翻文档发现，command 类型的 hook 拿不到对话上下文，它只能执行固定的 shell 命令。没法让一段 shell 脚本去「理解」对话内容再提炼成摘要。如果用 command hook，最多只能写一条占位记录，写着「Session ended」，聊胜于无。

后来发现还有 prompt 类型的 hook。它不是跑脚本，而是把一段指令塞给模型，让模型自己判断该不该放行。返回 {"ok": true} 就放行，返回 {"ok": false, "reason": "..."} 就拦截，reason 会作为下一轮的指令发给 Claude。这就有意思了。

方案是这样的。当 Claude Code 准备结束对话时，Stop hook 拦住它，告诉它「你还没记录会话，先去跑 /logging-session，跑完再来结束」。Claude Code 收到这条指令，就会继续工作，自动执行 /logging-session 做总结。

但这里有个坑。Stop 事件不只是主动结束对话时触发，Claude 每次回复完都会触发一次。也就是说，如果 hook 每次都返回「不行，去记录」，Claude 就会在每一轮对话结束后都试图去跑 /logging-session，陷入无限循环。

所以得有一个判断机制。Claude Code 的 Stop hook 设计里自带了一个字段叫 stop_hook_active，第一次触发时是 false，当 hook 返回 {"ok": false} 后，下一次触发时这个字段就变成 true。在 hook 的指令里写清楚了这个规则，第一次 Stop 拦截，第二次 Stop 放行。

从用户的角度看就是，每次会话结束，Claude Code 自动多做一步记录，然后才退出。全程不需要手动操作。

具体配置放在 ~/.claude/settings.json 里，类型是 prompt，让模型自己判断是否放行。

{
  "hooks": {
    "Stop": [
      {
        "hooks": [
          {
            "type": "prompt",
            "prompt": "你是一个负责检查会话是否真正可以结束的守卫……n1. 第一次触发（stop_hook_active 为 false），返回 {"ok": false}，要求执行 /logging-sessionn2. 第二次触发（stop_hook_active 为 true），返回 {"ok": true}，放行"
          }
        ]
      }
    ]
  }
}

这个两阶段机制听起来有点绕，但实际用起来是无感的。正常对话，该结束就结束。唯一的区别是，结束前会多出一条消息，Claude Code 告诉你它已经把这次会话记录下来了，顺手给出一个记录 ID。

配置完 hook 之后每次会话记录都会自动写入本地数据库，没有一次需要手动输入 /logging-session。以前不记录是常态，记录需要额外操作。现在反过来了，记录是自动发生的，不记录才需要额外干预。

当然也有边界情况。比如只是在对话里问了一个简单的问题，不涉及任何编码，hook 也会触发，Claude Code 也会记录一条。这种记录没什么信息量，但也不碍事，查询的时候按 task_category 筛掉就行。如果觉得烦，可以在 skill 的操作手册里加一条规则，只记录有实际编码操作的对话。

以及正在使用的 Copilot CLI，它的 hook 机制则不像 Claude Code 这样强大，不支持 command 类型的 hook，就只能在每次对话结束后，自己手动触发了。

五

SQLite 数据库中存储的信息并不能直接查阅，需要借助专门的软件比如 Na vicat，或是 VSCode 插件、命令行，然而希望能有更加轻量快捷的方式。

之前介绍过的个人 dashboard，可以查看 dailylog 笔记和番茄钟数据，这次将和 AI 对话的记录也加了进去。

终

现在每次结束对话，Claude Code 都会自动帮助沉淀会话内容。那些之前关掉终端就忘了的工作过程，现在都在数据库里，下周复盘的时候跑一条命令就能翻出来。

这本质上还是之前那篇《数据主权：Obsidian 的本地存储在 AI 时代更香了》背后思考的延续。

番茄钟数据存本地 SQLite，能自己做统计页面对比时间开销；Dailylog 在本地 Markdown 文件里，用脚本就能按需查询；现在，AI 的对话记录也回到了本地。它们共同遵循着一个极其朴素的原则——

先有数据，再用 AI 加工

。数据必须攥在自己手里，加工方式才能随心所欲。如果数据被锁在云端，AI 再强也只是空中楼阁，因为连取回数据的自由都没有。

回头审视，无论是 dailylog 中的灵光一闪、番茄钟里的时间刻度，还是现在数据库里与 AI 的思维碰撞，在探索 AI 的过程中，不自觉地将自己尽可能「数字化」了。它们不仅是工作的产物，更是数字生命的快照。

这也许就是拥抱 AI 的方式吧。

写个 Hook 截胡大模型：将零散的 AI 对话重塑为本地知识资产

一

二

三

四

五

终

先有数据，再用 AI 加工

相关阅读

相关下载