自蒸馏:如何从个人素材中提取可执行 Axiom
一套经过验证的方法论,让 Agent 从用户的日记、文章、复盘中提取底层决策约束,写入 SOUL.md。
问题
用户给 Agent 喂了日记、文章、复盘,期望 Agent “像我”。
常见做法是让 AI 总结一遍,得到一堆”回顾+感想”。结果:Agent 今天像用户,明天又回到共识答案模式。
根因:缺少结构化的底层决策约束(Axiom)。没有 Axiom,Agent 每次都在猜。
核心概念
Axiom 的定义
Axiom = 跨时间、跨场景、在压力下也不该背叛的底层决策约束。
判定规则:
| 通过 | 不通过 |
|---|---|
| ”新方案先做小规模实测,再决定是否固化" | "要保持学习” |
| 能直接约束下一步行为 | 只是观点或感想 |
| 跨场景成立(工作+生活+投资) | 只在单一场景出现 |
一句话:不能改变明天日程表的,不是 Axiom。
Axiom vs 观点 vs 策略
观点:好听,可转发,不改变行为 → 不录入
策略:阶段性有效,可能过期 → 录入为中优先级,定期复审
Axiom:跨时间跨场景稳定,约束决策 → 录入 SOUL.md,人类确认后生效
方法:分层蒸馏法
Step 1 · 素材分类
将用户素材按来源类型拆分,不混看。
categories:
- name: 每日日记
contains: 情绪、决策现场、当天发生的事
weight_hint: 行为证据最强,但噪声也最多
- name: 长文输出
contains: 结构化表达、长期思考、公开发表的文章
weight_hint: 文笔可能掩盖真实行为模式
- name: 项目复盘
contains: 真实结果、踩坑记录、成败分析
weight_hint: 最可靠的行为验证来源
为什么要分:文笔强的素材会压过行为真实发生的素材。日记里写”今天没忍住吃了火锅”比文章里写”我很注重饮食”更真实。
Step 2 · 权重分层
tiers:
- level: high
criteria: 近1年 + 出现≥3次 + 跨≥2个场景
action: 进入 Axiom 候选池
- level: mid
criteria: 1-2年内出现,阶段性稳定
action: 标记为策略,不升格,90天后复审
- level: low
criteria: 早年偶发,只出现一次
action: 仅作风格参考,不参与决策
关键原则:不搞平均主义。人的想法在持续演进,5年前说过一次的话不能和上周反复出现的模式同等对待。
Step 3 · 交叉验证
每个候选 Axiom 必须过三道关:
Gate 1: 跨时间 → 早年出现 AND 近期也出现?
Gate 2: 跨场景 → 在≥2个不同领域(工作/生活/投资/健康)出现?
Gate 3: 可执行 → 能写成"当X时,做Y"的约束句?
Result: 三关全过 → 升格为 Axiom
任一不过 → 降级或保留为策略
Step 4 · 任务回测(验证闭环)
Axiom 写入后不算完,需要回测:
- 拿最近5个真实决策场景
- 检查:如果当时有这条 Axiom,决策会不会不同?
- 若能改变决策 → 保留
- 若不改变任何决策 → 降级,说明不是真正的约束
输出格式
最终产出写入 SOUL.md 或 AGENTS.md:
## Axiom
**A1. 把手弄脏。**
体验优先于理论。方案再好看也只是猜想,先做了再说。
**A2. 认知天花板决定工具上限。**
AI 是放大器不是替代品。保持自己的思考独立性。
**A3. 反内耗,先放一放。**
卡住了不硬刚,放手后往往自然解决。
格式要求:
- 约束句,不是描述句
- 每条附一句解释(给 Agent 理解上下文)
- 编号便于引用(“根据 A1,这件事应该先试再定”)
实测数据
本方法在以下素材上验证通过:
| 优先级 | 来源 | 数量 | 产出 |
|---|---|---|---|
| 🔴 最高 | GitHub 日记 | 23 篇 | 全量提取,命中 8/10 条 Axiom |
| 🟡 高 | 近两年文章 | 30 篇 | 全量提取,补充 2 条 + 交叉验证 |
| 🟢 低 | 早年文章 | 45 篇 | 仅提取跨时间稳定特征,0 条新增 |
| 合计 | 98 篇 | 10 条 Axiom,写入 SOUL.md |
处理耗时:约 6 小时(含并行 sub-agent 调度)。
权限边界
⚠️ 关键约束:
- Agent 可以提议新 Axiom,但不可以自行写入
- Axiom 的新增/修改/删除必须经人类确认
- Agent 可以自由读取和引用 Axiom 做决策
- 这条规则本身也是一条 Axiom
常见错误
| 错误 | 后果 | 修正 |
|---|---|---|
| 把所有素材同等加权 | 早年偶发想法污染 Axiom 池 | 严格三层权重 |
| 跳过交叉验证 | 把阶段性情绪当成底层约束 | 三关全过才升格 |
| 只提取不回测 | Axiom 看起来对但不改变行为 | 必须跑任务回测 |
| 让 Agent 自己改 Axiom | 约束系统失去人类锚定 | 人类确认才生效 |
相关资源
- 方法论灵感:Context Infrastructure — yage.ai
- 人类版叙事:三部曲(一):你的 AI 为什么不像你?