自蒸馏:如何从个人素材中提取可执行 Axiom

一套经过验证的方法论,让 Agent 从用户的日记、文章、复盘中提取底层决策约束,写入 SOUL.md。

问题

用户给 Agent 喂了日记、文章、复盘,期望 Agent “像我”。

常见做法是让 AI 总结一遍,得到一堆”回顾+感想”。结果:Agent 今天像用户,明天又回到共识答案模式。

根因:缺少结构化的底层决策约束(Axiom)。没有 Axiom,Agent 每次都在猜。

核心概念

Axiom 的定义

Axiom = 跨时间、跨场景、在压力下也不该背叛的底层决策约束。

判定规则

通过不通过
”新方案先做小规模实测,再决定是否固化""要保持学习”
能直接约束下一步行为只是观点或感想
跨场景成立(工作+生活+投资)只在单一场景出现

一句话:不能改变明天日程表的,不是 Axiom。

Axiom vs 观点 vs 策略

观点:好听,可转发,不改变行为         → 不录入
策略:阶段性有效,可能过期             → 录入为中优先级,定期复审
Axiom:跨时间跨场景稳定,约束决策      → 录入 SOUL.md,人类确认后生效

方法:分层蒸馏法

Step 1 · 素材分类

将用户素材按来源类型拆分,不混看。

categories:
  - name: 每日日记
    contains: 情绪、决策现场、当天发生的事
    weight_hint: 行为证据最强,但噪声也最多
    
  - name: 长文输出
    contains: 结构化表达、长期思考、公开发表的文章
    weight_hint: 文笔可能掩盖真实行为模式
    
  - name: 项目复盘
    contains: 真实结果、踩坑记录、成败分析
    weight_hint: 最可靠的行为验证来源

为什么要分:文笔强的素材会压过行为真实发生的素材。日记里写”今天没忍住吃了火锅”比文章里写”我很注重饮食”更真实。

Step 2 · 权重分层

tiers:
  - level: high
    criteria: 近1年 + 出现≥3次 + 跨≥2个场景
    action: 进入 Axiom 候选池
    
  - level: mid  
    criteria: 1-2年内出现,阶段性稳定
    action: 标记为策略,不升格,90天后复审
    
  - level: low
    criteria: 早年偶发,只出现一次
    action: 仅作风格参考,不参与决策

关键原则:不搞平均主义。人的想法在持续演进,5年前说过一次的话不能和上周反复出现的模式同等对待。

Step 3 · 交叉验证

每个候选 Axiom 必须过三道关:

Gate 1: 跨时间 → 早年出现 AND 近期也出现?
Gate 2: 跨场景 → 在≥2个不同领域(工作/生活/投资/健康)出现?
Gate 3: 可执行 → 能写成"当X时,做Y"的约束句?

Result: 三关全过 → 升格为 Axiom
        任一不过 → 降级或保留为策略

Step 4 · 任务回测(验证闭环)

Axiom 写入后不算完,需要回测:

- 拿最近5个真实决策场景
- 检查:如果当时有这条 Axiom,决策会不会不同?
- 若能改变决策 → 保留
- 若不改变任何决策 → 降级,说明不是真正的约束

输出格式

最终产出写入 SOUL.mdAGENTS.md

## Axiom

**A1. 把手弄脏。**
体验优先于理论。方案再好看也只是猜想,先做了再说。

**A2. 认知天花板决定工具上限。**
AI 是放大器不是替代品。保持自己的思考独立性。

**A3. 反内耗,先放一放。**
卡住了不硬刚,放手后往往自然解决。

格式要求

  • 约束句,不是描述句
  • 每条附一句解释(给 Agent 理解上下文)
  • 编号便于引用(“根据 A1,这件事应该先试再定”)

实测数据

本方法在以下素材上验证通过:

优先级来源数量产出
🔴 最高GitHub 日记23 篇全量提取,命中 8/10 条 Axiom
🟡 高近两年文章30 篇全量提取,补充 2 条 + 交叉验证
🟢 低早年文章45 篇仅提取跨时间稳定特征,0 条新增
合计98 篇10 条 Axiom,写入 SOUL.md

处理耗时:约 6 小时(含并行 sub-agent 调度)。

权限边界

⚠️ 关键约束:
- Agent 可以提议新 Axiom,但不可以自行写入
- Axiom 的新增/修改/删除必须经人类确认
- Agent 可以自由读取和引用 Axiom 做决策
- 这条规则本身也是一条 Axiom

常见错误

错误后果修正
把所有素材同等加权早年偶发想法污染 Axiom 池严格三层权重
跳过交叉验证把阶段性情绪当成底层约束三关全过才升格
只提取不回测Axiom 看起来对但不改变行为必须跑任务回测
让 Agent 自己改 Axiom约束系统失去人类锚定人类确认才生效

相关资源

半胆浣熊

文科生,不会代码,但很幸运 —— 赶上了 AI 的年代。
这里是我的实战学习笔记。

← 返回文章列表