自蒸馏：如何从个人素材中提取可执行 Axiom

问题

用户给 Agent 喂了日记、文章、复盘，期望 Agent “像我”。

常见做法是让 AI 总结一遍，得到一堆”回顾+感想”。结果：Agent 今天像用户，明天又回到共识答案模式。

根因：缺少结构化的底层决策约束（Axiom）。没有 Axiom，Agent 每次都在猜。

核心概念

Axiom 的定义

Axiom = 跨时间、跨场景、在压力下也不该背叛的底层决策约束。

判定规则：

通过	不通过
”新方案先做小规模实测，再决定是否固化"	"要保持学习”
能直接约束下一步行为	只是观点或感想
跨场景成立（工作+生活+投资）	只在单一场景出现

一句话：不能改变明天日程表的，不是 Axiom。

Axiom vs 观点 vs 策略

观点：好听，可转发，不改变行为         → 不录入
策略：阶段性有效，可能过期             → 录入为中优先级，定期复审
Axiom：跨时间跨场景稳定，约束决策      → 录入 SOUL.md，人类确认后生效

方法：分层蒸馏法

Step 1 · 素材分类

将用户素材按来源类型拆分，不混看。

categories:
  - name: 每日日记
    contains: 情绪、决策现场、当天发生的事
    weight_hint: 行为证据最强，但噪声也最多
    
  - name: 长文输出
    contains: 结构化表达、长期思考、公开发表的文章
    weight_hint: 文笔可能掩盖真实行为模式
    
  - name: 项目复盘
    contains: 真实结果、踩坑记录、成败分析
    weight_hint: 最可靠的行为验证来源

为什么要分：文笔强的素材会压过行为真实发生的素材。日记里写”今天没忍住吃了火锅”比文章里写”我很注重饮食”更真实。

Step 2 · 权重分层

tiers:
  - level: high
    criteria: 近1年 + 出现≥3次 + 跨≥2个场景
    action: 进入 Axiom 候选池
    
  - level: mid  
    criteria: 1-2年内出现，阶段性稳定
    action: 标记为策略，不升格，90天后复审
    
  - level: low
    criteria: 早年偶发，只出现一次
    action: 仅作风格参考，不参与决策

关键原则：不搞平均主义。人的想法在持续演进，5年前说过一次的话不能和上周反复出现的模式同等对待。

Step 3 · 交叉验证

每个候选 Axiom 必须过三道关：

Gate 1: 跨时间 → 早年出现 AND 近期也出现？
Gate 2: 跨场景 → 在≥2个不同领域（工作/生活/投资/健康）出现？
Gate 3: 可执行 → 能写成"当X时，做Y"的约束句？

Result: 三关全过 → 升格为 Axiom
        任一不过 → 降级或保留为策略

Step 4 · 任务回测（验证闭环）

Axiom 写入后不算完，需要回测：

- 拿最近5个真实决策场景
- 检查：如果当时有这条 Axiom，决策会不会不同？
- 若能改变决策 → 保留
- 若不改变任何决策 → 降级，说明不是真正的约束

输出格式

最终产出写入 SOUL.md 或 AGENTS.md：

## Axiom

**A1. 把手弄脏。**
体验优先于理论。方案再好看也只是猜想，先做了再说。

**A2. 认知天花板决定工具上限。**
AI 是放大器不是替代品。保持自己的思考独立性。

**A3. 反内耗，先放一放。**
卡住了不硬刚，放手后往往自然解决。

格式要求：

约束句，不是描述句
每条附一句解释（给 Agent 理解上下文）
编号便于引用（“根据 A1，这件事应该先试再定”）

实测数据

本方法在以下素材上验证通过：

优先级	来源	数量	产出
🔴 最高	GitHub 日记	23 篇	全量提取，命中 8/10 条 Axiom
🟡 高	近两年文章	30 篇	全量提取，补充 2 条 + 交叉验证
🟢 低	早年文章	45 篇	仅提取跨时间稳定特征，0 条新增
合计		98 篇	10 条 Axiom，写入 SOUL.md

处理耗时：约 6 小时（含并行 sub-agent 调度）。

权限边界

⚠️ 关键约束：
- Agent 可以提议新 Axiom，但不可以自行写入
- Axiom 的新增/修改/删除必须经人类确认
- Agent 可以自由读取和引用 Axiom 做决策
- 这条规则本身也是一条 Axiom

常见错误

错误	后果	修正
把所有素材同等加权	早年偶发想法污染 Axiom 池	严格三层权重
跳过交叉验证	把阶段性情绪当成底层约束	三关全过才升格
只提取不回测	Axiom 看起来对但不改变行为	必须跑任务回测
让 Agent 自己改 Axiom	约束系统失去人类锚定	人类确认才生效

问题