第 14 章 · 驾驭曲线

pixiu 锚点：docs/lab/C1-yoke-curve.md（驾驭曲线自观，贯穿全程）元方法：用"执行比重"进行时观察你的协作阶段

开篇：你和 agent 的协作，会演进

这本书讲了这么多技术——算判分工、工具、循环、eval、熔断、工程。但有一个更上位的问题，贯穿始终却很少被正面讨论：你和 agent（或者说，你和 AI 编程助手）的协作关系，本身也在变化。

一开始你可能什么都想让 AI 干（"许愿式"）。被坑几次后，你开始给它画边界（"划边界"）。再后来你学会了驾驭它（"驾驭式"）。最后你甚至能让它帮你反思方法论（"元驾驭"）。

这就是旧手记提过的"驾驭曲线"四阶段：许愿 → 划边界 → 驾驭 → 元驾驭。 这一章用 pixiu 半年的真实经历，讲这条曲线长什么样——而且 pixiu 的实验对它做了一个重要修正。

旧手记的曲线是"回望式"的

旧手记的驾驭曲线，是一种回望式归纳——"到了山顶回头看，才发现自己走了四个阶段"。这种方式有个问题：它只能事后给你贴标签，没法进行时地告诉你"我现在在哪、下一步往哪走"。

我在 pixiu 的 lab 里专门做了个课题 C1，想验证一件事：这条曲线能不能进行时观察？有没有当下的指标，能告诉我我处在哪个阶段？

pixiu 的修正：用"执行比重"进行时观察

C1 的结论是：能。而且提出了一个具体的进行时指标——执行比重。

什么叫执行比重？就是在你跟 AI 助手（在 pixiu 的开发里，就是 Claude Code）的协作里，谁承担的"执行"更多。

我把 pixiu 开发全程的每个课题都做了自观，记录"这一段协作是谁主导、谁执行"：

课题	协作模式
R1（鲁棒性）	驾驭式：骨架/决策人定，AI 执行
Q1（CI 清债）	驾驭式：AI 执行多，人决策（清债策略/范围）
E1-E2（eval 框架）	驾驭式：框架设计人主导
E3（非确定性实验）	驾驭式；反直觉发现 AI 跑出、人解读（向元驾驭苗头）
R2（熔断）	驾驭式；端到端证据 AI 跑出、人解读

共同模式：全程都是"驾驭式"，但 AI 的执行比重在递增——早期（R1）我手把手，后期 AI 跑实验、做核实，我退到"解读 + 决策 + 兜底"。

这个观察修正了旧手记的曲线命题：

"执行比重"是阶段指标：AI 承担执行的比例越高（人越退到解读/决策/兜底），越接近元驾驭。
演进是渐进的，不是阶段跳跃：pixiu 全程都在"驾驭式"，没有某一天突然"进入元驾驭"。执行比重是慢慢从人向 AI 迁移的。
进行时指导价值：自观执行比重，你能感知"我是不是该放更多给 AI 了"——这比回望式的事后标签有用得多。

pixiu 半年弧线就是这条曲线

把 pixiu 的半年演进摆出来，你会发现它本身就是驾驭曲线的实证：

早期（许愿 → 划边界）。 pixiu 一开始，我让 agent 干很多事——包括直接执行买卖。结果就是第 4 章那个血的教训：agent 把真实持仓搞乱了。这次事故把我从"许愿式"踢进了"划边界"——我把买卖权收回来，agent 降级只读，加 15 条硬纪律，加熔断，加 eval。边界的每一道，都是被现实教训出来的。

中期（驾驭）。 我学会了把 agent 的能力切分清楚——算判分工、工具粒度分层、循环加护栏、上下文分层注入。这一阶段，我主导设计，AI 助手帮我实现。pixiu 的主体架构（core/tools/pipeline）就是这一阶段的产物。

后期（元驾驭苗头）。 到了 lab 体系（E1-E4、R1-R2、Q1-Q2、C1），事情变了——我开始让 AI 帮我跑实验、做核实，而我退到"解读数据 + 提炼命题"。最典型的是 E3：那个"极好输入飘最厉害"的反直觉发现，是 AI 跑 5 次打分跑出来的，我负责把它解读成"分层要按可判定性"的修正命题。这就是元驾驭的苗头——让 AI 不只执行，还帮我产出认知。

而 C1 这个课题本身（汇总全程自观、提炼修正命题），就是一次完整的元驾驭动作——我退到"跨课题解读"，AI 提供各片段素材。

这对你的指导意义

为什么这条曲线对你有用？因为它给了你一个进行时的自检：

如果你现在什么都让 AI 干、被坑了也不知道怎么收——你在"许愿"阶段，该开始划边界了。
如果你的 AI 助手只做体力活、所有判断都是你拍——你在"驾驭"，可以试着放一些探索性的活给它（让它跑实验、做核实）。
如果你的 AI 已经能跑实验产出数据、你只做解读——你摸到"元驾驭"了。

关键不是你现在标在哪个阶段，而是执行比重的方向——你是不是在逐渐把更多"执行"放给 AI，同时把"解读和决策"留给自己。如果你发现自己一直在手把手，那可能不是 AI 不行，是你没敢放。

诚实地说：pixiu 还没到元驾驭

C1 的自观很诚实：pixiu 全程都在"驾驭式"，只是有元驾驭的苗头，没真正进入。因为真正的元驾驭，需要 AI 能自主地、可信地帮你做认知生产——而 pixiu 的经验里，AI 跑实验可以，但"解读成什么命题"始终是人拍板的。

这不是谦虚，是实事求是。驾驭曲线不是个要赶紧通关的游戏，它是个渐进的迁移。知道自己在迁移的哪个位置，比急着标"我到元驾驭了"重要。

这一章的工具：执行比重自检

[ ] 你现在的协作，"执行"主要在谁手里？（全你做 / 全 AI 做 / 各占一半）
[ ] 你被 AI 坑过吗？坑完之后你画边界了，还是继续许愿？
[ ] 你有没有把"探索性"的活（跑实验、做核实、出数据）交给 AI？还是只让它干确定的实现？
[ ] "解读和决策"是不是还牢牢攥在你手里？（这是对的，但要意识到这是你的职责）
[ ] 你的执行比重，这半年有在往 AI 迁移吗？（没有的话，是 AI 不行，还是你没敢放？）

小结

驾驭曲线讲的不是技术，是你跟 AI 协作关系的演化。旧手记用回望式给了四个阶段标签，pixiu 用"执行比重"这个进行时指标修正了它——曲线不是跳跃的阶段，是执行比重从人向 AI 渐进迁移的过程。

而 pixiu 半年的弧线本身就是这条曲线：从让 agent 干所有事（许愿）、到被教训后画边界（15 条纪律 + 熔断 + eval）、到驾驭 AI 做实现、到让 AI 跑实验产出认知（元驾驭苗头）。

这本书的所有技术细节，本质上都是这条曲线"划边界"和"驾驭"阶段的产物——每一道护栏、每一条纪律、每一个 eval，都是我学会"怎么跟 AI 共事"的痕迹。

接下来

结语 · 从 pixiu 看 agent 工程的边界 —— 以及 pixiu 还没解决的那些问题。