Skip to content

第 14 章 · 驾驭曲线

pixiu 锚点:docs/lab/C1-yoke-curve.md(驾驭曲线自观,贯穿全程) 元方法:用"执行比重"进行时观察你的协作阶段

开篇:你和 agent 的协作,会演进

这本书讲了这么多技术——算判分工、工具、循环、eval、熔断、工程。但有一个更上位的问题,贯穿始终却很少被正面讨论:你和 agent(或者说,你和 AI 编程助手)的协作关系,本身也在变化。

一开始你可能什么都想让 AI 干("许愿式")。被坑几次后,你开始给它画边界("划边界")。再后来你学会了驾驭它("驾驭式")。最后你甚至能让它帮你反思方法论("元驾驭")。

这就是旧手记提过的"驾驭曲线"四阶段:许愿 → 划边界 → 驾驭 → 元驾驭。 这一章用 pixiu 半年的真实经历,讲这条曲线长什么样——而且 pixiu 的实验对它做了一个重要修正。

旧手记的曲线是"回望式"的

旧手记的驾驭曲线,是一种回望式归纳——"到了山顶回头看,才发现自己走了四个阶段"。这种方式有个问题:它只能事后给你贴标签,没法进行时地告诉你"我现在在哪、下一步往哪走"。

我在 pixiu 的 lab 里专门做了个课题 C1,想验证一件事:这条曲线能不能进行时观察?有没有当下的指标,能告诉我我处在哪个阶段?

pixiu 的修正:用"执行比重"进行时观察

C1 的结论是:能。 而且提出了一个具体的进行时指标——执行比重

什么叫执行比重?就是在你跟 AI 助手(在 pixiu 的开发里,就是 Claude Code)的协作里,谁承担的"执行"更多

我把 pixiu 开发全程的每个课题都做了自观,记录"这一段协作是谁主导、谁执行":

课题协作模式
R1(鲁棒性)驾驭式:骨架/决策人定,AI 执行
Q1(CI 清债)驾驭式:AI 执行多,人决策(清债策略/范围)
E1-E2(eval 框架)驾驭式:框架设计人主导
E3(非确定性实验)驾驭式;反直觉发现 AI 跑出、人解读(向元驾驭苗头)
R2(熔断)驾驭式;端到端证据 AI 跑出、人解读

共同模式:全程都是"驾驭式",但 AI 的执行比重在递增——早期(R1)我手把手,后期 AI 跑实验、做核实,我退到"解读 + 决策 + 兜底"。

这个观察修正了旧手记的曲线命题:

  1. "执行比重"是阶段指标:AI 承担执行的比例越高(人越退到解读/决策/兜底),越接近元驾驭。
  2. 演进是渐进的,不是阶段跳跃:pixiu 全程都在"驾驭式",没有某一天突然"进入元驾驭"。执行比重是慢慢从人向 AI 迁移的。
  3. 进行时指导价值:自观执行比重,你能感知"我是不是该放更多给 AI 了"——这比回望式的事后标签有用得多。

pixiu 半年弧线就是这条曲线

把 pixiu 的半年演进摆出来,你会发现它本身就是驾驭曲线的实证:

早期(许愿 → 划边界)。 pixiu 一开始,我让 agent 干很多事——包括直接执行买卖。结果就是第 4 章那个血的教训:agent 把真实持仓搞乱了。这次事故把我从"许愿式"踢进了"划边界"——我把买卖权收回来,agent 降级只读,加 15 条硬纪律,加熔断,加 eval。边界的每一道,都是被现实教训出来的。

中期(驾驭)。 我学会了把 agent 的能力切分清楚——算判分工、工具粒度分层、循环加护栏、上下文分层注入。这一阶段,我主导设计,AI 助手帮我实现。pixiu 的主体架构(core/tools/pipeline)就是这一阶段的产物。

后期(元驾驭苗头)。 到了 lab 体系(E1-E4、R1-R2、Q1-Q2、C1),事情变了——我开始让 AI 帮我跑实验、做核实,而我退到"解读数据 + 提炼命题"。最典型的是 E3:那个"极好输入飘最厉害"的反直觉发现,是 AI 跑 5 次打分跑出来的,我负责把它解读成"分层要按可判定性"的修正命题。这就是元驾驭的苗头——让 AI 不只执行,还帮我产出认知。

而 C1 这个课题本身(汇总全程自观、提炼修正命题),就是一次完整的元驾驭动作——我退到"跨课题解读",AI 提供各片段素材。

这对你的指导意义

为什么这条曲线对你有用?因为它给了你一个进行时的自检

  • 如果你现在什么都让 AI 干、被坑了也不知道怎么收——你在"许愿"阶段,该开始划边界了。
  • 如果你的 AI 助手只做体力活、所有判断都是你拍——你在"驾驭",可以试着放一些探索性的活给它(让它跑实验、做核实)。
  • 如果你的 AI 已经能跑实验产出数据、你只做解读——你摸到"元驾驭"了。

关键不是你现在标在哪个阶段,而是执行比重的方向——你是不是在逐渐把更多"执行"放给 AI,同时把"解读和决策"留给自己。如果你发现自己一直在手把手,那可能不是 AI 不行,是你没敢放。

诚实地说:pixiu 还没到元驾驭

C1 的自观很诚实:pixiu 全程都在"驾驭式",只是有元驾驭的苗头,没真正进入。因为真正的元驾驭,需要 AI 能自主地、可信地帮你做认知生产——而 pixiu 的经验里,AI 跑实验可以,但"解读成什么命题"始终是人拍板的。

这不是谦虚,是实事求是。驾驭曲线不是个要赶紧通关的游戏,它是个渐进的迁移。知道自己在迁移的哪个位置,比急着标"我到元驾驭了"重要。

这一章的工具:执行比重自检

  • [ ] 你现在的协作,"执行"主要在谁手里?(全你做 / 全 AI 做 / 各占一半)
  • [ ] 你被 AI 坑过吗?坑完之后你画边界了,还是继续许愿?
  • [ ] 你有没有把"探索性"的活(跑实验、做核实、出数据)交给 AI?还是只让它干确定的实现?
  • [ ] "解读和决策"是不是还牢牢攥在你手里?(这是对的,但要意识到这是你的职责)
  • [ ] 你的执行比重,这半年有在往 AI 迁移吗?(没有的话,是 AI 不行,还是你没敢放?)

小结

驾驭曲线讲的不是技术,是你跟 AI 协作关系的演化。旧手记用回望式给了四个阶段标签,pixiu 用"执行比重"这个进行时指标修正了它——曲线不是跳跃的阶段,是执行比重从人向 AI 渐进迁移的过程。

而 pixiu 半年的弧线本身就是这条曲线:从让 agent 干所有事(许愿)、到被教训后画边界(15 条纪律 + 熔断 + eval)、到驾驭 AI 做实现、到让 AI 跑实验产出认知(元驾驭苗头)。

这本书的所有技术细节,本质上都是这条曲线"划边界"和"驾驭"阶段的产物——每一道护栏、每一条纪律、每一个 eval,都是我学会"怎么跟 AI 共事"的痕迹。

接下来

结语 · 从 pixiu 看 agent 工程的边界 —— 以及 pixiu 还没解决的那些问题。