Pixiu Agent 工程手记以一个真实项目为载体的 agent 工程实战书

所有观点都长在 pixiu 上，每个结论都能在源码里验证

算判分工

pixiu 负责确定性"算"，LLM 负责综合"判"。15 条硬纪律用代码约束 LLM 的判断边界。

工具描述是给模型看的 prompt。颗粒度分层、错误可操作、危险操作主动收权。

用可证伪实验对付非确定性。画像 eval 20%→100%，裁判飘分布不均的发现。

连续失败熔断，根治 scheduler 空转一整夜。瞬时/可自修正/需用户/未预期四层分流。

双引擎架构、单人 CI（ruff 415→0，83 passed）、空壳识别、配置三层。

你和 AI 的协作沿"许愿→划边界→驾驭→元驾驭"演进，用执行比重进行时观察。