主题
所有观点都长在 pixiu 上,每个结论都能在源码里验证
pixiu 负责确定性"算",LLM 负责综合"判"。15 条硬纪律用代码约束 LLM 的判断边界。
工具描述是给模型看的 prompt。颗粒度分层、错误可操作、危险操作主动收权。
用可证伪实验对付非确定性。画像 eval 20%→100%,裁判飘分布不均的发现。
连续失败熔断,根治 scheduler 空转一整夜。瞬时/可自修正/需用户/未预期四层分流。
双引擎架构、单人 CI(ruff 415→0,83 passed)、空壳识别、配置三层。
你和 AI 的协作沿"许愿→划边界→驾驭→元驾驭"演进,用执行比重进行时观察。