主题
附录 A · pixiu 标注体系速查
pixiu 在
docs/lab/里建了一套研究标注体系。每个标注背后都是一个"假设→实验→数据→结论"的真实故事。本附录是速查表。
标注前缀含义
| 前缀 | 含义 | 范畴 | 典型出处 |
|---|---|---|---|
| R | Robustness / 韧性 | 鲁棒性默认化、熔断 | R1 llm.py/tushare_provider.py;R2 llm.py 熔断器 |
| E | Eval / 验证 | eval 实验 | pixiu/eval/、docs/lab/E1-E4 |
| Q | Quality / 质量 | CI、空壳识别 | docs/lab/Q1(CI)、Q2(空壳) |
| C | Curve / 驾驭曲线 | 元层自观 | docs/lab/C1(贯穿全程) |
| W | Wave / 巡检波次 | 巡检挖出的问题 | docs/lab/findings.md(W1-W5) |
标注子项(findings.md 里的问题编号)
R 系列(韧性)
- R1-1:tushare 7 个 fetch 加
@provider_retry(频率超限不重试) - R1-2:
llm.py裸 OpenAI 无 timeout/retry →make_llm_client工厂(timeout=60, max_retries=3) - R1-7:修正命题——装饰器难被 lint 强制,工厂可强制
- R2 / R2-1:client 熔断
CircuitOpenError(5次/60s/半开)+ scheduler 上层识别优雅跳过
E 系列(eval)
- E1:EDD 闭环在金融叙事分维度适用(结构化直接,叙事需支撑)
- E2:三种打分手段决策表;同模型裁判偏差未充分验证
- E3:裁判飘分布不均(极好 std0.31 / 极差 std0),按可判定性分层
- E4:~20 处模块级可变状态是"隐藏队列",eval 卫生
Q 系列(质量)
- Q1:单人 CI 价值;ruff 债务 415→0、Actions 45s 全绿 83 passed
- Q1-1:
except:pass藏 config 未定义(静默失败),ruff F821 抓出 - Q2:空壳识别(系统识别法核实调用链闭合)
C 系列(驾驭曲线)
- C1:驾驭曲线自观;修正命题——"执行比重"是进行时阶段指标,演进渐进非跳跃
W 系列(巡检波次,精选)
- W1-1:Web 端点 4-59s(先证伪:本地远端 RTT vs 生产同机,非 bug)
- W1-7:
memory.py save_summary死代码删除 - W2-5:画像注入 eval 20%→100%
- W2-6:会话→记忆反向缺口(加
remember工具) - W2-7:悬空 tool_calls 致 400(多 tool_call 卡住补占位)
- W3-1/3/5:工具粒度(run_backtest→compare→sweep),service 有工具层没暴露
- W3-3E/W3-5E:自主回测决策 eval 100% pass
- W4-1:概念板块受 Tushare 套餐权限限制
- W5-2:toggle_pipeline 不持久化 → 加状态文件
怎么用这个体系
每个标注都是可追溯的——在 pixiu 的 docs/lab/ 找对应笔记(R1/E3/Q1...),或在 findings.md 找 W 系列。笔记里有完整的"手记原命题 → 可证伪假设 → 实验设计 → 数据 → 结论 → 修正命题"。
这本书引用标注时,标的都是真实存在的笔记/代码。你可以按图索骥去 pixiu 仓库验证。