Skip to content

附录 A · pixiu 标注体系速查

pixiu 在 docs/lab/ 里建了一套研究标注体系。每个标注背后都是一个"假设→实验→数据→结论"的真实故事。本附录是速查表。

标注前缀含义

前缀含义范畴典型出处
RRobustness / 韧性鲁棒性默认化、熔断R1 llm.py/tushare_provider.py;R2 llm.py 熔断器
EEval / 验证eval 实验pixiu/eval/docs/lab/E1-E4
QQuality / 质量CI、空壳识别docs/lab/Q1(CI)、Q2(空壳)
CCurve / 驾驭曲线元层自观docs/lab/C1(贯穿全程)
WWave / 巡检波次巡检挖出的问题docs/lab/findings.md(W1-W5)

标注子项(findings.md 里的问题编号)

R 系列(韧性)

  • R1-1:tushare 7 个 fetch 加 @provider_retry(频率超限不重试)
  • R1-2llm.py 裸 OpenAI 无 timeout/retry → make_llm_client 工厂(timeout=60, max_retries=3)
  • R1-7:修正命题——装饰器难被 lint 强制,工厂可强制
  • R2 / R2-1:client 熔断 CircuitOpenError(5次/60s/半开)+ scheduler 上层识别优雅跳过

E 系列(eval)

  • E1:EDD 闭环在金融叙事分维度适用(结构化直接,叙事需支撑)
  • E2:三种打分手段决策表;同模型裁判偏差未充分验证
  • E3:裁判飘分布不均(极好 std0.31 / 极差 std0),按可判定性分层
  • E4:~20 处模块级可变状态是"隐藏队列",eval 卫生

Q 系列(质量)

  • Q1:单人 CI 价值;ruff 债务 415→0、Actions 45s 全绿 83 passed
  • Q1-1except:pass 藏 config 未定义(静默失败),ruff F821 抓出
  • Q2:空壳识别(系统识别法核实调用链闭合)

C 系列(驾驭曲线)

  • C1:驾驭曲线自观;修正命题——"执行比重"是进行时阶段指标,演进渐进非跳跃

W 系列(巡检波次,精选)

  • W1-1:Web 端点 4-59s(先证伪:本地远端 RTT vs 生产同机,非 bug)
  • W1-7memory.py save_summary 死代码删除
  • W2-5:画像注入 eval 20%→100%
  • W2-6:会话→记忆反向缺口(加 remember 工具)
  • W2-7:悬空 tool_calls 致 400(多 tool_call 卡住补占位)
  • W3-1/3/5:工具粒度(run_backtest→compare→sweep),service 有工具层没暴露
  • W3-3E/W3-5E:自主回测决策 eval 100% pass
  • W4-1:概念板块受 Tushare 套餐权限限制
  • W5-2:toggle_pipeline 不持久化 → 加状态文件

怎么用这个体系

每个标注都是可追溯的——在 pixiu 的 docs/lab/ 找对应笔记(R1/E3/Q1...),或在 findings.md 找 W 系列。笔记里有完整的"手记原命题 → 可证伪假设 → 实验设计 → 数据 → 结论 → 修正命题"。

这本书引用标注时,标的都是真实存在的笔记/代码。你可以按图索骥去 pixiu 仓库验证。