模型训练与回测结果持久化存储
背景
当前存储方式
- 训练产物:Qlib
R (Experiment Recorder) 默认写入本地目录(如 mlruns/)
- 回测产物:
run_grid.py 输出至 reports/grid_runs/<timestamp>/
summary.json:本次网格参数与窗口配置
results.jsonl:每个 job 的 recorder_id、HTML 报告路径、日志路径、状态
logs/*.log:训练/回测日志
- 模型/预测/回测 artifact:通过
R.save_objects() 等写入本地
问题
- 本地磁盘易占满,难以在多机/多环境共享
- 无统一元数据索引,不易检索、对比历史实验
- 缺乏结构化存储,无法高效做报表与可视化分析
目标
将模型训练与回测结果进行持久化存储,实现可扩展、可检索、可复现的实验管理:
- 文件存储(MinIO):模型权重、checkpoint、HTML 回测报告、日志等二进制/大文件,支持多机共享与版本追溯
- 元数据存储(PostgreSQL):实验配置、训练参数、回测指标(IC/IR、年化收益、最大回撤等)、关联路径索引,支持结构化查询与对比分析
计划
基础设施
训练流程接入
回测流程接入
查询
模型训练与回测结果持久化存储
背景
当前存储方式
R(Experiment Recorder) 默认写入本地目录(如mlruns/)run_grid.py输出至reports/grid_runs/<timestamp>/summary.json:本次网格参数与窗口配置results.jsonl:每个 job 的 recorder_id、HTML 报告路径、日志路径、状态logs/*.log:训练/回测日志R.save_objects()等写入本地问题
目标
将模型训练与回测结果进行持久化存储,实现可扩展、可检索、可复现的实验管理:
计划
基础设施
训练流程接入
train_lgb_alpha158_pit.py中,训练结束后将模型 artifact 上传至 MinIO回测流程接入
generate_html_report.py中,回测完成后将 HTML 报告、日志上传至 MinIOrun_grid.py中串联上述逻辑,确保每个 job 完成后自动持久化查询