共计 7230 个字符,预计需要花费 19 分钟才能阅读完成。
1. 手册定位
这份手册不是开发文档,也不是算法说明,而是给运营、采购、测试、业务负责人看的实际使用说明。
如果你现在的感觉是:
- 不知道从哪个页面开始看
- 不知道每个页面在看什么
- 不知道哪些结果能信,哪些只能观察
- 不知道什么时候可以进入审批或试点发布
就按这份手册使用。
2. 先记住系统边界
当前智能补货模块的真实定位是:
- ` 影子预测 `
- ` 质量评估 `
- ` 人工复核 `
- ` 受控试点发布 `
它 不是:
- 自动下采购单系统
- 默认替代旧 Dashboard 的正式补货系统
- 无人审批自动发布系统
当前固定边界:
- 默认不替代旧 Dashboard
- 默认不自动写正式备货结果
- 默认不允许批量正式发布
- 默认不允许无人审批自动 apply
- 离线 Benchmark 结果不能直接替代正式规则
如果你看到页面里有“智能建议”“影子预测”“Benchmark 更优”,也不能直接理解成“现在就可以用它替换旧备货结果”。
3. 进入方式与权限
3.1 页面入口
智能补货独立模块入口统一在:
- `/smart-replenishment/*`
3.2 权限说明
当前页面路由默认只对 admin 开放。
如果你能登录系统,但打不开这些页面,先确认:
- 当前账号是否有 `admin` 权限
- 是否已经正常登录
- 是否是从旧 Dashboard 误以为会自动跳转进智能补货模块
4. 页面成熟度说明
不是所有页面都代表“已经可以实际操作”。当前建议按下面理解:
4.1 已可实际使用页面
- `/smart-replenishment/overview`
- `/smart-replenishment/runs`
- `/smart-replenishment/compare`
- `/smart-replenishment/evaluation`
- `/smart-replenishment/benchmark`
- `/smart-replenishment/review`
- `/smart-replenishment/publish-gate`
- `/smart-replenishment/publish-audits`
- `/smart-replenishment/publish-precheck`
- `/smart-replenishment/approval-requests`
4.2 当前仍是占位 / 页面壳
- `/smart-replenishment/settings`
当前不要把 settings 当作正式运营配置后台使用。
5. 运营正确使用顺序
如果你是第一次用,或者每天只想知道“今天该先看什么”,固定按下面顺序:
- 先看 `overview`
- 再看 `compare`
- 再看 `evaluation`
- 再看 `review`
- 最后看 `publish-gate`
如果涉及正式试点审批,再继续:
- 看 `publish-audits`
- 进 `publish-precheck`
- 看 `approval-requests`
不要一上来就进审批页,也不要一上来就讨论 apply / rollback。
6. 页面逐页说明
6.1 总览页
页面:
- `/smart-replenishment/overview`
作用:
- 快速确认系统今天有没有跑
- 看最新运行情况
- 看当前 compare 数据覆盖范围
重点看:
- ` 最新 Run`
- ` 覆盖 SKU`
- ` 高差异条目 `
- ` 只读状态 `
业务理解:
- ` 最新 Run` 有值,说明今天链路有结果
- ` 覆盖 SKU` 越低,说明今天可观察范围越小
- ` 高差异条目 ` 多,不代表一定错,只代表需要优先人工看
- ` 只读状态 = read only`,说明本页不会改正式补货数据
适合回答的问题:
- 今天系统有没有跑
- 今天有没有新的影子结果
- 大概有多少 SKU 值得优先看
6.2 运行记录页
页面:
- `/smart-replenishment/runs`
作用:
- 查看每次智能补货运行记录
- 判断有没有运行失败
- 判断当前结果覆盖了哪些市场和日期
重点看:
- `run_key`
- `status`
- `run_type`
- ` 评估状态 `
- ` 作用范围 `
- ` 失败原因 `
业务理解:
- `status = success`:本轮运行成功结束
- `status = failed`:这一轮结果不能直接参考,先查失败原因
- ` 评估状态 ` 里的 `evaluated / data_insufficient` 很重要
- ` 作用范围 ` 能告诉你这轮是哪些市场、哪些锚点日期
适合回答的问题:
- 今天 EU/UK 有没有跑
- 当前 compare 对应的是哪一轮 run
- 为什么今天没有新结果
6.3 影子对比页
页面:
- `/smart-replenishment/compare`
作用:
- 对比“当前正式建议量”和“智能影子预测量”
- 帮运营先看差异和原因
这是运营最重要的页面之一。
重点看:
- `SKU`
- ` 站点 `
- ` 画像 / Provider`
- ` 正式建议 `
- ` 智能预测 `
- ` 差异 `
- ` 可信度 `
- `AWD 供给 `
- ` 原因标签 `
- ` 解释 `
字段怎么理解:
- ` 正式建议 `:当前旧系统正式补货链路的建议值
- ` 智能预测 `:智能补货影子链路给出的预测值
- ` 差异 > 0`:智能建议更激进
- ` 差异 <0`:智能建议更保守
- ` 可信度 `:当前数据口径是否足够可靠
- ` 原因标签 / 解释 `:系统给出的可解释原因,不是最终业务结论
正确看法:
- 先按 ` 站点 + 最小差异 ` 筛出高差异 SKU
- 再结合 ` 可信度 ` 判断值不值得花时间复核
- 不要只看差异量,要同时看解释
特别注意:
- EU/UK 在这里是诊断视图
- 共享池分摊仍以旧正式补货逻辑为准
- 单行差异不能直接当成最终采购量
推荐操作:
- 先筛 `Provider = rule_baseline`
- 再筛 `min_abs_diff >= 10`
- 优先看高差异 + 高可信度样本
6.4 预测质量评估页
页面:
- `/smart-replenishment/evaluation`
作用:
- 回答“智能结果到底准不准”
- 这是放大试点、引入 AI provider、放宽门禁的前置质量门
重点看:
- ` 样本数 `
- `WAPE`
- `Bias`
- `wQL@P50 / P75 / P90`
- `A 类 SKU 独立指标 `
- ` 数据不足原因 `
- ` 分组评估 `
字段怎么理解:
- `WAPE`:越低越好
- `Bias`:越接近 0 越好
- `wQL`:分位预测质量指标,越低越好
- `A 类 SKU`:高销量 / 核心 SKU,优先级最高
- `data_insufficient`:样本不足,不能据此扩大白名单
正确看法:
先看这三层:
- `T+7` 总体指标
- `A 类 SKU` 指标
- ` 数据不足原因 `
如果 A 类 SKU 还不稳定,或者 data_insufficient 很多,这一轮结果就只能继续 shadow 观察,不能据此推进发布。
6.5 离线 Benchmark 页
页面:
- `/smart-replenishment/benchmark`
作用:
- 对比离线 AI 模型和 `rule_baseline`
- 证明“AI 模型是否真的比当前规则更好”
它不是日常运营必须先看的页面。
重点看:
- `Benchmark WAPE`
- `Baseline WAPE`
- `WAPE Delta`
- ` 按窗口对比 `
- ` 按分组对比 `
字段怎么理解:
- `WAPE Delta <0`:Benchmark 优于 Baseline
- `WAPE Delta > 0`:Benchmark 差于 Baseline
特别注意:
- 这里的结果是离线导出、离线推理、结果回灌后的对比
- 结果不能直接进入正式发布
- 结果也不能自动替代当前正式补货规则
6.6 人工复核页
页面:
- `/smart-replenishment/review`
作用:
- 把影子预测解释成运营能理解的业务原因
- 记录人工确认、驳回、调整
- 沉淀结构化反馈
这是运营真正参与业务判断的核心页面。
页面分成三块:
- 左边 ` 复核队列 `
- 中间解释面板
- 右边复核表单
你要怎么用:
- 在左边选一个高差异 SKU
- 看正式建议、智能建议、差异、可信度
- 看解释面板里的原因
- 决定:
– 确认
– 驳回
– 调整
- 提交结构化原因和备注
这里还有两个附加区域:
- ` 需求驱动事件 `
- ` 商品关系候选审核 `
这两个区域的用法:
- ` 需求驱动事件 `:查看当前 SKU 是否存在促销、价格变化、广告等驱动
- ` 商品关系候选审核 `:把 suggested 候选人工通过或驳回
特别注意:
- 本页不会改正式 Dashboard 建议量
- 本页不会触发正式采购发布
- 本页的意义是“沉淀人工反馈”,不是“立即改正式结果”
6.7 发布门禁页
页面:
- `/smart-replenishment/publish-gate`
作用:
- 判断哪些影子预测具备进入试点条件
- 展示阻断原因
它不是发布按钮页面,而是门禁判断页面。
重点看:
- ` 模型状态 `
- ` 发布状态 `
- ` 白名单 `
- ` 评估窗口 `
- ` 阻断原因 `
- ` 建议动作 `
字段怎么理解:
- ` 模型状态 = 可试点 `:模型质量侧基本过关
- ` 发布状态 = 门禁放行 `:具备进入下一步流程资格
- ` 白名单 = 已启用 `:当前 SKU 在试点范围内
- ` 阻断原因 `:为什么现在不能继续往前
正确看法:
- `model_ready = true` 不代表现在就能正式发布
- `can_publish = true` 才表示门禁层面允许进入下一步
- 有 blocker 时,先解决 blocker,不要直接找技术说“帮我发一下”
6.8 发布审计页
页面:
- `/smart-replenishment/publish-audits`
作用:
- 查看 controlled publish 历史动作
- 查 dry-run、apply、rollback 记录
重点看:
- `action_type`
- `status`
- `run_id`
- `SKU`
- `Rollback`
- `reason_code`
动作怎么理解:
- `dry_run`:发布前预演
- `publish_apply`:试点正式写入
- `rollback_apply`:回滚执行
这个页面主要用来:
- 查历史记录
- 找某次预演对应的 `rollback point`
- 追踪谁做过什么动作
6.9 审批预检页
页面:
- `/smart-replenishment/publish-precheck`
作用:
- 对某一个 dry-run 包做正式审批前预检
重点注意:
这个页面不是自动给你列表,它需要你先输入:
- `rollback_point_id`
正确顺序是:
- 先去 `publish-audits` 找 dry-run 记录
- 找到对应的 `rollback point`
- 再把 `rollback_point_id` 带到本页做预检
本页重点看:
- `pilot_precheck`
- `blockers`
- `quality_risk_summary`
- `evaluation_requirement`
- `benchmark_requirement`
- `publish_limits`
正确看法:
- 通过预检,不等于已经发布
- 通过预检,只代表你可以进入审批申请阶段
6.10 审批申请页
页面:
- `/smart-replenishment/approval-requests`
作用:
- 查看审批申请
- 记录人工通过 / 驳回决策
重点看:
- `status`
- `rollback_point_id`
- `run_id`
- `sku`
- `market_name`
- `diff_qty`
- `restore_target`
- ` 申请原因 `
- ` 决策原因 `
状态怎么理解:
- `pending`:待审批
- `approved`:审批通过
- `rejected`:审批驳回
特别注意:
- 审批通过不等于已经发布
- 审批通过只是获得了下一步 apply 资格
- 当前链路要求双人审批,提交人和审批人不能是同一人
6.11 设置页
页面:
- `/smart-replenishment/settings`
当前状态:
- 页面壳
- 只适合验证入口和连通性
运营建议:
- 暂时不要把它当作正式配置中心使用
7. 运营最常见的 3 种使用场景
7.1 场景一:我只想知道今天哪些 SKU 值得看
操作顺序:
- 进 `overview`
- 看 ` 高差异条目 `
- 进 `compare`
- 用 `min_abs_diff >= 10`
- 优先处理高差异 + 高可信度 SKU
7.2 场景二:我想判断智能建议值不值得信
操作顺序:
- 进 `evaluation`
- 先看 `T+7`
- 再看 `A 类 SKU`
- 再看 ` 数据不足原因 `
- 有需要时再看 `benchmark`
判断原则:
- 指标稳定,才值得继续推进
- 样本不足,就继续 shadow
7.3 场景三:我想推进某个样本进入试点发布
操作顺序:
- 进 `publish-gate`
- 确认不是 blocked
- 去 `publish-audits` 找 dry-run 记录
- 拿到 `rollback_point_id`
- 进 `publish-precheck`
- 预检通过后,进入 `approval-requests`
- 完成双人审批
注意:
- 当前不是全量开放发布
- 只有受控试点才允许进入正式 apply / rollback
8. 哪些情况应该立刻停下来
出现下面情况,不要继续推进发布:
- `evaluation` 中样本明显不足
- `A 类 SKU` 指标恶化
- `publish-gate` 中 blocker 很多
- `publish-precheck` 中质量风险高
- `compare` 中 EU/UK 差异看起来异常但无法解释
- `review` 中业务大量驳回且原因集中在数据问题
这时正确动作是:
- 保持 shadow
- 记录问题
- 让技术或产品继续修口径 / 修数据 / 修规则
9. 当前最推荐的运营使用方法
如果你现在刚开始接手,最简单有效的方式就是:
每天固定看 4 个页面:
- `compare`
- `evaluation`
- `review`
- `publish-gate`
一句话理解:
- `compare`:看差在哪
- `evaluation`:看准不准
- `review`:留业务判断
- `publish-gate`:看能不能进试点
只要先把这 4 个页面用顺了,这套系统就已经能支撑日常观察、人工复核和试点推进。
10. 最后再记一次:不要误解系统阶段
当前智能补货模块已经能用,但它的“能用”是:
- 能观察
- 能对比
- 能评估
- 能复核
- 能受控试点
不是:
- 全量自动替代旧系统
- 自动正式发布
- 无人值守采购决策
运营在当前阶段最重要的职责不是“直接拿智能结果替代旧结果”,而是:
- 帮系统筛高价值样本
- 把业务判断结构化沉淀下来
- 协助识别哪些结果可以进入试点
- 协助识别哪些结果还必须继续 shadow