1. 项目目标

本项目用于研发一套可在立体仓库中执行自主巡检任务的四足机器人系统,完成以下三项核心能力:

  1. 自主导航巡逻。
  2. 识别货位出入仓状态。
  3. 扫描纸箱二维码并回传结果。

本方案按 DIY 和二次开发路线设计,不从零自研四足关节执行器,而是基于成熟四足平台完成上层机械、电气、算法和业务系统集成。

2. 适用边界

  • 适用于地面相对平整、但存在门槛、接缝、小障碍、狭窄通道的立体仓环境。
  • 适用于货架高度约 6 米到 10 米的多层货架。
  • 适用于“到点停车后扫描”的巡检模式,不追求边走边完成高精度识别。
  • 适用于纸箱二维码贴在箱体正面或侧前方下半部的作业规范。

如果仓库地面长期平整、通道固定且不需要跨越小障碍,轮式 AMR 加升降相机通常成本更低。本方案默认业务场景明确要求四足机器人。

3. 总体设计原则

  • 四足底盘只负责稳定移动与站姿调整,不承担高精识别的主要压力。
  • 高位识别问题优先通过桅杆、云台和贴码规范解决,不先堆算法。
  • 移动中只做低功耗导航和避障,停稳后再开启高负载视觉识别。
  • 库存判定不只依赖视觉结果,必须与 WMS 数据联动。
  • 先做可验证 MVP,再扩展自动充电、远程运维和异常识别能力。

4. 系统总体架构


WMS / 调度后台
  -> 任务下发
  -> 库存校验
  -> 异常告警
  -> 结果查询

四足机器人本体
  -> 四足底盘
  -> Jetson 边缘计算主机
  -> 3D LiDAR
  -> 深度相机
  -> 2 轴云台
  -> 光学变焦相机
  -> LED 补光
  -> 电源管理模块
  -> Wi-Fi / 5G 通信

ROS 2 软件栈
  -> 底盘驱动
  -> SLAM 与定位
  -> 导航规划
  -> 云台控制
  -> 视觉识别
  -> 任务状态机
  -> 数据上报

5. 推荐硬件基线

5.1 底盘

  • 推荐选型:成熟四足开发平台,例如 Unitree Go2 开发型或教育型。
  • 目标要求:

– 有 ROS2 或 SDK 接口。

– 有稳定的站姿控制与速度控制接口。

– 有不低于 3 kg 的有效载荷余量。

5.2 感知与计算

  • 主算力:Jetson Orin NX 16GB
  • 主导航雷达:Livox Mid-360
  • 近距感知:RealSense D435i 或 OAK-D
  • 高位扫描:

– 2 轴云台

– 10x 或 20x 光学变焦工业相机

– 轻型桅杆,建议提升 0.8 米到 1.2 米

– LED 常亮补光灯

5.3 通信与供电

  • 通信:Wi-Fi 6 为主,预留 5G 回传接口
  • 存储:NVMe SSD
  • 供电:从机器人电池分路,经独立 DC-DC 模块输出 24V / 12V / 5V

详细硬件清单见 [01_BOM 清单.md](/E:/programdata/Seafile/AI/stock/ 四足机器人立体仓巡检项目 /01_BOM 清单.md)。

6. 软件方案

6.1 基础平台

  • Ubuntu 22.04
  • ROS 2 Humble
  • 厂商 SDK + ROS2 bridge

6.2 导航定位

  • 建图与定位:FAST-LIO2
  • 路径规划:Nav2
  • 辅助重定位:AprilTag 或反光板地标

6.3 视觉识别

  • 箱体 / 空货位检测:YOLOv8
  • 二维码区域定位:YOLOv8 小模型或规则检测
  • 二维码解码:WeChat QRCode / ZBar
  • 深度占用判断:基于深度图或点云的货位占用分析

6.4 业务逻辑

  • 状态机:BehaviorTree.CPP
  • 数据通信:MQTT + HTTP API
  • 本地缓存:断网缓存、失败重传、任务断点续传

详细软件拆分见 [02_软件架构.md](/E:/programdata/Seafile/AI/stock/ 四足机器人立体仓巡检项目 /02_软件架构.md)。

7. 巡检业务流程


WMS 下发任务
  -> 机器人前往指定区域
  -> 到达货架点位
  -> 停稳
  -> 云台按预设俯仰角扫描
  -> 识别货位码 / 箱体 / 二维码
  -> 结合深度结果判断是否占位
  -> 与 WMS 当前账面数据比对
  -> 生成正常记录或异常记录
  -> 继续下一个点位
  -> 低电量时返航充电

8. 关键工程约束

8.1 载荷约束

  • 新增感知、结构与电源总重量建议控制在 3.0 kg 到 4.5 kg。
  • 云台、桅杆和相机尽量轻量化,避免机器人高速移动时俯仰晃动过大。

8.2 识别策略约束

  • 不在运动中做高分辨率二维码识别。
  • 扫描时必须先停稳并保持相机曝光稳定。
  • 箱码必须有贴码规范,否则算法投入会快速放大。

8.3 仓库改造约束

  • 货架两端应布设 AprilTag 或反光定位标记。
  • 无线网络需覆盖主要通道。
  • 自动充电区要预留清晰进出路径。

9. MVP 版本定义

第一阶段最小可行版本只要求完成以下闭环:

  1. 四足机器人在测试通道内自主到点。
  2. 到点后完成多角度扫描。
  3. 输出 ` 货位码 + 箱码 + 现场图片 `。
  4. 与简单 WMS 数据表对比后生成异常结果。

不在 MVP 阶段强制实现:

  • 全仓大规模调度
  • 自动充电桩联动
  • 复杂破损检测
  • 远程运维平台

10. 成功验收标准

  • 导航成功率:测试路线 20 个连续点位,自主到点成功率不低于 95%。
  • 识码成功率:规范贴码前提下,停车扫描二维码识别率不低于 95%。
  • 货位判定准确率:占位 / 空位判断准确率不低于 95%。
  • 业务闭环:可识别至少三类异常:

– 账面有货但现场为空

– 账面无货但现场有箱

– 货位箱码与账面不一致

11. 文档结构

  • [00_项目总方案.md](/E:/programdata/Seafile/AI/stock/ 四足机器人立体仓巡检项目 /00_项目总方案.md)
  • [01_BOM 清单.md](/E:/programdata/Seafile/AI/stock/ 四足机器人立体仓巡检项目 /01_BOM 清单.md)
  • [02_软件架构.md](/E:/programdata/Seafile/AI/stock/ 四足机器人立体仓巡检项目 /02_软件架构.md)
  • [03_实施计划.md](/E:/programdata/Seafile/AI/stock/ 四足机器人立体仓巡检项目 /03_实施计划.md)

12. 下一步建议

建议按以下顺序继续推进:

  1. 先做固定相机台架实验,验证二维码视角、焦距和补光。
  2. 再采购四足平台,先跑通建图与导航。
  3. 最后上背负式云台和桅杆,完成整机集成。

# 立体仓四足巡检机器人 BOM 清单

1. 说明

本清单按 MVP 到工程样机的研发路线编制,目标是支持一台四足机器人完成立体仓巡检演示与试点验证。

价格按 2026 年中常见市场区间做粗估,只用于立项和采购优先级排序,不作为正式报价依据。

2. 核心设备清单

类别 推荐项 数量 说明
四足底盘 Unitree Go2 开发型或教育型 1 提供移动底盘和 SDK
边缘计算主机 Jetson Orin NX 16GB 工控套件 1 负责 SLAM、导航、视觉推理
主导航雷达 Livox Mid-360 1 3D 建图与定位
深度相机 RealSense D435i 或 OAK-D 1 近距避障和占位判断
变焦相机 10x 或 20x 工业 block camera 1 扫描高位纸箱二维码
2 轴云台 轻型俯仰 + 旋转云台 1 控制扫描角度
轻型桅杆 碳纤或铝型材桅杆 1 提升相机安装高度
LED 补光 常亮补光灯 1 保证识码稳定性
SSD 1TB NVMe SSD 1 本地日志和图像缓存
电源模块 多路 DC-DC 电源板 1 输出 24V / 12V / 5V
网络模块 Wi-Fi 6 / 5G CPE 1 无线回传
背板与减振件 定制安装件 1 套 固定传感器与主机

3. 预算分级

3.1 MVP 低配方案

适合先做算法闭环和通道验证。

项目 估算金额
四足底盘 3 万到 6 万元
Jetson Orin Nano / NX 套件 0.5 万到 1.2 万元
Mid-360 0.6 万到 1.0 万元
深度相机 0.2 万到 0.5 万元
云台 + 变焦相机 0.5 万到 1.5 万元
桅杆、补光、安装结构 0.3 万到 0.8 万元
电源、存储、线缆 0.2 万到 0.5 万元
合计 5.3 万到 11.5 万元

3.2 工程样机方案

适合进入仓内试点。

项目 估算金额
四足底盘 5 万到 8 万元
Jetson Orin NX 工控套件 0.8 万到 1.5 万元
Mid-360 0.8 万到 1.2 万元
深度相机 0.3 万到 0.6 万元
高质量云台 + 变焦相机 1.0 万到 2.5 万元
桅杆、补光、减振结构 0.5 万到 1.2 万元
电源、存储、通信 0.4 万到 1.0 万元
备件与调试耗材 0.3 万到 0.8 万元
合计 9.1 万到 16.8 万元

4. 关键采购要求

4.1 四足底盘

  • 必须有开发接口和二次开发文档。
  • 必须支持外接计算主机。
  • 必须确认背载条件、重心约束和接口供电能力。

4.2 云台与相机

  • 优先选可通过串口、VISCA 或 ONVIF 控制的型号。
  • 云台自重越小越好。
  • 尽量避免直接使用重型球机,重量和供电压力都偏大。

4.3 结构件

  • 桅杆要兼顾轻量和刚性。
  • 相机安装点要预留调俯仰和调水平的微调机构。
  • 背板要考虑减振和防松。

5. 载荷预算建议

模块 目标重量
主机 + SSD + 散热 1.0 kg 到 1.5 kg
Mid-360 0.3 kg 左右
深度相机 0.1 kg 到 0.2 kg
云台 + 变焦相机 0.6 kg 到 1.2 kg
桅杆与安装件 0.5 kg 到 1.0 kg
电源与线束 0.3 kg 到 0.6 kg
合计 2.8 kg 到 4.8 kg

目标是将新增载荷控制在 3.0 kg 到 4.5 kg 区间内。

6. 建议先买什么

如果资金有限,优先级建议如下:

  1. 云台相机台架实验所需设备
  2. 主算力平台
  3. 主导航雷达
  4. 四足底盘
  5. 桅杆和整机结构件

原因是高位识别视角问题应先于整机集成验证,否则容易在机器人采购后才发现视觉方案不成立。


# 立体仓四足巡检机器人软件架构

1. 软件目标

软件系统需要支撑以下闭环:

  1. 接收巡检任务。
  2. 控制四足机器人到达指定货架点位。
  3. 控制云台扫描货架。
  4. 识别货位、箱体、二维码和空位状态。
  5. 回传结构化结果和现场图片。
  6. 与 WMS 校验后输出异常。

2. 推荐技术栈

  • 操作系统:Ubuntu 22.04
  • 中间件:ROS 2 Humble
  • 状态机:BehaviorTree.CPP
  • 感知推理:PyTorch / TensorRT
  • 视觉处理:OpenCV
  • 二维码解码:WeChat QRCode / ZBar
  • 通信协议:MQTT + HTTP API
  • 数据缓存:SQLite 或本地文件队列

3. ROS 2 节点划分


robot_base_node
  -> 底盘状态读取
  -> 速度控制
  -> 姿态控制

slam_localization_node
  -> LiDAR + IMU 输入
  -> FAST-LIO2
  -> 地图与位姿输出

navigation_node
  -> Nav2
  -> 目标点导航
  -> 避障与局部规划

ptz_control_node
  -> 云台旋转控制
  -> 变焦控制
  -> 预置位管理

inspection_vision_node
  -> 图像采集
  -> 箱体检测
  -> 二维码定位
  -> 解码
  -> 深度占位分析

task_manager_node
  -> 接收任务
  -> 调度导航与扫描
  -> 状态切换
  -> 结果汇总

backend_gateway_node
  -> MQTT 上报
  -> HTTP 请求
  -> 本地缓存与重传

4. 感知流程

4.1 导航感知

  • Mid-360 提供 3D 点云。
  • IMU 提供姿态辅助。
  • 深度相机补充近距离障碍信息。
  • 仓库端地标用于长廊重定位。

4.2 视觉识别流程


机器人到点停车
  -> 云台移动到扫描角度
  -> 抓取当前帧
  -> 箱体 / 空货位检测
  -> 二维码候选区域定位
  -> 局部裁剪增强
  -> 二维码解码
  -> 多帧结果投票
  -> 输出货位检查结果

4.3 库存判断逻辑

输入:

  • 当前点位对应货位码
  • 视觉识别出的箱码
  • 深度占位结果
  • WMS 当前账面记录

输出:

  • 正常在位
  • 账面有货但现场为空
  • 账面无货但现场有箱
  • 现场箱码与账面不一致
  • 识码失败待人工复核

5. 状态机设计

建议使用 BehaviorTree.CPP 或等价状态机框架实现。


待机
  -> 接收任务
  -> 前往起始点
  -> 巡检点导航
  -> 到点停稳
  -> 云台扫描
  -> 视觉识别
  -> 结果上报
  -> 下一个点位
  -> 低电量返航
  -> 充电完成后续巡

6. 接口建议

6.1 WMS 下发任务

POST /api/robot/tasks

示例字段:


{
  "task_id": "task_20260630_001",
  "area_code": "A",
  "route_points": ["A-01", "A-02", "A-03"],
  "priority": "normal"
}

6.2 巡检结果上报

POST /api/robot/inspection-results

示例字段:


{
  "task_id": "task_20260630_001",
  "point_id": "A-01",
  "location_code": "A-01-03",
  "occupancy": "occupied",
  "box_code": "BOX202606300001",
  "status": "mismatch",
  "image_url": "/images/task_20260630_001/A-01-03.jpg",
  "timestamp": "2026-06-30T10:00:00+08:00"
}

7. 算力分配建议

  • 运动中启用:

– SLAM

– Nav2

– 低频障碍感知

  • 到点后启用:

– 高清图像采集

– YOLO 检测

– 二维码定位与解码

– 图片上传

这样做的目的是降低 Orin 的持续热负载,避免长时间满载降频。

8. 日志与追溯

每次巡检建议保留以下记录:

  • 任务 ID
  • 时间戳
  • 机器人位姿
  • 点位编号
  • 货位码
  • 箱码
  • 占位状态
  • 原图或裁剪图路径
  • 识别耗时
  • 上报结果

9. MVP 软件交付范围

MVP 阶段只做以下模块:

  1. 底盘控制与导航
  2. 云台控制
  3. 二维码识别链路
  4. 简单占位判断
  5. WMS 简易接口
  6. 本地缓存与日志

暂不纳入:

  • 复杂异常行为分析
  • 多机器人调度
  • 自动地图更新
  • 远程诊断平台

# 立体仓四足巡检机器人实施计划

1. 项目阶段划分

本项目建议拆成四个阶段推进,每个阶段都有明确产出和验收标准,避免一次性集成过多变量。

2. Phase 1:视觉台架验证

2.1 目标

在不上机器狗的前提下,先验证高位扫描和二维码识别是否成立。

2.2 工作内容

  • 采购变焦相机、云台、补光和主机。
  • 搭建模拟货架和不同高度纸箱样本。
  • 测试不同俯仰角、焦距、曝光和补光条件。
  • 跑通二维码定位和解码链路。

2.3 产出

  • 扫描角度表
  • 贴码规范建议
  • 识别率测试报告
  • 相机与云台最终选型建议

2.4 验收标准

  • 在目标距离内,规范贴码二维码识别率不低于 95%。
  • 可明确给出是否必须加桅杆。

3. Phase 2:四足导航与建图

3.1 目标

完成四足机器人在模拟通道中的建图、定位和到点导航。

3.2 工作内容

  • 采购四足平台和 LiDAR。
  • 安装 Jetson 与基础电源系统。
  • 部署 ROS 2、FAST-LIO2、Nav2。
  • 在模拟仓道完成地图构建和点位导航。
  • 加入 AprilTag 或反光板做重定位。

3.3 产出

  • 仓道地图
  • 点位导航配置
  • 重定位方案
  • 巡检路线样例

3.4 验收标准

  • 连续 20 个点位导航成功率不低于 95%。
  • 长廊末端往返后无明显累计漂移失控。

4. Phase 3:整机集成

4.1 目标

将云台、相机、桅杆、补光和视觉算法整合到四足平台,完成“到点扫描”闭环。

4.2 工作内容

  • 设计背板、桅杆和减振结构。
  • 完成整机供电与线束布线。
  • 实现云台控制节点和扫描流程。
  • 打通导航、停车、扫描、识别、上报链路。

4.3 产出

  • 整机样机
  • 接线图
  • ROS2 节点部署说明
  • 巡检流程状态机

4.4 验收标准

  • 到点后 3 到 8 秒内完成一次扫描。
  • 单点可输出 ` 货位码 + 箱码 + 现场图片 `。

5. Phase 4:仓内试点

5.1 目标

在真实仓库中完成试点验证,并找到主要工程问题。

5.2 工作内容

  • 在真实通道验证网络覆盖。
  • 测试不同货架高度和贴码位置。
  • 对接简单 WMS 接口。
  • 验证异常识别和断点续传。

5.3 产出

  • 试点运行报告
  • 异常案例清单
  • 仓库改造建议
  • 下一阶段优化项清单

5.4 验收标准

  • 完成至少一条实际巡检路线的闭环。
  • 可识别三类基础库存异常。

6. 研发节奏建议

阶段 周期建议 关键目标
Phase 1 2 到 4 周 先证明视觉方案成立
Phase 2 3 到 6 周 跑通四足导航
Phase 3 3 到 5 周 完成整机闭环
Phase 4 2 到 6 周 真实仓内试点

7. 角色分工建议

最小团队建议如下:

  • 机器人软件工程师:负责 ROS2、SLAM、导航、状态机
  • 视觉算法工程师:负责箱体检测、二维码识别、深度占位判断
  • 机械电气工程师:负责背板、桅杆、供电、布线和安装
  • 后端工程师:负责 WMS 接口、结果落库和查询页面

如果人手有限,MVP 阶段至少要保证机器人软件、视觉算法、机械电气三类能力有人负责。

8. 主要风险与应对

8.1 视角风险

风险:

  • 高层货位二维码存在透视畸变,正面不可见。

应对:

  • 强制贴码规范。
  • 先做台架实验。
  • 需要时增加桅杆。

8.2 续航风险

风险:

  • 四足带载后续航不足。

应对:

  • 按分段巡检设计。
  • 视觉识别只在停车后开启。
  • 提前规划返航阈值。

8.3 散热风险

风险:

  • Orin 在夏季仓内高温环境下降频。

应对:

  • 使用独立散热器和风道。
  • 控制满载持续时间。

8.4 定位风险

风险:

  • 长廊重复结构导致 SLAM 漂移。

应对:

  • 仓道端部增加地标。
  • 巡检路径加入校准点。

9. 第一批文档和物料输出建议

完成本阶段后,建议继续补齐:

  1. 电气接线图
  2. 结构安装图
  3. ROS2 节点部署说明
  4. WMS 接口协议文档
  5. 试点测试用例清单