移动操作¶

移动操作（Loco-Manipulation）将运动控制和物体操作统一为一个全身控制问题。它不再将行走和抓取视为独立的能力，而是使机器人能够在环境中移动的同时与物体交互——开门、搬运物品、推开障碍物等。

为什么需要移动操作？¶

现实世界的任务需要同时具备移动性和灵巧性：

搬运箱子的机器人必须在保持抓取的同时稳定行走
开门需要协调底座移动与手臂/手部运动
清扫或整理房间意味着需要不断移动和操作物体

这些任务单凭运动控制或操作技能无法解决——它们需要全身协调。

问题定义¶

移动操作问题在标准运动控制的基础上扩展了操作目标：

观测空间（典型配置）：

本体感觉：基座位姿、关节状态（腿部 + 手臂/手部）
物体状态：相对位置、姿态、接触信息
任务目标：目标位置、期望物体状态

动作空间：

腿部关节目标（运动控制）
手臂关节目标（操作）
可选：手部/夹爪指令

奖励：结合运动质量和操作成功的多目标优化

\[ r = w_1 r_{\text{locomotion}} + w_2 r_{\text{manipulation}} + w_3 r_{\text{task}} \]

核心方法¶

层次化控制¶

将问题分解为多个层次：

graph TD
    TP[任务规划器] -->|子目标| HP[高层策略]
    HP -->|运动指令 + 手臂目标| LL[底层运动控制]
    HP -->|末端执行器目标| MA[操作控制器]
    LL --> LEGS[腿部关节]
    MA --> ARM[手臂关节]

高层策略：决定去哪里、抓什么
底层运动控制：预训练的行走控制器
操作控制器：预训练或基于 RL 的手臂控制器

优点：模块化，各组件可以独立训练

缺点：层间接口可能成为瓶颈，全身协调能力有限

端到端 RL¶

训练一个同时控制所有关节的单一策略：

\[ a_t = \pi_\theta(o_t), \quad a_t \in \mathbb{R}^{n_{\text{legs}} + n_{\text{arm}} + n_{\text{hand}}} \]

优点：表达能力最强，能发现涌现式的全身协调策略

缺点：训练更困难（动作空间大、多目标奖励），需要精心设计课程

混合方法¶

将预训练组件与端到端微调相结合：

分别预训练运动和操作策略
用这些组件初始化联合策略
在移动操作任务上进行端到端微调

这种方法越来越流行，因为它兼顾了训练效率和完整的协调能力。

代表性成果¶

移动操作平台¶

Spot + 机械臂（Boston Dynamics）：

四足机器人搭载 5 自由度机械臂
工业巡检、物品取回
经典控制与学习控制的组合

Mobile ALOHA（Stanford, 2024）：

移动底座搭载双 6 自由度机械臂
从遥操作数据中学习复杂的双臂移动操作
通过与多样化数据的协同训练提升泛化能力

人形移动操作¶

全身人形控制：

人形机器人（H1、Atlas、Figure）执行搬运物体、开门等任务
由于需要双足平衡和双臂协调，挑战尤为巨大
近期在大规模仿真 RL 训练中取得了显著进展

四足移动操作¶

四足 + 机械臂：运动控制 + 抓取/到达（Unitree B2 + Z1 机械臂）
四足使用腿部操作：某些方法直接使用腿部进行操作（如用前肢按按钮）

技术挑战¶

1. 操作力下的平衡维持¶

操作产生的力和力矩会扰动身体平衡：

举起重物改变质心位置
推拉产生侧向力
抓取时的接触力在全身传播

解决方案：在运动训练中加入操作扰动、使用鲁棒的奖励设计

2. 多目标奖励设计¶

平衡运动质量与操作成功率：

运动奖励过高 → 机器人行走良好但忽视操作
操作奖励过高 → 机器人够到了物体但摔倒

应对策略：自适应奖励权重、课程学习、拉格朗日方法处理约束满足

3. 接触丰富的交互¶

操作涉及复杂的接触动力学：

与物体建立/断开接触
滑动、滚动、枢转
柔性物体

这些在仿真中难以精确模拟，sim-to-real 迁移尤为困难。

4. 长时域任务¶

许多现实任务具有长时间尺度：

导航到物体 → 抓取 → 搬运 → 放置
每个阶段具有不同的动力学特征和要求

层次化方法或目标条件策略有助于分解长时域任务。

当前研究方向¶

语言条件移动操作：遵循自然语言指令（"从厨房桌上拿起红色杯子"）
双臂移动操作：在移动底座上协调两只机械臂
工具使用：行走时使用工具（如用棍子去够东西）
动态移动操作：在奔跑或跳跃中进行快速敏捷的操作

持续更新

随着该领域的进展，本节将补充更详细的算法分析和代码示例。

核心参考文献¶

Fu, Z., et al. (2023). "Deep Whole-Body Control: Learning a Unified Policy for Manipulation and Locomotion." CoRL.
Zhao, T.Z., et al. (2024). "Learning Fine-Grained Bimanual Manipulation with Low-Cost Hardware." RSS.
Ha, H., et al. (2024). "UMI on Legs: Making Manipulation Policies Mobile with Manipulation-Centric Whole-body Controllers." arXiv.
Portela, B., et al. (2024). "Learning Force-Based Manipulation of Deformable Objects from Multiple Demonstrations." ICRA.