具身智能研究基础¶

面向博士研究生的系统化学习资料

从强化学习基础到具身智能系统

欢迎！本资料是一份面向具身人工智能 (Embodied AI, EAI) 研究方向的综合性开源教学资源，旨在帮助博士研究生从零开始构建坚实的理论基础与系统视野。内容涵盖强化学习理论、世界模型、具身系统以及支撑大规模训练的分布式基础设施。

适合谁阅读？¶

本资料面向以下读者：

我们假设读者已具备以下背景：

RL 核心理论——MDP、贝尔曼方程、策略梯度、值函数方法、Actor-Critic、基于模型的 RL 以及离线 RL。掌握算法层面的基本构件。

了解智能体如何构建对世界的内部表示——从视频预测到学习动力学模型，再到前沿的基础世界模型。

运动控制、移动操作、遥操作系统，以及面向真实机器人学习的数据采集策略。

大规模 RL 训练——从 A3C 到 IMPALA 再到 SEED RL。理解支撑大规模 RL 实验的系统架构与框架。

本资料既可以作为教材按顺序阅读，也可以作为参考手册按需查阅。建议如下：

每个章节包含：

本资料持续更新。欢迎提交修正、建议或新内容——详见 GitHub 仓库。