跳转至

推荐阅读清单

精选教材、课程、博客和其他资源,帮助你深入拓展知识。按主题和难度等级组织。

教材

强化学习

书名 作者 难度 说明
Reinforcement Learning: An Introduction(第2版) Sutton & Barto, 2018 入门-中级 RL 圣经。建议先读 1-6 章,再按需选读。免费在线。
Algorithms for Decision Making Kochenderfer et al., 2022 中级 更广泛的决策视角,MDP 和 POMDP 讲解出色。免费在线。
Bandit Algorithms Lattimore & Szepesvari, 2020 高级 对探索-利用问题的严格理论处理。

深度学习

书名 作者 难度 说明
Deep Learning Goodfellow, Bengio, Courville, 2016 入门-中级 标准参考书。第 6-12 章与 RL 最相关。免费在线。
Dive into Deep Learning Zhang et al., 2023 入门 交互式、代码驱动。适合建立实现能力。中文版质量尤佳。
Understanding Deep Learning Prince, 2023 中级 新书,覆盖 Transformer、扩散模型等最新架构。免费在线。

机器人学

书名 作者 难度 说明
Modern Robotics Lynch & Park, 2017 中级 运动学、动力学、控制。具身智能的必备基础。
Probabilistic Robotics Thrun, Burgard, Fox, 2005 中级 定位、建图、SLAM。经典之作。
Robotics: Modelling, Planning and Control Siciliano et al., 2010 中级-高级 全面覆盖机器人控制理论。

中文资源推荐

  • 周志华《机器学习》(西瓜书):机器学习基础的优秀中文教材
  • 邱锡鹏《神经网络与深度学习》:免费在线,覆盖深度学习核心内容
  • 张伟楠等《动手学强化学习》:配合代码实践,适合入门

在线课程

强化学习

机器人与具身智能

数学基础

博客与技术写作

必读博客

  • Lilian Weng 的博客 — 对 RL、世界模型、机器人等主题极为清晰的技术阐述。推荐从 "A (Long) Peek into Reinforcement Learning" 开始。

  • The Gradient — ML/AI 研究趋势的长文分析与评论。

  • Berkeley AI Research Blog (BAIR) — UC Berkeley 的研究博客,覆盖 RL、机器人和 AI 系统。

  • Google DeepMind Blog — RL 突破性成果的高质量文章(AlphaGo、MuZero、Gemini)。

  • Hugging Face Blog — 开源模型和工具的发布动态,含大量实用教程。

研究方法论

  • "An Opinionated Guide to ML Research" — John Schulman。关于研究品味和执行力的实用建议。
  • "How to Read a Paper" — S. Keshav, 2007。论文阅读的三遍法。
  • "Mathematical Writing" — Donald Knuth。技术写作的永恒建议。

会议与期刊

具身智能的主要会议

会议 领域侧重 投稿截止
NeurIPS ML/AI(广泛) 5 月
ICML ML(广泛) 1 月
ICLR 表征学习、深度学习 9 月
CoRL 机器人学习(专注) 6 月
RSS 机器人(专注) 1 月
ICRA 机器人(广泛) 9 月
IROS 智能机器人 3 月

值得关注的研讨会

  • NeurIPS "Robot Learning" 研讨会
  • ICRA "Learning for Agile Robotics" 研讨会
  • CoRL 特邀报告与演示

如何跟踪会议动态

建议关注各会议的官方 Twitter/X 账号和 OpenReview 页面。CoRL 和 RSS 是具身智能领域最对口的会议,审稿过程相对透明(OpenReview)。

软件工具

核心库

用途
PyTorch 深度学习框架
JAX 高性能数值计算(在 RL 研究中日益流行)
Gymnasium(Gym) 标准 RL 环境 API
MuJoCo 物理仿真
Isaac Lab GPU 加速机器人仿真
Weights & Biases 实验追踪
Hydra 配置管理

值得研读的代码仓库

  • CleanRL — 清晰的单文件 RL 实现
  • Stable-Baselines3 — 可靠的 RL 实现
  • legged_gym — 运动控制 RL 训练(NVIDIA)
  • robomimic — 从示教学习的机器人操作
  • lerobot — Hugging Face 机器人学习库

经典论文合集

按主题分类的论文列表,参见:

保持更新

  • ArXiv — 设置 cs.RO、cs.LG、cs.AI 的关键词提醒
  • Google Scholar — 关注你研究领域的关键作者
  • Semantic Scholar — AI 驱动的论文推荐
  • Twitter/X — 关注研究者、实验室和会议账号
  • Reddit — r/MachineLearning、r/reinforcementlearning
  • 知乎 — 机器学习和机器人相关话题,中文社区讨论活跃