🕌
学习指南

用户1022

4月27日修改

•

开源内容：https://github.com/datawhalechina/every-embodied

•
学习指南知识库：​学习指南​

•
提问部分：​问题记录和汇总​

•
助教请申请这个文档的编辑权限，打卡信息，优秀作业等所有内容请汇总到：​202603期1群和​202603期2群​

•
课程说明：​

具身智能（Embodied AI）风很大，从 Mobile ALOHA 到 Pi0、OpenVLA，SOTA 模型几乎按周更新。但很多人想入局却卡在第一步：​

🤯 资料太碎，不知道从哪学起？

🤯 门槛太高，数学推导和物理引擎让人头秃？

🤯 跑不起来，环境配置配到怀疑人生？

别慌！这份由 Datawhale 发起、开源社区共同打磨的保姆级教程 Every-Embodied : Zero to Hero 正式开源啦！🌟 我们主打一个：基础友好、工程可复现、前沿可拓展。带你从一行 Python 代码开始，一步步给机器人装上“大脑”！🧠​

拒绝“配环境从入门到放弃”！我们提供了开箱即用的环境脚本，即使只有基础编程能力，只需三步命令，就能在本地跑通第一个 MuJoCo 机械臂抓取 Demo。带你跑通 OpenVLA、SmolVLA、ETPNav，甚至复刻春晚同款武术机器人！同时，🎬 配套保姆级视频教程！我们在 小红书和B 站同步更新了丰富的配套实操视频！从 Mujoco 仿真、ACT 抓取水杯算法到 GenieSim 一键启动，手把手带你避坑。​

•
面向人群：对具身智能感兴趣的学生、工程师、研究人员；具备Python基础和基础数学知识。Python 初学者 / AI 开发者： 想系统转型具身智能方向；高校学生： 需要做课程项目、毕设，或者想快速建立论文复现能力；硬件 / 机器人发烧友： 想打通从物理机控制到 Sim2Real 部署的完整闭环。​

•
课程编号：929​

•
学习群个数：2个​

•
学习人数：180人/群​

角色	姓名
航路开辟者（课程设计者）	陈可为
领航员（运营助教）
航海士（专业助教）

任务安排：

任务信息（每个task任选一个链接打卡即可）	天数	截止时间	评审	优秀作业
04月13日正式开始	共20天
Task01：具身智能基础与机器人控制，具身智能概述与发展，PID控制算法实现，机器人运动学基础，具身导航初步（视频教程）对应：热门内容：春晚机器人复刻 /every-embodied/blob/main/07-机器人操作、运动控制/Locomotion/01春晚舞蹈机器人复刻.md 视频教程： http://xhslink.com/o/1lB9dX0Vt2t 1. 课程01-具身智能概述：该章节涵盖了具身智能概述与发展”。 /datawhalechina/every-embodied/blob/main/01-具身智能概述/01具身智能概述.md 2. 课程02-机器人基础和控制、手眼协调：该章节涵盖了“机器人基础”（运动学）和“控制”（PID算法）。 /datawhalechina/every-embodied/blob/main/02-机器人基础和控制、手眼协调/01机器人空间描述与坐标变换.md /datawhalechina/every-embodied/blob/main/02-机器人基础和控制、手眼协调/补充代码教程_Cartpole三种控制算法实战/cartpole建模与控制.md 3. 具身导航基础（优先完成作业）： /every-embodied/blob/main/08-具身导航及VLN/02仿真环境基础/habitat导航环境/habitat_lab环境搭建及配置.md /every-embodied/blob/main/08-具身导航及VLN/02仿真环境基础/habitat导航环境/habitat_sim基础实践.md /datawhalechina/every-embodied/blob/main/08-具身导航及VLN/02仿真环境基础/habitat导航环境/habitat_lab基础.md 视频教程： http://xhslink.com/o/4FGHWn2YICu	4 天	截止时间 04月17日03:00
Task02：通识基础收束：视觉感知、仿真环境与训练范式入门 Task01 已经完成具身智能概述、机器人基础控制和导航初步。本阶段继续补齐共通能力，重点理解视觉感知、深度/3D 信息、强化学习、仿真平台和具身任务训练范式，为后续分支学习做准备。课程04-具身场景的计算机视觉、3D重建：该章节涵盖机器人视觉、深度估计、SAM 和抓取注意力等基础内容。 SAM和深度估计抓取注意力热图课程05-具身场景的深度和强化学习：该章节涵盖强化学习与具身决策入门。多机器人搬运家具强化学习仿真工具二选一： ManiSkill环境仿真配置 GenieSim配置 GenieSim视频教程：http://xhslink.com/o/2tybo79bOsk 建议打卡：说明感知、训练、仿真三者在具身任务中的关系；或跑通一个视觉/仿真/强化学习示例。	4 天	截止时间 04月21日03:00
Task03：分支入门：按兴趣选择 1 条主分支，跑通第一个方向性任务完成 Task01 和 Task02 后，开始按兴趣分流。建议每位同学优先选择 1 条主分支，不建议同时追多个方向。分支A：操作模型与世界模型适合喜欢机械臂操作、抓取、模仿学习、VLA、ACT、Pi0、SmolVLA、OpenVLA 和世界模型的同学。操作模型关注“机器人如何根据视觉和语言产生动作”，世界模型关注“系统如何理解、预测和规划环境变化”，两者都服务于机器人操作能力。 SmolVLA-LIBERO OpenVLA复现 MuJoCo复现ACT、Pi0、SmolVLA MuJoCo抓取实验视频教程：https://www.bilibili.com/video/BV1WhxeznE61/ ACT、Pi0数据采集和算法实操视频教程：http://xhslink.com/o/8lsptSLOlex LIBERO benchmark LeWorldModel分析解读与实验复现分支B：导航模型与无人机导航适合喜欢导航、VLN、场景理解、空间定位、路径规划、无人机导航和空中视角多模态任务的同学。无人机相关内容放在导航模型这一类，因为它的核心也是“在环境中理解目标、规划路径并执行移动”。具身导航算法基本介绍 Habitat Lab环境搭建及配置 Habitat Sim基础实践 Habitat导航视频教程：http://xhslink.com/o/4FGHWn2YICu 无人机多模态大模型实践对应仿真器下载链接(windows)：https://huggingface.co/datasets/Datawhale/house_win 分支C：应用实践与系统部署适合希望做仿真工具、开发板、真实机械臂、遥操作和系统集成的同学。 RDK-X5超新手入门教程 RDK-X5连接LeRobot机械臂进行遥操 InternDataEngine小空间功能体验教程建议打卡：选择一个主分支，说明选择原因，并跑通该方向的第一个 demo 或环境。	4 天	截止时间 04月25日03:00
Task04：分支深入：沿 Task03 方向补充新内容，形成一次可复现成果 Task03 已经开始，因此本阶段不再调整 Task03 的学习要求。Task04 不重复 Task03 的入门链接，只提供进一步深入或新增补充内容。学习者继续沿 Task03 已选择的主分支推进，把产出从“跑通第一个 demo 或环境”升级为“可复现成果”：可以选择训练、评估、参数对比、部署链路、数据生成、失败分析或论文/代码深读中的一种，打卡内容需要包含过程、结果和结论。分支A：操作模型与世界模型方向：适合已经在 Task03 接触 SmolVLA、OpenVLA、MuJoCo、LIBERO 或 LeWorldModel 的同学继续深入。Task04 建议转向更系统的模型理解、数据生成或新平台复现，避免重复提交同一个 demo。 RT系列论文解读与代码分析 SIM1柔体仿真与数据生成 Isaac GR00T入门与微调分支B：导航模型与无人机导航方向：适合已经在 Task03 跑过 Habitat 基础环境、导航算法入门或无人机 demo 的同学继续深入。Task04 建议转向更完整的导航任务复现、轨迹结果分析、成功/失败案例整理，或说明 VLN/导航模型如何把语言目标转成路径决策。 Habitat Lab基础实践具身导航综合入门实践 ETPNav代码复现 ETPNav前沿VLN导航算法复现视频教程：http://xhslink.com/o/8t08X6dROt5 分支C：应用实践与系统部署方向：适合已经在 Task03 接触 RDK-X5、LeRobot、仿真工具或真实系统链路的同学继续深入。Task04 建议选择新的数据合成、仿真数据生成或系统部署内容，重点输出可复现步骤、验证结果和踩坑记录。 SIM1柔体仿真与数据生成 Isaac GR00T入门与微调建议打卡：提交“同一分支深入成果”。内容包括 Task03 的延续关系、选择的补充内容或深入教程、复现/训练/部署/数据生成步骤、关键结果截图或指标、遇到的问题与解决方法，以及对该方向后续可以继续深入的判断。	4 天	截止时间 04月29日03:00
Task05：成果整理与交叉分享最后阶段不建议再开新坑，而是把前面完成的通识学习和分支实践整理成可复用成果。可提交复现报告、演示视频、动图、环境搭建记录、方向综述、论文/代码解读、踩坑总结等。分支A：操作模型与世界模型方向：可整理 ACT、Pi0、SmolVLA、OpenVLA、RT 系列、LIBERO 或 LeWorldModel 学习报告。分支B：导航模型与无人机导航方向：可整理 Habitat、VLN、ETPNav、无人机导航或无人机多模态实践复现报告。分支C：应用实践与系统部署方向：可整理 ManiSkill、GenieSim、RDK-X5、LeRobot 遥操作、真实系统部署或多模态 demo 的环境配置和踩坑总结。建议打卡：提交一份最终成果，说明你选择的分支、完成的任务、遇到的问题、解决方法和后续可以继续深入的方向。	4 天	截止时间 05月03日03:00