用户1022用户1022角色 | 姓名 |
航路开辟者(课程设计者) | 陈可为 |
领航员(运营助教) | |
航海士(专业助教) | |
任务信息(每个task任选一个链接打卡即可) | 天数 | 截止时间 | 评审 | 优秀作业 |
04月13日正式开始 | 共20天 | | | |
Task01:具身智能基础与机器人控制,具身智能概述与发展,PID控制算法实现,机器人运动学基础,具身导航初步(视频教程) 对应: 热门内容:春晚机器人复刻 /every-embodied/blob/main/07-机器人操作、运动控制/Locomotion/01春晚舞蹈机器人复刻.md 视频教程: 1. 课程01-具身智能概述:该章节涵盖了具身智能概述与发展”。 2. 课程02-机器人基础和控制、手眼协调:该章节涵盖了“机器人基础”(运动学)和“控制”(PID算法)。 /datawhalechina/every-embodied/blob/main/02-机器人基础和控制、手眼协调/01机器人空间描述与坐标变换.md /datawhalechina/every-embodied/blob/main/02-机器人基础和控制、手眼协调/补充代码教程_Cartpole三种控制算法实战/cartpole建模与控制.md 3. 具身导航基础(优先完成作业): /every-embodied/blob/main/08-具身导航及VLN/02仿真环境基础/habitat导航环境/habitat_lab环境搭建及配置.md /every-embodied/blob/main/08-具身导航及VLN/02仿真环境基础/habitat导航环境/habitat_sim基础实践.md /datawhalechina/every-embodied/blob/main/08-具身导航及VLN/02仿真环境基础/habitat导航环境/habitat_lab基础.md 视频教程: | 4 天 | 截止时间 04月17日03:00 | | |
Task02:通识基础收束:视觉感知、仿真环境与训练范式入门 Task01 已经完成具身智能概述、机器人基础控制和导航初步。本阶段继续补齐共通能力,重点理解视觉感知、深度/3D 信息、强化学习、仿真平台和具身任务训练范式,为后续分支学习做准备。 课程04-具身场景的计算机视觉、3D重建:该章节涵盖机器人视觉、深度估计、SAM 和抓取注意力等基础内容。 课程05-具身场景的深度和强化学习:该章节涵盖强化学习与具身决策入门。 仿真工具二选一: 建议打卡:说明感知、训练、仿真三者在具身任务中的关系;或跑通一个视觉/仿真/强化学习示例。 | 4 天 | 截止时间 04月21日03:00 | | |
Task03:分支入门:按兴趣选择 1 条主分支,跑通第一个方向性任务 完成 Task01 和 Task02 后,开始按兴趣分流。建议每位同学优先选择 1 条主分支,不建议同时追多个方向。 分支A:操作模型与世界模型 适合喜欢机械臂操作、抓取、模仿学习、VLA、ACT、Pi0、SmolVLA、OpenVLA 和世界模型的同学。操作模型关注“机器人如何根据视觉和语言产生动作”,世界模型关注“系统如何理解、预测和规划环境变化”,两者都服务于机器人操作能力。 分支B:导航模型与无人机导航 适合喜欢导航、VLN、场景理解、空间定位、路径规划、无人机导航和空中视角多模态任务的同学。无人机相关内容放在导航模型这一类,因为它的核心也是“在环境中理解目标、规划路径并执行移动”。 分支C:应用实践与系统部署 适合希望做仿真工具、开发板、真实机械臂、遥操作和系统集成的同学。 | 4 天 | 截止时间 04月25日03:00 | | |
Task04:分支深入:沿 Task03 方向补充新内容,形成一次可复现成果 Task03 已经开始,因此本阶段不再调整 Task03 的学习要求。Task04 不重复 Task03 的入门链接,只提供进一步深入或新增补充内容。学习者继续沿 Task03 已选择的主分支推进,把产出从“跑通第一个 demo 或环境”升级为“可复现成果”:可以选择训练、评估、参数对比、部署链路、数据生成、失败分析或论文/代码深读中的一种,打卡内容需要包含过程、结果和结论。 分支A:操作模型与世界模型方向:适合已经在 Task03 接触 SmolVLA、OpenVLA、MuJoCo、LIBERO 或 LeWorldModel 的同学继续深入。Task04 建议转向更系统的模型理解、数据生成或新平台复现,避免重复提交同一个 demo。 分支B:导航模型与无人机导航方向:适合已经在 Task03 跑过 Habitat 基础环境、导航算法入门或无人机 demo 的同学继续深入。Task04 建议转向更完整的导航任务复现、轨迹结果分析、成功/失败案例整理,或说明 VLN/导航模型如何把语言目标转成路径决策。 分支C:应用实践与系统部署方向:适合已经在 Task03 接触 RDK-X5、LeRobot、仿真工具或真实系统链路的同学继续深入。Task04 建议选择新的数据合成、仿真数据生成或系统部署内容,重点输出可复现步骤、验证结果和踩坑记录。 建议打卡:提交“同一分支深入成果”。内容包括 Task03 的延续关系、选择的补充内容或深入教程、复现/训练/部署/数据生成步骤、关键结果截图或指标、遇到的问题与解决方法,以及对该方向后续可以继续深入的判断。 | 4 天 | 截止时间 04月29日03:00 | | |
Task05:成果整理与交叉分享 最后阶段不建议再开新坑,而是把前面完成的通识学习和分支实践整理成可复用成果。可提交复现报告、演示视频、动图、环境搭建记录、方向综述、论文/代码解读、踩坑总结等。 分支A:操作模型与世界模型方向:可整理 ACT、Pi0、SmolVLA、OpenVLA、RT 系列、LIBERO 或 LeWorldModel 学习报告。 分支B:导航模型与无人机导航方向:可整理 Habitat、VLN、ETPNav、无人机导航或无人机多模态实践复现报告。 分支C:应用实践与系统部署方向:可整理 ManiSkill、GenieSim、RDK-X5、LeRobot 遥操作、真实系统部署或多模态 demo 的环境配置和踩坑总结。 建议打卡:提交一份最终成果,说明你选择的分支、完成的任务、遇到的问题、解决方法和后续可以继续深入的方向。 | 4 天 | 截止时间 05月03日03:00 | | |