06 Embodied AI
具身智能:VLA 模型、世界模型、机器人策略 RL 训练、模仿学习等。
🤖 VLA(Vision-Language-Action)
基础模型
π₀ 系列、RT 系列、OpenVLA、GR00T 等。
| 论文 | 关键词 | 年份 |
|---|---|---|
| π₀ | Flow Matching VLA、VLM 骨架 + Action Expert、跨构型预训练、预训练/后训练范式 | 2024 |
| π₀.₅ | 异构多源数据协同训练、分层推理(子任务预测 + 低层控制)、开放世界泛化 | 2025 |
RL 后训练
用强化学习微调或改进机器人策略,包括 VLA + RL 自改进、Flow/Diffusion Policy + RL 等。
| 论文 | 关键词 | 年份 |
|---|---|---|
| RISE | 组合式世界模型、想象空间 RL、VLA 自改进 | 2026 |
| SAC Flow | Flow 策略 × 序列模型、GRU/Transformer 重参数化、off-policy RL | 2026 |
🌍 World Models
视频世界模型、动力学预测、可控生成、想象与规划。
暂无笔记,敬请期待。