06 Embodied AI

具身智能：VLA 模型、世界模型、机器人策略 RL 训练、模仿学习等。

🤖 VLA（Vision-Language-Action）

π₀ 系列、RT 系列、OpenVLA、GR00T 等。

论文	关键词	年份
π₀	Flow Matching VLA、VLM 骨架 + Action Expert、跨构型预训练、预训练/后训练范式	2024
π₀.₅	异构多源数据协同训练、分层推理（子任务预测 + 低层控制）、开放世界泛化	2025

用强化学习微调或改进机器人策略，包括 VLA + RL 自改进、Flow/Diffusion Policy + RL 等。

论文	关键词	年份
RISE	组合式世界模型、想象空间 RL、VLA 自改进	2026
SAC Flow	Flow 策略 × 序列模型、GRU/Transformer 重参数化、off-policy RL	2026

视频世界模型、动力学预测、可控生成、想象与规划。

暂无笔记，敬请期待。