Skip to content

06 Embodied AI

具身智能:VLA 模型、世界模型、机器人策略 RL 训练、模仿学习等。


🤖 VLA(Vision-Language-Action)

基础模型

π₀ 系列、RT 系列、OpenVLA、GR00T 等。

论文关键词年份
π₀Flow Matching VLA、VLM 骨架 + Action Expert、跨构型预训练、预训练/后训练范式2024
π₀.₅异构多源数据协同训练、分层推理(子任务预测 + 低层控制)、开放世界泛化2025

RL 后训练

用强化学习微调或改进机器人策略,包括 VLA + RL 自改进、Flow/Diffusion Policy + RL 等。

论文关键词年份
RISE组合式世界模型、想象空间 RL、VLA 自改进2026
SAC FlowFlow 策略 × 序列模型、GRU/Transformer 重参数化、off-policy RL2026

🌍 World Models

视频世界模型、动力学预测、可控生成、想象与规划。

暂无笔记,敬请期待。