Skip to content

🧠 LLM Paper Notes

Main Navigation 首页论文索引笔记模板

主题

Sidebar Navigation

📚 论文分类

01 Foundation Models

02 Alignment & Safety

03 Reasoning

04 Multimodal

05 Agents

06 Embodied AI

VLA

基础模型

π₀ (2024)

π₀.₅ (2025)

RL 后训练

RISE (2026)

SAC Flow (2026)

World Models

07 Efficiency

08 RAG & Knowledge

09 Evaluation

目录

04 Multimodal

多模态模型：VLM（GPT-4V、LLaVA）、视频理解、语音模型、多模态生成、统一架构等。

最后更新:

Pager

上一篇03 Reasoning

下一篇05 Agents

基于 CC BY-SA 4.0 协议

© jiabingyang01