Skip to content

🧠 LLM Paper Notes

Main Navigation 首页论文索引笔记模板

主题

Sidebar Navigation

📚 论文分类

01 Foundation Models

02 Alignment & Safety

R³L (2026)

03 Reasoning

04 Multimodal

VLM

幻觉缓解

ACPO (2026)

AGLA (2025)

AVISC (2025)

CIPHER (2026)

CSR (2024)

DLC (2025)

EFUF (2024)

FLB (2026)

FarSight (2025)

HALC (2024)

HIME (2026)

IBD (2024)

HIO (2024)

ICD (2024)

LessIsMore (2024)

LogicCheckGPT (2024)

LPOI (2025)

LURE (2024)

mDPO (2024)

MemVR (2025)

MMHalSnowball (2024)

OPERA (2024)

REVERIE (2024)

RFI (2026)

SENTINEL (2025)

SIMA (2024)

STIC (2024)

TAF (2026)

VACoDe (2024)

VCD (2026)

VGA (2024)

VisFlow (2025)

Token 压缩

DART (2025)

Elastic Cache (2024)

Token Pruning Survey (2025)

VisionZip (2024)

视频生成

WorldForge (2025)

05 Agents

06 Embodied AI

VLA

基础模型

ChatVLA (2025)

Dexbotic (2025)

FAST (2025)

GR-3 (2025)

MMaDA-VLA (2026)

OTTER (2025)

π₀ (2024)

π₀.₅ (2025)

SpatialVLA (2025)

UniVLA (2025)

感知增强

3D-CAVLA (2025)

3D-MIX (2026)

AimBot (2025)

AnchorVLA4D (2026)

BridgeVLA (2025)

DeepVision-VLA (2026)

SF (2025)

TGM-VLA (2026)

UAOR (2026)

VP-VLA (2026)

推理与规划

CoWVLA (2026)

CronusVLA (2026)

DAM-VLA (2026)

DreamVLA (2025)

DUST (2026)

FLARE (2025)

FutureVLA (2026)

MemoryVLA (2025)

MoH (2025)

OptimusVLA (2026)

ProgressVLA (2026)

SPR (2026)

TCoT (2026)

高效推理

BitVLA (2025)

EfficientVLA (2025)

FocusVLA (2026)

GridS (2026)

HeiSD (2026)

LAC (2026)

PD-VLA (2025)

SD-VLA (2026)

RLRC (2025)

RTC (2025)

VLA-Cache (2025)

VLA-Pruner (2025)

RL 后训练

ARM (2026)

ConRFT (2025)

DiffRL Data (2025)

FPO++ (2026)

GRAPE (2025)

GigaBrain-0.5M* (2026)

GR-RL (2025)

LRM (2026)

MoRE (2025)

π₀.₆* (2025)

π-StepNFT (2026)

πRL (2025)

PLD (2026)

PTR (2026)

ReWiND (2025)

RISE (2026)

Robo-Dopamine (2025)

ROBOMETER (2026)

RoboReward (2026)

RL-Co (2026)

RLinf (2025)

RLinf-USER (2026)

RLinf-VLA (2025)

RL-VLA Survey (2025)

RLVLA (2025)

RPD (2025)

SAC Flow (2026)

SC-VLA (2026)

SimpleVLA-RL (2025)

SRPO (2025)

TACO (2025)

TGRPO (2025)

TOPReward (2026)

TwinRL (2026)

ViVa (2026)

VLAC (2025)

VLA-RFT (2025)

VLA-RL (2025)

WMPO (2025)

World-VLA-Loop (2026)

WoVR (2026)

World Models

BridgeV2W (2025)

Fast-WAM (2026)

Kinema4D (2026)

MIND-V (2026)

SpatialVAM (2026)

WorldVLA (2025)

Imitation Learning

EC-Flow (2025)

07 Efficiency

08 RAG & Knowledge

09 Evaluation

MME (2024)

10 Reinforcement Learning

DiffusionNFT (2025)

FLAC (2026)

目录

07 Efficiency

高效推理与部署：量化（GPTQ、AWQ）、蒸馏、剪枝、Speculative Decoding、FlashAttention、KV Cache 优化、LoRA 等。

暂无笔记（视觉 Token 压缩 / KV Cache 相关论文已迁移至 04 Multimodal — Token 压缩）

最后更新:

Pager

上一篇EC-Flow (2025)

下一篇08 RAG & Knowledge

基于 CC BY-SA 4.0 协议

© jiabingyang01