LLM Paper Notes论文精读笔记

覆盖大语言模型及相关领域——原理拆解、公式推导、实验分析与个人思考

Foundation Models

架构设计、预训练方法、Scaling Laws、Tokenizer、长上下文

RLHF、DPO、Constitutional AI、Red-teaming、价值观对齐

已有 1 篇笔记

Chain-of-Thought、数学推理、代码生成、逻辑推理、Test-time Compute

VLM、图像/视频理解、语音、多模态生成

已有 37 篇笔记

Tool Use、Web Agent、代码 Agent、多 Agent 协作、规划

VLA 模型、世界模型、机器人 RL、模仿学习、Sim-to-Real

已有 93 篇笔记

量化、蒸馏、剪枝、推测解码、KV Cache 优化、MoE

RAG 架构、向量检索、知识图谱、Grounding、幻觉消除

Benchmark 设计、评估方法论、LLM-as-Judge、排行榜分析

已有 1 篇笔记