主题
覆盖大语言模型及相关领域——原理拆解、公式推导、实验分析与个人思考
架构设计、预训练方法、Scaling Laws、Tokenizer、长上下文
RLHF、DPO、Constitutional AI、Red-teaming、价值观对齐
Chain-of-Thought、数学推理、代码生成、逻辑推理、Test-time Compute
VLM、图像/视频理解、语音、多模态生成
Tool Use、Web Agent、代码 Agent、多 Agent 协作、规划
VLA 模型、世界模型、机器人 RL、模仿学习、Sim-to-Real
已有 3 篇笔记
量化、蒸馏、剪枝、推测解码、KV Cache 优化、MoE
RAG 架构、向量检索、知识图谱、Grounding、幻觉消除
Benchmark 设计、评估方法论、LLM-as-Judge、排行榜分析