动机 博士生该具有的意识与能力 Yanjie Ze 前辈的 Paper List John Schulman 的 Research 经验 Karpathy 的 PhD 经验 论文列表 经典与深度强化学习 Classical & Deep RL 模仿学习 Imitation Learning(含 Active Imitation Learning) 部分可观测强化学习 Partially Observable RL 偏好学习 Preference Learning 纯文本推理 Textual Reasoning 多模态推理 Multimodal Reasoning 经典视觉 Classical CV 其他整理内容 跨论文综合 Syntheses 会议观察 Conference Notes Auto Topic Index Agentic RL Classical CV Imitation Learning Multimodal Reasoning Partially Observable MDP Preference Learning Classical & Deep RL Representation Learning Safety & Alignment Textual Reasoning World Models