动机 博士生该具有的意识与能力 Yanjie Ze 前辈的 Paper List John Schulman 的 Research 经验 Karpathy 的 PhD 经验 论文列表 强化学习 Reinforcement Learning 主动模仿学习 Active Imitation Learning 部分可观测强化学习 Partially Observable RL 偏好学习 Preference Learning 纯文本推理 Textual Reasoning 多模态推理 Multimodal Reasoning 计算机视觉 Computer Vision 其他整理内容 跨论文综合 Syntheses 会议观察 Conference Notes Auto Topic Index Active Imitation Learning Agentic RL Bandit Theory Computer Vision Imitation Learning Multimodal Reasoning Partially Observable MDP Preference Learning Reinforcement Learning Representation Learning Safety & Alignment Textual Reasoning