动机 博士生该具有的意识与能力 Yanjie Ze 前辈的 Paper List John Schulman 的 Research 经验 论文列表 强化学习 Reinforcement Learning 主动模仿学习 Active Imitation Learning 部分可观测强化学习 Partially Observable RL 偏好学习 Preference Learning 纯文本推理 Textual Reasoning 多模态推理 Multimodal Reasoning 计算机视觉 Computer Vision