强化学习基础 2024-08-25 数据合成及过滤, 论文阅读 强化学习入门(一)学习资料整理 强化学习基础学习 李宏毅老师强化学习课程 Reinforce Learning Book 2020 强化学习论文学习 GAE论文(优势函数估计) InstructGPT论文 强化学习实践学习 Trlx代码仓库 PlayGround 其他相关文章(简单介绍) https://spinningup.openai.com/en/latest/spinningup/rl_intro2.html#id20 https://www.zhihu.com/search?type=content&q=%E5%BC%BA%E5%8C%96%E5%AD%A6%E4%B9%A0为什么我总感觉强化学习不是真的人工智能? http://incompleteideas.net/book/the-book-2nd.html https://www.alexirpan.com/2018/02/14/rl-hard.html RLHF PPO论文:https://arxiv.org/pdf/1707.06347.pdf PPO拆解:https://zhuanlan.zhihu.com/p/645225982