- 王树森DRL,对应代码
- https://github.com/MetaHX/Reinforcement-Learning
- 蘑菇书 (整理了周博磊老师的《强化学习纲要》、李科浇老师的《世界冠军带你从零实践强化学习》以及多个强化学习的经典资料作为补充)
- https://github.com/DLR-RM/stable-baselines3 可以自定义policy、feature extractor的python包;https://github.com/DLR-RM/rl-baselines3-zoo 配合这个实现自动调参
- 北大董豪DRL