File tree 1 file changed +33
-26
lines changed
1 file changed +33
-26
lines changed Original file line number Diff line number Diff line change @@ -35,37 +35,44 @@ spinningup-SAC reward curve:
35
35
```
36
36
.
37
37
├─ DDPG
38
- │ ├─ DDPG
39
- │ └─ DDPG_spinningup
38
+ │ ├─ DDPG
39
+ │ └─ DDPG_spinningup
40
40
├─ MADDPG
41
- │ ├─ .gitignore
42
- │ ├─ .idea
43
- │ ├─ README.md
44
- │ ├─ __pycache__
45
- │ ├─ arguments.py
46
- │ ├─ enjoy_split.py
47
- │ ├─ logs
48
- │ ├─ main_openai.py
49
- │ ├─ model.py
50
- │ ├─ models
51
- │ └─ replay_buffer.py
41
+ │ ├─ .gitignore
42
+ │ ├─ .idea
43
+ │ ├─ __pycache__
44
+ │ ├─ arguments.py
45
+ │ ├─ enjoy_split.py
46
+ │ ├─ logs
47
+ │ ├─ main_openai.py
48
+ │ ├─ model.py
49
+ │ ├─ models
50
+ │ └─ replay_buffer.py
52
51
├─ PPO
53
- │ ├─ .idea
54
- │ ├─ PPOModel.py
55
- │ ├─ __pycache__
56
- │ ├─ core.py
57
- │ └─ myPPO.py
52
+ │ ├─ .idea
53
+ │ ├─ PPOModel.py
54
+ │ ├─ __pycache__
55
+ │ ├─ core.py
56
+ │ └─ myPPO.py
58
57
├─ README.md
59
58
├─ SAC
60
- │ ├─ SAC_demo1
61
- │ └─ SAC_spinningup
59
+ │ ├─ SAC_demo1
60
+ │ └─ SAC_spinningup
62
61
├─ TD3
63
- │ ├─ TD3
64
- │ └─ TD3_spinningup
65
- └─ imgs
66
- ├─ spinSAC.png
67
- ├─ spin_ddpg.png
68
- └─ spin_td3.png
62
+ │ ├─ TD3
63
+ │ └─ TD3_spinningup
64
+ ├─ imgs
65
+ │ ├─ spinSAC.png
66
+ │ ├─ spin_ddpg.png
67
+ │ └─ spin_td3.png
68
+ └─ reference
69
+ ├─ 多智能体 MADDPG - Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments - 1706.02275.pdf
70
+ ├─ 强化学习 DDPG - CONTINUOUS CONTROL WITH DEEP REINFORCEMENT 1509.02971.pdf
71
+ ├─ 强化学习 GAE High-Dimensional Continuous Control Using Generalized Advantage Estimation 1506.02438.pdf
72
+ ├─ 强化学习 PPO - Proximal Policy Optimization1707.06347.pdf
73
+ ├─ 强化学习 SAC1 - Soft Actor-Critic Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor - 1801.01290.pdf
74
+ ├─ 强化学习 SAC2 auto alpha Soft Actor-Critic Algorithms and Applications 1812.05905.pdf
75
+ └─ 强化学习 TD3 - Addressing Function Approximation Error in Actor-Critic Methods 1802.09477.pdf
69
76
```
70
77
71
78
## Requirements
You can’t perform that action at this time.
0 commit comments