Skip to content

Commit 5c4c6d5

Browse files
author
unknown
committed
update reference
1 parent 939a63f commit 5c4c6d5

File tree

1 file changed

+33
-26
lines changed

1 file changed

+33
-26
lines changed

README.md

+33-26
Original file line numberDiff line numberDiff line change
@@ -35,37 +35,44 @@ spinningup-SAC reward curve:
3535
```
3636
.
3737
├─ DDPG
38-
├─ DDPG
39-
└─ DDPG_spinningup
38+
├─ DDPG
39+
└─ DDPG_spinningup
4040
├─ MADDPG
41-
│ ├─ .gitignore
42-
│ ├─ .idea
43-
│ ├─ README.md
44-
│ ├─ __pycache__
45-
│ ├─ arguments.py
46-
│ ├─ enjoy_split.py
47-
│ ├─ logs
48-
│ ├─ main_openai.py
49-
│ ├─ model.py
50-
│ ├─ models
51-
│ └─ replay_buffer.py
41+
│ ├─ .gitignore
42+
│ ├─ .idea
43+
│ ├─ __pycache__
44+
│ ├─ arguments.py
45+
│ ├─ enjoy_split.py
46+
│ ├─ logs
47+
│ ├─ main_openai.py
48+
│ ├─ model.py
49+
│ ├─ models
50+
│ └─ replay_buffer.py
5251
├─ PPO
53-
├─ .idea
54-
├─ PPOModel.py
55-
├─ __pycache__
56-
├─ core.py
57-
└─ myPPO.py
52+
├─ .idea
53+
├─ PPOModel.py
54+
├─ __pycache__
55+
├─ core.py
56+
└─ myPPO.py
5857
├─ README.md
5958
├─ SAC
60-
├─ SAC_demo1
61-
└─ SAC_spinningup
59+
├─ SAC_demo1
60+
└─ SAC_spinningup
6261
├─ TD3
63-
│ ├─ TD3
64-
│ └─ TD3_spinningup
65-
└─ imgs
66-
├─ spinSAC.png
67-
├─ spin_ddpg.png
68-
└─ spin_td3.png
62+
│ ├─ TD3
63+
│ └─ TD3_spinningup
64+
├─ imgs
65+
│ ├─ spinSAC.png
66+
│ ├─ spin_ddpg.png
67+
│ └─ spin_td3.png
68+
└─ reference
69+
├─ 多智能体 MADDPG - Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments - 1706.02275.pdf
70+
├─ 强化学习 DDPG - CONTINUOUS CONTROL WITH DEEP REINFORCEMENT 1509.02971.pdf
71+
├─ 强化学习 GAE High-Dimensional Continuous Control Using Generalized Advantage Estimation 1506.02438.pdf
72+
├─ 强化学习 PPO - Proximal Policy Optimization1707.06347.pdf
73+
├─ 强化学习 SAC1 - Soft Actor-Critic Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor - 1801.01290.pdf
74+
├─ 强化学习 SAC2 auto alpha Soft Actor-Critic Algorithms and Applications 1812.05905.pdf
75+
└─ 强化学习 TD3 - Addressing Function Approximation Error in Actor-Critic Methods 1802.09477.pdf
6976
```
7077

7178
## Requirements

0 commit comments

Comments
 (0)