Add DDPG #1

kevslinger · 2022-03-28T19:28:05Z

No description provided.

brett-daley

Looks good but needs implementation changes that we discussed.

brett-daley · 2022-03-28T19:43:17Z

fast_dqn/deep_deterministic_policy_gradient.py

+        with tf.GradientTape() as tape:
+            Q = self.predict_values(states, actions, network='main')
+            # TODO: Should we use huber loss here?
+            loss = tf.reduce_mean(huber_loss(targets - Q))


Let's use tf.square instead

fast_dqn/deep_deterministic_policy_gradient.py

brett-daley · 2022-03-28T19:47:02Z

fast_dqn/deep_deterministic_policy_gradient.py

+                Dense(1)
+            ])
+        # We make one shared encoder for the actor and critic.
+        # TODO: Should we make separate main/target/exec encoders?


Yes, we should have target/exec models for the encoder, too.

brett-daley · 2022-03-28T19:47:57Z

fast_dqn/agents/ddpg/baseline_ddpg_agent.py

+        self.num_actions = self._vec_env.action_space.shape[-1]
+        self.action_limit = self._vec_env.action_space.high.max()
+
+        actor_optimizer = Adam(lr=1e-4)


Let's have a single optimizer for actor + critic. Use Adam with lr=1e-4.

…with DrQv2

Add DDPG

e7cbafe

brett-daley self-requested a review March 28, 2022 19:29

brett-daley assigned brett-daley and kevslinger and unassigned brett-daley Mar 28, 2022

brett-daley requested changes Mar 28, 2022

View reviewed changes

kevslinger and others added 4 commits April 6, 2022 15:41

Add target/exec encoders, bug fixes, implementation details aligning …

1e26828

…with DrQv2

DQN + DDPG share replay memory

1d08666

Abstract off-policy agents

fb92396

Keras models

b86bb4b

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add DDPG #1

Add DDPG #1

kevslinger commented Mar 28, 2022

brett-daley left a comment

brett-daley Mar 28, 2022

brett-daley Mar 28, 2022

brett-daley Mar 28, 2022

Add DDPG #1

Are you sure you want to change the base?

Add DDPG #1

Conversation

kevslinger commented Mar 28, 2022

brett-daley left a comment

Choose a reason for hiding this comment

brett-daley Mar 28, 2022

Choose a reason for hiding this comment

brett-daley Mar 28, 2022

Choose a reason for hiding this comment

brett-daley Mar 28, 2022

Choose a reason for hiding this comment