GitHub - liangyiting/DDPG-for-process-optimization-: 还在整理中..尝试将强化学习（DDPG框架）用于锌冶炼净化过程的锌粉添加量优化.。首先在matlab中搭建净化过程模型（agent)，然后通过python接口与主程序连接；然后搭建三层行动网络和评价网络；基于梯度下降算法训练网络参数。整个训练过程发散，而且无法解决。可能原因在于过程模型复杂，在只有有限数据条件下很难用神经网络逼近，从而造成无法收敛。代码基于tensorflow，python和matlab。

liangyiting / DDPG-for-process-optimization- Public

Notifications You must be signed in to change notification settings
Fork 3
Star 5

还在整理中..尝试将强化学习（DDPG框架）用于锌冶炼净化过程的锌粉添加量优化.。首先在matlab中搭建净化过程模型（agent)，然后通过python接口与主程序连接；然后搭建三层行动网络和评价网络；基于梯度下降算法训练网络参数。整个训练过程发散，而且无法解决。可能原因在于过程模型复杂，在只有有限数据条件下很难用神经网络逼近，从而造成无法收敛。代码基于tensorflow，python和matlab。

5 stars 3 forks Branches Tags Activity

Star

Notifications

Branches Tags

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
actor_network.py		actor_network.py
actor_network_bn.py		actor_network_bn.py
cobalt_simulation_2.py		cobalt_simulation_2.py
critic_network.py		critic_network.py
critic_network_bn.py		critic_network_bn.py
ddpg.py		ddpg.py
filter_env.py		filter_env.py
gym_ddpg.py		gym_ddpg.py
ou_noise.py		ou_noise.py
replay_buffer.py		replay_buffer.py