Skip to content

还在整理中..尝试将强化学习(DDPG框架)用于锌冶炼净化过程的锌粉添加量优化.。首先在matlab中搭建净化过程模型(agent),然后通过python接口与主程序连接;然后搭建三层行动网络和评价网络;基于梯度下降算法训练网络参数。整个训练过程发散,而且无法解决。可能原因在于过程模型复杂,在只有有限数据条件下很难用神经网络逼近,从而造成无法收敛。代码基于tensorflow,python和matlab。

Notifications You must be signed in to change notification settings

liangyiting/DDPG-for-process-optimization-

About

还在整理中..尝试将强化学习(DDPG框架)用于锌冶炼净化过程的锌粉添加量优化.。首先在matlab中搭建净化过程模型(agent),然后通过python接口与主程序连接;然后搭建三层行动网络和评价网络;基于梯度下降算法训练网络参数。整个训练过程发散,而且无法解决。可能原因在于过程模型复杂,在只有有限数据条件下很难用神经网络逼近,从而造成无法收敛。代码基于tensorflow,python和matlab。

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages