-
Notifications
You must be signed in to change notification settings - Fork 3
还在整理中..尝试将强化学习(DDPG框架)用于锌冶炼净化过程的锌粉添加量优化.。首先在matlab中搭建净化过程模型(agent),然后通过python接口与主程序连接;然后搭建三层行动网络和评价网络;基于梯度下降算法训练网络参数。整个训练过程发散,而且无法解决。可能原因在于过程模型复杂,在只有有限数据条件下很难用神经网络逼近,从而造成无法收敛。代码基于tensorflow,python和matlab。
liangyiting/DDPG-for-process-optimization-
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
About
还在整理中..尝试将强化学习(DDPG框架)用于锌冶炼净化过程的锌粉添加量优化.。首先在matlab中搭建净化过程模型(agent),然后通过python接口与主程序连接;然后搭建三层行动网络和评价网络;基于梯度下降算法训练网络参数。整个训练过程发散,而且无法解决。可能原因在于过程模型复杂,在只有有限数据条件下很难用神经网络逼近,从而造成无法收敛。代码基于tensorflow,python和matlab。
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published