• 简体   /   繁体
基于二阶价值梯度模型强化学习的工业过程控制方法-计算机应用研究2024年08期

基于二阶价值梯度模型强化学习的工业过程控制方法

作者:张博 潘福成 周晓锋 李帅 字体:      

摘 要:为了实现对高延时、非线性和强耦合的复杂工业过程稳定准确的连续控制,提出了一种基于二阶价值梯度模型强化学习的控制方法。首先,该方法在模型训练过程中加入了状态价值函数的二阶梯度信息,具备更精确的函数(试读)...

计算机应用研究

2024年第08期