中国科学技术大学自动化系 合肥 230027
江琦
TP202
基于强化学习的方法,提出一种动态电源管理超时策略自适应在线优化算法.构建基于超时策略动态电源管理系统的半Markov 控制过程模型,将动态电源管理问题转化为一个带约束的优化问题.利用此模型的动态结构特性,结合在线梯度估计与随机逼近推导超时策略的在线优化算法.该算法自适应性强,计算量小,具有全局收敛性.通过无线网络通信节点动态电源管理的应用仿真验证了算法的有效性.
江琦;奚宏生;殷保群.动态电源管理超时策略自适应优化算法[J].控制与决策,2008,23(4):372-377