华中科技大学系统工程研究所, 湖北武汉430074
应用Shannon 熵和其他熵指数来度量马尔可夫决策的复杂性1 将马尔可夫链的复杂性、不确定性和不可预 测性的度量扩展到马尔可夫决策, 提出一套基于信息理论的复杂性度量方法, 可用于随机和确定性策略下的完全观 测和不完全观测马尔可夫决策. 对有关数值进行仿真研究, 并给出了计算结果.
王红卫, 李 琛, 刘会新.马尔可夫决策过程复杂性的熵测度[J].控制与决策,2004,19(9):983-987