近似动态规划在资源配置中的应用研究 06月30日
【摘要】大部分资源配置问题都具有离散或连续的状态和决策空间,针对中小型问题,一般运用动态规划(DP)、变分不等式或极大值原理求解,而对于大型资源配置问题,不管问题有无模型都面临着“维数灾”问题。经典DP的运算时间随着问题规模的增加而呈指数增长,变分不等式不能解决具有闭集约束条件的最优化问题,极大值原理只给出了最优化的必要条件。而近似动态规划(ADP)结合了强化学习、神经网络、自适应评价系统以及经典 […]
【摘要】大部分资源配置问题都具有离散或连续的状态和决策空间,针对中小型问题,一般运用动态规划(DP)、变分不等式或极大值原理求解,而对于大型资源配置问题,不管问题有无模型都面临着“维数灾”问题。经典DP的运算时间随着问题规模的增加而呈指数增长,变分不等式不能解决具有闭集约束条件的最优化问题,极大值原理只给出了最优化的必要条件。而近似动态规划(ADP)结合了强化学习、神经网络、自适应评价系统以及经典 […]