值函数近似 | 师大云端图书馆

基于模糊近似的强化学习方法研究 06月30日

【摘要】强化学习是一种用于求解可以建模为马尔科夫决策过程问题的机器学习方法，其通过Agent与环境交互以获得最大累计奖赏的方式进行学习。当前强化学习面临的主要挑战和机遇是如何求解大规模状态或动作空间的问题。本文将模糊推理作为近似方法用于强化学习算法中，针对当前已有的基于模糊推理的强化学习算法的不足，提出几种改进的基于模糊推理和基函数优化的值函数近似算法：(1)针对传统的基于查询表或函数近似的Q值迭 […]

分类：参考文献
标签：中国知网免费入口, 二型模糊逻辑, 值函数近似, 基函数细化, 小学教育毕业论文, 工程项目管理论文, 强化学习, 模糊推理, 网站设计毕业论文
喜欢：1331
阅读全文

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

基于函数逼近的物流车辆路径规划方法及应用研究 06月30日

【摘要】物流车辆的路径规划问题关系到车辆运输成本和物流活动效率的高低，是我国物流产业转型升级过程中必须解决的重要问题。信息技术和通信技术的快速发展和广泛应用、新型的物流形式如电商生鲜物流等都促进了实时动态路径规划方法的发展和应用。本文从当前物流活动的新形势出发，以解决随机多车辆路径规划问题的维数灾为目标，以近似动态规划理论和函数逼近技术为工具，针对物流活动中应用普遍但求解困难的带随机需求和服务期限 […]

分类：参考文献
标签：中国知网免费入口, 值函数近似, 基函数优化, 毕业设计论文致谢, 环境保护论文, 电大毕业论文范文, 线性函数逼近, 车辆路径规划, 近似动态规划
喜欢：3333
阅读全文

基于模糊近似的强化学习方法研究 06月30日

基于函数逼近的物流车辆路径规划方法及应用研究 06月30日

广而告之

最新推荐

随机推荐