基于模糊近似的强化学习方法研究 06月30日
【摘要】强化学习是一种用于求解可以建模为马尔科夫决策过程问题的机器学习方法,其通过Agent与环境交互以获得最大累计奖赏的方式进行学习。当前强化学习面临的主要挑战和机遇是如何求解大规模状态或动作空间的问题。本文将模糊推理作为近似方法用于强化学习算法中,针对当前已有的基于模糊推理的强化学习算法的不足,提出几种改进的基于模糊推理和基函数优化的值函数近似算法:(1)针对传统的基于查询表或函数近似的Q值迭 […]
基于函数逼近的物流车辆路径规划方法及应用研究 06月30日
【摘要】物流车辆的路径规划问题关系到车辆运输成本和物流活动效率的高低,是我国物流产业转型升级过程中必须解决的重要问题。信息技术和通信技术的快速发展和广泛应用、新型的物流形式如电商生鲜物流等都促进了实时动态路径规划方法的发展和应用。本文从当前物流活动的新形势出发,以解决随机多车辆路径规划问题的维数灾为目标,以近似动态规划理论和函数逼近技术为工具,针对物流活动中应用普遍但求解困难的带随机需求和服务期限 […]