Robocup3D仿真机器人球队决策系统模型研究 10月30日
【摘要】仿人机器人学是结合了多门学科的一个综合性研究方向,是机器人学中对更智能机器人的探索。人工智能领域里的多智能体系统(MultiAgentSystem)一直是学者们的研究焦点。作为智能体的机器人,它们之间为完成一个统一的任务而协作配合时,需要将大任务划分为多个小任务,并未每个机器人分配角色位置。这就引出了机器人群体的角色位置分配和全队决策问题。本文以Robocup仿真3D机器人踢足球为研究背景 […]
基于性能势的智能体学习与规划方法研究 06月25日
【摘要】强化学习和智能规划是当前人工智能领域的研究热点。生活中的众多顺序决策问题都可以用马尔科夫决策过程(MDP)进行描述,基于MDP的性能势理论为上述问题的求解优化提供了一种新的理论框架,它可以利用样本轨道的估算对参数未知的系统进行在线优化和求解。当系统状态转移矩阵、奖励函数等参数未知时,强化学习通常被用来对系统的最优策略进行学习,该特点使其能够很好地与性能势理论相结合,从而得出更有效率的在线优 […]