基于状态空间划分的预测状态表示模型获取研究
【摘要】预测状态表示(PredictiveStateRepresentation,PSR)方法是对动态系统建模的有效方法。相比其它建模方法,PSR具有表征能力强、模型易于学习等优点,可以有效地解决局部可观测问题。但传统的研究方法大都是在整体状态空间上获取系统的PSR模型,计算复杂、模型获取相对困难,已有相关算法通常仅适用于规模较小的系统。在本文工作中,通过研究系统状态空间划分机制,将整个状态空间划分为多个子状态空间,降低了获取系统PSR模型的难度,进而提出基于状态空间划分的PSR模型算法及基于状态空间划分的转移预测状态表示(TransformedPredictiveStateRepresentation,TPSR)模型获取算法,实现了较大规模系统中系统PSR模型的获取。本文主要研究内容及成果包括以下几个方面:(1)提出状态空间划分机制。通常情况下,系统的状态数量会随着系统规模的增大而增多,从而增加了获取系统整体的PSR模型的难度。本文根据landmark的特性,以landmark为划分状态空间的临界点,把整体状态空间划分为几个规模较小的子状态空间。进行状态空间划分后,只需分别获取状态数量一般都小于整体状态空间的状态数量的各个子状态空间对应的PSR模型,降低了模型获取的难度。(2)提出一种基于状态空间划分的PSR模型获取算法。该算法根据状态空间划分机制,将较大规模系统的整体状态空间划分为几个较小的子状态空间,进而学习各子状态空间对应的PSR模型;并根据这些子状态空间的PSR模型,构建系统整体的PSR模型后,可对任意事件进行预测。实验仿真结果表明所提算法是有效的。(3)提出基于状态空间划分的TPSR模型获取算法。随着系统规模的增大,发现检验核这一过程的时间复杂度和计算量通常也相应增大,为了进一步减小模型获取的复杂性,本文在对状态空间划分后,通过引入主成分分析(PrincipalComponentAnalysis,PCA)方法,提出基于状态空间划分的TPSR模型获取算法。该算法使用PCA方法对各个子状态空间的经历-检验矩阵进行降维,直接利用降维后的矩阵获取各个子状态空间的TPSR模型,无需发现检验核,简化了模型学习过程。实验仿真结果表明了所提算法的有效性。
【作者】陈珍珍;
【导师】刘云龙;
【作者基本信息】厦门大学,系统工程,2014,硕士
【关键词】动态系统建模;状态空间划分;预测状态表示;转移预测状态表示;
【参考文献】
[1]王冠雄.汽油机水套内过冷沸腾传热的影响因素分析及模拟计算[D].吉林大学,工程热物理,2013,硕士.
[2]丁海鸣.基于嵌入式Linux的烟道粉尘测定仪远程监控系统设计与实现[D].东华大学,控制理论与控制工程,2004,硕士.
[3]王沛雯.公司特征对会计稳健性的影响[D].北京交通大学,2014.
[4]蔡宇东.AES算法的高速实现[D].浙江大学,电路与系统,2004,硕士.
[5]王昭.海州常山的化学成分研究[D].湖北中医药大学,中药学,2013,硕士.
[6]周萍.广州市海珠区外来人口管理模式探究[D].东北师范大学,公共管理(专业学位),2012,硕士.
[7]李慧,陈健飞,余明.线性光谱混合模型的ASTER影像植被应用分析[J].地球信息科学,2005,01:103-106+115.
[8]许伶俐.地县级城市品牌营销与传播探究[D].湖北工业大学,设计艺术学,2013,硕士.
[9]陆勇星,朱凌宏.精密球偏心研磨加工参数仿真优化[J].机械强度,2013,01:33-40.
[10]张璐.子宫内膜异位症相关性卵巢癌的临床病理特征[D].山东大学,临床医学(专业学位),2013,硕士.
[11]邵义元.基于数据集成的智能决策支持技术应用于工业过程建模与优化[J].九江师专学报,2002,06:38-42.
[12]刘振鹏,张沧生,常胜,李继民.FICSAM:一种适用于大型适应性系统的单例学习方法[J].计算机应用研究,2005,02:43-45.
[13]衷路生,宋执环.基于正交梯度搜索的动态系统递阶优化辨识[J].自动化学报,2008,06:711-715.
[14]吕珂.基于融合策略的视觉目标跟踪算法研究[D].中国地质大学(北京),电子与通信工程,2013,硕士.
[15]乔钰涵.《你想吃什么?》教学设计[D].吉林大学,汉语国际教育,2013,硕士.
[16]朱英福.日本开放式学校研究[D].华东师范大学,比较教育学,2004,硕士.
[17]李荣有,郝赫.“蔡元培梁启超美育艺术教育思想与当代文化建设”全国学术研讨会综述[J].艺术百家,2013,02:252-253.
[18]王伟.政府监管视角下建筑产业竞争力问题研究[D].华侨大学,公共管理(专业学位),2013,硕士.
[19]叶凌.论中国农业产业化发展及其“股田制”经营模式[D].西南财经大学,工商管理,2003,硕士.
[20]王丽爱.研究思维进化计算的多峰优化性能及研究算法参数对效率的影响[D].太原理工大学,计算机软件与理论,2004,硕士.
[21]杨辉.欧陆微机数采系统在锅炉生产监控中的应用[J].冶金自动化,1999,02:53-55.
[22]缪立强.物流综合信息平台中信息的安全性设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[23]曹智.六年人参和高丽参加工品化学成分研究[D].吉林农业大学,作物栽培学与耕作学,2012,硕士.
[24]章谷雅.法人犯罪的刑事责任及其立法完善[D].四川大学,法律,2003,硕士.
[25]李中男.基于Android系统的一机双号拨号软件的设计与实现[D].北京交通大学,2014.
[26]齐晓鸿.一个求解多目标问题的算法:Pareto-MEC[D].太原理工大学,计算机软件与理论,2004,硕士.
[27]杨明,孙志挥.快速关联规则挖掘与更新算法[J].计算机科学,2002,08:88-90.
[28]成思危.成思危《虚拟经济论丛》专栏虚拟经济探微[J].发现,2004,05:39-42.
[29]成渠.用H13代替3Cr2W8V提高铝合金压铸模使用寿命[J].航空工艺技术.1991(04)
[30]刘莎莎.面向低碳属性的信息化评价体系指标权重研究[D].首都经济贸易大学,产业经济学,2013,硕士.
[31]李彩琼.三角范畴中的余挠偶[D].湖南师范大学,基础数学,2013,硕士.
[32]刘风.FVB小鼠肾脏对急性缺血再灌注损伤的抗性及其分子机制[D].福建医科大学,内科学,2014,硕士.
[33]冯云超.甘草及无花果双水相萃取物的酪氨酸酶抑制及抗氧化活性研究[D].华中科技大学,无机化学,2013,硕士.
[34]成蕊.基于TD煤炭专网语音用户面系统的研究与实现[D].西安科技大学,信号与信息处理,2013,硕士.
[35]袁冬.基于海量文本的语义构建方法研究[D].中国海洋大学,2012.
[36]李程.通过PI3K/Akt信号传导通路探讨丹参对大鼠肝缺血再灌注损伤的保护作用[D].辽宁医学院,外科学,2012,硕士.
[37]陈婷婷.吐鲁番木卡姆“托克逊版”音乐文化调查研究[D].中央音乐学院,木卡姆研究,2012,硕士.
[38]孙驷腾.我国证券投资基金税法制度的缺失及优化研究[D].西南政法大学,经济法学,2012,硕士.
[39]高好考.K_(ATP)通道介导的一氧化氮对心肌细胞缺氧复氧损伤保护作用的研究[D].第四军医大学,内科学,2004,硕士.
[40]冀培林.贵霜王朝时期中亚地区佛教兴盛原因和影响[D].内蒙古师范大学,专门史,2012,硕士.
[41]孙磊.环境相邻权研究[D].黑龙江大学,民商法学,2014,博士.
[42]韦庆芬.现代汉语叫喊类动词研究[D].南京师范大学,汉语言文字学,2012,硕士.
[43]衣沈妮.CRRT治疗后SIRS患者相关指标的变化及意义[D].青岛大学,护理学,2013,硕士.
[44]李调军.浅水域勘探中的串道接收法[J].石油地球物理勘探,1980,S1:81-84.
[45]祝芹.民事诉讼鉴定人制度研究[D].中国政法大学,诉讼法学,2013,硕士.
[46]黎莉.必然的堕落—原型批评视角下克里斯托弗·马洛的悲剧研究[D].湖南师范大学,英语语言文学,2014,硕士.
[47]纪瑞华.我国通用航空立法若干问题研究[D].内蒙古大学,法律,2014,硕士.
[48]徐亚运.健身气功五禽戏竞赛功法鹿奔动作的运动生物力学分析[D].北京体育大学,民族传统体育,2013,硕士.
[49]孙磊.基于张量判别分析的步态识别算法研究[D].哈尔滨工业大学,控制科学与工程,2013,硕士.
[50]孙超.急性乙型肝炎前驱期发热与肝衰竭的相关性研究[D].山东大学,内科学,2013,硕士.
- 下一篇: 不同临床型别申克孢子丝菌黑素含量的研究
- 上一篇: 乳腺癌保乳术后调强放疗与三维适形放疗的剂量学比较