基于张量分解的缺失数据插补算法的研究
【摘要】随着计算机技术在各个领域的广泛应用,需要处理的数据维数越来越高。在网络交通分析,化学数据分析等领域,采样数据通常是部分缺失的高维形式。要想对这些部分缺失的高维数据进行分析和处理,通常需要对缺失的部分进行插补。传统的处理数据缺失的方法大部分是针对向量或者矩阵形式的低维数据,对于高维数据,往往将其展开成向量或者矩阵形式进行处理,但是这无疑破坏了数据本身的结构特性,插补准确度较低。近几年的研究将张量分解及高维数据的插补结合了起来,提出了一系列的算法。本文对这些算法进行了研究,提出了3种新的算法,并通过仿真实验与这些算法进行了比较。针对基于张量分解的缺失数据插补问题,本文所做的具体工作如下:1、针对小规模稠密张量的插补问题,提出了Tucker-ALS算法。经典的PARAFAC-ALS算法采用得是张量分解中的CP分解模型,采用最大期望值法解决最小二乘问题,但是速度慢,插补准确度不够高。本文提出的Tucker-ALS算法思想与其类似,但是采用的是Tucker分解模型,插补速度更快。2、针对中小规模稠密张量的插补问题,提出了Tucker-WOPT算法。目前较好的PARAFAC-LM算法通过求二阶偏导数解决最小二乘问题,而CP-WOPT算法通过求梯度值来解决最小二乘问题,这两种算法都是基于张量分解中的CP分解模型的。而本文提出的Tucker-WOPT算法采用Tucker分解模型,通过求因子矩阵的一阶偏导数解决最小二乘问题,并推导出了快速计算公式。Tucker-WOPT算法比这两种算法能够获得更高的插补准确度,并且随着数据缺失比例的增加,这种优势越来越明显。3、针对大规模稀疏张量的插补问题,提出了Tucker-SOPT算法。该算法和稀疏张量的CP-WOPT算法的思想类似,只不过本文采用的是Tucker分解模型。本文推导出了稀疏张量与矩阵的n-模积的计算方法,并推导出了稀疏张量的Tucker分解模型的因子矩阵的一阶偏导数计算方法。Tucker-SOPT算法与稀疏张量的CP-WOPT算法运算速度基本相同,但是插补准确度更高。
【作者】朱彦君;
【导师】吴向阳;
【作者基本信息】杭州电子科技大学,计算机软件与理论,2014,硕士
【关键词】张量分解;缺失数据;最大期望值法;梯度优化;高维数据插补;
【参考文献】
[1]李生杰,任翠霞,务宗文.叠后高分辨率处理方法研究及效果分析[J].石油地球物理勘探,1996,02:270-277+308.
[2]闫斌.德国对华投资对中德双边贸易额的影响分析[D].山东财经大学,国际商务(专业学位),2014,硕士.
[3]蒋珍.我国利率市场化法律问题研究[D].华中师范大学,法律,2014,硕士.
[4]张雄伟.基于Copula函数的VaR方法在投资组合中的应用研究[D].兰州大学,应用统计(专业学位),2013,硕士.
[5]刘扬.Hedgehog信号通路调控牛肌卫星细胞增殖和分化的研究[D].西北农林科技大学,动物遗传育种与繁殖,2014,博士.
[6]张海平.黄河拉西瓦水电站果卜岸坡稳定性预测及失稳预报研究[D].成都理工大学,地质工程,2011,硕士.
[7]刘艳娟.关联交易合同法律效力问题研究[D].西南政法大学,民商法学,2012,硕士.
[8]李馨欣.基因转染RP105抑制TLR4对大鼠心肌缺血再灌注损伤的保护及机制研究[D].三峡大学,免疫学,2013,硕士.
[9]沈红健.特发性正常压力脑积水患者神经心理及影像学特征的研究[D].第二军医大学,神经病学(专业学位),2013,硕士.
[10]周菊芳.西部大开发中非理性需要的作用及其引导[D].首都师范大学,马克思主义理论与思想政治教育,2003,硕士.
[11]王月,冯连勇,牛燕.世界石油物探市场及物探技术发展趋势分析[J].石油地球物理勘探,2008,06:736-741+612+742.
[12]王琳.潍坊十笏园建筑装饰特点研究[D].河北科技大学,设计艺术学,2012,硕士.
[13]栾一琳.形式美在珠宝首饰设计中的应用[D].中国地质大学(北京),设计艺术学,2014,硕士.
[14]薛同思.MIMO-OFDM系统时变信道估计算法研究[D].江苏科技大学,电子与通信工程(专业学位),2013,硕士.
[15]雷静.有机硅改性聚醚型聚氨酯的合成与表征[D].燕山大学,化学工艺,2014,硕士.
[16]智朴.兴隆洼文化陶器分期及相关问题研究[D].辽宁大学,考古学及博物馆学,2012,硕士.
[17]叶竹花.基于校园网的网络智能教学平台的研究与设计[D].福州大学,计算机应用技术,2004,硕士.
[18]余竹.基于移动荷载作用下结构响应及小波分析的桥梁损伤诊断研究[D].北京交通大学,桥梁与隧道工程,2014,博士.
[19]余效强.尖晶石型纳米晶Mn_xZn_(1-x)Fe_2O_4微结构及其磁性研究[D].内蒙古科技大学,凝聚态物理,2014,硕士.
[20]杨芳儿,沈涛,郑晓华,郑晋翔.基片温度对脉冲激光沉积CN_x薄膜的组织结构和摩擦学性能的影响[J].真空科学与技术学报,2013,04:371-376.
[21]马秀静.我国上市公司非鉴证服务与审计独立性关系的实证研究[D].山东财经大学,会计学,2013,硕士.
[22]章轼辙.以氧化锰为活性组分的脱硝催化剂的研究[D].重庆大学,化学工程(专业学位),2014,硕士.
[23]刘宁,王龙春,蒋金水,李春波,赵汝嘉.CIMS环境下自适应系统开发方法的研究[J].一重技术.1997(04)
[24]田银.基于NFCS—CAF数据挖掘算法研究[D].西南农业大学,2003.
[25]祝慧.第十二届世界杯中外男排技术运用效果研究[D].河北师范大学,体育教育训练学,2013,硕士.
[26]刘洋.变压器绕组状态监测与故障诊断系统设计[D].沈阳工业大学,电机与电器,2013,硕士.
[27]李昊旻.炎症、糖基化终末产物、葡萄糖及胰岛素对单核—巨噬细胞系THP-1细胞功能的影响[D].大连医科大学,内科学,2012,硕士.
[28]肖思敏.交叉与综合:中学历史学科渗透的理性思考[D].福建师范大学,教育,2003,硕士.
[29]林彦.客户资源价值评价体系及价值挖掘研究[D].南京航空航天大学,2005.
[30]海娜.针对智能手机上新闻阅读的用户界面改进[D].清华大学,管理科学与工程,2013,硕士.
[31]李冰.有无格栅垫层夯实水泥土楔形桩复合地基工作性状对比研究[D].湖南工业大学,岩土工程,2012,硕士.
[32]叶倩倩.中小企业动态业绩评价[D].浙江工业大学,2013.
[33]刘国成,王永骥.一种基于改进粒子滤波的多目标跟踪算法[J].控制与决策,2009,02:317-320.
[34]林祥海,张建良,陈杉杉,孔德文,苏步新.迁钢2号高炉霍戈文热风炉最佳煤气流量的数值模拟[J].冶金自动化,2011,02:41-44.
[35]杨学成.亚临床肾上腺皮质肿瘤激素分泌状态的基础与临床研究[D].青岛大学,外科学,2014,博士.
[36]戴箭胜.放电等离子体推进火花能量控制系统的高速数据采集处理技术研究[D].南京理工大学,导航、制导与控制,2013,硕士.
[37]王龙女.The Training of Translators in Huanqiu Project[D].西安外国语大学,英语翻译,2014,硕士.
[38]孙敬兰.陕西省历史文化名镇名村保护与发展中的问题与对策[D].西安建筑科技大学,设计艺术学,2013,硕士.
[39]张泱泱.电动汽车信息终端数据存储技术研究[D].广东工业大学,电力电子与电力传动,2014,硕士.
[40]董丽彬.卡马西平及七十味珍珠丸对大鼠海马CA1区、顶叶皮质区神经细胞凋亡的影响[D].河北医科大学,神经病学,2013,硕士.
[41]王雪飞,张一农,秦军.国外互联网管理经验分析[J].现代电信科技.2007(05)
[42]王龙生.黄土坡面细沟流水动力学特性试验研究[D].华中农业大学,水土保持与荒漠化防治,2014,硕士.
[43]余博,刘小龙,任兴武,李柏松.年产10万吨发动机铸件车间设计[J].中国铸造装备与技术,2015,02:51-56.
[44]裴圣军.萨缪尔森经济伦理思想研究[D].中共中央党校,伦理学,2014,博士.
[45]张巍巍.氢可调控氧化石墨烯的化学结构和特性[N].科技日报,2012-05-24002.
[46]李韶光.基于入侵容忍技术的监管体系结构研究[D].电子科技大学,2004.
[47]田润泽.《隐蔽的秩序》(第二、三章)翻译项目报告[D].华中科技大学,翻译,2013,硕士.
[48]刘萍,别荣芳.基于交易数据库的关联规则生成算法FAS及其应用[J].计算机应用,2005,06:1376-1378+1381.
[49]刘玉龙.椭偏仪校准方法研究[D].中国计量科学研究院,测试计量技术及仪器,2014,硕士.
[50]李艳军.FeCrAl多孔材料的制备及抗硫化腐蚀性能研究[D].东北大学,材料学,2011,硕士.
- 下一篇: 面向智能服务机器人的物体感知研究
- 上一篇: 连铸坯感应加热过程建模与优化控制研究
相关推荐
- 卓越教师的个性特征与成长机制研究
- 08月18日
- H19/IGF2印记簇在骨骼肌发育中的调控机理初步研究
- 08月23日
- 当代大学生健康人格培养研究
- 10月02日
- 河南栾川三道沟铅锌矿同位素地球化学特征及成因分析
- 12月31日