基于加权向量提升的多尺度聚类挖掘算法
【摘要】数据挖掘(DataMining,DM)是从包含相对复杂结构的海量动态数据库中提取潜在的、未知的、和有用知识的过程[1],因此也被称作数据库中的知识发现(KnowledgeDiscoveryinDatabase,KDD)。聚类[2]作为数据挖掘领域中的重要研究内容得到了长足的发展,聚类主要实现以下目的:将数据集中的对象分成若干类簇,以达到类簇内对象尽可能相似,而类簇间对象尽可能相异。目前有关聚类挖掘的研究已基本成熟,而当前社会是一个“跨界”的社会,将聚类挖掘技术应用于其它学科越来越受到学者们的重视,而多尺度科学[3,4]作为一门新兴学科,其相关研究也变得炙手可热,将聚类挖掘同多尺度科学结合起来实现多尺度聚类挖掘变得越来越重要。目前,多尺度聚类挖掘有了一定的研究进展,如学者孙庆先将多尺度的数据挖掘归纳为三种途径[4]:在挖掘前将单一尺度的数据转换成多个尺度的数据,然后对多个尺度的数据分别进行挖掘,即实现数据的多尺度转换;在挖掘算法中引入调节尺度用的操作部件,以控制挖掘出知识的尺度;将挖掘出的单一尺度的知识转换成多个尺度的知识,即完成知识的多尺度转换。通过前两种途径可以很容易地实现多尺度挖掘,但遇到的一个严重的问题就是需要在每一个尺度上应用挖掘算法。途径3还很少有人研究,本文对本途径进行探索,提出了一种新的算法,以解决前两种途径的多尺度聚类挖掘中所遇到的问题。本文的主要工作内容如下:提出了一种基于向量的多尺度表示方法。尺度存在于各种类型的数据库中,而不同类型的数据,其尺度的表达方式也不同,为尺度大小的比较、尺度转换工作带来了不便。本文基于向量的思想将不同数据类型的尺度表示成统一的向量形式,以方便尺度间的比较、转换操作,并为本文算法的提出奠定了基础。提出了一种基于加权向量提升的多尺度聚类挖掘算法,来完成在不同尺度上聚类的目的。算法的基本思想即是多尺度挖掘的第三种途径:首先,该算法选定一个基准尺度,并在该基准尺度上应用聚类挖掘算法以获取该尺度上的聚类结果;其次,对于用户感兴趣的其它尺度,通过应用尺度转换机制将基准尺度上的聚类结果反演出目标尺度的聚类结果,进而完成多尺度的聚类挖掘。将本文提出的算法应用于H省流动人口分析当中,进一步验证了本文算法的可行性和有效性。实验表明,该算法是可行和有效的,其聚类结果可以为相关领域的决策者提供科学的指导依据。
【作者】苏东海;
【导师】赵书良;
【作者基本信息】河北师范大学,计算机应用技术,2014,硕士
【关键词】多尺度;多尺度转换;聚类挖掘;多尺度聚类;
【参考文献】
[1]夏薇.威奇《高级视唱练耳》教材教法研究[D].武汉音乐学院,音乐与舞蹈学,2013,硕士.
[2]郁剑伟.基于Qt的电子地图子系统的设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[3]万玉婷.关于会话应答句的意义可预测性研究[D].西南大学,英语语言文学,2013,硕士.
[4]李磊磊.中学物理光学仿真实验平台的设计与开发[D].华中师范大学,现代教育技术,2014,硕士.
[5]黄琳.韩国小学汉语协作教学现状考察与研究[D].吉林大学,汉语国际教育,2013,硕士.
[6]赵波锋.基于RFID技术的移动电子商务应用研究[D].湖南大学,软件工程,2010,硕士.
[7]李继武.中国产品质量政府管制初探[D].吉林大学,国民经济学,2004,硕士.
[8]张平远.美、日对肉禽食品药残量提出新要求[J].湖南饲料.2005(01)
[9]邢晶晶.电信增值业务的商业模式研究[D].武汉大学,2004.
[10]高飞.金红石相TiO_2薄膜/ZnO纳米线复合材料的制备及其光电催化性能研究[D].上海大学,应用化学,2013,硕士.
[11]白霜.基于HS分类的中日韩产业内贸易发展研究[D].山东大学,产业经济学,2013,硕士.
[12]刘波,王凌,金以慧.差分进化算法研究进展[J].控制与决策,2007,07:721-729.
[13]廖春苗.农村空巢老人需求状况及社会工作介入研究[D].苏州大学,社会工作(专业学位),2013,硕士.
[14]杨丹.上市公司营运资金管理问题探讨[D].江西财经大学,会计学,2013,硕士.
[15]朱柏华.再谈中药现代化[J].中药材.2000(07)
[16]崔会宝.基于厚差溯源的轧辊偏心分析[D].燕山大学,机械电子工程,2014,硕士.
[17]冯志敏.我国上市公司两权分离度与政府干预对资本结构影响的实证研究[D].山东财经大学,会计学,2014,硕士.
[18]刘红.CRM的战略评价与控制[D].东南大学,2004.
[19]郝小可.基于多分类器的入侵检测系统研究及其在气象网络安全中的应用[D].南京信息工程大学,气象信息技术与安全,2012,硕士.
[20]张迎迎.呼市儿童福利院社会工作介入[D].内蒙古师范大学,社会工作(专业学位),2012,硕士.
[21]刘秋娟.《青琐高议》重写唐代小说研究[D].西南大学,中国古代文学,2013,硕士.
[22]姚庆海.马克思恩格斯人的全面发展思想及其当代价值研究[D].云南师范大学,科学社会主义与国际共产主义运动,2013,硕士.
[23]刘智益.不确定性CFD模拟方法及其应用研究[D].华北电力大学,热能工程,2014,博士.
[24]李玉茜.氯化锂水溶液表面蒸汽压的实验研究[D].浙江大学,动力工程(专业学位),2013,硕士.
[25]胡凌飞.水稻抗虫相关基因OsWRKY53及OsHI-PSKR的功能解析[D].浙江大学,农业昆虫与害虫防治,2014,博士.
[26]万绍文.英语政治演讲语篇的元功能分析[D].江苏科技大学,外国语言学及应用语言学,2013,硕士.
[27]刘玥.基于马克思主义大众化的天津特色文化发展研究[D].天津理工大学,马克思主义中国化研究,2013,硕士.
[28]邹静.从多元系统论的角度看《独立宣言》清末民初三个中译本[D].北京外国语大学,外国语言学及应用语言学,2014,硕士.
[29]王林.部分双曲微分同胚的拟极限跟踪性[D].河北师范大学,基础数学,2013,硕士.
[30]周晓琴.高中语文课堂师生互动有效性调查研究[D].山东师范大学,学科教学(专业学位),2013,硕士.
[31]谢明志.基于空战平台的数据融合研究[D].西北工业大学,控制理论与控制工程,2004,硕士.
[32]冯畅.澧南垸分洪洪水演进模拟与可视化及蓄洪调度研究[D].湖南师范大学,自然地理学,2013,硕士.
[33]李晶.引入信息修正因素的上市公司财务危机预警系统的构建[D].沈阳工业大学,会计学,2004,硕士.
[34]曹菡.空间关系推理的知识表示与推理机制研究[D].武汉大学,2002.
[35]李俊阳.基于三方博弈的中国铁路运力资源优化配置研究[D].北京交通大学,2014.
[36]何雪蕾.乳酸基聚氨酯的可控制备及其性质研究[D].华侨大学,高分子化学与物理,2013,硕士.
[37]王毅.一种混合分析型数据库引擎的设计与实现[D].复旦大学,计算机应用技术,2012,硕士.
[38]刘冬启.观道河水库周丛生物群落结构和渔产潜力的研究[D].华中农业大学,水产养殖,2001,硕士.
[39]类延翠.迷失的自我—拉康镜像理论视角下对《收藏家》的解读[D].江苏师范大学,英语语言文学,2013,硕士.
[40]庞春江,庞会静.RBAC模型的改进及其在电力ERP权限管理中的应用[J].电力系统自动化,2008,13:49-52.
[41]师梦.磷石膏综合利用工艺的关键技术研究[D].合肥工业大学,化学工艺,2013,硕士.
[42]宋小帆.中职生就业质量现状、问题及对策研究[D].鲁东大学,教育管理(专业学位),2013,硕士.
[43]马兆昆,宁淑丽,宋怀河.高导热炭纤维的研究进展[J].北京化工大学学报(自然科学版),2014,01:1-13.
[44]袁志容.臭氧—生物活性炭污水回用技术研究[D].西安建筑科技大学,市政工程,2004,硕士.
[45]李蓉.自创商誉的计量及其应用研究[D].北京交通大学,2014.
[46]周蓉.支持张量机的在线学习算法研究[D].华南理工大学,计算数学,2014,硕士.
[47]刘楠.1921-1939年英苏外交关系研究[D].黑龙江大学,世界史,2013,硕士.
[48]任红伟.波纹钢腹板预应力混凝土组合箱梁设计理论与试验研究[D].北京交通大学,2011.
[49]艾丽.小学生生命教育的社会工作介入[D].华中师范大学,社会工作,2013,硕士.
[50]高力.中国旅行社市场过度竞争研究[D].西北师范大学,产业经济学,2013,硕士.

- 下一篇: 铅锌冶炼废渣堆场土壤产黄青霉菌F1浸出修复研究
- 上一篇: 制度安排视角下的中国金融结构调整与经济发展