复杂网络社区发现若干问题研究

复杂网络社区发现若干问题研究

作者:师大云端图书馆 时间:2015-05-25 分类:期刊论文 喜欢:2082
师大云端图书馆

【摘要】近年来,复杂网络逐渐成为信息科学、社会学、物理学、乃至生命科学等学科研究的热点。所谓复杂网络,是指将自然界中的各个实体抽象为网络中的节点,实体与实体之间的关系抽象为网络中的边。这使得自然界中的很多系统都可以表示为复杂网络的形式,例如社会关系网、科学家合作网、通信网、互联网、人类疾病基因网等等。研究发现,复杂网络具有复杂的内部结构和多样的结构特征,其中,模块性(即社区结构)是复杂网络的一个重要特征,它表现出网络中的节点具有聚集化的特性,即社区内部节点之间连接稠密、社区之间的节点连接稀疏。此外,社区结构在现实世界中往往是“重叠”的。复杂网络(重叠)社区结构的发现对于分析复杂网络的拓扑结构、理解复杂网络的功能、发现复杂网络中的隐藏规律以及预测复杂网络的行为具有十分重要的意义。目前,研究者提出了众多网络(重叠)社区发现方法,并将之成功应用于现实系统的分析中,然而社区发现方法存在的问题还有很多,如复杂网络社区发现问题与聚类分析问题两者之间的关系还有待研究;网络社区发现算法尤其是重叠社区发现算法的精度和效率还有待提高;传统的划分评价函数模块化Q函数存在分辨率的限制等等。鉴于复杂网络社区发现问题与传统机器学习中的聚类分析问题都是对数据进行划分,并且机器学习中的聚类分析研究日趋成熟,本文结合机器学习相关的技术和方法,改进并提出了若干发现网络(重叠)社区的算法,主要贡献如下:(1)揭示了社区发现问题和聚类分析问题之间的区别和联系,利用聚类分析中定义的相似度概念对GN(GirvanandNewman)算法进行改进,给出了快速的SGN(GNbasedonsimilarity)算法。通过比较和分析,我们发现,在构造了网络节点的相似度矩阵以后,社区发现问题就转化为了聚类问题,并利用任意一种可靠的聚类方法对网络进行社区划分;接着,本文分析和比较了不同的网络节点相似度构造方法和不同的聚类算法在发现社区时的性能差异,并将相似度计算引入到传统的GN算法中,取代GN算法中计算非常耗时的介数计算,得到改进的GN算法SGN,从而降低了GN算法的时间复杂度。(2)提出了一种基于类原型的复杂网络重叠社区发现的一般框架,并结合实际的聚类算法进行应用。通过研究,我们发现,网络中的重叠节点往往位于各个社区的边界地区,即不同社区的交汇部分。基于这样的特征,我们利用类原型聚类算法的思想和概念,通过定义和计算网络中节点的类原型归属度信息,设计了一个基于类原型的复杂网络重叠社区发现方法的框架,并将该框架应用于几种常见的聚类算法,例如K-means算法、AP(AffinityPropagation)算法、层次聚类算法AL(AverageLinkage)和NJW(Ng,JordanandWeiss)谱聚类算法。基于我们框架的方法不仅能发现网络中的非重叠社区,而且能够有效地发现网络中的重叠社区。(3)提出了基于排序中心度的K-rank算法。类似K-means算法,K-rank:算法通过不断迭代更新各个社区的中心节点从而达到收敛。同时,K-rank算法通过计算各个节点的中心度准则(rankcentrality)找到社区的中心节点,避免了K-means算法在迭代过程中容易产生空类的情形。然后对K-rank算法进行扩展,使之能够应用于有向网、加权网以及重叠社区网络。(4)提出了一个基于贪婪优化surprise函数的社区发现方法AGSO(AlgorithmbasedonGreedySurpriseOptimization)以及它的加速算法FAGSO(Fast-AGSO)。相关文献指出,相比传统的社区划分评价标准-模块化Q函数,新的社区发现评价准则-surprise函数不存在分辨率的问题,因此在评价存在社区大小不均的网络时,surprise函数的优势明显。但是,目前缺乏相关的直接对surprise函数进行优化的社区发现方法。因此,我们采用贪婪思想,借助surprise函数的特性,提出了贪婪优化surprise函数的AGSO算法以及它的加速算法FAGSO算法,实验结果证明了贪婪优化Surprise函数方法的有效性。
【作者】姜雅文;
【导师】于剑;贾彩燕;
【作者基本信息】北京交通大学,计算机科学与技术,2014,博士
【关键词】复杂网络;社区发现;模块性;聚类;节点中心度;相似度矩阵;类原型;重叠社区;分辨率;模块化Q函数;

【参考文献】
[1]刘波.线在室内设计中的特性及运用[D].青岛大学,设计艺术学,2013,硕士.
[2]蒋建东,花京华,李鲁霞.分布式光伏阵列重构拓扑及控制方法[J].机电工程,2013,03:343-348+353.
[3]冯俊小,姜敏,周闻华,吴启明,向顺华.带烟气循环的W型辐射管流动传热及NO_x排放特性[J].北京科技大学学报.
[4]周李鹏.甘蓝型油菜抗菌核病QTL定位[D].华中农业大学,作物遗传育种,2014,硕士.
[5]张中杰.中国证券投资基金二元内部治理结构有效性研究[D].复旦大学,金融学,2012,硕士.
[6]孙长祥.限制财产权侦查措施研究[D].西南政法大学,侦查学,2012,硕士.
[7]刘帅.网络动力学格点参数各向异性效应的研究[D].中国科学院研究生院(武汉物理与数学研究所),应用数学,2014,博士.
[8]薛金勇.社会转型背景下的县级新闻网建设研究[D].安徽大学,传播学,2013,硕士.
[9]郭庆武.软测量模型生成系统研究与应用[D].南京工业大学,2003.
[10]马珊.面向Web文本数据仓库的预处理关键技术研究[D].西安电子科技大学,计算机应用技术,2011,硕士.
[11]李乐虎.民国时期高等学校体育教育发展状况研究[D].湖南师范大学,体育教育训练学,2013,硕士.
[12]高迪.口服暴露碳纳米管对小鼠胃肠道的影响[D].吉林大学,2014.
[13]常娓娓.西尼罗河病毒抗体竞争ELISA检测方法的建立及初步应用[D].扬州大学,预防兽医学,2011,硕士.
[14]张建宏.西铜高速改扩建项目可持续性后评价研究[D].长安大学,交通运输工程(专业学位),2013,硕士.
[15]吴慧慧.滇西大盈江流域河流阶地特征及其对新构造运动响应研究[D].中国地质大学(北京),地理学,2013,硕士.
[16]葛亮,张建华,余斌.智能变电站数据中心及其应用服务[J].电力系统自动化,2013,24:54-59.
[17]王永峰,李庆军.陆地生态系统植物挥发性有机化合物的排放及其生态学功能研究进展[J].植物生态学报,2005,03:387-396.
[18]张健,傅泽田.基于呼叫中心的农户服务系统需求分类算法研究[J].计算机应用研究,2005,01:34-35.
[19]邓静萱.CRO公司人才流失的成因分析与对策研究[D].北京交通大学,2013.
[20]丁修苓.边缘修饰的锯齿型碳化硅纳米条带的电学和磁学性质研究[D].吉林大学,2014.
[21]房莉.高血压左室肥厚患者与TpTe间期相关性的研究[D].桂林医学院,内科学,2012,硕士.
[22]张安伟.基于扭矩的发动机怠速控制研究[D].华南理工大学,车辆工程,2012,硕士.
[23]李春雨.软骨多糖对肺癌的抑制作用及分子作用机制[D].青岛大学,药物化学,2013,硕士.
[24]王进军.管道噪声有源控制的工程实现及应用研究[D].西北工业大学,水声工程,2004,硕士.
[25]才华.我国外汇占款对基础货币的影响研究[D].江西财经大学,金融学,2013,硕士.
[26]张文生,张关泉,宋海斌.基于混合法波场外推的波动方程基准面校正[J].石油地球物理勘探,2001,02:141-145+186-262.
[27]肖霞.胜坨油田沙二段油藏聚驱后聚表二元复合驱技术研究[D].西南石油大学,应用化学,2013,硕士.
[28]石艳.水泥混凝土路面裂缝修补料制备与性能研究[D].长安大学,材料学,2014,硕士.
[29]刘勇国,李学明,廖晓峰,吴中福.基于数据挖掘的入侵检测[J].重庆大学学报(自然科学版),2002,10:128-131+135.
[30]闫辉.公司非破产清算中债权人利益保护[D].苏州大学,法律(专业学位),2014,硕士.
[31]武懿嘉,沈韦韦,张云灿.亚临界流体与高剪切应力对EPDM废胶粉脱硫反应的影响[J].高分子材料科学与工程.
[32]刘新东,江全元,曹一家.基于功角受扰轨迹拟合的暂态稳定快速预测[J].电力系统自动化,2008,19:5-9.
[33]王婕.山西省中老年人握力水平的比较研究及相关因素分析[D].中北大学,民族传统体育学,2013,硕士.
[34]李安.衬垫单面焊热过程研究[D].武汉理工大学,材料加工工程,2012,硕士.
[35]范建,曾琳,颜瑞.煤机装备再制造性评估实证研究[J].煤炭工程,2014,12:123-125.
[36]焦义明.脑缺血预处理对大鼠脑内Nogo-A及受体NgR表达的影响[D].郑州大学,神经病学,2013,硕士.
[37]仪文卿.审美文化视野中的徐福形象研究[D].鲁东大学,文艺学,2014,硕士.
[38]陈剑,贾杰,闻英友,赵大哲,刘积仁.基于TDMA方式WMN中一种链路调度机制研究[J].控制与决策,2010,09:1349-1353+1358.
[39]陈佑剑.常见过渡金属碳化物的制备及其性能研究[D].温州大学,应用化学,2012,硕士.
[40]孙善星.大跨度索穹顶结构施工过程模拟分析[D].西安建筑科技大学,结构工程,2013,硕士.
[41]吕晓辉.浅析工业遗迹改造对城市文化生态的影响[D].河北工业大学,设计艺术学,2013,硕士.
[42]徐肖肖.基于煤矿物联网的智能定位终端的设计及定位研究[D].中国矿业大学,通信与信息系统,2014,硕士.
[43]刘欢.日本、意大利产业集群竞争优势分析[D].吉林大学,世界经济,2004,硕士.
[44]戴玉勤,景广军,谢俊元.基于数据仓库技术的银行决策支持系统设计和实现[J].计算机工程与应用,2002,05:224-227.
[45]崔静.农村信息资源配置效率评价研究[D].南京农业大学,情报学,2012,硕士.
[46]严冲.复合材料梁腹板的剪切屈曲研究[D].哈尔滨工业大学,固体力学,2013,硕士.
[47]臧宏.农垦宝泉岭管理局农业社会化服务研究[D].内蒙古农业大学,农业推广,2013,硕士.
[48]张宏燕.我国乡镇领导干部选拔任用研究[D].大连海事大学,公共管理,2014,硕士.
[49]李明泽.不同加工方式对青稞中β-葡聚糖含量及其生理功效的影响[D].西南大学,农产品加工及贮藏,2013,硕士.
[50]王秀杰.企业经营管理分析体系深化应用实施[D].北京交通大学,软件工程,2012,硕士.

相关推荐
更多