基于聚类的协同过滤个性化推荐算法研究
【摘要】随着信息技术和互联网的快速发展,信息资源成指数级别增长,面对严重过载的信息,用户很难快速定位到对自己有用的信息资源,从而耗费大量的时间搜寻自己想要的内容。这使得推荐系统应运而生,它能够根据不同用户的喜好来有针对性地为其提供个性化推荐服务。目前,在众多的个性化推荐技术中,协同过滤算法表现出其独有的优势,以致它被广泛的应用,特别在电子商务领域取得了相当大的成功,但是传统的协同过滤算法存在数据稀疏性、冷启动、实时性等问题,如果能有效的克服,不仅能够提高用户满意度,同时还提高销售利润。本文以推荐系统为基础,以推荐技术为主线,研究了个性化推荐系统,个性化推荐算法及相关技术,并进行比较分析;接着针对目前应用较好的协同过滤算法的问题,引入了项目属性和用户特征来构建项目属性矩阵和用户特征矩阵,提出基于用户相关相似性和基于项目相关相似性计算方法;另外,对聚类技术进行了相关研究,利用Kruskal算法对传统K-means聚类进行改进,实现自动确定初始聚类中心;最后对基于用户和项目方向的聚类进行了相关研究,提出将基于项目属性聚类的初始预测结合基于用户特征聚类的最终预测来做出推荐。主要在如下几个方面做了研究工作:第一,针对传统协同过滤算法过度依赖于用户—项目评分矩阵会面临严重的数据稀疏性问题、冷启动问题,本文将用户特征信息和项目属性信息有效利用,避免出现“相似而不相同”的现象的同时也克服了新项目和新用户问题,提出了分别基于项目属性和基于用户特征相关的相似性计算方法;第二,对传统K-means聚类进行了深入研究,针对其初始聚类中心人为随机选择敏感的问题,提出了一种能够自动生成相对比较均匀分布的K个初始聚类中心的改进聚类算法;第三,为有效的降低了协同过滤算法中近邻查询空间,同时在项目属性和用户特征矩阵上分别采用改进后的聚类算法进行聚类,明显能降低计算维度,提高推荐效率;第四,针对用户评分稀疏性问题,结合基于项目聚类的邻居查找结果和原始评分矩阵做基于项目的初始预测填充原始评分矩阵。其中,缺乏评分的新用户或新项目用本文前面改进的相关相似性计算方法代替传统评分相似性查找邻居,克服了冷启动问题;最后,将基于用户聚类的邻居查找结果结合填充完好的评分矩阵做基于用户的最终评分预测,使推荐精度较高。第五,为了验证本文提出的改进算法的有效性,在所选MovieLens数据集上分别将该改进的协同过滤算法与一些传统的协同过滤算法进行了分析和对比实验。实验结果表明该方法最终推荐质量优于其他传统推荐算法。
【作者】袁利;
【导师】张大斌;
【作者基本信息】华中师范大学,管理科学与工程,2014,硕士
【关键词】推荐系统;协同过滤;聚类;用户特征;项目属性;
【参考文献】
[1]刘艳敏.城市化进程中失地农民的权利保障[D].河北师范大学,宪法学与行政法学,2012,硕士.
[2]黄子春.工程监理项目风险管理的研究[D].西安建筑科技大学,建筑与土木工程,2004,硕士.
[3]李沛.1949-1956年中国高校知识分子的政治认同变迁分析[D].华中科技大学,马克思主义中国化研究,2012,硕士.
[4]许雯.小学科学教科书插图研究[D].首都师范大学,课程与教学论,2013,硕士.
[5]卢玉栋.新型淀粉基造纸助剂的研制及作用机理研究[D].福建师范大学,高分子化学与物理,2004,硕士.
[6]张道全.英语小说的翻译技巧[D].复旦大学,英语笔译,2012,硕士.
[7]朱晓春.Likert量表在文明指数调查中的作用[D].苏州大学,应用统计(专业学位),2013,硕士.
[8]周震.后石墨烯和无机石墨烯材料:计算与实验的结合[A].中国化学会.中国化学会第28届学术年会第4分会场摘要集[C].中国化学会:,2012:1.
[9]陈元桂.冯友兰新理学的“理”范畴研究[D].湘潭大学,中国哲学,2003,硕士.
[10]康彩红.CFP汉华易美图片库发展战略研究[D].首都经济贸易大学,工商管理(专业学位),2013,硕士.
[11]王爱林.中美高校高水平运动队管理模式的比较研究[D].南京体育学院,体育人文社会学,2012,硕士.
[12]邓婷.化工物流园区铁路危险货物运输车辆调配模式优化研究[D].北京交通大学,物流工程(专业学位),2013,硕士.
[13]王贵栋.关于李三代数的幂零性[D].河北大学,基础数学,2003,硕士.
[14]江南.部门治理中“裸官”监督研究[D].华中师范大学,行政管理,2014,硕士.
[15]王磊.复杂地形环境下的无人机导航问题研究[D].哈尔滨工业大学,飞行器设计,2013,硕士.
[16]李王丽.Notch1和Jagged1蛋白在大肠腺癌组织中的表达及临床病理意义[D].辽宁医学院,病理学与病理生理学,2012,硕士.
[17]刘琳.海拉尔第三中学蒙古族学生英语课堂学习焦虑调查[D].内蒙古师范大学,学科教学(专业学位),2012,硕士.
[18]员振铎.部队医院军人医疗服务信息系统的开发与实现[D].内蒙古师范大学,地图学与地理信息系统,2013,硕士.
[19]闫兴国.A风力发电公司人力资源规划研究[D].兰州大学,工商管理(专业学位),2013,硕士.
[20]陈江海.论我国社区矫正制度的完善[D].云南财经大学,法律(专业学位),2013,硕士.
[21]张立勇.开孔泡沫铝孔结构及力学性能研究[D].合肥工业大学,材料加工工程,2004,硕士.
[22]有清.企业决策的驱动力[N].中国财经报,2002-08-08004.
[23]姜雪娜.政府补助与企业社会责任[D].西南交通大学,会计学,2014,硕士.
[24]邓亚曦.从释意理论看简约技巧的使用对即兴演讲汉英交传质量的影响[D].北京外国语大学,翻译,2014,硕士.
[25]鲁斯唯.海峡西岸经济区大气污染物排放清单研究[D].厦门大学,环境科学,2014,硕士.
[26]尤克民.丝素蛋白多孔支架联合硫酸软骨素酶ABC治疗大鼠脊髓损伤[D].苏州大学,骨外科学,2014,硕士.
[27]徐晓(龙天).风湿性疾病中高同型半胱氨酸血症的研究[D].山西医科大学,心血管内科,2003,硕士.
[28]王乾龙,李硕,卢艳丽,彭杰,史舟,周炼清.基于大样本土壤光谱数据库的氮含量反演[J].光学学报,2014,09:308-314.
[29]冉华明周锐董卓宁车军.空战中协同干扰、探测、攻击任务分配[J].北京航空航天大学学报.
[30]曹世超.船舶轴带式电站系统分析及可靠性预计[D].大连海事大学,电气工程,2013,硕士.
[31]翟敏.极限学习机的自适应网络结构选择方法研究[D].西北大学,应用数学,2014,硕士.
[32]肖鹏钻.基于项目的协作学习系统研究与实现[D].吉林大学,软件工程,2014,硕士.
[33]杜兰.仙桃市农村居民点空间格局演变与驱动力研究[D].华中师范大学,土地资源管理,2014,硕士.
[34]马伟伟,贾新春,张大伟.双率采样系统的基于观测器的网络化H_∞控制[J].自动化学报.
[35]李浣.警校大学生核心自我评价与就业焦虑的相关性研究[D].吉林大学,应用心理,2013,硕士.
[36]张莹,韩芳溪,柴乔林.基于频繁模式树的AOI聚类算法[J].计算机工程与应用,2004,35:178-179+217.
[37]陈妮.御景园房地产项目投资风险管理研究[D].西安石油大学,项目管理,2011,硕士.
[38]薛倩倩.宽带多媒体卫星通信系统PVC信令的设计与实现[D].西安电子科技大学,电子与通信工程,2012,硕士.
[39]韩军.解读银行信息化[J].金卡工程.2005(08)
[40]张冬生.基于计算机视觉的三维测量技术[D].华北电力大学(河北),控制理论与控制工程,2004,硕士.
[41]卫萌.心理授权对员工创新行为的影响研究[D].安徽大学,企业管理,2013,硕士.
[42]井大为.多媒体教学软件系统的设计与实现[D].山东大学,软件工程(专业学位),2013,硕士.
[43]石薇.非正规部门对居民收入的影响力度与影响路径[D].浙江工商大学,统计学,2012,硕士.
[44]邓肖夫.建设工程施工项目资源配置评价模型研究[D].中南林业科技大学,结构工程,2013,硕士.
[45]孙凯.R&D信息披露的价值相关性研究[D].西安科技大学,企业管理,2013,硕士.
[46]季卫丹.hSulf-1基因腺病毒表达载体的构建及其抗肿瘤机制的实验研究[D].苏州大学,遗传学,2012,硕士.
[47]金崇富.京海黄鸡IGF-IR、IGFBP-3基因多态性及其与生产性能的相关性研究[D].扬州大学,动物遗传育种与繁殖,2011,硕士.
[48]吴黎明.针刺配合麦粒灸涌泉穴治疗中风后抑郁症的临床研究[D].广州中医药大学,针灸推拿学(专业学位),2013,硕士.
[49]李志华.真空中煤还原氧化镁的研究[D].昆明理工大学,2004.
[50]赵芳.高血压病及相关疾病的社区新型综合防治模式效果评估[D].山西医科大学,社会医学与卫生事业管理,2003,硕士.

- 下一篇: 电子商务生态链信息流转效率研究
- 上一篇: 基于网络技术的政府采购招标流程优化
相关推荐
- 自媒体化网络广播电台“云传播”机制研究
- 11月23日
- 国际银行标准实务(ISBP745)法律问题研究
- 02月15日
- 玛咖组织培养再生系统的建立及组培苗遗传稳定性的分析
- 07月16日
- 单比特传输系统预均衡技术研究
- 10月04日