基于数据挖掘的微博用户兴趣群体发现与分类
【摘要】微博即微型博客,是一种以关注分享为模式的新兴社交媒体,其内容少、发布快、形式多样正好迎合了人们对信息实时的、准确的、多样的分享交流需求,因此受到广大用户的欢迎与喜爱,而微博本身一跃成为当代互联网领域新兴、火热的明星。人们热衷在微博上获取最新资讯,表达自己观点,分享喜爱的事物。用户在使用微博的时候,浏览什么样的内容,关注什么样的好友是根据其兴趣、偏好、习惯来确定的,所以了解用户本身的兴趣就能够了解到用户大概的关注范围与爱好内容,而“物以类聚,人以群分”,对于拥有相同爱好的用户群体的发现有助于为微博推广、微博营销、好友推荐等提供新的切入点与研究思路。但微博用户数量庞大,每个用户都是一个独立的个体,确定什么样的标准,使用什么样的方法,借助什么样的工具去发现用户兴趣群是本文所要解决的问题。数据挖掘方法能够找到海量数据中有潜在价值的知识与模式,所用到的数学算法在经过多年完善修正已经日趋稳定,在金融、电信等领域的应用也有很多的成功案例,而在微博用户兴趣群发现上的应用还没有成熟,本文尝试使用数据分析的方法、借助数据挖掘工具去探索微博用户的习惯、兴趣与偏好,同时也希望拓展数据挖掘应用于微博范围上的研究,以提供新的思路与借鉴。本文以五章的内容尝试探索微博用户兴趣群发现。首先在绪论中阐述了研究微博用户兴趣的重要意义、国内外有关数据挖掘与微博用户兴趣的研究现状与本文的主要内容、研究方法和论文创新点,然后对于数据挖掘概念、流程、方法、算法进行了梳理与探讨,之后提出了基于数据挖掘的微博用户兴趣群体发现的方法与进行聚类分析的数据的标准化方法,最后通过互联网新浪微博上收集的用户数据进行了实证研究,并提出了相应的应用结论与对今后展望。
【作者】曾珂;
【导师】陈菁华;
【作者基本信息】华中师范大学,管理科学工程,2014,硕士
【副题名】以新浪微博为例
【关键词】数据挖掘;微博;用户兴趣;兴趣群;聚类分析;
【参考文献】
[1]苑书金,董敏煜,魏修成,瞿祥明.横向各向同性介质中的反射波旅行时分析[J].石油地球物理勘探,2001,04:488-494+516.
[2]顾华杰,王周平.GO-SELEX技术筛选大田软海绵酸适配体[A].中国食品科学技术学会.中国食品科学技术学会第十一届年会论文摘要集[C].中国食品科学技术学会:,2014:2.
[3]刘超群.我国社会保障水平区域差异分析及协调发展对策研究[D].山东财经大学,社会保障,2013,硕士.
[4]本报记者张进中.宁波:向创新要质量效益[N].光明日报,2014-05-14001.
[5]姚宇峰.SZ电信公司IT服务管理体系设计与实施[D].西北大学,工商管理(专业学位),2012,硕士.
[6]全勇.一种弱耦合电子商务系统的研究[D].天津大学,计算机应用技术,2004,硕士.
[7]刘咏.CB银行武汉分行绩效管理优化方案设计[D].华中科技大学,工商管理,2013,硕士.
[8]刘春荣.宝钢转炉计算机控制[J].冶金自动化,1988,01:2-9.
[9]梁钰敏.Ad Hoc网络匿名路由协议研究[D].中国矿业大学,计算机软件与理论,2014,硕士.
[10]肖婷婷.基于社会网络视角的吐鲁番旅游产业集群升级研究[D].新疆大学,旅游管理,2013,硕士.
[11]曲春辉.基于录波信息的发变组故障分析与诊断系统[D].华北电力大学(河北),电力系统及其自动化,2004,硕士.
[12]许容.我国油页岩开发利用政策研究[D].中国地质大学(北京),公共管理,2013,硕士.
[13]韩月.基于稀疏性的机器学习方法研究[D].西安电子科技大学,电路与系统,2012,硕士.
[14]李川.分布式数据库查询策略优化的研究[D].西安电子科技大学,计算机应用技术,2012,硕士.
[15]邵鹏辉.磷在磁铁矿—针铁矿混合相上吸附行为及其机理研究[D].华东交通大学,市政工程,2012,硕士.
[16]王俊宇,谢献卿.宣钢中型高炉炉外脱硫存在的问题及改进措施[J].炼铁.1998(02)
[17]李权.美国自闭症儿童教育福利研究及启示[D].湖南师范大学,社会保障,2013,硕士.
[18]龚俊杰.未成年犯罪刑事和解制度构建[D].南昌大学,法律(专业学位),2012,硕士.
[19]梁利平.设计任务型活动提高高中生的英语写作能力[D].内蒙古师范大学,学科教学(专业学位),2012,硕士.
[20]宋雪梅.山东省中职旅游教育人才培养模式研究[D].西北师范大学,旅游管理,2014,硕士.
[21]王凯.国际大型田径比赛中FOP管理方法的分析与优化[D].北京体育大学,体育教育训练学,2013,硕士.
[22]莫亦乐.消费者移动互联业务使用意愿影响因素研究[D].浙江大学,2007.
[23]蒋士钧.GZY-50型车装全液压钻机通过部级技术鉴定[J].石油地球物理勘探,1987,04:434.
[24]龙晓明.跨文化旅游理念在桂林旅游发展中的应用[D].中南林学院,2001.
[25]徐楠,文福拴,余志伟.电力市场环境下的无功问题[J].电力系统自动化,2006,11:93-104.
[26]黄艳.油桐组织快繁与离体再生体系的建立[D].西南大学,植物学,2013,硕士.
[27]樊少峰.三聚氰胺在养殖水体中的分布与迁移[D].广东工业大学,环境科学与工程,2014,硕士.
[28]王文莉.云环境下基于事件的分布式工作流技术[D].哈尔滨工业大学,计算机科学与技术,2013,硕士.
[29].国家自然科学基金委员会生命科学部2013年度青年基金项目[J].生命科学,2013,12:1223-1276.
[30]杜维娜.张竞生浪漫主义美学思想研究[D].安徽大学,美学,2013,硕士.
[31]刘平丽.稻田土壤剖面CH_4、N_2O、CO_2分布特征及周转规律研究[D].南京农业大学,土壤学,2011,硕士.
[32]胡齐赞.大白菜花药和游离小孢子培养比较研究[D].浙江大学,农业推广,2004,硕士.
[33]林建勤.基于Web的数据挖掘应用模式研究[J].贵州师范大学学报(自然科学版),2004,03:92-96.
[34]曾文钦.小胶质细胞介导的IGF-1对新生大鼠脑缺血损伤修复的影响[D].南方医科大学,人体解剖与组织胚胎学,2012,硕士.
[35]卞昊.合同能源管理在N公司的应用及分析[D].宁夏大学,工商管理(专业学位),2014,硕士.
[36]杨德岭,刘思峰,曾波.基于核和信息域的区间灰数Verhulst模型[J].控制与决策,2013,02:264-268.
[37]刘行.中国农村非正规金融正规化研究[D].吉林大学,马克思主义基本原理,2014,硕士.
[38]王莉萍.聚丙烯酸类互穿水凝胶的制备及其性能研究[D].西北师范大学,分析化学,2014,硕士.
[39]蔡金芳.城市社区居民的公民意识养成研究[D].华东师范大学,成人教育学,2013,硕士.
[40]邱辉.高速移动环境下OFDM接收机关键技术研究与FPGA实现[D].南京邮电大学,通信与信息系统,2013,硕士.
[41]刘志平.构棘中黄酮类化合物的分离表征和二氢黄酮肟类、腙类衍生物的合成及活性研究[D].广西大学,化学工艺,2013,博士.
[42]宗群,马宏波,王中海.基于NNFPN模型的电梯故障诊断方法的研究[J].控制与决策,2005,03:341-344.
[43]余亮,张亚涛,刘金盾.改性氧化石墨烯/聚醚砜杂化荷正电纳滤膜的制备及表征[J].高等学校化学学报,2014,05:1100-1105.
[44]范昕炜,杜树新,吴铁军.粗SVM分类方法及其在污水处理过程中的应用[J].控制与决策,2004,05:573-576.
[45]吉向阳.病历档案数据库质量评价研究[D].郑州大学,图书馆学,2013,硕士.
[46]王宏伟.检测硫化物的钌(Ⅱ)配合物磷光探针的合成与性质研究[D].大连理工大学,分析化学,2013,硕士.
[47]刘艳军,王伟.一类多变量非线性系统的自适应模糊控制[J].自动化学报,2007,11:1163-1169.
[48]刘静.密云水库浮游生物与富营养化控制因子研究[D].首都师范大学,植物学,2004,硕士.
[49]时阳.台湾当代佛教建筑的文化特色及其启示[D].西安建筑科技大学,建筑历史与理论,2013,硕士.
[50]靳鑫.亚瑟王的历史形象在中世纪的盛衰[D].河北师范大学,世界史,2012,硕士.

- 下一篇: 基于用户情景感知的动态兴趣模型及其应用
- 上一篇: 基于手机报的“三农”信息服务模式研究