面向中文微博文本的情感识别与分类技术研究

面向中文微博文本的情感识别与分类技术研究

作者:师大云端图书馆 时间:2024-07-24 分类:硕士论文 喜欢:911
师大云端图书馆

【摘要】作为时下最流行的社交媒体之一,微博具有信息传播快、信息量大、内容欠规范等显著特点,已发展成为互联网信息交流共享的重要平台之一。当前,对微博文本的情感识别与分类研究逐渐成为自然语言处理领域中一个新的热点研究方向及难点所在,其研究成果对于企业及时洞悉用户对产品或服务的使用反馈、对获取社会民众的民意、舆情监测等应用均具有重要的现实意义。本研究致力于初步解决面向中文微博文本的主观句识别与情感分类问题,具体研究内容如下:一、通过分析微博文本,总结出微博文本的若干结构特征,并构建表情情感库。在分析微博文本中常出现的重复标点符号的基础上,整理出辅助识别情感分类的标点符号情感库。将情感词汇本体库和表情情感库、标点符号情感库相结合,构建了中文微博文本的情感特征库。二、分别使用词频统计、期望交叉熵、TF-IDF、以及求TF-IDF的方差等方法对微博文本进行情感特征抽取,其实验结果显示:基于方差与TF-IDF加权结合的特征识别与抽取方法取得了最好的结果。三、关于微博文本的情感识别与分类,我们首先判断微博文本的主、客观性,使用朴素贝叶斯方法和支持向量机方法来识别主观句,实验结果显示:朴素贝叶斯方法对主观句的识别效果更好。此后,对属于主观句的微博文本我们进行了情感分类研究,使用基于支持向量机的一对一分类法和一对其余分类法,其实验结果显示:基于支持向量机的一对一分类法效果更好。四、基于以上提出的情感特征抽取方法及情感识别与分类方法,我们构建了相应的原型系统。通过在公开评测数据集上的一系列实验验证了本文所提方法的可行性和有效性。
【作者】彭蔚喆;
【导师】胡珀;何婷婷;
【作者基本信息】华中师范大学,计算机技术,2014,硕士
【关键词】微博内容分析;主观句识别;情感分类;

【参考文献】
[1]杨子清.Heart和“心”的概念隐喻对比研究[D].南京师范大学,英语语言文学,2012,硕士.
[2]矫文斌.北京地铁安全隐患管理平台的设计与实现[D].大连理工大学,软件工程(专业学位),2013,硕士.
[3]张晶.自锁托槽矫治器在成人错(牙合)畸形矫治中的应用[D].大连医科大学,口腔临床医学,2012,硕士.
[4]郝婕.商会行政化问题研究[D].长春工业大学,社会学,2013,硕士.
[5]李钦华.宜昌市鲜活农产品物流产业促进政策研究[D].华中师范大学,公共管理,2012,硕士.
[6]王晓磊.英汉请求语的比较研究[D].河北师范大学,英语语言文学,2012,硕士.
[7]杨红.基于GIS的滇中引水工程昆明段岩溶区适宜性评价[D].成都理工大学,环境地质,2013,硕士.
[8]陈建,李成林,杨伟弘.基于事件驱动的过程控制画面实时刷新方法的研究与实现[J].冶金自动化,2012,02:45-48+75.
[9]蒙霞.论生命伦理学视野中转基因技术的研究与应用[D].广西大学,科学技术哲学,2004,硕士.
[10]姚海军.宝安体育场屋盖系统运营安全监测[D].华南理工大学,桥梁与隧道工程,2014,硕士.
[11]邹晓妹.北京市运动内衣市场发展现状及其前景研究[D].首都体育学院,体育人文社会学,2013,硕士.
[12]黄潋之.基于Zigbee传感器网络的室内环境监测系统设计[D].哈尔滨理工大学,通信与信息系统,2012,硕士.
[13]张祎.中古汉语兼语句研究[D].苏州大学,汉语言文字学,2013,硕士.
[14]白海燕.数字资源整合的模式与解决方案[J].图书情报工作,2005,10:87-91.
[15]张墨雨.“好女孩”的词与物:《米娜》杂志的身体叙事[D].苏州大学,传播学,2014,硕士.
[16]赵双龙.BCD工艺在电源管理IC设计中的应用[D].浙江大学,2006.
[17]吴昱.备用信用证在中国的法律适用[D].外交学院,国际法,2004,硕士.
[18]徐晓丹.殷海光社会思想研究:文化与制度双轨并行的现代转化[D].华中师范大学,社会学,2013,硕士.
[19]刘莹.台湾“悼亡小说”简论[D].华东师范大学,中国现当代文学,2013,硕士.
[20]林玉翠.纳米结构四氧化三钴的喷雾燃烧法控制合成及催化性能[D].南昌大学,2013.
[21]叶琼伟.《商务智能》课程建设初探[J].云南财贸学院学报,2004,S1:350-353.
[22]华中生,徐晓燕.PWB装配线综合生产能力计划模型及其近似求解算法[J].自动化学报,2000,04:557-562.
[23]包达飞.双转子异步电机特性分析及矢量控制系统研究[D].南京农业大学,机械工程,2013,硕士.
[24]赵磊.肠杆菌科细菌碳青霉烯酶基因blaKPC-2的质粒定位及遗传环境[D].河南农业大学,基础兽医学,2012,硕士.
[25]梁战平.情报学若干问题辨析[J].情报理论与实践,2003,03:193-198.
[26]于明坚,丁炳扬,俞建,金孝锋,周宏,叶万辉.水盾草入侵群落及其生境特征研究[J].植物生态学报,2004,02:231-239.
[27]董庆龙.LTE上行信道的干扰抑制合并技术算法及实现[D].复旦大学,电子与通信工程,2012,硕士.
[28]武旭鹏.创业板重要股东减持对股价影响的实证研究[D].上海交通大学,工商管理,2013,硕士.
[29]刘国岭.糖尿病合并高血压相关因素与中医证型分布情况调查[D].陕西中医学院,中西医结合临床(专业学位),2013,硕士.
[30]王福康.改变我们生活的十大新兴技术(上)[J].自然与科技,2009,04:22-25.
[31]李昌果,张永亮,郭建新.浅谈电信运营商之互联互通[J].铁道通信信号.2002(09)
[32]孙浩亮.专利质押价值评估参数研究[D].天津财经大学,会计学,2012,硕士.
[33]郭嘉.客运专线与城市交通换乘客流预测及衔接方案研究[D].北京交通大学,2008.
[34]郑颖瑜.广西乡镇党委公推直选研究[D].广西民族大学,政治学理论,2013,硕士.
[35]李国胜.家蚕丝氨酸蛋白酶抑制剂Serpin5多克隆抗体制备及组织表达分析[D].苏州大学,特种经济动物饲养,2013,硕士.
[36]刘锦国.数据挖掘方法与技术综述[J].科技广场,2004,07:22-25.
[37]朱家元,虞建飞,张恒喜.嵌入局部模型的SOM网络对混沌时间序列预测研究[J].控制与决策,2003,01:106-109.
[38]吴文明.干部教育培训高校基地建设的探索与实践——以全国干部教育培训浙江大学基地为例[J].教育教学论坛,2014,23:223-224.
[39]郑仕健.空心金刚石微球制造与水下放电等离子体的初步研究[D].中国科学技术大学,2013.
[40]姚晓英.张家界国家森林公园游客安全意识研究[D].中南林业科技大学,森林游憩与公园管理,2013,硕士.
[41]张启亮.《钟形罩》中女性意识的觉醒[D].四川外国语大学,英语语言文学,2013,硕士.
[42]石春初.基于环境形态与感知特征的建筑设计研究[D].西南交通大学,建筑设计及其理论,2012,硕士.
[43]魏磊.村镇建筑基础下碎石垫层隔震性能试验研究[D].西安建筑科技大学,岩土工程,2013,硕士.
[44]张晖.卫星遥感气溶胶光学厚度与西安市PM_(10)浓度关系模型研究[D].西北大学,环境工程,2014,硕士.
[45]齐月.辽宁省旅游形象传播效果的评价[D].渤海大学,旅游管理,2014,硕士.
[46]王敏,李民.因特网技术在新闻远程传送中的应用[J].中国新闻科技.2000(02)
[47]邱东明.连铸电涡流型熔渣检测传感器激励源的研究[J].冶金自动化,1987,06:37-41.
[48]王源.星巴克广告变迁分析[D].四川外国语大学,英语语言文学,2014,硕士.
[49]陈柱.流动QCM全自动DNA分析系统的研制[D].湖南工业大学,生物医学工程,2012,硕士.
[50]王晓亚.益肾通络方对膜性肾病大鼠肾组织中TGF-β1mRNA和ColⅣmRNA表达的影响[D].河北医科大学,中医内科学,2013,硕士.

相关推荐
更多