汉语否定与不确定信息识别研究
【摘要】自然语言中存在大量否定与不确定信息,针对此类信息的识别是目前信息抽取领域研究热点之一。英文中否定与不确定信息识别研究较早,但目前面向汉语的否定与不确定信息的自动识别研究尚处于起步阶段。其中一个重要原因是汉语否定与不确定语料匮乏,导致相关研究进展缓慢。同时,汉语在语言特征(如语法、修辞等)上与英语存在较大差异,需要提出针对汉语的否定与不确定信息识别模型。本文制定了一套面向汉语的否定与不确定信息标注规则,构建了汉语否定与不确定信息识别语料库,并提出了汉语否定与不确定触发词和覆盖域的识别方法。具体研究内容包括以下三个方面:首先,制定了一套面向汉语的否定与不确定信息标注规则,构建了汉语否定与不确定信息识别语料库,并统计在不同类别文本中否定与不确定使用的语言现象。该语料为汉语否定与不确定信息识别提供了重要资源。其次,分别提出了基于字框架和词框架的汉语否定与不确定触发词识别模型。另外,为了解决触发词歧义问题,本文将基于词框架的条件随机场(conditionalrandomfields,简称CRF)模型与概率统计模型相结合,提出了新的汉语否定与不确定触发词识别融合模型。实验结果表明,该模型提高了触发词识别性能。最后,借鉴英文中覆盖域识别使用的特征,提出了面向汉语特征的否定与不确定覆盖域识别方法。并在此基础上,提出了基于多分类器的汉语否定与不确定覆盖域识别融合模型。实验结果表明,该模型有效提高了覆盖域识别性能。本文提出了一种汉语否定与不确定触发词和覆盖域识别方法,该方法的研究将进一步推进面向汉语的否定与不确定信息识别研究的发展,为自然语言理解等需要确定语义知识的应用服务。
【作者】陈站成;
【导师】朱巧明;李培峰;
【作者基本信息】苏州大学,计算机应用技术,2014,硕士
【关键词】否定信息;不确定信息;语料库构建;触发词识别;覆盖域识别;
【参考文献】
[1]闫祯祯.基于后悔理论的出行时间信息感知价值研究[D].大连理工大学,交通运输规划与管理,2013,硕士.
[2]谭章荣.“一户一表、水表出户”的探索[J].城市公用事业.1999(06)
[3]黄东明.宁都黄鸡蛋用性能和肌肉品质测定与分析[D].江西农业大学,特种经济动物饲养,2012,硕士.
[4]付瑞丽.硝基芳香羧酸配位聚合物的合成和结构研究[D].东北师范大学,无机化学,2012,硕士.
[5]李忠杰.黑龙江省农田水利基础设施投资问题研究[D].东北农业大学,农业推广(专业学位),2013,硕士.
[6]多米尼克·米乔恩,雷蒙德·穆尼兹.反褶积和频谱加宽[J].石油地球物理勘探,1976,S1:19-20.
[7]周繁坤.FP1在铅导致PC12细胞内铁聚积中的作用研究[D].南昌大学,流行病与卫生统计学,2014,硕士.
[8]尹伟,曹渊,胡宝山,鲜晓红.一种新型双氧水电化学传感器设计[J].实验技术与管理,2014,12:74-76.
[9]朱志如.典型汽油组分在不同性质孔隙介质中的吸附与运移研究[D].中国地质大学(北京),环境工程,2014,硕士.
[10]陈士通1,2,杜修力1,张文学1,赵振宇2.结构参数变化对提梁机结构动力特性的影响分析[J].铁道标准设计,2014,08:95-98.
[11]张菊.华北南部盆地二氧化碳地质储存潜力与适宜性评价[D].石家庄经济学院,地下水科学与工程,2013,硕士.
[12]桑勇.重庆市轨道交通三号线项目群风险管理[D].西南交通大学,项目管理,2012,硕士.
[13]张冲.基于颜色标记的三维目标姿态估计研究[D].燕山大学,计算机应用技术,2014,硕士.
[14]张先明.全反式维甲酸对球囊损伤大鼠胸主动脉内皮后内膜增生、PCNA、P16和PDGF-BB表达的影响[D].青岛大学,心血管内科,2003,硕士.
[15]方立桥.油底壳加强筋和滚筋结构优化设计[D].北京交通大学,机械工程(专业学位),2013,硕士.
[16]张伟谦.基于磁流变减振器的汽车半主动悬架研究[D].浙江大学,2010.
[17]封硕.形状记忆聚合物泡沫性能分析[D].哈尔滨工业大学,工程力学,2013,硕士.
[18]黄尧.中小学校本师资培训之研究[D].华东师范大学,教育学原理,2002,硕士.
[19]梁国荣.基于噪声源估计的电机故障诊断研究[D].广东工业大学,电机与电器,2013,硕士.
[20]刘明祥,周炳海.基于时间约束集的集束型设备群调度方法[J].自动化学报,2012,03:479-485.
[21]邓天.中国夫妻离婚财产认定与分割三论[D].华东政法大学,民商法学,2012,硕士.
[22]左世强.内蒙古城镇居民收入差距问题的收入流动性视角思考[D].内蒙古财经大学,政治经济学,2012,硕士.
[23]陈楚天.周代邓国、邓县的历史与文化[D].华中师范大学,区域文化史,2014,硕士.
[24]李爽.客户关系管理理论在图书馆的应用[J].图书馆杂志,2003,01:15-17.
[25]李德军.新型脂溶性鸟嘌呤衍生物的设计和合成[D].吉林大学,有机化学,2014,硕士.
[26]肖静静.氨基葡萄糖的氧化研究[D].江南大学,应用化学,2012,硕士.
[27]崔兴.中关村西区四号地工程项目质量控制管理研究[D].燕山大学,项目管理,2013,硕士.
[28]张宝聚.网球“彩色区域”训练法的实验研究[D].山东体育学院,体育教学,2012,硕士.
[29]古钟璧,王苇,王祯学.大滞后生产过程的智能式补偿预测控制[J].自动化学报,1995,04:494-498.
[30]张立佳.聚乙二醇支载磺酸和氧化石墨烯的合成及催化性能研究[D].西北师范大学,有机化学,2013,硕士.
[31]牛奕麟.基于RBAC模型的医疗体检系统的设计和实现[D].大连理工大学,工业工程(专业学位),2013,硕士.
[32]李智.天津郊区城市化中的问题与发展路径研究[D].天津财经大学,区域经济学,2012,硕士.
[33]杨璇.住宅小区停车位归属问题研究[D].内蒙古大学,法律,2014,硕士.
[34]陶骞,陈旭,孙建军,毛艳芳,王晋.基于编码波形的数字化变电站信号绝对传输延时测试方法[J].电力系统自动化,2014,16:110-114.
[35]徐义田.支持向量回归算法的研究及其在食物安全中的应用[D].中国农业大学,2005.
[36]王伟.基于Linux平台的混沌保密通信系统的设计与实现[D].杭州电子科技大学,电路与系统,2014,硕士.
[37]周帆.国内电视剧悬念异化现象研究[D].云南师范大学,广播电视艺术学,2013,硕士.
[38]韩晓庆.旅游文本汉英翻译实践报告[D].大连海事大学,英语笔译,2014,硕士.
[39]周雪,胡卫明.融合颜色和增量形状先验的目标轮廓跟踪[J].自动化学报,2009,11:1394-1402.
[40]尹晓龙.中国新兴微电影广告研究[D].山东大学,设计艺术学,2013,硕士.
[41]周璇.科学发展观的核心“以人为本”思想研究[D].河北经贸大学,马克思主义基本原理,2013,硕士.
[42]王雪琴,曹丽华,陈正坚,罗军,王红军,涂克华,蒋宏亮,王利群.用于抗肿瘤药物评价的三维肿瘤细胞体系的构建及性能[J].高分子学报,2014,06:808-814.
[43]沈涵飞.基于开源平合的高校党建网站设计与实现[J].软件导刊,2015,01:127-129.
[44]陈耿,朱玉全,孙志挥.一种基于异常检测的关联模式挖掘模型[J].计算机工程与应用,2004,12:158-159+198.
[45]樊兆峰,马小平,邵晓根.非线性系统RBF神经网络多步预测控制[J].控制与决策,2014,07:1274-1278.
[46]李竹青.智能公交调度系统数据服务器软件设计[D].浙江工业大学,2013.
[47]杨帆.消亡在二元世界中的女人—从二元对立角度解读《觉醒》[D].北京交通大学,2014.
[48]邱光荣.曲靖供电局信息化建设规划研究[D].云南大学,工商管理,2012,硕士.
[49]夏谦.我国保障性住房产业化建设策略研究[D].山西财经大学,社会保障,2014,硕士.
[50]王兴鹏.智能财务分析系统——财务管理软件的发展方向[J].中国会计电算化,2004,06:25-26.
相关推荐
- 民办本科高校教师课堂教学质量评价体系的研究与实践
- 09月15日
- 汽车零部件故障率基础分布及保修成本测算
- 03月22日
- 创伤脓毒症遗传易感性的分子流行病学与临床关联研究
- 07月16日
- 双LD-双PSD深孔轴线直线度检测技术研究
- 01月22日