面向事件的文本表示及其应用研究
【摘要】人类是通过事件来认识和理解这个世界的。事件反映着现实世界中的运动、行为和变化,现实世界就是由无数个相互关联的事件所构成。因此,将“事件”作为人类知识单元符合人类认识世界的规律。对于事件的研究,一直以来,深受认知科学、语言学和人工智能等领域的高度重视。尤其近年来,事件的研究已经成为自然语言理解中的一个热点。目前对事件的研究大多集中在自然语言处理领域的一些面向事件的应用技术,但面向事件的文本表示是这些应用技术的基础,因此人们需要研究面向事件的文本表示方法以支持各种面向事件的文本信息处理应用。本文首先研究事件要素的语言表现和缺省补全,挖掘事件间的语义关系,然后在项目组提出的事件网络文本表示思想的基础上,针对叙事类文本,考虑以事件作为基本语义单元,研究面向事件的文本表示方法——事件网络,并对事件网络的构建理论、方法及其相关应用进行探索。本文主要的研究内容和创新点包括:(1)事件要素的语言表现和缺省补全研究。在CEC语料库的基础上,本文对已标注文本中的事件实例进行深入分析,首先从语料库中抽取事件触发词作为事件特征项,利用哈工大同义词词林,采用半自动的方法对事件特征项进行聚类,得到同类事件触发词表;然后对事件时间、环境和对象要素的语言表现进行研究,发现各事件要素的语言表现规律;最后对标注文本中的事件要素缺省现象进行分析,并定义了基于上下文结构和基于语义关系的启发式规则来实现事件要素的缺省判断和补全,实验取得了较为理想的效果。(2)基于事件共现的事件关系知识挖掘。通过对标注文本中事件间关系的整理和分析,可以从文本中发现事件类之间关系的语义知识。本文首先在共现理论的研究基础上,对文本中的事件共现现象进行了分析,并利用CEC语料库中的5个事件主题类文本集,分别以句子、段落和文本为窗口单元进行事件共现网络的构建;然后将事件共现对的抽取过程看成是事件固定语义关系规则的抽取过程,并利用关联规则的数据挖掘方法从不同窗口单元的事件共现网络中抽取事件共现对,归纳分析后得到事件类之间的语义关系;最后提出了基于事件共现网络的重要事件抽取方法,并通过实验对其效果进行验证。(3)面向事件的文本表示方法研究。本文对传统文本表示模型进行研究,并在项目组提出的事件网络文本表示思想的基础上,发展了事件网络文本表示模型。事件网络是以事件作为节点,事件间关系作为边的图结构模型,根据选取不同的事件间关系,可以构造不同的事件网络。本文研究了两种事件网络:无向事件网络和有向事件网络,并给出了其相关定义和构建方法。无向事件网络利用事件在段落中的相邻关系或事件间存在的相似关系进行构建,不仅可以很好的表示事件的特征信息,还可以表示出事件之间的文本结构信息和语义相似关联信息;有向事件网络则利用事件在句子中的相邻关系或事件间存在的非分类语义关系进行构建,可以直观的让人们了解文本中事件的发生、发展过程,帮助人们实现对文本语义知识的理解。(4)事件网络的运算及其应用研究。本文针对两种事件网络,结合在自动文摘和文本分类两方面信息处理的具体应用,进行了相关运算研究,并通过实验验证事件网络文本表示模型的有效性。首先提出了子事件主题划分算法,用以得到各事件相对其子事件主题社区的主题关联度,并通过与事件权重进行加权计算得到事件的重要度,在此基础上,实现了基于无向事件网络的文本自动文摘;然后根据有向事件网络的特点,提出最大公共子图匹配算法,用以计算有向事件网络间的相似度,并应用于文本自动分类。实验结果表明,基于事件网络的自动文摘和文本分类均取得了较好的效果。
【作者】廖涛;
【导师】刘宗田;
【作者基本信息】上海大学,计算机应用技术,2014,博士
【关键词】文本表示;事件共现;事件网络;子事件主题划分;最大公共子图匹配;
【参考文献】
[1]孔四新.21世纪的黄金产业——开发冬凌草[J].经济月刊.2000(11)
[2]华子钧.基于多步预测的精细积分算法在电力系统暂态稳定计算中的应用[D].浙江大学,电力系统及其自动化,2013,硕士.
[3]李晨.碳金融发展中的清洁发展机制投资项目(CDM)获签的影响因素分析[D].浙江大学,会计学,2012,硕士.
[4]陈倩.金斯利·艾米斯的《幸运的吉姆》之存在主义分析[D].河北师范大学,英语语言文学,2013,硕士.
[5]徐彬.纳米二氧化钛粉体的制备及表面修饰的研究[D].河北师范大学,物理化学,2004,硕士.
[6]江洪,许露.制造业振兴中的新材料发展研究[J].新材料产业,2015,05:19-24.
[7]谭奇.面向空间DTN网络的仿真演示平台设计[D].哈尔滨工业大学,信息与通信工程,2013,硕士.
[8]任洲仪.小学教师的课堂评价语研究[D].东北师范大学,教育,2012,硕士.
[9]李斌鹏.碳基复合吸波材料的制备和表征[D].山东大学,材料学,2013,硕士.
[10]叶志杰,沈伟东,章岳光,张兴,袁文佳,李旸晖,刘旭.原子层沉积制备铱薄膜的特性研究[J].光学学报,2014,10:319-323.
[11]夏然.图里翻译规范理论视角下《时间机器》三个中译本研究[D].四川外国语大学,英语语言文学,2013,硕士.
[12]顾学雍.联结理论与实践的CDIO——清华大学创新性工程教育的探索[J].高等工程教育研究,2009,01:11-23.
[13]盖金龙.船舶电力推进实验平台监控设计及能效研究[D].大连海事大学,船舶与海洋工程,2014,硕士.
[14]李杰.西北工业大学国家保密学院:面向网络空间安全主战场[J].保密工作,2015,01:29-31.
[15]朱莉.论新中国十七年(1949-1966)地域版画中色彩差异性的生成[D].中央美术学院,版画,2013,硕士.
[16]陈咏艳.沧源永和佤族社区与澜沧班利拉祜族村基督教音乐文化的比较研究[D].云南艺术学院,音乐人类学,2014,硕士.
[17]冯肯.含风电机组的配电网无功优化[D].西南交通大学,电力系统及其自动化,2013,硕士.
[18]闻红英.含有偶氮苯分子聚合物性能的研究[D].苏州大学,高分子化学与物理,2014,硕士.
[19]刘慧.集群创新网络内的企业学习研究[D].浙江大学,2003.
[20]张明波.基于承载力控制的预应力RPC梁设计理论研究[D].北京交通大学,2009.
[21]汪旸,尹项根,张哲.分布式集中决策的区域智能保护系统结构与算法[J].电力系统自动化,2009,21:53-57.
[22]刘自扬.中兽药制剂中非法添加化学药物的检测研究[D].北京中医药大学,中药化学,2011,硕士.
[23]王赟.过渡金属掺杂Pt基及Pd基催化剂的制备及其电催化性能研究[D].烟台大学,2014.
[24]胡晓丽.国外动态[J].生物加工过程,2012,04:6+53+69+76.
[25]王震.基于惯性作动器的管路系统振动主动控制研究[D].中国舰船研究院,船舶与海洋结构物设计制造,2014,硕士.
[26]陈坤.后掠式弧形深松铲柄的结构优化研究[D].吉林农业大学,农业机械化工程,2012,硕士.
[27]向万新,欧阳湘达.一种高精度测量频率的方法[J].自动化学报,1990,05:475-477.
[28]贡少瑞.某隧道围岩稳定性分析与塌方预测研究[D].西安建筑科技大学,土木工程建造与管理,2013,硕士.
[29]李世平,李华德.基于间接转矩控制的异步电动机变频调速系统[J].冶金自动化,2004,06:1-4.
[30]董川.GR电梯公司层门导轨架库存改善研究[D].华南理工大学,工业工程,2012,硕士.
[31]何兴文.网络虚假广告法律规制研究[D].贵州民族大学,经济法学,2012,硕士.
[32]林小珍.八桥全地面起重机冷却系统效能研究[D].吉林大学,机械工程,2014,硕士.
[33]丁莹.家电产品营销渠道研究[D].首都经济贸易大学,工商管理(专业学位),2014,硕士.
[34]陈明明.房屋拆迁中的职务犯罪问题研究[D].贵州民族大学,刑法学,2013,硕士.
[35]陶珍珍.盈余管理、审计费用与内部控制审计[D].云南财经大学,会计学,2013,硕士.
[36]阳蔚霞.英、法“唯美—颓废派”与上海新感觉派之比较[D].华东师范大学,世界文学与比较文学,2004,硕士.
[37]陶勇.吉林长白山天然矿泉水抚松饮用水水源保护区划分研究[D].吉林大学,水利工程,2013,硕士.
[38]王尧.基于J2EE的ICT项目管理系统设计与实现[D].西安电子科技大学,软件工程,2012,硕士.
[39]王娟.佳能(中国)有限公司体验式营销策略研究[D].山东大学,工商管理(专业学位),2013,硕士.
[40]李峰.基于SSVM的场景深度信息恢复算法研究[D].浙江工业大学,模式识别与智能系统,2012,硕士.
[41]李霞.沈阳市居民“我”和“咱”的使用状况调查研究[D].沈阳师范大学,语言学及应用语言学,2013,硕士.
[42]廖卉芳.武汉市棚户区改造困境及对策研究[D].华中科技大学,土地资源管理,2013,硕士.
[43]殷志伟.公益创投:社会组织能力建设的创新模式与实践[D].苏州大学,社会工作(专业学位),2014,硕士.
[44]孔庆辉.唐代中国文献流传日本研究[D].辽宁大学,档案学,2012,硕士.
[45]谢秋实.硫碳改性制备锂硫电池的研究[D].武汉工程大学,2013.
[46]徐高.宿迁市承接产业转移影响因素研究[D].扬州大学,产业经济学,2012,硕士.
[47]邬新兵,蒙萌,庄伟,吕玲红,陆小华.介孔TiO_2固定化葡萄糖氧化酶的直接电化学性能[J].化工学报.
[48]石丁丁.振动流化床对褐煤的干燥特性研究[D].中国矿业大学,矿物加工工程,2014,硕士.
[49]潘非.嵌入式SRAM编译器的容量扩展方法的研究[D].安徽大学,微电子学与固体电子学,2014,硕士.
[50]杨植渠.面向全体学生的高中生物教学模式探讨[D].山东师范大学,学科教学(专业学位),2013,硕士.
- 下一篇: 基于ORACLE的烤烟种植空间数据库性能优化
- 上一篇: 扩大消费长效机制的消费品流通体系研究
相关推荐
- 学科竞赛驱动的学生工程实践能力培养模式研究与实践
- 01月16日
- 土壤磷素形态及物种多样性对幼苗光合作用的影响
- 07月15日
- 普通空间矢量法在级联多电平载波调制中的应用
- 01月25日
- 癌蛋白SRC-3通过调节膀胱癌细胞糖脂代谢促进肿瘤进程
- 09月24日