基于传统特征与概念数字特征的复述识别方法研究

基于传统特征与概念数字特征的复述识别方法研究

作者:师大云端图书馆 时间:2024-07-21 分类:硕士论文 喜欢:1077
师大云端图书馆

【摘要】复述是自然语言表达中存在的一种普遍现象,即相同语义的不同表达方式。复述识别即判别两个给定语言表达式或者模板是否表达相同或相似的意思,其研究结果可广泛应用于自然语言处理各个领域,如信息检索、机器翻译、自动问答等。复述在自然语言中的普遍性及广泛应用让复述研究显得尤为重要。本文分析了国内外关于复述识别的研究技术和研究成果,发现现存方法主要集中在利用句子传统特征,如将句子看成字符串、语义符号或者抽取词法特征、句法特征等来进行复述识别,忽略了句子作为信息载体本身随着知识背景的积累不断发展变化的特性,即知识的不确定性。前人基于传统特征的复述识别方法试图将一种连续的变化的语言离散化确定化,忽略了自然语言不确定性问题。而复述本身是自然语言不确定性的一种反应,其具有的语义多样化,不确定性和发展变化性是复述识别研究中不可忽视的因素。为解决前人采用传统特征进行复述识别的方法中所忽略的两个问题:(1)概念作为整体具有的语义完整性和边界不确定性,(2)概念在具体语境中表现出语义差异性和多义性导致的歧义问题。本文从传统特征和概念特征两个方面进行语义特征抽取,采用对应特征进行复述识别。本文主要研究内容包括以下几个方面:].基于多层传统句子特征的复述识别技术。通过研究现存方法,句子传统特征的某一方面被用于复述识别相当普遍,本文考虑到句子特征的多面性,本文提出基于多层次结合句子特征的复述识别技术。首先在标准语料库的训练语料上进行词法分析,得到句子主语、谓语、宾语成分;其次进行句法分析得到句法依存关系;然后结合两个层次句子特征,训练出句对相似度计算模型;最后将训练模型运用到标准语料库的测试语料上进行测试。与先前方法相比,本方法在识别准确率和F值上表现突出。2.基于云模型数字特征的复述识别技术。考虑到自然语言本身具有发展变化和不确定性,传统特征无法满足自然语言发展变化和整体刻画的要求。与此同时,定性特征定量化的研究还很不够。通过对复述识别问题本质的分析,为解决词汇作为概念整体在复述识别中的知识表示问题和词汇多义性问题,提出基于概念的词义关联模型,用云模型加以表示,提出基于概念数字特征的复述识别方法。首先对在标准语料库的训练语料中复述句对包含的词进行相关词群扩展,利用云模型理论知识将句对中词汇以及其相关词群转换成概念;然后基于概念的数字特征进行复述识别。这是首次将云模型运用到复述识别研究中,在词汇语义的表示中抽象出一个概念层次。通过在标准复述语料库上进行详尽对比实验,结果显示概念特征在复述识别中表现较好。3.基于云概念跃升的复述识别技术。为了解决句子作为一个整体对象的知识表示问题,以及句子内部成分的多义性和不确定性造成的歧义问题,提出基于云概念跃升的复述识别方法。在云模型概念数字特征的复述识别方法基础上,将句子作为一个概念整体对待,将构成句子的细粒度概念进一步跃升成粗粒度概念以表示整体句义。利用云模型所具有的无限纵深特点挖掘出句子本身的不确定性知识,以更客观描述句子语义。最后根据所获得数字特征对句对进行复述识别。通过解决概念多义性问题,云概念跃升方法较云模型方法有更好的表现,同时也较传统方法有一定的突破。本文提出的基于概念的复述识别方法优点表现在三个方面:(1)既考虑到句子词汇本体意思,也考虑到词汇外延信息,即概念不确定性和完整性;(2)通过概念跃升挖掘句子概念特征,解决词汇在具体语境中的歧义问题;(3)利用概念数字特征代替传统字符串表面特征、词法特征、句法特征等,更能体现句子作为自然语言具有的鲁棒性。复述识别研究在自然语言处理诸多领域有广泛应用,这些领域都涉及到知识表示、知识评价,研究还很不够。在我们所了解范围内,这是首次将概念数字特征运用到复述识别研究中,意在挖掘句子语义模糊性或不确定性。实验结果表明,本文提出的方法在标准语料库上的识别率有一定提高。同时也间接地证明本文从不确定性知识角度进行复述识别的有效性。更为重要的是,该方法可以无缝转移到大部分相关研究中,为其他领域的研究提供便利。
【作者】张红;
【导师】张茂元;
【作者基本信息】华中师范大学,计算机应用技术,2014,硕士
【关键词】句对复述识别;云模型;概念数字特征;概念跃升;

【参考文献】
[1]韩冰.埃及自然保护区的环境管理与旅游发展问题研究[D].对外经济贸易大学,外国语言学及应用语言学,2004,硕士.
[2]石剑平.非线性波方程的解析解研究与等变平面向量场极限环分支分析[D].昆明理工大学,工程力学,2014,博士.
[3]董广婕.辽宁地区脊髓小脑性共济失调2个朝鲜族家系的临床表现、影像学及基因突变分析[D].大连医科大学,神经病学,2012,硕士.
[4]王文成.信息引导职务犯罪侦查制度之研究[D].安徽大学,法律,2012,硕士.
[5]陈强.面向病理性震颤抑制机器人上肢生物力学模型的研究[D].哈尔滨工业大学,机械电子工程,2013,硕士.
[6]徐婧.山区高速公路拓宽路基不均匀沉降处治技术研究[D].长安大学,交通运输工程(专业学位),2013,硕士.
[7]胡登.基于产业营销视角的中山中医药产业聚集研究[D].电子科技大学,工商管理(专业学位),2012,硕士.
[8]叶凌青.未来时间知觉与积极效应的关系研究[D].西南大学,发展与教育心理学,2014,硕士.
[9]邓小昭.因特网用户信息需求的发掘与跟踪[J].图书情报工作,2002,12:75-79.
[10]张亮.数据挖掘在机械制造业外购件供应系统的应用[D].重庆大学,2004.
[11]谭劲.广发银行联名信用卡营销策略研究[D].广东财经大学,工商管理(专业学位),2014,硕士.
[12]赵婷.森林防火平台的设计与实现[D].复旦大学,软件工程,2012,硕士.
[13]熊海.基于相移可调谐啁啾光纤光栅多波长滤波器的研究[D].北京交通大学,2015.
[14]张议.基于几种巯基改性石墨烯复合物的电分析研究[D].湖南师范大学,2014.
[15]江维国.广西承接广东产业转移优化产业结构的企业战略[D].广西师范大学,工商管理,2013,硕士.
[16]蒋夏军,李蔚清,吴慧中.高级分布式仿真中的数据收集技术研究[J].系统仿真学报,2004,08:1758-1761+1767.
[17]宋晓贺.非洲菊和彩叶芋抗病基因同源序列的分离鉴定和抗白粉病分子标记[D].西北农林科技大学,植物病理学,2013,博士.
[18]陈佩.用户使用手机银行的影响因素作用机制研究[D].华中师范大学,企业管理,2014,硕士.
[19]关红蕾.美国高校服务学习的理念及实践研究[D].河北大学,高等教育学,2014,硕士.
[20]何生志,郭涛,张浩.基于OracleDataMining的数据挖掘在石化企业的应用[J].自动化博览,2005,02:34-36.
[21]杜銮燕.台商直接投资对福建产业结构升级影响研究[D].华侨大学,企业管理,2014,硕士.
[22]汪亚梅.进城务工人员随迁子女教育现状调查报告[D].安徽大学,社会工作,2013,硕士.
[23]郭晓枫.计算机支持协作学习的角色设计及实证研究[D].华东师范大学,教育技术学,2013,硕士.
[24]牟红珍.基于疏水蛋白HFBI在烟草中表达Reteplase的研究[D].宁夏大学,生物化学与分子生物学,2014,硕士.
[25]陈树强.泰达配电网故障选线方法与装置研究[D].天津大学,电力系统及其自动化,2013,硕士.
[26]许 丁1, 谢公南2.基于不动点方法求解非线性FalknerSkan流动方程[J].应用数学和力学,2015,01:.
[27]袁晓辉,王乘,袁艳斌,张勇传.一种求解机组组合问题的新型改进粒子群方法[J].电力系统自动化,2005,01:34-38.
[28]王欣.感触“被导航”[D].中央美术学院,美术学,2013,硕士.
[29]何志桥,韩晶,宋爽.Ag修饰TiO_2催化剂紫外光催化还原CO_2的研究[J].浙江工业大学学报,2014,01:20-26.
[30]黄彩银,麦辰.通信网中的时间同步研究[J].广东通信技术.2007(04)
[31]秦超.国有大型冶炼企业员工职业成长通道改进研究[D].云南财经大学,工商管理,2014,硕士.
[32]张帆.万兆交换机电磁兼容设计与研究[D].武汉邮电科学研究院,通信与信息系统,2012,硕士.
[33]王琪.未成年人监护制度的公权干预研究[D].内蒙古大学,法律,2014,硕士.
[34]陈楠.老年2型糖尿病合并颈动脉粥样硬化斑块三种常见中医证型及影响因素研究[D].北京中医药大学,中医内科学,2013,硕士.
[35]李慧.~(60)Co-γ辐照对直立型扁蓿豆生长发育特性的影响[D].内蒙古农业大学,草业科学,2013,硕士.
[36]陈旸.高血压合并糖尿病心脑血管高危人群中医证候的研究[D].北京中医药大学,中医内科学,2013,硕士.
[37]张磊.基于计算机视觉的风力机叶片缺陷诊断研究[D].华中科技大学,热能工程,2013,硕士.
[38]张娟.《比尤拉的国度》和《三联画》的翻译实践报告[D].河北师范大学,翻译,2013,硕士.
[39]刘毅,金福江,高增梁.时变过程在线辨识的即时递推核学习方法研究[J].自动化学报,2013,05:602-609.
[40]范健.媒体对农业科技推广的影响[D].中国农业大学,种植业,2004,硕士.
[41]黄睿.论当代中国风景油画中的人文精神及其呈现[D].西南大学,美术学,2014,硕士.
[42]鲁明上.装配MBD数据集及装配过程仿真[D].华中科技大学,机械设计及理论,2013,硕士.
[43]王淑英.秘密侦查法制化探析[D].华南理工大学,法律(专业学位),2012,硕士.
[44]蒋琪.OSTA考试站管理系统[D].西安理工大学,电气工程,2003,硕士.
[45]徐昕.基于移动通信开放业务能力平台的旅游信息系统设计与实现[D].吉林大学,软件工程,2013,硕士.
[46]袁丽萍.水氮供应对日光温室番茄生育及品质影响的研究[D].中国农业大学,蔬菜学,2004,硕士.
[47]王志勤,续合元.ITU-T特别研究组第一次会议情况[J].电信网技术.2001(05)
[48]范金.聚合物微孔发泡气泡长大理论的研究[D].吉林大学,材料学,2013,硕士.
[49]王文杰.市场均衡问题的算法研究[D].青岛大学,计算数学,2013,硕士.
[50]郭竞文,孟令云,冉锋,陈瑞金.列车间不确定性资源请求冲突的预测方法[J].铁道运输与经济,2014,07:34-39.

相关推荐
更多