基于依存关系树的复句句法特征自动选取
【摘要】随着社会的发展,科技的进步,人们获取信息的途径越来越多,而且更加方便。人们在交流的过程中,也产生了大量的数据。信息处理的自动化和智能化是社会发展的必然。在此背景下,自然语言处理领域得到了飞速发展。在中文信息处理领域,分词和词性标注已经取得突破性进展。然而,为了最终实现对篇章的理解,要上升到句子层面的理解,而中文复句的研究是句子到篇章研究的过渡。复句由分句构成,其所含的信息量比单句大,常用来表示人和人、事和人及人与物之间的逻辑意义关系,同时兼有语法、语义乃至语用等多方面的属性。复句的层次关系划分是对复句研究的根本,而复句中关系标记的标识及关系标记之间的搭配关系又是复句层次关系划分的基础。基于以上事实,复句的研究就必须上升到语法、语义,甚至是语用的层面。本文试图以关系标记为出发点实现对复句层次结构的初步理解。复句特征的研究是基础中的基础,本文提出的基于依存关系树的复句句法特征自动选取实现了复句中表征关系标记及其搭配关系的句法特征集的获取。鉴于复句本身的特点,我们在选择特征的时候,并未局限于词汇特征,而是融入了丰富的句法特征。条件随机场模型是无向图模型,在自然语言处理中得到广泛的应用。我们利用该模型对复句语料进行了训练,并将相应的特征选取算法加入到模型中,实现了复句句法特征的自动选取。实验主要分为关系标记和搭配关系句法特征选取两个方面。由于关系标记任务更简单,研究也较多,所以得到的实验结果更好,准确率及召回率都达到了98%左右。本文对关系标记搭配关系的研究只是初步的探索,准确率及召回率只有77%左右,需要进一步深入研究。实验得到的模型文件可以应用在相关的任务中。
【作者】叶林沿;
【导师】李源;
【作者基本信息】华中师范大学,计算机应用技术,2014,硕士
【关键词】依存关系树;复句特征;关系标记;条件随机场模型;
【参考文献】
[1]赵越.香叶木苷的抗辐射损伤作用机制研究[D].哈尔滨工业大学,食品科学与工程,2013,硕士.
[2]周丽玮.无形资产与企业价值相关性的实证研究[D].河北经贸大学,会计,2014,硕士.
[3]陈亚杰,王新.目的论视角下的少数民族特色词汇翻译──以蒙古族特色词汇为例[J].中国翻译,2011,04:79-81.
[4]李萍.2010年湖北省交通专门人才需求预测与开发[D].武汉理工大学,2003.
[5]莫小玉.粳米理化特性与食用性能关系的研究[D].浙江工商大学,食品工程,2013,硕士.
[6]郭俊芳.以纳比派为例解读19世纪末绘画空间的变化[D].西北大学,美术学,2014,硕士.
[7]王玉菊.HINOC系统MAC协议汇聚子层设计[D].西安电子科技大学,通信与信息系统,2010,硕士.
[8]刘小彬.高速车地通信MIMO系统中非理想CSI反馈技术研究[D].西南交通大学,信号与信息处理,2014,硕士.
[9]潘曰强.海蓄电站进厂交通洞施工进度预控策略研究[D].华南理工大学,项目管理,2012,硕士.
[10]严玉花.荀子德育思想及其现代价值问题研究[D].西北师范大学,思想政治教育,2013,硕士.
[11]马建新.对我国政治文明建设中借鉴资本主义政治文明有益成果的思考[D].河南大学,马克思主义理论与思想政治教育,2004,硕士.
[12]滕沁芳.基于语料库的“程度副词+名词”的名词研究[D].上海外国语大学,语言学及应用语言学,2013,硕士.
[13]孙鸽林.浅水波模型方程研究[D].扬州大学,基础数学,2011,硕士.
[14]魏巍巍.高介电常数聚偏氟乙烯/金属酞菁/多壁碳纳米管复合材料的制备及性能研究[D].吉林大学,高分子化学与物理,2013,硕士.
[15]唐亮.隧道病害调查分析及衬砌结构的风险分析与控制研究[D].浙江大学,2008.
[16]赵丹.在线肺癌病例数据库的构建和初步应用[D].第二军医大学,内科学(专业学位),2013,硕士.
[17]张萍,史开泉,卢昌荆.函数S-粗集与粗规律挖掘-分离[J].系统工程与电子技术,2005,11:85-88.
[18]潘晓惠.中国区域金融中心金融生态环境差异研究[D].南京财经大学,金融学,2012,硕士.
[19]任雪艳.基于SWOT分析的云南农村文化产业发展与对策研究[D].云南大学,公共管理,2012,硕士.
[20]王树功,黎夏,钟凯文,周永章,刘凯.遥感与GIS技术在湿地定量研究中的应用趋势分析[J].热带地理,2005,03:201-205.
[21]安俊辉.组蛋白甲基化酶ESET调控小鼠精原干细胞存活的机理研究[D].西北农林科技大学,动物遗传育种与繁殖,2014,博士.
[22]刘雷.控制与引导——控制性详细规划层面的城市设计研究[D].西安建筑科技大学,2004.
[23]高超,阚兰艳,胡晓珍,许震.石墨烯基二维分子刷[A].中国化学会高分子学科委员会.2011年全国高分子学术论文报告会论文摘要集[C].中国化学会高分子学科委员会:,2011:1.
[24]李红艳.普通高中教师评价学生策略研究[D].东北师范大学,教育经济与管理,2012,硕士.
[25]胡应宏,王建赜,任佳佳,纪延超.不平衡负载的平衡分量法分解及补偿方法[J].中国电机工程学报,2012,34:98-104+15.
[26]康冬阳.方以智书画美学思想研究[D].安徽大学,美学,2013,硕士.
[27]多琦.基于电子商务的顾客满意信息收集与评价系统设计的研究[D].哈尔滨理工大学,2003.
[28]张璐.对外汉语阅读教材中的插图研究[D].华中师范大学,汉语国际教育,2013,硕士.
[29]蔡小霞.晚清“溢美”型狭邪小说研究[D].陕西理工学院,中国古代文学,2013,硕士.
[30]刘宏涛.国有商业银行运营中的寻租问题研究[D].青岛大学,金融学,2004,硕士.
[31]宋秉怿.美国1974年住房保障法评析[D].内蒙古大学,世界史,2014,硕士.
[32]何宇青.香鱼P2X7R基因解析[D].宁波大学,生物化学与分子生物学,2013,硕士.
[33]蒋林燕.广义Gamma分布的参数估计[D].西南交通大学,电子与通信工程,2014,硕士.
[34]艾华.基于指数平滑模型的禽霍乱发病预测模型的研究[D].东北农业大学,临床兽医学,2013,硕士.
[35]王颖.我国农村寿险市场发展中存在的问题及对策[D].中南林业科技大学,农村与区域发展,2013,硕士.
[36]贾自艳.中文智能搜索引擎关键技术研究[D].北京工业大学,2001.
[37]汪莉丹.《原则》(第三章)翻译报告[D].四川外国语大学,翻译(专业学位),2014,硕士.
[38]邓媛.江南水乡古镇风貌特色保护利用及对策探究[D].长安大学,城市规划与设计,2013,硕士.
[39]高丝娜.白藜芦醇对糖尿病小鼠肾脏氧化应激损伤的保护作用[D].河北医科大学,内科学,2013,硕士.
[40]鲁琛,屈稳太,杨祥龙,王春龙,曹泓,贾生尧.桃园中无线传感网络通信协议改进设计[J].农业机械学报,2014,07:260-266.
[41]陈宗松.T形条阀塔盘的研究[J].石油化工设备.1991(02)
[42]王支娟.探析解决离婚当事人房产纠纷的法律途径[D].山东大学,法律(专业学位),2013,硕士.
[43]邵华.纺织企业环境业绩评价指标体系优化研究[D].宁波大学,企业管理,2012,硕士.
[44]康凯.内蒙古国电能源公司人力资源管理研究[D].内蒙古大学,工商管理,2013,硕士.
[45]束悦.清代小说《二度梅全传》研究[D].南京师范大学,中国古代文学,2012,硕士.
[46]孙娜.网络第三方支付的法律风险防控制度研究[D].安徽大学,法律,2014,硕士.
[47]张鑫.基于灰理论的中国股票市场短期组合预测建模研究[D].武汉理工大学,统计学,2012,硕士.
[48]彭俊才.非常法定财产制下夫妻共同股权分割研究[D].华中科技大学,经济法学,2013,硕士.
[49]董亚丽,程代展,秦化淑.非线性时变系统的稳定性[J].控制与决策,2003,04:453-455+459.
[50]陶丹丹.土地整理项目综合效益评价研究[D].江西农业大学,土地资源管理,2012,硕士.
- 下一篇: 清末民初郑孝胥社会交谊探究
- 上一篇: 小学德育教育游戏的研发与应用