基于语料库的能够独立成句的一词结构和三词结构研究

基于语料库的能够独立成句的一词结构和三词结构研究

作者:师大云端图书馆 时间:2023-02-26 分类:硕士论文 喜欢:1443
师大云端图书馆

【摘要】能够独立成句的一词结构和三词结构作为特殊的语言现象,存在于各种汉语文本中,有一定的研究价值。本文所做的工作,主要是对大规模中文语料库文本中能够独立运用的一词结构和三词结构进行分类统计和结构分析,这些都是在对语料库文本分词与词性标注的基础上进行的。本文的结构内容设计共分为五章:第一章,是对语料库的发展进行概述,简单介绍了语料库的国内外发展情况,介绍了本论文的选题缘由、研究目的、意义和内容结构设置。第二章,首先对汉语词语切分的基本定义做了简要概括,再介绍汉语词语切分的难点以及切分效果的评价。以此为依据,来证明本文运用的词语切分工具的切分准确率是比较高的,可以忽略语料库文本词语切分中的一些噪音。第三章和第四章为论文的主要部分,这两部分是通过几个实验来得出结论的。第三章抽取测试文本中夹在两个中文标点之间的能够独立运用的一个词语的结构,按照词频统计数据得出独立成句的结论,然后对这些词语进行分类,得出能够独立成句的词语所属词类所占的比例,再通过计算各成句词语所属词类独立成句的条件概率,计算出不同词类的词语在实际应用过程中独立出现的次数与总共出现的次数的比值。判断出哪类词语被独立运用的概率高。第四章实验步骤与第三章相似,抽取小规模测试文本中的夹在两个中文标点之间的能够独立成句的三个词语的结构,绘制相应的词表,并计算各个词条的t-测试值,设定阈值判断出三个词语中的中间词更倾向于同前、后两个词中的哪一个先结合,划分出(A+B)+C和A+(B+C)两种类型。最后再对这些能够成句的三词结构进行结构类型的划分。通过统计的方式判断出哪种结构类型的三词结构更容易被独立运用。第五章为总结与展望,对本论文的两大主要章节得出的结论进行总结,并对本论文未完成的工作以及对将来的进一步研究进行介绍。对大规模的语料库进行中文信息处理之后发现,能够独立成句的高频词和中频词,在文本中出现的次数越多,能够独立成句的机会越大。而低频词部分随着在测试文本中出现次数的减少,能够独立使用的机会基本不变。另外,还得出大部分实词是可以独立成句的,虚词中只有少量的词类能独立成句,但是实词中的名词、动词、形容词等更多的是同其他成分组合构成句子,相对来说独立成句的机会不是很大。相反,虚词中的拟声词、叹词等,独立出现次数虽然很少,但是,它们在文本中出现的总次数也不多,它们独立使用的机会相对来说比较大。三词句在组合形式上有(A+B)+C与A+(B+C)两种,在一定的阈值范围内可以通过t-测试值来确定三词结构在形式上属于哪一种类型。超出一定阈值范围内的结构,不能仅仅凭借t-测试值来判断,要根据具体的词条来确定其类型。另外,从句子结构上来看,三词句多以主谓结构、动宾结构和偏正结构形式出现。
【作者】褚红伟;
【导师】王修力;
【作者基本信息】安徽大学,语言学及应用语言学,2014,硕士
【关键词】语料库;统计;一词结构;三词结构;类型;

【参考文献】
[1]刘琼.中小学机器人教育模式设计与应用研究[D].河北师范大学,教育技术学,2012,硕士.
[2]吴通华,郑玉平,张哲,窦乘国.单通道条件下纵差和纵联保护无缝切换机制[J].电力系统自动化,2011,17:72-75.
[3]田冬英.两栖可变形机器人控制系统与自主越障研究[D].沈阳理工大学,模式识别与智能系统,2013,硕士.
[4]罗厚福.执行器故障下自适应容错控制算法研究[D].东北大学,控制理论与控制工程,2010,硕士.
[5]沈志刚,李金芝,易敏.射流空化方法制备石墨烯研究[A].中国颗粒学会颗粒制备与处理专业委员会.颗粒学最新进展研讨会——暨第十届全国颗粒制备与处理研讨会论文集[C].中国颗粒学会颗粒制备与处理专业委员会:,2011:3.
[6]何冠楠.基于脆弱性分析的随机路网设计[D].西南交通大学,交通运输规划与管理,2014,硕士.
[7]李畅.谈生肖图像在现代设计中的文化魅力[D].沈阳师范大学,美术学,2014,硕士.
[8]佘佐亚.绿色荧光蛋白转基因小鼠舌癌模型的建立和荧光表达观察[D].广西医科大学,病理生理学,2013,硕士.
[9]卓龙浩.国债收益率曲线的动态估计与预测[D].华中科技大学,金融,2013,硕士.
[10]申建利.高速动车轴承轴颈监测及智能选配的研究[D].太原科技大学,计算机应用技术,2014,硕士.
[11]井长海.《左传》与口头传统[D].山东大学,民间文学,2013,硕士.
[12]王睿.草原生态补偿法律制度研究[D].复旦大学,法律,2012,硕士.
[13]雷英.P公司成本管理诊断报告[D].首都经济贸易大学,工商管理(专业学位),2014,硕士.
[14]张博.在线测径仪控制系统设计[D].河北大学,集成电路工程,2014,硕士.
[15]胡瑞峰.中部六省会城市休闲发展水平评价研究[D].华中师范大学,自然地理学,2012,硕士.
[16]费江华,何永辉,孙晨,黄胜标.一种基于特征选择的组合分类器在带钢表面缺陷分类中的应用[J].冶金自动化,2010,02:19-23.
[17]王婧.女性生育权的法理分析[D].黑龙江大学,法律,2013,硕士.
[18]牛晶.中英义务教育阶段数学课程标准比较[D].东北师范大学,学科教学(专业学位),2012,硕士.
[19]喻晓琴.滇池流域典型城镇雨水径流特征及截流方法研究[D].重庆大学,市政工程,2014,硕士.
[20]周春萍.一类由元素的阶数之和决定的有限群[D].华中师范大学,基础数学,2013,硕士.
[21]孙国臣.基于Android系统的139邮箱的设计与开发[D].山东大学,电子与通信工程(专业学位),2013,硕士.
[22]赵焜.黑龙江省森林碳汇经济可持续发展问题研究[D].东北农业大学,林业经济管理,2013,硕士.
[23]王成峰,周爱,王利光,陈国庆.碳电极桥接富勒烯分子C_(36)的电子学特性研究[J].黑龙江大学自然科学学报,2013,06:815-818+826.
[24]程军保.基于JAVA EE的矿业权专家预审系统研究与应用[D].中国地质大学(北京),地图制图学与地理信息工程,2014,硕士.
[25]沈雁冰.郑州市143例经不同途径诊断的前列腺癌患者临床病理特征的对比分析[D].郑州大学,泌尿外科(专业学位),2013,硕士.
[26]陈珊.促进问题解决的学习干预设计与应用研究[D].华东师范大学,教育技术学,2013,硕士.
[27]吴公华.可持续发展视角下的西部经济发展状况综合评价研究[D].内蒙古农业大学,技术经济及管理,2013,硕士.
[28]司金林.泰安市人力资源和社会保障局劳动用工登记管理系统设计与实现[D].山东大学,软件工程(专业学位),2013,硕士.
[29]李萱.环境法学基础理论研究的困境及出路[D].清华大学,民商法学,2003,硕士.
[30]崔丹.朝鲜族村落老年群体文化的重构[D].辽宁大学,民俗学,2012,硕士.
[31]吴石金,赵士良,沈飞超,徐铭.蚯蚓蛋白质组双向电泳技术体系的建立及条件优化[J].浙江工业大学学报,2013,02:156-160+190.
[32]陶冉.城市社区养老需求及服务供给研究[D].山东财经大学,社会保障,2013,硕士.
[33]张秀云.MnSOD硝基化在高糖致心肌细胞“代谢记忆”效应中的作用[D].辽宁医学院,内科学,2012,硕士.
[34]陶慧蕴.搜索引擎“快照”类服务的著作权侵权研究[D].复旦大学,法律,2012,硕士.
[35]杨卓超.网络服务中格式条款研究[D].吉林大学,民商法学,2013,硕士.
[36]李志梁.采高及关键层层位对覆岩裂隙演化影响的实验研究[D].西安科技大学,安全技术及工程,2014,硕士.
[37]李炳强.空间光学遥感器运动学支撑方案设计与分析[D].中国科学院研究生院(长春光学精密机械与物理研究所),机械制造及其自动化,2012,硕士.
[38]郭成钢.客户关系管理——在商业企业中的实现[D].东北财经大学,企业管理,2003,硕士.
[39]吴涛,周有庆,龚伟,曹志辉,张雪美.基于新型电子式电流互感器的多功能电能表的设计[J].电力系统自动化,2008,16:56-60.
[40]吴丘林.无线传感器网络密钥预分配方案研究[D].湖南大学,计算机科学与技术,2011,硕士.
[41]王丽娟.直径为奇数的Bannai/Ito型勒纳德三元组的分类[D].河北师范大学,基础数学,2014,硕士.
[42]刘亚梅.生本教育理念下的初中地理教学策略研究[D].河北师范大学,学科教学,2013,硕士.
[43]许冀锟.2013年E3大展同声传译实践报告[D].河北师范大学,翻译,2014,硕士.
[44]赵阳.生物膜在犬上颌窦提升黏膜穿孔中的作用研究[D].山东大学,口腔临床医学,2013,硕士.
[45]朱兴曦.宁夏引黄灌区水稻节水控灌技术应用研究[D].西安理工大学,水利工程,2003,硕士.
[46]廖伟.基于多核DSP的实时图像增强显示硬件系统实现[D].中国科学院研究生院(光电技术研究所),检测技术与自动化装置,2014,硕士.
[47]王珺.电信客户流失预测的统计分析[D].云南财经大学,统计学,2013,硕士.
[48]敖伊敏.不同围封年限下典型草原土壤生态化学计量特征研究[D].内蒙古师范大学,环境科学(专业学位),2012,硕士.
[49]韩锐.基于SolidWorks的机构运动仿真研究[D].西安理工大学,机械设计及理论,2004,硕士.
[50]严爱军,柴天佑,王普.基于案例推理的竖炉故障预报系统[J].控制与决策,2008,02:177-181.

相关推荐
更多