手写维吾尔文字识别若干关键技术研究
【摘要】相比拉丁字母、汉字等文字,目前对自然草体文字如阿拉伯文、维吾尔文的手写识别研究相对较少。本文研究脱机和联机手写维吾尔文字识别方法,包括字符识别、字符分割和单词识别等几个关键性技术。针对维吾尔128类字符,提出基于部件分解和融合的手写字符识别算法。首先构建手写维吾尔部件库和字符的部件字典,将字符分解为主体、附加和点三类部件,并结合连笔分析获得较鲁棒性的部件描述;其次,针对各类部件的不同特点设计相应的特征抽取和分类器,通过部件匹配来检测和辨识相似字间的微小差异;为减轻手写字符拓扑变形造成的干扰,对联机部件提取一种统计特征即时分方向特征;最后,对多个部件的分类输出进行融合,获得字符识别结果。提出字符识别的多部件自适应融合策略。提出一种实时的融合系数计算方法,利用部件匹配测度分布来估计其权重,以实现部件的自适应融合。提出基于加权和、基于朴素贝叶斯模型、以及基于改进D-S证据理论的部件融合算法。对比实验证实,基于改进D-S证据理论的融合算法能够克服加权和融合鉴别能力较弱、以及贝叶斯融合对噪声过于敏感等缺点,有效提升了字符识别算法的识别率和稳定性。针对维吾尔词书写粘连和手写笔画漂移等问题,提出基于多信息加权融合路径寻优的字符分割算法。首先,提出基于主体切分和附加聚类的字段过分割算法,并通过字段模糊匹配获得鲁棒的字根序列描述;然后,建立匹配位置高斯模型来估算字段匹配信息,以抑制笔画漂移造成的干扰;最后,构建字符序列二阶Markov语言模型,并基于Bayes准则提出单词后验概率的多信息加权融合计算方法,综合字段匹配、字符识别和语义信息,对字段匹配及字根合并的路径进行寻优,以最佳分割路径得到字符分割结果。提出一个结合反馈结构和字段分析的手写维吾尔单词识别系统。为克服顺序结构中的错误累积问题,该系统构建反馈结构,通过对字段形态错误、字符识别错误和单词匹配错误三种反馈信息的估计和响应,来控制字符分割和单词识别的结果。首先,过分割单词图像得到主体和附加字段序列;其次,根据反馈信息设计字段合并策略,以获得最优的字符分割序列;然后,利用字符分割时所获取的结构信息,设计多级混合维吾尔字符分类算法,以提升字符识别准确性;最后,提出双层动态时间规整算法,通过字符序列匹配获得单词识别结果。
【作者】许亚美;
【导师】卢朝阳;
【作者基本信息】西安电子科技大学,通信与信息系统,2014,博士
【关键词】手写文字识别;脱机;联机;维吾尔语;字符识别;字符分割;单词识别;部件;多信息融合;反馈;
【参考文献】
[1]李晓霞.内部审计质量与公司治理关系的研究[J].中国商贸,2014,26:38-39+41.
[2]文倩.结构化压缩感知在无线通信网络流量预测中的应用研究[D].浙江大学,信息与通信工程,2013,硕士.
[3]申志军.增加值贸易统计核算方法与实践研究[D].北京交通大学,应用统计(专业学位),2013,硕士.
[4]蒋晓源.悬索桥高大塔柱裂缝仿真及安全性评估分析[D].重庆交通大学,桥梁与隧道工程,2012,硕士.
[5]皋军.基于模糊理论的数据挖掘技术的研究与应用[D].南京航空航天大学,2004.
[6]王平让.PIV图像后处理新方法研究[D].大连理工大学,港口、海岸及近海工程,2004,硕士.
[7]史爽.缪凤林文化民族主义史学思想研究[D].华中师范大学,中国近现代史,2013,硕士.
[8]吴鑫.医学翻译实践报告[D].长沙理工大学,英语笔译(专业学位),2013,硕士.
[9]尔肯·艾买提.新疆青少年足球专业后备人才培养现状研究[D].新疆师范大学,体育教育训练学,2013,硕士.
[10]赵经营.耳穴按摩融合自我管理模式干预高血压病的临床研究[D].广州中医药大学,中西医结合临床(专业学位),2013,硕士.
[11]张晓东.平板气膜冷却的实验研究[D].浙江理工大学,车辆工程,2013,硕士.
[12]李海涛.农村居民就医行为及其模型研究[D].南京农业大学,社会学,2012,硕士.
[13]邹慧.神东风积沙区煤炭开采对土壤水分运移规律的影响[D].中国矿业大学(北京),土地资源管理,2014,博士.
[14]刘航.马克思有关机器的技术哲学思想研究[D].哈尔滨工业大学,科学技术哲学,2013,硕士.
[15]程福明.羟基磷灰石荧光纳米粒子的制备与表征[D].山东大学,2014.
[16]敖永红,邹钢,吴志,刘俊林.基于SQLServer数据库多媒体数据的管理[J].微型电脑应用.2002(01)
[17]丁林根.泰国BNS公司棒材轧机的自动控制系统[J].冶金自动化,1998,06:45-48.
[18]丁磊.雷达电源集成测试系统[D].兰州理工大学,控制工程,2013,硕士.
[19]王华.电针结合康复训练治疗脑卒中后足内翻的临床疗效观察[D].湖南中医药大学,针灸推拿学,2014,硕士.
[20]梁勇奇,韩崇昭,石勇.可控结构半弹道式再入飞行器的跟踪及充满空间的模型集设计[J].自动化学报,2010,11:1534-1543.
[21]曹婷.对建筑工程质量民事责任的探讨[D].苏州大学,法律(专业学位),2014,硕士.
[22]陈丽娟,杨欣,夏安邦.热电厂MES系统数据仓库的设计与应用[J].东南大学学报(自然科学版),2005,S2:188-192.
[23]黄加异.无线传感器网络多路径分布式能耗均衡路由协议研究[D].广东工业大学,控制工程,2013,硕士.
[24]杜飞.上下文环境下探测概念漂移的算法研究[D].山东大学,计算机软件与理论,2013,硕士.
[25]卢和煜.废钢铁回收加工业要大力发展[J].中国物资再生.1993(04)
[26]梁敏慧1,崔亚娟2,何梅2,李东2,闫红1.叶黄素分析检测方法研究进展[J].食品工业科技.
[27]成建国.鄂钢380m~3高炉供上料系统设计[J].炼铁.1999(06)
[28]王愿石.语意的复归与重建[D].安徽师范大学,美术学,2004,硕士.
[29]魏云洁,刘鲁.探寻新常态下旅游研究的新课题——2014《旅游学刊》中国旅游研究年会综述[J].旅游学刊,2014,11:125-128.
[30]李奇.阜朝公路滑坡体探测和定位研究[D].东北大学,摄影测量与遥感,2010,硕士.
[31]罗方.基于高阶统计量的非最小相位地震子波提取方法研究[D].成都理工大学,信号与信息处理,2013,硕士.
[32]李娇.中国女排与世界女排强队技术运用比较分析[D].沈阳师范大学,体育教育训练学,2013,硕士.
[33]王新民,秦文琦,李清权.一种频率自动跟随的电流型变频调速系统[J].冶金自动化,1995,02:41-43.
[34]叶瑞.基于梯度下降法的组合分类器在质量诊断中的应用研究[D].南京理工大学,管理科学与工程,2013,硕士.
[35]张欣欣.基于压缩感知的WSN数据处理方法的研究[D].哈尔滨工业大学,控制工程,2014,硕士.
[36]刘卫东.水稻中大麦Mlo和玉米Hml抗病基因同源序列的研究[D].华中农业大学,生化与分子生物学,2000,硕士.
[37]米甜.英语动结结构的句法结构再研究[D].四川外国语大学,英语语言文学,2013,硕士.
[38]郝俊杰.麦谷蛋白亚基的动态积累及其Glu-1基因座的遗传多样性研究[D].河南农业大学,作物遗传育种,2004,硕士.
[39]陈家欢.赣南乡村聚落外部空间的衍变[D].华侨大学,建筑设计及其理论,2014,硕士.
[40]张生瑞,邵春福,严海.公路交通可持续发展评价指标及评价方法研究[J].中国公路学报,2005,02:74-78.
[41]赵立艳.案例教学法的理论、实践与启示[D].东北师范大学,教育,2003,硕士.
[42]肖志松.美国专利法最新修改及其对中国的借鉴研究[D].复旦大学,法律,2012,硕士.
[43]刘文.半固态合金熔体的表观粘度研究[D].北京交通大学,2007.
[44]黄超.血管紧张素Ⅱ受体基因多态性与原发性醛固酮增多症发病风险相关性研究[D].厦门大学,外科学,2014,硕士.
[45]陈俊.论职务犯罪侦查规律及在渎职侵权案件侦查工作中的运用[D].华中科技大学,经济法学,2013,硕士.
[46]鲍霖.甘肃岗岔金矿成矿预测研究[D].中国地质大学(北京),地质工程,2014,硕士.
[47]郭磊.双膜覆盖和环剥技术在葡萄促早栽培中应用的研究[D].南京农业大学,果树学,2011,硕士.
[48]薄萍萍.证券公司破产标准研究[D].西南政法大学,民商法学,2012,硕士.
[49]高志阳.由L-α-亮氨酸三联吡啶配体构建的手性金属配合物的合成及性能研究[D].郑州大学,无机化学,2013,硕士.
[50]裴可灵.环酰亚胺类肽化合物CIP-13F抗肿瘤转移作用研究[D].济南大学,药理学,2012,硕士.
- 下一篇: 几类约束矩阵方程的迭代解法研究
- 上一篇: 十六大以来中国共产党民生建设研究