基于人类视觉系统的图像信息感知和图像质量评价
【摘要】图像是多媒体信息时代的主要数字信息资源。如何从海量的图像数据中迅速而准确地搜寻到我们所需的信息成为研究热点。作为一个高级视觉信息感知系统,人类视觉系统能高效地处理图像内容。因此,研究人类视觉系统的视觉信息感知特性能有效提升计算机处理图像的能力。本文探索了人类视觉系统的感知特性,重点探讨了视觉感知初期的视觉关注特性、视觉感知过程中的视觉分辨能力、以及视觉感知后期对图像质量的综合体验,并研究了其在数字图像处理中的建模及应用,这其中包括图像显著性检测算法、图像恰可识别失真阈值估计算法、图像质量评价算法。在视觉信息感知初期,人类视觉系统并非对所有图像区域平等地进行处理,而是通过视觉关注机制筛选出重要区域以进行进一步的优先解读。基于视觉关注的图像显著性检测算法能有效减少待处理图像内容,从而提升图像处理效率。对于输入视觉信息的感知过程中,由于视觉系统的分辨能力有限,无法察觉出处于一定阈值以下的信号内容变化。恰可识别失真阈值表征视觉系统感知能力,可有效去除图像冗余信息,从而提升图像压缩性能。对于一幅待处理的图像,其质量直接决定了主观视觉对其的认知充分性和准确性。图像客观质量评价算法能够预测主观视觉对图像内容的综合体验,可用来优化以视觉质量为目的的图像处理系统。本文的具体研究内容包括以下三个方面:(1)探寻视觉感知初期视觉关注特性,研究图像内容特性对视觉关注的吸引作用。针对视觉系统更加关注那些与周边具有不同特征的图像区域,提出了一种简单的基于内容对比度的图像显著性目标提取算法:首先,通过分析主观视觉关注研究成果,总结影响视觉关注的图像特征;然后,根据亮度对比度、边缘对比度等图像内容特性来度量图像内容的显著性;最后,根据显著性指导提取图像中感兴趣目标。进一步地,我们深入分析视觉系统的关注特性,针对人类视觉系统更加关注视觉信息丰富的图像区域,提出了基于视觉信息量的图像显著性检测算法:首先通过估计图像像素间的相关性,度量图像内容的视觉冗余程度;接着,根据像素的分布特性,计算图像内容的信息熵;然后,从信息熵中去除图像的视觉冗余,获得图像内容的视觉信息量;最后,采用视觉信息量来度量图像显著性,从而建立显著性检测模型。(2)探索视觉感知过程中的视觉分辨能力,研究图像内容区域的恰可识别失真阈值。视觉系统非常善于提取图像的结构信息,并通过结构比对及模式匹配来理解图像内容,因此视觉系统对具有自相似结构区域分辨能力强。针对人类视觉系统对具有规则内容的图像区域高度敏感,提出了基于结构自相似性的恰可识别失真阈值估计算法:根据相邻像素间的相似性,首先度量图像内容的结构自相似程度;然后,根据结构自相似性提出了新的空域掩模方程;最后,结合现有的亮度敏感度方程和所提空域掩模方程,建立恰可识别失真阈值估计模型。进一步地,根据最新大脑认知研究提出了的自由能量新理论,分析主观视觉对图像信息的分辨能力。自由能量理论指出,视觉系统能准确解读有序图像内容,而无法准确解读图像不确定信息并忽略该部分内容的细节。针对人类视觉系统无法准确解读图像中的不确定信息,提出了基于自由能量理论的恰可识别阈值估计算法:根据这一感知特性,模拟视觉系统对输入信号的积极预测过程,将图像分解为可预测内容及不确定信息;然后,分别计算图像可预测内容及不确定信息这两部分的视觉分辨能力;最后,结合两者确定图像的恰可识别失真阈值。此外,根据自由能量理论指导,系统地分析图像结构不确定性对视觉分辨能力的作用,提出了基于结构不确定性的模块掩膜效应估计算法:首先,根据自由能量理论指导分解出图像不确定信息;接着,对图像不确定信息采用局部二值模式度量其结构不确定性;然后,根据结构不确定性及亮度适应性计算视觉的模块掩膜效应;最后,根据模块掩膜效应提出了新的恰可识别阈值计算方程。(3)探讨视觉感知后期主观视觉对图像质量的综合体验,研究噪声对图像质量的衰减作用。根据内在推导机制理论,不同类型噪声将对可预测的主要视觉内容及残余的不确定信息这两部分内容造成不同的影响,并导致不同的质量衰退结果。针对这一感知特性,提出了基于内在推导机制的全参考图像质量评价模型:根据内在推导机制理论,我们首先分析噪声对图像主要视觉内容及不确定信息的质量衰退的作用;然后,分别计算图像的主要视觉内容衰减程度及不确定信息的变化情况;最后,根据噪声能量的分布情况非线性结合这两部分内容的评价结果,获得图像的最终质量。此外,针对一些应用场景中仅存在部分原参考信息,我们研究部分参考质量评价模型。大脑的内在推导机制理论指出噪声将影响图像的主要视觉内容及不确定信息。根据噪声对视觉信息的衰减作用,提出了基于视觉信息保真的部分参考图像质量评价模型:首先,分别计算原参考图像与待测图像的主要视觉内容及不确定信息的具体信息量;然后,通过度量主要视觉内容及不确定信息的信息量衰减情况,从而得出图像质量。为了更加准确度量图像质量衰减情况,根据噪声对图像结构内容的破坏作用,提出了基于图像结构衰减的部分参考图像质量评价模型:首先,采用局部二值模式分析图像结构特性;然后,计算每个局部二值模式所对应的图像结构衰减情况;最后,融合所有局部二值模式下的结构衰减程度获得图像质量。上述研究成果从主观视觉感知的角度对图像处理进行分析与研究,具有一定的前瞻性和挑战性。本文在理论分析上取得一些突破,在技术实现上具有一些创新,为基于主观视觉感知的客观图像处理开辟了新的思路,具有重要的理论意义及实用价值。
【作者】吴金建;
【导师】石光明;
【作者基本信息】西安电子科技大学,电路与系统,2014,博士
【关键词】人类视觉系统;视觉关注;显著性;视觉分辨能力;恰可识别失真阈值;结构自相似;图像质量评价;内在推导机制;结构不确定度;
【参考文献】
[1]朱维娜.新疆阿吾拉勒成矿带中段典型铁矿床成矿物质来源与矿床成因研究[D].中国地质大学(北京),矿物学、岩石学、矿床学,2014,硕士.
[2]王宏琳.新一代系统──计算机集成油气勘探系统[J].石油地球物理勘探,1996,06:898-906.
[3]孙会.旧桥检测及加固方法研究与应用[D].长安大学,建筑与土木工程(专业学位),2013,硕士.
[4]陈建玲.上市建筑企业经营绩效评价研究[D].武汉理工大学,会计学,2012,硕士.
[5]周素霞.高速列车空心车轴损伤容限理论与方法研究[D].北京交通大学,2010.
[6]彭囝囡.员工感知的企业社会责任与工作绩效关系的研究[D].新疆财经大学,企业管理,2013,硕士.
[7]朱强.农村中介组织发展趋势研究[D].湖南农业大学,农业经济管理,2004,硕士.
[8]吴芝路,张士金.浅谈移动通信CRM系统建设[J].信息技术,2003,04:74-77.
[9]赵东雄.多自动导引小车系统(AGVS)路径规划研究[D].湖北工业大学,机械设计及理论,2014,硕士.
[10]蒋丽珠.海马Racl活性与场景恐惧记忆的维持及遗忘[D].中南大学,临床医学,2014,博士.
[11]谢峥.英国《取消董事资格法案》中“不适格”之研究[D].对外经济贸易大学,国际法学,2004,硕士.
[12]李洁.基于换乘协调的城市轨道交通运力资源配置研究[D].北京交通大学,2014.
[13]谢君平.网络消费商品质量瑕疵问题研究[D].大连海事大学,法律,2014,硕士.
[14]刁维萍.水稻不同基因型吸收积累镉的差异及其机理研究[D].浙江大学,植物营养学,2004,硕士.
[15]王姗.基于企业绩效的人力资源管理信息系统设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[16]吕明,宁智,阎凯,付娟,孙春华.超空化条件下液体射流热稳定性研究[J].计算力学学报,2014,04:506-510.
[17]夏芬.基于体验的乡村旅游开发研究[D].湖北大学,人文地理学,2011,硕士.
[18]宋宇文.探究现代女性消费心理对商品包装设计的诉求[D].上海师范大学,设计艺术学,2013,硕士.
[19]刘晓庆.草原承包经营权流转中的出租方式研究[D].内蒙古大学,民商法学,2013,硕士.
[20]杨颖.ERP环境下物料管理子系统的研究与开发[D].合肥工业大学,材料加工工程,2004,硕士.
[21]温鑫菲.围青春期女孩系统性低度炎症与体脂积累的变化趋势及关系[D].上海体育学院,运动人体科学,2014,博士.
[22]李敏.学生视角下的高职院校师生关系研究[D].南京师范大学,基础心理学,2012,硕士.
[23]赵岑.P波预警中的震级预测和PGA、PGV估算研究[D].西南交通大学,建筑与土木工程,2013,硕士.
[24]陈涛.苍南县农村社区建设研究[D].华东理工大学,公共管理(专业学位),2014,硕士.
[25]李恩喜.非小细胞肺癌术后辅助化疗的近期疗效与驱动基因EGFR、KRAS和耐药蛋白ERCC1、RRM1的相关性分析[D].吉林大学,内科学,2013,硕士.
[26]陈振华.北部湾环流季节变化的数值模拟与动力机制分析[D].中国海洋大学,物理海洋学,2013,博士.
[27]杨红.铁路与城市轨道交通一体化发展研究[D].北京交通大学,2008.
[28]高境泽.金融调控权的构造及其边界[D].吉林大学,法律,2014,硕士.
[29]王帝.CX信用服务公司项目投资效益分析[D].吉林大学,项目管理,2014,硕士.
[30]秦文华.奥尔夫教学法在幼儿音乐教育中的应用探索[D].山东大学,音乐学,2013,硕士.
[31]张鹏.后唐伶宦、后妃干政研究[D].西北大学,专门史,2014,硕士.
[32]赵洹琪.伊拉克战争中中美媒体报道差异性研究[D].吉林大学,新闻与传播,2014,硕士.
[33]邓冰心,张波,姜剑锋.稀土元素对ZrO_2-M_2O_3/MCM-41(M=La,Ce,Sm,Gd)氢转移催化活性的影响[J].无机化学学报,2015,01:153-158.
[34]常威.移动解耦并联机构型综合及样机研制[D].燕山大学,机械设计及理论,2014,硕士.
[35]邹帆.基于神经网络的多轴教学机器人控制系统的设计与实现[D].湖南大学,控制工程,2012,硕士.
[36]金兰.媒体栏目收视率影响因素研究[D].浙江工业大学,2013.
[37]刘瞻.数字出版著作权保护问题研究[D].郑州大学,法律,2013,硕士.
[38]郭鑫.基于分布式控制的束流路径校正和远程监测研究[D].中国科学院研究生院(上海应用物理研究所),信号与信息处理,2014,硕士.
[39]龙艳.我国高中语文教材中女性形象审视与重塑[D].西南大学,课程与教学论,2014,硕士.
[40]樊琳娟.龙清廉人物画研究[D].新疆师范大学,美术学,2014,硕士.
[41]王文竹.滚珠丝杠副的接触变形及其传动系统的温度场分析[D].东北大学,机械制造及自动化,2010,硕士.
[42]曹瑞平.高速耗单轨电流模逻辑电路设计术[D].宁波大学,电路系统,2014,硕士.
[43]刘子祥.长沙鸟类群落结构及丝光椋鸟(Sturnus sericeus Gmelin)的生态研究[D].湖南师范大学,动物学,2014,硕士.
[44]田静和.论《乐经元义》中刘濂对古典乐律文献的质疑[D].武汉音乐学院,音乐舞蹈学,2013,硕士.
[45]冷文光.基于聚苯胺和苯胺寡聚体的微米/纳米组装结构的制备与性质研究[D].复旦大学,材料物理与化学,2013,博士.
[46]丁晨.对企业长期竞争活动中技术创新绩效的评价及优化[D].西安电子科技大学,管理科学与工程,2004,硕士.
[47]闵芳.均相法检测小而密低密度脂蛋白浓度的研究[D].南京理工大学,化学工艺,2013,硕士.
[48]阿扎巴雅尔.中蒙抵押权制度比较研究[D].内蒙古大学,民商法学,2013,硕士.
[49]韩华.全球化背景下社会主义的历史演进及逻辑启示[D].曲阜师范大学,马克思主义理论与思想政治教育,2004,硕士.
[50]俞宏.高速锁相环集成电路芯片的设计[D].浙江大学,2005.

- 下一篇: 矿山牵引电机车控制系统的研究
- 上一篇: 语义关联的注意捕获
相关推荐
- 锂离子电池硅碳复合负极材料的制备及其性能研究
- 07月17日
- 西南大西洋部分经济鱼种形态学与遗传学初步研究
- 09月22日
- C公司员工招聘体系优化研究
- 12月31日
- 内蒙古博领科技教育业务发展战略研究
- 06月30日