基于图像结构特性的图像视频压缩
【摘要】随着电子设备、计算机及网络的迅速发展和人们需求的增高,数字图像和视频数据正以极快的速度产生和传播。图像视频的分辨率、帧率、动态范围等在不断增大。图像视频的类别也越来越丰富,例如照相机及摄像机获取的自然图像及视频,计算机生成的混合图像视频,深度相机获取的深度图像视频等。存储或传输这些图像和视频数据均需要高效的压缩方法来减少数据量并保证好的图像质量。传统的图像视频压缩方案主要通过预测、变换、量化和熵编码来减少数据冗余,从而实现压缩。其中,预测利用了图像及视频的空域和时域的结构相关性,变换利用了图像的低通特性将信号能量集中。然而这些方法对图像的结构特性尚未充分利用。本文分析了图像的结构特性,包括局部结构特性和非局部结构特性,例如混合图像文字图形区域的高频特性,具有稀疏直方图的结构特性,相似模式重复出现的特性等,以及自然图像中内容的重复相似性结构特性,深度图像在物体边界呈现的急剧变化的结构特性。并针对这些结构特性设计了高效的压缩方法,实现了重要的编码性能提高。本文的主要研究内容和成果为:1.针对混合图像的局域结构特性,提出了两种空域编码方法:残差标量量化(ResidualScalarQuantization,RSQ)方法,基颜色索引表(BaseColorsandIndexMap,BCIM)方法。文字图形块常呈现复杂的形状并具有多方向性。文字图形区域的预测残差也表现出较强的各向异性。经过变换,信号能量会扩散到中高频带而不易压缩。RSQ模式对预测残差直接进行量化和熵编码,而跳过了变换。从而实现了对残差的更紧凑表达。另外,文字图形块一般由有限的几个颜色值组成。BCIM方法利用这一特性,用几个有代表性的基颜色和一个索引表来简洁地表达整个图像块。我们采用动态规划算法来对基颜色进行选取以最小化重建失真,并用率失真优化来确定最优的基颜色数目。我们将RSQ和BCIM这两种方法分别设计成帧内编码模式,从而能方便地集成到块基的编码框架下。由于有效地利用了文字图形区域的局部结构特性,这两种编码方法在混合图像压缩中实现了甚至高于10dB的编码增益。2.针对混合图像在非局域区域经常拥有相似的文字图形内容这一结构特性,提出了利用一维字典基的Lempel-Ziv-MarkovChainAlgorithm(LZMA)压缩方法对混合图像压缩。通过从字典中寻找与编码字符串匹配的内容,并以紧凑的方式对匹配串描述,LZMA有效地利用了相似模式重复出现的图像结构特性来去除冗余。为了对含有噪声或已压缩的混合图像仍获得较高的压缩性能,我们对LZMA方法进行了扩展使其支持有损字典基的压缩。我们将该方法设计成一个帧内编码模式并集成到块基的编码框架中,在混合图像压缩中实现了重要的编码性能提高。3.针对自然图像及视频中存在的非局域结构相似性,提出了信号依赖变换(SignalDependentTransform,简称SDT)的方法。图像及视频中存在大量的非局域相关性内容,表现在具有相似结构的内容常在非局域区域重复出现。然而,在不增加用于表示这些相似内容位置信息所需比特情况下,如何有效利用非局域相关性来帮助压缩仍然非常困难。为了解决这个问题,我们在非局域区域寻找与编码内容相似的大量图像块,并用这些图像块来训练信号依赖的变换(SDT)。由于编码端和解码端能用相同的方法来推导SDT,该方法成功避免了编码额外的头信息。我们将SDT应用到KeyTechnologyArea(KTA)压缩软件中来利用空域和时域的非局域相似性结构特性。在帧内(intra)编码中,该方法较之KTA实现了高达1.4dB的编码增益;在帧间(inter)编码中,实现了高达1dB的编码增益。4.针对Kinect获取的深度和彩色图像视频,考虑到深度和彩色图像对齐的结构特性(对同一场景从相近视角的同步获取),以及深度图像在物体边界常具有急剧变化的结构特性,设计了目标基(object-based)的编码框架来对类似Kinect获取的深度和彩色图像视频进行压缩。该方案对不同的目标平面进行独立编码,避免了对物体边界块做为一个整体进行的编码,因此该编码方法在深度图像视频压缩上实现了重要的编码增益。该方案支持基于目标的编码,即可以只传输感兴趣的目标平面而非整幅图像,这为在保证感兴趣目标重建质量前提下实现位流的减少提供了有效的方法。上述研究工作主要从利用图像视频的结构特性出发来研究提高图像视频编码性能的方法。我们针对混合图像不同于自然图像视频的结构特性设计了空域的压缩算法,从而极大地提高了编码性能。自然图像视频也存在一些尚未有效利用的结构特性。非局域相似性特性就是其中之一。实验结果表明,有效地利用图像视频的结构特性能为编码性能的提升带来新的希望。
【作者】兰翠玲;
【导师】吴枫;石光明;
【作者基本信息】西安电子科技大学,智能信息处理,2014,博士
【关键词】图像视频编码;图像结构特性;局域相关性;非局域相关性;
【参考文献】
[1]刘凤娇.基于线阵CCD非接触式实时动态检测生丝细度[D].苏州大学,光学工程,2013,硕士.
[2]许兆新,郝燕玲.2变量约束的挖掘查询优化技术研究[J].计算机工程与应用,2004,06:191-192+229.
[3]张致忠,金丰友.大尺寸螺纹孔系的旋风加工技术[J].一重技术.1997(01)
[4]许金立.基于商圈理论的商业地产项目定位研究[D].北京交通大学,2008.
[5]冯慧中,龙志祥,庞春秀.高速高阶可编程数字滤波技术与实现[J].电讯技术.1992(03)
[6]杨金艳,杨万勤,王开运,孙建平.木本植物对CO_2浓度和温度升高的相互作用的响应[J].植物生态学报,2003,03:304-310.
[7]王辉.时频分析在地震资料提频去噪中的应用[D].长安大学,地质工程(专业学位),2014,硕士.
[8]安寅.股权集中度、股权制衡度与营运资金政策相关性研究[D].西南交通大学,会计学,2013,硕士.
[9]王罗强.基于化工企业特点的ERP导入策略探讨[D].湘潭大学,2002.
[10]任秀峰.调整产品结构适应市场需求[J].机械与电子.1990(06)
[11]张姝.肝郁型抑郁症患者与正常人的脑功能影像学差异研究[D].北京中医药大学,中医内科,2014,硕士.
[12]段媛媛.让“谈摇色变”成为过去时[D].西北民族大学,文艺学,2012,硕士.
[13]权一男.基于节点状态的分布式文件系统存储副本分发策略的研究[D].吉林大学,网络与信息安全,2013,硕士.
[14]赵晓蕊.犯罪嫌疑人、被告人逃匿、死亡案件违法所得没收程序的研究[D].广西民族大学,法律,2013,硕士.
[15]张春焕.气体燃料船用主机工作过程三维数值模拟研究[D].大连理工大学,动力机械及工程,2013,硕士.
[16]刘清.高中历史学科学业水平考试试题与课程标准的一致性分析研究[D].新疆师范大学,学科教学,2013,硕士.
[17]池程芝,章卫国,朱江乐,刘小雄.基于MDD不动点迭代的控制分配方法[J].控制与决策,2013,06:945-949.
[18]齐军.5α还原酶抑制剂对前列腺癌诊断标记PSA的影响[D].内蒙古大学,生物工程,2014,硕士.
[19]张丽娜.学习卡片在小学历史知识教学中的设计与使用研究[D].东北师范大学,教育,2012,硕士.
[20]文玉琼.红塔集团人力资源管理系统的研究与应用[D].重庆大学,管理科学与工程,2003,硕士.
[21]王义华.氧化低密度脂蛋白对人脐静脉内皮细胞肾素前体表达的影响[D].大连医科大学,内科学,2012,硕士.
[22]马延玉.绍英赴日考察日记(四)[J].紫禁城.1991(01)
[23]陈生庆.PEARL语言在实时系统中的应用[D].广东工业大学,软件工程,2004,硕士.
[24]高立博.0.35μmSOI工艺PDK开发与应用[D].辽宁大学,微电子学与固体电子学,2012,硕士.
[25]崔潇潇,王贵锦,林行刚.基于Adaboost权值更新以及K-L距离的特征选择算法[J].自动化学报,2009,05:462-468.
[26]薛景,施诚.数据挖掘技术在中医领域中的应用[J].中医药信息,2005,05:6-7.
[27]陈润泽,吴文传,孙宏斌,蓝海波,刘海涛,刘晓敏.双馈风电机组惯量控制对系统小干扰稳定的影响[J].电力系统自动化,2014,23:6-12.
[28]陈武.中国广西人群内皮型一氧化氮合酶(eNOS)基因多态性与原发性高血压继发冠心病的相关性研究[D].广西医科大学,生物化学与分子生物学,2003,硕士.
[29]回振龙.马铃薯连作障碍生理机制及其调控的研究[D].甘肃农业大学,作物生态生理,2013,硕士.
[30]薄敏.第十二届全运会青年女篮进攻技战术应用能力的研究[D].沈阳体育学院,体育教育训练学,2014,硕士.
[31]钟樑.论我国新股发行审核制度的改革与完善[D].华东师范大学,经济法学,2013,硕士.
[32]吴江.民营企业收购上市公司研究[D].首都经济贸易大学,产业经济学,2004,硕士.
[33]寇志洋.吉林石化公司有机合成厂实施清洁生产的模式研究[D].华东理工大学,化学工程,2014,硕士.
[34]肖基毅,邹腊梅,刘丰.频繁项集挖掘算法研究[J].情报杂志,2005,11:4-5+9.
[35]刘川.论上市公司关联交易的法律问题[D].东北财经大学,经济法学,2003,硕士.
[36]薛艳芳.细芒针疗法透刺面部足阳明经改善面部中下部皮肤松垂的临床疗效观察[D].成都中医药大学,中医外科学,2012,硕士.
[37]鲍勇吉.羟基磷灰石冷喷涂流场分析与涂层评价[D].吉林大学,机械制造及其自动化,2013,硕士.
[38]王建智.基于延迟的分而治之混合型良性蠕虫对抗策略[D].西安电子科技大学,计算机系统结构,2011,硕士.
[39]冉伟.基于卤虫卵壳的碳材料的制备及其超级电容器电化学性能的研究[D].燕山大学,化学工艺,2014,硕士.
[40]张润.基于重访周期的对地侦察小卫星星座设计[D].西安电子科技大学,空间信息科学技术,2012,硕士.
[41]胡枫.基于马尔科夫模型的短时交通流预测研究[D].南京邮电大学,模式识别与智能系统,2013,硕士.
[42]王雪.哈尔滨市节水型园林绿地设计研究[D].东北农业大学,园林植物与观赏园艺,2013,硕士.
[43]潘震.材料表面拓扑形貌的细胞响应以及PLGA组织工程多孔支架的制备与软骨组织修复研究[D].复旦大学,高分子化学与物理,2013,博士.
[44]吴倩.应对大规模风机脱网的无功电压紧急控制策略研究[D].华中科技大学,电力系统及其自动化,2013,硕士.
[45]闻守斌.胜利油田单6东超稠油脱硫降粘机理及现场实施方案研究[D].大庆石油学院,油气井工程,2004,硕士.
[46]朱玉坤.防治棉蚜高效低容量施药技术研究[D].山东农业大学,农药学,2013,硕士.
[47]黄少芳.电动汽车充电机(站)谐波问题的研究[D].北京交通大学,2008.
[48]王茸.多元非参数控制图[D].西北大学,概率论与数理统计,2013,硕士.
[49]本报记者周文天 万晶.南江玩转同城两房企石墨烯再吊市场胃口[N].中国证券报,2013-03-05A13.
[50]张志让.逻辑约束自动分析叠前等效偏移中的速度谱[J].石油地球物理勘探,1997,S2:65-72+189.
- 下一篇: 番茄SpMPKs基因响应非生物胁迫的功能分析
- 上一篇: 马克思恩格斯城乡关系思想及其当代价值研究