




已阅读5页,还剩48页未读, 继续免费阅读
(计算机应用技术专业论文)jpeg图像的无参考质量评价方法研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
论文独创性声明 本论文是我个人在导师指导下进行的研究工作及取得的研究 成果。论文中除了特别加以标注和致谢的地方外,不包含其他人 或机构已经发表或撰写过的研究成果。其他同志对本研究的启发 和所做的贡献均已在论文中做了明确的声明并表示了谢意。 储魏澎,吼唧 论文使用授权声明 本人完全了解上海师范大学有关保留、使用学位论文的规定, 即:学校有权保留送交论文的复印件,允许论文被查阅和借阅; 学校可以公布论文的全部或部分内容,可以采用影印、缩印或其 它手段保存论文保密的论文在解密后遵守此规定。 储签名b 魏童铷魄7 一缈 上海师范大学硕士学位论文 摘要 随着图像处理技术的迅速发展,如何正确有效地评价一幅图像的质量好坏 日益变得重要起来。近年来,图像质量评价已经成为了图像信息工程领域内一项 重要的研究课题,引起了人们的高度重视。 在图像质量评价方法中,有代表性的方法主要有两种:客观评价和主观评 价。客观评价方法又可以分成全参考质量评价方法、部分参考质量评价方法和无 参考质量评价方法。目前,人们提出的大多数图像质量评价方法都需要原始图像 作为依据。然而在实际应用中,人们获取的大多数压缩图像都无原始图像可供参 考,因此近些年来无参考的图像质量评价方法越来越受到重视。 本文提出了一种针对于静态的j p e g 压缩图像的基于d c t 的无参考的数字 图像质量评价方法。 众所周知,j p e g 压缩技术利用了离散余弦变换( d c t ) 能够将大量信息集 中于低频系数的特性,对高频系数大量进行量化压缩。也正是d c t 系数的量化 过程造成了j p e g 图像主要的信息丢失。已有大量的研究发现,图像按8 8 像 素块( p i x e lb l o c k ) 进行离散余弦变换后,各d c t 块的固定频率上的d c t 系数 具有拉普拉斯分布( l a p l a c i a nd i s t r i b u t i o n ) 的统计特性。本文正是利用了d c t 系数的这种统计特性,在对该特性进行深入分析研究的基础上,推导出了计算 d c t 系数上的量化误差的方法,并将该方法应用于数字图像的客观质量评价。 文中对于本方法的实现过程及理论依据作了详细的阐述,并给出了大量的实验数 据以验证本方法的有效性和可靠性。 关键字: 图像质量评价、无参考、离散余弦变换( d c t ) 、拉普拉斯分布、峰值 信噪比( p s n r ) 、均方误差( u s e ) 、j p e g j p e g 图像的无参考质量评价方法研究 a b s t r a c t w i t ht h er a p i dd e v e l o p m e n to fd i g i t a li m a g ep r o c e s s i n gt e c h n o l o g y , i tb e c o m e s m o l la n dm o r ei m p o r t a n td a yb yd a yt oa s s e s st h eq u a l i t yo fad i g i t a li m a g e a c c u r a t e l ya n de f f e c t i v e l y r e c e n t l y ,i m a g eq u a l i t ya s s e s s m e n th a sb e c o m ea c o n c e m f u ls u b j e c ti ni m a g ei n f o r m a t i o np r o j e c td o m a i n t h e r ea r et w or e p r e s e n t a t i v em e t h o d sm a i n l yf o ri m a g eq u a l i t ya s s e s s m e n t o n e i st h eo b j e c t i v ea s s e s s m e n tm e t h o d ;t h eo t h e ri st h es u b j e c t i v ea s s e s s m e n tm e t h o d t h ef o r m e ri sc o m p r i s e do ff u l l r e f e r e n c eq u a l i t ya s s e s s m e n tm e t h o d ,h a l f - r e f e r e n c e q u a l i t ya s s e s s m e n tm e t h o da n dn o - r e f e r e n c eq u a l i t ya s s e s s r n e n tm e t h o d s o 陆m o s t i m a g eq u a l i t ya s s e s s m e n tm e t h o d sh a y i n gb e e nb r o u g h tf o n ha r ef u l l r e f e r e n c e o r h a l f - r e f e r e n c eo n e st h a tr e q u i r et h eo r i g i n a li m a g ea sar e f e r e n c e h o w e v e r , i n p r a c t i c e ,f o rm o s to f t h ec o m p r e s s e di m a g e s ,t h eo r i g i n a li m a g e s a r en o ta v a i l a b l ea n d t h a ti sw h yt h en o - r e f e r e n c ei m a g eq u a l i t ya s s e s s m e n tm e t h o di sa t t a c h e dm o r ea n d m o r ei m p o r t a n c et o ad c tb a s e dn o r e f e r e n c ed i g i t a li m a g eq u a l i t ya s s e s s m e n tm e t h o di s p r o p o s e di nt h i sp a p e r , w h i c ht a k e st h es t a t i cj p e gi m a g e sa ss t u d yo b j e c t s i ti sw e l lk n o w nt h a tt h ec h a r a c t e r i s t i ct h a tl a r g ea m o u n to fi n f o r m a t i o ni s c o n c e n t r a t e do nt h el o wf r e q u e n c yi nt h er e s u l to fd i s c r e t ec o s i n et r a n s f o r m c d , w h i c hi su t i l i z e db yj p e gi m a g ec o m p r e s s i o ns c h e m e a n dq u a n t i z a t i o no ft h ed c t c o e f f i c i e n t si n t r o d u c e se r r o ri nt h ei m a g er e p r e s e n t a t i o na n dc a u s e st h em a i nl o s so f s i g n a li n f o r m a t i o ni nt h ew h o l ec o m p r e s s i n gp r o c e s s i ti sg e n e r a l l yb e l i e v e dt h a ta f t e r a l li m a g ei st r a n s f o r m e db l o c kb yb l o c k ( 8x8 、w i t hd i s c r e t ec o s i n et r a n s f o r m , f o r e a c ha cc o e f f i c i e n t s ,t h eh i s t o g r a mo fu n q u a n t i z e dc o e f f i c i e n t sf o raf i x e da c f r e q u e n c yr e s e m b l e sal a p l a e i a nd i s t r i b u t i o n t h i sc h a r a c t e r i s t i co fd c t c o e f f i c i e n t s i su t i l i z e di nt h i sp a p e r b a s e do nm e t i c u l o u sa n dp a i n s t a k i n ga n a l y s i sa n dr e s e n r e ho n t h i sc h a r a c t e r i s t i c ,as c h e m ef o rc a l c u l a t i n gt h eq u a n t i z a t i o ne r r o ro l ld c tc o e f f i c i e n t s i sp r o p o s e dt ob ea p p l i e dt od i g i t a li m a g eq u a l i t ya s s e s s m e n lt h er e a l i z a t i o np r o c e s s a n dt h et h e o r e t i c a lf o u n d a f i o i lo ft h i ss c h e m ea r ee x p l a i n e di nd e t a i la n dl a r g e n u m b e r so fe x p e r i m e n t a lr e s u l td a t aa l ep r o v i d e dt op r o v ei t sv a l i d i t ya n dr e l i a b i l i t yi n t l l i sp a p e r k e yw o r d s :i m a g eq u a l i t ya s s e s s m e n t ;n or e f e r e n c e ;d i s c r e t ec o s i n et r a n s f o r m ; l a p l a c i a nd i s t r i b u t i o n ;p e a ks i g n a ln o i s er a t i c ( p s n r ) ;m e a ns q u a r e de r r o r ( m s e ) 2 j p e g 图像的无参考质量评价方法研究 1 1 引言 第1 章绪论 随着多媒体技术和因特网技术的快速发展,数字图像处理技术与理论已成 为计算机应用的一个重要领域,广泛应用于众多的科学与工程应用,如遥感、医 学、气象、通信等【l 】。而随着图像处理技术的迅速发展,如何正确有效地评价 一幅图像的质量好坏也就日益变得重要起来。比如,在各种图像压缩或者传输系 统中,往往需要根据压缩或者传输之后的图像质量状况来评价该系统的优劣或者 调整相关的参数以达到更好的压缩或者传输效果f 2 】。近年来,图像质量评价已 经成为了图像信息工程领域内一项重要的研究课题,引起了人们的高度重视。 图像质量评价方法包括主观评价方法和客观评价方法,其中客观评价方法 又可以分为三类:全参考质量评价方法、部分参考质量评价方法和无参考质量评 价方法【3 】。全参考质量评价方法需要原始图像的完整信息作为评价的参考:部 分参考质量评价方法需要原始图像的部分特征或者统计信息作为评价参考:无参 考质量评价方法则完全依赖于待评测图像本身的信息来进行质量评价,而无须原 始图像的任何信息。在很多场合,如无线有线传输网络中,往往无法获得发送 端的原始图像信息【2 】,因此研究无参考的客观质量评价方法是很有意义的。图 像质量评价的研究已成为图像信息工程的基础技术之一【4 】。 使用水印技术可以实现对数字图像的无参考质量评价。数字水印是按照一 定的策略往原始数据中另外添加的某些数字信息。选择合适的水印嵌入方式和位 置,使得水印信号和宿主信号对图像操作的灵敏度一致起来,这样就可以用水印 质量的改变来反映宿主信号质量的改变【2 】。不过基于水印技术的无参考质量评 价方法的首要条件是,目标图像必须事先有数字水印被嵌入,这在一般情况下是 不被满足的。因此,研究不使用水印技术的无参考质量评价方法是很有意义的。 在众多数字图像存储格式中,j p e g 图像是目前最为常见的格式之一,其使 用非常广泛。j p e g 标准也是目前最流行且最全面的连续色调静止画面压缩标准 之一【5 】。因此专门针对于j p e g 图像进行质量评价的研究是很有实用价值的 4 上海师范大学硕士学位论文 1 2 图像质量评价 图像质量的含义主要包括两个方面:图像的逼真度和图像的可懂度。多少 年来,人们希望能够找出图像逼真度和可懂度的定量测量方法,作为评价图像和 设计图像系统的依据,但目前人们对人类视觉特性仍没有充分理解,特别是对人 眼视觉的心理特性还难以找出定量的描述方法,因此图像质量评价还有待深入研 究【4 】。 图像质量评价方法可分为:客观评价方法、主观评价方法和基于人眼的视 觉特性( h v s ) 的评价方法。 1 2 1 客观质量评价方法 图像质量的客观评价方法是使用一个或者多个图像的度量指标来反映图像 的质量状况【2 】。客观评价一般使用重构图像偏离原始图像的误差来衡量重构图 像的质量【4 】。常用的衡量方法主要有均方误差( m s e ) 和峰值信噪比( p s n r ) 。均 方误差的表达式为: ( 石一) 2 m s e = 型等卜 ( 1 1 ) 式中,石表示原始图像,表示重构图像,m ,n 分别表示图像x 方向和 y 方向图像像素点的个数。均方误差从总体上反映了原始图像和重构图像的差 别。峰值信噪比的表达式为: r 2 p s n r = 1 0 1 。g l 。蠢 ( 1 2 ) 式中的l 为图像中灰度取值的范围,对8 比特的灰度图像而言l = 2 5 5 。 一般而言,图像的峰值信噪比越大,其质量也就越高。峰值信噪比很好地 反映了整个图像的失真程度,而且其计算方法( 公式1 2 ) 直观、严格、易于工 程化的应用。 对于具体的客观质量评价方法也可能采取其它不同的质量衡量方法,比如 文献【2 】【6 】都采用了不同的质量衡量方法。但一般而言这些方法与m s e 和p s n r 都有一定的相关性。 j p e g 图像的无参考质量评价方法研究 客观质量评价的缺点是不能反映局部像点有较大灰度差别以及较多像点反 而只有较小灰度差别等各种情况。它对图像中所有像点同等对待,不能反映人眼 的视觉特性【4 】。 客观评价方法可以分为三类:全参考质量评价方法、部分参考质量评价方 法和无参考质量评价方法【3 】。全参考质量评价方法需要原始图像的完整信息作 为评价的参考;部分参考质量评价方法需要原始图像的部分特征或者统计信息作 为评价参考;无参考质量评价方法则完全依赖于待评测图像本身的信息来进行质 量评价,而无须原始图像的任何信息。 无参考图像质量评价方法又可以分为基于水印的和非基于水印的两类。基 于水印的质量评价方法要求其评价的目标图像事先有数字水印被嵌入。非基于水 印的无参考的图像质量评价方法则无此要求。 1 2 1 1 基于水印的无参考客观质量评价方法 数字水印是按照一定的策略往原始数据中添加的某些数字信息。数字水印 技术最初的应用是对数字产品进行版权保护和防止对信息的篡改。近年来在图像 质量评价领域,数字水印技术也有相当的应用。 文献【2 1 中提出了一种基于半脆弱性数字水印算法的无参考图像质量评价方 法( w i q m ) 。它首先按照一定的策略将水印嵌入到图像分块d c t 变换的中频系数 上,嵌入的具体位置和嵌入强度的选择主要依据两个标准:图像的感官质量不受 到影响;水印的质量变化能够有效的反映图像质量的变化。然后通过评估提取出 来的水印的质量状况来评估图像的质量状况。该方法的原理如图1 1 所示: 图1 - 1 v i q m 原理图 如前所述,基于水印技术的质量评价方法的首要条件是,目标图像必须事 先有数字水印被嵌入,这在一般情况下是不被满足的,这也是该方法的主要缺点 6 上海师范大学硕士学位论文 之一。 1 2 1 2 非基于水印的无参考客观质量评价方法 文献【6 】中提出了一种非基于水印的无参考图像客观质量评价方法,该方法 用三阶平均细节累积量作为衡量图像质量的指标,无需原始图像作参考。该方法 从细节信号和高阶累积量的角度进行解压缩图像质量的客观评价,其中利用了文 献【7 】中的结论,即由于高阶累积量对高斯噪声不敏感,因此可以避免高斯噪声 对系统辨识的影响。这种基于高阶统计量的评价方法的特点是,比较强调细节信 号噪声对图像质量的影响,并直接在空间域对图像数据进行公式化的高阶统计量 计算。 本文所提出的针对于j p e g 图像的无参考客观质量评价方法也是非基于水 印的。本文的方法主要利用了频域上d c t 系数的统计特性,对j p e g 压缩过程 中产生的量化误差进行估计,从而做出图像的质量评价,具体实现将在后文介绍。 1 2 2 主观质量评价方法 图像质量的主观评价方法是让观察者根据一些事先规定的评价尺度或自己 的经验,对测试图像按视觉效果进行质量判断,并给出质量分数,然后对所有观 察者给出的分数进行加权平均,加权平均后所得的结果( m e a no p i n i o ns c o r e ) 即为图像的主观质量评价。 主观评价主要有两种度量尺度,即绝对尺度和相对尺度【8 】,如表l 一1 所示。 表1 1 主观质量测量评分 级别绝对测量尺度相对测量尺度 l 一很好一群中最好的 2 较好好于该群中平均水平的 3一般该群中平均水平 4 较差差于该群中平均水平的 5 很差该群中最差的 主观质量评价方法虽然较好地反映出了图像质量,但无法应用数学模型对 7 j p e g 图像的无参考质量评价方法研究 其进行描述,而且比较容易受其他因素的限制和影响,不适合工程化的应用场合 【2 】。在实际应用中,图像的主观质量评价方法受到了严重限制,甚至根本不适 合某些应用场合,如实时图像传输等领域【4 】。 1 2 3 基于人眼的视觉特性( h v s ) 的评价方法 随着多媒体数据压缩技术的发展,图像质量评价方法的研究进入了一个新 阶段,即从以往物理意义上简单的误差统计方法转为结合人眼视觉特性( h v s : h u m a nv i s u a ls y s t e m ) 的误差统计方法。大量的研究表明:基于h v s 的测量方法 优于没有考虑h v s 的测量方法【9 】。从图像质量评价的研究进展来看,目前新 的测量方法主要分为两类:基于视觉感知的测量方法和基于视觉兴趣的测量方法 【4 】。 1 - 2 3 1 基于视觉感知的图像质量评价方法 图像降质对人眼视觉的影响是由人眼视觉系统的灵敏度决定的,而视觉灵 敏度是由人眼的视觉细胞决定的 1 0 】。此外,人眼视觉系统的灵敏度还受到图 像局部空间频率的影响,大量实验结果证明:影响像素误差可视度的因素是误差 周围的局部区域环境,而不是整个图像的背景环境【4 】【l l 】。为此人们建立了各 种h v s 模型用以评价图像的质量,其中最典型的h v s 模型如图1 2 所示,它 模拟了视觉感知的三个显著特性,即视觉非线性特性( w e b e r 定律) 、视觉敏 感度带通和视觉多通道及掩盖效应【4 】。 i - i y s 模型 豁h 浆5h 黼h 黼差h 燃 圈1 - 2 典型的h v s 模型 目前的感知测量方法实际上只是较多地考虑了人眼视觉的生理特性,而对 人眼视觉的心理特性却研究得较少【4 】。 1 2 3 2 基于视觉兴趣的图像质量评价方法 人们在观察和理解图像时往往会不自觉地对其中某些区域产生兴趣,这些 8 上海师范大学硕士学位论文 区域被称为“感兴趣 x ( r o i :r e g i o no f i n t e r e s t ) ”。整幅图像的视觉质量往往取决 于r o i 的质量。人眼观察一幅图像时,只会对其中显著变化的区域发生兴趣仔 细观看,而对那些亮度均匀的平滑区域或空间频率相近的纹理区则会忽略掉 【1 2 】。现实生活中人们由于文化背景、周围环境以及情绪的影响,对同一幅图像 的评价会产生较大偏差,但是对于图像中关注的区域却具有共性,它们集中传递 了整幅图像所要表达的大部分客观信息【4 】。 文献4 中介绍了一种基于视觉兴趣的评价方法i 设测试图像中只有一个感 兴趣区a l ,其面积为s l ,不感兴趣区a 2 的面积为s 2 ,图像的总面积为s = s l + s 2 。测量公式为: 脚= ( ;石) 2 + 五( ;巧) 2 】( 1 3 ) ” ( ,) e 4 ( f ,j ) e a 2 其中, 、五分别为a 1 和a 2 的加权值,并满足 s + 如s := s ,加权值 越大,表示人眼对该区的兴趣程度越大。 、五的构造( 如图1 3 ) 如下: 如= 1 - 荨属i 两了 ( 1 4 ) :要( 1 一五) + 五( 1 5 ) 其中,后【0 , 1 】为调整因子,它反映了人眼对不感兴趣区或感兴趣区的重视 程度。由上面的式子可以看出,当s l = 0 ,五= 1 或s 2 = 0 9 = l 时,i m s e 退化为 m s e 【4 】。 捌 囊1 弋 捷域丽烈 图卜3 兴趣权值 9 j p e g 图像的无参考质量评价方法研究 基于视觉兴趣的测量方法为图像质量评价开辟了一条新路,但目前该类方 法还只是处于初期研究阶段,仍有许多问题有待深入研究。例如,图像中感兴趣 区如何确定? 如果测试图像中包含多个感兴趣区,如何确定这些感兴趣区域的权 值? 等等【4 】。 1 3j p e g 图像压缩原理 j p e g 标准是目前使用最为普遍的连续色调静止图像压缩标准之一。这种标 准定义了三种不同的编码系统:一种是有损基准编码系统,这个系统是以d c t 为基础的并且足够应付大多数压缩方面的应用;另一种是扩展的编码系统。这种 系统面向的是更大规模的压缩,更高的精确性或逐渐递增的重构应用系统;还有 一种面向可逆压缩的无损独立编码系统i t 3 。 本文的研究对象即基于有损基准编码系统的j p e g 图像。 j p e g 文件的压缩流程如图1 - 4 所示【1 4 】。 图像样本 水平偏移卜叫8 8d c t 卜刊均值量化 c 量化囊引 d c 量化素 z i g - z a g 扫描 量化表 d ch u f f m a n 舞- - - - - i cl i i j f f m n 袭1 世 图1 - 4 基本j p e g 算法生成压缩文件流程图 2 p e g 文件 在进行j p e g 压缩时,图像以8 x 8 像素块为单位分别进行离散余弦变换 ( d c t ) 。8 8 像素块经过d c t 变换后,左上角的低频分量包含了图像的大部 分重要信息,而右下角高频分量则包含了少量的细节信息。在编码时,使用量化 的方式大量压缩高频部分细节信息。d c t 系数( 矩阵d ) 被量化矩阵q 以公式 ( 1 6 ) 所示方式进行量化: i o 上海师范大学硕士学位论文 研n d 阱小队刀 回 对d c t 系数量化之后,由于两个相邻的8 x8 子块的直流系数d 品相差很小, 所以量化过的参数群中的直流系数d 盘采用差分编码d p c m ,而对8 8 像素块 的6 3 个交流系数采用以z i g z a g 顺序( 图卜5 ) 进行扫描的游程编码分别进行压缩。 为了进一步提高压缩t t ,还要对直流和交流分量的码子进行熵编码。对于直流和 交流分量码子采用不同的h u f f r m n 编码器进行压缩。最后,压缩流再加上一个文 件头形成了最终的f f p e g 文件 1 4 。 图卜5z i g z a g 顺序表示图 j p e g 解压是压缩的逆过程。对于每一个像素块b ,将从j p e g 文件中得到 的量化过的参数d 9 乘以存储在量化表q 中的量化参数【1 4 】: 掰= g 彤,f , o ,7 ) ( 1 7 ) 根据上式得到掰后,对d ;进行逆d c t ( i d c t ) 运算,再将i d c t 的结 果做四舍五入取整运算,最后将该整数值截取到区间【o ,2 5 5 1 庆j ,即得到解压后的 重构图像。 j p e g 图像的无参考质量评价方法研究 1 4 论文的创新点 本文针对于j p e g 静止图像提出了一种无水印嵌入的无参考的数字图像质 量评价方法,即基于d c t 的无参考的图像质量评价方法。这种方法充分利用了 d c t 系数的统计特征,根据d c t 系数分布近似符合拉普拉斯分布的特性,在从 压缩图像中读出了量化矩阵和d c t 系数值之后,首先利用读出的这些数据采用 最大似然估计法或矩估计法计算出d c t 对应的拉普拉斯分布的分布参数。由此 即可得到d c t 的完整分布特性。然后利用该分布特性推导出压缩图像在各个 d c t 频率上的均方量化误差的计算公式并计算出这些量化误差。最后通过前面 得到的各d c t 频率上的均方量化误差计算出图像整体的p s n r ,从而对图像做 出客观质量评价。 本文较为详细地阐述了本方法的理论基础以及实现步骤,重要的理论依据 可以从参考文献中查阅到。在进行了一系列的实验后,本文通过大量的实验数据 验证了本方法的有效性和可靠性。 1 5 论文的内容安排 第1 章为绪论。讨论了项目背景意义、国内外研究现状和本文的主要研究 目标及创新点。 第2 章为d c t 系数的统计特性。研究图像进行d c t 变换后的d c t 系数的 统计特性,主要阐述了压缩图像中d c t 系数与拉普拉斯( l a p l a c i a n ) 分布的相 似性以及如何通过量化后的d c t 系数估计出各频率上的d c t 系数对应的拉普拉 斯分布的分布参数。 第3 章为图像的峰值信噪比( p s n r ) 估计。主要推导出了两个分别用于计 算交流系数( a c ) 和直流系数( d c ) 上的均方误差( m s e ) 的公式,这两个公 式都利用了第2 章所阐述的d c t 系数的拉普拉斯分布理论及其参数估计结果, 并最后使用这两个公式的结果计算出图像的峰值信噪比,从而达到对图像进行无 参考的客观质量评价的目的。 第4 章为对本文所阐述的图像评价方法的实验结果的分析。该章节摘录了 大量的实验数据并对这种数据进行了图形化表示,从而直观地验证本方法的有效 性和可靠性。 上海师范大学硕士学位论文 第5 章为对本文所阐述的图像评价方法在彩色图像质量评价上的拓展应用。 主要阐述了如何在彩色图像质量评价领域应用本文所阐述的方法,同时给出了有 力的实验数据验证了本方法在彩色图像评价上的适用性和有效性。 第6 章为本文的总结。 最后是参考文献。 1 3 j p e g 图像的无参考质量评价方法研究 第2 章d c t 系数的统计特性 本章介绍j p e g 压缩图像中d c t 系数统计特性。主要研究并阐述压缩图像 中d c t 系数与拉普拉斯( l a p l a c i a n ) 分布的相似性以及如何通过量化后的d c t 系数估计出各频率上的d c t 系数对应的拉普拉斯分布的分布参数。 2 1 离散余弦变换( d c t ) 普通图像的相邻的像素点包含了相似的信息,一般存在空间上的冗余, 因 此d c t ( d i s c r e t e c o s i n e t r a n s f o r m ) 的设计利用了图像空间上的冗余信息。另外, d c t 的设计使得图像的空间域表示和频域表示相互结合起来,因为在d c t 系数 提供关于图像的8 x 8 子块的频率信息的同时,d c t 表示内的每个8 x 8 子块的 位置提供了关于解码图像中相应的像素点的位置的空间信息【1 5 】【16 】。对于一个 n x n 的子块【b j , k 】:;: :l ,其d c t 系数【,。,。】:,。:1 定义如下: 一1 一1 1 m = b ,i c ,m c k ,以,m 舻j( 2 1 ) j = ok = o 其中, 吨c o s ( 罱阿圳) ,且口。:c j ,一硝m 8 l 丽【2 _ ,+ 1 1j ,且口。= ( 2 2 ) 逆离散余弦变换0 d c t ) 定义如下: 一l 一l b _ ,k = ,_ ,露c ,埘c k ,疗,工豇= ,- j ( 2 3 ) 埘= 0n = 0 任何一个8 x 8 像素块b 都可以解释为基图像的线性组合,而这个线性组合 的6 4 个权值就可以看成是b 的d c t 系数【1 7 】。图2 1 列出了二维d c t 的6 4 个 基图像。d c t 系数中左上角( 1 ,1 ) 位置的系数为直流系数( d c ) ,d c 系数 包含了低频信息,它是整个像素块的均值,一般来说它支配了整个像素块的内容; 1 4 m 所 再厅 上海师范大学硕士学位论文 d c t 系数中其余的6 3 项为交流系数( a c ) ,a c 系数包含了高频信息,它代表 了图像的细节。 2 2 量化矩阵 图2 - 1 二维d c t 的6 4 个基图像 ,d c t 编码过程是无损的,因此其数据表示仍然是可逆的。多数数据压缩( 引 起数据的损失) 是通过随后的量化过程达到的,量化过程由n n 的量化矩阵规 定( 对每个颜色通道) ,并且量化使用的像素块大小和d c t 的一样。对于每个 n x n 像素块,使用n x n 的量化矩阵相应项来除d c t 系数,然后进行四舍五 入取整。解量化的过程则相反,用n n 的量化矩阵的相应项去乘量化后的d c t 系数f 1 6 】。 j p e g 图像的无参考质量评价方法研究 量化矩阵的设计利用t 人眼视觉系统的差异敏感功能( c o n t r a s ts e n s i t i v i t y f u n c t i o n ) ,利用人眼对高频较不敏感的特性来去除觉察不到的数据。使用最为 普遍的一类量化矩阵是由i j g ( i n d e p e n d e n tj p e gg r o u p ) 定义的。该类量化矩阵 对每一个通道分别使用一个量化矩阵q 鹏和一个标量权值来确定,并定义为一 个带有一个整型参数的函数q : o ,1 0 0 一m 肌,公式如下: 线,q ) = 阳“耐( 裂) 簖 , 亿。, 其中q 肼是i j g 的标准量化矩阵( 如图2 2 所示) ,s g ) 则是一个分段 函数,分别由一段双曲线和一段渐减的直线组成,其定义如下: 删:j 【半卜o 仁, p 。2 乱5 0 邪1 0 虬 s ( g ) 的图形如图2 3 所示,其双曲线段和直线段的接合点在q = 5 0 处 1 6 】。 其中的q 称为质量因子。 1 61 li o 1 21 21 4 1 41 31 6 1 4 1 72 2 1 82 23 7 2 43 55 5 4 96 47 8 7 2 9 2 9 5 1 62 44 05 16 1 1 92 65 86 05 5 2 4 4 0 5 7 6 95 6 2 95 l8 78 06 2 5 6 6 81 0 91 0 37 7 6 48 l1 0 41 1 39 2 8 71 0 31 2 11 2 01 0 l 9 81 1 21 0 01 0 39 9 1 71 8 1 82 1 2 4 2 6 4 76 6 9 9 9 9 9 99 9 9 99 9 9 9 9 9 2 4 4 7 9 9 2 6 6 69 9 5 69 99 9 9 9 9 9 9 9 9 9 9 99 9 9 9 9 9 9 9 9 99 99 9 9 9 9 9 9 9 9 9 9 99 9 9 9 9 99 9 9 99 99 9 9 99 99 9 9 99 9 9 9 9 99 9 9 9 9 99 99 9 9 9 9 9 9 9 ( a ) 亮度通道 ( b ) 彩色通道 图2 - 2i j g 标准量化矩阵 上海师范大学硕士学位论文 图2 - 3 缩放因子函数s ( q ) 的图形表示 2 3 d c t 系数的统计特征 如第一章所述,在j p e g 压缩时,图像以相邻的8 8 像素的像素块为单位 进行离散余弦变换( d c t ) 形成8 x 8 的d c t 系数矩阵。8 x 8 的d c t 系数中 左上角( 1 ,1 ) 位置的系数为直流系数( d c ) ,其余的6 3 个位置的系数为交流 系数( a c ) 。d c 系数包含了低频信息,它是整个像素块的均值;a c 系数包含 了高频信息,它代表了图像的细节。由于d c 系数和a c 系数包含的信息不同, 以及量化时的量化尺度不同,因此它们具有不同的统计特征。 2 3 1 交流系数( a c ) 的统计特征 一般认为,一幅图像按8 8 像素块进行d c t 交换后,所有8 8 的d c t 系数块的相应位置的a c 系数( 每个像素块6 3 个a c 系数构成6 3 个a c 频率) 均近似符合拉普拉斯分布( l a p l a c i a nd i s t r i b u t i o n ) 【1 8 1 9 2 0 2 1 2 2 】。以2 为 参数,均值为0 的拉普拉斯分布的概率密度函数( p d p r o b a b i l i t yd e n s i t yf u n c t i o n ) 厂( x ) 为: 厂( z ) :委e 一2 纠 ( 2 6 ) 相应的概率分布函数为: 1 7 j p e g 图像的无参考质量评价方法研究 f ( x ) = o 矽= = 1e m ,j o ; ( 2 7 ) 1 一一1p h x 0 2 设x 为概率密度函数为o ) 连续随机变量,则其方差为d ( x ) = 2 五2 【1 5 2 0 2 1 。图2 - 4 所示是参数五为不同值时的拉普拉斯分布示意图,从图中可 见拉普拉斯分布曲线的一个特性,即参数兄值的变大,曲线越陡峭,变量的分布 越向0 点集中。 ; 。ll ; ( b ) 五一0 0 0 5 ( c ) 五= o 1( d ) a - 0 5 图2 - 4 拉普拉撕分布图 为便于直观地了解d c t 系数的分布规律,现以5 1 2 x 5 1 2 的l e n a 图像为例。 1 8 上海师范大学硕士学位论文 ( a ) 原始图像( b ) 压缩图像 图2 - 5l e n a 图像( 5 1 2x5 1 2 ) 图2 5 中左边一幅是未经压缩的l e n a 原始图像,对其进行d c t 变换后,取 坐标( 2 ,1 ) 位置( 注:本文所述的d c t 系数坐标均对应为m a t l a b 中的矩阵下标) 的d c t 系数,画出其频数直方图如图2 - 6 所示,比较图2 - 6 和图2 _ 4 直观可见 d c t 系数的分布与拉普拉斯分布极其相似。 图2 - 6l e n a 原始图像经d c t 交换后的a c 系数频数直方图 现在来考察量化后的d c t 系数。图2 5 中右边一幅是l e n a 图像以质量因子 7 5 进行j p e g 压缩后的图像,从该压缩后的图像文件中读取出来的d c t 系数在 坐标( 2 ,1 ) 位置的频数直方图如图2 7 所示,从图中可以看出量化后的d c t 系数 虽然仍较好地保持了拉普拉斯的分布特性,但是其分布曲线却没有原始d c t 系 数平滑,因此在应用的时候应当尽可能基于原始d c t 系数的分布特性而不是量 化后的d c t 系数的分布特性进行分析。 1 9 j p e g 图像的无参考质量评价方法研究 要利用原始的d c t 系数的分布特性,就需要估计出其拉普拉斯分布的参数 五,而且由于要进行的是无参考的图像质量评价,在此情况下应当假设原始的 d c t 系数无法得到,那么就应当从量化后的d c t 系数( 可获取到的样本) 估计 出原始d c t 系数的分布参数。 对于一个固定的颜色分量上的固定a c 频率,设g + = 1 , 2 ,3 ,) 为量 化矩阵中相应的元素,仇为量化前的d c t 系数值,向为量化后j p e g 文件中编 码的d c t 系数值,则 岛= r o u n d ( r i q ) ( 2 8 ) 乃= q k i ( 2 9 ) 以上各式中,r o u n d 表示四舍五入取整运算,i = 1 ,2 ,3 ,) ( j 为j p e g 图像的8x 8 像素块数) ,j ,f 为去量化( d e q u a n t i z e dd c tc o e f f i c i e n t ) 后的d c t 系数值对于前面定义的随机变量x ,儿可以看作是取自离散随机变量 y = g r o u n d ( x q ) 的随机样本。 据文献 1 5 】,设p 为与离散随机变量y 关联的概率密度函数,则 1 - e - l q 2 ,胛:o ; 砒卜p 洲一整数 亿姗 上海师范大学硕士学位论文 并且离散随机变量y 的方差为d ( y ) = b 2c 。s h ( 幻2 彬( 2 s i n h 2 ( 幻2 ”,数学 期望为e i l ,) = 0 。 由于拉普拉斯分布依赖于参数五,因此必须通过采集到的给定频率上的a c 系数饥) 来估计出参数z 。文献【1 5 】中采用了一种最大似然估计的方法,其结论 如下:设口= 阿:y j = o t ,= j a 且p = 2 z j b l ( 其中,| i 表示一个有穷 集合中元素的个数) ,则 :詈- n - a + 4 a - 4 a f l - 4 f 1 2 + 4 p 2 + 4 a p 1 是参数五的最大似然估计( 如果口= 0 ,即给定a c 频率上的所有d c t 系 数均为0 ,则= 佃) 。应当注意的是,上面的七,是量化后j p e g 文件中编 码的d c t 系数值,而不是去量化后的d c t 系数值。文献1 1 5 中给出了公式( 2 1 1 ) 的详细证明,其证明过程中利用了公式( 2 1 0 ) 的结果,详细证明请参见该文献。 笔者从标准测试图像库中选取了1 0 幅测试图片( 见图2 - 8 ) ,对每幅图像 均采用0 到1 0 0 之间不同质量因子进行压缩,然后利用上文的最大似然估计法分 别计算压缩图像中的d c t 系数的拉普拉斯分布参数a 的估计值,测试后的统计 结果如表2 1 所示。 从表2 1 可以看出,不计a c 系数全0 的情况时,参数a 的值在o 0 0 5 0 至 2 5 0 0 0 之间,实际上绝大多数j p e g 压缩图像的五一般也在此范围之内。另外, 量化后的a c 系数全0 的情况出现频率极高,平均可达3 3 9 0 4 9 个,即达半数以 上,约占6 3 个a c 频率的5 3 8 2 ;在质量因子- 7 5 时,平均可达4 1 1 8 7 5 个, 约占6 5 3 8 。因此采用最大似然估计法,2 m z = 4 - o o 的情况是常见的,这就要求 在实际应用的时候,必须充分考虑= + m 的情况并采取适当的处理方法。 2 1 j p e g 图像的无参考质量评价方法研究 ( a ) b a b o o n ( b ) b r i d g e( c ) c o u p l e ( e ) l a k e ( g ) s ii k d r o p( h ) p e p p e r s ( j ) w o m a n 图2 - 8 十幅选自标准测试图像库的测试图片 上海师范大学硕士学位论文 表2 - 1 最大似然估计法得出的参数五的测试统计结果 a 平均值旯最大值6 3 个a c 中值全为0 的平均 图像五最小值( 不计全0 ( 不计全0个数( 口为质量因子) 的a c )的a c ) 口【0 ,7 5 】口【o ,1 0 0 】 b a b o o no 0 1 1 7 ,o 0 9 3 42 3 2 8 91 4 3 1 2 51 0 9 0 4 8 b r i d g e 0 0 0 5 90 0 9 4 91 3 8 6 61 8 3 7 5 01 4 0 0 0 0 c o u p l e 0 0 0 7 9 o 1 3 9 2 1 7 6 7 0 2 3 6 8 7 51 8 1 4 2 9 l e n a0 0 1 0 70 2 0 3 52 3 1 6 73 1 2 5 0 02 4 1 9 0 5 l a k e0 0 0 5 8o 1 2 6 81 3 6 4 32 7 3 1 2 52 0 8 5 7 1 m 孔0 0 0 8 10 1 4 3 61 8 0 0 62 2 0 6 2 51 6 8 0 9 5 m i l k d r o p 0 0 0 9 40 2 2 8 93 2 7 43 5 5 0 0 0 2 8 7 1 4 3 p e p p e r s 0 0 0 7 00 1 6 5 21 6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 放心餐饮工程建设方案(3篇)
- 2025年度医护人员针对性普法知识考试题库及答案(共九套)
- 牧场安全生产培训会简报课件
- 聊城教资面试题库及答案
- 安全教育培训销售课件
- 矿山行业面试题库及答案
- 科学防疫面试题库及答案
- 农业产业园项目2025年市场推广策略与可行性评估报告
- 2025年罕见病药物研发激励政策与医药产业政策创新的探索报告
- 2025年农业产业集群农业产业园区产业园区农业信息化与智能化发展机制研究报告
- 草木染色的工艺及步骤
- 网络传播概论(彭兰第5版) 课件全套 第1-8章 网络媒介的演变-网络传播中的“数字鸿沟”
- 蚂蚁搬家游戏活动方案设计
- 配电终端功能构造
- 融资风险评估报告
- 画法几何及土木工程制图课件
- 第2课 树立科学的世界观《哲学与人生》(高教版2023基础模块)
- 2023免拆底模钢筋桁架楼承板图集
- 云计算技术基础应用教程(HCIA-Cloud)PPT完整全套教学课件
- 成人学士学位英语1000个高频必考词汇汇总
- 全屋定制家居橱柜衣柜整装安装服务规范
评论
0/150
提交评论