已阅读5页,还剩46页未读, 继续免费阅读
(通信与信息系统专业论文)基于传感器模式噪声的手机照片来源取证研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 在这个信息技术迅猛发展的时代,数码照片成为了信息传递的重要载体,它 不仅能让我们了解到国内外最新的信息动向,也成为了司法等领域的有效证据, 但是,人们同样担忧一些共享照片的真实性,在图像篡改越来越严重的情况下, 图像的原始性成为了人们更感兴趣的焦点。图像来源取证便是对图像的成像设备 来源进行探讨研究,它是数字图像取证的一个分支,也是目前研究的热点方向。 本文研究的主要内容是采用有效的方法对不同的手机照片进行来源鉴别。以 典型的相机成像模型为出发点,分析模型中各个模块的特性,从中提取取证特征。 论文在分析了现有的几种图像来源取证算法的基础上,提出了两种新的算法,具 体的研究成果如下: ( 1 ) 改进了典型的图像特征分类算法。由于传统图像特征中的颜色特征对 图像内容的依赖性很强,因而本文中将去除该特征,并对图像质量特征和小波域 特征进行了改进,为了减小计算复杂度,本文采用s f f s 算法进行特征选择,去 除对分类贡献不大的冗余特征。通过对两种算法的实验结果分析,本文算法改善 了典型算法的缺陷,分类精度得到提高。 ( 2 ) 提出采用三个颜色通道进行相关性检测的算法。该算法首先将图片分 解成红、蓝、绿三个颜色通道,对每个颜色通道进行去噪和去c f a 插值噪声处 理,获取三个检测噪声,再采用典型相关分析法进行鉴别。相比较传统的采用单 色通道的相关性检测算法,该算法充分利用了传感器是产生噪声主要来源的特征 和典型相关分析法能最大化相关性的特性,从而使原始照片匹配真实相机的概率 增大,实验结果和分析表明,该算法具有较好的鉴别效果。 关键词:图像来源取证;模式噪声;特征提取;支持向量机;相关性检测 a bs t r a c t i nt h i se r ao f r a p i dd e v e l o p m e n ti n t h ei n f o r m a t i o n t e c h n o l o g y , d i g i t a l p h o t o g r a p hb e c o m e sa ni m p o r t a n tc a r r i e rf o ri n f o r m a t i o nt r a n s m i s s i o n ,w h i c hn o t o n l yl e tu su n d e r s t a n dt h et r e n do ft h el a t e s ti n f o r m a t i o n ,b u ta l s ob e c o m e st h ev a l i d e v i d e n c ei nj u d i c i a la n do t h e ra r e a s h o w e v e r , i nt h ec a s et h a ti m a g et a m p e ri s b e c o m i n gs e r i o u s ,p e o p l ed o u b tt h ea u t h e n t i c i t yo fs o m es h a r i n gp h o t o g r a p h s ,a n d s t a r tt of o c u so r i g i no ft h ei m a g e a sab r a n c ho fi m a g ef o r e n s i c s ,t h es o u r c 宅 i d e n t i f i c a t i o ni st oe x p l o r et h eo r i g i no ft h ei m a g i n gd e v i c ef o rac e r t a i ni m a g e ,a n d b e c o m e sah o tr e s e a r c hd i r e c t i o n i nt h ep a p e r , e f f e c t i v em e t h o d sa r ce m p l o y e dt o i d e n t i f yp h o t o sc a p t u r e db y d i f f e r e n tc e l l - p h o n e s b e g a nw i t hat y p i c a lc a m e r ai m a g 啦m o d e l ,w ea n a l y s et h e c h a r a c t e r i s t i co fe a c hm o d u l ef r o mw h i c hf o r e n s i c sf e a t u r e sa r ee x t r a c t e d b a s e do n a n a l y z i n gt h ee x i s t i n gs e v e r a la l g o r i t h m so fi m a g es o u r c ef o r e n s i c s ,t w on e w a l g o r i t h m sa 代p r o p o s e d ,a n dt h es p e c i f i cr e s e a r c hc o n t r i b u t i o n sa r el i s t e da sf o l l o w s : ( 1 ) a ni m p r o v e dc l a s s i f i c a t i o na l g o r i t h mb a s e do ni m a g ef e a t u r e si sp r o p o s e d a s t h ec o l o rf e a t u r e so ft r a d i t i o n a li m a g ef e a t u r e sh a v es t r o n gd e p e n d e n c eo nt h ei m a g e c o n t e n t , s ot h e s ef e a t u r e sa r er e m o v e di nt h i sp a p e r , m o r e o v e r , t h ei m a g eq u a l i t y f e a t u r e sa n dw a v e l e td o m a i nf e a t u r e s 锄屯i m p r o v e d i no r d e rt or e d u c et h e c o m p u t a t i o n a lc o m p l e x i t y , s f f sa l g o r i t h ma r ee m p l o y e df o rf e a t u r es e l e c t i o na n di t c a nr e m o v et h er e d u n d a n tf e a t u r e sw h i c hh a v el i t t l ec o n t r i b u t i o nt oc l a s s i f i c a t i o n a n a l y s i sa n de x p e r i m e n t a lr e s u l t ss h o wt h a tt h en e wa l g o r i t h mi m p r o v e st h ed e f e c t s o ft h et y p i c a la l g o r i t h ma n dc l a s s i f i c a t i o na c c u r a c yi sr a i s e d ( 2 ) c o r r e l a t i o nd e t e c t i n ga l # t h r no fu s i n gt h r e ec o l o rc h a n n e l si sp u tf o r w a r d t h ea l g o r i t h mf n s t l yd e c o m p o s e st h ei m a g e si n t or e d ,b l u e ,g r e e nt h r e ec o l o rc h a n n e l s , a n dt h i n ed e t e c t i o nn o i s e sa r ea c q u i r e db yd e n o s i n ga n dd e c f ai n t e r p o l a t i o nn o i s e o p e r a t i o ns u c c e s s i v e l yt oe a c hc o l o rc h a n n e l t h e nt h em e t h o do fc a n o n i c a lc o r r e l a t i o n a n a l y s i si se m p l o y e dt oi d e n t i f yi m a g e s c o m p a r e dt ot r a d i t i o n a lc o r r e l a t i o nd e t e c t i n g a l g r i t h mo fu s i n gas i n g l ec h a n n e l ,t h i sa l g o r i t h mm a k e sf u l lu s eo ft h ec h a r a c t e r i s t i c s t h a ts e n s o ri st h em a i ns o u i v 宅o fn o i s ea n dc a n o n i c a lc o r r e l a t i o na n a l y s i sc a n m a x i m i z et h ec o r r e l a t i o n ,s ot h a tt h ep r o b a b i l i t yo ft h eo r i g i n a lp h o t om a s h i n gr e a l c a m e r ai si n c r e a s e d t h ee x p e r i m e n t a lr e s u l t sa n da n a l y s i ss h o wt h a tt h ea l g o r i t h m h a sg o o di d e n t i f i c a t i o np e r f o r m a n c e k e yw o r d s :s o u r c ei d e n t i f i c a t i o n ;p a t t e r nn o i s e ;f e a t u r ee x t r a c t i o n ;s u p p o r t v e c t o rm a c h i n e ;c o r r e l a f i o nd e t e c t i o n m 第一章绪论 1 1 数字图像取证的研究背景及意义 随着互联网的快速发展及数码相机、手机等数字图像获取设备的广泛使用, 整个社会将越来越数字化,极大的提高了人们的生活乐趣和工作效率。同时,在 信息技术的驱动下,各种功能强大的图像处理软件( 如p h o t o s h o p 、a c d s e e 、 i p h o t o 等) 也应运而生,任何人都可以按照自己的意图对拍摄的图片进行修改处 理。尽管大多数人对图片进行处理仅是出于视觉效果的考虑,但也不乏一些人故 意精心篡改原始图片,达到以假乱真、满足自身利益的目的。一旦这些通过互联 网传播的高品质图片被用于正式媒体、科学发现和法庭证物等重要领域后,社会 的稳定和发展将会受到严重的影响。 近几年来,国际上有关图片伪造而引起相关风波的事件屡见不鲜。2 0 0 6 年8 月,黎巴嫩籍自由摄影师阿德南哈吉向路易社提供了伪造的黎以冲突照片,如 图1 1 所示。将原图片中的浓烟加重以夸大冲突的激烈程度,此举随即引起了网 友的广泛关注,激发了更强的民族矛盾。2 0 0 9 年在伦敦召开的反剽窃会议上, ( p l o sm e d i c i n e ( p l o s 医学) 主编v u g i n i ab a r b o u r 列举了一项2 0 0 8 年至2 0 0 9 年的调查数据。数据显示,在这期间,( p l o sb i o l o g y ) ) ( p l o s 生物学) 和( p l o s m e d i c i n e ) ) ( p i o s 医学) 临时接受发表的论文中的所有图像都有处理过的痕迹。 美国研究诚信办公室( o 砒) 公布的一项关于2 0 0 7 至2 0 0 8 年度研究不端行为案 例的数据中,6 8 与图像伪造有关。o r 主任j o h nd a h l b e r g 表示,图像伪造是 一个日益显著的问题,需要我们进行解决。 在我国,伪造新闻照片的现象也层出不穷。2 0 0 8 年曝光的首届中国国际新 闻摄影大赛( 简称华赛”) 金奖作品l :广场鸽接种禽流感疫苗造假事件,引起了 全国上下一片轰轰烈烈的大讨论和打假之声。2 0 0 9 年,人们日报上又刊登了 一幅被明显处理的草坪鸽。如图1 2 所示。虽然这些事件看似并未对人们的生活 产生重大的影响,但是却反映出一些新闻从业者严重的职业操守问题,在整个行 业中产生了负面作用。 ( a ) 伪造的照片( b ) 真实的照片 图1 1 黎以冲突事件中伪造的照片 图1 2 伪造的鸽子照片 这种状况使得人们对网络图片真实性的质疑越来越多,同时,对图片进行有 效鉴定的呼声也越来越高,这就需要用数字图像取证技术去解决司法调查机构面 临的难题。数字图像取证为司法证据的有效性提供了技术支撑,达到维护社会诚 信体系的目的。 1 2 数字图像取证概述 数字图像取证技术,是指使用统计分析和逻辑推导的方法对数字图像的某些 特征进行识别、提取、收集、分析、验证、确认,以达到鉴别和认证数字图像是 否遭受了篡改操作的目的,并进一步用以确保数字图像内容的原始性、真实性和 完整性的一种技术。 现阶段的数字图像取证可分为两大类:数字图像主动取证技术和数字图像被 动盲取证技术。下面将对其进行分别介绍。 1 2 1 数字图像主动取证技术 数字图像主动取证技术是指预先对数字图像嵌入标识信息,再通过提取标志 信息鉴别图像是否完整和真实的认证技术。主要包括以鲁棒数字水印为代表的防 伪技术,以脆弱水印为代表的防篡改技术,以及数字指纹、数字签名技术等。实 际中数字水印技术应用居多,主要是用来保护数字产品的版权和内容的完整。同 时,数字水印在电子商务的数字安全,网络访问权限控制和媒体附加信息等方面 也有着重要的应用。 水印相当于数字产品的“隐形身份证”,能够与数字图像紧密结合并隐藏其 中,对于数字图像传播过程中可能发生的修改,例如压缩、模数转换具有很好的 抵抗性。但是,现阶段绝大部分的数码相机或手机中都没有内置水印功能,相机 厂商不愿为此付出很多的代价,这种情况可能会持续到未来的很长时间,而且, 即便是添加了水印或者签名的数字图像,由于水印或签名的算法、秘钥共享等安 全性问题,人们也会担心这种附加式信息的安全和有效性。这就使得主动取证技 术受到了很大的限制。而被动盲取证技术不需要预先在图像中嵌入水印这种标识 信息,因而具有更实用的研究价值。 1 2 2 数字图像被动盲取证技术 数字图像被动盲取证技术则是指在对数字图像进行原始性、真实性和完整性 进行鉴别的过程中,取证方无法获得数字图像的原始信息,而只能依赖于待鉴别 的数字图像数据本身。 数字图像被动盲取证是近几年才兴起的新技术,目前还处于研究的初级阶 段,主要解决以下问题: ( 1 ) 图像是如何产生的? 是计算机生成的,还是手机或者相机拍摄的,还 是从其他图像复制粘贴而来? 如果是手机拍摄的,是由哪种类型的手机拍摄的, 时间和地点? ( 2 ) 图像是“原始”图像还是被某种篡改伪造手段篡改过的图像? 如果它是 被篡改伪造的图像,是被哪种手段篡改的? ( 3 ) 图像是否完整? 是否嵌入了不可见的秘密信息? 综合上述问题,数字图像被动盲取证可分为三个研究方向:图像来源取证、 图像篡改检测和图像隐写分析【t 】。 图像来源取证是指在图像来源不明的情况下,单从图像本身来鉴别其生成设 备。为了解决这个问题,可以将图像来源取证分为以下三个层次: ( 1 ) 图像获取设备类型。数字图像的获取途径繁多,常见的设备类型有计 算机、数码相机、手机和扫描仪。对于一幅图像,首先需要鉴别它是由其中哪种 设备拍摄得到的。 ( 2 ) 图像获取设备型号。即鉴别图像是由哪一个厂商哪一种型号的设备所 获取的。 ( 3 ) 图像获取设各个体。即鉴别图像是由哪一台具体的设备所生成的。 图像来源取证的方法主要有两种:第一种是提取图像的颜色、质量、小波系 数统计量和二进制相似性等统计特征,用模式分类器对提取的特征进行训练和预 测来实现图像的分类。第二种是提取出成像设备中的固有指纹,通过比较相关性 来鉴别。前者主要是应用于图像获取设备类型或型号的鉴别,而后者是一种精确 的鉴别技术,由于每台设备的固有指纹都不一样,因而不仅能鉴别设备型号,而 且能够鉴别设备个体。 图像篡改检测是指图像取证者采用相关技术检测出图像被篡改的位置和方 式。目前大多数检测算法只是针对于一种篡改方式或图像格式。常见的篡改方式 有复制粘贴操作( 包括同一幅图像的复制粘贴和不同图像的拼接合成) 、重采样 操作、模糊操作和腰e g 压缩操作。 图像篡改检测方法可分成五类田:( 1 ) 基于像素的检测方法。通过检测像素 的统计异常信息判断图像是否被篡改。例如文献【3 】中通过检测图像有无完全相 同或相似的区域来判断其是否有遭受复制粘贴篡改,文献【4 】提出利用像素的高 阶统计特性进行拼接合成篡改检测,文献【5 提出根据重采样所产生的特殊周期 性进行篡改检测。( 2 ) 基于f p e g 压缩的检测方法。j p e g 图像篡改的主要途径 有双重 p e g 压缩和 p e g 的块效应。虽然原始图像和被篡改的图像都用 p e g 格式保存,但是通过检测方法闯可以知道双重 p e g 压缩下图像是否被篡改。而 p e g 的块效应是否遭受破坏也广泛应用于图像篡改中删。( 3 ) 基于成像设备特 征的检测方法。由于数码相机的镜头、图像传感器会在成像过程中留下固有噪声, 因而可以根据噪声一致性【- o 】判断图像是否被篡改。( 4 ) 基于物理原理的检测方法。 根据图像中场景的光照是否一致【1 1 l 可以鉴别图像的篡改。这种方法主要适用于拼 接合成图像的篡改检测。( 5 ) 基于对象位置关系的检测方法。相机中心在图像平 4 面上的投影点称为主点。主点位于图像中心附近,它会随着图像中景物的平移而 平移。文献【1 2 】通过检验从图像的不同局部所估计出的主点位置是否一致来判断 图像内容是否经过了改动。 图像隐写分析主要是指对数字图像中是否嵌入了隐藏信息、嵌入的位置、嵌 入的内容等问题进行分析检测。隐写分析检测主要分为主动攻击和被动检测。主 动攻击的目标是破坏或篡改传输的隐藏信息;被动检测的目标是检测到隐藏信息 存在。由于图像隐写的被动检测与数字图像的完整性取证联系更为紧密,因而它 是目前隐写分析的研究重点,其研究内容主要集中在对隐藏信息的发现性检测和 估计嵌入隐藏信息的长度两个方面。隐写分析由确定可疑对象、确定隐写机制、 恢复隐写密钥和提取隐藏信息四个部分组成。隐写分析的最终目的是能够使其分 析结果能作为司法取证的呈堂证供,这就要求取证者不仅能发现隐藏信息,而且 能有效确定出隐藏信息的位置并提取出来。但是,这样的技术还不够成熟,在公 开的文章中鲜有发表,此外,没有一种算法能够完成隐写分析的各个部分。因此, 未来的研究方向是进一步解决如何确定完善的隐写算法、密钥等问题,最终实现 隐藏信息的提取。 1 3 数字图像来源取证的研究现状及存在的问题 目前。以数字水印为代表的数字图像主动取证技术研究已趋于成熟,而被 动盲取证技术是近几年才兴起的新的研究方向,尚处于初步研究阶段。本论文的 研究方向是数字图像来源取证技术,其应用前景广阔,因而引起人们的广泛关注。 很多国际知名学府已有相关研究团队在从事数字图像来源取证的研究。 美国d a r t m o u t h 大学以t - i a n yf a r i d 【1 3 】教授为核心的研究团队提出基于小波域 多尺度分析的方法对计算机生成图像和数码照片进行来源鉴别 1 4 j 5 。美国 m a r y l a n d 大学的吴吴教授领导的团队通过估计相机c f a 模式和插值系数实现分 类嗍。美国c o l u m b i a 大学的sfc h a n g 教授等人提出利用相机响应函数反映数码 相机成像过程中不同信号处理方法,对不同相机拍摄的数字图像进行来源认证 r t l , 并从微分几何学的角度,对数码照片和计算机生成的图片进行了分析和分类 1 1 s , 1 9 ,这些图片来自于他们构建的公开图片库嗍。美国p o l y t e c h n i c 大学的k h a r r a z i 等人最早提出利用图像的颜色特征、质量特征和小波域统计特征对不同的相机照 片分类【2 l j ,这是一种典型的相机来源取证方法。美国b i n g h a r n t o n 大学的jf r i d r i c h 教授等人也从早期的数字水印取证投入到图像盲取证的研究中来,最有代表性的 是提出利用数码相机中的模式噪声进行相关性检测来实现来源鉴别【恐甾】。 国内对数字图像来源取证的研究起步较晚,2 0 0 6 年8 月在哈尔滨工业大学 召开的第六届全国信息隐藏暨多媒体信息安全学术研讨会上,首次将数字图像取 证列入了征文主题之一。此后,很多学者积极投身于到数字图像来源取证的研究 工作中,取得了不少的研究成果。在国内的研究机构方面,北京电子技术应用研 究所、北京邮电大学、大连理工大学、同济大学、中山大学、华南理工大学、湖 南大学和长沙理工大学等已有不少相关的论文发表。 目前,虽然数字图像来源取证技术取得了不错的发展,但仍存在以下一些问 题。( 1 ) 算法的适用性不强。由于不同的设备类型、同一设备类型的不同型号都 有自己特有的属性,会出现算法只对某些设备有较好的效果的情况。( 2 ) 算法时 间复杂度大。特别是在图像来源取证时,需要对大量的图片进行处理获取统计特 性,因而做一次完整的实验可能需要几天,使得研究效率较低。( 3 ) 算法的适应 性不够广泛。很多算法都是在基于某种假定的模型下提出来的,当不满足这种假 定的模型时便不能得到预想的效果,因为实际中可能会受到其他因素的影响,因 而需要建立一个较为完善的模型再进行分析。 1 4 本文的研究内容与结构安排 本文研究的主要内容是手机照片的来源取证技术。由于手机与数码相机的成 像有很大的相似性。因此,本文首先从典型的相机成像系统出发,分析成像过程 中对照片特性产生影响的因素,突出成像传感器中的模式噪声在来源取证中的重 要性。于是,在对前期已有的相机来源取证算法进行分析与仿真之后,本文提出 了两种基于模式噪声的手机照片来源取证技术。具体安排如下: 第一章:绪论。简要介绍数字图像取证的研究背景及意义,概述了数字图像 取证的分类、数字图像来源取证的国内外研究现状及存在的问题,并简述本文的 研究内容。 第二章:数码照片来源取证技术综述。从数码相机的角度出发,描述其成像 原理并对成像过程进行建模,然后分析模型中各个模块的特性,从中提取取证特 6 征,最后在此基础上从两大方面详细介绍了现有的数码照片来源取证方法。 第三章:基于图像特征的手机照片来源取证。详细的介绍了t s a i 等人用图 像特征进行分类实现来源取证的算法,通过分析图像特征,对其缺陷进行改进, 提出一种新的基于图像特征的手机照片分类算法,并对这两种算法进行了对比实 验和分析。实验结果显示出新算法的鉴别精度有所提高,证明了其有效性。 第四章:基于模式噪声相关性的手机照片来源取证。分别通过对f r i d r i e h 和 h u 等人用模式噪声进行相关性检测来实现相机照片来源取证的分析,指出其算 法的合理性和存在的问题,在此基础上提出基于典型相关分析的手机照片来源取 证算法,并用对比实验证明了本文算法的优越性。 第五章:总结与展望。总结本文的研究工作,并对图像来源取证方法的未来 发展进行了展望。 7 第二章数码照片来源取证技术综述 2 1 引言 在信息化的今天,数码照片随处可见。在众多的照片来源设备中,数码相机 受到了很多人的青睐,而如今智能手机的出现,更能够满足人们时刻分享生活点 滴的愿望。数码照片来源取证在实际应用中具有很大的价值。本章首先介绍典型 数码相机的成像原理,然后分析模型中各个模块的特性,从中提取取证特征,最 后介绍几种典型的数码照片来源取证方法。 2 2 数码相机成像模型 数码相机是在光学技术、光电传感技术和计算机信息技术的基础发展起来的 一种集光、机、电于一体的高科技产品。它与传统相机的光学原理一样,都是将 景物的光线通过镜头聚焦在平面上形成物像。但是,数码相机采用半导体感光器 件代替了传统相机中的胶卷,这样不仅避免了复杂的暗房工作,而且拍摄出来的 照片能够自由的在网络上传输。 自然 景物 颜色 图像 滤波 传感器 阵列 字 像 图2 1 典型的数码相机成像模型 典型的数码相机成像模型由图2 1 所示。其中,透镜系统由镜头和控制曝光、 聚焦、收集光线并控制光线稳定性的器件构成1 2 6 。需要指出的是,精密的校准自 动增益控制器会改变光圈和快门速度来实现自动曝光以获取好的曝光照片。自动 聚焦是指通过前后移动镜头以获取可能最清晰的照片。而图像的稳定性控制则能 避免因相机摇晃产生模糊照片。组合滤波器包括红外线和抗混淆滤波器,以最大 限度的确保图像的可视质量。红外线滤波器是一种吸收或反射滤波器,仅允许部 分可见光通过,而且,分块的红外辐射能减少成像的锐化。当传感器像素之间的 间隔不能够更好的支撑光线的空间频率时,抗混叠滤波器就发挥了其减少混叠现 象的作用。具体的成像原理如下描述:自然景物的光线通过透镜系统、组合滤波 器聚集到图像传感器上。图像传感器是由若干微小的按照一定规律排列组成的像 3 素阵列,即c c d 或c m o s 。光传感的像素阵列将光线整合在整个光谱上,并转 换成电信号。由于c c d 输出的是模拟信号,则需要使用一个a d 转换器,将模 拟电信号转换成数字信号。而c m o s 采用的是数字化接口,则不需使用a d 转 换器。由于大部分的图像传感器只应用了一个颜色滤波阵列( c f a ) ,即传感器 输出的是单色图像,那么,彩色图像需要通过数字图像处理部分的颜色插值获得。 接着,将插值图像进行白平衡、伽马校正等操作后,再转换成特定的图像格式存 储得到数字照片。 2 3 对数码照片特性产生影响的模块 2 3 1 透镜系统 相机镜头是数码相机中最重要的部件,它的好坏直接影响着照片的质量。由 于制作工艺的缺陷,镜头在成像中会不可避免的产生畸变。这种畸变可以通过优 化镜头制作的用料等方法得到改善。可想而知,对于一些采用廉价镜头的手机来 说,镜头畸变现象尤为严重。镜头畸变有很多,主要体现为径向畸变。典型的径 向畸变有枕形畸变和桶形畸变【2 刀。如图2 2 所示。当图像点偏离目标位置而靠近 光轴位置时就产生了桶形畸变。枕形畸变是因图像点偏离目标位置而远离光轴产 生的。使用广角镜头和长焦镜头时会分别导致桶形畸变和枕形畸变。针对相机镜 头畸变的特性,c h o i t 捌提出将其作为统计特征并通过分类实现相机的来源鉴别。 ( a ) 桶形畸交( b ) 枕形畸变 图2 2 图像几何形状的径向畸变 2 3 2 图像传感器 图像传感器是相机成像过程中的核心模块。数码相机中的图像传感器主要有 c c d 和c m o s 两种类型,而c m o s 因价格低廉在手机中广泛应用。不同类型、 9 不同尺寸的图像传感器对照片的特性会产生不同的影响。实际上,由于制作工艺 等原因,使用同一种传感器生成的照片质量也会有所差异。下面将对传感器进行 具体介绍。 ( 1 ) 传感器的灰尘 传感器的灰尘问题主要出现在单反相机中。由于单反相机的镜头可拆卸,使 得感光器件裸露在空气中,空气中的灰尘就会因静电场的作用被吸附到传感器的 表面,形成了一种独特的灰尘模式嗍,通常这种灰尘模式用肉眼是看不出来的, 虽然通过某些特定的处理虽能使灰尘减少,却不能根除。而普通的数码相机不需 要更换镜头、因此,灰尘模式可以作为一种相机来源取证的方法,不仅可以区分 普通数码相机和单反相机拍摄的照片,还能将照片匹配给某一特定的单反相机。 ( 2 ) 传感器的像素缺陷 像素缺陷是一种可视的像素阵列误差,在廉价的相机中尤为突出,即使照片 被严重压缩处理后,这种误差依然存在。可见,像素缺陷可以作为一种图像来源 取证方法。像素缺陷的种类有很多,不同的制造商生产的传感器中的像素缺陷各 有不同。常见的像素缺陷有点缺陷、熟点缺陷、死像素、像素陷阱和簇缺陷p 哪。 然而,对于一些不存在像素缺陷的高端相机和通过相机处理便能消除的相机来 说,这种方法将失效。因此,像素缺陷在图像来源取证的应用上存在一定的局限 性。 ( 3 ) 传感器的模式噪声 即使传感器所拍摄的是一个光线均匀的景物,所获图像的像素在强度上仍会 呈现出一些微小的变化,这是由散粒噪声和模式噪声引起的嘲。散粒噪声是一种 随机噪声,通过对多幅图像进行平均能有效的削弱这种噪声。而模式噪声是对图 像产生重要影响的因素,当多幅图像所拍色的是同一个场景,这种噪声会近似相 同。模式噪声在相机中是固有存在的,因此,它可以作为图像来源取证的有效方 法。 2 3 3 数字图像处理 ( 1 ) c f a 插值 正如数码相机成像原理所述,出于传感器制作尺寸和成本的考虑,大部分相 1 0 机中只有一个设计在传感器前端的c f a 。当光线透过镜头之后,c f a 使得每一 个像素点只接收一种颜色信息,即传感器输出的是单色图像。实际上,我们生活 中看到的彩色图像,仅1 3 的颜色信息是真实的,另外2 3 的颜色信息是通过c f a 插值处理完成的。c f a 模式和c f a 插值算法在一定程度上影响着图像的质量, 不同的相机会有不同的c f a 排列方式和滤波模式,不同的插值算法会使图像的像 素之间存在某种特殊的相关性。根据插值算法估计插值系数并提取特征可以作为 一种图像来源取证的方法。下面对c f a 模式和典型的c f a 插值算法进行简单介 绍。 大部分数码相机中的c f a 采用传统的b a y e rc f a 模式,主要分为四类,如 图2 3 所示。每2 x 2 个像素组成一个基本单元,其中,g 分量占像素点的i 2 ,r 、 b 分量各占i 4 。g 分量代表了大部分的亮度信息,即包含了大部分的图像信息, 为了简化起见,很多文章仅对图像的绿色分量进行分析就能得到较好的效果。人 类对绿色的变化最为敏感,而b a y e rc f a 模式的设计符合人类视觉感知模型,因 此它成为了最常用的c f a 模式。由于采用了马赛克式的设计,b a y e rc f a 也被 称为马赛克式c f a 。除了b a y e r c f a 模式外,少数数码相机中采用了另外的c f a 模式,例如c y g m ( q 锄j 托n 册“h 姚膨翘) 、r g b e ( r e d - c n e e n - b l u e - e m e r a l d ) 和c m y ( c y a n - m a g e n m - y e l l o w ) c f a 模i 挚1 】。 圈圈甚碡 图2 3 必种类型的b a y e rc f a 模式 典型的c f a 插值算法有双线性插值、双三次插值、中值滤波插值、平滑色 调插值和基于梯度的颜色插值等。通常将这些插值算法分为两大类:非自适应插 值算法和自适应插值算法。前者是指不需要考虑图像的特性,对整个图像采用同 一种插值方法;而后者则相反。由于自适应插值算法具有较强的针对性,在实际 中应用较多。本文以图2 4 的b a y e rc f a 样式为例,简单介绍两种自适应插值算 法。 图2 4b a y e r c f a 样式 基于颜色梯度的插值。该方法是指在对亮度分量( g 分量) 插值时,充分考 虑到图像局部的纹理特征,通过计算待插值点色度分量( r 分量或b 分量) 的梯 度方向来自适应选择插值系数。这是一种基于色度梯度的插值方法l ,2 】,类似的还 有一种基于亮度梯度的插值方法吲。基于梯度的插值方法首先要估计出所有点缺 失的g 分量。例如,对于图2 4 中的像素点 ,先通过式( 2 1 ) 和式( 2 2 ) 分 别计算出水平方向的梯度值日3 , 3 和垂直方向的梯度值玛,。在比较h 3 ,和巧,3 之 后,通过计算式( 2 3 ) 自适应选择该点g 分量的插值方法。在求r 和b 分量时, 假定邻域内颜色分量的差值为常数,即邻域色调具有一致性,则像素点r 3 。和g 。 的b 分量可通过式( 2 4 ) 和式( 2 5 ) 求得。其它各点的g 、b 和r 分量的计算 方法与上述方法类似。基于颜色梯度的插值方法能自适应的进行插值方向的选 择,较好的保持图像的纹理特征,因而,这种方法仍被应用于一些数码相机中。 1 峨,3 = i ,3 ,l + ,3 5 2 ,3 ( 2 1 ) ; 1 巧,3 = 亡i ,l ,3 + ,5 。3 2 吃,3 ( 2 2 ) g 3 3 = 三( 9 3 :+ 9 3 4 ) , 坞,3 ( 2 3 ) i ( 9 3 , 2 + 9 3 , 4 1 - 9 2 3 + 9 4 ,3 ) ,以,3 = 蚝,3 b 3 , 3 = g 3 3 + 丢他2 - g :2 ) + ( 6 4 :一g 4 - :) + ( 6 :4 - g : 4 ) + ( 6 4 4 一g ) ) ( 2 4 ) 3 , 4 9 3 ,+ 三( ( 6 2 ,一g 2 。) + ( 6 4 1 4 一g 4 4 ) ) ( 2 5 ) a c p ( a d a p t i v ec o l o rp l a n e ) 插值。这种方法进一步细化了上述梯度的计算, 并且也参考了邻域r 通道和b 通道的像素值来对g 分量进行估计p 】。对于g 通 道的插值,a c p 已经达到了在水平、垂直和对角方向的近似最优化f 3 s i 。此外,对 于c f a 中r 点和b 点上的b 分量和r 分量,a c p 插值算法也定义了梯度算子 进行自适应选择插值。同样在计算像素点,3 ;的g 分量时,a c p 插值算法先通过 式( 2 6 ) 和式( 2 7 ) 分别计算出日,和巧,。与基于颜色梯度的插值算法类似, 再用式( 2 8 ) 自适应地选择g 分量的插值方法。而对于c f a 中g 点的r 分量 和b 分量,a c p 插值算法则采用了一种非自适应的方法来估计。例如g :,和9 3 :可 以通过式( 2 9 ) 和式( 2 1 0 ) 求出b 分量,而r 分量的求法与之类似。在计算 c f a 中r 点和b 点上的b 分量和r 分量时,a c p 插值算法又定义了一个代表不 同对角线方向的梯度算子以自适应的选择插值方向。仍以计算像素点 ,的b 分 量为例,两个对角线的梯度算子的定义如式( 2 1 1 ) 和式( 2 1 2 ) 所示。利用式 ( 2 1 3 ) 计算出所求的b 分量。b 点的r 分量求法与之类似。a c p 插值算法的 优点是在亮度和色度通道都引入了细化的梯度计算方法和更有效的插值策略,使 得插值后的图像视觉质量较好;缺点是算法的复杂性导致计算量较大。 g 3 。3 ; 爿3 。3 刊9 3 2 。9 3 i + 1 2 吩。3 。吩,1 。r 3 。5i 圪。3 刊9 2 。3 一9 4 。3l + f 2 t 3 1 3 一。3i 毕+ 塾竽,h ,j ,月 一j o 堕垫学业堕+ 纽玉鼍业以,: 4x 1 。 岛- 3 = b ,:垒:! 垒:! + 兰墨! :! 二堡! :! 二呈! :! h 。 22 占,;皇! :! 丝:! + 三墨! :! 二! ! :! 二! ! :! 22 叫。3 爿b 2 。2 一b 4 。4i + 1 2 g 3 3 一g 2 ,2 一g 4 。4 d ;3 爿b 2 ,一b 。2i + 1 2 g 3 。3 一g 2 一g 4 2 ( 2 6 ) ( 2 7 ) ( 2 8 ) ( 2 9 ) ( 2 1 0 ) ( 2 1 1 ) ( 2 1 2 ) 学+ 塾导也,d i , 3 赡( 2 1 3 ) 丝竿卑虫+ 堡凸譬 堕旦,: 44 ” 一 ( 2 ) 自平衡 物体的颜色会因不同投射光线的颜色而发生改变。例如,一张白纸在太阳光 下是白色的,而在钨丝灯下看起来会偏鹅黄色,这是因为不同光线的色温有所不 同。一般来说,数码相机的感光元件不能像人眼一样会自动修正光线的改变。因 而,白平衡实质上是对色温进行控制和校正,使拍摄出来的照片不会因为不同的 光线而产生不同的颜色。不同的相机中会采用不同的白平衡算法,使得照片会表 现出不同的特征,因而,白平衡也可以作为图像来源取证的入手点。 ( 3 ) 伽马校正 伽马校正是指对图像进行非线性色调编辑,检测出图像中的深色部分和浅色 部分,并使两者比例增大,从而提高图像的对比度效果。数码相机的光电转换特 性是非线性的,非线性部件的输出与输入间的关系可以用下面的幂函数表示: = 圪7 ( 2 1 4 ) 通常,和的取值范围都在肛1 之间,7 的值由实验确定。一般通过获 取不同亮度的光线在数码相机中所得到的数据来拟合感光器件的非线性曲线,从 而获取y 的值。 ( 4 ) j p e g 压缩 现有的数码相机支持存储的主要格式有r a w 、t i f f 和j p e g 。由于j p e g 压缩 能在保证图像质量优良的条件下使得存储量减小,因而j p e g 格式成为了数码相 机中最常见的图像存储格式。此外,手机中的图像存储格式几乎都是采用这种格 式。j p e g 压缩是数字图像处理中的最后一个环节,它的重要性不可忽视。j p e g 有几种模式,其中最常用的是基于离散余弦变换( d c t ) 的顺序型模式,又称为 基线系统,包含颜色模式转换、d c t 、有损量化、无损信息熵编码四大部分。其 编码器流程和解码器流程分别如图2 5 和图2 6 所示。 图2 5j p e g 编码器流程 1 4 fy = 0 2 9 9 r + 0 5 8 7 g + 0 1 1 4 b c 。= - 0 1 6 8 7 r - 0 3 3 1 3 g + 0 5 丑 ( 2 1 5 ) ic ,= 0 5 r 一0 4 1 8 7 g 一0 0 8 1 3 b f 贴y + 1 4 0 2 c , 【b = y + i 7 7 2 c 6 使其值域为【- 1 2 8 ,1 2 8 ,同时,若待编码的图像尺寸不是8 的整数倍,则需先将 1 5 由于8 x 8 的数据块经过d c t 变换后,其低频分量都集中在左上角,高频分量分 布在右下角。由于该低频分量包含了图像的主要信息( 如亮度) ,相比之下,高 频分量就没那么重要了,所以忽略高频分量就能达到压缩的目的。量化便能去掉 图像中的高频分量,它是信息损失的根源。经过量化后,该8 8 的数据块会生成 一个8 x 8 的量化矩阵,即量化表。量化表左上角的值较小,右上角的值较大,这 样就能保持低频分量,抑制高频分量。在y c r c b 颜色模式中,人们对y 分量更 敏感,因此,可以对y 采用细量化,对c r c b 采用粗量化,可进一步提高压缩比, 这样就得到了两个不同的量化表,即基准亮度量化表和色度量化表。这是一组标 准的量化表,用户也可以自定压缩的量化表。在现有的数码相机中,不同的厂商 会根据不同的需求自定义量化表。在有损量化的过程,图像块的高频分量出现大 量连续的零系数,有益于无损信息熵编码。 无损信息熵编码。在对d c t 系数进行有损量化之后,j p e g 编码器将对量化 的系数进行无损信息熵编码,从而进一步压缩数据。在j - p e g 图像中,直流d c t 系数和交流d c t 系数是分开编码的。一般地,口e g 的无损信息熵编码分为两步: 首先利用j p e g 编码器将量化后的d c t 系数进行游程编码,并将系数值转换为 某种中间格式,接着进行霍夫曼编码或算术编码。 2 4 现有的数码照片来源取证方法 2 4 1 基于图像统计规律的取证方法 不同图像的生成过程不尽相同,却都是以数值形式存储的,图像本身在一定 程度上存在着统计规律,该方法是利用数理统计学的知识仅对图像像素本身分析 来探索图像内部的统计特征。统计特征通常可以用直方图、小波系数和高阶统计 量等统计量来表征。利用d c t 变换、小波分解等图像分解方式也能提取出图像 的统计特征。 ( 1 ) 基于图像分解的自然图像特性 l y u 和f a r i d 在文献【1 4 】中提出基于正交镜像滤波器( q m f ) 分解的图像统 计模型对自然图像和计算机生成图像进行分类,该模型由一阶和高阶统计量组 成。q m f 分解是一种类似小波分解的多尺度多方向的图像分析方法。算法中采 1 6 用了4 级q m f 分解,通过提取各方向各子带上分解系数的均值、方差、偏度和 峰度统计特征,并同时考虑各子带间的相关性,计算分解系数与其相邻尺度、相 邻方向、邻域位置及其他颜色通道同一位置的分解系数间的四阶线性预测误差特 征,将由此获得的总共2 1 6 维特征作为线性分类器( l d a ) 和支持向量机( s v m ) 的输入进行分类,在对图像库中4 0 0 0 0 幅自然图像和6 0 0 0 幅计算机生成图像进 行实验后的结果显示出,l d a 对两者的正确分类率分别为5 4 6 和9 9 2 ,而
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论