(计算机软件与理论专业论文)区分真实照片与人工图片的算法与实现.pdf_第1页
(计算机软件与理论专业论文)区分真实照片与人工图片的算法与实现.pdf_第2页
(计算机软件与理论专业论文)区分真实照片与人工图片的算法与实现.pdf_第3页
(计算机软件与理论专业论文)区分真实照片与人工图片的算法与实现.pdf_第4页
(计算机软件与理论专业论文)区分真实照片与人工图片的算法与实现.pdf_第5页
已阅读5页,还剩48页未读 继续免费阅读

(计算机软件与理论专业论文)区分真实照片与人工图片的算法与实现.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生笪塑型兰至婴兰焦笙茎 堕坌塞兰璺苎翌三里笪堕兰堕皇! ! 望 区分真实照片与人工图片的算法与实现 专业: 硕士生: 指导教师 计算机软件与理论 麦青 李才伟 摘要 随着互联网的发展,人们对在互联网上进行图像检索,尤其是基于内容的图 像检索的需求越来越大。然而,已经有实验 4 】证明,在混杂的真实照片和人工图 片中进行图像基于内容的检索将较大的影响内容检索的准确度。所以,通过区分 真实照片与人工图片的算法进行图像的预分类和与识别,对于提高在互联网上基 于内容的图像、影片检索的成功率有着巨大的现实意义。 区别于目前大部分相近的侧重于图片的宏观特性的研究,本文主要考虑了图 片的微观特性,包括纹理的粗细、能量、走向、信息量以及纹理的颜色、亮度分 布特征。可以看到,受到计算复杂性的影响,除了一小部分强调细节真实性的人 工图片( 如电影最终幻想) 之外,大多数图片在像素级的细节都是大致模拟, 以有规律的纹理重复来代替真实情况下随机产生的差异,本文捕捉这些差异,不 仅提高了分类的准确度,而且把原来仅限于卡通与照片的区分扩展到人工图像与 真实照片的区分,提高了算法适用范围。 在本文中,分别讨论了目前在纹理研究领域通常使用的多个特征指标以及由 本文提出的基于分片的特征指标在该区分算法中的有效性,并使用支持向量机 ( s v m ,s u p p o r tv e c t o rm a c h i n e ) 的算法,对这些指标进行整理,达到可以进行图像 分类的效果。 最后,在实现了人工图片和真实照片的区分算法的基础上,本文提出了个 基于区分算法的开放性的,可配置的图像检索系统。本文的区分算法将可以作为 该系统的支持算法之一,参与图像分类过程。该系统将可用于组织目前的各种基 于图像内容的分类算法,并实现互联网上的基于图像内容的图像检索系统。本文 同时还给出了该系统的概要设计,并对其有效性进行了论证。 关键词:图像区分算法,人工图片,真实照片 生塑塑型兰茎堡主堂竺笙苎 堕坌塞兰翌竺塑查三燮翌望圭! ! 塑 a l g o r i t h ma n di m p l e m e n t a t i o n o f d i s t i n g u i s h i n gb e t w e e n r e a lp h o t o sa n d a r t i f i c i a lg r a p h i c s m a j o r :c o m p u t e rs o f t w a r ea n dt h e o r y n a m e : o i n gm a i s u p e r v i s e r : c a i w e i “ a b s t r a c t a st h er a p i dd e v e l o p m e n to ft h el n l e m e t ,m o r ea n dm o r ep e o p l ep r e f e rt or e t r i e v e i m a g e so nt h ei n t e r a c t ,e s p e c i a l l yb a s eo nt h ec o n t e n t so ft h ei m a g e s h o w e v e r , s o m e e x p e r i m e n t ss h o wt h a ti nt h ei m a g ed a t a b a s e ,w h i c hh a sj o i n e dt h ec o m p u t e rg r a p h i c s a n dt h er e a lp h o t o st o g e t h e r , t h ec o n t e n t - b a s e di m a g er e t r i e v a 【w i l ll o s em u c ho fi t s a c c u r a c y s oi tm a k e ss e n s et oh a v eap r e - c l a s s i f i c a t i o no fr e a lp h o t o sa n da r t i f i c i a l g r a p h i c sb e f o r et h ec b i r d i s t i n g u i s h i n gf o r mm o s to ft h er e c e n tr e s e a r c h e so ft h i sa s p e c tt h a tp a yt h e i r a t t e n t i o n so nt h em a c r oc h a r a c t e r i s t i c s ,w ep a i dm o r ea t t e n t i o n so nt h em i c r o c h a r a c t e r i s t i c so ft h ei m a g e s ,s u c ha st h et e x t u r e sw i d t h ,e n e r g y , d i r e c t i o n ,t h ee n t r o p y , t h ed i s t r i b u t i o no ft h ec o l o ra n dt h el i g h ta sw e l l i nf a c t w ec a ns e et h a te x c l u d i n g s o m ea r t i f i c i a lg r a p h i c s ,s u c ha st h eg r a p h i c sf r o mt h ef i l mf i n a lf a n t a s y , w h i c hh a v e p a i dm u c ha t t e n t i o ni ns i m u l a t i n gt h er e a lp h o t o s ,a r t i f i c i a lg r a p h i c sh a v eg r e a t d i f :f e r e n c ew i t ht h er e a lp h o t o si nt h ea s p e c to ft h ed e t a i l si nt h ec l a s so fp i x e l s m o s t o ft h eg r a p h i c sm i x e dt h e m s e l v e sw i t ht h er e a lp h o l o sb yt h er e g u l a rp a t t e r n s ,w h i c h a r eu s e df o rs i m u l a t i n gt h er a n d o mp a t t e r n so ft h er e a lp h o t o s b yc a t c h i n gt h e s ek i n d s o fd i f f c r e n c e 。w ei m p r o v et h ea c c u r a c yo ft h ec l a s s i f i c a t i o n e v e l lw eh a v ee x p e n d s 山ee x t e n t so ft h ea l g o r i t h mf r o mt h ed i s t i n g u i s h i n gc a r t o o n sa n dd h o t o st ot h e d i s t i n g u i s h i n gc o m p u t e rg r a p h i c sa n dr e a lp h o t o s i nt h i st h e s i s 。t h ee f f e c t so ft h ep a r a m e t e r so ft h et e x t u r ej nt h ec l a s s i f i c a t i o na r e d i s c u s s e d a n dt h es v m ( s u p p o r tv e c t o rm a c h i n e ) i su s e dt od e a lw i t ht h e s e p a r a m e t e r sf o r t h ep u r p o s eo ft h ec l a s s i f i c a t i o n a tl a s t ,i nt h et h e s i s ,a no p e n ,c , o n f i g u r a b l ei m a g er e t r i e v a ls y s t e mb a s e do nt h e c o n t e n t b a s e dc l a s s i f i c a t i o na l g o r i t h m si sp u tu pi no r d e rt oo r g a n i z et h ea v a i l a b l e c l a s s i f i c a t i o na l g o r i t h m s ,s u c ha so u rc l a s s i f i c a t i o na l g o r i t h m ,a n da d a p tt ot h ec b i r o nt h ei n t e r a c t b o t ho ft h eg e n e r a ld e s i g na n dt h ed i s c u s s i o no ft h es y s t e ma r ea t s o g i v e ni nt h i st h e s i s k e y w o r d s :i m a g ec l a s s i f i c a t i o n 、a r t i f i c i a lg r a p h i c s 、r e a lp h o t o s 计算机科学系硕士学位论文 区分真实照片和人工图h 的算法与实现 第1 章引言 随着数字化多媒体数据的飞速增长,对于这些资料的快速查找成为个非 常迫切的需求。因此,基于内容的多媒体信息检索成为一个热门的研究领域, 它是对基于文本描述的检索方法的一个十分有效的补充。 图像检索的传统方法是基于文本的,使用关键字注释是最常用的方法。这 样,对图像的检索就变成了对关键字的查找。但是,基于文本的检索存在的主 要问题是:出于图像注解的主观性和不完备性,因雨不能保证正确率。为了克 服基于文本方法的局限性,2 0 世纪9 0 年代出现了基于内容的图像检索 ( c o n t e n t b a s e di m a g er e t r i e v a l ,c b i r ) 系统,它是指直接针对图像内容进行图 像信息查询的检索系统。按照图像检索复杂度的递增,c b i r 可以分为以下3 个层次上的图像检索1 1 】: 1 ) 原始特征:使用颜色、纹理、形状等视觉特征进行图像检索。这些特征 是客观的,是图像本身的属性,不需要任何外部知识。 2 ) 导出特征:导出特征又称为逻辑特征,是通过对图像中所描述对象进行 某种程度的逻辑推理而得到的。这一层次的检索需要得到一些外部知识的帮助。 目前,报纸、杂志等图像数据库的检索主要是在这一层次上进行。 3 ) 抽象属性:该层次的检索涉及到对图像中所包含物体的含义和场景的描 述,需要进行大量的高层次的推理。 按导出特征和抽象属性进行检索又称为语义图像检索【2 l o 目前,大部分 c b l r 是按照图像的原始视觉特征,在第一层次上进行检索。然而,从实际日常 应用的角度来说,语义图像检索的用途更加广泛。当前主要研究的重点都是在 已知图像的类别上进行图像理解的。例如,在遥感图像上找出目标,在机器人 的视觉图像上实时找出入脸,在人脸的图像中找出五官轮廓并进行匹配,在医 学图像上自动找出癌细胞等等。这些都能够很好地解决专业领域的问题,但是 对于普通的用户用不上。对于普通用户,如果可以使用类似于目前的文字搜索 引擎的方式,对要检索的内容进行基本的文字描述,“图像搜索引擎”则根据一 些基本的词法分析,得到搜索的要点,然后在图像库中根据要点分门别类的逐 计算机科学系硕士学位论文区分真实照片和人工图片的算法与实现 级搜索,最终得到内容上最贴切的一系列图像,那样就很不错了。这种搜索方 式虽然类似于基于关键字的搜索,但是他是在计算机理解了图像内容的基础上 进行的。而这种基于图像分类的图像检索的工作方式也与大多数在图像原始特 征上进行的c b i r 有很大的不同。 我们所要做的研究目的就是要实现图像的基本分类,以证实该种图像检索 方式的研究可行性。我们使用图像的纹理特征和支持向量机( s u p p o r tv e c t o r m a c h i n e ,s v m ) i 拘方法实现了人工图片和真实照片的区分。并且利用文献 1 】的 层次思想和w e b 服务的思想,给出这样一种基于区分算法的图像搜索系统的概 要设计,以期它的实现能用于在互联网上进行基于内容的图像检索。 计算机科学系硕l 学位论义 区分真实照片和人工图片的算法与实现 第2 章视觉信息检索综述 2 1 图像检索与分类 随着科学技术的进步,特别是计算机技术的发展,现代技术已能运用各种 手段大量的采集和产生各种类型的信息数据。由于各种信息数据的类别和载体 的增加,以及他们的综合和集成,人们对它们统而冠之以“多媒体”。多媒体信 息中数量最大最主要的一种就是视觉信息。这里视觉信息既包括一般所说的静 止图像信息,也包括视频及序列图像信息,以及计算机图形和动画信息等。随 着需求的增长,工业技术的进步以及个人数码消费品的普及,视觉信息的增长 远远高于其他媒体信息的增长。进入新世纪后,有人估计仅世界上每年产生的 新图像已达到8 0 0 亿幅。对此作一估算,假设每幅图像平均尺寸为1 0 2 4 7 6 8 像 素,而每个像素用2 4 b i t 表示,即3 b y t e ,则这些数据的量大概为1 ,8 1 0 8 g b 的 数据量。很幸运的,这么大的数据量并不是集中放在一个地方,否则存储器的 体积要达到超出人们想象。目前这些数据分布存储在全球将近两亿台实现了互 联的计算机上面,这样则不必制作出庞大的存储器了。然而,这样在使用这些 图像数据的时候,就有必要进行信息的检索。 信息检索的概念提出是在上世纪五十年代初,用来描述信息用户将一个对 信息的要求转换为一个参考集合的过程,并在此基础上,用户将有可能快速的 搜索并提取出相关的信息。其中,信息检索的效率与信息载体的数据量、信息 的组织形式及信息表达的抽象程度等密切相关。 视觉信息检索是信息技术的一个重要研究内容,他的目的是从视觉数据库 中快速的提取出于一个与查询相关的图像或图像序列。视觉信息检索实际上是 传统信息检索的扩展,他将视觉媒体也包含到信息检索中。随着越来越多的图 像和视频数据库的建立和越来越多视觉信息在数字档案中的应用,对视觉信息 汁算机科学系硕士学位论文 区分真实照片和人工图片的算法与实现 检索的需求扩大了。 一般视觉数据关联两类信息【3 j : 1 ) 与图像或视频内容不直接相关但有某种联系的数据,也常称为内容无关 的元数据,如格式、作者名、日期、所有权等。 2 ) 与图像内容相关的视觉信息的数据,可以分两层 i ) 底层或中层特征的数据,如颜色、纹理、形状、空间联系、运动等, 以及他们的组合,也常称为与内容相关的元数据。一般来说,这种数 据与感觉因素有关。 i i ) 高层内容语义的数据,这种数据也常称为内容描述元数据,他关心图 像实体和客观世界实体的关系,或者图像实体与视觉符号和场景相联 系的时间、事件、感受和意图的联系。 图像标识作为一个内容无关的特征在传统视觉信息检索中被广泛应用,这 是因为相对于图像的数据量来说,文字的数据量相当少,而其他内容无关的特 征也一样。这种检索方法虽然简单,但有几个根本的问题影响对视觉信息的有 效使用【3 】。 首先,由于图像,视频内容丰富,很难用文字标签完全表达,所以这种方法 在查询图像视频中常会出现错误。其次,文字描述是一种特定的抽象,如果描 述的标准改变,则标签也得重新制作才能适合新查询的要求。换句话说,特定 的标签只适合特定的查询要求。最后,目前这些文字标签是靠观察者选出来加 上去的,因此受主观因素影响很大,不同的观察者或同一个观察者在不同条件 下对同一幅图像可能给出不同的描述,因而不够客观,没有统一标准,常会自 相矛盾。 事实上,诸如图片获取的日期、作者名等都可提供有用的索引线索,但都 不能完全抓取图像的视觉信息。图像内容带给人的信息是多方面的,所以没有 人是仅借助标号来回忆场景的。用户需要能通过图像的内容,访问他们所需要 的图像信息。例如在专, i i , n 库中经常进行的一些比较分析,以获取具有某种属 性的图像子集。当然,这种属性可以一开始就在图像的标签上表示出来,但是 用户的需求总是变化的,查询的属性也就时常变化,总会遇至标签无效的情况, 这时就需要对图像的内容进行检索。而在互联网上进行类似的检索则更加困难, 汁算机科学系硕十学位论文 区分真实照片和人【图片的算法与实现 因为根本没有一个统一的标识标准对互联网上的图像信息进行标记,这就更加 需要针对图像内容进行的检索。 基于内容的视觉信息检索( c o n t e n t b a s e dv i s u a i n f o r m a t i o nr e t r i e v a l , c v i r ) 是视觉信息研究中的新热点。基于内容的视觉信息检索借助对视觉媒体 从底层到高层进行处理、分析和理解的过程获取其内容,并根据内容进行检索。 它涉及到对图像和视频中的视觉信息进行有效的查询、索引、浏览、搜索和提 取,而且这种工作是直接根据图像和视频的内容含义而展开和进行的。d j 目前基于内容的视觉信息检索主要用在各种各样的专业图库l 1 。如医学图 库、统计图库、商业图库、行政图库等等,为了进行各种各样目的而设计出的 基于内容的检索系统。然而作为公众使用的图像内容检索系统并不流行,这是 由算法的复杂性所决定的。一般来说,专业的图库中的图像都有类似的图像结 构,例如专业的统计图库中,必然大量的存在各种统计折线图,基于一定的行 业标准,这些折线往往使用类似的颜色表示出来。当要把表示某个含义的折线 图检索出来时,可以利用颜色特征轻松的把折线提取出来,再根据行业知识进 行含义分析,然后判断是否所需的折线图。然而在互联网上检索所需要的统计 折线图就不是这么简单的事情了,首先面临的问题就是如何把统计折线图与其 他的图像区分出来。目前互联网的技术基础之一超文本技术为人们带来了 很大的便利,人们可以在自己的网页上随意、随处连接任意的图像,虽然这带 来了网页的美化,但是也带来了图像信息的混杂,再加上超连接技术,更带来 了全互联网上图像信息的混乱情况,而在这样混乱的“图库”上进行信息检索, 必然要面对图像的区分和分类,这正是本文研究的出发点。 2 2 图像区分算法的意义 如上所述,目前专业图库的各种基于图像内容迸行信息检索的算法并不能 直接给互联网上的普通用户使用,也就是中间需要一个图像内容区分过程。从 图像检索系统的设计方法的角度来看,也可根据这种图像区分的思想来设计系 统。普通用户,可以使用类似于目前的文字搜索引擎的方式,对要检索的内容 计算机科学系硕上学位论文 区分真唼照片和人丁图片的算法与实现 进行基本的文字描述,“图像搜索引擎”则根据一些基本的词法分析,首先得到 目标图像的各层的分类要素,再根据这一系列的分类要素对图片进行按类别的 搜索,并在该过程中对不符合要求的图像集进行剪枝,直到得到最符合的图像 序列。虽然,目标图像可能被进行了多次的分析,但这是在已经分好类的图像 集中进行的,不会产生过多的计算要求,同时这能够提高获取目标图像的准确 度。而在图像入库,进行初级分类的时候,还能在剪枝的过程中,使用较简单 的算法就把不必要的复杂的分类算法去掉,降低了计算的复杂性。 其中,区分人工图片和真实照片的算法则是这各个层次的区分算法中比较 基本的一层。已经有实验表明,在混杂了人工图片和真实照片的图库中进行 c b i r ,将极大的降低检索的成功率。而在实际应用中,对人工图片,如卡通图 片,3 d 图片,广告标识和其他各种类型的标志都可以有专门的识别算法,而且 这些算法与针对真实照片的识别算法有很大的区别,如果能在检索的开始就对 这两种图片进行区分,然后再利用各种有针对性的算法进行图像分类识别,则 可以从很大程度上提高图像检索的成功率。 2 3 人工图片和真实照片的区分算法简介 我们把通过各种各样照相技术、或者直接称之为光学记录技术所获取的图 片或视频称之为真实照片,虽然这些图片可能在获取的时候已经使用了各种特 殊的光学技术,获得了特殊的效果,只要他们或取的基础不是计算机的图片, 我们还是把他们归为真实照片。 然而相对应的,如果是使用计算机直接制作的图片,不管是卡通图片还是 其他的非自然的数字图像我们都把他们称之为人工图片。 虽然这样的分类还是把很多的图像具体含义混杂在一起,但是我们可以得 到一系列比较统一的图像特征。其中的人工图片可能拥有以下几个共同点f 4 j : 1 ) 颜色的数量较少,较简单,对比强烈。制作人工图片时,往往是对现 实事物进行抽象,为了减少制作难度,但同时要加强事物的存在感, 往往会使用较少的颜色,而同时使用夸张的饱和度。 i i 算机科学系硕士学位论文区分真实照片和人工图片的算法与实现 孙图片充满了一系列均匀的色块。同样是基于制作难度的原因,在人工 图片上的纹理往往被简化为均匀的色块。 3 ) 含有正规的文字。很多的人工图片,尤其是在专业图片库中的图片往 往会包含一些标志文字。这些文字不会随着图片的视角而发生变形, 而且还与背景有强烈的对比度,文字内部的颜色和纹理也有相当严格 的规律性。 通过这些特征所区分出来的图片可以使用比较特殊而又相对简单的算法 提取出其内在的含义。然而,我们是否可以通过这些特点来实现我们的区分算 法呢? 我们首先观察一下的两张图片: 图2 - 1 一幅容易误认为人工图片的照片 计算机科学系硕士学位论史 区分真实照片和人工图片的算法与实现 图2 2 幅容易误认为真实照片的人工图片 其中的图2 - 1 ,让人一眼看上去就像人工图片,颜色数量非常少而且均匀, 然而这是一幅真正的照片,其中所有的东西都是使用有颜色的纸制作的,图像 的获取方式就是对这件工艺品拍张亮度充足的照片。而下面的那幅人工图片图 2 2 ,光看男主角的脸部,似乎有点皱纹,而且皱纹还很逼真,一下子要估计这 是否一张人工图片,看来也不太容易。因此,光凭一些宏观特征来做人工图片 和真实照片的分类,并不容易。 2 4 已有研究成果 国外曾进行过相关的研究,主要侧重于卡通和现实视觉信息的区分,在文 献f 4 1 中提到了大致的研究现状。 r o a c h 等人通过运动信息迸行区分卡通和非卡通的1 引,在一定的程度上类似 于区分人工图片和真实照片。在通常的卡通中,运动的过程会带来同像素位 置上的颜色发生阶跃性变化,而在真实的自然片段中,由于图片的数字化所带 来的事物边界的模糊性,运动过程将不会带来像素颜色发生阶跃性变化,而是 被一种急速的连续变化所代替,因此产生区分的作用。然而,他们做的系统仅 包含8 段卡通和2 0 段非卡通,难以说明结果的普适性。而且这种方法不能用在 生蔓! ! 型主墨竺主兰丝堕苎 竺坌塞壅璺旦塑垒圭鬯生塑苎竺皇! ! 塑 静态图片中。 而b t t m o n 譬等人考虑了使用影片的三神宏观特性,用以区分出七种类型 的影片f 6 j ,而卡通影片也是其中的一类,由于所使用的部分特性与影片的长度 有关,而其余与影片长度无关的统计特征也依赖于影片的大数据量才趋于稳定, 因而这种方法不适宜广泛使用在静态图片上面,然而中间所采用的统计特征参 量可以做下参考。 还有些相关的研究是基于w w w 的图片检索剐,其中进行了网络的照 片和绘画的分类研究,但是采用的是一些同网络相关的特性,例如是文件名, 图片的压缩率,u r l 中的关键字等,而不是图片内容本身,因而算法没有推广 性,而且也不符合于我们基于图像内客检索的原意。 为了综合考虑图片的特性,v t h i t s o s 等人总结了一系列的宏观特性【,而使 用的最远近邻直方图描述子来分析这些宏观特性,进行图片的分类,可是计算 量过大,而且并不能明显区分照片和图片。 还有人使用决策规则来分析这些宏观特性【1 0 】【“】,也不具有足够的判断能 力。而同样针对这些结果,文献 4 】使用了支持向量机( s v m ) 的方法来分析宏 观特性。通过分别对5 0 0 张自然照片和5 0 0 张卡通片进行训练,再对两万多张 图片进行区分,取得了较好的效果。然而,遗憾的是文献【3 】的方法可以保证把 所有的卡通图片找出来,却不能保证把所有的自然照片找出来。这是因为文献 【4 】中也只考虑了宏观特性,而忽略人跟不容易注意得到的纹理特性。 国内在图像分类方面的研究还比较少,侧重点仍然放在专业图库中的图像 分类。但是国内在图片纹理分析方面还是做了不少的研究工作,主要的目的还 是在图片分割上面。通常来说,纹理分析主要涉及纹理抽取和特征分类两个阶 段:在纹理抽取阶段,人们将图像信息简化为一个小的特征描述集。而在特征 分类阶段,人们则从个别像素( 例如纹理分割) 或像素集( 例如图像分类) 中 抽取特征。迄今为止,纹理分析依然面临诸多困难,值得幸庆的是此领域的研 究得到了加强。在纹理分析领域,纹理特征识别方法主要分为五类:统计学方 法、几何学方法、结构方法、基于模型的方法和信号处理的方法。很明显纹理 抽取不是我们的目的,特征分类才是我们的目的。但是不同于针对具体内容分 类,我们不需要确实的抽取图像中的目标内容,只要纹理特征集的统计特征满 计算机科学系硕士学位论文 区分真实照片和人工图片的算法与实现 足分类的要求藏行了。我们主要针对的是真实照片中所包含的微小纹理,它们 尺寸细小,分布随机,是一般人工图片的制作者所不愿意花计算时间来实现的 效果,因而其中对我们的分类比较重要的一些统计特征是:纹理的分布均匀性, 清晰程度,纹理的相似程度,纹理的信息量等。 2 5 核心问题和关键技术 从已有的研究中可以看出,要实现真实照片与人工图片的区分的核心问题 和关键技术圭要有以下三项: 使用什么宏观特征作为区分的参数:在区分普通难度的图片时所采用的 图像特征。例如像文献 4 】中所提到的亮度、颜色饱和度、颜色立方图、 边沿方向、压缩率等等 使用什么参数来描述纹理特征:在较难区分的图片中,采用纹理特征描 述参数。例如描述图像灰度分布均匀性的二阶矩,描述纹理的清晰程度 的图像对比度,描述共生矩阵的元素在行的方向或列的方向的相似程度 的参数,描述纹理信息量的熵值等等 具体的图像区分算法:对于相同的参数,采用不同的算法可以达到不同 的区分效果,区分算法可以包括简单的加权统计,神经网络方法,统计 学习方法等等。 其中图像的特征参数的选取的研究尤为重要。而具体的区分算法是基于不 同的特征参数所使用的,好的参数对结果有决定性的影响,而区分算法则在改 善提高区分效果中起重要作用。 目前对图像宏观参数的研究以及基于其上的区分算法已经研究的比较透 彻r 而对图像的纹理特征的微观参数在区分算法中的作用的研究还比较少 计算机科学系硕士学位沦文 区分真实照片和人工图片的算法与实现 本文算法就是主要使用了纹理特征的微观参数的基础上进行的,因而有 定的创新。 - 1 1 计算机科学系硕士学位论文 区分真实照片和人t 图片的算法与实现 第3 章人工图片和真实照片的区分算法 3 1 区分算法概述 区分算法流程大致如下 图3 - 1 人工图片与真实照片区分算法流程图 1 2 ! ! 蔓! ! 型兰墨堡! :兰堡堡奎 垦坌壅壅璺星塑叁三堕笠! 燮皇! ! 堡 3 2 特征参数选择及其定义 3 2 1 灰度共生矩阵1 1 2 】 纹理是由灰度分布在空间位置上反复交替变化而形成勺,因而在图像空间 中相隔某距离的两像素间会存在一定的灰度关系,这种关系被称为图像中灰度 的空间相关特性。在灰度直方图中,因为各个像素的灰度是独立地进行处理的, 所以不能很好地反映纹理中灰度及空间相关性的规律,故需要研究图像中两个 像素灰度级的联合分布的统计形式。通过这种方式得到的纹理特征称为二次统 计量( s e c o n do r d e rs t a t i s t i c s ) 。该思想正是灰度共生矩阵( c o o c c u r r e n c e ) 的 基础。 灰度共生矩阵用p 。表示: p 。( f ,) ,( f ,一0 , 1 2 上一1 ) + 上式中l 表示图像的灰度级,本文使用了0 - 2 5 5 共2 5 6 个灰度级;i ,i 分 别表示两个像素的灰度:6 表示两个像素间的空间位置关系,包括两个像素之 间的距离和方向。本文使用的是距离为1 ,方向分别为0 ,4 5 ,9 0 ,1 3 5 四个, 代表了一个像素与周围八个像素的位置关系。 p 。= p 。( o ,0 ) p 。( 1 ,o ) p 。o ,0 ) p 。仁一1 o ) p 。( o ,1 ) p 。( o ,) p 。( 1 ,1 ) p 。( 1 ,) p 。( f ,) pa 旺一1 ,n p 。( 0 ,三一1 ) p 。( 1 ,l 一1 ) p 。( f ,l 一1 ) p 。犯一1 ,三一1 ) 使用灰度共生矩阵并不能直接进行纹理的研究,而是通过对灰度共生矩阵 计算各种指标,获取图像的纹理信息。常用的计算指标有:二阶矩、对比度、 相关和熵。 计算机科学系硕士学位论文 区分真实照片和人工图片的算法与实现 3 2 2h s v 颜色空间 色彩空间是以强度值来表示色彩的模式,色彩空间指定色彩信息是如何表 示,其意义是以一、二、三或四度空间或组合来表示强度值。颜色空间按照基 本结构可以分两大类,基色颜色空间和色、亮分离颜色空间。其中h s v 是其中 的一种色、亮分离色彩空间,h s v 代表色相( h u e ) 、饱和度岱a t u r a t i o n ) 和明暗度 ( v a l u e ) 。它不同于r g b 等基色颜色空间,它的三个独立参量在进行相互加减时 没有意义,反过来说,它的独立参量对纹理特征的贡献是相互独立的。一般常 用的r g b 到h s v 的转换公式: t , m a x ,g ,b ) r 一 一 一 2 5 5 s :1 一m i n ( r , g , b ) 2 5 5 + v 日= a r 。c o s 【_ 堡三呈! 丝三皇! r ,bo rg ,b 2 ( r - g ) 2 + ( r b ) ( g 一口) h s v 颜色空间的色相在研究彩色图像中使用,而亮度则跟图像的灰度相当。 对于色相来说,可以做出类似于前面所述的灰度共生矩阵的色相共生矩阵,用 来描述彩色图像的纹理,只不过此时的数量级别不是2 5 6 ,而是通常的所说的 色度圆盘的3 6 0 。不过要注意的点是,当两个像素之间,色相的数值大与一 定程度时,色相的数值差的大小并不能进一步说明纹理的特点,因此在用色相 共生矩阵时,某些参量的计算公式与灰度共生矩阵不太样,在下面会有提到 的。 3 2 3 二阶矩u 2 1 l 一1l 一1 2 蔷荟鲐j ) 二阶矩是图像灰度或色相分布均匀性的度量。当灰度( 色相) 共生矩阵中 的元素分布较集中于主对角线时,说明从局部区域观察图像的灰度( 色相) 分 布是较均匀的。从图像整体来观察,纹理较粗,此时二阶矩值则较大,反过来 计算机科学系硕上学位沦义 区分真实照片和人工图片的算法与实现 则二二阶矩值较小。一般来说,真实照片的纹理应该较细,因为在真实映像进行 数字化的时候,受到随机因素的影响,会产生大量的像素间的微小偏差而产生 细小的随机纹理。通过二阶矩,可以获取这一差别。 3 2 4 对比度【1 2 1 厂。:,2 2 t l ,三- 1 工f 一- 1 p 6 6 ( f ,) ( 灰度) 厂。2 川f 毛一6 6 ( 灰度 。i j h 厂:。l - 1 l - 。1 p 6 g ,- ) ( 色相) 厂,一p 6 ( i ,) ( 色相) 。i = 0 ,= 0 图像对比度可以理解为图像的清晰度,即纹理的清晰程度。在图像中,纹 理的沟纹越深,则其对比度,:越大,图像的视觉效果越是清晰。般来说, 人工图片的对比度比较大,这是人工图片的艺术效果造成的。 对于图像的灰度共生矩阵和色相共生矩阵来说,纹理的对比度计算有所不 同。两者式中的n 均代表为像素的差异,但是对于灰度共生矩阵,r l 越大代表 灰度差别越大,两者的区别越明显,而对于色相共生矩阵来说,1 1 大于定程 度时,它的大小不再说明两个像素间的对比关系,因此n 的数值没有直接计算 入对比度中,而是作为一个控制的闽值,保证只有差别大与一定程度的像素对 被计算。 3 2 5 相关1 2 】 ,:薹互塑竺竺 j3 q 2 “2 2 式中u ,、u 。、o 和o 。分别定义为 生苎垫型堂墨堡主兰堡笙苎 堕坌壅茎墨苎塑幽苎堕兰堡皇茎翌 肛,2 荟2 磊户。( f ) 口:2 磊j 磊p 。( u ) i = 磊l - 1g 一肛1 ) 2 荟l - 1 p 。( f ,) 2 :一磊l - 1 ( 歹一2 ) 2 丢l - 1 p 。o ,) 相关能够用来衡量灰度( 色相) 共生矩阵的元素在行的方向或列的方向的 相似程度。例如,某图像具有水平方向的纹理,则图像在0 = o 方向的灰度共生 矩阵的相关值,往往大于o = 4 5 ,。= 9 0 和e = 1 3 5 的灰度共生矩阵的相关值 ,。人工图片的纹理由于是模拟生成的,所以具有规律性,这在研究纹理的 相关件中将会有所体现。 3 2 6 熵吡l 厂。一荟荟p 。( f ,埘0 9 p 。 ,) 熵值是图像具有的信息量的度量,纹理信息是图像信息的一种。若图像没 有任何纹理,则灰度共生矩阵几乎为零阵,熵值,。接近为0 。若图像充满着细 纹理,则p 。( f ,j ) 的数值近似相等,该图像的熵值,。最大。若图像中分布着较 少的纹理,p 。( f ,) 的数值差别较大,则该图像的熵值厂。较少。一般情况下, 人工图片的纹理数不如真实照片的多,因此熵也相对较少。 3 2 7 图像饱和度平均值 计算机科学系颂上学位论文区分真实照片和人工图片的算法与实现 。 s :盗竺 m4 上式中,m 、n 分别为图像的高度和宽度,s 为图像各像素饱和度组成的 矩阵。文献( 5 1 中的实验证明,卡通片或是人工物占较大篇幅的录像( 如运动记 录片) ,其画面的平均饱和度要比一般的录像高,而文献【3 的实验更表明,在 使用图片的平均饱和度进行图片的区分时,错误率可以控制在0 2 7 。这是因为 饱和度较高的颜色更能引起人的注意。通常的人工图片由于缺少立体感,因此 画面层次感比较差,而要补偿层次感的缺失,则可通过饱和度高的不同颜色形 成对比反差,达到有层次的效果。因而可以把图像颜色饱和度的平均值作为判 断的一个参量。 3 2 8 图像亮度平均值 m e a n v 一 善磊y ( f ,) m4 类似于图像饱和度平均值,式中v 为图像各像素亮度组成的矩阵。在我们 的区分算法中,图像的平均亮度所体现的并不是一种客观的区分性,而是一种 主观区分性,它是由于图像的用途所产生的差异。一般情况下,明快的颜色能 使刺激人的视觉感官,对于欣赏性的图片有增强美感的作用。而人工图片在大 多数的情况下,尤其是在互联网上,更多的是起欣赏、美化页面的作用,因此 普遍来说平均亮度会比较大。而真实照片所起的比较多是反映真实的作用,因 此平均亮度相对来说就小一些。但是,也是同样的原因,图像亮度平均值对于 超出这个范畴的图片来说,就没有区分的价值了。不过,依然可以把它作为一 个区分的特征参数加以考虑。 计算帆科学系硕士学位沦文 区分真实照片和人t 图片的算法与实现 3 2 9 图像总体色相数 图像总体色相数是关于整幅图像色彩出现数目的一个统计,虽然今天大多 数的人工图片已经在颜色的丰富程度能够与自然照片相比,然而还有很多不强 调真实感的人工图片,他们的颜色相对来说还是比较单调( 见图3 - 2 ) ,因此可 以用图像总体的色相数来描述色彩丰富程度,以作为人工图片与自然照片的一 个区分特征。 图像总体色相数的获取算法如下: 输入:图像的色相矩阵h 输出:图像的总体色相数g l o b a l h u e n u m ( 1 ) 获取h 的立方图h i s t ; ( 2 ) 把h i s t 进行分段统计,得到每段色相数c o l o r n u m ; ( 3 ) 设置有效色相阂值t h r e s h o l d 为图像像素总数的千分之五 ( 4 ) 对每个分段,如果c o l o r n u m t h r e s h o l d ,则记为一个有效色相, g l o b a l h u e n u m 加一 ( 5 ) 统计完所有分段获得g l o b a l h u e n u m 其中,考虑到整幅图像的数据量比较大,相应的总体色相数的取值范围却 比较小,因此一个干扰像素则可能产生新的色相计数,为了防止类似的干扰, 我们设置了有效色相的闽值。 另外,对h i s t 进行分段统计的作用是为了识别扫描的人工图片和提高3 d 图片的识别率。 扫描的人工图片从图像的性质上应该归于真实照片,如果精细的计算这类 图像的色相数,将发现它与真实的自然照片分布情况相当类似。这是因为扫描 仪受到实际印刷物的材质影响,即使是在同一色块上邻近像素的色相,采样的 时候还是有些微差别,不能保证样。然而目前在互联网的广泛存在的人工图 片有相当大的一部分是通过扫描印刷品获得的,例如是在杂志上的卡通图片等 等,如果把这类图片归于人工图片,则我们的区分算法的作用就不大了。为了 避免这种情况,我们对色相数进行分段计算,使得只有些微差别的色相归为一 类。这样,印刷的人工图片将会像其源图像一样,色相集中到几个比较大的种 计算机科学系硕l 学位论文区分真实照片和人工图片的算法与实现 类当中,与自然照片产生了差别。 3 d 图片的情况类似,只不过它的邻近像素色相变化是连续的,而不是随机 的。通过分段计算,把这些变化的色相都归在一起,同样可以得到其集中情况。 最后得到的总体色相数,一般来说,人工图片的色相数可能会较小,而真 实照片的总体色相数可能会较大。然而,随着目前人工图片制作技术的提高, 人工图片的颜色也在不断地丰富( 图3 3 总体色相数为4 8 ,与图3 - 4 的总体色 相数5 3 相当) ,这样就要求我们有更精细的特征参数,因此我们进行了图像分 片色相平均值的提取。 图3 - 2 一幅简单的人工图片 计算机科学系颐士学位论文区分真实照片和人工图片的算法与实现 图3 3 一幅复杂| ;q 人工图片 3 2 1 0 图像分片色相数 图3 4 一幅普通的真实照片 图像分片色相数是关于图像局部出现色相数的平均统计。虽然目前大量的 计算机科学系硕士学位论文 区分真实照片和人工图片的算法与实现 人工图片的总体色相数已经达到自然照片的程度,然而要在整幅图像的处处达 到与自然照片类似的色相数就少多了。这涉及到人工图片的制作成本问题,在 制作人工图片,尤其是制作高度仿真的人工图片时,往往要进行多种的渲染计 算,包括光照、衰减、纹理、雾化、n 混合等等,还有多种图像优化的计算, 包括抗锯齿、透视角修正等,每种渲染及优化计算都需要消耗大量的运算成 本,而使用者的注意力也就只放在图片的主题上,因此在全图范围内进行仿真 就显得过于奢侈,也没有必要。基于这样的原因,人工图片在非主题的大多数 范围内都是使用比较简单的纹理图案代替。然而真实照片则不同,其上面所有 的光照、纹理等效果都是自然形成的,无须计算生成,因此在真实照片的每一 个角落都可能隐藏着复杂的纹理结构。所以,当具体到图像的局部,真实照片 和人工图片的色相数目将有较大的差别,具体来讲,人工图片的分片色相数较 少,而真实照片的要多。 具体的图像分片色相数的提取算法: 输入:图像的色相矩阵h 输出:图像的分片色相数b l o c k h u e m e a n n u m ( 1 ) 设置图像分片大小 ( 2 ) 对于图像的每一个分片h b l o c k ( 3 )获取h b l o c k 的立方图h i s t ; ( 4 ) 把h i s t 进行分段统计。得到每段色相数c o l o r n u m ; ( 5 )对每个分段,如果c o l o r n u m 0 ,则记为一个有效色相,该分片的 色相数b l o c k n u m 加一 ( 6 ) 统计完分片的所有分段获得该分片色相数b l o c k n u m ( 7 ) 合计所有分片的色相数得到t o t a l h u c n u m ( 8 ) 图像的分片色相数b l o c k h u e m e a n n u m = t o t a l h u e n u m 图像分片数 其中对色相立方图进行分段统计的原因与上述的一样,但是在计算有效的 色相数目时没有设置色相阂值,这是因为相对来说,图像分片的数据量比较小, 个干扰点只能影响一个分片,当分片比较小,数目比较多时,干扰点所起的 作用有限。 图像的分片大小将较大的影响计算结果。随着分片的增大,人工图片的分 2 1 生塑垫型兰墨堡圭兰堡堡茎 垦坌塞兰墨苎! ! ! 生翌苎堕墨鲨! ! ! ! 翌 片色相数将迅速增大,面真实照片的将趋于稳定,相反的,随着分片的变小, 真实照片的分片色相数将降低,而人工图片的降低却比较缓慢。在这两个极端 都使得两种图像的分片色相数趋于近似,而无法区分。 3 2 i i 图像色相数总体分片比 月k 巴兜n 把。g l o b a l h u e n u m b l o c k 圩 e m e a n n u m 虽然图像总体色相数和分片色相数是从不同的角度来进行图片区分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论