




已阅读5页,还剩55页未读, 继续免费阅读
(通信与信息系统专业论文)基于ucl的数字图像内容管理技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
西南科技大学硕士研究生学位论文第1 页 摘要 随着数字图像资源的日益增多和网络承载的各种多元化属性需求不断增 加,由此带来的复杂性使得数字图像资源难以有效管理,究其原因是现有的 对数字图像识别管理方法大多停留在图像的底层特征上,忽略了图像的语义 信息,从而导致了信息孤岛难于理解和相互分离。论文从数字图像的内容语 义出发,建立基于u c l 的数字图像内容管理体系,从而更加高效的管理海量 数字图像资源。 基于此,本文首先对数字图像进行语义标引,建立统一的元数据框架, 形成规范的管理机制。依据此框架对数字图像语义标引信息进行综合管理。 其次,重点研究了基于u c l 标引的数字水印安全管理方法。该方法将u c l 标引信息作为水印信息嵌入载体数字图像当中,建立数字图像水印模型。在 此模型中,采用对初值敏感性较高的混沌序列对标引信息进行混沌加密,同 时采用d w t 和d c t 相结合的数字水印算法,使不可见性和鲁棒性达到了平 衡。实验结果表明,本方法能够较好的抵抗椒盐噪声、低通滤波以及j p e g 压缩攻击,具有较好的鲁棒性和抗攻击性,安全性较高。 最后,针对数字图像语义之间的相关性,以及用户对数字图像语义概念 定义的随机性和模糊性,提出了基于云模型( c l o u dm o d e l ) 的数字图像语义 表示方式,并构建语义向量空间。在此空间中,通过计算云模型语义确定度 ( s e m a n t i cc l a s sc e r t a i n t yd e g r e e ,s c c d ) ,来完成对数字图像的语义分类。 为高效准确的利用s c c d 分类的经验知识,构建了基于数字图像语义的云模 型支持向量机分类方法( c l o u ds u p p o r tv e c t o rm a c h i n eb a s e do ni m a g e s e m a n t i c ,c s v m i s ) 。该方法不但对多语义分类效果明显,同时可以消除 样本的拒分现象。仿真结果表明,c s v m - i s 分类性能明显优于当前典型的 n e s t i n ga l g o r i t h m 。 关键词:u c l 语义标引数字水印安全管理语义类确定度 语义分类 西南科技大学硕士研究生学位论文第1 l 页 a b s t r a c t w i t ht h ev o l u m eo fd i g i t a li m a g er e s o u r c e sa n dt h er e q u e s t sf o rt h ed i v e r s i t y o fq u a l i t yo fs e r v i c e si n c r e a s i n g ,i th a sb e c o m em o r ec o m p l e xa n dd i f f i c u l tt o m a n a g ed i g i t a li m a g er e s o u r c e si nn e t w o r k s t h ek e yr e a s o ni st h a tt h ee x i s t i n g w o r kh a sb e e nf o c u s e do nt h el o w e r - l e v e lf e a t u r e so fi m a g er e s o u r c e sa n dh a sn o t b e e nt a k e nal o o ka tt h es e m a n t i ci n f o r m a t i o n ,w h i c hr e s u l t si nt h es e p a r a t i o no f t h ei n f o r m a t i o ns i l o s t ot a c k l et h i si s s u ea n dt om a n a g et h ed i g i t a l i m a g e r e s o u r c e se f f e c t i v e l y , ad i g i t a l i m a g em a n a g e m e n ts y s t e mb a s e do nu c l ( u n i f o r mc o n t e n tl o c a t o r ) i sp r o p o s e df r o mt h ep e r s p e c t i v eo f s e m a n t i c s f i r s t l y , au n i f o r mm e t a - d a t af r a m e w o r ki sb u i l tu pb ym e a n so fs e m a n t i c i n d e x i n go ft h ed i g i t a li m a g er e s o u r c e s m e a n w h i l e ,an o r m a t i v em a n a g e m e n t m e c h a n i s mi sd e v e l o p e dt os y s t e m a t i c a l l ym a n a g et h ei n d e x e di n f o r m a t i o no f t h e d i g i t a li m a g er e s o u r c e s s e c o n d l y , as e c u r i t ym a n a g e m e n tm e t h o d f o rd i g i t a l w a t e r m a r k i n g i s p r o p o s e db a s e do nu c li n d e x i n g t h i sm e t h o d e m b e d st h eu c li n d e x i n g i n f o r m a t i o na sw a t e r m a r ki n t ot h eo r i g i n a li m a g ea n de s t a b l i s h e sad i g i t a li m a g e w a t e r m a r km o d e l i nt h em o d e l ,t h ei n d e x e di n f o r m a t i o ni sc h a o t i c a l l ye n c r y p t e d w i t hc h a o t i cs e q u e n c e sw h i c ha r es e n s i t i v et oi n i t i a lv a l u e ,a n dat r a d e - o f fi s a c h i e v e dt ob a l a n c et h ei n v i s i b i l i t ya n dr o b u s t n e s so fd i g i t a lw a t e r m a r k b ym e a n s o ft h ec o m b i n a t i o no fd w ta n dd c t t h ee x p e r i m e n t ss h o wt h a tt h i sm e t h o d e x h i b i t sas t r o n gr e s i s t a n c et os a l t & p e p p e rn o i s e ,l o w - p a s sf i l t e r i n ga n da t t a c k s l i k ej p e gc o m p r e s s i o na t t a c k s ,a n db u i l d sah i g hl e v e lo fr o b u s t n e s s f i n a l l y , b yo b s e r v i n gt h ec o r r e l a t i o no fd i g i t a li m a g es e m a n t i c sa n dt h e r a n d o m n e s sa n df u z z i n e s so ft h es e m a n t i cc o n c e p t sd e f i n e db yu s e r s ,ac l o u d m o d e lb a s e dd i g i t a li m a g es e m a n t i cr e p r e s e n t a t i o na p p r o a c hi ss u g g e s t e da n da s e m a n t i cv e c t o rs p a c ei sc o n s t r u c t e d i nt h i ss p a c e ,d i g i t a li m a g ec l a s s i f i c a t i o ni s i m p l e m e n t e do nt h eb a s i so fs e m a n t i cc l a s sc e r t a i n t yd e g r e e ( s c c d ) i n a d d i t i o n ,a na p p r o a c hn a m e da sc l o u ds u p p o r tv e c t o rm a c h i n eb a s e do ni m a g e s e m a n t i c ( c s v m i s ) i sd e v e l o p e dt oe f f e c t i v e l ya n da c c u r a t e l yu t i l i z et h e e x p e r i e n c e s a n dk n o w l e d g es c c dp r o d u c e d t h i sa p p r o a c hc a nm a k et h e c l a s s i f i c a t i o nm o r ee a s i l ya n da l s oc a ne l i m i n a t et h er e j e c t i o no fc l a s s i f i c a t i o no f 西南科技大学硕士研究生学位论文第l li 页 t h es a m p l e s e x p e r i m e n t ss h o wt h a tc s v m i si ss u p e r i o rt ot h ep r e s e n tt y p i c a l n e s t i n ga l g o r i t h mi nt e r m so fc l a s s i f i c a t i o n k e yw o r d s :u c ls e m a n t i ci n d e x i n g ;w a t e r m a r k i n gs e c u r i t ym a n a g e m a n t ; s e m a n t i cc l a s sc e r t a i n t yd e g r e e ( s c c d ) ;s e m a n t i cc l a s s i f i c t i o n 西南科技大学硕士研究生学位论文第l 页 1 绪论 1 1 课题研究背景与意义 随着网络科技的发展和用户数量的不断增多,海量级、碎片化的数字图 像资源增加了人们获取有效信息的时间和成本。现有的数字图像资源在网络 源端的标引、网络传输和终端解析均存在内容管理混乱、分级管理不完善和 用户需求无法满足等诸多问题,究其原因是没有建立统一的内容标引及语 义解析机制。为了应对数字图像资源在网络中大幅度增多的现状,提高数字 图像的可信可控度,迫切需要对其进行语义理解和内容管理。 为了解决对日渐庞大的图像的管理和迅速的搜索的矛盾,动态图像专家 组( m o v i n gp i c t u r e se x p e r t sg r o u p m o t i np i c t u r e se x p e r t sg r o u p ,m p e g ) 提 出m p e g 7 他1 标准,该标准对数字图像等数据的含义进行了一定程度解释,但 是它并未对数字图像的内容进行语义理解。同样,m p e g 2 1 1 3 ,多媒体框架描 述的出现和发展致力于解决大范围网络上透明传输和对多媒体资源不断扩展 的问题。不过,m p e g 2 1 只定义了多媒体的描述框架,并没有从用户的角度 定义其语义字段,同时也未对数字图像涉及到的内容进行语义描述和标引, 因此它的应用和推广受到了一定的限制。 因此新一代网络迫切需要建立统一的,以为用户提供个性化服务为宗旨 的数字图像内容管理机制,为三网融合的实现提供一定的理论基础。 1 2国内外研究现状 数字图像的内容管理主要涉及语义标引、语义的安全传输以及数字图像 的语义分类三部分。 1 2 1语义标引技术 语义的标引技术是沟通数字图像底层特征和高层语义信息之间的桥梁, 是缩小语义鸿沟的重要手段,在图像检索,生物医学,数字图书馆等诸多方 面得到了广泛的应用和推广。 传统的图像的标引技术一般分为基于有限集的图像标引方法和基于互联 网数据集的图像标引方法两类。 ( 1 ) 基于有限集的图像标引方法 西南科技大学硕士研究生学位论文第2 页 在基于有限集的图像标引算法中,由d u y g u l u 于1 9 9 3 年提出的基于机器 翻译的图像标引算法一直占有举足轻重的地位。该方法将图像的标引过程看 成是一种机器翻译的过程,即首先把每幅图像经过分割划分几个区域,再利 用聚类方法将每个区域的特征进行类别的划分并用视觉词汇组成的向量来表 示,最后通过建立视觉词汇与标引词汇之间的联系实现图像的标引。 如果将每一个标引词作为一个类别,并对每一个词汇训练一个二元分类 器,这样就将图像标引的问题转化为图像的分类问题来解决。有很多方法如 贝叶斯点估计( c h a n ge ta l ,2 0 0 3 ) ,、2 d m h m m 模型( l ie ta l ,2 0 0 3 ) m 、支 持向量机( c u s a n oe ta l ,2 0 0 3 ) ,等进行图像标引工作。但是由于这种方法需 要训练大量的分类器,而且在训练集中需要手工标引图像区域信息,所以很 难推广到类别数目较多的情况。 跨媒体相关模型( c r o s s m e d i ar e l e v a n c em o d e l ,c m r m ,j e o ne ta l ,2 0 0 3 ) n ,的核心思想在于建立图像内容和标引词之间的概率相关性,找到一组语义 概念使之与图像内容之间的条件概率最大,这组语义概念就是最后的标引结 果。c m r m 充分考虑到词汇在整个训练集上的全局统计特性和概率估计,该 模型一经提出,很多模型在其基础上进行和改进和演变,取得了相对较好的 结果。 人们在基于隐变量模型( l a t e n ts e m a n t i c a n a l y s i s ,l s a ) 的基础上提出了 概率潜在语义分析( p r o b a b i l i s t i cl a t e n ts e m a n t i ca n a l y s i s ,p l s a ) ,该模型假 设有一些变量z ,词与文档之间的关系通过隐变量进行表述。m o n a ye t a l ( 2 0 0 3 ) 引首先将l s a 和p s l a 引入到自动图像标引当中,但由于带有隐变量 的生成式模型一般较为复杂,需要估计的参数数目较多,因此该方法没有得 到很好的推广使用。 虽然基于有限数据集的方法可以借鉴机器学习、计算机视觉和物体识别 等各种新技术,然后在实际应用中,这种方法的数据集比起互联网上的大规 模数据非常小,导致训练图像的规模和标引词集合都非常有限,难以大范围 的推广。 ( 2 ) 基于互联网数据集的图像标引方法 由于互联网上的数字图像资源日益丰富,研究人员开着着手从互联网的 庞大数据集中寻找解决问题的新思路,使得很多以往由于资源和数据受限而 不能解决的问题有了突破口。 互联网的图像一般内嵌于某个网页当中,这些网页会包含各种文本信息, 例如文件名、u r l 、锚文本( a n c h o rt e x t ) 、a l t 标签文本以及图像周围的 西南科技大学硕士研究生学位论文第3 页 环绕文本等,都可以给图像内容提供语义上的一些辅助信息。 随着互联网图像共享社区的普及使得普通用户可以上传自己的图像与他 人分享,此外,还可以为图像添加一定的标引词汇以反映他们对图像的看法 和理解。这些网站包括f l i c k r 、p h o t o s i g 、t r e k e a r t h 、y u p o o 等。近年来,很 多研究工作也都尝试挖掘这些社区网上丰富的用户数据,如m i t 的l a b l e m e ( r u s s e le ta l ,2 0 0 5 ) ,c m u 的e s p ( l u i se ta l ,2 0 0 4 ) 等提供用户在线完成图 像的人工标引,g o o g l e 的i m a g el a b e l e r 也是通过用户的参与来实现图像的 标引。 a n n o s e a r e h ( w a n ge ta l ,2 0 0 6 ) f 是最早基于互联网数据集对图像标引的 工作之一,其核心思想是:对于一个待标引的图像,在一个较大的数据集中 找到一幅或几幅与它相近的图像,再从这些相近的图像标引当中学习出最终 的标引词。 基于搜索的图像标引算法s b i a ( w a n ge ta l ,2 0 0 6 ) 也是一个基于互联网 数据集的图像标引算法,s b i a 良好的弥补了a n n o s e a r e h 需要提供初始关键 词的的局限,从数据库中找到与待标引图像视觉内容最相似的图像,然后从 该图像的标引词当中学习出最后的标引词。 在基于互联网数据集的图像标引工作中,由于标引词的选取很大一部分 都是从周围文本当中选取,因此导致最终标引词的噪声较大,即很多次可能 与图像描述毫无语义关联。r u ie ta l ( 2 0 0 7 ) 叫等提出一种基于互联网数据集 的图像标引框架,针对有噪声的文本通过基于搜索的标引词扩展,找到语义 相关的标引词,再利用二分图加强的原理对标引词汇进行重新排序以获得良 好的标引效果。 尽管数字图像的标引在不断的演进,但是仍然缺乏简单有效的、系统的 整体设计。因此需要寻求行之有效的解决方案。由此,李幼平院士受到都 柏林核心元素数据体系结构和w e b 核心技术一一u r l 定位方法的影响提出 一种在信息的文件层进行信息的理解的标引方法,( u n i f o r mc o n t e n tl o c a t o r , u c l ) ,其目标是实现网络信息资源的“个性化按内容主动服务”。u c l 技术 如今已经引起人们的重视,很快就会在国家文化网格、国家数字媒体网格和 全国文化信息资源共享工程等方面得到应用。 中国工程物理研究院电子应用研究所和计算机技术研究所是最早开展对 u c l 的研究工作,他们研究的主要内容是u c l 的理论框架。研究工作者有 高杨博士2 1 和马卫东博士n 引等。2 0 0 4 年,马建国教授 完整的提出了具有内 容理解的信息服务系统中u c l 的实验框架,完成了u c l 的多映射机制、信 西南科技大学硕士研究生学位论文第4 页 宿端的u c l 解析等实验室验证,为u c l 实用化奠定了深厚的基础。近年来, 网页、音视频等多媒体资源的语义标引技术也得到了广泛的应用| 1 5 1 6 , 1 7 | 0 尽管u c l 技术的研究正在引起人们的重视,并取得了一些研究成果,但 是要真正实现语义理解的内容定位却是一项复杂而浩大的工程,需要受到更 多的关注和研究力量的加入。 1 2 2 数字水印技术 数字水印技术是信息隐藏技术领域的重要分支,是现阶段多媒体资源对 版权实施保护的有效方法,它已经逐渐成为信息安全领域的一个研究热点。 数字水印技术一般是将某些有意义或者无意义的信息流嵌入到数字多媒体对 象中,从而达到版权证明,侵权跟踪等目的。 1 9 9 3 年a z t i r k e l 等所撰写的“e l e c t r o n i cw a t e rm a r k n 引一文中首次使 用了“w a t e rm a r k 这一术语。这标志着数字水印技术作为一门正式研究学 科的诞生,后来逐渐使用w a t e r m a r k 或者d i g i t a lw a t e rm a r k 来表示“数字水 印 。 1 9 9 4 年,v a ns c h y n d e lrg 等提出了修改图像l s b 位平面的数字水印嵌入 方法1 9 ,该方法采用替换方式将数字水印嵌入到宿主图像数据的最不重位, 其优点是数字水印隐蔽性较好,但是鲁棒性差。为了提高水印的鲁棒性,1 9 9 5 年c o x t :* ,等人提出了一种基于扩频通信的思想,将水印嵌入图像感知上最重要 的频域因子中的水印方案,实验结果表明,该方案对各种普通图像处理操作 有很好的鲁棒性,c o x 方案已经成为水印技术中一个比较经典的方案,其主 要缺陷是水印的提取过程必须有原始图像的参与。后来,c o x 提出的算法首 次指出了数字水印鲁棒性与频域系数选择的关系,在数字水印技术的发展进 程中具有重要意义。1 9 9 8 年,z e n g 等他提出基于分块d c t 的数字水印方法, 用一个密钥随机地选择图像的一些子块,通过在频域的中频上调制一个三元 组来嵌入二进制数字水印序列。该方法在中频分量中嵌入数字水印,兼顾了 数字水印隐蔽性和鲁棒性,具有了对有损压缩和低通滤波等攻击的鲁棒性。 d e e p ak u n d u r 等提出小波变换域图像数字水印算法他”,将图像和数字水印分 别做小波分解,根据视觉特性进行数据融合,不足之处在于提取数字水印时 需要原始宿主图像。 在数字水印的发展过程中,人们不断尝试将新的理论和方法引入到这一 领域,以期改善数字水印技术的性能。为了增强数字水印对几何变换攻击的 抵抗能力,基于不变矩的图像归一化方法、应用分形、混沌、数学形态学、 西南科技大学硕士研究生学位论文第5 页 奇异值分解等理论嵌入数字水印技术。1 9 9 9 年,k u t t e r 他引等提出了“第二代 数字水印”的概念,突破了以往将数字水印嵌宿主信号最不重要部分的思想 栓桔,推动了数字水印技术的发展。图像数字作为数字水印技术的“摇篮 , 孕育了很多具有普遍意义的方法,为其它媒体形式数字水印技术的研究及应 用奠定了基础。 国内近年来已有不少研究所和大学开展了对数字水印技术的研究,如中 科院自动化研究所的模式识别国家重点实验室、清华大学、哈尔滨工业大学 等。数字水印的研究已经引起了多种学科研究人员的兴趣和关注。同时,为 数字水印技术专门研究的软件工具包也已经开始被广泛的使用,例如对数字 水印进行攻击实验的工具包s t i r m a r k 他”。我国成功加入w t o 为国内的版权保 护增加了压力,同时也给数字水印技术的发展提供了动力和机遇。因此开展 数字水印技术及其应用的研究具有重要的现实意义。 1 2 3 数字图像自动分类 对于数字图像的自动分类,一般分为基于生成模型( g e n e r a t i v em o d e l ) 的方法和基于判别模( d i s c r i m i n a t i v em o d e l ) 的方法两大类。生成模型主要 是对每个类别在特征空间中的分布分别进行建模,而判别模型则是针对不同 类别在特征空问中的分布差异进行建模m ,。 ( 1 ) 基于生成模型的图像分类方法 在基于生成模型的图像分类方法中,高斯混合模型( g a u s s i a nm i x t u r e m o d e l ,g m m ) 是一类常用的分类模型。v a i l a y a t 2 引用g m m 模型对图像特征 进行建模,并使用贝叶斯分类器对图像进行层次分类。此方法将每一幅图像 表示为图像中提取的一个特征向量,并将特征向量矢量量化生成码本向量, 最后将码本向量对应的g m m 模型来表示每类图像的条件概率,最后使用贝 叶斯准则进行分类。 随着图像词袋特征的出现,各种主题生成模型被广泛应用于图像分类中, 并取得了良好的效果。s i v i e 、q u e l h a s 和b o s c h 等人幢,”- 拍瑚,分别提出采用p l s a ( p r o b a b i l i s t i el a t e n ts e m a n t i e a n a l y s i s ) 模型0 1 来进行图像分类,具体的做法 是:首先将图像类别作为隐含主题,然后利用p l s a 方法从图像特征中自动 发现这些隐含的图像主题,最后进行分类。l i 等使用改进的l d a ( l a t e n t d i r i c h l e ta l l o c a t i o n ) 模型n 1 1 来解决自然场景图像的分类问题。由于主题生成模 型是受到文本分类的启发而构建,因此应用于图像领域时通常需要采用离散 的视觉单词。为了更好地适应图像数据连续性的特点,h o r s t e r 提出了一个连 西南科技大学硕士研究生学位论文第6 页 续视觉单词模型”,并使用连续局部特征矢量的分布来对视觉单词分布建模。 实验结果表明,基于连续视觉单词模型的方法要明显优于基于离散视觉单词 模型的方法。然而,上述主题分析模型只是考虑到图像中可能出现的所有主 题,却并没有考虑主题的空问分布情况。为此,f e r g u s 3 3 过平移和尺度不变 的方式来扩展了p l s a 模型以包含主题空间信息,同时l i t 3 等通过旋转不变 的方式进行了扩展。l i u 5 1 通过图像之间的对应关系( c o r r e s p o n d e n c e ) 为主 题模型加入空间约束信息。z h a n g n 盯则将图像表示为一个矩阵,矩阵中的元素 表示了在不同尺度范围内视觉单词出现的情况。他们将图像集合表示为一个 三阶张量,然后根据这一表示对p l s a 模型进行扩展,进而利用利用张量对 数据维数的处理能力,最大程度的对图像进行分类。 随着研究的不断深入,文本分析中的语言模型( l a n g u a g em o d e l i n g ) 也 被应用于图像分类中。w u 协提出了一个基于视觉语言模型的图像分类方法, 该方法先将图像描述为一个视觉单词的矩阵,然后假设每个视觉单词都是在 局部区域中彼此独立,并且条件依赖于它近邻的视觉单词。对于每一类图像, 利用视觉单词和近邻信息构建相应的视觉语言模型,并以此进行图像分类。 根据所采用近邻个数的不同,在上述方法中采用的三类常用的模型分别为 u n i g r a r n 模型、b i g r a m 模型和t r i g r a m 模型。与之类似,t i r i l l y 啼町也提出了一 种新的图像表示一一视觉语句( v i s u a ls e n t e n c e s ) ,通过加入简单的空间信息 来构成相应的“句子,从而利用这些句子来进行分类。 ( 2 ) 基于判别模型的图像分类方法 在基于判别模型的图像分类方法中,核方法是一类应用最广泛的方法。 核方法应用的关键问题在于定义图像之间的距离或者相似度的计算方法。理 想情况下,该距离度量不但能够获得图像外观之间的不同,而且能够空间结 构上的差异也能够通过距离度量获得。核函数会由于距离度量计算方式的不 同产生较大差异,晟终基于该核函数构建的分类器性能也会存在较大差距。 早期的基于支持向量机( s v m ) 图像分类方法都是将图像作为一个整体, 直接用图像全局特征之间的欧式距离来构建核函数t 3 9 , 4 0 , 4 | , 4 2 , 4 3 ,。随后这一方法也 被应用于词袋特征中。c s u r k a 和d a n c e 等人引最先在图像分类中采用词袋特 征,并且应用s v m 分类器来解决图像分类问题。 随着技术的发展,利用空间结构来定义距离向量备受关注。该类方式中 最著名的空间金字塔匹配核( s p a t i a lp y r a m i dm a t c h i n gk e r n e l ,s p m ) h ”。空间 金字塔匹配核是一种简单而有效的计算图像间相似度的方法,与其他核函数 相比具有优越的性能。l i n g h 引利用“视觉单词对 定义了近邻分布核( p r o x i m i t y 西南科技大学硕士研究生学位论文第7 页 d i s t r i b u t i o nk e r n e l ,p d k ) 用于图像分类。l i u n 则在s p m 核的基础上进一 步提出了同时对特征和空间进行划分的f e s c o ( f e a t u r ea n ds p a t i a lc o v a r i a n t ) 核。但以上三种方法均没能充分利用图像的特征点集在特征空间中表现出来 的结构特性,因此逐渐被淘汰。 b o o s t i n g 算法作为一类高效的判别模型也被应用于图像分类任务中。 o p e l t t 圳提出使用b o o s t i n g 算法从所有图像局部特征集合中找出一个有效的特 征向量集合,并且将该集合融合到线性分类器中用于图像自动分类。z h a n g f ”, 也提出了相似的方法,不同之处在于他的方法中使用的是分层b o o s t i n g 算法。 ( 3 ) 基于混合模型的图像分类方法 由于生成模型和判别模型各自均有优缺点,因此基于生成模型与判别模 型相混合的分类方法应运而生。h o l u b 等人们提出将星云模型与支持向量机 相结合进行图像分类,通过计算星云模型的f i s h e r 代价联合生成模型与判别 模型进行分类。p e r r o n n i n 提出了一种f i s h e r 核来进行图像分类,该f i s h e r 核框架同时利用了生成和判别模型方法,首先用生成模型对信号的生成过程 进行建模,然后根据在生成模型所得概率密度函数上的梯度矢量对信号进行 描述,最后利用判别模型来完成分类。b o s c h 等人引提出采用基于生成模型 和判别模型相结合的方法进行场景分类,该方法首先利用p l s a 模型学习图 像的码本分布和主题分布,然后将图像用所有主题出现的概率作为图像特征, 最后对该特征应用判别分类模型( 如支持向量机或k 近邻算法) 来进行学习 和分类。 一般来说,生成模型的扩展能力较强,能够通过构建合适概率的模型完 成对类别数据的描述和判断,并且能够在样本数量较大时得到良好的效果。 但是,由于其计算复杂度与模型的复杂程度正相关,即模型描述能力提高的 同时,参数的数量也随之增加,进而容易增大计算开销。因此,模型复杂度 的构建就成了生成模型当中最重要也亟待解决的问题。对于判别模型而言, 其通常具有良好的泛化保证,计算简单的同时误差较低。但是,判别模型通 常只考虑单一的图像特征,不能解决多种特征的分类问题,因此,在提高分 类准确性的同时如何融合多种图像特征进行分类都有待于进一步研究。 1 3课题来源 本课题来源于国家自然科学基金“新一代广播网的语义计算与内容机制 研究 ( 项目编号:6 0 9 0 2 0 2 1 ) 和国家重点基金项目“非对称广域覆盖信息 西南科技大学硕士研究生学位论文第8 页 共享网络理论与技术研究 ( 项目编号:6 0 9 3 2 0 0 5 ) 。 1 4 论文主要研究内容和结构安排 本课题以数字图像的语义信息为基点,试图解决数字图像信息缺乏语义 标识、难以统一管理的问题,并完成语义信息从网络源端到终端的安全传输, 建立基于语义的、高效的数字图像内容管理体系,更加有序地管理海量数字 图像资源。论文分为网络源端,网络传输,网络终端三个部分来考虑数字图 像资源的内容管理,其主要研究内容如下: ( 1 ) 数字图像语义标引规范 , 在网络源端对数字图像进行语义标引是数字图像内容管理的基础。论文 选择对数字图像资源的形式及内容特征进行分析、选择和记录,根据图像语 义的有效描述方式,采用u c l 技术形成一个规范完善的数字图像语义描述框 架。 ( 2 ) 构建数字图像水印模型 在网络传输过程中,将标引形成的语义信息作为水印嵌入到载体图像当 中,建立数字图像语义安全管理框架,完成语义信息在网络中的安全传输, 并能根据语义信息对网络中的数字图像进行监测和管理。主要解决的问题为: 第一,如何在不影响可视化效果的情况下完整的将语义信息嵌入到载体图像 中,并有较好的鲁棒性和抗攻击性。第二,嵌入的语义信息要能较为简单的 被检测和提取,方便对数字图像的监督和管理。 ( 3 ) 建立c s v m ,i s 分类模型 对网络终端接收到的大量数字图像,通过云模型语义确定度分类算法对 数字图像进行语义分类管理,并将产生的经验知识用来训练c s v m i s 模型, 完成数字图像的自动分类,最终完成基于语义理解的数字图像内容管理。 根据研究内容,论文共分为四个章节,具体的内容结构安排如下: 第一章,绪论。简要介绍论文研究的背景和意义,并概述了课题相关技 术的研究现状以及本文的研究内容。 第二章,介绍了论文相关概念的u c l 理论、数字图像水印技术以及云模 型基本理论。本章根据数字图像内容管理的需要,分析了数字水印这一语义 信息安全传输方法,同时介绍了数字图像语义分类所要用到的云模型理论知 识。以上理论是全文研究的重要理论与技术基础。 第三章,对现有的的数字水印算法进行分析研究,构建数字图像语义安 西南科技大学硕士研究生学位论文第9 页 全传输的数字水印框架,并在此基础上提出了一种适用于本文中标引信息传 输的数字水印算法。主要研究了标引信息的预处理处理,水印信息的生成, 以及水印的嵌入和提取,并进行一系列的攻击实验验证该算法的鲁棒性和抗 攻击性。 第四章,提出了基于云模型的s v m 图像语义分类研究。通过云语义确 定度分类算法对数字图像进行语义分类管理,并将产生的经验知识用来训练 支持向量机,以实现数字图像语义的自动分类,从而完成数字图像的内容管 理。 西南科技大学硕士研究生学位论文第1 0 页 2数字图像内容管理相关技术研究 内容一般指的是对任何类型的数字信息的结合体,例如文本、图形图像、 w e b 页面、业务文档、数据库表单,音视频文件等各种结构化数据、非结构 化文档等信息的聚合:管理就是施加在“内容 对象上的一系列处理过程, 包括收集、确认、整理、定位、转换、分发、更新、存档等,目的是为了“内 容 能够在正确的时间、以规范的形式传递到正确的地点和人。 论文涉及的数字图像的内容管理,是指对数字图像资源进行语义的标引 和安全传输,最终依据标引信息将数字图像准确分类。本章从相关理论基础、 数字图像的内容管理框架两个方面来阐述基于u c l 的数字图像内容管理机 制。 2 1相关概念 2 1 1 u c l 概念 u c l ( u n i f o r mc o n t e n tl o c a t o r ) 副即“统一内容定位”由中国工程院李 幼平院士提出,是在数据广播网络平台( 如有线电视h f c 网) 及i p 交互网 络平台( 如互联网) 上实现信息资源组织管理的创新技术理念,其目标是实 现网络信息资源的“个性化按内容主动服务 。u c l 技术的目的是解决网络 信息资源的发现、查找、识别、传输、控制和主动服务等问题。 在网络信息空间中,可采取以下两种方法定位某条信息:按地址定位和 按内容定位。目前,互联网上普遍采用的是“按地址定位”,即u r l ,但这 个并不是真正的“资源定位 。因为按照地址定位的方式仅适合交互式网络, 并不具有人性化,它不能直接按照用户指定的所需信息,而只能首先取得信 息的u r l ( 链接、搜索路径) 后,再遵循该路径获取资源。显然,该方法不 能保证获取信息的正确率,同时获取资源的时间也无法正确估量。另一种信 息资源的定位方式是按内容定位,它是信息提供者与用户之间一种较为有效 的直接沟通。信息提供者通过u c l 技术对内容进行标引,获取用户获取资源 的需求意向,同时用户根据语义关系指定并获取所需资源内容,从根本上改 变了用户在浩瀚的信息资源中艰难寻找所需信息的局面,变“人找信息 为 “信息找人 。 是语义标引是指给图像给出标准化标引信息的过程,根据数字图像的具 体特征提出u c l - i ( u n i f o r mc o n t e n tl o c a t o rb a s e do ni m a g e ) 概念,这些信 西南科技大学硕士研究生学位论文第1 1 页 息能够准确反映出数字图像的本质特征,并能方便的利用此标引信息对图像 进行管理。 本文将使用元数据实现对数字图像语义的建模。元数据的定义有广义定 义和狭义定义之分。元数据的广义定义是- “关于数据的数据( d a t aa b o u t d a t a ) 或“关于数据的结构化数据 。元数据的广义定义简洁而且宽泛。 元数据的狭义定义是:描述某种类型资源( 或对象,o b j e c t ) 的属性, 并对这种资源进行定位和管理,同时有助于信息检索的信息。它特指在标记 语言环境下,对网络信息资源进行描述的解决方案,主要支持对网络信息资 源的发现、存储、管理和检索利用。 。 在设计数字图像内容标引框架之前,有必要先研究近年来在国际上影响 较大的各种元数据规范,找出其中在标引数字图像信息资源的不足之处,加 以改进和完善,构造适用于静态数字图像的内容标引框架。目前,教育和多 媒体领域元数据标准如下表所示: 表2 - 2教育和多媒体领域元数据标准 t a b 2 - 3m e t a d a t as t a n d a r d so fe d u c a tio na n dm uitim e dia 本文对上述各项标准进行了分析对比,m o a 2m e t a d a t a 一般多用于艺术 类图像资源的元数据描述;c d l m c t a d a t a 的描述方式则过于复杂,不利于实 现数字图像标引的简明扼要的目的;r l g 则由于其较为注重反映图像的原始 特征,而导致适用性不强;除此之外,这些标准均未考虑到数字图像的语义 层面,即图像描述的具体内容。例如本文件作者是谁,属于知识分类学科中 的哪个子域;该数字图像能够表达作者怎样的初衷,映射出何种社会现象等 等。 西南科技大学硕士研究生学位论文第1 2 页 因此,参考国家数字图书馆工程标准规范项目研制成果晦”,本文制定了 适用于本文涉及的数字图像内容管理技术的数字图像语义信息标引元数据框 架,具体内容如下表所示: 表2 - 3数字图像内容标引框架 t a b 2 - 3f r a m e w o r ko fdig i c aiim a g ec o n t e n tin d e xin g 类属元素名称 中文名说明举例 。 u i l :s u b j e c t主题名图像的主题内容l e n as o d e r b e r g 。 u i 2 :t i t l e标题名图像的标题名称l e n a 晒入 具备测试标准图像 信息 u i 3 d 懿c r i p n 描述信息评论、描述或者注解 磊所善芫募条祥。 版权氓4 r e t :r 创建者 创作的个人或团体 花花公子杂志 咎二 u i 5 :p r 0 v i d e r 提供者图像的提供者 w i l l i a mk p r a t t 住自 u i 6 :d a t e 日期图像发布或创作日期1 9 7 2 1 1 u i 7 :s o u r c e 图像来源w e b 、本地、扫描w e b 外部 u i s :f i l es i z e 文件大小所占据存储空间6 5 k b 属性 u i 9 :m e a s u r e m e n t s 图像尺寸宽度、高度 5 1 2 x 5 1 2 信息 u i l o :t y p e 图像类型图像的压缩格式 j p e g 本标引框架以保证元数据是简单实用,而且具有足够的描述能力。涵盖 了数字图像最重要的内容检索的内容语义信息( t i t l e ,s u b j e c t ,d e s c r i p t i o n ) 、辅 助用户检索或关联检索的外部属性信息( f i l es i z e ,m e a s u r e m e n t s ,t y p e ) 以及确 保原作的权利不受侵害的版权管理信息( c r e a t o r , p r o v i d e r , d a t e ,s o u r c e ) 。这三 类信息不但能够吸取了上述各项标准的优点,考虑了图像的复制,描述,组 织,和管理等各个反面所需要的功能,更加人性化的从用户的角度出发,“给 用户只所需 。 为了使用方便,我们采用通用的标准语言来表示。考虑以下原则: 1 ) 该规范中基本字段能够涵盖一幅数字图像的基本语义信息; 2 ) 不是所有的字段都是必须的,可根据应用领域、传输方式、用户终端 等进行选择。 西南科技大学硕士研究生学位论文第1 3 页 2 1 2 数字水印技术概述 2 1 2 1 数字水印模型 目前,数字水印还没有一个非常好的理论模型。简单来说,数字水印系 统包括嵌入和提取两个部分阽”。嵌入部分至少具有两个输入量:一个是原始 信息,它通过适当的变化后作为待嵌入的水印信号:另一个就是要在其中嵌 入水印的载体作品。水印嵌入器的输出结果为含水印的载体作品,通常用于 传输和转录。之后这件作品或另一件未经过这个嵌入器的作品可作为水印检 测器的输入量。大多素和检测器试图尽可能的判断出水印存在与否,若存在, 则输出为所嵌入的水印信号
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 泥瓦作文物修复师理论知识考核试卷及答案
- 智慧景区建设实施方案:2025年智慧景区运营管理报告
- 2025年历史文化街区保护与开发在城市更新中的政策扶持与市场机制创新实践路径研究
- 新质生产力提出的创新属性
- 洞察2025年下沉市场:家居壁纸行业消费行为与渠道策略研究报告
- 电商知识竞赛试题及答案
- 起重工竞赛理论试题及答案
- 屠宰行业节能减排示范创新创业项目商业计划书
- 大豆蛋白产业投资基金创新创业项目商业计划书
- 坚果护眼保健食物创新创业项目商业计划书
- 2025年私人住宅装修合同及详细工程清单
- 2025年法本法硕真题及答案
- 变压器装配工职业技能考核试卷及答案
- 潍坊工会社会工作者考试试题(含答案)
- 水利工程建设项目安全生产 风险管控“六项机制”建设标准
- 2025广东广州市海珠区人民检察院招聘劳动合同制司法辅助人员5人笔试备考试题及答案解析
- 秋季传染病健康知识培训课件
- 师恩如灯照亮我们的成长路教师节主题班会课件
- 2025医学支气管哮喘防治考试题目及答案
- 2025年教育局遴选笔试重点解析
- 1.2 运动的描述 教学课件 人教版(2024)八年级物理上册
评论
0/150
提交评论