(光学工程专业论文)网屏编码技术在信息隐藏和文档图象检索中的应用.pdf_第1页
(光学工程专业论文)网屏编码技术在信息隐藏和文档图象检索中的应用.pdf_第2页
(光学工程专业论文)网屏编码技术在信息隐藏和文档图象检索中的应用.pdf_第3页
(光学工程专业论文)网屏编码技术在信息隐藏和文档图象检索中的应用.pdf_第4页
(光学工程专业论文)网屏编码技术在信息隐藏和文档图象检索中的应用.pdf_第5页
已阅读5页,还剩66页未读 继续免费阅读

(光学工程专业论文)网屏编码技术在信息隐藏和文档图象检索中的应用.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 摘要 随着信息技术( i t ) 的高速发展,以及扫描仪和高像素的数码图像采集设 备的广泛应用,使得电子文档在日常工作、学习和生活中的作用越来越重要。 这就带来了信息安全和文档图像的管理和检索问题。特别是在越来越广泛应用 的无纸化办公和数字图书馆领域显得尤为重要。针对这类信息安全问题,信息 隐藏和数字水印技术是目前应用最广泛、发展速度最快的一类技术。另一方面, 针对无纸化办公和数字图书馆中海量文档图像的管理和检索的问题,也提出了 很多的方法,而且每种方法都有各自的特点。 在现有的一些信息隐藏算法理论、数字图像处理理论和传统的通信理论的 指导下,我们提出了网屏编码( s c r e e n c o d e ) 技术。我们将网屏编码应用于上 述两个领域。 本文主要进行了如下的一些工作: ( 1 ) 介绍了目前的一些信息隐藏算法和文档图像检索算法,分析了他们的 原理和优缺点,以及介绍了这两个领域的发展现状。 ( 2 ) 阐明了网屏编码技术的技术基础及其实现方法,引入代码间的最大类 似度的概念,用以提高网屏编码的鲁棒性,并通过实验验证了它的作用。 ( 3 ) 我们利用网屏编码技术实现了在文档中隐藏大量信息( 包括文本数据 和多媒体数据等) 的功能,这在一定程度上保证了文档图像的信息安全。文中 将详细介绍我们的方法和实现过程。通过实验,我们证明了利用网屏编码技术 可以在纸质介质中埋入大量的信息,包括文本信息和其它的多媒体信息,同时 也能准确的识别。 ( 4 ) 将b 样条函数应用于图像的边缘检测领域,通过使用b 样条函数对图 像进行曲面拟合( 磨光) ,通过求曲面的二阶导零交叉点来查找边缘。该方法可 以较好的检测出图像的边缘,有效的缓解了由于网屏编码埋入过程中对图像的 视觉效果的破坏问题。 ( 5 ) 将网屏编码技术应用于文档图像检索系统,实现了文档内容的快速、 准确和高精度的检索。试验结果表明,由于网屏编码具有很好的鲁棒性和很高 的识别准确度,以及单位容量大等特点,基于网屏编码技术的文档图像检索方 摘要 法的检索准确度很高,检索精度可以达到单词的级别。 关键词:数字水印信息隐藏网屏编码文档图像图像检索文档图像检索 a b s t r a c t ab s t r a c t w i t ht h er a p i dd e v e l o p m e n to fi n f o r m a t i o nt e c h n o l o g y ,a sw e l la st h ew i d e ru s eo f 1 1 j 曲- p r e c i s i o ns c a n n e ra n dh i g h r e s o l u t i o nd i g i t a lc a m e r a ,e l e c t r o n i cd o c u m e n t sp l a y a i li m p o r t a n tr o l ei nd a i l yl i f e m sh a sb r o u g h ti n f o r m a t i o ns e c u r i t ya n dd o c u m e n t i m a g e sm a n a g e m e n ta n dr e t r i e v a lp r o b l e m s e s p e c i a l l yi nt h ef i e l do fa p p l i c a t i o no f t h ep a p e r l e s so f f i c ea n dd i g i t a ll i b r a r i e s i no r d e rt od e a lw i t ht h ei n f o r m a t i o n s e c u r i t yp r o b l e m s ,i n f o r m a t i o nh i d i n ga n dd i g i t a lw a t e r m a r k i n gt e c h n o l o g yh a db e e n w i d e l yu s e d o nt h eo t h e rh a n d ,t h e r ea r eal o to fm e t h o d st om a n a g ea n dr e t r i e v a l t h ed o c u m e n ti m a g e ,e a c hh a si t so w nc h a r a c t e r s 。t h e s em e t h o d sc a t lb ed i v i d e di n t o t w oc a t e g o r i e s :t r a d i t i o n a lb a s eo no c rd o c u m e n ti m a g er e t r i e v a lm e t h o d sa n d m o d e mb a s e - c o n t e n td o c u m e n ti m a g er e t r i e v a lm e t h o d s s o m eo ft h e mh a v eb e e n a p p l i e dt os o m ew e l l - k n o w nc o m m e r c i a ls y s t e m i ns o m eo ft h ee x i s t i n gi n f o r m a t i o nh i d i n ga l g o r i t h mt h e o r y , d i g i t a li m a g e p r o c e s s i n gt h e o r ya n dt h et h e o r yo ft r a d i t i o n a lc o m m u n i c a t i o n st h e o r y ,w ed e v e l o p e d an e t w o r ks c r e e nc o d i n gt e c h n o l o g y i nt h i sp a p e r ,w ea p p l ys c r e e n c o d et e c h n o l o g y w i l lb ea p p l i e dt ot h ea b o v et w oa r e a s w h e na p p l i e ds c r e e n c o d et e c h n o l o g yi n t o h i d i n gi n f o r m a t i o na r e a ,w ec a ne m b e da m o u n to fi n f o r m a t i o n ,s u c ha st e x t , n u m b e r , a u d i o ,v i d e oa n di m a g ei np r i n t i n gp a p e r s a st h ec a p a c i t yo fs c r e e n c o d ei sl a r g e , a n ds t r o n gr o b u s t n e s s ,w h i l ea p p l ys c r e e n c o d et e c h n o l o g yi n t od o c u m e n ti m a g e r e t r i e v a la r e a , t h ed o c u m e n ti m a g e sc a nb ea c c u r a t e ,h i g h - p r e c i s i o nr e t r i e v e d e x p e r i m e n tr e s u l tp r o v e dt h a tt h ed o c u m e n ti m a g e 、析t hs e v e r a ll a n g u a g e sc a nb e r e t r i e v e di nw o r d 1 e v e l t h em a i nc o n t e n ti sl i s t e da sf o l l o w s : li n t r o d u c e ds o m ei n f o r m a t i o n h i d i n ga l g o d t h r na n dt h ed o c u m e n t si m a g e r e t r i e v a la l g o r i t h m ,a n da n a l y z e dt h e i rp r i n c i p l e 2 e x p o u n d e dt h es c r e e nc o d i n gt e c h n i q u e sb a s ea n dr e a l i z e sm e t h o d ,i n t r o d u c e d t h ec o n c e p to fc o d em o s tg r e a t l ys i m i l a r , w h i c hc a l le n h a n c et h es c r e e nc o d e r o b u s t n e s s ,a n dt h r o u g he x p e r i m e n t a lv e r i f i c a t i o ni t sf u n c t i o n i i w eu s e dt h es c r e e nc o d i n gt e c h n i q u et or e a l i z eh i d i n gi n f o r m a t i o n ( i n c l u d i n g t e x t d a t aa n dm u l t i m e d i ad a t aa n ds oo n ) i nt h ed o c u m e n t s ,w h i c hh a sa s s u r e dt h e d o c u m e n t si m a g ei n f o r m a t i o ns e c u r i t y a p p l i e st h eb s p l i n ef u n c t i o ni nt h ei m a g ee d g ed e t e c t i n g t h i sm e t h o dm a y o b t a i nt h ev e r yg o o dd e t e c t i n ge f f e c t ,a n di tc a ne f f e c t i v ea l l e v i a t i o nt h ei m a g e v i s u a le f f e c td e s t r u c t i o ni ns c r e e nc o d ee m b e d p r o c e s s w h e na p p l i e dt h es c r e e nc o d m gt e c h n i q u ei i lt h ed o c u m e n t si m a g er e t r i e v a l s y s t e m , w er e a l i z e dt h ed o c u m e n t sc o n t e n tf a s t ,a c c u r a t e ,t h eh i g ha c c u r a c y r e t r i e v a l t h e e x p e r i m e n t a lr e s u l ti n d i c a t e dt h a tt h i sm e t h o dc a l lr e t r i e v a 】 d o c u m e n t sa c c u r a c y , a n dt h er e t r i e v a lp r e c i s i o nm a y a c h i e v et h ew o r dt h er a n k k e y w o r d s :w a t e r m a r k i n gh i d i n g i n f o r m a t i o ns c r e e n c o d ed o c u m e n ti m a g e i m a g er e t r i e v a ld o c u m e n ti m a g er e t r i e v a l 1 1 1 蔓 禾 孓 南开大学学位论文版权使用授权书 本人完全了解南开大学关于收集、保存、使用学位论文的规定, 同意如下各项内容:按照学校要求提交学位论文的印刷本和电子版 本;学校有权保存学位论文的印刷本和电子版,并采用影印、缩印、 扫描、数字化或其它手段保存论文;学校有权提供目录检索以及提 供本学位论文全文或者部分的阅览服务;学校有权按有关规定向国 家有关部门或者机构送交论文的复印件和电子版;在不以赢利为目 的的前提下,学校可以适当复制论文的部分或全部内容用于学术活 动。 学位论文作者签名:纠小例 硼年厂月加 经指导教师同意,本学位论文属于保密,在年解密后适用 本授权书。 指导教师签名:学位论文作者签名: 解密时间:年月日 各密级的最长保密年限及书写格式规定如下: 南开大学学位论文原创性声明 本人郑重声明:所呈交的学位论文,是本人在导师指导下,进 行研究工作所取得的成果。除文中已经注明引用的内容外,本学位 论文的研究成果不包含任何他人创作的、已公开发表或者没有公开 发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个 人和集体,均已在文中以明确方式标明。本学位论文原创性声明的 法律责任由本人承担。 学位论文作者签名:调卜卸 ) 砷$ 年歹月彳日 第一章绪论 第一章绪论 第一节研究背景 互联网的发展和普及,已经从根本上改变了人们学习、工作和生活的方式。 通过互联网人们可以很方便的进行交流和学习。相应的,多媒体信息的数量也 呈爆炸式的增张。而随之而来的版权保护、防篡改等问题表现得越来越突出。 另外,由于互联网的发展已经突破了国际的限制,这也就带来了信息安全的问 题。为了应对这些问题,信息隐藏和数字水印技术应运而生。 另一方面,由于数字图像采集设备的普及,从经济角度考虑,维护存储了 大量文档图像的数据库是可行的,这就造成了无纸化办公的快速发展和数字图 书馆的广泛建设,文档图像的管理和检索问题也随之而来。显然,利用人工进 行管理和检索是不现实的,这就迫切要求用计算机来进行自动管理和自动检索。 目前世界各国有许多的高校、研究机构和公司投身于上述两个领域。一些 研究成果以论文和专著的形式发表出来,同时还出现了一些专门的国际期刊、 国际会议和论坛。一些实力较强的公司也开发出了一些商用系统和软件。 第二节信息隐藏技术 1 2 1 信息隐藏技术的由来 信息隐藏是近几年来提出的新技术,现代数字信息隐藏的历史可以追溯到 1 9 5 4 年。那年,m u z a k 公司获得了一项名为“i d e n t i f i c m i o no fs o u n da n dl i k e s i g n a l s 的专利i l l ,专利中描述了向音乐中嵌入不可感知的信号来证明所有权 的方法。19 9 6 年5 月,第一届国际信息隐藏学术研讨会( i n t e r n a t i o n a li n f o r m a t i o n h i d i n gw o r k s h o p ,i h w ) 在英国剑桥牛顿研究所召开,这标志着信息隐藏这门学 科的诞生。 其实信息隐藏思想由来已久。它可以追溯到古希腊时期的隐写术 ( s t e g a n o g r a p h y ) 。单词s t e g a n o g r a p h y 源于古希腊词汇s t e g a n o s 和g r a p h i a ,意 第一章绪论 思是将有用或重要的信息隐藏于其它信息里面以掩饰其存在。隐写术是信息隐 藏的一个重要分支。隐写术最著名的例子可以追溯到远古时期,希罗多德 ( h e r o d o t u s ) 在他的著作h i s t o r i e s 2 1 中提到:大约在公元前4 4 0 年,一个名叫 h i s t a i e u s 的人,为了鼓动奴隶们起来反抗波斯人,就给他最信任的奴隶剃头, 并将一个消息刺在奴隶的头上,直到他的头发长长以后,这则消息才消失。然 后把这个人派出去送“信,最后反叛成功。h e r o d o t u s 还提到,在波斯朝廷的 一个希腊人为了警告斯巴达:波斯国王薛西斯一世将入侵。他先去掉书记板上 的蜡,然后将消息写在木板上,最后重新用蜡覆盖木板,木板看起来像空白的。 历史上诸如此类的隐写方法还有多种。1 7 世纪,英国的、m 1 1 ( i n s ( 1 6 l 仁1 6 7 2 ) 是 资料记载中最早使用隐写墨水进行秘密通信的人,在2 0 世纪的两次世界大战中 德国间谍都使用过隐写墨水。早期的隐写墨水是由易于获得的有机物( 例如牛 奶、果汁或尿) 制成,加热后颜色就会变暗从而显现出来。 在中国古代,人们曾经使用挖有若干小孔的纸模板盖在信件上,从中取出 秘密传递的消息,而信件的全文则是为打掩护用的。关于信息隐藏历史的详细 资料,可以参考文献【3 】。 随着计算机技术和多媒体技术的发展,这种古老的思想有了新的表达方式, 人们开始研究怎么在数字数据中隐藏信息。各种理论和数学模型相继引入进来, 现代信息隐藏技术已经发展成为一门多学科专业的综合性学科。 1 2 2 信息隐藏技术概述 1 2 2 1 信息隐藏的原理及其框架模型 从数字通信的角度看,信息隐藏可以理解为在宽带信号( 载体图像) 上通 过扩频通信技术传输一个窄带信号( 隐藏信息) 。虽然隐藏的信息具有一定的能 量,但是信道上各个频率的能量难以检测,也就实现了信息隐藏。隐藏信息检 测过程则可以看作在有噪声的信道中检测弱信号的过程。从图像处理的角度看, 信息隐藏可以看作是在一个强信号( 载体图像) 中叠加一个弱信号( 隐藏信息) , 只要弱信号的强度低于人眼视觉特性( h v s ) 的对比度门限,人眼就无法识别 隐藏的信息。人眼视觉系统的对比度门限受限于空间和频率的影响。 一般的信息隐藏系统主要包括信息埋入部分和信息检测部分。他们的框架 模型分别如下图所示: 2 第一章绪论 图1 1 信息隐藏技术的信息埋入过程示意图 图1 2 信息隐藏技术中信息检测过程示意图 给定一幅图像,和待隐藏的信息形,一般还会用到密码学的加密算法,所 以还有一个密钥k ,则经过埋入过程后得到含隐藏信息的图像,。,可表示为: j - ,形k ( 1 1 ) 具体的信息隐藏算法一般可以表示为: ,= i + 口形 ( 1 2 ) 或者 i 一,( 1 + a w ) ( 1 3 ) 其中口为埋入的强度因子。它决定了算法的鲁棒性和隐藏信息的隐秘性,口越 小,隐藏的视觉效果越好;而口值越大,鲁棒性就较强。所以,其值的选择一 般会考虑到人眼的视觉特性以及图像的特征。对于一些采用分块处理算法的信 息隐藏技术来说,其值会随着分块视觉特性的不同而不同。 检测时,如果用到了原始载体图像,我们就称检测为非盲检测;不需要原 始载体图像时,我们称检测方法为盲检测。实际应用中,由于要受到噪声等一 些因素的影响,检测出的信息一般会和原始的隐藏信息不完全相同,为了判断 检测出的信息是否为原始隐藏信息,通常会计算他们的相似度p ( w ,w ) 。 相似度的公式一般表示如下: 3 第一章绪论 缈胁器 ( 1 4 ) x , 或者 p ( w ,矽) := 兰些 ( 1 5 ) 4 w x w 4 wx 判断时,我们先设置一个门限值t ,当相似度p ( w ,形) t 时,则可以判定检测 出的数据中含有隐藏信息。反之则认为不含有隐藏信息。 1 2 2 2 信息隐藏技术的特性 信息隐藏主要是利用人的视觉、听觉器官的局限性,通过修改数字载体文 件的冗余信息位( r e d u n d a n td a t a ) 来实现信息隐藏。它主要有两方面的应用:数字 水印( d i g i t a lw a t e r m a r k i n g ) 和隐写术( s t e g a n o g r a p h y ) 。信息隐藏技术要求同时满足 鲁棒性( r o b u s t n e s s ) 、不可感知性( i m p e r c e p t i b i l i t y ) 和容量( c a p a c i t y ) 这三种主 要特性。 ( 1 ) 不可感知性:不可感知性包括不可见性( i n v i s i b i l i t y ) 和不可听性 ( i n a u d i b i l i t y ) ,是指利用人类的视觉特性或者听觉特性,经过一系列的处理, 使埋入隐藏信息后的载体与原始载体在视觉上或者听觉上没有区别。这是信息 隐藏技术的基本要求和特性。 ( 2 ) 鲁棒性:鲁棒性体现了隐藏算法应对一般的信号处理和恶意处理的能 力。一般信号处理包括数据处理和数据修改,而恶意的处理主要包括加噪声和 修改数据的几何特性等。 ( 3 ) 容量是指在原始载体数据中可以埋入的信息数量。针对不同的应用有 不同的需求。 这三种特性相互矛盾相互制约。如何根据实际应用环境进行取舍、平衡这 三种主要特性是设计信息隐藏算法的关键。另外在设计隐藏算法时还考虑安全 性和对载体的要求。 1 2 2 3 信息隐藏技术的分类 信息隐藏技术可作如下分类: ( 1 ) 按载体类型分类:有文本、图像、音频和视频的信息隐藏技术。 ( 2 ) 按密钥分类:若嵌入和提取采用相同的密钥,则称其为私钥信息隐藏技 4 第一章绪论 术,否则称为公钥信息隐藏技术。 ( 3 ) 按嵌入域分类:可分为空域、时域和变换域方法。空间域替换方法处理 是用各种各样的方法直接修改图像的像素( 如直接修改像素晟低有效位的l s b 算法) 。而变换域方法处理( 如常用的一些数学正交变换) 是对图像进行各种各 样的变换后嵌入隐秘信息。 ( 4 ) 按检测是否需要原图像参与分类:可分为非盲检测算法和盲检测算法。 非盲检测算法中隐秘信息的检测需要原始图像的参与,而盲检测算法中隐秘信 息的检测不需要原始图像的参与。 ( 5 ) 按照保护对象分类:主要分为隐写术和数字水印技术。隐写术是一种相 对来说比较成熟的技术。数字水印是指嵌在数字作品中的数字信号,可以是图 像、文字、符号和数字等一切可以作为标识和标记的信息,其目的是进行版权 保护、所有权证明和完整性保护等,因此它的要求是鲁棒性和不可感知性。其 中用于版权保护的鲁棒水印是目前研究的热点。 1 2 3 信息隐藏常用算法 下面我们介绍一下一些常用的信息隐藏算法: ( 1 ) 空域算法: 空域算法研究得比较早,最初是由t u r n e r 提出的l s b 算法【4 】。该算法由于 将信息隐藏的到最低位,相当于叠加了一个能量较弱的信号的到原始信号中, 因而在视觉上很难被人察觉。但是该算法鲁棒性较差,在数据压缩、滤波、量 化和变形的情况下,隐藏信息很容易丢失。 s c h y n d e l 算法【5 】也被认为是一篇具有历史价值的算法,它是第一篇在主要 会议上发表的关于数字水印的文章。文中阐明了一些关于水印的重要概念和鲁 棒水印检测的通用方法( 相关性检测方法) ,此算法首先把一个密钥输入一个 m 序列( m a x i m u m 1 e n g t hr a n d o ms e q u e n c e ) 发生器来产生水印信号,然后此 m 序列被重新排列成2 维水印信号,并按像素点逐一插入到原始图像像素值的 最低位。水印信号被安排在了最低位上,因而它是不可见的。 麻省理工学院媒体实验室w a l t e rb a n d e r 等人提出的p a t c h w o r k 算法【6 】是通 过改变图像中的统计特性将信息隐藏到像素的亮度值中。该算法首先随机选取 n 对像素点,然后通过增加像素对中一个点的亮度值,而相应降低另一个点的 亮度值的调整来隐藏信息。该算法可以有效抗有损压缩、裁剪和灰度矫正等攻 5 第一章绪论 击,但是对仿射变换很敏感,而且容量较小,可用于票据打印防伪。 ( 2 ) 变换域算法 h s u 和w u t 7 1 提出的d c t 变换域数字水印算法是目前研究最多的一种数字 水印算法。其方法是首先把图像分成8 x 8 的不重叠像素块,经过分块d c t 变换, 得到由d c t 系数组成的频率块,然后随机选取一些频率块,将水印信号嵌入到 由密钥控制选择的一些d c t 系数中。该算法是通过对选定的d c t 系数进行微 小变换以满足特定的关系,来表示一个比特的信息。在提取水印信号时,选取 相同的d c t 系数,并根据系数之间的关系抽取比特信息。其思想类似于扩展频 谱通讯中的跳频( f r e q u e n c yh o p p i n g ) 技术,特点是数据改变幅度较小,而且透 明性好,但是其抵抗几何变换等攻击的能力较弱。 c o x 等人提出的基于扩频通信技术的频率域数字水印嵌入策略【8 1 19 】是频率 域水印技术的经典之作,该算法旨在兼顾水印信息的不易察觉性和鲁棒性,其 一个重要的贡献在于提出水印应嵌入到图像中敏感感知部分,达到提高水印鲁 棒性的目的。t a o 等人【1 0 】提出一种自适应d c t 水印算法,把图像块按噪声敏感 特性分为6 类,每一类水印嵌入的强度不同。利用人类视觉系统特征,m a c q ,w e i , p o d i l c h u k 等人提出的水印算法 1 l l 1 2 1 考虑到不可见性,使得嵌入的水印信号更加 适应于载体图像。h u a n g 等人【1 3 】提出了一个基于d w t 的不可见水印嵌入对策, 并利用该对策提出了一种自适应水印算法,但水印检测需要原始载体,属于非 盲检测。p o d i l c h u k 等人 1 4 1 提出一种基于感知模型的小波域自适应水印算法,用 临界差异确定水印的嵌入强度。 ( 3 ) n e c 算法f 8 】【1 5 】【1 6 1 1 1 7 1 该算法由n e c 实验室的c o x 等人提出,该算法在数字水印算法中占有重 要地位,其实现方法是首先以密钥为种子来产生伪随机序列,该序列服从高斯 n ( 0 ,1 ) 分布,密钥一般由作者的标识码和图像的哈希值组成;其次对图像 做d c t 变换,最后用伪随机高斯序列来调制( 叠加) 该图像除直流( d c ) 分量外 的1 0 0 0 个最大的d c t 系数。该算法具有较强的鲁棒性、安全性、透明性等。 由于采用特殊的密钥,因此可防止i b m 攻击,而且该算法还提出了增强水印鲁 棒性和抗攻击算法的重要原则,即水印信号应该嵌入原数据中对人感觉最重要 的部分;水印信号由独立同分布随机实数序列构成,该实数序列应该具有高斯 分布n ( 0 ,1 ) 分布的特征。 6 第一章绪论 1 2 4 信息隐藏技术的研究现状 1 9 9 0 年发表了第一篇关于图像数字水印的文章。从1 9 9 4 年开始,国际学 术界陆续发表了有关数字水印的文章,而且文章数量呈快速增长趋势。1 9 9 6 年 5 月,第一届国际信息隐藏学术研讨会在英国剑桥牛顿研究所召开。很多有影 响的国际会议和国际权威杂志都组织了数字水印技术专刊或专题报道。 到目前为止,数字水印从研究对象上看主要涉及图像水印、视频水印、音 频水印、文档水印和三维网格数据水印等几个方面,其中大部分的水印研究和 论文都集中在图像研究上,其原因在于图像是最基本的多媒体数据,同时互联 网的发展为图像水印的应用提供了广泛的应用基础。 全球支持或开展数字水印研究的政府机构和研究部门很多,包括美国财政 部、欧洲电信联盟、麻省理工学院、微软公司、朗讯贝尔实验室等机构,同时, i b m ,h i m c n ,n e c ,p i o n e e r 和s o n y 五家公司还宣布联合研究数字水印版权保护 技术。与此同时,一些公司已逐步推出了有关水印技术的商用软件系统,目前 已经出现了很多的信息隐藏方面的软件和产品,例如m i c r o s o f t 的d i 西t a lr i g h t 、 m a n a g e r ,i b m 的c r y p t o l o p e 等等。 我国在1 9 9 9 年1 2 月1 1 日,在何德全、周仲义、蔡吉人三位院士的积极倡 导下,由北京电子技术应用研究所组织,召开了全国第一届信息隐藏学术研讨 会。至今为止,该研讨会已经举办了七届。国家“8 6 3 计划”、“9 7 3 项目( 国家重 点基础研究发展规划) ”、国家自然科学基金等都对信息隐藏领域的研究有项目 资金支持。从目前的发展水平来看,我国相关学术领域的研究与世界当前水平 处在同一阶段,而且有独特的思想见解。 第三节文档图像的检索概述 由于文档图像是一种较为特殊的图像,所以在介绍文档图像检索之前,我 们先来介绍一下图像检索算法和常用图像检索系统。 1 3 1图像检索 图像检索是数字图像处理领域的一个重要方向,它的目标是从图像数据库 中快速准确地提取出与查询图像相关的图像或图像序列。从其发展历程来看, 可分为两代。第一代图像检索系统的特点是:由管理员手工为数据库内的图像 7 第一章绪论 添加注解,并提供检索时所需的索引;检索时,用户输入字符串利用索引进行 检索。这种检索系统存在两个主要问题,人工注释的工作量大,特别是图像数 量级大时;主观信息的表达和理解造成注释信息的不稳定,后面一个问题直接 影响到检索结果。于是第二代基于内容的图像检索技术应运而生。 基于内容的图像检索方法( c b i rc o n t e n tb a s e di m a g er e t r i e v a l ) 的特点是 不但可通过管理员对数据库内的图像进行注解,而且系统能自动地对数据库内 的图像进行分析,特征提取,建立检索时所需的索引;检索时,用户不仅可以 借助多种输入进行检索,还能实现人机交互。 经过几年时间的发展,目前基于图像内容的检索已经取得阶段性的进展。 每年也有相关的国际会议召开。如s p i e 的s t o r a g e a n dr e t r i e v a lf o ri m a g ea n d v i d e od a t a b a s e s ,a c mm u l t i m e d i a 、i n t e r n a t i o n a lc o n f e r e n c eo ni m a g ea n dv i d e o r e t r i e v a l 等。很多重要学术期刊也都以此内容发表了专刊,如i e e ec o m p u t e r , i e e ep a m i ,p a t t e r nr e c o g n i t i o n ,i m a g ea n dv i s i o nc o m p u t i n g 等。 目前用来描述图像内容的特征主要包括:l 、图像的颜色特征( 图像的颜色 组成和分布等) ;2 、图像的纹理特征( 图像的纹理结构,方向及分布特征等) ; 3 、图像的形状( 图像的大小、形状等) :4 、子对象的空间关系等。 国内外一些大学和公司在这方面早已开展了相当多的研究工作,并研制了 很多比较成熟的图像检索系统。具有代表性的基于内容的图像检索系统主要有: 1 i b ma l m a d e l l 研究中心开发的第一个商用的c b i r 系统q b i c ,它的系 统结构和技术对后来的图像检索系统有深远的影响。它提供了基于视觉特征、 手绘草图、图例、关键词等查询方式。该系统是从颜色、纹理、形状三方面描 述图像的视觉特征。颜色特征使用r g b 、y i q 、l * a * b 和m u n s e l l 颜色空间及k 元颜色直方图。其纹理特征是t a m u r a 纹理表示的一种改进形式,是粗糙度、对 比度和方向性三者的综合。形状特征的表达则采用了面积、圆度、离心率、主 轴方向以及矩不变量等描述方法。 目前该系统已经应用到i b m 的数字图书馆中。这个数字图书馆集成了多种信 息存储、管理和分配的技术,实现了自动索引、归并、对比、特征抽取和翻译 等功能。 2 美国伊利诺伊大学( u n i v e r s i t yo fi l l i n o i sa tu r b a n ac h a m p a i g n ) 开发的 m a r s 系统。该系统是第一个正式提出相关反馈的系统,它将相关反馈技术集成 到检索的不同层次中。m a r s 系统使用的是基于颜色布局的图像表示方法。它 8 第一章绪论 通过区域分块和聚类把图像化分成若干个块,提取图像块的视觉特征进行检索。 使用的视觉特征包括颜色、纹理和形状特征。 3 清华大学i 拘i m g r e t r 系统【l 引。国内在图像检索技术方面的研究起步较晚, 但是也取得了一些研究成果。清华大学的i m g r e t r 系统就是其中的代表,该系统 结合了多种组织方法,能提供基于主色、纹理、直方图、颜色分布、框架等多 种检索方式。该系统提取的图像特征有:主色、纹理、颜色直方图、颜色分布、 框架、图像边界等,然后根据实验效果调整各特征所占的比重,以达到优化。 而s s 索引建立器利用相似索引技术以特征文件为基础建立s s i n d e x 文件,能实现 顺序检索无法实现的实时检索。除此之外,这个阶段还包括一些进行格式转换 和图标生成的工具。 除了上述一些系统以外,还有很多比较优秀的图像检索系统,如由哥伦比 亚大学j o h nrs m i t h 开发的面向w w w 的图像检索工具w e b s e e k ;由v i r a g e 公司 开发的基于内容的图像搜索引擎v i r a g e 等等。 1 3 2 文档图像检索 尽管现在电子文件在实际生活中越来越重要,但是,它并没有取代传统的 纸质文档,相反,纸质文档的数量越来越多【1 9 1 。其原因一方面是不断的有新的 报纸、杂志、图书出现;另一方面也是由于人们对传统纸质文档的偏爱,纸质文 档也相对廉价,使用也方便( 人们休闲的时候可以看看杂志,睡觉之前也可以 卧在床上看看书籍,人们外出学习的时候也可以带上报刊,毕竟电脑目前还不 能很好的满足这些要求) 。但是纸质文档不仅难以长时间保存,而且对大量的 纸质文档来说,存储、管理和检索也是一种很大的挑战。通过数字化设备如扫 描仪或者高精度的数字摄像设备将它们转换成数字文档是一种最经济可行的方 式。随之而来的文档图像管理和检索问题也就理所当然的成为研究热点。近年 来,不仅发表、出版了一系列的论文专著,而且也出现了相应的国际会议和国 际期刊:i n t e r n a t i o n a lc o n f e r e n c eo fd o c u m e n ta n a l y s i sa n dr e c o g n i t i o n i n t e r n a t i o n a lj o u r n a lo fd o c u m e n ta n a l y s i sa n dr e c o g n i t i o n ( i c d a r & i j d a r ) 。 文档图像是一类比较特殊的、并被广泛使用的图像。其内容一般是文字和 图表等。它在视觉影效上比较单调,灰度对比强烈,具有特定的统计特征。一 般包括商务文件,业务信函,私人信件等,使用的语言包括英文,简繁体中文, 日文,韩文,德文,法文等语言的印刷体和手写体,其载荷的信息具有明显的 9 第一章绪论 应用价值。由于文档图像具有上述的一些特性,所以文档图像检索和一般的图 像检索存在差异:1 、文档图像检索的目的是确定图像数据库中有没有查询图像 的副本。2 、由于文档图像一般是灰度图像,所以不会使用其颜色特征来检索。 3 、文档图像的内容结构相对简单一些,纹理也不会复杂。 1 3 3 文档图像检索常用算法 经过国内外研究人员的共同努力,文档图像的检索在理论和实际应用中都 取得了许多进展和成果。目前提出的一些算法大体可以分为两类:传统的文档 字符识别( o c r ) 技术和基于图像特征的文档图像检索算法。 1 传统的文档字符识别( o c r ) 技术检索 字符是文档图像的主要信息之一。文档字符检索算法是通过光学字符识别 ( o c r ) 技术去识别文档中的字符,然后利用字符匹配技术来检索文档图片。 目前也开发出了基于o c r 技术的检索系统,女i h e l i o s 【2 0 】等商业系统。 但是由于目前的o c r 技术在抗噪声、抗形变、抗复杂版面和抗低分辨率等 方面还有待提高,虽然也有很多学者提出了一些改进算法【2 l 】【2 2 】【2 3 】【2 4 1 ,同时也出 现也一些多语言识别的o c r 软件,如清华大学的t h o c r 软件和我国台湾开发的 丹青o c r 软件等,但是并没有从根本上解决问题。在实际应用中,很多时候要 人为的干预才能得到令人满意的检索效果。这在大型数据库中,显然是不现实 的。所以就限制了这种技术的实际应用范围。而且,o c r 还有一个很显著的缺 点:对于不同的语言要采用不同的o c r 系统,在多语言混合文档图像数据库中, 这个缺点直接影响到了检索的速度。 2 基于图像特征的文档图像检索 针对o c r 算法的一些问题,人们开发出了基于文档图像特征的检索算法。 它主要是利用图像的一些特征来实现图像检索。该算法不需要了解文档的内容, 只需要比较两篇文档特征的相似性。按其原理可以分为两类:基于文档页面相 似性的检索和基于关键字的检索。基于页面相似性的检索算法主要是通过提取 图像页面的全局特征或者局部特征来进行检索,1 9 9 3 年p e rh e r r m a n n 和g u n t h e r s c h l a g e t e r 提出一种基于页面几何结构的文档图像检索算法 2 5 1 ,2 0 0 1 年 h a n c h u a n 心馏等提出一种基于段落块系列大小和位置信息的检索算法【2 6 1 。这两 种方法都是利用图像的全局特征,它们的检索速度较快,但是检索的准确度和 精度不高,很多时候难以满足检索需求。于是就发展出了基于图像局部特征的 1 0 第一章绪论 检索方法。1 9 9 8 年,d d o e r m a n n 等提出种先提取文档图像的代表行作为文档 图像签名,然后获取该行的字符形状编码,最后利用这些字符形状编码去检索 图像。随后,利用图像局部特征的算法相继地发表,y e h e z k e ll a m d a n 等人提出 的g h 算法【2 7 1 ,m a s a k a z u1 w a m u r a 等也提出了类似的算法【2 8 】 2 9 】 3 0 】【3 1 1 ,这些算法考 虑到一些几何变换的影响,但是一般计算复杂度高,而且大多只支持特定语言 ( 一般是英语) 的文档,检索精度也只能达到段落或者行的级别,而且准确度 也不能让人满意。 基于关键字的检索是在字符分割的基础上进行的:d o c w m m nd 等提出了利 用英文字符在b a s e l i n e ,x 2 1 i n e ,a s c e n d e r ,d e s c e n d e r 等四基线中的特征进行相似 性比较的算法【3 2 】,c h i n g l i n w a n g 等人提出了利用中文字符图像中的黑白像素比 例作为图像特征进行中文文档图像检索的方法【2 1 1 。由于不同语言文字在笔画、 字、词、句等的构成上有很大不同,所以针对某种语言的算法对其他的语言可 能失效。如对英文文档的算法对中文文档一般会失效。在对多语言文档图像检 索时,这种方法的缺点将暴露无遗。 针对这些问题,本文提出了一种新颖的方法:基于网屏编码技术的文档图 像检索法。实验证明:该算法具有高效、高精度及强鲁棒性的特点,并且对常 用的语言都有效。 1 3 4 文档图像检索技术的发展现状 文档检索从其发展过程来看,可以分为两类,一类是传统的方法,它先用 光学字符识别技术( o c r ) 将文档图像转换成文本数据,再利用这些文本数据 进行检索。第二类是目前基于文档图像特征的检索算法,这是目前该领域的研 究热点。 文档图像作为数字图像的一个比较特殊的种类,它随着数字图像检索技术 的进步而发展。近十年来,基于内容的图像检索是当前计算机视觉、数字图书 馆、图像和视频处理、知识挖掘等领域最活跃的研究课题之一。每年都有相关 的国际会议召开,如s p i e 的s t o r a g ea n dr e t r i e v a lf o ri m a g ea n dv i d e o d a t a b a s e s ,a c mm u l t i m e d i a 、i n t e r n a t i o n a lc o n f e r e n c eo ni m a g ea n dv i d e o r e t r i e v a l 等。很多重要学术期刊也都以此内容发表了专刊,如i e e ec o m p u t e r , i e e ep a m i ,p a t t e r nr e c o g n i t i o n ,i m a g ea n dv i s i o nc o m p u t i n g 等。 国内外一些大学和公司在这方面早已开展了相当多的研究工作,研制了一 第一章绪论 些比较成熟的系统并已经用于数字图书馆系统中。 第四节本文所作的工作 随着数字采集设备( 如扫描仪,数码相机等) 的普及和发展,使得文档图 像文件越来越多。另外由于无纸化办公越来越受到各个行业的青睐,以及世界 各国建设的数字图书馆工程,文档图像的检索和安全问题也逐步提上议事日程。 许多高校、研究机构和公司开始进入这一研究领域,一些算法和方法相继提出, 也有一些具有实力的公司开发出了一些商用系统。 在现有的一些信息隐藏算法理论、数字图像处理理论和传统的通信理论的 指导下,我们开发出了网屏编码( s c r e e n c o d e ) 技术。本

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论