




已阅读5页,还剩63页未读, 继续免费阅读
(计算机应用技术专业论文)文本水印在数字版权保护中的应用研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
话j 艺大学硕士毕监论文 摘要 随着计算帆和互联网技术的发展,国内公司企业信息化的深化,电子文档在 企业内部网和电子政务网中使用广泛,很多机密文件都以电子文档的形式分发和 存储。由于电子文档易于编辑、复制和分发的特点,导致盗版侵权事件屡见不鲜, 造成了巨大的经济损失。 尽管园前普遍使用的基于数据加密的d r m 技术可以为数字内容提供有效的 版权保护、限制访问权限、阻止未授权的访问,然而一旦文件被泄露到保护系统 之外时,就不再处于安全保护之下了。数字水印技术补充了数据加密的不足,将 版权信息隐藏在数字作品中,在盗版发生时通过提取版权信患作为诉诸于法律的 电子证据,是数字版权保护最羼的保障。 针对这一现状,本文在一个基于d r m 技术的电子文档管理系统之上开发了 一个文本数字水印模块,提高了该系统的安全性。 本文主要做了如下几个方面的工作: 1 介绍了当前主要的数字版权保护技术和研究现状,对现有的文本数字水 印算法进行了详细的分类和比较,并在此基础上根据d d p s 电子文档安 全管理系统的特点,提如了水印模块的需求; 2 针对踊 x 西北大学学位论文知识产权声明书 本入完全了解西北大学关于收集、保存、使用学位论文的规定。 学校有权保留并向国家有关部门或机构送交论文的复印件和电子版。 本人允许论文被查阅和借阕。本人授权西北大学可以将本学位论文的 全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫 描等复制手段保存和汇编本学位论文。同时授权中国科学技术信息研 究所等机构将本学位论文收录到中国学位论文全文数据库或其它 相关数据库。 保密论文待解密后适用本声明。 学位论文作者签名: 耋兔亟鱼 指导教师签名: o 口年苦月钟日硼譬年6 月w 中日 西北大学学位论文独创性声明 本人声明:所里交的学位论文是本人在导师指导下进行的研究忑作及敬锝的研究 成果。据我所鲡,除了文中特剐加以标注和致谢的地方外,本论文不包含其袍人已经 发表或撰写过的研巍成采,也不包含梵获得透= l 乏大学或其它教育祝构的学位或诞书蔼 使用过的材料与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确 的说明并表示谢意 学位论文作者签名:j f 囊,听臼 训年刍月砷日 西北大学硕士毕业论文 第一章绪论 本章首先介绍了课题的研究背景和意义,从而引出本文研究的主题,随后阐 明了课题研究的主要内容;最后给出了论文的章节安排。 1 1 研究的背景和意义 随着计算机网络技术、数字通信技术、信息编码与压缩技术的快速发展,使 得电子文本、多媒体数字作品和计算机程序等数字内容的交换和传输变得非常简 单和快捷,同时也带来了由于非法盗版和恶意攻击引起的版权纠纷问题。 尽管网络上流传的音、视频数据大量增加,但是人们的很多创意仍然以文本 的方式存储和传输。文本数据仍然占据着人们日常工作、生活的重要位置,数 字化的期刊、报纸、书籍、科技文献已经逐渐改善了人们的阅读方式。不仅如此, 电子文档也因为其使用方便、快捷、成本低廉而在企业内部网和电子政务网中得 到大力推广,甚至很多机密文件都在以电子文档的形式进行分发和存储。 由于这些数字化的文档可以轻易的被不留痕迹的编辑修改和无损复制,造成 作品的版权被侵犯、政府和企业的重要文件被非法盗用和篡改等事件屡见不鲜。 根据国际知识产权联盟【2 】( t h ei n t e m a t i o n a li n t e l l e c t l l a lp r o p e n ya 1 1 i a n c e ,简称 ) a ) 的最新报告,由于版权侵犯( 包括i n t e m e t 上的盗版) 全球每年损失约 2 0 0 2 2 0 亿美元。根据c s i ( 美国计算机安全学会) 和f b i 每年的联合调查报告 显示:在2 0 0 0 年信息安全事件造成的损失当中,3 0 4 0 是由电子文件的泄 漏造成的,2 0 0 2 年有超过8 3 的安全威胁来自于企业内部,包括内部未被授权 的文件存取、专利信息的窃取以及内部人员的财务欺骗等【3 】。 无论政府机构,还是公司企业都希望在信息顺利传播的条件下,机密信息可 以得到有效的保护,因此针对电子文档的版权保护已经成为企业网内必须重点解 决的信息内容安全问题。如何能在充分利用计算机和网络便利的同时,又能有效 的保证企业内部文件的信息安全已经成为当前网络发展与应用中亟待解决的重 要问题之一。 西北大学硕士毕业论文 1 2 数字版权保护和数字水印技术的研究现状 数字版权管理( d r m ) 就是结合硬件和软件的存取机制,对数字化内容在其 生存周期内的存取进行控制,可以有效地杜绝通过网络和计算机非法复制、传播 数字信息产品,保护内容提供者的知识产权和经济收益,自产生以来,就得到了 工业界和学术界的普遍关注,被视为是数字内容交易和传播的关键技术【4 ,5 】。 国际上许多著名的计算机公司和研究机构纷纷推出了各自的产品和系统,如 m i c r o s o f tw m i 之m 【6 1 ,i b me m m s 【”,a d o b ec o n t e n ts e e r 8 1 。m i c r o s o r 的 w i n d o w s x p 操作系统、o 伍c ex p 等系列软件中也使用了d r m 技术。国内做的 比较成功的是北大方正的a p a b i 【9 1 ,另外香港大学【1 0 】、中国科学院计算技术研究 所【1 1 12 1 、西安交通大学【1 3 】等,也在数字版权保护技术领域做了不少研究工作。 早期的版权保护基于密码技术的,发布数字作品之前先对其加密,只有已经 购买了作品的用户才拥有解密密钥,由此防止盗版者获得该作品的数字内容。但 是密码技术只能保护传输中的作品,对于在信道终端解密后的作品就不再有保护 作用。而水印技术能把版权信息隐藏在数字作品中,这些版权信息在解密后仍能 够存在,可以用于防止非法拷贝、作品认证、所有者鉴别、操作跟踪等,弥补了 密码技术的不足。目前实现d r m 系统的有效方法主要是采用密码技术与水印技 术相结合。 数字水印是近十年来国际学术晃兴起的一种有效的数字产品版权保护技术, 自1 9 9 3 年被提出以来,由于其在信息安全和经济上的重要地位,发展较为迅速, 国际学术界陆续发表了许多关于数字水印技术方面的文章,一些国际会议和学术 期刊( 如正e e ,s p i e ,s i 印a lp r o c e s s i n g 等) 都相继出版了关于数字水印的专 题。国内各大研究所和高校也纷纷投入到对数字水印的研究之中,北京电子技术 应用研究所于1 9 9 9 年1 2 月组织召开了第一届信息隐藏学术研讨会( c m w ) , 至今已成功的举办了七届【1 4 】,极大地推进了国内水印技术的研究与发展。 当前社会中电子文本已经成为人们生活、工作中的一部分,尤其是在政府和 企业信息化的过程中更是离不开电子文档的应用和普及,在电子政务网和企业内 部网中电子文档的安全性也变得越来越重要。d i m 版权保护的技术解决了企业 网中的电子文档的保护问题,但还存在以下问题: 2 西北大学硕士毕业论文 1 目前国外的版权保护产品虽然比较成熟,但是价格昂贵,而国内同类 产品中较为成熟的a p a b i 也需要将文档转化为固有的格式才能进行有 效的保护,其局限性限制了a p a b i 的广泛应用。 2 由于文本文件中可插入标记的可辨认空间( p e r c e p t u a lh e a d r o o m ) 【1 5 】 小,而且在文本文件中嵌入信息易被读者发现,一些文字处理软件也 有会意无意之间改变文件破坏嵌入的数据,导致了文本数字水印的研 究发展缓慢,滞后于其他多媒体水印技术,文本水印算法多处于研究 实验的阶段,实用性差。 1 3 本文所做的工作 由1 2 节的分析可知,随着国内企业信息化的深化,各个公司、企业单位对 电子文档信息安全的需求越来越迫切,在电子政务网和企业内部网络中对电子文 档的版权保护技术的研究已经迫在眉睫。针对这个现状,本文对以下几个方面展 开了研究: 1 分析了当前数字版权保护领域的研究现状介绍了当前主要的数字版 权保护技术,包括数据加密技术、数字水印技术、d r m 技术,并介 绍了在d 蹦技术中数字水印的应用; 2 详细介绍了现有的文本水印算法,并进行了分类总结和比较。并在此 基础上,根据电子文档安全管理系统( d d p s ) 的授权特点,提出了 水印模块的需求:在w b r d 文件中嵌入水印后,可以通过w 0 r d 文件 或者二值文本图像来提取水印; 3 分别比较了文字和图像作为版权标识的鲁棒性;并分析了在w - 0 r d 文 档中嵌入数据的多少和执行时间之间的关系;通过大量实验重点对字 间距编码、字大小编码、字颜色编码和字体编码四种算法在w 6 r d 文 档中嵌入水印的性能进行了比较; 4 介绍了水印模块的工作原理和流程,并进行了执行效率、隐蔽性、兼 容性的实验和分析,实验结果说明了该水印模块可以在d d p s 系统起 到版权标识的作用,不会影响到系统原有功能,也不会影响其安全性。 西北大学硕士毕业论文 1 4 论文内容的安排 本文接下来的章节安排具体如下: 第二章主要介绍了现有的数字版权保护技术,对主流的数字版权保护技术做 了概括性的介绍,进而为本文研究重点做了铺垫。 第三章介绍了人类视觉系统和文本数字水印技术。着重介绍了文本信息隐藏 的特点,从鲁棒性、安全性、水印容量等角度对常见的文本数字水印算法进行分 析比较。 第四章重点讨论了针对w b r d 文档的文本水印技术。分别对基于字移编码和 特征编码等四种水印算法进行了实验分析和比较,提出了适合w b r d 文档特点的 字间距编码方式。 第五章结合第四章的结论,介绍了现有的电子文档保护系统d d p s ,并根据 d d p s 中用户授权的特点,提出了可以通过w b r d 文档嵌入水印并且可以通过二 值图像检测水印的水印模块。并且通过大量实验证明了水印算法的有效性。 第六章对所做的工作进行了总结并探讨应进一步开展的研究工作。 4 西北大学硕士毕业论文 第二章数字版权保护中的密码和水印技术 目前的版权保护可以分为两大类:一类是基于加密认证的版权保护,主要用 于控制内容的非法复制和传播;另一类是基于数字水印( d 睹t a lw a t e 册a r k i n g ) 的版权保护,侧重于隐藏版权信息,在版权受到非法侵害时提供电子证据。现有 的大部分商业化的d r m 多为传统的版权保护技术,基于密码技术或者密码技术 与水印技术相结合,但是数字水印技术的发展前景被普遍看好【5 1 。 其中密码学理论和密码技术是版权保护的重要基础,以密码学为基础的数据 加密技术、数字签名技术、消息认证与身份识别技术都是版权保护的核心技术。 尽管密码学在版权保护中占有重要的位置,但是它却有着固有的缺陷传统的 加密方法对内容的保护只局限在加密通信的信道中或其处于他加密状态下,一旦 解密,则毫无保护可言。 数字水印技术是由信息隐藏技术发展而来的,作为密码技术的补充,在版权 保护中应运而生。在d r m 系统中,可以将版权所有者的身份标识作为水印信息 嵌入在数据内容中为版权纠纷提供仲裁依据;在d i 蝴系统的访问控制中,把访 问控制条件作为水印嵌入在数字内容中,通过验证水印来判断用户的使用权限; 水印还可以作为数字内容跟踪、指纹和内奸跟踪的依据;数字水印技术更是从完 整性验证、所有权验证、内容认证等方面,完善了数字版权保护系统。它甚至被 认为是多媒体内容保护的最后一道防线。 数据加密技术与数字水印技术从不同角度保证信息的安全,然而解决信息安 全问题,并不仅仅依赖于技术和算法( 如加密芯片、安全协议等) 等措施,还依 赖健全的法制措施、道德观念和健全的保密措施,这些将不在本文进行讨论。 2 1 密码学简介 密码学( c r y p t o 笋印h y ) 是研究编制密码和破译密码的技术科学。研究密码 变化的客观规律,应用于编制密码以保守通信秘密的,称为编码学;应用于破译 密码以获取通信情报的,称为破译学,总称密码学。 数据加密将一段有意义的数据流按照通信双方按约定的法则转换成看起来 s 西北大学硕士毕业论文 没有意义的数据,使得在信息传递过程中非法拦截者无法从中获得正确的信息, 从而达到保密的目的。 在密码学中,有一个基本的k e r c l ( h o 凰假设,即密码算法是公开的,秘密必 须全部在密钥之中【16 1 。 2 1 1 密码通讯系统 在密码通信中,要传递的信息称为明文( p l a i n t e x t ) ;在信道上传送的加密后 的信息称为密文( c i p h e r t e x t ) ;把信息从明文转换成密文并保持信息的机密性的 被称为密钥( k e y ) ;从明文得到密文的过程称为加密,从密文中恢复明文的过 程称为解密( 或者脱密) ;加密和解密所采用的规则分别称为加密算法和解密算 法,加密算法和解密算法通称为密码算法。 密码通信系统是在密码通信过程中,发送方、接收方、密钥管理中心以及非 授权者共同组成系统,如图2 1 所示。 图2 1 密码通信系统 在密码通信系统中有两类非法攻击者:一是那些非法入侵者、攻击者或黑客 主动窜扰系统,采用删除、更改、插入、重放、伪造等手段向系统注入虚假信息, 进行干扰破坏的攻击,称作主动攻击;二是对密码通信系统采取截获密文进行窃 听分析的攻击,称作被动攻击。 2 1 2 密码体制 密码学是在编码与破译的斗争实践中逐步发展起来的,并随着先进科学技术 的应用,已成为一门综合性的尖端技术科学。 西北大学硕士毕业论文 在密码编制中进行明密变换的法则,称为密码的体制。古典的密码体制的基 本类型可以分为四种:错乱按照规定的图形和线路,改变明文字母或数码等 的位置成为密文;代替用一个或多个代替表将明文字母或数码等代替为密 文;密本用预先编定的字母或数字密码组,代替一定的词组单词等变明文为 密文;加乱用有限元素组成的一串序列作为乱数,按规定的算法,同明文序 列相结合变成密文。 现代加密算法中,根据加密和解密是否使用相同的密钥,被分成对称密码体 制和非对称密码体制。 对称密码体制:加密密钥和解密密钥相同,系统的安全性主要取决于密钥 的安全性,必须同过安全可靠的途径将密钥送至接收端。 在2 0 世纪7 0 年代,随着计算机网络及通信技术的发展,迫切需要有规范的 统一的保护信息的加密手段。1 9 7 3 年,美国国家标准局( n b s ) ,即现在国家标 准与技术研究所( n i s t ) 开始征集对数据加密标准的建议。由m m 公司提出的 d e s 加密算法作为分组加密算法是第一个而且是最著名的对称加密算法,在 1 9 7 7 年被采纳为联邦标准,它是密码学历史上的一个历程碑。在此之后,又有 很多优秀的算法问世,例如m a r s 、c r 6 、r j j i n d a e l 、s e r f i s h 和t w o f i s h 等算法。 非对称密码体制( 公钥密码体制) :主要特点是加密密钥和解密密钥各不 相同,可以将加密和解密能力分开,每个用户有一对密钥,其中一个是公钥,一 个是私钥,因而可以实现多个用户加密消息,只能由一个用户解读( 如加密运算) , 也可以实现一个用户对消息签名而使多个用户验证。公钥密码体制的安全性在于 从公钥和密文推出明文或私钥在计算上是不可行的。 2 2 数字水印技术 数字水印( d i 百t a lw a t e n n 溅n g ) 技术是由信息隐藏技术发展而来的,是在 将一些标识信息( 可以是一段文字、图片、序列号等) 直接嵌入数字内容当中, 但不影响原内容的价值。水印通常是不可见或不可察的,它与原始数据( 如图像、 音频、视频数据等) 紧密结合并隐藏其中,成为原数据不可分割的一部分,并可 以经历一些不破坏原数据实用价值或商用价值的操作而存活下来【1 7 】。通过这些 7 西北大学硕士毕业论文 隐藏在数字内容中的标识信息,可以确认数字内容创建者、购买者,或者判断数 字内容的真实性、完整性。 2 2 1 信息隐藏技术简介 信息隐藏是研究如何将某一信息隐藏于另一个公开的信息中,然后通过公开 的信息的传输来传递隐藏信息的一种技术。隐藏信息起源于古老的隐写术【1 8 】, 早在公元前就被使用了。如今,互联网、数字通信和多媒体技术的广泛应用,为 信息隐藏技术的发展提供了更加广阔的空问。 信息之所以能够隐藏在多媒体数据中是因为【1 9 】: 多媒体信息本身存在很大的冗余,从信息论的角度看,未压缩的多媒体信 息的编码效率是很低的,所以在不影响多媒体信息本身传送和使用的前提下,将 某些信息嵌入其中进行秘密传送是完全可行的。 人眼或人耳本身对某些信息都有一定的掩蔽效应,比如人眼对灰度的分辨 率只有几十个灰度级;对图像边缘附近的信息不敏感等。利用人体感官的这些特 点,可以很好地将信息隐藏而不被察觉。 在信息隐藏的通用模型中,待隐藏的信息为秘密信息( s e c r e tm e s s a g e ) ,它可 以是版权信息或秘密数据,也可以是一个序列号;公开信息为载体信息( c o v e r m e s s a g e ) ,如图像、视频、文本或音频信号。信息的隐藏一般由密钥( k e y ) 来控制, 即通过嵌入算法( e m b e d d i n ga l g o r i t h m ) 将秘密信息隐藏于公开信息中,而隐藏载 体( 隐藏有秘密信息的公开信息) 则通过信道( c o m m u m c a i i o nc h 枷e 1 ) 传递,然后监 测器( d e t e c t o r ) 利用密钥从掩蔽载体中回复或检测秘密信息【1 9 2 0 1 ,如图2 2 所示。 信息隐藏技术主要由下述两部分组成: 信息嵌入算法,它利用密钥 载体信息。 来实现秘密信息的隐藏。 秘密信息s 隐蔽信息检测提取算法( 检 测器) ,它利用密钥从隐蔽载体中检 测恢复出秘密信息。在密钥未知的 前提下,第三者很难从隐秘载体中 秘密信息s 得到或删除,甚至发现秘密信息。 一一 , 叫检测器卜一含噪携密信息s 一 图2 2 信息隐藏模型 西北大学硕士毕业论文 信息隐藏技术是一个新兴的知识领域,尽管还处在发展研究阶段,可也已经 具有了自己的意义和内涵。如今信息隐藏技术包含的内容十分广泛,可以作如图 2 3 所示的分类【1 9 ,2 1 1 。 ( i n r o r m a t i o nh i d i n g ) 隐秘通道信息隐秘技术匿名技术数字水印 ( c o n v e r tc h a n n e i s ) ( s t e g a o g r a g b y )( a n o y m i t y )( c o p y r i g h t 、i a r k i n g ) 厂l 厂- 语义隐秘术 其他隐秘术 健壮的数字水印 灵敏的数字水印 ( l i n g u i s t i c ( t e c h n i c a i( r o b u s t( f r ag i l e s t e g a n o g r a g h y )s t e g a n o g r a g h y )c o p y r i g h t | 、i a r k i n g )w a t e r m a r k i n g ) 广 数字指纹数字水印 ( f i n g e r p r i n t i n g )( w a t e r 巾a r k j n g ) 厂l 不可见的数字水印可见的数字水印 ( i m p e r c e p t i b l e ( v j s i b i e w a t e r m a r k i g ) w a t e r m a r k i n g ) 图2 3 信息隐藏的分类 2 2 2 数字水印原理 一个数字水印方案一般包括三个基本方面:水印的生成、水印的嵌入和水印 的提取( 或检测) 。数字水印技术实际上是通过对水印载体媒质的分析、嵌入信 息的预处理、信息嵌入点的选择、嵌入方式的设计、嵌入调制的控制等几个相关 技术环节进行合理优化,寻求满足不可感知性、安全可靠性、稳健性等诸条件约 束下的准最优化设计问题【2 1 1 。 图2 4 所示为一个数字水印系统的水印嵌入和提取过程。 图2 _ 4 数字水印的嵌入和提取过程 数字水印的存在要以不破坏原始作品的欣赏价值和使用价值为原则,一般来 讲,数字水印应具有以下信息隐藏的基本特征: 1 ) 不可感知性,亦称为不易察觉性、隐蔽性性。指水印与原始数据紧密结 西北大学硕士毕业论文 合并隐藏其中,不影响原始数据的正常使用的特性。如图2 4 中带有水印的文件 i 与原始文件i 的相似性。 2 ) 鲁棒性。嵌入的水印信息能够抵抗在数字作品应用过程中的各种恶意或 非恶意的操作。即经过了各种攻击后是否还能提取水印信息w ,提取的w 和 原始水印信息w 是否相似,w 是否能有效的证明文件i 的版权。 3 ) 安全性。未授权者不能伪造水印或检测出水印。图2 4 中密钥k 对水印 的嵌入过程进行置乱加强安全性,避免没有密钥的使用者恢复和修改水印。 4 ) 易用性。指水印的嵌入和提取算法是否简单易于。比如图2 4 中水印嵌 入算法c 和水印提取算法d 的实用性,执行效率等。 数字水印技术除应具有以上信息隐藏技术的一般特点,还有其固有的特点和 研究方法。例如,从信息安全的保密角度而言,若隐藏的信息如果被破坏掉,系 统仍可以视为安全的,因为秘密信息并未泄露;但是,在数字水印中,隐藏信息 的丢失意味着版权信息的丢失,从而失去了版权保护的功能,这一系统便是失败 的。因此,数字水印技术通常都要求较高的鲁棒性、安全性和隐蔽性。 2 2 3 数字水印的分类 数字水印的分类方法有很多种,分类的出发点不同导致了分类结果的不同, 最常见的分类方法包括以下几类【2 2 2 3 ,2 4 】: 1 按可见性分类 如果嵌入的水印信号强度足够大,能够用肉眼直接观察到,则称之为可见水 印。而不可见水印的数据通常与原始数据紧密结合在一起,难以用肉眼观察。 2 按作用分类 按作用可将数字水印分为鲁棒水印和水印。脆弱性水印很容易被破坏,主要 应用于数据的完整性验证,判断载体数据是否被篡改。它随着对象的修改而破坏 即使是载体数据极细微的变化也会影响数字水印的提取和检测的结果。鲁棒水印 主要用于版权保护,嵌入的水印能抵抗常见的编辑处理、图像处理和有损压缩等, 在经历有意或无意的破坏后,水印仍能检测出来以提供认证。鲁棒水印是当前数 字水印研究的重点。 3 按检测方法分类 1 0 西北大学硕士毕业论文 按水印检测是否需要原作品可分为盲水印和非盲水印。在提取或检测水印的 过程中,如果需要原始数据来提取水印信号,称为非盲水印算法;如果不需要原 始数据参与,可直接根据水印数据来提取出水印信号,称为育水印算法。一般来 说,非盲水印比盲水印更安全,但盲水印更符合所有权验证的需要,是水印算法 发展的方向。 4 按水印嵌入的方法分类 根据嵌入技术的不同可分为空域水印和变换域水印。时空域水印技术是指将 水印信息嵌入在数字作品的时间域( 常用于数字音频作品) 或空间域( 主要针对 数字图像或视频) 采样点的幅度值中。基于变换域的技术是先对作品做某种变换, 常用的变换技术有离散傅里叶变换、离散余弦变换、离散小波变换等,然后把水 印信息嵌入到作品的变换域的系数中。 5 按水印内容分类 按内容可将水印划分为有意义水印和无意义水印。有意义水印是指水印本身 是有意义的文字、数字图像( 商标、印鉴等) 或者数字音频片段的编码。无意义 水印则只对应于一个序列号。有意义水印的优势在于:如果由于受到攻击或其他 原因致使提取出的水印受损,人们仍然可以通过视觉观察确认是否有水印;但对 于无意义水印来说,如果解码后的水印序列有若干码元错误,则只能通过统计决 策来确定信号中是否含有水印。 6 按用途分类 可分为版权保护水印、篡改提示水印、票据防伪水印、隐蔽标识水印、印刷 数字水印等。 7 按水印的载体分类 可将水印分为图像数字水印、视频数字水印、音频数字水印、文本数字水印 和关系数据库数字水印技术等。到目前为止,图像数字水印是研究最多也是最成 熟的技术,主要用于数字图像的版权保护。视频水印技术主要是将水印数据直接 嵌入视频流中,从而控制视频的应用,如d v d 的控制存取、数字广播的控制等。 音频水印主要用于网上音乐等音频数字的版权保护。由于关系数据库数据本身的 特殊性,关系数据库数字水印技术在国内研究很少,它可用来验证关系数据库的 所有权归属。文本水印技术所处理的文本既可以b 【t 纯文本,也可以是格式化的 西北大学硕士毕业论文 文本,如h t m l 、p d f 、d o c 等格式的文件,又可将文本当作二值图像来处理。关 系数据库数字水印技术可用来验证关系数据库的所有权归属,但是由于关系数据 库数据本身的特殊性,该类在国内研究很少。 8 私有水印和公开水印 私有水印只能被持有人读取或检测,而公开水印可以被公众提取或检测。通 常来说,公开水印的安全性和鲁棒性比不上私有水印,但公开水印在声明版权信 息,和预防侵权行为上无疑具有优势,是水印发展的方向。 9 对称水印和非称水印 当嵌入水印与提取水印过程所使用的密钥相同时,相应的水印( 算法) 称为 对称水印( 算法) 。当嵌入水印与提取水印过程所使用的密钥不同时,相应的水 印( 算法) 称为非对称水印( 算法) 。 2 3d r m 技术 数字版权管理( d i 西t a l 融曲t sm a n a g e m e n t ,d r m ) ,就是对各类数字内容的 知识产权进行保护的一系列软硬件技术。d 蹦的作用是对数字化信息内容在其 生存周期内的存取进行控制,包含了版权使用的描述、识别、交易、监控,对有 形和无形资产的各种权限的跟踪和对版权所有人关系的管理等内容。d i w 的核 心就是通过各种信息安全技术锁定和限制数字内容及其分发途径,防范对数字产 品无授权复制和使用,保护数字内容的知识产权。d r m 的目的就是通过技术的 手段,在整个生命周期内,对数字内容的知识产权进行保护,确保数字内容的合 法使用和传播。 2 3 1d r m 的概述 d r m 包括对数字资产各种形式的使用进行描述、识别、交易、保护、监控 和跟踪等各个过程,贯穿数字内容的整个生命周期。对数字内容的版权进行保护, 必须根据所保护的数字内容特征,并按照相应的商业模式和现行的法律体系进 行。数字版权保护技术和商业模式、法律基础三者相辅相成,构成整个数字版权 保护体系,对各类数字内容版权进行有效的管理和保护。 1 2 西北人学硕士毕业论文 1 d 1 w 的体系结构 不同的d i m 系统虽然在所侧重的保护对象、支持的商业模式和采用的技术 方面不尽相同,但是它们的核心思想是相同的,都是通过使用数字许可证来保护 数字内容的版权,用户得到数字内容后,必须获得相应的数字许可证才可以使用 该内容。 图2 5 给出典型d r m 系统的参考体系结构,包括三个主要模块:内容服务 器( c o n t e n ts e n ,e r ) 、许可证服务器( 1 i c e n s es e e r ) 和客户端( c l i e n t ) 。 内容服务器 窑喜人偷 垒鏖j 面r m 打雹 一 产品信r 厂 息薛l 金融交易 内容 仓库 d r m 许可 证生成器 别睦 钥库jl 二”二 许可证服务器 客户端 数字内容包一孕 | 内容数据 陵 i :丽亲孳氅瑾d 一黾蝣怕m 、嚏僦轴魂涌掌 d r m 、i 数字内容 控制器i 使用工具 数字许可证? 内容密钥 标 识 图2 5d i t m 系统参考体裂d 】 内容服务器:通常包括存储数字内容的内容仓库、存储产品信息的产品信息 库和对数字内容进行安全处理的d r m 打包工具。该模块主要实现对数字内容的 加密、嵌入数字水印等处理并将处理结果和内容标识元数据等信息一起打包成可 以分发的数字内容。另外一个功能就是创建数字内容的使用权利,将数字内容密 钥和使用权利信息发送给许可证服务器。 许可证服务器:包含权利库、内容密钥库、用户身份标识库和d 蹦许可证 生成器。该模块主要用来生成并分发数字许可证,还可以实现用户身份认证、触 发支付等金融交易事务。数字许可证是一个用权利描述语言来描述数字内容授权 信息的计算机文件,包含了数字内容使用权利( 包括使用权限、使用次数、使用 期限和使用条件等) 、许可证颁发者及其拥有者信息。大多数d r m 系统中,数 字内容本身经过加密处理。因此,数字许可证通常还包含了数字内容的解密密钥。 西北大学硕士毕业论文 客户端:主要包含d r m 控制器和数字内容使用工具。d i 洲控制器负责收 集用户身份标识等信息,向许可证服务器申请许可证,控制用户对数字内容的使 用。数字内容控制器用来辅助用户使用数字内容。 2 关键技术和问题 数字版权保护不是密码技术的简单应用,也不是将受保护的内容从服务器传 递到客户端并用某种方式限制其使用的简单机制【4 乃】。内容提供者希望通过使用 d i 泓,保护数字作品的版权,促进数字化市场的发展。因此,用户对d i w 系统 的接受度也是必须考虑的。 一个完善的d 1 w 系统必须兼顾提供者和使用者双方的需求,具备以下功能: 保证内容不能被非法复制。 保证内容不被非法篡改。 保证版权相关信息的可验证性和完整性。 内容的拥有者可以控制内容的再次传播。 2 3 2 数字水印技术在d r m 中的应用 目前大多数商业化的d r m 都是基于传统加密的版权保护技术的,主要用于 控制内容的非法是使用、复制和传播,而数字水印技术可以隐藏版权信息,在版 权受到非法侵害时提供电子证据。虽然数字水印技术尚处于实验研究阶段,但其 发展前景被普遍看好。 在版权保护领域,数字水印技术的典型应用大致分为以下几类【2 6 】: ( 1 ) 显示地表明版权信息。通过让使用者察觉数字水印存在,警示使用者 注意使用规则,禁止非法传播。 ( 2 ) 作为确认拥有内容的证据。拥有者在数字产品中嵌入含有其身份信息 的数字水印,在发生法律纠纷时可以由第三方提取水印作为诉讼证据。 ( 3 ) 自动搜索盗版实例。比如利用1 1 1 t e m e t 搜索引擎在网上自动搜索d v d 、 m p 3 以及各种视频文件并检测其版权信息,将发现盗版则将网址记录在案。 在d i 蝴系统中,数字水印技术有如下的用途: ( 1 ) 保护元数据。在d r m 系统中,将与著作权相关的信息组成一个元数 据,然后利用数字水印技术将元数据和数字内容绑定。由于元数据中含有版权信 1 4 西北人学硕士毕业论文 息和使用条款,数字水印可以为元数据提供安全保障。 ( 2 ) 用于盗版取证和追踪。出品人可将不同用户的i d 作为不同的水印数据 ( 数字指纹) 嵌入作品的合法拷贝中以用于盗版取证和追踪。 ( 3 ) 用于数据加注解和访问控制。这种水印称为注解水印( a n n o t a t i o n w a t e m a r k ) 。当数字内容在用户的播放设备中被访问时,用户的播放设备就对加 注解水印进行计数、核对使用限制、根据需求更新水印。 ( 4 ) 用于篡改提示与完整性保护,脆弱水印可以用于保护数字作品的完整 性。 ( 5 ) 可将许可证信息作为水印嵌入到数字内容中,用于保护许可证信息。 2 4 小结 本章介绍了目前版权保护的两个主要的技术数据加密技术和数字水印 技术。概述了密码系统框架和密码体制;较为详细的介绍了数字水印原理,并对 数字水印算法进行了较为详细的分类:最后又介绍了在版权保护领域中数字水印 技术的应用。本章的讨论为本文的研究重点提供了理论基础。 1 5 西北大学硕士毕业论文 第三章文本数字水印 目前关于数字水印的研究大多集中在图像、视频和音频方面,这是因为图像、 视频、音频等载体的信息冗余性较大,人的感官对这些信息的掩蔽效应明显,可 隐藏的信息量也就相对较大。相比之下,文本信息中的冗余较小,想要嵌入不可 感知的信息相对艰难。但是,在文本中的信息隐藏也具有重要的价值,文本水印 同样能够在军事、政务、商务、网络出版等方面发挥重要作用。 3 1h v s 概述 中国自古就有谚语:“耳听为虚,眼见为实”、“百闻不如一见”,英语中也有 “s e e i n gi sb e l i e v i n g ”的说法。这些都表明人们习惯于相信自己眼睛所看见的, 而这正是信息隐藏技术得以存在和发展的前提【2 7 1 。 最近几年,人们在信息隐藏的研究中引入了人类视觉系统( h u m a i lv i s i o n s y s t e m ,h v s ) 的模型,使之成为信息隐藏领域中的一个新的研究手段【2 引,利用 人类视觉的掩蔽效应进行信息隐藏,在具有较强鲁棒性的基础上,可以进一步提 高秘密信息的隐蔽性。 根据对h v s 的研究,可知它具有以下特性: 人眼对于色彩不如对亮度敏感; 人眼对于不同灰度等级的敏感性不同,对中等灰度最为敏感; 对图像平滑区的噪声敏感,对纹理区域的噪声不敏感; 对于不同时空分布特征信号的响应是不同的,通常人眼对较高频率的高 频信息敏感程度低于相对较低频率的信息: 人眼对不同方向上的敏感程度也不同,对图像中倾斜方向的纹理不敏感; 在不同背景亮度和不同边缘变化程度的情况下,对误差的敏感程度也不 相同。 1 6 西北大学硕士毕业论文 3 2 文本信息隐藏的载体 3 2 1 文本的概念 一个符号如果具有记录语言的功能,我们便将它视作一个文字,文本即是由 这些符号所组成的序列。用于文本信息隐藏的文本载体类型可以分成以下几种 【2 7 2 9 】: 1 纯文本文档,指a c s i i 码文本文档或计算机源代码文档。这样的文档没 有格式信息,编辑简单,使用方便,但是因为这种类型的文档不存在可插入标记 的可辨认空间( p e r c e p t u a lh e a d r o o m ) 【1 5 】,很难嵌入秘密信息,一般需要被保护 和认证的正式文档也不会用这种格式存储。 2 格式化的文档,一般指w o r d 、p d f 、p o s t s c r i p t 、聊s 等文档中除了有文 本信息本身以外,还有很多用来标记文字格式和版面布局冗余信息。对于这类文 档,可以把水印信息嵌入到它们的文字的格式化编排中,例如行、字间距、字体、 文字大小和颜色等不足以被人眼发现的微小变化都可以用来进行信息的隐藏。 3 文本图像,包括包含文本内容的灰度图像或二值图像,其中以二值文本 图像为主。二值图像中的像素仅有“o 或“1 ”两种取值。针对这类文档,现有 的主要数字水印技术就是翻动图像中的个别象素来嵌入秘密信息。 4 纸质文本,这类载体若要实现隐藏信息的自动提取,需要先对其进行数 字化、文字和排版识别等步骤。 3 2 2 文本文件的格式 随着计算机技术的快速发展,电子文本文档的种类越来越丰富,许多系统都 有自己特定的文件格式。目前,主要的电子文本文档格式有:纯文本的t x t 文 件和源程序文件,还包括具有一定格式的w b r d 、h t m l 、p o s t s c r i p t 、p d f 、i 盯f 、 l 、e m a i l 等文件。 那么,到底纯文本文件与格式化文件有什么区别呢? 请看下例2 9 】: 分别新建w - o r d 文档t e s t d o c 和文本文档t e s t 饮t ,输入同样的内容: “w b l c o m et oo u rs c h 0 0 l ! 保存退出后,比较这两个文件的长度。 1 7 西北大学硕士毕业论文 通过对上例w b r d 文档和文本文件的比较,我们发现:尽管这两个文件中的 文字是一样的,但是w b r d 文档的长度远远大于该文件中包含的字符个数,而纯 文本文件的长度刚好等于该文件中所含字符的个数。之所以会有这样的结果,是 因为w - o r d 文档中的文字有比较复杂的格式,而纯文本文件中的文字没有任何格 式。 可见,格式化与非格式化的文本文件的区别是: 文本文件中如果只有文本信息,除了换行和回车外,不包括其他有关格式的 信息,则称为非格式化文本文件或纯文本文件。 而带有各种文本排版信息等格式信息的文本文件,称格式化文本文件,如 w r o r d 文档和、p s 文件。该类文件中带有段落格式、字体格式、文章的编号、 分栏、边框等格式信息。 3 3 文本数字水印算法 到目前为止,文本数字水印技术已经发展了近十年的时间,出现了很多经典 的以文本为载体的数字隐藏算法,不仅可以将水印信息嵌入在文本的排版布局 中、字符的格式位置中、文字的结构特点中,甚至是载体文件文本的本身也可以 携带水印信息。 下面是文本数字水印嵌入过程的通用模型: 选择需嵌入文本的水印信息; 将水印信息加密编码; 预处理文本载体文件; 尽可能用不可察觉的方式将该加密后的水印信息嵌入到文本数据中。 本节将着重介绍现有的几种文本水印算法,并进行比较。 3 3 1 文档结构微调算法 文档结构微调算法是通过对文本文档空间域的变换来嵌入数据的。文档的空 间域不仅包括文本的字符、行、段落的结构布局,也包括了字符的形状和颜色。 由h v s 的特点可知,人眼对图像中某些细微的变化不敏感,文本中文字的 西北大学硕士毕业论文 布局、结构某些微小的变化也不足引起人眼的注意,所以可以通过微调这些文档 的结构来嵌入水印信息。基于此,b r a s s i l 和m a ) ( e m c h u k 等人提出在p o s t s c p t 文档中通过微调字符位置、形状来插入隐藏信息的多种方法【3 0 ,3 1 】;之后文献 3 2 ,3 3 ,3 4 】中又提出了通过在文本句中添加不会引起人们注意的空格来隐藏数 据;根据字符颜色r g b 值的微小变化人眼视觉不易察觉的,文献 3 5 ,3 6 】中又提 出了将信息隐藏在字符颜色中。 1 行移编码 大部分文档格式有一个特点,即一段文字中文本行之间的距离是均匀的。人 眼无法察觉小于等于1 3 0 0 英寸的垂直位移量 30 1 ,行间距编码方法正是通过垂直 移动文本行的位置来实现信息隐藏的。 b r a s s i l 等人提出的行间距编码方法中,通过一行文本的上移或下移来表示信 息“0 或“1 ”,与其相邻的两个文本作为解码过程的参考行保持不动。为提取 准确,通常页面上第一行、最后一行以及较短的行都不作编码。 该编码方式一般应用于有格式的文本文档,也可应用于二值文本图像的。该 编码方式可嵌入的隐藏信息量较小,一般情况下2 行文本才能嵌入1b i t 的数据。 与英文相比,汉字的重心和字形的中心相近,且汉字文本行图像的高度基本 相同。根据汉字文本的这些特点,黄华等人提出了种新的行移标记策略和相应的 质心检测方法【3 7 】。新的标记策略不仅提高了算法容量,在1 行文本中就能嵌入l b i t 的信息量;检测水印信息时可以通过每行文字的质心相对距离实现盲检。 2 字移编码 人眼无法辨认1 15 0 英寸以内的水平位移量【3 0 1 ,b r a s s i l 等人提出的字移编码 就是通过将文本某一行中的某些字符进行水平移位来嵌入水印的。 在字移编码时,将某一单词左移或右移来表示“o 或“l ,而与其相邻的 单词作为参考位置不动。经过编码的文本中单词之间的间隔变化很小并不均匀 的,因此不易被察觉。该编码方式唯一的限制是被编码的文字所在的文本行中所 有单词水平位移的总和为o ,以保持行的正确排序不被打乱。如图3 1 所示,( a ) 中第一行文本中单词“f o r ”之前的间距增加了,( b ) 显示的是( a ) 中同样的文 字,只是去掉标记用的竖线之后,几乎不易发现文本的变化。 1 9 西北大学硕士毕业论文 由于英文文本中单词间距原本 就不固定,因此在检测水印时需要 原始文档。该编码方式可以应用于 一般有格式的文本文档,也可应用 于二进制图像的文档。此方法比行 间距编码隐藏的信息量大,最好情 况下1 个单词可隐藏lb i t 的数据。 3 特征编码 n 0 wi s【i l et i m ef o r童1 1m e n w o m e nt 0 w1 s出ed m e:o rl m e n w o m e n【o 一 ( a ) n o wi st h et i m ef o ra _ um e n w o m e nt o n o wi st h e 胁ef b ra um e n w o m e nt o ( b ) 图3 1 字移编码实例【3 0 】 特征编码就是通过改变文档中某个字符的某一特征来嵌入秘密信息【3 0 1 。在 编码过程中,先确定需要改变文本中哪些字符的特征,然后根据所定的规则 “代码字”,扫描全文中的所有字符,变换符合该规则的字符,而不符合规则的 字符保留原来的特征不变。例如稍为修改字母b 、d 、h 、k 等中的垂直线的长度。 如图3 1 所示:( a ) 图为没有 进行编码的文字图像,( b ) 图为在 特征编码之后的文字图像,为了能 够明显的看出来字符编码后字符特 征发生的变化,则将该变化放大显 示如图( c ) 。 该编码方式可以同样适用于一般有格式的文本文档,也可应用于二进制图像 的文档。此方法可隐藏的信息量大小与字间距编码方法差不多,在最好情况下1 个字符可隐藏1 b i t 的信息量。通过字母变化在文本中插入不易辨认的标记要非常 细心,不会改变该字母和上下文的结合关系。 此外,还有通过改变字体的类型、标点的类型甚至词汇字母的类型来达到信 息隐藏的。例如n o r t h w e s tu 嘶v e r s i t yo f c o m p u t e rs c i e n c ea j l dt e c h n 0 1 0 9 y ”,如 果需要隐藏“1 0 0 0 0 1 ”则可以将第2 、3 、4 、5 个词汇的首字母改为斜体即可, “n o n h w e s t 己,n i v e r s i t yd fc d 疗妒“r p ,f 朗c pa n dt e c l l n o l o g y ”。比如,眭新光等人 提出了在超文本中通过修改标记字母的大小写嵌入秘密信息的水印算法【38 1 。 4 附加空格编码 附加空格编码是对字移编码的一种改进,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年高级经济师工商管理真题解析
- 中央会议规范管理办法
- 规划设计资质管理办法
- 农业养殖技术合作服务合同
- 虚拟记忆植入-洞察及研究
- 2025年中国建设银行借款合同范文
- 2025物资采购施工合同范本
- 城市公共照明设施建设与维护合同
- 销售代理合同细则说明
- 2025年独立运行户用风力发电机组合作协议书
- 文言实词本义引申义
- 07J902-3 医疗建筑(卫生间、淋浴间、洗池)
- 2024年网上大学智能云服务交付工程师认证考试题库800题(含答案)
- SJG 110-2022 附建式变电站设计防火标准
- 《中式烹调工艺》课件-热菜烹调工艺
- 中华民族共同体概论课件专家版2第二讲 树立正确的中华民族历史观
- 仓库发错货的解决方案
- 金属冶炼安全事故案例与分析
- 南京市2023-2024高一上学期期末英语试卷及答案
- 输液泵、微量泵技术操作规程及评分标准
- 数字孪生及车间实践第三篇数字孪生车间
评论
0/150
提交评论