




已阅读5页,还剩66页未读, 继续免费阅读
(计算机应用技术专业论文)基于标点符号的中文文本数字水印的设计与研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 基于标点符号的中文文本 数字水印的设计与研究 摘要 随着因特网的迅猛发展和多媒体技术的广泛应用 越来越多的数字 作品通过网路的形式传输 发表 使得这些作品的版权保护技术显得尤 为重要 数字水印是一种有效的数字产品版权保护技术 对数字水印的研究目前主要集中在以图像 声音等载体来进行信息 的隐藏 以文本为载体的水印技术方面的研究成果较少 而事实上 人 们的很多创意都以文本的方式储存和传输 文本作为信息传递的一种手 段 其应用大大地超过了图像 视频和音频的范围 同时随着高性能打 印机和扫描仪的不断出现 对于印刷出版物的制假 造假 盗版等行为 日益猖獗 而传统的印刷品防伪技术又存在着高成本 技术复杂 应用 面窄等缺点 假冒伪劣产品严重侵害了图书出版作者的利益 与其他印 刷品防伪技术相比 将数字水印技术应用于图书等印刷出版物防伪方面 成本低 实现简单 是一项对传统印刷品防伪技术的发展和改进 本文针对传统文本水印方法存在的不足和中文汉字本身的复杂度 提出了一种新的基于文本中的标点符号的水印算法 该方法基于对中文 文档中的标点符号的分析和比较 在不影响文本字体格式和内容的情况 下 利用人类视觉过程对标点符号的形状不敏感 阅读文章时不会把视 线过多地停留在标点符号上的特点 将相关的版权信息嵌入到文本之 中 并利用密码学中的多表代换方式和信息处理中的纠错编码 对水印 信息进行预处理 实现了对水印信息的加密和保护 为了说明本文所提出方法的可行性 本文选取了以w i n d o w sx p 操 作系统为工作平台 基于v i s u a lc m f c 和m a t l a b 7 0 环境对文本数 字水印算法做了仿真实验 结果表明 本文所提出的文本水印的研究成 果突破了现有的水印方法 尤其是对中文文本嵌入水印的难题进行了有 益的尝试 对于图书等印刷品领域的版权保护的研究和发展有着重要意 义 关键词 文本水印 信息隐藏 标点符号 版权保护 i i a b s t r a c t d e s i g na n dr e s e a r c ho f t e x tw a t e r m a r k i n gb a s e d o ni n t e r pu n c t i o n s a b s t r a c t w i t ht h er a p i dd e v e l 叩i n go fi n t e m e ta n dt h ew i d eu s i n go fm u l t i m e d i a t e c h n i q u e m o r ea n dm o r ed i g i t a l p r o d u c t sh a v e b e e nc o n v e y e d a 1 1 d p u b l i s h e dt h r o u 曲t h en e t i ti su r g e n tt op r o t e c tt l l ec o p y r i 曲to ft h e s e p r o d u c t s d i 百t a lw r a t e 册砒i n gi s 锄e 腩c t i v e 妣h n o l o g yf o rc o p r r i 咖 p r o t e c t i o ni nr e c e n ty e a r s c u r r e n t l y w 乱e 加a r k i n gr e s e a r c h sa r em o s t l yf o c u s e do ni m a g ea n d a u d i of o r l l i d i n gi n f i o m i a t i o n m e a n w h i l e t 1 1 e r e s e a r c h so ft e x ta s a c o v e r o b j e c ta r er e l a t i v e l yf e w e r b u ti nf a c t l o t so fp e o p l e so r i g i n a l i t yc a nb es a v e da j l dt r a n s 触db y t h ew a yo ft e x t a sa j l i m p o r t a n tw a yo fi n f o n n a t i o nt r a n s f i e 玎i n g t h e 印p l i c a t i o no ft e x te x c e e d sc o n s u m e d l yi m a g e v i d e o a u d i o e t c w i t ht h e i n v e n t i n go f t 1 1 eh i 曲p e r f o m a n c ep r i n t e ra n ds c a n n e r f a k i n ga n dp i r a t i n g o nt h ep r e s s w o r kp u b l i c a t i o na r er 锄p a n t a n dt h et r a d i t i o n a lt e c h n i q u e so f t h ep r e s s w o r kp u b l i c a t i o nh a v 9s o m es h o n c o m i n g s s u c ha u sh i 曲c o s t c o m p l e xt e c h n i q u e s a n ds m a l lc o v e r t h e r e f o r e t h eb e n e f i t so f t h ea u t h o r s h a v eb e e ns t r i c t l yl o s e db yf a k i n ga n dp i i a t i n gp r e s s w o r s c o l n p a r e dt ot h e i i i 北京化t 大学硕t 学位论义 o t h e rt e c h n i a u e s i ti sas i 2 n i f i c a t i v et r ya n dd e v e l o p m e n tt oc o m b i n et h e0 t h e rt e c h n l q u e s l tl sas l g n l t l c a l l v et r ya n qq e v e j o p m e n oc o i i l d l i l e i l e d i g i t a lw a t e r m a r k i n gw i t ht h ep r o t e c t i o no fp u b l i c a t i o nb e c a u s eo f i t sl o w e r c o s ta n ds i m p l yi m p l e m e n t b a s e do na n a l y s i so fd i s a d v a n t a g e so ft h ep r e s e n ta l g o r i t h m sa n dt h e c o m p l e x i t o ft h ec h i n e s et e x t t h i sp a p e rp r e s e n t sa n e wt e x t w a t e n n a r k i n g u s i n gm ei n t e 印u n c t i o n sa sc o v e r o b j e c ti nt h et e x t m e a n w h i l e a c c o r d i n gt o t h es i m i l a r i t yo ni n t e 叩u n c t i o n si nd i f f e r e n tm o d e sa n dl o ws e n s i t i v i t yo ft h e h u m a n sv i s u a ls y s t e m s v h e nt h er e a d e r st a k eal o o ko ft h ea r t i c l e s t h e y d o n tp a ym u c ha t t e n t i o no nt h ei n t e 印u n c t i o n s u s m gt h e s ec h a r a c t e r i s t i c s t h e 访f o m a t i o n s 他i c ha r ep r o t e c t e dc 锄b ee m b e d d e di m ot h et e x t b e f o r e e m b e d d i n gt h ei n f o n n a t i o n s w eu s et h ea l g o r i t h i i l si nc r 伊t o l o g ya n dt h e d i 酋f e r e n te n c o d i n gm e t h o d si nc o m m u n i c a t i o n l o g r e s sa sap r e p r o g r e s s w h i c hc a nm a k em l lu s eo ft h ew a t e m l a 伙i n gi n f o r m a t i o n sa n dp r o t e c tt h e m i no r d e rt os h o wt h ef e a s i b i l i 够o ft h et e x t w a t e 肌a r l i n ga l g o r i t h m p r e s e n t e db yt h i sp 印e r at e x t w a t e m a r k i n gp r o g r a mb a s e do n t h ew i n d o w s x pi sd e s i g n e da n dd e v e l o p e du s i n g s u a lc m f ca n dm a t l a b 7 0 即1 ee x p e r i m e n t a lr e s u l t sc a np r o v et h a tt h i sm o t h e db r e a kt h r o u 曲t 1 1 e t r a d i t i o n a lt e x t w a t 唧a r k m g e s p e c i a l l y f o rt h ec h i n e s et e x ta n dt h i s a l g o r i t h i n h a sa ni m p o 咖ts i g n i f i c a t i o n f o rr e s e a r c h e sa n dd e v e l o p m e 鹏f o r t h ep u b l i c a t i o n k e yw o r d s r e x t w a t e r m a r 虹n g i n f o n i l a t i o nh i d i n g i n t e 印u n c t i o n s i v a b s t r a c t c o p y r i g h tp r o t e c t i o n v 北京化工大学位论文原创性声明 本人郑重声明 所呈交的学位论文 是本人在导师的指导下 独 立进行研究工作所取得的成果 除文中已经注明引用的内容外 本论文 不含任何其他个人或集体已经发表或撰写过的作品成果 对本文的研究 做出重要贡献的个人和集体 均已在文中以明确方式标明 本人完全意 识到本声明的法律结果由本人承担 作者签名 j 醴翌二l 日期 丑也丑j 卜 关于论文使用授权的说明 学位论文作者完全了解北京化工大学有关保留和使用学位论文 的规定 即 研究生在校攻读学位期间论文工作的知识产权单位属 北京化工大学 学校有权保留并向国家有关部门或机构送交论文的 复印件和磁盘 允许学位论文被查阅和借阅 学校可以公布学位论 文的全部或部分内容 可以允许采用影印 缩印或其它复制手段保 存 汇编学位论文 本学位论文不属于保密范围 作者签名 涵盈 一 导师签名 适用本授权书 日期 幺泣上1 日期 靼扯与 一 第一章绪论 1 1 课题研究的背景和意义 第一章绪论 多媒体技术和网络技术的发展 使得数字化声音 图像 音乐 视频和文本等 电子出版物可以被快速准确地获取 传输和存储 这些已经成为信息交流 尤其是 网上信息交流的重要方式 但是 网络在给人们带来便利的同时也暴露出越来越严 重的信息安全问题 如作品侵权更加容易 篡改更加方便等 另外 高性能打印机 和扫描仪的出现 使得印刷图书作品的盗版也日益猖獗 i l 因此 如何既充分利用 i n t e m e t 的便利又能有效地保护知识产权和实现机密信息的传递 已经成为一个十分 紧迫的课题 密码学是信息安全的传统技术 然而对于公开发布的信息产品却难以通过密码 技术实现版权保护 近年来 国际上开始提出并尝试一种新的关于信息安全的概念 即将版权等机密信息秘密地隐藏于一般的文件中 然后再通过网络传递或公开发行 由于非法使用者获取的是含有版权信息的文件 并不像传统加密过的文件那样看似 一堆会激发人们破解机密资料动机的乱码 而是看起来和其他非机密性的一般资料 无异 因而十分容易逃过非法使用者的破解或去除隐藏信息 另外 隐藏于文件中 的机密信息在一般的使用中不会被消除 即使经过解密 再加密 压缩 数 模变换 等过程 设计巧妙的机密信息也仍能继续存在并可通过一定的方法进行检测 因而 完全可用作版权鉴定的证据 这些特点正是传统加密系统所欠缺的 也是信息隐藏 的基本思想 信息隐藏是信息安全领域一个新兴的也是非常重要的研究领域1 2 j 自从2 0 世 纪9 0 年代世界各国开始研究数字媒体信息隐藏技术以来 已经有相当数量的研究成 果问世 从技术类别及其用途上 信息隐藏技术可以分为隐蔽信道 c o v e r tc h a i l e l 隐藏技术 s t e g a i l o 伊a p h y 数字水印 d i g i t a lw a t e m 瑚妇n g 等 数字水印技术是信息隐藏技术在多媒体领域的一个重要应用 也是信息隐藏技 术研究领域的一个重要分支 它作为一种新型的信息隐藏技术受到了越来越多的重 视 已经成为了多媒体信息安全领域的研究热点 数字水印的概念最早出现在1 9 9 4 年的图像处理会议 i c i p 9 4 上 s c h y n d e l 3 在会议上发表了题为 ad 哂 w a l e m 溅n g 的论文 数字水印技术的研究是在2 0 世纪9 0 年代受到重视并蓬勃发 展期来的 它的提出是为了保护版权 它是利用人类感觉器官h v s h 岫a i lv i d e o s y s t e r n 和h a s h 啪a n a m d i os y s t e m 的不敏感特性及多媒体数据中存在的冗余 通 过一定的算法将秘密信息隐藏到宿主信息中 且水印的添加不会影响原数据的内容 和正常使用 4 l 嵌入到多媒体数据中的信息 可以是数字 序列号 文字 图像标 l 北京化工人学硕 i 学位论义 志等 能够起到版权保护 标识产品 秘密通信 验证归属权 鉴别数据真伪等作 用 5 o 同时 报刊杂志 图书等仍以印刷品的形式存在于人们的生活中 而且在人们 获取信息过程中占据了很大的比重 据统计 印刷品市场的前景有增无减 印刷品 的盗版现象也日益猖獗 传统的防伪技术在一定程度上起到了保护知识产权的作用 但仍存在成本高 工艺复杂 应用范围窄等不足 近年来兴起的数字水印技术将具 有特定意义的标记 水印 利用数字嵌入的方法隐藏在印刷产品中 用以证明创作 者对其作品的所有权 并可以作为鉴定 起诉非法侵权的证据 同时通过对水印的 检测和分析来保证数字信息的完整可靠 从而成为知识产权保护和数字多媒体防伪 的有效手段 与传统的防伪技术相比 数字水印防伪具有检测速度快 安全性高 成本低等特点 将这一技术应用于印刷品防伪将会有广阔的前景 1 2 印刷品数字水印技术的研究现状 尽管数字水印可以应用于包括文本 图像 声音以及视频在内的多媒体数据中 但是从文献来看目前大多数相关的研究都集中在与图像 声音 视频的版权保护有 关的水印技术 而涉及文本保护的成果并不多 6 这其中的主要原因是由于 一方 面当前有大量的图像 音频和视频产品需要有效的手段加以保护 另一方面此类数 字媒体普遍存在大量的冗余数据 便于水印信息的隐藏 事实上 文本作为信息传递的一种重要手段 其应用大大超过了图像 音频和 视频的范围 尤其是传统的印刷出版物 在高性能的扫描机出现后 可以通过网络 发行的方式进行传播 目前应用于印刷品的文本数字水印技术研究大多还是基于图 像处理 即通过图像处理进行文本数字水印的嵌入 在经过打印 扫描过程后再对 隐藏的信息进行提取 影响比较大的方法有 c h i n g 一 gl i n 等f 7 人利用傅立叶变 换所具有的旋转 剪切 平移等特点 较早开展了脆弱性水印的研究 给出了建立 在傅立叶一一梅林伍m 变换基础上能抗打印 扫描过程的数字水印算法 李忠源等 嘲利用p h o t o s h o p 本身所带有的功能进行了印刷品信息隐藏方面的研究 戴跃伟等 9 j 研究的一种新的稳健图像水印算法 它具有一定的抗旋转和抗剪切性能 可以较好 地用于印刷证件的防伪 梁华庆等 i o 提出的一种基于数字水印的证件防伪技术方 案 该算法采用强度自适应的d c t 系数局部调整法 将水印序列重复多次嵌入到中 频系数中 张静等 1 1j 给出的一种能抗打印 扫描过程的空间域灰度图像数字水印算 法 应用该算法嵌入的水印经打印 复制及扫描后能有效地提取出水印 数字水印是当前数字信号处理 图像处理 密码学 通信理论 算法设计等学 科的交叉领域1 1 2 是信息安全领域的研究热点之一 数字水印技术在数字作品版权 2 第一章绪论 保护应用的研究已经比较成熟 但利用数字水印技术解决印刷出版物版权保护和防 伪技术还是很少 尤其是通过文本数字水印的研究就更少了 本课题将有助与印刷 出版物防伪技术研究 具有重要的现实意义 1 3 本文的主要内容 本文以现有的文本数字水印方法为理论基础 通过对中文印刷出版物的现有版 权保护方法的分析 将文本数字水印的技术应用于印刷出版物 尤其是针对中文印 刷出版物 实现对其的版权保护 主要完成了以下工作 1 全面分析数字水印技术的基本理论和经典算法 包括数字水印的通用模 型 方法和特点 现有文本数字水印的基本算法和局限性 2 提出基于文本中标点符号的水印思想 完全基于格式的文本数字水印算 法比较脆弱 是不能经受格式重排之类的正常操作的 而基于标点符号 的数字水印 使水印的嵌入不改变文本原有的格式而是改变到文本的内 容 但是这种改变不影响读者的阅读 因此可以有效地抵抗各种来自与 格式方面的攻击 3 研究了不同字体下标点符号的相似和区别 由于在中文文本中存在的标 点符号的种类和个数都是有限的 为此本文研究了中文文本的水印容量 从而选择某种标点符号作为载体 4 提出了对原有水印信息进行预处理的算法 利用密码学中的多表变换方 式对原始信息进行密钥的循环加密 再次利用信息处理中的重复编码 汉明编码 添加间隔码方式对水印进行编码 进一步增强水印信息的稳 健性和抗攻击能力 5 研究加载水印后的文本进行扫描为图像后 对该图像进行逐步分解和提 取标点符号的算法 6 在提取水印信息过程中 采用逆编码 解密方式对原始信息进行检测和 恢复 7 水印嵌入与提取仿真实验 在嵌入水印时 通过v i s u c 小伊c c o m 技术和o l ea u t o m a t i o n 技术实现对中文文本数字水印的嵌入 在提取水 印时 通过m a t l a b 7 0 实现对嵌入信息的图像进行分解和切割 提取 标点符号 并进行测试 完成水印信息的提取 8 对上述实验结果进行性能分析 如抗格式变换的攻击实验的分析等 总之 本文详细地论述了从数字水印的一般技术 到现有的文本数字水印 进 而提出改进的基于标点符号的文本数字水印技术并将其应用于印刷出版物 再到整 北京化工大学硕 e 学位论文 个设计的仿真实验与性能分析的全过程 1 4 本论文的结构图 本文共分七章 第一章为绪论部分 阐述了本文所研究内容的背景 意义和当前数字水印在印 刷作品中的研究现状 第二章阐述了数字水印的基本理论 首先简要地介绍了数字水印的起源 信 息隐藏技术的定义和概况 然后对数字水印的概念 分类 基本原理和通用的数字 水印系统进行了详细介绍 重点介绍了数字水印在文本文档中的应用 并通过分析 比较传统水印算法的不足之处提出了本文的水印算法思想 第三章详尽地阐述了基于标点符号的数字水印的算法 从对标点符号和人类视 觉系统的分析到水印信号进过加密 不同形式的编码最终产生嵌入水印信息 这部 分还描述了水印嵌入理论与通信原理中的信道编码理论的关系 为水印的提取和恢 复提供了可靠的依据 最后对水印的嵌入算法进行了描述 第四章的内容是建立在第三章嵌入水印信息的原理之上的逆过程 详细地阐述 了对含有水印信号的载体进行水印信息的检测和恢复 其中涉及到水印信息解码和 解密 最后同样对水印的检测和恢复算法进行了描述 第五章是利用第三 四章的基本原理通过编程实现的基于标点符号的水印的嵌 入和提取的过程 并对整个实验中需要利用到的关键技术和方法进行了介绍 同时 也给出了水印嵌入和提取的程序流程图和部分关键代码 第六章是对实验中的测试文本进行的展示和分析 并对该水印算法在理论上的 查错纠错能力进行了客观地评价 第七章是论文的结尾 一方面对全文进行了总结 另一方面对本文提出的算法 的不足之处进行了说明 为未来的本文数字水印的研究和应用于印刷出版物提供了 值得研究和探讨的方向 4 第 二章数7 水印基奉理论 2 1 概述 第二章数字水印基本理论 现代的版权保护制度最突出的特点之一是出现了专门的版权保护技术 在版权 保护方面 法律与技术之间存在着密切的互补关系 当法律的威慑力不足以制止侵 权行为时 技术手段就用来弥补法律的不足 随着多媒体技术特别是声像数据压缩 技术的发展 c d 音乐 v c d d v d 影碟 电脑动画等数字化产品逐渐走进了人们的 生活 i n t e m e t 的迅猛发展更为数字作品的广泛传播创造了条件 相对于其他版权保 护对象而言 数字作品有一系列突出特点 如无失真复制 复制成本低等 这些特 点使得它很难得到现有版权制度的保护 因此 2 0 世纪9 0 年代 人们对研究如何保护数字作品版权的兴趣空前高涨 数字水印技术也就开始成为学术界一个重要的热门研究方向 许多大学 公司和研 究机构设立了专门的数字水印实验室开展相关研究 较著名的有剑桥大学 麻省理 工学院 h 帕u e 大学和i b m 实验室 n e c 研究院 贝尔实验室等 研究内容主要 集中于图像 视频和音频等数字媒体 但也涉及其他一些内容 l 引 如文本 软件代 码 数据库等 用于版权保护的数字水印一般称为稳健水印 i b b u s tw 犯m 砌d n g 利用这种水印技术在多媒体内容的数据中嵌入创建者或所有者的标示信息 或者嵌 入购买着的标识 即序列号 在发生版权纠纷时 提取出的创建者或所有者的信息 可用于标示数据的版权所有者 而序列号则用于标示违反协议而为盗版提供多媒体 数据的用户 用于版权保护的数字水印要求有很强的稳健性 除了要求在一般图像 处理 如滤波 加噪声 部分替换 压缩等中能生存外 还需要能抵抗一些恶意攻 击 目前 尚无能十分有效用于实际版权保护的稳健水印算法 数字水印源于信息隐藏 并与之密切相关 为此本章将首先介绍信息隐藏的基 本概念和理论 进而对数字水印技术的基本概念和原理进行综合阐述 最后深入分 析和讨论文本数字水印的基本方法并分析其局限性 2 2 信息隐藏 2 2 1 信息隐藏的提出 信息隐藏学研究的是在信息中隐藏信息 它是一门既古老又年轻的学科 同时 也是一门能体现人类高度智慧的信息安全斗争技术和艺术 从古至今 几乎所有新 北京化1 大学硕 学位论义 的信息隐藏手段和技术一旦出现 就立即会被用于情报作战中 在一定程度上决定 着战争的胜负乃至国家命运 i 引 信息隐藏研究虽然可以追溯到古老的隐写术 但在国际上正式提出数字化信息 隐藏研究则是在1 9 9 2 年 直到1 9 9 9 年9 月在德国d r e s d e n 召开的第三届信息隐藏 研讨会 信息隐藏理论才逐渐地成熟 它不同于传统密码学技术 而是将机密资料 信息秘密地隐藏于一般的文件中 然后再通过网络传递 由于非法拦截者从网路上 拦截下来的伪装后的机密资料 并不像传统加密文件一样 而实际上是和其他非机 密性一般资料无异的文件 从而到达迷惑攻击者的目的 其道理如同生物学上的保 护色 巧妙地将自己伪装隐藏于环境中 免于被天敌发现而遭受攻击 这一点是传 统加解密系统所欠缺的 也是信息隐藏学的基本思想 2 2 2 信息隐藏的定义和模型 2 2 2 1 定义 所谓信息隐藏就是将秘密信息隐藏到一般的非秘密的数字媒体文件 如图像 声音 文档文件 中 从而不让对手发觉的一种方法 由于含有隐藏信息的媒体是公 开发布的 而可能的检测者难以从公开信息中判断隐藏信息是否存在 更加难以截 获隐藏信息 从而达到保证信息的安全的目的 信息之所以能够隐藏在多媒体数据中是因为 1 5 1 多媒体信息本身存在很大的冗余性 从信息论的角度看 未压缩的多媒体信 息的编码效率是很低的 所以将某些信息嵌入到多媒体信息中进行秘密传送 是完全可行的 并不会影响多媒体本身的传送和使用 2 人眼或人耳的感知特性都有一定的掩蔽效应 比如人眼对灰度的分辨率只有 几十个灰度级 对边沿附近的信息不敏感等 利用人的这些特点 可以很好 地将信息隐藏而不被察觉 2 2 2 2 通用模型 待隐藏的信息称为秘密信息 s e c r e tm e s s a g e 它可以是版权信息或秘密数据 也可以是一个序列号 而公开信息则称为载体信息 c o v e rm e s s a g e 如图像 视频 文本或音频信号 信息的隐藏过程一般由密钥 k e y 来控制 即通过嵌入算法 e m b e d d i n ga l g o r i t h m 将秘密信息隐藏于公开信息中 而隐藏载体 隐藏有秘密信息 的公开信息 则通过信道 c o m m u n i c a t i o nc h a r u l e l 传递 然后监测器 d e t e c t o r 利用密钥 从掩蔽载体中恢复或检测秘密信息l l6 信息隐藏的通用模型见图2 1 6 第 二章数字水e j 基本原理 信息隐藏技术主要由下述两部分组成 1 信息嵌入算法 它利用密钥来实现秘密信息的隐藏 2 隐蔽信息检测或提取算法 监测器 它利用密钥从隐蔽载体中检测或恢复出 秘密信息 在密钥未知的前提下 第三者很难从隐秘载体中得到或删除 甚 至发现秘密信息 l 秘密信息 图2 1 信息隐藏模型 f i g 2 lm o d e lo fi n f o m a 士i o nh i d i n g 2 2 3 信息隐藏与数字水印的关系 信息隐藏的应用领域划分为如图2 2 所示 1 7 1 秘密信息 t 检测器 图2 2 信息隐藏技术分类 f i g 2 2s y 妣mo fi n f b 啪a t i o nh i d i n g 7 由 北京化1 大学顾十学位论文 数字水印是信息隐藏技术的一个重要分支 与钞票水印相似 数字水印技术是 将特制的标记 利用数字内嵌到数字图像 声音 文档 图书 视频等数字产品中 用以证明创作者对其作品的所有权 并作为鉴定 起诉非法侵权的证据 同时通过 对水印的检测和分析 保证数字信息的完整可靠性 从而成为知识产权保护和数字 多媒体的防伪的有效手段 2 3 数字水印 数字水印技术是通过在原始数据中嵌入秘密信息一一水印 w a t e n i l 破i n g 来证 实该数据的所有权 这种被嵌入的水印可以是一段文字 标识 序列号等 而且这 种水印通常是不可见或不可察觉的 它与原始数据 如图像 音频 视频数据 紧密 结合并隐藏其中 并可以经过一些不破坏源数据使用价值或商用价值的操作而能保 存下来 数字水印技术除了应具备信息隐藏技术的一般特点外 还有其固有的特点 和研究方法 i 1 9 1 在数字水印系统中 隐藏信息的丢失 即意味着版权信息的丢失 从而也就失去了版权保护的功能 也就是说 这一系统就是失败的 由此可见 数 字水印技术必须具有较强的稳健性 水印对有意或无意的图像操作与失真具有一定 的抵抗力 安全性 嵌入在宿主数据中的水印是不可删除的 且能够提供完全的版 权证据 以及不可察觉性 人的感觉器官对水印是不可觉察的 或者说是透明的 保 真性 加入水印后并不会损害原来的媒体内容价值 2 3 1 数字水印的分类 数字水印的分类方法有很多种 分类的出发点不同导致了分类的不同 它们之 间是既有联系又有区别的 最常见的分类方法如下 2 0 1 按特性划分 按水印的特性可以将水印分为稳健水印和脆弱水印两类 稳健水印主要用于在 数字作品中标识著作权信息 如作者 作品序号等 它要求嵌入的水印能够经受各 种常用的编辑处理 脆弱水印主要用于完整性保护 与稳健水印的要求相反 脆弱 水印必须对信号的改动很敏感 人们根据脆弱水印的状态就可以判断数据是否被篡 改过 2 按水印所附载的载体数据划分 按水印所附载的载体数据 可以将数字水印划分为图像水印 音频水印 视频 水印 文本水印以及用于三维网格模型的网格水印等 随着数字技术的发展 会有 更多种类的数字媒体出现 同时也会产生相应载体的水印技术 第 二章数字水印基本原理 3 按检测过程划分 按水印的检测过程可以将数字水印划分为非盲水印和盲水印 非盲水印的检测 过程中需要原始数据 而盲水印的检测只需要密钥 不需要原始数据 一般来说 非盲水印的稳健性比较强 但其应用受到存储成本的限制 由于水印提取易于实现 盲水印在实际应用中受到更广泛的关注 4 按内容划分 按数字水印的内容可以将水印划分为有意义水印和无意义水印 有意义水印是 指水印本身也是文本 数字图像 如商标图像 或数字音频片段的编码 无意义水印 则是一个随机序列 有意义水印的优势在于 如果由于受到攻击或其他原因致使解 码后的水印破损 人们仍然可以通过视觉观察确认是否有水印 但对于无意义水印 来说 如果解码后的水印序列有若干码元错误 则只能通过统计决策来确定信号中 是否含有水印 5 按用途划分 不同的应用需求造就了不同的水印技术 按水印的用途可以将数字水印划分为 票据防伪水印 版权保护水印 篡改提示水印和隐蔽标识水印 票据防伪水印是一 类比较特殊的水印 主要用于打印票据和电子票据的防伪 一般来说 伪币的制造 者不可能对票据图像进行过多的修改 所以诸如尺度变换等信号编辑操作是不用考 虑的 但另一方面 人们必须考虑票据破损 图像模糊等情形 而且考虑到快速检 测的要求 用于票据防伪的数字水印算法不能太复杂 版权标识水印是目前研究最 多的一类数字水印 数字作品既是商品又是知识作品 这种双重性决定了版权标识 水印主要强调隐蔽性和稳健性 而对数据量的要求相对较小 篡改提示水印是一种 脆弱水印 其目的是标识宿主信号的完整性和真实性 隐蔽标识水印的目的是将保 密数据的重要标注隐藏起来 限制非法用户对保密数据的使用 6 按水印隐藏的位置划分 按数字水印的隐藏位置 可以将其划分为时 空 域数字水印 变换域数字水印 时 空 域数字水印是直接在信号空间上叠加水印信息 而变换域水印则包括在d c t 域 d f t 域和小波变换域上隐藏水印 随着数字水印技术的发展 各种水印算法层 出不穷 水印的隐藏位置也不再局限于上述四种 应该说 只要构成一种信号变换 就有可能在其变换空间上隐藏水印 2 3 2 数字水印系统的基本原理 一个数字水印方案一般包括三个基本方面 2 1 1 水印的生成 水印的嵌入和水印 的提取或检测 数字水印系统实际上是通过对水印载体媒质的分析 嵌入信息的预 处理 信息嵌入点的选择 嵌入方式的设计 嵌入调制的控制等几个相关技术环节 9 北京化工大学顾 l 学位论文 进行合理优化 寻求满足不可感知性 安全可靠性 稳健性等诸条件约束下的最优 化设计问题 而作为水印信息的重要组成部分一一密钥 在信息预处理 嵌入点的 选择和调制控制等不同环节完成嵌入 2 3 2 1 水印生成 这里假设原始的有效信息 i 是一串伪随机数 或者是与作者 版权相关的字符 串 目前大多数水印方案都采用了密码学中的加密体系来加强有效信息的保密性能 有时甚至多种密钥联用 在有效信息和密钥 k 在经过一定的加密算法后生成水印信 息 这样的水印的非所有者就更加难以提取到数字媒体中信息 给攻击者增加了去 除 伪造水印的难度 从而保证水印信息的安全 设有加密算法e 则可用以下公 式表示 形 e k 2 1 水印生成的模型如图2 3 所示 图2 3 水印生成模型 f i g 2 3m o d l eo f v a t e 加a r k c r e a t i n g 2 3 2 2 水印嵌入 水印的嵌入是指将待嵌入的水印信息通过相应的水印嵌入算法 f 添加到开放 的公共数据 c 中 可以根据载体的不同特点 根据不同的需求提出满足条件的方法 进行加载得到含水印的载体 p 水印嵌入的模型如图2 4 所示 图2 4 水印嵌入模型 f i g 2 4m o d l eo fw a t e 兀n a r l e m b e d d i n g l o 第二章数 水印摧奉原理 2 3 2 3 水印检测 水印检测过程用来判断某一数据中是否含有指定的水印 它是基于统计原理进 行的 目的是使错判与漏判的概率尽量小 结果可以表明所考察数据中存在给定水 印的可能性 设判断阀值为v 水印检测算法d 则可用以下公式表示 d p k v 表示水印w 存在 d p k v 表示水印w 不存在 水印检测的模型如图2 5 所示 2 3 2 4 水印提取 图2 5 水印检测模型 f i g 2 5m o d l eo fw a t e 咖a d e t e n i i l g 水印提取过程是嵌入过程的逆过程 水印提取算法 7 是从含有水印信息的载 体中获取原始水印信息 设提取出的水印为形 则可用以下公式表示 尸 k 或矿7 f p k 盲检 2 2 水印提取的模型如图2 6 所示 i原始载体i i i 盲检时不要 图2 6 水印提取模型 f i g 2 6m o d l e0 fw a t e n n a f k p i c k i n g 北京化丁大学硕f j 学位论文 2 4 文本数字水印 从目前发表的大量研究论文看 研究得最多和最深入的是在图像载体中嵌入数 字水印 这一方面是由于图像处理的直观性 另一方面是由于图像中存在大量的冗 余信息 使得我们可以在其中隐藏一些信息而不致引起观察者的怀疑 但是对于文 本信号就不同了 文本信号中不存在冗余 文本的一个比特发生变换 文本就发生 错误 因此在文本中进行信息伪装的难度比较大 2 引 另一方面 在网络上传输的绝 大部分还是文本信息 而且由于文本信息隐藏具有一定的难度 所以隐藏密文的文 本往往不容易受到怀疑 一定程度上又具有较好的安全性 因此基于文本的信息隐 藏具有非常重要的现实意义和应用前景 2 4 1 文本文档的分类和特点 所谓文本文档就是文字信息的数字化表示所形成的电子文件 文字以电子文档 的形式保存并传播 是计算机和通讯技术发展的结果 2 3 1 由于电子文档具有易于编 辑 保存以及传输迅捷等特点 同时可以和传统印刷方式进行相互转换 如打印 扫描 识别等 因而得到了广泛的应用 在对文字信息的数字化过程中 由于来源不同对文档内容描述方式不同 因而 文本文档的表现形式也不尽相同 概括来说 文本文档分为两大类 一种是以a s c i l 码表示内容并包含格式的文档格式文件 其中汉字用双字节表示 另一种是以象素 点阵的方式描述内容的文档图像表示文件1 2 训 文档格式文件的类型很多 文件格式也是多种多样 如w o r d 文档 d o c w 曲页 幸 h t m 和木 h t 叫 r t f 格式 n d 纯文本 幸 t x t 等 这是因为针对不同的应 用范围 不同的表述对象 具有不同的描述 如利用网页传递信息 既要有丰富的 多媒体内容和效果 又要传递较少的数据 因而产生了超文本链接标记语言 用于 文字和数据的链接 以及文件间的超级链接 也就形成了超文本文件 h t i l l l 瞄5 1 文本文档与图像 视频和音频等多媒体信息有着完全不同的特点 1 文本文档的图像表示是用象素点阵列的方式来描述文档各页的内容 2 文本文档一般由单词或汉字 句子和段落等有规律的结构组合而成 3 非格式化文档不保存文档的格式信息 其文本信号中基本不存在冗余 文本 的一个信息位变化 文本内容就可能发生错误 4 格式化文档保存文档的格式信息 其版面布局信息 如字间距 行间距或格 式化编排中 存在一定的冗余 1 2 第一二章数字水e 1 j 基本原理 2 4 2 文本数字水印的研究现状 大概从1 9 9 3 年开始才有人研究文本数字水印 1 9 9 5 年9 月l e e ej o u m a lo n s e l a r e a si nc o m m u n i c a t i o n 杂志通过加入数字水印来保护版权的方式在互联网上试 发行了一期 第一个月的注册用户就达到了1 2 0 0 人 2 6 1 到目前为止 基于文本的 数字水印研究 相关的研究成果在国外已有一些 而在国内却不多见 下面列举出 一些典型的文本数字水印的研究成果 2 4 2 1 移位编码方法 移位编码方法是利用相邻文本 行或者词等 的相对位置关系来隐藏信息的方 法 主要有行间距编码和字间距编码两种 行间距编码 2 7 就是在文本的每一页中 每间隔一行轮流地嵌入秘密信息 但嵌 入信息的行的相邻上下两行位置不动作为参考 需嵌入信息的行根据密文数据的比 特流进行轻微的上移和下移 在移动过的一行中编码一个信息比特 如果这一行上 移 则编码为 1 如果这一行下移 则编码为 0 一 该编码技术具有很强的稳健 性 即使经过多次拷贝 或对页面按某个伸缩因子进行多次缩放 嵌入的秘密信息 也可以检测出来 字间距编码f 2 8 是通过将文本某一行中的一个单词进行水平位移来嵌入秘密信 息的 通常是在编码过程中 将某一格单词左移或右移 而与其相邻的单词并不移 动 这些不动的单词作为解码过程中的参考位置 此种方法与行间距编码技术隐藏 信息的原理大致相同 都是通过移动来实现的 相对而言字间距编码能够隐藏更多 的信息 文献 2 9 中d h u a n g 和h 等人还提出了基于正弦波的字间平均间距文 本水印技术 即通过微调单词间距使不同行的字间平均间距表现出正弦曲线特征 从而将水印信息编码在正弦曲线中 实现了盲检 关于以上方法的密文检测算法 在文献 3 0 中都进行了详细的介绍 2 4 2 2 同义词替换方法 同义词替换 3 1j 方法是通过对文本中的文件结构及句法特点的分析 挑出一些词 语用其他一些与其意思十分相近的词语进行替换 从而实现秘密信息的隐藏 如 互 联网 与 因特网 我们 和 咱们 动画 和 卡通 等 通常有两对同义 词 选用其中一个或另一个分别表示 o 或 1 通信双方必须同时拥有这个同义 词对 有些词可能存在好几个同义词 那这些词就可以嵌入更多的信息 隐藏信息 的容量是与同义词库的大小有关 同义词库越大 文件的隐藏容量通常也越大 这种方法具有较好的抗分析能力 因为它只是进行同义词替换 而没有增加字 北京化t 大学顺十学位论文 词 文件的长度不会有任何增加 也没有改变句法结构以及意思 但是有些词语经 过替换之后 读起来可能不是那些协调 容易引起怀疑 而对其进行篡改 影响后 面秘密信息的恢复 因此它的稳健性相对较弱 2 4 2 3 特征编码方法 特征编码 3 2 是通过改变文档中某个字母的某一特殊特征来嵌入标记 特征可以 是字体 也可以是字 如b k 等中的垂直线 其长度可稍做修改以使一般人不易 发觉 相对某种给定的字体可以改变其字符高度 目前主要有以下几种方式 标点信息隐藏方法 3 3 j 是利用中文与英文的标点输入所占用字符宽度的区别来 进行信息隐藏的 例如中文的逗号与英文的逗号 它们在文档中所占用的宽度是有 一定的差别的 在嵌入水印信息的时候 我们可以假设中文的都用来来表示所要隐 藏的信息位为l 而英文的逗号表示隐藏的信息位为0 或者相反 由于逗号在中文 文档和英文文档中的使用比较频繁 所以利用逗号的变换可以隐藏更多的信息 字体信息的隐藏方法 蚓是通过修改文本中一些文字的字体信息来隐藏秘密信 息的 这些字体被修改后很难被察觉 以上几类方法实质上都是通过一些相近信息的互换来进行信息隐藏的 这种措 施不容易引起中间人的怀疑 进而对其攻击破坏 有一定的隐蔽性 而且它隐藏信 息的容量比较大 但是隐藏信息的文本一旦在传输中遭受篡改或删除 到最后恢复 秘密信息的时候会受到很大的阻碍 甚至有些根本就不能恢复 2 4 2 4 变换编码方法 变换编码1 3 5 方法是将文本先进行特定的变换后再隐藏信息的方法 如文本伪装 算法i 蚓 这种新的算法提出将不具有冗余度的文本信号经过变换后 得到具有冗余 度的信号 再在冗余空间中进行文本的伪装 首先根据编码方式 可以把所有文字 以它的编码方式读入为一串编码数字 这些编码数字是以整数形式存在的 并且是 与文字一一对应的 它们不存在任何冗余 数字发生微小的变化将引起文字的错乱 而将这串数字信号以它的比特流表示进行某种变换 如小波变换 f f t 变换等 在 变换域中的信号就具有了二些冗余度 可以允许有误差 然后就考虑利用这点微小 的冗余进行文本伪装 运用这种算法可以将一段机密文本转变为一段普通的文本 在普通的文本的掩 饰下传输秘密信息 不易引起第三者的怀疑 该算法产生的密钥具有一定冗余度 它在传输过程中可以抵抗一定的人为破坏和干扰 另外算法还采用了密钥和明文分 离的传输方式 提高了安全性 1 4 第二章数字水e 基奉原理 2 4 2 5 其他方法 n f m a x e m c h u k 等人提出了通过附加空格来加载秘密信息的文本数字水印方 法 3 7 该方法通常用于非格式化文本 一般是在行末添加空格或不可见编码将信息 隐藏在字处理系统的断行处 由于行尾是否有空格在视觉上难以区分 提取时可通 过不可见编码
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 彩钢板劳务合同范本
- 医院保洁服务外包合同4篇
- 鸡鸭屠宰场下脚料无害化处理与资源化利用合同
- 美容美发店租赁合同附产品研发及市场拓展合作协议
- 酒吧经营场所租赁合同包括品牌形象维护及推广责任
- 委托设计方案合同6篇
- 天平考试题及答案
- 2025年公需课《人工智能赋能制造业高质量发展》试题(附答案)
- 2025年高校教师岗前培训高等教育心理学知识竞赛考试题库(附答案)
- 2025年高级焊工题库及答案
- 2025医院防控试题及答案
- 物业收费知识培训
- 专题22.6二次函数与几何综合2025~2026学年九年级数学上册(人教版)
- 2025江苏苏州昆山国创投资集团有限公司第二期招聘10人笔试参考题库附带答案详解
- 2025年秋季学期幼儿园园务工作计划
- 2025-2026学年浙教版(2024)初中科学七年级上册教学计划及进度表
- 计算机操作员中级考试题库及答案解析
- 2025-2026学年第一学期校园“1530”安全教育记录表
- 2025-2026学年译林版(三起)(2024)小学英语三年级上册教学计划及进度表
- 2024年合肥演艺集团有限公司社会招聘4人笔试备考试题带答案详解
- 厨房用火安全知识培训课件
评论
0/150
提交评论