




已阅读5页,还剩43页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
摘要 摘要 随着服务外包产业的快速发展,知识产权阎题也随之而来,目前关系数据库 水印技术成为解决服务外包数据库版权阃题的一个重要的方法。本文在研究和分 析现有的关系数据库水印技术的基础上,针对服务外包知识产权数据库中两种不 同类型的数据提出了两种适用于该数据库的关系数据库水印算法。 一种算法是基于知识产权数据库中数值型数据的关系数据库水印算法,该算 法将一幅将具有标识版权信息的图像作为水印嵌入关系数据库中,并且对水印图 像用a r n o l d 变换进行了置乱,对关系数据库中的数据用数据挖掘中的k - m e a n s 聚类算法进行聚类划分,该算法剩用图像作为水印,在水印提取时更直观,更易 识别,实验证明该算法具有很强的鲁棒性和不可见性。针对知识产权数据库系统 中的非数值型数据的特点,本文提出了种基于相似函数的关系数据库水印算 法。该算法利用自己定义的相似函数来进行水印信息的嵌入,对数据库中属性值 的修改量很少,能够抵抗各种攻击,并且在对水印进行恢复时不需要原始的数据 库。 最后,本文将提出基于图像的关系数据厍水印算法应用到服务外包知识产权 数据库中,设计并实现了知识产权数据库数字水印系统,并对该系统进行了测试, 测试结果表明该数字水印系统具有较强的鲁棒性和不可见性,支持盲检测,有一 定的使用价值。 关键诃:知识产权:版权保护: 数字水印;关系数据库;a r n o l d 变换: k m e a n s 算法 a b s t r a c t a b s t r a c t w i mt h ef a s td e v e l o p m e n to fs e r v i c eo m s o u r c i n gi n d u s t r y ,t h ep r o b l e mo f i n t e l l e c t u a lp r o p e r t yc o m e s 。w a t e r m a r k i n gr e l a t i o n a ld a m b a s et e c h n o l o g yb e c o m e sa n i m p o r t a n tw a yt os o l v et h ec o p y r i g h tp r o b l e mo fs e r v i c eo u u o u r c i n gd a m b a s e o nt h e b a s i so fr e s e a r c h i n ga n di m p r o v i n gt h ec u r r e n tw a t e r m a r k i n ga l g o r i t h m so fr e l a t i o n a l d a t a b a s e ,t w ow a t e r m a r k i n gr e l a t i o n a ld a t a b a s ea l g o r i t h m sa l ep r o p o s e df o rt w o d i f f e r e n tt y p e so fd a t ai ns e r v i c eo u t s o u r c i i l gi n d u s t r yo ft h ei n t e l l e c t u a lp r o p e r t y d a t a b l e o n ew a t e r m a r k i n gr e l a t i o n a ld a t a b a s ea l g o r i t h mi sb a s e do nn u m e r i c a ld a t ai n i n t e l l e c t u a lp r o p e r t yr i g m sd a t a b a s e ,ae o p y r i 曲ta u t h e n t i c a t i o ni m a g ei se m b e d d e d i n t or e l a t i o n a ld a t a b a s ea saw a t e r m a r k t h ek - m e a n sc l u s t e r i n ga l g o r i t h mi n t h ed a t a m i n i n gi sb r o u g h ti nr e l a t i o n a ld a t a b a s e a ni m a g ei sa st h ew a t e r m a r kw h i c hm a k e s t h ew a t e r m a r ke x t r a c t i o ne a s i e ra n dm o r ei n t u i t i v e ,e x p e r i m e n tr e s u l t ss h o wt h a tt h e a l g o r i t h mh a sg o o dr o b u s t n e s sa n di n v i s i b i l i t y aw a t e r m a r k i n gr e l a t i o n a ld a t a b a s e a l g o r i t h mb a s e do ns i m i l a rf u n c t i o ni sp r o p o s e df o rn o n - n u m e r i c a ld a t ai ni n t e l l e c t u a l p r o p e r t yr e l a t i o n a ld a t a b a s e w a t e r m a r ki r e f o r m a t i o nw a se m b e d d e di n t or e l a t i o n a l d a t a b a s eb yad e f i n e ds i m i l a r i t yf u n c t i o n t h ep e r f o r m a n c eo f t h ea l g o r i t h ms h o w st h e n u m b e ro fe l e m e n tm o d i f i c a t i o n sn e e d e db yt h ee m b e d d i n gp r o c e s si sl e s sa n di tc a n r e s i s ta l lk i n d so fa t t a c k sa n dn e e dr i oo r i g i n a ld a t a b a s ea tt h et i m eo fd e t e c t i n g d a t a b a s ew a t e r m a r k , f i n a l l y , t h ew a t e r m a r k i n gr e l a t i o n a ld a t a b a s ea l g o r i t h mb a s e d o ni m a g ei s a p p l i e di ni n t e l l e c t u a lp r o p e r t yr e l a t i o n a ld a t a b a s e w ed e s i g naw a t e r m a r kr e l a t i o n a l d a m b a s es y s t e ma n dt e s tt h es y s t e m ,t h et e s tr e s u l t ss h o wt h a t 函g i t a lw a t e r m a r k i n g s y s t e mh a ss t r o n gr o b u s t n e s sa n di n v i s i b i l i t y ,s u p p o r t sb l i n dd e t e c t i o na n dh a sa c e r t a i nv a l u ei r tu s e k e yw o r d s :i n t e l l e c t u a lp r o p e r t y ;c o p y r i g h tp r o t e c t i o n ;r e l a t i o n a ld a t a b a s e ; d i g i t a lw a t e r m a r k ;a r n o l dt r a n s f o r m ;k - m e a n sa l g o r i t h m 第1 章绪论 1 1 概述 第1 章绪论 随着经济全球化步伐加快和产业分工日益细化,软件与信息服务外包产业逐 渐成为一种新兴的产业1 1 】。我国迅速抓住这个经济发展的机遇积极发展软件服务 外包产业。各个发展服务外包的城市也开始了对信息服务外包公共支撑平台的建 设,来加强殷务并包资源的整合和兴享以及促进软件服务外包产业的发展。本文 所研究的服务外包知识产权系统是南昌市服务外包基地城市软件与信息服务外 包公共支撑平台建设中的一部分。 随着软件服务外包产业的快速发展,知识产权问题越来越引起人们的重视, 目前知识产权问题已经成为制约我国软件服务外包产业发展的重要障碍 2 , 4 1 。为 了解决知识产权保护和信息安全问题,近年来提出了加密解密、数字签名、数 字标签、数字指纹、数字水印等多种技术p j 们。其中数字水印技术成为当前信息 安全领域研究发展最快的熟点技术,它是用于解决知识产权保护的最具有潜力的 多学科交叉技术。 本课题所研究的服务外包知识产权系统的数据库中主要存放着大量的软件 外包核心技术和创新点以及各种专利数据,这些鼓据或多或少都有着一定商业绘 值和社会价值。如何保证该系统数据库的数据的所有权f a j 题成为该系统建设研究 的个重点问题。 1 2 研究的背景和意义 1 z ,1 研究的背景 近几年来,我国的软件与信息服务外包产业发展迅猛,产业规模持续扩大。 为了使我国服务外包产业能够快速的可持续的发展,我国政府陆续颁布了一系列 政策法规周。孛央和地方各级致府也高度重视和大力发展殿务井包产业,国家软 件与信息服务外包公共支持平台的建设为我国软件与服务外包产业的发展创造 了有利的条件n 但是知识产权问题一直是中国服务外包产业的软肋。如何保护服 务外包产业中的知识产权成为一个亟待解决的问题。 第1 章绪论 1 2 2 服务外包知识产权系统 本文所研究的服务外包知识产权系统是南昌市建设的软件与信息服务外包 公共服务支撑平台的一部分,该系统主要包括知识产权预警机制,软件服务外包 中知识产权现状的分析与战略建议,知识产权的交流和培训,专利项目和产品的 交易等内容。服务知识产权系统向企业提供软件外包中技术开发及产品或技术的 知识产权分析、软件外包中知识产权相关知识的培训,支持服务外包企业关注支 持产权现状并提出订阅知识产权预警信息等业务,提供基于语义处理的专利搜索 引擎和专利战略分析系统的核心技术等,为软件与信息服务外包企业的服务模式 提供多样性和灵活性。主要包括知识产权司法鉴定、基于技术标准中的专利分析、 技术领域专利分析、知识产权专利数据库定制服务、知识产权产业政策研究、企 业知识产权战略咨询、知识产权培训等七大模块。下面将简单介绍一下知识产权 系统中七大模块的功能及面向的服务对象。 1 、知识产权司法鉴定。该模块主要在工业和信息化领域,通过对技术和产 品进行相关专业技术的分析、检测,为诉讼活动或非诉讼活动中涉及的知识产权 问题、争议等提供鉴别和判断,并依法出具司法鉴定意见。面向的客户主要是: 法院、律所、企业、知识产权代理机构、行业协会、产业联盟、商会等。 2 、基于技术标准中的专利分析。该模块主要通过分析标准中的技术方案, 提取关键技术点,进行专利检索和清洗,筛选出相关专利,将其与标准中的技术 方案进行对比分析,挖掘潜在侵权专利,并针对专利的稳定性、创新点和专利组 合等进行综合分析,为标准制定和实施提供专利解决策略。面向的客户主要是: 政府部门、标准化组织、行业协会、产业联盟、科研院所和企业等。 3 、技术领域专利分析。该模块主要针对指定行业、技术领域,提取专利数 据、研究专利分布,获知产业发展的历史与现状,跟踪国内外核心技术、创新热 点、技术发展态势,评估其技术活动程度、技术生命周期、演变过程和未来发展 趋势,为引导产品制程、技术架构提供重要参考。面向的客户主要是:政府、行 业协会、产业联盟、企业、科研院所等。 4 、专利数据库定制服务。该模块主要包括两部分: ( 1 ) 专利数据加工 专利数据加工服务是指针对顾客的实际需求向用户提交著录项规范、手工技 术分类、摘要改写、创新点标引等不同加工程度的专利数据。 ( 2 ) 专题专利数据库建设 专题数据库构建是指针对顾客的需求按技术领域、技术点、研发主体等向用 户提交不同加工程度的准确、齐全的专利数据库。其目标客户是:企业联盟、协 2 第1 章绪论 会。 5 、知识产权产业政策研究。该模块是面向政府、行业协会、科研院所,根 据产业需求和热点问题,对我国信息产业自主创新体系、知识产权相关的法律法 规、战略部署、政策拟定等领域开展研究与分析。其目标客户是政府、行业协会、 产业联盟、企业、科研院所等。 6 、企业知识产权战略咨询。该模块结合企业所在行业特点、技术现状、市 场战略等相关信息,为企业的知识产权战略和配套管理制度的制订、实施提供咨 询服务。其目标客户是政府、行业协会、产业联盟、企业、科研院所。 7 、知识产权培训。该模块为政府、行业协会、产业联盟、地方因区、企业 提供知识产权法律体系、管理实务、运营规则、战略规划等专业化培训。服务客 户为政府、行业协会、产业联盟、企业、科研院所等。 1 2 3 研究的意义 随着世界经济的全球化发展步伐的加快和网络技术的快速发展,服务外包产 业发展迅猛。但是服务外包产业特别是软件服务外包中知识产权阔题逐渐成为影 响该行业发展的个重要障碍,因为服务外包知识产权系统的数据库中存放着大 量的数据,而这些数据或多或少的都有一定的商业价值,如果泄露出去可能会对 公司或企业造成很大的损失m 。所以如何保护软件服务外包产业关系数据库中信 息的安全,保护服务外包产业关系数据库信息的版权成为服务外包产业需要迫切 解决的一个问题。 传统的保护数据库信息的安全主要是通过数据加密和数字签名等方法,但是 数据加密的方法由于数据加密和解密的过程比较复杂,密钥的管理比较繁琐,并 且该加密后的数据库仅能让那些拥有密钥的人使用,这在一定程度上限制了数据 库可用性;而解密后的数据库可以被任意的复制和修改,因此将无法保证数据库 的版权。数字签名技术是基于密码学的一种保护数据内容完整性的一种方法,该 方法向数据库中添加冗余的验证信息,所添加的验证信息与数据库中要保护的数 据的完全分离的,并且该验证信息很容易被删除,一旦验证信息被删除就无法保 护数据库中信息的安全和数据库的版权。 将数字水印技术应用于关系数据库中,在不破坏数据库使用价值的基础上, 向数据库数据中嵌入或在数据库数据中直接提取不可见并且不容易破坏的能证 明数据库信息版权的信息,保护数据库信息的安全和保证数据库的版权,是目前 数据库安全领域研究的一个崭新课题。因此对服务外包知识产权系统的关系数据 库水印算法的研究具有一定的理论价值和实用价值。 3 第1 章绪论 1 - 3 本文的主要工作 本文的主要目的是根据服务外包知识产权系统数据库中不同类型数据的特 点,研究适用于服务外包知识产权数据库的数字水印算法,然后将研究出的关系 数据库水印算法应用到知识产权数据库系统中保护服务外包知识产权系统数据 库的版权。 首先,分析知识产权数据库中的数值型数据的特点,通过分析和研究现有的 基于数值型数据的关系数据库数字水印技术,提出一种适用于知识产权数据库的 基于图像的数值型关系数据库水印算法。 然后,通过研究服务外包知识产权系统数据库中非数值型属性的特点,本文 又提出了一种基于相似函数的非数值型数据的关系数据库数字水印算法,从而使 关系数据库水印算法具有更广的实用价值,能够更好的保护服务外包知识产权系 统的版权。 最后,本文将基于图像的关系数据库水印算法应用到知识产权数据库中,设 计实现了知识产权数据库水印系统,并对该系统进行了功能测试和性能测试。 1 4 论文的结构 本文的内容组织如下: 第一章绪论。主要介绍了服务外包知识产权系统和该课题的研究背景,并简 要介绍了本课题所研究的主要内容。 第二章关系数据库上的数字水印技术。主要对关系数据库中数据的特殊性, 关系数据库对水印技术的特殊要求以及关系数据库的主要特征进行了分析,并且 介绍了关系数据库水印技术的通用模型和常见的攻击方式以及关系数据库水印 技术的研究现状。 第三章基于知识产权数据库数值型属性的水印算法。主要针对知识产权数据 库中数值型数据的特点,在分析研究现有的基于数值型数据的关系数据库水印算 法的基础上,提出了一种基于图像的关系数据库水印算法。 第四章基于知识产权数据库非数值型属性的水印算法。主要对服务外包知识 产权系统数据库中非数值型数据的特点进行了分析和研究,提出了一种基于相似 函数的关系数据库水印算法。 第五章知识产权数据库水印系统的实现。主要介绍了知识产权数据库水印系 统的设计和实现过程,并且对该系统进行了功能测试和性能测试。 4 第1 章绪论 第六章总结和展望。总结了本文所做的主要工作,分析和展望了以后的研究 方向和研究重点。 s 第2 章关系数据库上的数字水印技术 2 1 引言 第z 章关系数据库上的数字水印技术 近年来,随着数据库技术的不断发展以及数据库管理系统的广泛应用,在 i n t e r n e t 上允许用户远程查询和访问数据库的同时,数据库的提供者还要担心数 据被窃取和非法复制的问题。因此需要一种机制来表明数据库数据的所有权,这 就带来了数据库所有权保护的问题。利用数字媒体中的数字水印技术在关系数据 库中嵌入水印来保护数据库的版权已经成为数据库版权研究的一个崭新的课题。 目前关系数据库已经广泛应用于各个行业,例如那些提供信息服务( 如气象 信息、人才市场信息、股票交易信息等 公司i s ,对于这些提供信息服务的公司 来讲,该公司的主要资产就是存储在数据库中的大量数据,如果有不法分子非法 盗用或传播该数据库中信息的话,那么这些信息服务公司必然会遭受很大的经济 损失。因此利用数字水印技术实现对数据库版权的保护,具有重要的理论价值和 应用价值。 2 2 关系数据库数字水印的分析 关系数据库水印技术是指为了保护关系数据库中数据的安全和数据库的版 权,在保证数据库使用价值的基础上,在关系数据库中嵌入或直接根据数据库中 数据的特征提取一些能够证明数据库版权的水印信息。数据库中的水印信息虽然 不能阻止数据库中的信息非法传播或者被复制,却可以有效的鉴别非法传播或被 复制的信息的版权。 目前数字水印技术已经在多媒体数字产品中已经得到了广泛的应用,但在关 系数据库中的实际应用却很少,这主要是因为关系数据库中的数据与多媒体数据 存在很大的不同,所以很多较成熟的多媒体数字水印算法不能直接应用到关系数 据库中【1 8 】。 2 2 1 关系数据库中的数据和多媒体的数据之间的差异 目前,数字水印技术在多媒体领域的研究较多,而且相应的软件产品已经投 入到应用中,但是关系数据库领域的水印算法的研究仍然比较少,这主要是因为 关系数据库数据与多媒体数据存在很大的差异,导致很多较成熟的多媒体水印算 6 第2 章关系数据库上的数字水印技术 法不能直接应用到关系数据库中【1 2 】,二者之间的差异主要存在在以下几个方面: 1 、多媒体数据对象是有大量的位组成,并且许多位是冗余的,所以有很大 的空间来隐藏水印。而关系数据库则是由许多独立的元组组成,每个元组代表一 个单独的对象,冗余空间比较少,水印必须分散地隐藏在这些单独的对象中。 2 、多媒体数据对象各个点之间主要存在空间上的有序关系,而组成关系数 据库的元组之间以及元组的属性值集合之间是无序的,数据间一般不存在依赖关 系。 3 、多媒体数据对象某个部分的删除或替换,很容易引起视觉上的变化,而 关系数据库却可以简单地去捧一些元组或者用其他类似的关系数据摩中的元组 来代替而不易被发觉。这使得数据库水印易于被攻击而且难以发现。 4 、静态的多媒体数据一般很少进行更新,而数据库需要经常进行维护更新, 这为确保数字水印的鲁棒性带来困难。 5 、数据库数据主要被机器程序读取和处理,无法像多媒体数据那样基于人 类视觉模型或听觉模型来实现数字水印的隐藏嵌入。 6 、多媒体数据在不改变其原来意义的基础上,一般是不能进行逻辑或算术 运算的。但数据库中的数据往往要迸行逻辑或算术等运算。 由于关系数据库中的数据和多媒体数据存在着上面这些差异,因此很多现有 的成熟的多媒体数字水印技术不能直接应用到关系数据库中,数字水印技术在关 系数据库领域的研究存在着很多困难。但是可以通过对多媒体数字水印技术的分 析和研究,借鉴其思想和基本原理,研究出适合关系数据库数据的数字水印技术。 2 2 z 关系数据库对数宇水印技术的特殊要求 任何数字水印技术必须保证在嵌入水印后不影响原始数据的使用【1 8 | 1 9 1 ,因 此在关系数据库嵌入水印也必须保证不能影响数据库的使用价值,但由于关系数 据库与普通的多媒体不同,是一种特别的记录数据的载体,所以数据库数字水印 技术有下面一些特殊要求: 1 、可嵌入性 由于关系数据库中数据的冗余很小,因此要在不影响原来数据的基础上将水 印信息嵌入到关系数据库中比较难,并且由于关系数据库中的数据具有很强的语 法结构和语法意义,因此必须保证水印嵌入时不能与原有的语法结构和语法意义 矛盾【4 2 】。也就是说,有可能某些数据是不能修改的,而这样的数据自然不能嵌 入水印信息。 2 、可操作性 7 第2 章关系数据库上的数字水印技术 由于关系数据库中数据需要进行一系列的运算,因此要求水印在进行一系列 运算后仍然要附着于关系数据库数据中,这是水印关系数据库研究的难点之一。 一般来说,这就要求水印信息均匀分布于整个数据库并且完全融于数据库的原始 数据中。 3 、动态性 当数据库拥有者对带有水印的数据库进行更新时,水印信息应该随着数据的 更新而嵌入,并且更新数据的水印信息应该跟原来数据库的水印信息保持一致。 当有新的数据加入时,水印信息应能实时嵌入;当有数据修改时,水印信息不会 丢失;当数据正常删除时,要保证数据库中水印信息的完整性。 4 、盲测性 水印检测或提取时,既不需要原始的水印信息,也不需要原始数据就可以从 关系数据库的水印数据中检测提取出水印信息,实现水印的盲提取。这样能够确 保存在于合法复制的数据库副本中的水印总能被检测出来,而不需要依靠更新前 的原始数据库,这些副本中的数据可能被进一步地整合,与原始数据库可能已有 比较大的不同。 5 、可管理性 带有水印的数据形成的数据产品,转移到带有水印管理功能或兼容的数据库 管理系统中要仍然能够运行,水印可以随之迁移,不会轻易丢失。 2 2 3 关系数据库水印的主要特征 由于关系数据库中数据本身的特殊性、关系数据库对数字水印技术特殊要求 以及关系数据库可能受到的各种恶意攻击,关系数据库水印算法必须在鲁棒性和 不可见性之间折中考虑 2 2 , 2 3 】,因此关系数据库中的水印要具备以下几个主要特 性: l 、良好的鲁棒性,因为关系数据库中的数据需要经常进行更新和维护而且 数据库中数据比较容易遭到攻击而不易被发现,因此嵌入到关系数据库中的水印 信息要有足够强的鲁棒性来抵御数据库的常规操作和各种常见的恶意攻击,嵌入 的水印信号不能轻易去掉也不易伪造,而且数据的常规操作不会毁坏已嵌入的水 印。 2 、不可见性要高,对合法的数据库使用者来说,应该是感知不到水印信号 的,而且要不影响原始数据库数据的可用性。 3 、嵌入的水印信息尽可能的多,嵌入关系数据库中的水印信息量越多,水 印就越难丢失或遭到毁坏,而且水印被误判的概率也越小。 8 第2 章关系数据库上的数字水印技木 4 、误判率低,关系数据库中水印的误判主要有两种情况,一种情况是从己 嵌入水印信息的关系数据库中检测或提取不出己嵌入的水印信息,另一种情况是 关系数据库中没有嵌入水印时反而检测或提取出水印信息。 5 、盲检测,由于数据库数据需要经常更新维护,关系数据库的数字水印技 术最好能够在水印提取时实现盲检测,即在水印检测时既不需要原始数据库数据 也不需要水印信息。 2 - 3 关系数据库水印通用模型和攻击方式 2 3 1 关系数据库水印技术的通用模型 关系数据库水印技术与多媒体数字水印技术的算法虽然不尽相同,但他们的 原理大致都是相同的,主要包括数字水印的嵌入过程和数字水印的检测、提取过 程1 孙。 数字水印的嵌入过程主要是原始数字水印信息经过适当地变换后,利用水印 嵌入算法嵌入蓟原始数据库中,从而得到含有水印信息的水印数据库,为了增加 攻击者删除或伪造水印的困难,确保水印数据库的安全性和可靠性,一般的水印 方案在嵌入和提取水印采用了密钥,只有掌握正确密钥的数据库拥有者才能检测 或提取出原始的水印。水印嵌入的实现过程的表示如图2 ,l 。 图2 ,1 水印嵌入盼过程 设原始数据库为,水印信息为矿,密钥为k ,水印嵌入算法为f ,则嵌 入水印后的数据库,可以表示为: ,7 f ( s ,w ,k ) 。 关系数据库数字水印的检测或提取,是用来确定关系数据库数据的版权归 属,当水印数据库中的数据被非法盗用,发生版权纠纷时,一般需要对水印数据 库中的水印进行检测或提取,来证明数据库的所有权,数据库水印的检测或提取 9 第2 章关系数据库上的数字永印技术 的实现的过程如图2 2 所示。 图2 2 水印提取的过程 水印的检测或提取过程至少需要提供待检测的已嵌入水印信息的关系数据 库和正确的密钥,根据检测器和应用场合的不同,数字水印的检测或提取分两种 情况,一种是检测关系数据库中是否存在水印,另一种是从含有水印的关系数据 库中提取出水印。由于采用的水印检测算法的不同,水印的检测或提取过程有可 能要用到原始数据库信息和( 或) 原始的水印信息。假设,是原始的关系数据库, ,7 是已嵌入水印的关系数据库,k 是密钥,d 是水印检测或提取算法,提取出 来的水印信息矽可以表示为:w d ( i ,i ,k ) 或w = d ( ,7 ,k ) ( 盲检测) 。 2 3 z 关系数据库水印常见的攻击方式 由于关系数据库数据需要经常维护更新,所以关系数据库数字水印技术的鲁 棒性要求要比多媒体数据的数字水印技术更高,应该可以防御各种各样的攻击, 包括正常的数据更新和恶意的攻击。嵌入的水印信息不能因为正常的数据操作而 在无意中被除掉,否则就达不到数据库版权保护的目的。除此之外水印系统应该 能够保护数据的版权并且抵御攻击者各种形式的恶意攻击,对水印关系数据库常 见的恶意攻击方式有以下几种【l 孓m j : 1 、子集选取:数据库的窃取者为了去除水印信息,通常只窃取数据库部分 属性或元组来使用,不会使用整个数据库的元组和属性,即进行子集选取攻击。 2 、子集添加:数据库的窃取者为了破坏水印信息会向关系数据库中添加一 些属性或元组,虽然添加的属性或元组没有改变原始数据库中的属性,但是由于 数据库中加入了太多没有水印信息的数据,会使水印的检测更加困难。 1 0 第2 章关系数据库上的数字水印技术 3 、子集更新:数据库的窃取者为了删除非法获得的数据库中的水印信息, 通常会修改窃取的关系数据库中的部分属性或元组,即进行子集更新攻击。 4 、混合和匹配攻击:数据库的窃取者为了破坏数据库中的水印信息,会从 许多不同的数据库中非法盗用比较类似的元组,然后将这些盗用的元组组合起来 组成自己的关系数据库,并对外界宣称自己拥有该数据库版权。 5 、添加攻击:数据库的攻击者会对非法获取的嵌入了水印的数据库数据, 简单地嵌入自己水印然后宣布对数据库的所有权。 6 、可逆性攻击:数据库的攻击者在盗取了某个关系数据库后,有可能在该 数据库中会找到了一个随机出现的虚幻的水印,于是数据库的攻击者就开始对数 据库中的水印进行可逆性攻击,获取了该虚幻的水印后就开始宣布自己拥有该关 系数据库版权。 数据库的攻击者对于不同的关系数据库水印算法有各种不同的攻击方法,所 以理想的数据库水印算法要有足够强的鲁棒性能抵御各种攻击。 2 4 关系数据库水印技术的发展现状 2 4 1 关系数据库水印技术的研究方向 近年来,数字水印技术研究主要集中在以图像水印、音频水印、视频水印为 主的多媒体数据上。2 0 0 0 年,sk h a n n a 等首次提出利用信息隐藏技术实现对数 据库安全控制的新思想【1 9 1 ,使数据库水印技术引起研究者关注。而数据库水印 技术( r d b w m ) 的研究始于2 0 0 2 年,由i b ma l m a n d e n 研究中心的r a k e s ha g r a w a l 【3 】 和j e r r yk i e r n a n 【5 j 在中国香港召开的第2 8 届v l d b 会议上首次提出,目的在于保 护数据库的版权信息。美国国家科学基金( n f s ) 于2 0 0 2 年开始资助有关数据库 水印技术的研究。2 0 0 3 年哈尔滨工业大学的牛夏牧教授将数据库水印技术引人 中国f s j ,越来越多的国内外学者对数据库水印的鲁棒性、可行性进行研究,以期 更好的保护关系数据库的版权。我国的国家自然科学基金于2 0 0 4 年立项资助了 清华大学王建民的水印关系数据库关键技术研究,【副。 目前,关系数据库水印领域的研究主要有以下几个方向: 1 、关系数据库水印鲁棒性的研究。由于关系数据库自身的特殊性和对数字 水印技术的特别要求,关系数据库水印算法的鲁棒性要求更高。专家学者们在这 方面做了大量的研究,利用单向哈希函数对数据库中数据进行加密,水印密钥的 分存【1 1 | ,多次嵌入水印,水印检测时的多数表决机制等都是为了提高水印的鲁棒 性。例如,2 0 0 6 年,张桂芳【4 1 1 等人提出的基于中国剩余定理的数据库水印技 1 1 第2 章关系数据库上的数字水印技术 术,大大提高了数据库水印抵抗子集选取攻击的能力。2 0 0 6 年,彭沛夫【4 0 】等人 提出的基于有效位数的数据库数字水印技术,增加了水印嵌入的信息量。2 0 0 7 年,胡斌1 1 1 】等人提出的于密钥分存的关系数据库数字水印技术,大大提高了 水印抵抗子集修改,子集删除等的鲁棒性。2 0 0 8 年,x i a o y u nc h e n 【7 】,p e n g f e ic h e n 等提出的as e l f - r e s i l i e n c ed i g i t a li m a g ew a t e r m a r kb a s e do nr e l a t i o n a ld a t a b a s e , 有效的增加了删除数据库数据时水印的鲁棒性。 2 、数据库水印嵌入的宿主类型的研究。目前大部分数据库水印算法都是将 水印信息嵌入关系数据库的数值型数据中,但是实际应用的关系数据库中含有大 量的非数值型数据,针对如何将水印信息嵌入到关系数据库的非数值型属性中, 增加水印技术在数据库中的应用范围,使数字水印技术在关系数据库具有真正的 使用价值的研究刚刚起步。s o l a n a sa ,d o m i n g of e r r e rj i l l 等人在第三届国际信息 会议上提出了将水印信息嵌入到非数值型数据中的数据库水印技术,我国蒙应 杰、董晓梅1 1 2 等针对基于非数值型数据库水印技术进行了研究。 3 、数据库脆弱性水印的研究。按照不同的分类标准可以将关系数据库水印 技术分为不同的种类,根据关系数据库水印的功能来分可以将水印分为脆弱性和 鲁棒性两种。关系数据库脆弱性水印对数据库中数据的改动特别敏感,只要攻击 者稍微修改了数据库中的少量数据,即使没有破坏水印信息也会被检测出来,因 此主要用在对数据完整性要求较高的数据库中,检测关系数据库中的数据是否被 修改过,该类数据库水印算法实现的难度很大。l iy ,s w a r u pv 【1 7 1 等率先对关系 数据库脆弱性水印进行了研究,我国肖湘蓉,孙星明【1 8 】等人对脆弱性水印技术 在关系数据库中的应用做了大量的研究工作。 4 、数据库零水印的研究。零水印技术是一种“非嵌入式”的水印技术,关 系数据库零水印技术是指不向关系数据库的数据中嵌入任何水印信息,而是直接 从关系数据库数据中提取数据的某些特征信息作为数据库的版权信息,即“零水 印”,该水印技术没有改动数据库中数据,也不会向数据库中引入任何冗余信息, 因此具有更广泛的适用范围。目前,我国的蒙应杰【4 6 1 、张勇【2 1 j 等人都致力于零 水印技术在关系数据库中的研究。 由于关系数据库不同于一般的静态多媒体作品,所以关系数据库对水印技术 存在着一些特别要求,目前关系数据库数字水印算法研究存在着不少困难,研究 的进展也比较迟缓,相关的关系数据库水印技术还不成熟。 2 4 2 国内外几种基本关系数据库水印算法 1 、r a g r a w a l 的关系数据库水印技术 第2 章关系数据厍上静数孚求蹦j 扳木 2 0 0 2 年,i b ma l m a d e n 研究中心的r a k e s ha g r a w a l 对关系数据库基于数值型 数据的水印算法进行了研究,并提出了标记某些数值型属性的策略f 3 l 。这种策略 的基本思想是:假定可以标记的关系数据库的某些数值型属性的属性值是允许一 定的误差,在其误差范围内不影响关系数据库的正常使用。 标记策略的基本思想是:首先,用m d 5 或s h a 等单项h a s h 函数确定关系数 据库能够被标记的元组,元组是否可以被标记是由用户的密钥、这些元组的主键 值和要被标记元组的比例共同决定的。然后,再根据能被标记的属性的数目以及 这些属性的比特位数共同决定要把被标记的属性和这些属性的具体的比特位置。 最后,对数据库中被标记的元组的数值型数据的比特位数作标记,即置1 或者置 0 ,于是数据库中的水印信息可以看作是整个数据库中很多被标记的比特位所构 成的比特位模式。由用户自己的密钥、元组的主键值以及需要标记的元组比例的 控制算法来共同确定要标记的元组、元组的属性、属性的比特位置以及对某一比 特值的设置。由于添加了密钥,所以只有拥有正确密钥的人,在数据库的攻击者 没有对元组的主键值进行任何改动的情况下,才能检测出已嵌入的水印,这样就 大大的提高了水印的保密性。 2 、r s i o n 的关系数据库水印技术 2 0 0 2 年,美国p u r d u e 大学的r s i o n 等人深入研究了关系数据库水印技术, 研究出一种新的标记关系数据库中某些数值型数据的策略【5 1 。这种策略的基本思 想是:假设关系数据库中一个数值型数据的集合为s = 缱,j 川,s 。) cr ,排序 密钥为k 。首先,根据标准化项目的最大意义比特位的加密码值h a s h 函数 i n d e x ( s i ) = h ( k ,m s b ( n o r m ( s m ,k ) 对关系数据库中的某个数值型数据的集合 s 利用已有的排序密钥k 进行排序,然后,再通过构造不同的子集s 进行水印信 息标记的嵌入。 假设水印信息的长度是m 个比特位,将水印信息的每个比特位嵌入到不同的 子集s 中使水印信息能够分散在整个数据库中,使水印能抵御如子集添加或子集 修改等各种攻击。对于子集选取攻击,如果只选取数据库中项目集合5 的数据, 那么每个子集s 的数据也减少5 ,只要子集墨足够小那么该算法仍有一定的鲁 棒性。 如果关系数据库中每个子集s 都要嵌入一个比特位的水印信息,那么要计算 出选取的要嵌入水印信息的子集s 的大小,即蚓,子集的大小s i l 将直接决定整 个水印信息标记编码的长度,所以可以用来标记的水印信息编码的长度为罱个 比特位。只要项目集合s 足够大,可以多次嵌入水印信息,水印信息就能抵御防 止子集删除攻击,但水f p 嵌入的次数最多为i 次。 在水印检测或提取时,首先从数据库中捷敢出所有的水印备份信息,然后用 】穹 第2 覃关系数据厍上的数字水印技术 多数选举的方法确定水印比特位信息,最后得到原始的水印信息。 3 、牛夏牧的关系数据库水印技术 2 0 0 3 年,我国牛夏牧教授等人首次开始研究关系数据库数字水印技术,并 且提出了一种在关系数据库中嵌入少量有实际意义的水印信息的水印算法【2 3 1 。 其基本思想是:利用已有的关系数据库水印算法,在关系数据库中已经选择出来 的数值型数据的某一个比特位中嵌入一种匹配关系,也就是将数据库中已选择的 属性值编号的h a s h 值的( 奇偶) 与该属性值的最不重要位的值( o 1 ) 相匹配, 但是这种算法只能验证关系数据库中是否嵌入了水印信息,不能提取出有实际意 义能证明版权归属的水印信息。 很明显,用这种验证算法来证明数据库的版权所属太过勉强,如果水印是有 实际意义的信息,那么水印算法会有更好的实用性。上面的验证算法的结果可以 当作一个比特位信息,如果比特值为“1 ”,则证明数据库中嵌入了水印,如果比 特值为“0 ”,那么则证明在数据库中没有嵌入水印。由于该水印验证算法只是在 关系数据库中元组的编号可以被a 整除的元组所组成的个比较小的子集中嵌 入水印信息的,所以可以考虑如果在数据库的朋个子集( m m i 。黪缈o d 娥网;i l i 囊鎏鋈i e n d 1 _ 1 誓 j i 毫 t - = x ;x 铡+ y ;y = t + 2 幸y ; ?- 。曩 e n d j?j 。;j 用a r n o m 变换对水印图像进行预处理主要是为了增加水印信息的保密性,水 印数据库在受到攻击时,如果不知道所用的置乱方法和置乱次数,即使数据攻 击者能恢复出水印信号,仍然无法恢复出原始的水印图像。 2 、k m e a n s 算法 k m e a n s 算法又称k 一平均算法或k 一均值算法,是目前数据库挖掘中最 常用的一种数据聚类算法。算法实现的思路是3 1 3 3 】:首先,从关系数据库的数 据中随机的选取k 个数据,每个数据对象都代表一个聚类的初始均值;接下来, 对数据库中剩下的数据,根据数据对象与每个聚类均值的距离( 相似度) 将其 划分到与之最近( 最相似) 的聚类中;然后,对初步划分的各个聚类重新计算 其均值;不断重复上面的步骤,直到准则函数e 收敛为止,即直到最终划分的 各个聚类不再变化为止。k m e a n s 算法的准则函数定义为: 足 e = zi x - 墨1 2 ( 3 3 ) i = 1x e q 式( 3 3 ) 中e 表示关系数据库中所有数据的平方误差的总和,x 表示关系数 据库中给定的数据,i 表示聚类e 的均值。使用这个准则函数主要是为了使最 终划分好的聚类中的数据对象尽可能的尽可能的紧凑,而各个聚类之间尽可能 的独立。 1 7 第3 章基于知识产权数据库数值型属性的水印算法 k m e a n s 算法的具体算法描述圈: 输入:聚类的数目足和包含刀个数据对象的关系数据库。 输出:满足平均误差准则函数e 最小的k 个聚类。 具体实现的过程: ( 1 ) 从关系数据库中任意选择k 个数据作为足个聚类初始中心; 2 ) 对关系数据库中剩下的数据,根据各个数据对象与各个聚类的距离( 相 似度) ,将各个数据对象分别划分到与之最近( 最相似) 的聚类中; ( 3 ) 对初步划分的各个聚类重新计算其均值,然后用新计算出来的均值作为 新的聚类中心; ( 4 ) 重复执行步骤( 2 ) 和( 3 ) ,直到准则函数e 收敛。 3 2 2 水印嵌入算法 该算法引入了公证方公证版权的思想,在将水印嵌入到数据中时要让版权所 有者和版权公证方持有加密的密钥,a r n o m 变换的次数、变换周期和原始水印 信息。向关系数据库中嵌入数字水印的流程如图3 1 所示,具体的步骤如下: 1 、对原始的水印图像w 进行t 次a r n o m 变换,得到置乱后的水印图像w7 , 设水印图像w 的a r n o m 变换周期为丁。 2 、将置乱后的水印图像w7 转化为二进制比特流。 3 、将得到的水印图像的二进制比特流按照每3 比特一组进行划分,如果最 后一组不够3 个比特,就在前面添加“0 ”补足。 4 、利用k m e a n s 算法,对数据库中的满足有效位数要求的数据值型数据 对象,进行x 个聚类的划分,根据聚类的中心值进行排序 c ,c ,e 。 5 、根据密钥k e y 和主键值r 尸对聚类中的字段值,4 ,利用h a s h 函数计算 其编号l d = h a s h ( k e y ,尸,- 4 ) 。 表3 1 三元组对应表 根据倒数第二位数的取值,修改末位数的值 嵌入的信息 o123456789 0 0 00 01 12 23 34 45 56 67 78 89 9 0 0 1 0 11 22 33 44 5 5 6 6 7 7 8 8 9 9 0 0 1 00 21 32 43 54 65 76 87 98 09 1 0 1 10 31 42 53 64 75 86 97 08 19 2 1 0 0 0 41 52 63 74 8 5 9 6 0 7 1 8 2 9 3 1 0 10 51 62 73 84 95 06 17 28 39 4 1 1 00 61 72 8:3 94 05 16 27 38 49 5 1 1 1 0 71 82 93 04 1 5 2 6 3 7 4 8 5 9 6 第3 章基于知识产权数据厍数值型属性
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 玉米期货风险管理制度
- 现代餐饮人员管理制度
- 现场卫生设备管理制度
- 现金印章票据管理制度
- 珠宝公司人事管理制度
- 班级春节安全管理制度
- 班里安全小组管理制度
- 瓷砖市场业务管理制度
- 生产技术培训管理制度
- 生产班组量化管理制度
- 高空作业车升降车安全方案
- 2022年广东南方报业传媒集团有限公司招聘笔试试题及答案解析
- 口腔黏膜病图示课件
- 国开期末考试《人力资源管理》机考试题及答案(第56套)
- 房地产项目规划设计部工作流程图
- 送教上门情况记录表
- 隧道二衬施工专项方案
- 机械设备供货安装及售后服务方案
- 《深圳公交综合车场设计标准》(征求意见稿)
- 双脉冲测试法对英飞凌FF300R12ME4的测试和研究
- 弃渣场施工方案
评论
0/150
提交评论