




已阅读5页,还剩49页未读, 继续免费阅读
(通信与信息系统专业论文)电子记录关联取证理论与技术研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
武汉理工大学硕士学位论文 摘要 随着计算机网络技术的普及,电子商务以及其它基于网络的活动越来越频 繁,产生了大量的文本、图片、合同、订单等电子记录,其中的一些电子记录 可以作为法律纠纷中的依据,电子记录做为法律依据使用时,必须保证其真实 性,未被伪造或篡改。传统意义上对记录的搜索,通常是在搜索时对记录的某 些信息设置约束条件,然后查询出对应的结果,约束条件对应的信息直接以字 段的形式存在于数据库中,这种搜索存在一定的局限性,它搜索出来的记录只 是满足约束条件的单个记录的集合,记录与记录之间并不存在关联关系。然而, 在实际的应用中,记录和记录之间并不是孤立存在的,经常存在着各种各样的 关联关系,而且这种关联关系往往不直接以字段的形式存在于数据库中,但是 对记录的信息稍加分析后又是显而易见的,这种情况使用传统的搜索方式是无 法实现的。 本文在使用本体对电子记录进行描述的基础上,通过关系规则来动态描述 记录之间的隐含关系,并依据关系包含的规则实现基于规则的关联取证,从而 实现传统搜索无法实现的关联取证。同时,通过将电子记录与数字签名结合起 来,提出电子记录的关联签名,不仅可以保证电子记录的可信性,还可以不经 过搜索过程直接获取与其关联的记录。在计算关联签名时将关联的记录与当前 的电子记录关联起来,在对电子记录进行取证时,不仅要取出电子记录的详细 信息,还要从记录的签名数据中取出与其关联的记录的信息,并对关联的电子 记录中的关键信息进行验证,从而形成基于关联签名的电子记录证据链。 本文的创新点和特色之处可以归纳为以下两点: 第一,在本体描述电子记录的基础上,根据类和类包含的属性通过s w r l ( s e m a n t i cw e br u l el a n g u a g e ) 语言动态创建关系规则,并对关系规则的取证 进行理论分析,最终实现基于规则的关联取证; 第二,通过研究电子记录的存在形式,完成电子记录关联签名的设计,并 实现电子记录关联签名的搜索取证。 关键字:电子记录,关联取证,关系,规则,关联签名 武汉理工大学硕士学位论文 a b s t r a c t w i t ht h ep o p u l a r i z a t i o no fc o m p u t e rn e t w o r kt e c h n o l o g y , e - c o m m e r c ea n do t h e r w e b - b a s e da c t i v i t i e sa r eb e c o m i n gm o r ea n dm o r ef r e q u e n t t h u s ,al a r g en u m b e ro f t e x t ,p i c t u r e s ,c o n t r a c t s ,o r d e r sa n do t h e re l e c t r o n i cr e c o r d sa r eg e n e r a t e d ,s o m eo f w h i c hc a nb eu s e da st h eb a s i sf o rl e g a ld i s p u t e s b e f o r et h ee l e c t r o n i cr e c o r d sa r e u s e da se v i d e n c e ,w em u s te n s u r ei t sa u t h e n t i c i t y , i ts h o u l dh a v en o tb e e nf o r g e do r t a m p e r e d t r a d i t i o n a ls e a r c h o fr e c o r d su s u a l l yb ys e t t i n gc o n s t r a i n t s o ft h e i n f o r m a t i o nw h i c ht h er e c o r dc o n t a i n e d ,a n dt h e nq u e r yt h ed a t a b a s et og e tt h e c o r r e s p o n d i n gr e s u l t s t h e c o n s t r a i n tc o n d i t i o n so f l c nh a v ec o r r e s p o n d i n gf i e l d s d i r e c t l yi nt h ed a t a b a s e t h e r ea r es o m el i m i t a t i o n so ft h i ss e a r c hm o d e ,t h er e s u l t s s e a r c h e db yt h i sm e t h o dc a l lo n l ym e e tt h ec o n s t r a i n t s t h e r ei sn or e l a t i o n s h i p a m o n gt h er e c o r d s h o w e v e r , t h ee l e c t r o n i cr e c o r do f t e ne x i s t sn o ti ni s o l a t i o n ,i t u s u a l l yh a sr e l a t i o n s h i pw i t ho t h e re l e c t r o n i cr e c o r d si np r a c t i c a la p p l i c a t i o n s ,a n d t h i sr e l a t i o n s h i ph a sn od i r e c t l yf i e l d si nd a t a b a s e ,w h i c hc a nb e e a s i l yg o tb y 趾百i c i z i n gt h ei n f o r m a t i o no fe l e c t r o n i cr e c o r d t h i ss i t u a t i o nc a nn o tb es o l v e db y t r a d i t i o n a ls e a r c h t h i sp a p e rd y n a m i c a l l yd e f i n et h er e l a t i o n s h i pb e t w e e ne l e c t r o n i cr e c o r d so nt h e b a s i so fd e s c r i b i n gt h ee l e c t r o n i cr e c o r db yu s i n go n t o l o g y , a n dt h e ng e tt h er e l a t e d r e c o r d sb ya n a l y s i st h er u l e sc o n t a i n e di nt h er e l a t i o n s h i pp r o p e r t y , w h i c hc a nn o tb e g e tb yt r a d i t i o n a ls e a r c h b e s i d e s ,w ep r o p o s a lc o r r e l a t e ds i g n a t u r eb yc o m b i n i n g e l e c t r o n i cr e c o r d sa n dd i g i t a ls i g n a t u r e ,w h i c hc 锄n o to n l ye n s u r et h ec r e d i b i l i t yo f t h er e c o r d ,b u ta l s og e tr e l a t e dr e c o r d sw i t h o u ts e a r c h i n g i nt h ec a l c u l a t i o no ft h e c o r r e l a t e ds i g n a t u r e ,t h ei n f o r m a t i o no ft h ee l e c t r o n i cr e c o r d sa s s o c i a t e dw i t ht h e c u r r e n te l e c t r o n i cr e c o r dw i l lb ea d d e di nt h es i g n a t u r e t h ed e t a i l e di n f o r m a t i o no f t h er e c o r da n dt h ea s s o c i a t e de l e c t r o n i cr e c o r d sw i t ht h er e c o r ds h o u l db o t hb eg o t w h e nw es e a r c ht h er e c o r d ,a tt h es a m et i m e ,t h ek e yi n f o r m a t i o no ft h ea s s o c i a t e d e l e c t r o n i cr e c o r d ss h o u l db ev e r i f i e d f i n a l l y , w ew i l lg e tac h a i no fe l e c t r o n i cr e c o r d s b a s e do nc o r r e l a t es i g n a t u r e i n n o v a t i o na n dc h a r a c t e r i s t i c so ft h i s p a p e rc a nb es u m m a r i z e di n t ot h e 武汉理工大学硕士学位论文 f o l l o w i n gt w op o i n t s : f i r s t l y , u s eo n t o l o g yt od e s c r i b et h ee l e c t r o n i cr e c o r d s ,a n dt h e nd y n a m i c a l l y c r e a t er u l e st h r o u g hs w r l ( s e m a n t i cw e br u l el a n g u a g e ) l a n g u a g ea c c o r d i n gt ot h e c l a s sa n dt h ep r o p e r t i e sc o n t a i n e di nt h ec l a s s ,f i n a l l ya n a l y s i st h er u l e sc o n t a i n e di n t h er e l a t i o n s h i pp r o p e r t ya n dr e a l i z et h er e l a t e ds e a r c h s e c o n d l y , d e s i g nc o r r e l a t e ds i g n a t u r eb ya n g l i c i z i n gt h ef o r mo ft h ee l e c t r o n i c r e c o r d s ,a n dt h e nr e a l i z et h es e a r c hf o r e n s i c so ft h ec o r r e l a t e ds i g n a t u r ec o n t a i n e di n e l e c t r o n i cr e c o r d k e yw o r d s :e l e c t r o n i cr e c o r d ,r e l a t e ds e a r c h ,r e l a t i o n s h i p ,r u l e ,c o r r e l a t e ds i g n a t u r e i i i 武汉理工大学硕士学位论文 1 1 课题来源 第1 章绪论 “十一五 国家科技支撑计划重点项目可信电子记录技术研发与应用示 范( 项目编号:2 0 0 9 b a h 3 9 8 0 3 ) 。 1 2 课题背景 计算机网络技术的普及,使得电子商务、电子政务以及其它基于网络的活 动大量出现,产生了大量的文本、图像、合同、订单等电子数据,其中一些有 用的电子数据被存储起来,用于日常生活和工作的查阅,也可以作为法律纠纷 中的依据,这些以电子方式存储的记录被称为电子记录【1 1 ,例如电子合同、电子 交易单、电子聊天记录等。电子记录和传统的纸质记录相比较有着创建容易、 存储信息量大、修改简单等更多的优点,正是由于电子记录的这些优势,使得 电子记录深入到社会生活的各个方面【2 j 。 信息技术的不断发展,网络上的电子记录数量越来越多,用户可获取的信 息量越来越大,信息量大的同时必然会造成电子记录描述和存储多样化。针对 不同的应用会开发相应的系统,会导致重复性的开发,造成资源的浪费,并且 多个应用之间没有统一的标准,无法实现系统间的数据交换。此外,由于电子 记录对应的管理系统通常是由其运营商开发并存储与之相应的电子记录,它可 以将不利于自己的电子记录进行修改和删除,不能保证电子记录的公正性。以 上的问题使得信息服务和信息组织面临各种新的挑战。 目前对电子记录的管理更多地是将其作为一个信息的存储和查询系统来使 用,由于这些系统通常具有针对性,往往只是实现了电子记录的存储和普通搜 索,没有更高层次的关联取证功能,因而如何有效的组织、管理和维护这些记 录,在浩如烟海的信息中取到对用户有价值的信息己经成为一个非常重要的问 题,所以对电子记录的搜索取证技术研究具有理论与现实意义。 武汉理工大学硕士学位论文 1 3 国内外研究现状 目前的w e b 模型主要支持对文本内容的浏览和搜索,随着网络信息的大量 增加,该模型已经无法胜任海量信息的交换和处理工作,需要新的模型来支持 对w e b 信息资源、服务以及智能应用的统一访问,并通过标准机制去交换数据 和处理不同的数据语义。语义i 网( s e m a n t i cw e b ) 3 - 6 】是一种能理解人类语言的智能 网络,旨在赋予如今的网络一个全新的体系结构和运作方式,它不但能够理解 人类的语言,而且还可以使人与电脑之间的交流变得像人与人之间交流一样轻 松。但是语义网只是一种网络结构,是人们对未来网络的一种希望,仍然需要 一种能够表示网络资源的方法,x m l 模型可用于数据的表示和交换,但缺乏描 述语义信息的能力,在不知x m l 元素的语义的前提下,计算机仍无法理解信息, 就需要一个更高的层次来描述结构的语义。为此,w 3 c ( w o r l dw j d ew r e b c o n s o r t i u m ) 于2 0 0 3 年1 0 月颁布了推荐标准r d f ( r e s o u r c ed e s c r i p t i o n f r a m e w o r k ,资源描述框架) 1 7 j 来描述网络上的信息资源,r d f 可以定义元素之间 的关系,具体表现为三元组集( 类似于句子的主体、谓词、客体) 【8 9 l 。虽然r d f 具有较强的表达能力,但仍存在一些不足,如r d f 没有定义推理和公理的机制 等,为了更好适应语义网需要,w 3 c 于2 0 0 4 年3 月推出了o w l 悱1 2 】( o n t o l o g y w e b l a n g u a g e ) 语言,这两者都是w 3 c 致力于的语义网的关键组成部分。o w l 语 言以描述逻辑为语义推理基础,目前已成为语义网发展和本体建立的重要工具 专一f 1 3 ,1 4 】o o 随着本体应用的日益广泛,相关的研究也越来越多,国外对语义网的研究 主要应用在人工智能、情境感知、知识工程、智能检索等领域。w 3 c 为本体和 语义网方面的发展做了大量的研究工作,并且开发了很多本体的推理引擎,为 本体进行信息检索和推广提供了应用的前景和统一的标准【1 5 - 阍。 电子记录的相关应用随着计算机的发展越来越广,涉及到档案管理、金融、 医疗等各个行业,由此产生的电子记录种类也各种各样,使电子记录在创建、 存储、传输与查询时产生很多不便。随着电子记录应用的不断增加,对电子记 录的理论研究也越来越深入,如何保证电子记录的真实性和可靠性成为研究的 重点,欧美等发达国家在电子记录、电子档案、电子病历等设立研究项目,赋 予法律效力并推进电子数据的安全管理规范的实施,电子记录做为证据的相关 法规在我国的发展相对缓慢。电子记录通常使用自定义的表现形式,在生成、 2 武汉理工大学硕士学位论文 存储和搜索等方面缺乏统一的操作标准和规范,而本体使用的是通用的概念描 述方法,因此在不同的系统间可以通过使用本体描述来达到一致的交互【挣2 2 1 。 电子记录的日益流行,使得电子记录的取证技术显得尤为重要,然而现在 使用的取证技术只能对已有的数据加以简单搜索,通常是通过对电子记录包含 的信息设置约束条件完成,这种搜索无法满足关联取证要求,不能根据已有的 数据加上推理规则实现关联取证,也不能实现电子记录的证据链取证功能。例 如:一阶逻辑1 2 3 j 定义的概念:f a t h e r ( ? x ,? y ) b r o t h c r ( ? y ,? z ) u n c l c ( ? x ,? z ) , 它表示的意思为:如果v 是x 的父亲,并且y 和z 是兄弟,那么可以知道z 是x 的叔叔 2 5 1 。在已有的记录中即使有了前面的两个前提条件,如果在数据库中 没有物理性的存储z 是x 的叔叔这条记录,使用现有的搜索无法得到这个显而易 见的结果,但是通过定义与之对应的关系规则以后,可以通过搜索取证得到这 个结果。 s w r l 2 6 j 是以语义的方式呈现规则的一种语言,s w r l 规则的概念由 r u l e m l ( r u l em a r k e dl a n g u a g e ) 2 7 演变,再结合本体概念形成,目前s w r l 已 经成为w 3 c 的规范之一。规则的表示在语义w e b 中发挥着重要的作用,规则可 以表达更多的知识,通过对现有的数据进行分析可以将隐含的关联关系显式的 表现出来,同时,规则表达能力可以大大节省存储空间,记录之间的关系是通 过已有的数据和规则的定义动态推理得到,而非事先存储 2 8 - 3 2 1 。 本文在对电子记录进行本体描述的基础上,采用w c b 框架s t r u t s 3 3 - 3 5 1 + s p r i n g 3 6 3 7 】搭建系统,利用s w r l 强大的语义表达能力定义关系规则,关系规则可以 动态的改变,从而保证格式不同的电子记录规则制定的灵活多样化,然后,根 据定义的规则实现电子记录的关联取证:此外,引入电子记录的关联签名保证 电子记录的可信性,在获取记录的信息时,取出电子记录的关联签名信息中包 含的关联记录,形成记录链。 1 4 主要研究内容 本论文主要研究了关系规则的定义,并根据所定义的规则搜索出满足要求 的结果,同时对电子记录的关联签名进行设计,该研究要实现的功能包括: ( 1 ) 对关系所要包含的规则进行定义,使得规则表达的意思清晰、明确, 不会产生歧义。 ( 2 ) 根据关系中包含规则的定义,对已有的电子记录进行快速、准确的搜 3 武汉理工大学硕士学位论文 索取证,得出正确的结果。 ( 3 ) 实现电子记录关联签名的计算和验证,并对签名中包含的关联的电子 记录进行取证。 1 5 论文结构 本论文划分为七章,各章包含的内容安排如下: 第1 章绪论 介绍课题的来源、背景和国内外研究现状,并对本论文的主要研究内容以 及结构作了说明。 第2 章关系规则定义 本章介绍了基于o w l 的电子记录的描述,借助本体强大的描述功能完成对 电子记录的描述,进而实现电子记录的存储。在此基础上,介绍了记录关系的 定义,并详细讲述了关系包含的规则的定义过程。 第3 章基于规则的电子记录关联取证理论研究 本章首先对规则条件的类型进行分析,然后对基于本地记录的关系和包含 远端的关系这两种关系的关联取证过程进行理论分析。 第4 章基于规则的电子记录关联取证实现 本章主要介绍了关联取证的实现,在对关系类型划分的基础上,给予两种 具体关系的实现过程。 第5 章电子记录关联签名的设计 本章介绍了电子记录做关联签名的必要性,详细说明了关联签名的计算、 验证过程,对关联签名中包含的关联记录进行取证,最终形成电子记录的关联 签名证据链。 第6 章搜索取证测试与分析 本章主要对基于规则的关系的关联取证和电子记录的关联签名的关联取证 进行测试和分析。 第7 章总结与展望 本章对全文的研究内容进行总结,并提出本研究存在的不足之处以及改进 的方向。 4 武汉理工大学硕士学位论文 第2 章关系规则定义 传统意义上对记录的搜索,通常是在搜索时对记录的某些信息( 字段值) 设置约束后查询出对应的结果,如:搜索出姓名为“张三 的所有人,这种方 式也是当下最常用的记录搜索方式,但是这种搜索存在一定的局限性,它搜索 出来的结果只是满足所设置的约束条件,记录与记录之间并不存在关联关系。 根据实际的情况,可以知道记录和记录之间并不是孤立存在的,必然存在 着各种各样的关联,而且它们之间通常不仅仅通过相同的字段信息来关联的, 如:有一个描述人的数据库,每条数据都包含“父亲的身份证号”字段,那么 根据现实的情况容易知道“父亲的身份证号 这个字段值相同的多个记录之间 是亲兄弟、亲姐妹或亲兄妹的关系,甚至在记录的两端都要求性别为“男 ,就 可以得到所有的亲兄弟结果,但是这种结果用传统的搜索是无法达到的。这里, 基于s w r l 的关系规则可以轻易的描述出这种隐含的搜索,而s w r l 的关系规 则是在o w l 本体描述电子记录的基础上形成,所以要详细了解s w r l 关系规 则,必须先了解基于o w l 的电子记录描述及存储。 2 1 基于o w l 的电子记录描述 要了解基于o w l 的电子记录的描述,必须首先了解本体语言为描述记录所 提供的主要概念:c l a s s ( 类) 、p r o p e r t y ( 属性) 和i n d i v i d u a l ( 个体) 。 类:类用于描述一组共享某些属性的个体,如:所有的人都有名字、年龄、 性别等信息,因此可以将人定义为一个p e r s o n 类,那么所有的人都是p e r s o n 类 的对象。 类与类之间用s u b c l a s s o f 来关联,类as u b c l a s s o f 类b ,表示类a 是类b 的子类,类b 是类a 的父类。类之间有以下特性f 1 1 】: ( 1 ) 子类的实例默认全部都是父类的实例; ( 2 ) 类的继承关系可以传递,若类a 是类b 的子类,类b 是类c 的子类, 那么类a 也是类c 的子类: ( 3 ) 类可以多继承,某个类可以是一个类或多个类的子类。 本体中,所有的类都包含一个共同的父类o w l :t h i n g ,当创建某个类时不指 5 武汉理工大学硕士学位论文 明它的父类时,则默认它的父类为o w l :t h i n g 。以下给出一个p e r s o n 类的定义: 属性:属性用于定义个体与个体之间的关系或描述个体与个体中数据值的 关系。属性的定义包括类型、定义域、值域等的定义【儿j 。属性是个二元的关系, 定义时要指定它的定义域和值域,它的类型有以下两种: ( 1 ) d a t a t y p e p r o p e r t y ( 数据属性) :用以描述类的实例与r d f 文字或x m l s c h e m a 中规定的数据类型之间的关系,它的定义域为某个类,值域为r d f 文字 或x m ls c h e m a 中规定的数据类型。如:有个人的名字叫张三,那么这里名字 相当于是一个数据属性,它的定义域为p e r s o n 类,值域为x s d :s t r i n g ; ( 2 ) o b j e c t p r o p e r t y ( 对象属性) :用以描述两个记录类的实例之间的关系。 如:张明是张晓明的父亲,这里父亲就相当于是一个对象属性,它的定义域和 值域都为p e r s o n 类。 属性之间也可以有继承关系,属性a s u b p r o p e r t y o f 属性b ,表示属性a 是 属性b 的子属性,属性b 是属性a 的父属性,属性类型自动从父属性继承,即 父属性为数据属性,子属性也必然是数据属性。 个体:个体是类的实例。下面给出一个p e r s o n 类的实例的定义: 在了解以上的概念后,借助本体的强大描述功能来描述电子记录,电子记 录的本体描述包括记录类的描述以及记录属性的描述。 记录类是用来描述电子记录的本体类,相当于是对具体电子记录的抽象, 一个记录类可以用以描述一个特定的应用系统。结合本体类的自身特性和前文 中提到的电子记录可能的类型,这里用有继承关系的树状结构来描述记录类的 关系,记录类继承关系图如图2 1 所示。 类似本体中类的定义,根记录类是所有记录类的父类,记录的存储位置既 可能在当前系统对应的数据库中,也可能在其它系统的数据库中,因而将记录 类分为本地记录类和远端记录类两种,结合记录类可能的三种类型:表单型 ( f o r m ) 记录、文件型( f i l e ) 记录和表单+ 文件型( f o r m + f i l e ) 记录,将记录 类细分为:表单型本地记录类、文件型本地记录类、表单+ 文件型本地记录类、 表单型远端记录类和表单+ 文件型远端记录类五种,如图2 1 中线框内所示。给 予了分类后,在创建新的记录类时,按照具体的情况继承其中的一种。 6 武汉理工大学硕士学位论文 图2 1 记录类继承关系图 有了记录类的分类,还需要一些属性来描述类的具体信息,比如:类的标 识、作用等,具体介绍如下: 记录类的父类名称:用以存放当前类的父类的表识,每个记录类都会有自 己的用以描述电子记录的记录属性,当子类继承父类后,会继承父类的记录属 性,即子类的实例可以使用从父类继承下来的属性; 记录类命名空间:用以存放符合本体规范的命名空间( n a m e s p a c e ) ,与 l o c a l n a m e 一起组成本体中资源的唯一标识( u r i ) ; 记录类局部i d :用以存放记录类的局部i d ,即本体规范中资源的l o c a l n a m e , 与命名空间一起组成本体中资源的唯一标i 只( u r i ) ; 记录类名称:用以存放当前记录类的中文名字,便于用户使用; 记录类描述:用以存放记录类的详细描述,比如其作用等; 记录类类型:用以存放记录类的类型,其值为f o r m 、f i l e 、f o r m + f i l e 中的一 种,代表表单型、文件型和表单+ 文件型; 实例存放位置:用以描述记录类实例的存放位置,根据具体的情况,记录 的数据可能全部存放于当前的系统,可能全部存放于其它的系统,可能部分在 当前的系统中,部分在其它的系统中,因而,存放位置为本地、部分远端和远 端三种。 实例的存储处理组件:当系统接收到某个电子记录后要对其进行存储,但 是接收到的数据的格式往往不能直接进行存储,需要对其进行处理得到统一格 式的数据,即存储处理组件。这里要求同一个记录类接收到的数据格式是一致 7 武汉理工大学硕士学位论文 的,只有这样才能进行统一处理; 实例的显示处理组件:从数据库中取到电子记录给用户展示时,由于不同 的记录类中的数据格式各不相同,所以需要通过不同的方法来处理数据的格式, 达到显示的效果,即显示处理组件,它与存储处理组件是相互对应的; 实例的唯一标识产生方式:存储电子记录时,每个电子记录都有唯一的标 识( u r i ) ,这个标识可以是由记录的发送方产生,也可以由记录的接收方产生; 前置系统的处理组件:当记录类的记录存放位置为部分远端或全部远端时, 只连接当前系统的数据库将会取不到完整的记录,因而需要给其设置一个前置 系统,前置系统有远端部分数据的配置信息,如:数据库的位置、名字、密码、 信息所在的表等,根据这个配置信息可以取得不在当前系统中的记录的信息。 以上的所有属性都是用于描述类本身的信息或对类的所有记录的总括性描 述,仅有这些属性是无法描述电子记录的,如:为了描述人的基本信息( 姓名、 性别、身份证号等) ,可以创建一个p e r s o n 的记录类,但是,仅有类p e r s o n 是无 法取到姓名、性别、身份证号这些信息的。为了描述记录的详细信息,需要给 记录类设置一些属性,称为记录属性,每一个属性与数据库表中的字段相对应, 这里记录属性的描述也采用本体的方式存储,因此,需要遵循本体的一些规则。 与记录类的描述类似,记录属性包含有命名空间、局部i d 、中文名称、描 述信息,此外,记录属性还拥有定义域和值域,定义域为当前的记录类,表示 只有当前的记录类及其子类能够使用这个属性,取值可以为i n t e g e r 、s t r i n g 、 b o o l e a n 、d a t e 、a n y 等类型。此外,记录属性做为本体中的一个资源,也可以 使用属性来描述。例如:某个属性为签名属性时,表示这个属性的值是一个签 名值,而签名的验证需要知道签名数据中包含了记录的哪些信息,此时可以通 过给签名属性设置一个签名列表属性来描述其包含的字段列表,从而在获取记 录详情时,取出签名列表包含的记录部分的信息作为原始值对签名数据进行验 证。 给出一个名为“人类的记录类定义如图2 2 所示: 8 武汉理工大学硕士学位论文 奠萎g 嚣 湖搂蠢苦舅日 琶录 局蓥叠 琶录羹名韩 霉瓣奇蛐拘芷理静 窑何量季眺理蛙蚌 证酣瞄蜷 记弼荨蹬 宴弹 _ 嚣 期e 驴唑 袭酋父茹 h h f m :m t 4 龚 r 认存肆托彰 缴馒暴煳瞄 褂于拦堙 尧斟# 据潮 蠹羹委 甜娃喊 翟霉毳l 蒜j 秘瓣罕磊黼: ;獬。t 一妇:。c 。n 麓。;嚣 嚣鬻 嚣鬟 ;m船喇蕾l逆景字&镪$ 地 j始琵爷瞄oj 亲身懿垮蕾疆 己晕宇睦往童撼 j$ 抛转女艇;昔豫豫髓执 二霉7 ”。o 并镕 e d 喊簦名翘铭胜钧$本地 !j 毓k塞子鼻黼碍昔适记录宇段矗毫树 记棼蠡碰 稿i 翰i 证挚聋麟燃: 渡浸羹蹬胥e 何记录睹n 西墨毳壁? 图2 - 2 “人类 的定义 2 2 基于o w l 的电子记录存储 记录类的创建目的是为了存储对应的电子记录,在对记录类及记录类包含 的记录属性定义的完成后,就可以创建记录类对应的记录实例。 记录实例可以采用本体的方式存储( 三元组格式) ,采用本体方式存储记录 时,在存储一个记录时,首先会为这个记录产生一个唯一标识( u r i ) ,然后,根 据这个记录所包含的属性条数会产生多条数据,主语为记录的u r i ,谓词为属性 的u r i ,宾语为记录对应的属性值,即在完成一个记录的存储时,往往在数据库 中会产生多条数据与这一个记录对应,而且会随着用于描述记录的属性条数变 多而增多,采用这种存储方式在记录数量大到一定的程度后,通过分页方式读 取记录的过程会变的缓慢。因此,这里采用一种本体与普通数据库存储相结合 的方式来存储记录,每个记录仍然有自己的u r i ,但并不是以三元组方式存储数 据,而是采用通常所用的方式,一条记录在一个表中只占用一条记录。 存储记录前需要创建记录类对应的数据表,在这里记录的存储采用“增量” 存储的方式,即每个记录类都拥有一个与之对应的表,并且表中只包含自己所 拥有的属性信息。子类继承父类的属性后,虽然子类拥有父类的属性,但是子 类对应的数据表中并不创建从父类继承的属性。记录类所拥有的属性及其对应 表的关系如图2 3 所示,有两个记录类c l a s s a 和c l a s s b ,c l a s s a 拥有记录属性: 9 武汉理工大学硕士学位论文 p r o a l 、p r o a 2 p r o a n 共1 1 个,c l a s s b 拥有记录属性:p r o b l 、p r o b 2 p r o b n 共 n 个,c l a s s b 是c l a s s a 的子类,因而c l a s s b 拥有c l a s s a 拥有的属性,在创建表 时,记录类a 对应的表只包含自己的记录属性p r o a l p r o a n 和i d 字段,记录 类b 对应的表也是只包含自己的记录属性p r o b l p r o b n 和i d 字段,当存储子记 录类的记录时,从父类继承来的属性值仍然存储在父类对应的表中,子类自身 拥有的属性存储在子类对应的表中,即一条记录可能被存储在多个表中,所以 需要一个共同的字段i d 来将同一条记录关联起来,i d 值相同的记录表示同一条 记录。 记录类a i ( c l a s s a ) s u b c l a s s o f 记录类b ( c l a s s b ) 从 类 a 继 承 类 b 自 身 拥 有 关联字段 图2 3 记录类对应表的关系 系统的数据存储是通过客户端调用的,因此需要运用数据的传输协议。本 系统实现了w e bs e r v i c e 的调用方式。其它应用系统调用系统发布的w e b s e r v i c e 接口发送记录到当前的系统,当前系统接收到的数据后,会判断当前的系统中 是否存在着存储数据的线程,如果有就使用这个线程,如果没有就启动一个线 程处理接收到的数据,从数据中提取出记录对应的记录类,然后根据记录类的 配置信息找到对应的存储处理组件对接收到的数据进行处理,然后将处理后的 数据按照上面提到的“增量 的方式存储到记录类对应的数据表中。 1 0 茹;融 ,0,i 、l0产ij,、illj 删础;跳藿础脚厂,illiii、llii 武汉理工大学硕士学位论文 2 3 关系属性的定义 在完成了对电子记录的描述并通过w c b s e r v i c e 接口的调用以后,本系统中 就拥有了记录类以及记录类的记录,就可以根据记录类或通过对记录属性值添 加限制条件进行简单的搜索。如前文所述,数据库中的记录往往具有一些隐含 的关联,但是这种隐含的关联无法通过简单的搜索直接搜索得来,而是通过记 录的属性值之间的比较得来。本系统将这种隐含的关联称为关系,这种关系隐 含于数据库中,但并不直接以某条记录的某个字段值的形式出现于数据库中。 关系属性的定义也是基于o w l 描述的,因此它也必须遵从本体的一些相关 规则,关系属性包括的具体信息介绍如下: ( 1 ) 有自己的命名空间( n a m e s p a c e ) 和局部i d ( 1 0 e a l n a m c ) ,并且命名空 间+ 局部i d 组成唯一的标识u r i ; ( 2 ) 关系名称,即关系属性的中文名字,能使用户迅速了解到关系属性的 作用; ( 3 ) 关系描述,关系属性的详细介绍,详细说明关系属性的作用; ( 4 ) 定义域和值域,关系属性用于描述两个记录之间的联系,因此,它必 然是一个对象属性( o b j e c t p r o p e r t y ) ,它的定义域和值域指向具体的记录类,定 义域指定哪些记录类可以使用当前的关系,值域用于指定当前关系的值可以是 哪些记录类的记录; ( 5 ) 父属性名称,指向当前属性的父属性。本体的属性之间有继承关系, 这里定义了一个名为“关系属性 的对象属性做为新创建的属性的父属性,从 而使所有的关系属性形成树状结构。 关系属性的定义如图2 5 所示,父关系默认为内置的根属性,可以更改。 一。秣猫箨搿,髓嚣4 | ;一事_ = = 墨,。粤善掣 差,莩名张: 关军属性臣i 雪 乒手昂名望晷:h t t f ? m to 扎i :n 兰争:。m :l 。毫精、:叔权 誊猫、- : 用羊描述叔叔的关系属性 ,争羔竺 。萤爹兰j ! 二国劳型童,拼墼二j 皤 单 回馕鸶? 图2 5 关系属性的定义 武汉理工大学硕士学位论文 2 4 规则的定义 记录之间隐含的关联用关系来描述,但是,仅有关系属性的基本信息、定 义域和值域等信息并不足以将其描述出来,记录之间需要满足一定的条件才能 称其满足关系,这些条件被称为规则。如:一个简单的一阶逻辑的推理 f a t h e r ( ? x ,? y ) f a t h e r ( ? y ,7 z ) - g r a n d f a t h e r ( ? x ,? z ) ,表示的意思为如果y 是x 的父亲,并且z 是y 的父亲,那么z 是x 的祖父,其中,“ 左边的称为规则 的条件,“ 右边的称为规则的结果,规则条件与规则结果一起构成一条完整 的规则。规则的定义过程就是要将这样的规则描述出来。 2 4 1 规则定义原理 描述逻辑( d e s c r i p t i o nl o g i c ) 是基于对象的知识表示,它具有很强的表达能 力,被认为是以对象为中心的表示语言的最为重要一种形式。本体语言中的o w l d l 语言就是基于描述逻辑的,但它不能有效地表示“i f t h e n 样式的规则, 而使用s w r l 可以有效地弥补这些不足,并且s w r l 是基于本体的,可以很好 的利用已有的类和属性将规则描述出来,规则的表述采用“规则结果如果规 则条件的形式来描述,如:x 有祖父z 如果x 有父亲y & y 有父亲z 。规 则结构图如图2 6 所示。 图2 - 6 规则结构图 s w r l 规范中规定的元素,可以针对记录间隐含的关联条件进行描述,即将 隐含的关系条件化,使其成为可见的规则,s w r l言架构图如图2 7 所示1 3 8 】。 用s w r l 描述的每一条规则用一个s w r l :i m p 来表示,它由s w r h h e a d 和s w r l :b o d y 武汉理工大学硕士学位论文 两部分组成,s w r l :h e a d 用于描述规则的结果部分,s w r l :b o d y 用于描述规则的条 件部分,表示由条件推出结果。条件部分可以由多个条件组成,多个条件之间 是“与 的关系,即所有条件都必须满足。如果某个条件可以用其它条件替换, 即这里会出现“或”,为描述这种规则,可以再创建一条规则,让规则的头部 ( s w r l :h e a d ) 保持一致,规则中的其它条件不变,出现“或 的地方用可以替换 的条件进行替换即可实现。 图2 7 s w r l 语言架构图 以下对s w r l 规范中规定的规则构成的元素详细介绍【2 6 1 。 ( 1 ) s w r l :c l a s s a t o m ,针对个体或者变量名的描述,即描述的个体或变量为 类的实例。如:变量x 为类p e r s o n 的一个实例表示如下: x ( 2 ) s w r l :d a t a r a n g e a t o m ,用以描述一个数据的取值类型或取值的范围,取 值类型为x m ls c h e m a 中定义的数据类型,取值范围可以是一个集合,表示取 武汉理工大学硕士学位论文 值可以为集合中的任意一个。如:变量x 的取值为5 或1 0 表示如下: 5 l o x ( 3 ) s w r l :i n d i v i d u a l p r o p e r t y a t o m ,用以限定某个变量或某个实例的属性值, 并且属性值是某个实例。如:变量x 有个属性为h a s f a t h c r ,属性值为j i m ,表示 如下: x 1 ( 4 ) s w r l :d a t a v a l u e d p r o p e r t y a t o m ,用以限定某个变量或某个实例的属性值, 并且属性值是个数值。如:变量x 有个属性为i d n u m b e r ,属性值为1 0 0 0 ,表示 如下: x 1 0 0 0 ( 5 ) s w r l :s a m e i n d i v i d u a l a t o m ,用以描述两个实例为相同的实例。如:变量 x 和y 为相同的实例,表示如下: x y ( 6 ) s w r l :d i f f e r e n t l n d i v i d u a l s a t o m ,用以描述两个元素为不同的实例。如: x 和y 为不同的实例,表示如下: 1 4 武汉理工大学硕士学位论文 x y ( 7 ) s w r l :b u i l t i n a t o m ,描述的s w r l 的扩展,运用模块化的方法,使其实 现更加灵活。目前可以使用的包括:用于比较的( b u i l t i n sf o rc o m p a r i s o n s ) 、 用于数字计算的( m a t hb u i l t i n s ) 、用以处理字符串的( b u i l t i n sf o rs t r i n g s ) 、用 以处理日期和时间的( b u i l t i n sf o rd a t e ,t i m e ) 等,这里不一一对这些扩展进 行详尽的说明。 有了以上s w r l 语言的规范,就可以根据已有的记录类和属性创建规则。 关系属性与规则之问是包含关系,每个关
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 狼蒲松龄课件
- 狼疮性肾炎课件
- 农业废弃物资源化利用项目技术集成与应用研究报告
- 历届护士面试题库及答案
- 咖啡连锁品牌在2025年市场布局中的社区商业饮品品牌建设报告
- 铁路货场改扩建项目2025年社会稳定风险评估与风险应对措施研究
- 2025年金融衍生品市场创新风险管理与金融风险管理人才培养计划报告
- 农业物联网在2025年精准种植中的农业资源合理配置报告
- 2026年中国新能源汽车智能化设计研究报告:人机交互篇
- 电商绿色物流包装材料可持续发展现状与挑战报告
- 辽宁沈阳地铁有限公司所属公司招聘笔试题库完整参考答案详解
- 2025年秋季小学二年级上册语文教学计划及教学进度表
- 2025年海事两员从业资格考试(包装危险货物申报人员)历年参考题库含答案详解(5套)
- 新学期初二开学家长会课件
- 2025-2026学年外研版(2024)初中英语七年级上册(全册)教学设计(附目录)
- 2025年辅警招聘考试试题库附完整答案(历年真题)
- 痔疮病人护理课件
- 水泥房子组装方案(3篇)
- 2025新《治安管理处罚法》解读
- 聚焦2025民营医院差异化竞争策略与品牌影响力评估报告
- DB42T 1319-2021 绿色建筑设计与工程验收标准
评论
0/150
提交评论