(论文)基于XML+SCHEMA的模糊数据建模方法_第1页
(论文)基于XML+SCHEMA的模糊数据建模方法_第2页
(论文)基于XML+SCHEMA的模糊数据建模方法_第3页
(论文)基于XML+SCHEMA的模糊数据建模方法_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第2 9 卷第1 0 期 2 0 0 8 年1 0 月 东北大学学报( 自然科学版) J o u r n a lo fN o r t h e a s t e r n U n i v e r s i t y ( N a t u r a lS c i e n c e ) v 0 1 2 9 。N o 1 0 O c t 2 0 08 基于X M LS c h e m a 的模糊数据建模方法 严丽,马宗民,刘健,于 戈 ( 东北大学信息科学与工程学院,辽宁沈阳1 1 0 0 0 4 ) 摘 要:为了满足现实W e b 应用中对不精确和不确定信息处理的需要,提出了一种基于X M L S c h e m a 的模糊X M I 。数据模型利用该模糊X M L 数据模型,模糊信息在X M L 文档中能以自然的方式进行表示在模 糊集和可能性分布理论的基础上,分析了X M L 文档中模糊数据的多重粒度,给出了不同类型模糊数据的 X M L S c h e m a 表示方法为模糊数据的W e b 发布与共享,以及实现基于W e b 的智能信息处理奠定了坚实的基 础 关键词:模糊集;可能性分布;X M I 。S c h e m a ;模糊X M I 。数据模型;W e b ;建模 中图分类号:1 1 P3 1 1 1 3 1文献标识码:A文章编号:1 0 0 5 3 0 2 6 ( 2 0 0 8 ) 1 0 1 4 0 6 0 4 F u z z y D a t a M o d e l i n g B a s e do nX M LS c h e m a 洲L i ,M A Z o n g - m i n ,L 1 U J i a n ,y U G e ( S c h o o l o fI n f o r m a t i o n S c i e n c e & E n g i n e e r i n g ,N o r t h e a s t e r nU n i v e r s i t y ,S h e n y a n g 11 0 0 0 4 ,C h i n a C o r r e s p o n d e n t :M AZ o n g m i n ,E m a i l :r r m z o n g m i n i s e n e u e d u c n ) A b s t I 翟c t :T o m e e t t h er e q u i r e m e n tf o ri m p r e c i s ea n du n c e r t a i ni n f o r m a t i o np r o c e 碰s i n gi nt h e a c t u a l a p p l i c a t i o n s o f t h eW e b 。a f u z z y X M Ld a t am o d e li Sd e v e l o p e do nt h e b a s i so ft h eX M L S c h e m a W i t ht h em o d e lu s e d t h e f u z z yi n f o r m a t i o n i nX M Ld o c u m e n t sC a r lb er e p r e s e n t e d n a t u r a l l y B a s e d o nt h ef u z z ys e ta n dp o s s i b i l i t yd i s t r i b u t i o n t h e o r y ,t h em u l t i p l eg r a n u l a r i t i e s o f d a t af u z z i n e s si nX M L d o c u m e n t sa r ei d e n t i f i e d S Oa s t o p r o v i d e v a r i o u s t y p e s o fX M L S c h e m a r e p r e s e n t a t i o n s t h a t a d d r e s sa l lt y p e So f f u z z i n e s s T h e f u z z yX M L d a t am o d e lw i l ll a yaf i r m f o u n d a t i o nf o rf u z z yd a t ar e l e a s i n ga n di n t e l l i g e n t p r o c e s s i n g o nt h eW e b K e yw o r d s :f u z z ys e t ;p o s s i b i l i t yd i s t r i b u t i o n ;X M LS c h e m a ;f u z z yX M L d a t am o d e l ;W e b ; m o d e l i n g 在现实世界中,信息通常是模糊、不确切的 为了处理不精确、不确定信息,人们对传统数据库 进行了扩展在过去的2 0 年里,模糊关系数据库 已经被广泛研究【卜引,而且最近几年,模糊面向 对象数据库和模糊概念数据模型的研究开始受到 研究者的广泛重视L 5 “J 当前,随着W e b 技术的 广泛应用,产生了种类繁多数量巨大的电子数据 资源,X M L 作为I n t e r a c t 的下一代标记语言已经 成为W e b 上数据表示与交换的标准【7 咱 为了能 够以X M L 格式输出模糊数据库中的数据,需要 研究模糊X M L 数据的表示和处理方法然而,当 前的X M L 不能表示和处理不精确和不确定数据 目前,对表示和查询含不精确和不确定信息 X M L 的研究还很少,只有含不完全信息的 X M L 9 j 和含概率信息的X M L 1 0 - 1 1 在研究文章 中有所讨论研究文献 1 2 提出了一种基于X M L D T D 的模糊X M L 模型,给出了模糊U M L 类图 到模糊X M L 模型,再到模糊关系数据库的形式 化转换方法但是应当指出的是,X M LD T D 缺乏 描述高结构化数据的充足表达能力,而X M L S c h e m a 则能为数据的描述提供丰富的结构、类型 和约束 本文在基于模糊集和可能性分布理论的基础 上,提出了支持多重粒度模糊性的X M L S c h e m a 数据模型,该模型可以很自然地表述X M L 中元 素及元素属性值上存在的模糊性信息模糊X M L 收稿1 5 1 期:2 0 0 7 1 1 2 6 基金项目:教育部新世纪优秀人才支持计划项目( N C E T 一0 5 0 2 8 8 ) 作者简介:严丽( 1 9 6 4 一) ,女,黑龙江齐齐哈尔人,东北大学副教授;马宗民( 1 9 6 5 一) ,男,黑龙江齐齐哈尔人,东北大学教授,博 士生导师;于戈( 1 9 6 2 一) ,男,辽宁大连人,东北大学教授,博士生导师 第1 0 期严丽等:基于X M LS c h e m a 的模糊数据建模方法 1 4 0 7 数据模型的研究,为W e b 信息的发布与共享、实 现基于W e b 的智能信息管理奠定了坚实的基础 对于任意的“,U ,取( “i ) 表示“f 为真的可能 性 1 不完备信息和模糊集理论 2X M L 中的模糊性问题 1 1 不精确和不确定信息 不一致性、不精确性、含糊性、不确定性和不 明确性是数据库系统中不完备( i m p e r f e c t ) 信息的 5 种基本形式 1 ) 不一致性是一种语义冲突,意味着现实世 界中的某相同方面在数据库系统中被不一致地表 示多次例如,G e o r g e 的年龄可能被同时存储为 3 4 和3 7 信息的不一致性通常来自于信息集成 2 ) 不精确性和含糊性与属性值的内容相关, 表明要从给定的范围内取一个值,但是当前不知 道选择哪一个,含糊信息通常表示成语言值例如 张三的年龄可以用集合 1 8 ,1 9 ,2 0 ,2 1 来描述,此 为不精确信息,而李四的年龄可以用语言常量“年 轻”来描述,此为含糊信息 3 ) 不确定性与属性取值的真值度相关,表明 对一个或一组给定的值分配相信程度,例如C h r i s 当前的年龄是3 5 岁的可能性为9 8 4 ) 不明确性表示的是信息缺乏完备的语义, 而导致了多种可能性的解释通常,一个信息可能 同时存在几种类型的非完整性信息的不精确性 和不确定性是非完整性信息的两种主要形式【1 3 J , 文献中已提出多种方法来表示不精确和不确定信 息【1 4 J ,这些方法可归结为2 大类,分别是符号方 法和定量方法,而由Z a d e h E l 5 提出的模糊集理论 和可能性分布理论已经被广泛用于不精确和不确 定信息的定量表示 1 2 模糊集和可能性分布理论 设u 是一个论域,F 是L ,上的一个模糊 集【1 5 】F 的定义需要一个隶属函数卢F :U 一 0 , 1 ,其中对于任意的“U ,卢F ( U ) 表示U 属于模 糊集F 的隶属度,模糊集F 表示为 F = 膨( U 1 ) U 1 ,脚( u z ) u 2 ,他( “。) u ” 当U 不是离散域的时候,模糊集F 则表示为 F = j - 阿( “) 允 这里,产F 用于表示模糊集F 的隶属函数;F ( “) 用于表示“属于模糊集F 的隶属度本文只讨论 离散模糊集 当卢F ( “) 解释成一个变量x 值为“的可能 性度量时,一个模糊值就可以用一个可能性分布 丌x 来表示【1 6J ,这里X 取U 中的值: 戤= 取( U 1 ) u l ,取( U 2 ) U 2 ,戤( “。) 在关系数据库模型中有两类模糊性:一类是 与元组的隶属度相关的模糊性,另一类是用可能 性分布表示的属性值元组的隶属度表示元组属 于一个相应关系的可能性,属性值可能性分布表 示不确定这个属性的精确值,只能确定属性可能 取值的范围及每个可能值为真的可能性 对于结构化的数据,可以用X M L 很自然地 表示模糊信息在模糊X M L 中,可以用隶属度信 息表示元素的模糊性,也可以用一个可能性分布 表示元素属性值的模糊性对于元素的属性值, X M L 限定其为惟一单值但是不难发现,这种限 制在实际中并不总是正确的,通常有些数据项有 多个值,并且这些值可能未知,只能用可能性分布 来表示以T o mS m i t h 的e m a i l 地址为例,由于其 可能同时有几个e - m a i l 地址其e - m a i l 地址为 “T S m i t h y a h o o c o r n ”的可能性是0 6 ,为 “T o m S m i t h y a h o o ,c o m ”的可能性是0 8 5 ,为 “T o m S m i t h h o t m a i l c o m ”的可能性是0 8 5 ,为 “T S m i t h h o t m a i l c o m ”的可能性是0 5 5 ,为 “T S m i t h m s n c o m ”的可能性是0 4 5 与上述情 况相反,有些数据项则只能取单值例如,一个人 的年龄就是一个惟一非负整数当不能确定其具 体年龄时,可以用可能性分布 0 4 2 3 ,0 6 2 5 , 0 8 2 7 ,1 0 2 9 ,1 0 3 0 ,1 0 3 1 ,0 8 3 3 ,0 6 3 5 , 0 4 3 7 来表示其年龄信息基于上述讨论,对含 可能性分布的模糊数据可以有两种解释,即模糊 析取数据( d i s j u n c t i v e ) 和模糊合取数据 ( c o n j u n c t i v e ) 综上,将X M L 文档中的模糊性分为两类: 1 ) 第一类是元素的模糊性,可以用隶属度与 这样的元素关联; 2 ) 第二类是元素属性值的模糊性,可以用可 能性分布表示 图1 是一个包含模糊信息的X M L 文档片段 3 模糊表示模型 3 1X M I _ 中的模糊数据表示 由上面的例子可以看出,一个取值为 0 ,1 的 可能性属性“P o s s ”应当首先引入,它与一个称作 “V a l ”的模糊构造子共同用于说明一个给定元素 存在于X M L 文档的可能性图1 的第3 行( V a l P o s s = 0 8 ) 描述了给定的元素是C o m p u t e r 1 4 0 8东北大学学报( 自然科学版)第2 9 卷 S c i e n c ea n dT e c h n o l o g y 的可能性为0 8 对于 X M L 文档中可能性为1 0 的元素,元素的起始标 志( V a l P o s s = 1 0 ) 和结束标志( V a l ) 可以省略 1 3 ( V a l P o s s = 0 8 ) 4 ( d e p a r t m e n tD N a m e = “C x a n p u t e rS c i e n c ea n dT e c h n o l o g y ”) 5 ( t e a c h e rT I D = “2 1 1 4 8 1 2 0 0 7 ” 6 ( D i s tt y p e = “d i s j u n c t i v e ”) 7 ( V a lP o s s = 0 8 ) 8 ( m a r n e ) V i n c e n tL y o t ( m a r n e ) 9 ( t i t l e ) A & s o c i a t eP m f e s m r ( t i t l e ) 1 0 ( s a l a r y ) 3 0 0 0 ( s a l a r y ) 1 1 ( t e l ) 0 2 4 8 3 6 8 0 0 0 1 ( t d ) 1 2 ( 、瑚 1 3 ( wP c 髓= 0 6 ) 1 4 ( m a r n e ) V i n c e n t L y o t ( t n a m e ) 1 5 ( t i t l e ) P r o f e s s o r ( t i t l e ) 1 6 ( s a l a r y ) 5 0 0 0 ( s a l a r y ) 1 7 ( t e l ) 0 2 4 8 3 6 6 0 0 0 1 ( t d ) 1 8 。( 、瑚) 1 9 ( D i s t ) 2 0 ( t e a c h e r ) 2 1 ( s t u d e n ts I D = “2 0 0 2 3 0 5 6 ”) 2 2 ( s n a m e ) T o mS m i t h ( s n a m e ) 2 3 ( a g e ) 2 4 ( D i s tt y p e = “d i s j u n c t i v e ”) 2 5 ( WP o s s = 0 4 ) 2 3 ( 、q ) 2 6 ( V a l P e a s = 0 ,6 ) 2 5 2 8 ( wP o s s = 1 0 ) 2 9 ( 、瑚 2 9 ( V a lP o s s = 1 0 ) 3 0 ( 、,a 1 ) 3 0 ( V a lP o R s = 1 0 ) 3 1 ( V a l ) 3 1 ( WP c 瞒= 0 8 ) 3 3 ( A q ) 3 2 ( wP o s s = 0 6 ) 3 5 ( A q 3 3 ( V a lP o s s = 0 4 ) 3 7 ( 一心 3 4 ( D i s t ) 3 5 ( a g e ) 3 6 ( g r a d e ) 9 5 ( g r a d e ) 3 7 ( e m i l ) 3 8 ( D i s tt y p e = “c o n j u n c t i v e ”) 3 9 ( V a lP o s s = 0 6 0 ) T S m i t h y a h o o 0 0 f n ( 、q ) 4 0 ( P o s s = 0 8 5 ) T o m S m i t h y a h o o c o m ( V a I ) 4 1 ( P 0 6 s = 0 8 5 ) T o m S m i t h h o t m a i l ( 、瑚) 4 2 ( wP o s s = 0 5 5 ) T S m i t h h o t m a i l o d i n ( v , a ) 4 3 4 9 ( c o u r s e ) 5 0 5 1 和( v a l ) ,可以表 示元素的可能性分布信息,而可能性分布也可以 表示模糊的元素值为此,需要引入另一个模糊构 造子D i s t 来描述可能性分布信息图1 的2 4 - - 3 4 行,描述的是T o mS m i t h 的年龄信息的D i s t 构造 子,这里的可能性分布是祖先一后代链的叶子节 点实际上可能性分布也可以是非叶子节点图1 的6 1 9 行描述了I D 为2 1 1 4 8 1 2 0 0 7 教师的可能 情况在教师的两个信息中,7 1 2 行的状态值有 0 8 的可能性,1 3 1 8 行的状态值具有0 6 的可 能性 3 2 模糊X M LS c h e m a 定义 随着模糊构造子的引入,可以利用X M L 表 示模糊信息,但为了能够容纳这些模糊构造子,需 要对现有的X M LS c h e m a 进行相应的修改在这 节中,将重点研究模糊X M L 数据模型的S c h e m a 表示问题 首先,元素V a l 的S c h e m a 定义为 ( x s :e l e m e n tn a m e = “V a l ”t y p e = “v a h y p e ”) ( x s :c o m p l e x t y p en a m e = “v a l t y p e ”) ( x s :s e q u e n c e ) ( x s :e l e m e n tn a m e = “o r i g i n a l d e f i n i t i o n ”m i n O c c u r s = “0 ” m a ) ( ( ) c c u r S = “u n b o u n d e d ”) 7 x s :a t t r i b u t en a m e = P o s s t y p e = “x s :f u z z y ”m i n O c c u r $ = “0 ”n 1 a X O C C L l l S = “u n b o u n d e d ”d e f a u l t = “1 0 ”) ( x s :, s e q u e n c e ) ( x s :c o m p l e x t y p e ) 元素D i s t 的S c h e m a 定义为 ( x s :e l e m e n tn a w l e = “D i s t ”t y p e = “d i s t t y p e ”) ( x s :c o m p l e x t y p e n a l T l e = “d i s t t y p e ”) x s :e l e m e n tn a m e = “V a l ”t y p e 5 “v a l t y p e ”m i n O c c u r s 。 0m a ) ( ( ) c a l r s = “u n b o u n d e d ”乃 此时,叶子元素l e a f e l e m e n t 可能是精确的 ( 如图1s t u d e n t 中的s n t 3 m e ) ,也可能是模糊的,取 可能性分布表示的值( 如图1 s t u d e n t 中的a g e ) 叶子元素l e a f E l e m e n t 是不含模糊性的精 确元素,则其S c h e m a 可以定义为 ( ) ( s :e l e m e n tI m e = “l e a f e l e m e n t ”t y p e 2 “l e a f e l e m e n t t y p e ”门 第1 0 期严丽等:基于X M LS c h e m a 的模糊数据建模方法 ( x s :d e m e n tn a r n e = “o r i g i n a l d e f i n i t i o n ”t y p e = “x s :t y p ” m i n O c c u r s = “0 ”m a ) ( 0 c c u r s = “* ”乃 叶子元素l e a f E l e m e n t 是取值为可能性分 布表示的模糊元素,则其S c h e m a 可以定义为 ( ,【s :e l e m e n t n a m e 2 “l e a f e l e m e n t ”t y p e 2 “l e a f e l e m e n t t y p e ” ( x s :c o r n p l e x t y p e = “l e a f e l e m e n t t y p e ” ( x s :e l e m e n tf l a m e2 “d i s t ”t y p e = “d i s t t y p e ”m i n O e e u r s 2 0 m a x O e c u r s = “* ” ( x s :e o m p l e x t y p e ) 2 ) 一个非叶子元素,它的S c h e m a 定义为 ( x s :e l e m e n tn s l n e 2 “n o n l e a f e l e m e n t ”t y p e 2 “n o n l e a f e l e m e n t t y p e ”n ( x s :c o m p l e x t y p en a m e “n o n l e a f e l e m e n t t y p e 、 ( x s :s e q u e n c e ) ( x s :e l e m e n tr l a I n e = “o r i g i n a l d e f i n i t i o n ”t y p e 。“) 【s :t y p e s ” l 1 1 i n O c c u r B 0 m a x n e l l s2 “* ”乃 ( x s :m m p l e x t y p e ) 非叶子元素取与可能度相关联的值,则其 S c h e m a 可以定义为 ( ) 【s :e l e m e n tn a m e 一- - “n o n l e a f e l e m e n t ” t y p e = “n o n l e a f d e m e n t t y p e ” ( x s :c o m p l e x t y p e n a l T l e = “r - o n l e a f d e m e n t t y p e “ ) ( x s :e l e m e n tn a m e = “v a l ”t y p e = v a l t y p e m i n ( ) c m u s = “0 ” H l a 】o c c u r s 5 “* ” ( x s :c o m p l e x t y p e ) 非叶子元素取值的集合,集合中的每个值 与一个可能度相关联,其S c h e m a 可以表示为 ( 稻:e l e m e n tl k a m e = “n o n l e a f e l e m e n t ” t y p e = “n o n l e a f e l e m e n t t y p e ”门 ( x s :c o r n p l e x t y p en f n l e - 2 “n o r d e a f e l e m e n t t y p e ”) ( x 8 d e m e n tn a m e = “d i s t ”t y p e = “d i s t t y p e ”m i n O e c u r s = “0 ”m a 延) c c l l r s 2 “* ”) ( x s :c o m p l e x t y p e ) 4 结语 本文在研究模糊集和可能性分布理论的基础 上,讨论了X M L 中数据模糊性的多重粒度,分 析了模糊数据的表示方法为了能更好地支持模 糊信息的处理,提出了模糊X M L S c h e m a 数据模 型 今后的研究工作重点将放在模糊信息的查询 优化技术问题上,以便建立一套基于模糊X M L 的完备数据操作运算体系 参考文献: 1 2 3 4 5 6 7 8 9 1 0 1 1 1 2 1 3 1 4 3 1 5 1 6 B u c k l e s BP ,P e t r yF E A f u z z yr e p r e s e n t a t i o n o fd a t a f o r r e l a t i o n a ld a t a b a s e J n z z y 融5 a n d $ 哦研5 ,1 9 8 2 ,7 ( 3 ) :2 1 3 2 2 6 M aZ M ,M i l iF H a n d l i n gf u z z y i n f o r m a t i o n i ne x t e n d e d p o s s i b i l i t y - b a s e d f u z z yr e l a t i o n a ld a t a b a s e s J I n t e r n a t i o n a l J o u r n a lo fI n t e l l i g e n t S y s t e m s ,2 0 0 2 ,1 7 ( 1 0 ) :9 2 5 9 4 2 鼬uKVS VN ,M a j t n n d a rAK F u z z yf u n c t i o n a l d e p e n d e n c i e s a n dl o s s l e s sj o i n d e c o m p o s i t i o n o f f u z z y r e h t i o n a ld a t a b a s es y s t e m s J A C M T r a n s a c t i o n s o nD a t a - b a s eS y s t e m s ,1 9 8 8 ,1 3 ( 2 ) :1 2 9 1 6 6 P r a d e H ,T e s t e m a l eC G e n e r a l i z i n g d a t a b a s er e h t i o n a l a l g e b r a f o rt h et r e a t m e n to f i n c o m p l e t e o ru n c e r t a i n i n f o r m a t i o n J I n f o r m a t i o n 渤,1 9 8 4 ,3 4 :1 1 5 1 4 3 , M a Z M ,Z h n g WJ ,M a W Y ,e ta 1 C o n c e p t u a ld e s i g n o f f u z z yo b j e c t - o r i e n t e d d a t a b a s e su t i l i z i n ge x t e n d e d e n t i t y - r e l a t i o n s h i pm o d e l J I n t e r n a t i o n a lJ o u r n a lo fI n t e l l i g e n t S y 咖m s ,2 0 0 1 ,1 6 ( 6 ) :6 9 7 7 1 1 Z “e l iA C h e nPP E n t i t y r e l a t i o n s h i p m o d e l i n g a n df u z z y d a t a b a s e s C P r o c e e d i n g so f t h e 1 9 8 6 I E E EI n t e r n a t i o n a l C o n f e r e n c e o n D a t aE n g i n e e r i n g L o s 姆k s :I E E E C o m p u t e rS o c i e t y 1 9 8 6 :3 2 0 一3 2 7 W 3 C E x t e n s i b l e m a r k u p l a n g u a g e ( X M L ) E B O L h t t p : V C w r W W 3 o r g T R R F 盼x m l ,2 0 0 6 一l O 1 6 B e r n e r s - L e eT ,H e n d t e rJ 。L a s s i l aO 1 r I 陀s e m a n t i c w e b J 侃& i e n t i f w A m e r i c a n ,2 0 0 1 ,2 8 4 ( 5 ) :3 4 4 3 A b i t e h o n tS ,S e g o u f i n L ,V i a n uV R e p r e s e n t i n ga n d q u e r y i n g X M Lw i t h i n c o m p l e t ei n f o r m a t i o n J A C M n s a c t i o n s o n h a b a s # S y s t o n s ,2 0 0 6 ,3 1 ( 1 ) :2 0 8 2 5 4 H u n gE 。G 咖r L ,S u b r a h m a n i a n VS P r o b a b i l i s t i c i n t e r v a l X M L C # P 溅s o ft h e 2 0 0 3 I n t e r n a t i o n a lC o n f e r e n c e o i lD a t a b a s eT

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论