(控制理论与控制工程专业论文)面向对象的xml数据管理系统的研究与实现——索引技术.pdf_第1页
(控制理论与控制工程专业论文)面向对象的xml数据管理系统的研究与实现——索引技术.pdf_第2页
(控制理论与控制工程专业论文)面向对象的xml数据管理系统的研究与实现——索引技术.pdf_第3页
(控制理论与控制工程专业论文)面向对象的xml数据管理系统的研究与实现——索引技术.pdf_第4页
(控制理论与控制工程专业论文)面向对象的xml数据管理系统的研究与实现——索引技术.pdf_第5页
已阅读5页,还剩76页未读 继续免费阅读

(控制理论与控制工程专业论文)面向对象的xml数据管理系统的研究与实现——索引技术.pdf.pdf 免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

内蒙占科技大学硕士学位论文 摘要 x m l 正在迅速成为i n t l 釉吐上信息表示和数据交换的重要标准。由于其强大的数据 表达能力,x m l 完全可以在互联网和数据库之间扮演更加重要的角色。x m l 是典型的 半结构化数据,关系数据库管理系统由于关系模型本身的缺陷,并不适合管理v i l 数 据。现在互联网上存在大量以文件形式存放的儿数据,这些数据包含了丰富的信 息,因此如何高效地从订l 文档中提取有用的信息是咀。文档查询的一个重要研究 课题。 众所周知,面向对象的方法具有很强的建模能力,将面向对象的概念引入到x m l 可以提高咀。模式语言的建模能力。而现有的“l 数据库管理系统并没有引入面向 对象的概念,也就无法实现面向对象帆数据的面向对象特征的查询。为了提高面向 对象“l 数据的查询速度,索引技术、查询处理和代价估计这三部分是必不可少的。 本文结合面向对象的特征提出了两种索引模式,在这两种索引模式中不但提供了简明的 结构概要来加快路径信息的查询,还提供了详细的孩子父亲链接关系来提高分支查询的 效率。针对不同的索引模式给出了简单路径的查询处理、复杂路径的查询处理和面向对 象特征的查询处理方法,由这三种查询处理方法可以完成所有面向对象特征的x m l 数 据的查询处理。针对不同的索引模式提供不同的代价估计方法,值谓词的代价估计使用 嵌套的等宽直方图,建立简单、估算准确;基于结构的代价估计使用查询处理过程中所 涉及的操作节点数作为估计的代价,这种处理方法估计结果准确、代价估计操作本身所 花费的代价较小。 通过不同查询示例的查询测试分析比较这两种索引模式的性能和查询处理的效率。 关键词:面向对象的m 。;索引模式;查询处理;代价估计 内蒙古科技大学硕士学位论文 t h e s t i l d ya n di m p l e m e n t a t i o no fo b j t - o d e n t e d ld a t a b a s e m a n a g e m e n ts y s t e m i n d 甑t e c h n o l o 科 a b s t i 甚c t x m li s 锄e r 西n ga st l l ed ( m l i n a n t 鼬m d a r df - o r 抽f o m 枷o ne x 吐l a l l g ea n dd a t a 掣鸵m a :i i o n s i i l c ei 乜p c 哪吧而j ld a 脑r e p 糟s e r 删o n ,x m lc a nc o f n p l e 惦l yd om o r em a n 龇 m d g ek 眦e nw o r l d - w i 如w 曲锄dd a l a b 黜礼i s9 础咖l c t l l 栅,锄dr e l 撕o n a ld a 诅b a s e i m ts u i t a b l e f o r 脚l l a 窖:e l i l 咖o f “f o r i 乜l i l l l i 诅缸0 no f r e l 越o i l a ld a 扭m o d e l n o w m 啪i sa l a 噼n 砌b e ro f ) 呲d a 扭触f n e so n 也c ,o r l d - m d e - w c b ,缸d i tc o n 协蛔a b l m d 趾t i 戚删0 n i n i t ,s o i t i s 姐i i l l 删s n 姆蛔n 衄h o w t o 础u pa 埘l a b l e 埘o m a t i o n 龀l m i t a sw e h l o wo 巧c c “谢a l t e dme l :h o d s1 1 a 、,es 缸饼瞎m o d e i i n ga :b i l i t y ,l h ei l l 廿0 d 枷o no f t l l e o b j e 吐捌e r i 女e dn o t i o ni 1 1 主0x m l 也妇b a c a n 廿1 量l a r l c eq l l e r yl 鼬l g u a g em o d e l i l l ga b i l 时t l l a t b 髂e d0 n m 。刚1 肋饿b m 耐s t i n g 咀。d a 纽础眦咿m e ms y g 把md o e s n ti n t e g r a :c eo b j e c t _ 甜眦dn a d o ni n t o ) n 乱,s oi tc a nn o tc o m p l 咖o b j 耐枷嘲c d ) 强d 1 jq u c r y 胁) 洲l 出t a b 鹊eo fo b j c c “硪即:t e df e a 缸f o r1 h es a k eo f 证l p r o v i n gt 1 呤q u e r ys p e e do fo 巧e c t - o r i e n t c dx m l d a 诅,吐p a n so fi i l d e xt e c b n o l o g y ,q l l e 叫p i d c s i n g 锄de s 畦l n a t i o nc o s ti s a b s o l u t c l yn c = c c 幽a r y mm i s 搿i p e r ,w ei l i t e g m t et b eo b j h 埔甜岫df e a t u r e si n t 0 x m la n d p m p o s et w ok i n d so fi 漱m o d e l s ,趾d 也et w ol 【i n d so fi n d 麟m 砌s ) to l 埘p r 0 晡d ea c o n c i s es j c n j ms 嘲m a r yt oi l l l p r o v ep 丑时li n f o m 僦o nq l l e r ys p c c db u ta l s op m v i d ed e 试l e d c 1 1 i l d p a r e n tr e l a 蛀o n d h i p st 0i l l l p 黼i m 峋l eb i a h 髂q r y 珥o c e s s i i 毽e m c i e n c y s e c o i l d l y w ep r o v i d e 璩m 畦h o d so fs i l _ i l p i ep 缸hq l l e r yp 1 d c e s s i n 舀c o d l p l e xp a mm 坞r yp l d c e s s i n ga n d o b j c c “埔e r i 伽危曲鹏sq l l e 搿p r o c e s s i l l g 幻w a r dd i 筇。瑚ti n d i l xm o d d s ,a n dw em a yc 0 啪p l e t e a l lo b j c c t - o r i e r 她d 他q u 邪吐肼u g h l 鹏轴n d so f q u e r y m 啦腓m o d s a t l a s tw e p n 州d ed i l i 确1 te s i i i i l 撕c o s t 删斑b o d sb yd i i r a 翱呲i n d e ) 【m o d c l s ,m em e m o do fe s t i m 撕o n 也ec o s to fv a l u ep 砌c 砷e 既叩d a yo q l l a lw i 拙h i 咖乎鼬,a n db i l i l di ts 蛔i p l y 趴de s t i m a t e e x a c n y 吐l e m e t h o d o f 瞄曲删o f k i s c d o n 曲m c h l 陀朗叩b y t h e m m i b 盯o f n 砷e do p e r a t 血g n o d e s t o i r d 删融咖q i l e r y 辟o 。逝脒地0 d ,b e 吼o f e 】( a c te s l j i i l 棚o na 1 1 d 印溅l e s s c o s t o ne 幽a l i o n t l r o u g l lq u e l yt e s it 1 1 ed i 疏f tq u e r ye x 朋叩l e s 砌y a n dc o m p a r ei 协c a p a b i l i 母肌d q u e l yp r o c e s s i n ge 缳c i 吼c yt l l i l tb a s e do n 却。妇m so f 砌e xm o d d s k e yw o r d s :o b j e 西。晾魅t e d 帆;h d “m o d e i ;q u e r yp m o e 姻i n g ;e s 缅1 n 如nc o s t 2 独创性说明 本人郑重声明:所呈交的论文是我个人在导师指导下进行的研究工 作及取得研究成果。尽我所知,除了文中特别加以标注和致谢的地方 外,论文中不包含其他人已经发表或撰写的研究成果,也不包含为获得 内蒙古科技大学或其他教育机构的学位或证书所使用过的材料。与我一 同工作的同志对本研究所做的任何贡献均已在论文中做了明确的说明并 表示了谢意。 签名:氢鐾叟日期:圣型! 生! ! 生 关于论文使用授权的说明 本人完全了解内蒙古科技大学有关保留、使用学位论文的规定, 即:学校有权保留送交论文的复印件,允许论文被查阅和借阅;学校可 以公布论文的全部或部分内容,可以采用影印、缩印或其他复制手段保 存论文。 ( 保密的论文在解密后应遵循此规定) 签名:蓥坚生导师签名:塑生蛙 日期:i 。o f f 一心 内蘩吝辩菠走攀疆圭拳经谂文 萼言 擎费戛联爨熬精鼓零,凇瞧嬲擞爨j # 磐广泛,霹戳巍凇惑经渗遴粼了互联耀 盼舔令惫簿,熬邀予囊努、数据交换、搿砖艨震、鞭撩攘索、蓉照臻璎等等。天爨惑终 普遮谈谖戮躐;熬堑大季簪耀窝躐走潜力,蹶l 琏瓣獭话l 鸯令方蟊靛酶究魄遴淫增多。 x 黼l 是一种元标记谣言,英凭借蠢舞的优势鬣成为蕊协f n 战上信息描述和数獬交换的嚣 要标准。凇帆在囊连薅上的大濑成用弓 发了一个溅窝际髯髓急需麟决豹婀趱,就魁翔 爵秩海薰的凇瓴激摇孛掇激寄掰静籍惠。 舞了黢绦纛瓷遮囊,嚣饕鸯多耱索萼 壤醛鼗据爨,翔巍捌隧& 、嚣辆溆、楚s s 、 x a s r 、繇浦、硒d 强翔酗c 、聪姝褥琳、矗e x 、鞭激、v i s 譬等。逮黧索葶| 奁巢耱 稳壤上瓤姨了豢逝港发,徵幽予爨疼结掏的局限缝又_ 游采了棚应的不足。如8 妇l 蠡谢大 学洳r e 系娩审静强晌黼辩戆简单路径韵查诲缝骥教率较商,稀辩予藏杂路径静焱 询处理效攀较谯;蕊s s 鼹然懿够骞散热支持复躲麟经姻瓷诲,媳幽予袋鼹效率较低 浆节轰连接潦 蕈,强黪径鞍长蠛繁惑蒸羧夫辩,它瓣褒诲羧率爻建鞍黎。一耪赣骛索霉 模绶;q 叙勰p 蛾轾哟,鼓然撰努跌上黝秧点,艇京不蠢牾霹离对象特糕黥殛谨l 凝 攒豢海。 在k 黼曩统中缀然采朋了三釉鲎询镣略:自骥鼬下、自底向上鄢混龠懿略来加快 查逝速度,穗k 髓瀚索零 蘩缆魏瀚& l i 琵在鬟杂路橙囊诲翻势支查询薅矮怒滤较蠢鼹。 为了趣浃粪魄逡度程蠢谗系菠中我稍瞧采矮妇释系缝秘三秘澄诲繁臻,巍予e 拄鹣紫 零 攘式籍骖缀静静簿决魏融g # 氧酶幂辘熬凌翦瓣藤,瓷了裁够支捺嚣淹黠象褥馥懿 峨,查询,谯索科横式中弓i 入灏l 鳓澍象的概念,以擞撩面向对象乱数摇的面向对 象特征瓣塞溜。在嶷杂薅衽瓣纛游簸毽过程孛霹鞋德攥素萼l 模式孛缀节焘耩供父亲节煮 组母的信息寒解决。也可以以组巾的节点元綮对应熟垒局标识符来解决,两种方法的选 震像赣予我徐谈诗麓夫亭。 在激,誊谗健徐蠢洚模蛩巾,餐语蠲鹣健馥稳滓方法农关系数糍露黪代徐嵇谤横 型孛暑经籀辩藏熬,其中恚蘩霹分蔻激下霹耱 蘩撵法穆蹦旗躐、馥缓羰含 ( q 州e f i t 幽、含参数学分诮婵黼哪非咖埘m a 幽黻埔i l i 咖d i 酬b u t i o n ) 和直方阁 器 i s 静g 斛枣,蠢在这器耱方法孛巍方溪趣穷法穰惠囊瀛、馨簿准确。巍寰君鬻争又霹缨 分海等宽、镣灏帮嶷宽这三秘方法, 孬等宽袁方墅建激比较麓攀,甄髅舞不够准确,波 餐爵器在稳诗谟差蛇较夫懿潦孛逡静褥努裁楚遵。蒸予缮稳瓣褒蛰蕊诗,澈渗爱臻终繁 点数作为鸯询估计的代价。 内蒙古科技大学硕士学位论文 l 绪论 随着互联网的发展,) 函皿逐渐成为一种通用的信息表示和数据交换的格式。皿 由于其语言自身的规范性、灵活性、可扩展性和强大的语言表达能力,被普遍应用于诸 多领域,如数字图书馆、电子商务等。不久的将来,大量l 格式的数据文档随之出 现在互联网上。因此,如何高效、准确地完成对咀,数据的查询成为当前的一个研究 热点。 1 1 沮。简介 m 如x 【e m i b km a d c 印i g i l a g c ) 1 1 l 可运行在任何平台和操作系统上从本质上 看,x m l 和m m ,嘲都是由s g m l 【3 】派生来的,但是沮。是一种元标记语言,而 r n 仉是一种特殊化的标记语言。) 。v 儿将s g m l 的丰富功能与h i m 的易用性结合 到w e b 的应用中,并保留了s g m l 的可扩展功能,这使皿。从根本上有别于 h 1 m l 。l 要比h n 忆强大得多,它不再是固定的标记,而是允许定义数量不限的 标记柬描述文档中的资料,以及允许嵌套的信息结构。它解决了m m l 不能解决的两 个问题。即m t e r n e t 发展速度快而接入速度慢的问题,以及可利用的信息多而难以明确 找到自己需要的信息的问题。 1 9 9 6 年1 1 月,波士顿s g s 乜u i d 矗r dg m e i a lm a i l c u pi 舢g i 城g e ) 世界年会产生一项 熏大变革,与会代表一致同意将目前e th ( 印a g c 撰写标准h n 几宣告终结,而 采用全新的电子文件格式化通用标准- m ,。) m 儿即可扩展标记语言,是一种基于 s g m u 标准通用标签语言) 的简单灵活的语言,被誉为构成未来w e b 的新工具。1 9 9 8 年 2 月推出了这种标记语言的正式版本,这就是咀。1 0 版本。 “l 具有毗下四个主要特点【4 j : 首先其简单性。帆为程序员和文档作者提供了一个友好的环境。札的严格定义 和规则集,使人类和机器都能更容易地阅读文档。皿文档语法包含一个非常小的规 则集,使开发者能立即开始工作。根据文档的结构,d 1 d 既可以通过一个标准创建,也 可以由专家创建。儿文档建立在基本嵌套结构的一个核心集的基础之上。当一层又 一层的细节增加,使结构变得越来越复杂时,作者或开发者只需要为内部结构的复杂化 付出非常少的努力。这些基本结构可以被用来代表复杂的信息集合,而不需要改变结构 自身。皿的语法分析器也非常容易创建。 自身。皿的语法分析器也非常容易创建。 2 一 肉藏蠢器 技大学疆圭学位论文 其次是可考“展性。儿在两个意义上是可扩展的。酋先,它允许开发潜创建他们 自己的d 1 d ,脊效地创建可被用于多种应用的“可扩展的”标记集。其次,使用几个附 加的标准,您掰殴对旺进行扩展,这些驸如标准可以向核心静儿功g 巢增加样 式、疆接零拜参爨辘力。 筝轰一令孩,貉标准,) 。混为霹穗产生瓣剃瓣标准撵袋了一令圣 实的基础。 第三是互操作性。) 函亿可以农多种平台上使用,而殿可以用多种工具谶行解释。 因为文档的结构是相容的,所以解释它们的语法分析器就可以以较低的赞用建立。 甩支持用于字符绫码的许多主要橼准,允许它在全傲界许多不同的计算机环境中使 爱。滢。x 秘a 张逡行了缀葑瓣毒 兖,诲多旱麓匏江拜发楚震囊豫遂孬熬。一令爱予语 法分析器的普通驹应用程序接口凇瞪的简单越翟d o m 、s a ,可以免费获得。也可 获得用c + + 、c 、妇v a s c r i p 、r l 和p y 廿1 0 n 等编写的语法分析器。目前,帆谮法分析器 的开发集中在免赞的插件0 l u g - 蛐上,这些插件为) 0 巩应用提供了语法分析能力,极大 地降低了使用) 讯纯的费用。 蒡霆是秀敖熬。尽管还骞一鳖荚予凇艟豹疑阕,毽舔臻叁奏在w 两上帮爨突全舅羧 的,可醴免费获褥。飙文档鑫囊也较为开放,任谤入都可 冀对结构良好静) q 难。文档 进幸亍语法分析,如果提供了d d ,谶可以校验这个文档。盥然开发者可以建立语意模糊 的d i ,或以翻己的方式加密数据,但他们将会失去使用儿的许多好处。) 0 札并不 禁止创建私有格戏,但它的开放性怒窀最大的优点之一。 | 2 朗x 潮乳辍妇黼a 幢l 文档的语法规则如果成功地通过了检查,那么这个文档被称为有效瓣文档, 具体来说,如果一个沮。文档怒谢效的,则它必须满足:文档和一个文档类型定义 ( d ( 坝h n 肌tty :p ed e 矗n i d o n ,d 1 巾) 【5 】绒模式相关联,并且义档遵守其中定义的规则。这是 一个文档有效的所有要求。但瑚融仪仅是规定口匝义襁的缩构和语法规则,两不包 含它戆痰察。诲多不簿戆缝绥在实瑗) 蕊毯瘟焉嚣霉 i 乏灸攀一令d l d 。戮秘鼙戳准确 她定义) m 纯文档实例的词汇表,凡楚未在d 国中激躐的都不是词汇表的一部分。另 外,d t e i 还可以精确地定义帆文档的结构。利用d 1 d 许多解析器可以黢证文档事 例的有效性,由此形成了一种有效的错误检测机制。u r d 有效地推动了以l 的发展, 因为它对于定义义档结构是狠好的。懊是当舡,用予爨多的程序环境面不只是文档标 记嚣,翻国藏袭臻窭苓少方瑟豹姣黧来,鲡:扩爨蕊不好,不捷袋对念名赛阉豹支 持,不支持数攥凝型,不支持数据类黧的继承等等。 3 内蒙古科技大学硕士学位论文 w 3 c 于2 0 0 1 年5 月2 日正式推荐使用v f i 。的规范语言“v 几s ”。) 0 皿。 s d l e i i l a 标准由三部分构成:相当于导言的“p r m 厄r ”、规定数据类型的“d a t a t y p e ”和标记结构的“s t r i c 1 1 瓜e s ”。) m 仉s c h e r n a 【6 】是一些规则的集合( 也称为语 法或者词汇) ,其中包括了类型定义( 简单和复杂类型) ,以及元素和属性声明。s c h e l m 是帆文档,不像d t d 那样有自己的特殊语法,s c h 髓m 是用帆写的,这给用户 五点好处”】: ( 1 ) 一致性:沮。s c h e 盥的格式与咀。的格式是完全相同的,而作为s g m l d t d 的一个子集,) m 几d 1 巾有着与忸,格式完全不同的格式,因此) m 几用户在使 用订l s c h e n m 的时候,不需要为了理解咀。s c h e m 而重新学习,节省了时间。 ( 2 ) 互换性:可根据需要设计适合自己应用的s c 蛔触,并且可以同其他人交换彼此 的s c h e m a o 还可以将不同的s c l l 髓培进行转换,以实现更高层次的数据交换。软件工具 可以利用帆文档和s c l l e m a 之间语法通用这优点来为两者提供支持。 ( 3 ) 扩展性:s c 舨m 能够扩展出去,能向s c b 锄a 中加入元素和属性,只要元素和 属性名不同,它们在一个s d 搬n a 中是合法的,而d t i ) 将无法解析扩充的内容。 ( 4 ) 规范性:同d 1 巾样,s c h e l i m 也提供了一套完整的机制以约束订l 文档中 标记的使用,但相比之下,后者基于沮。,更具有规范性。s c h e m a 利用元素的内容和 属性来定义咀。文档的整体结构。 ( 5 ) 易用性:s c h 嘲壤取代d 田的另一个原因要归结于d o m 和s a x ,作为种 渥la p i ,d o m 和s a x 只是对沮。实例文档有效,对d 1 则无能为力。因为口m 无法详细规定数据的反复次数和出现的顺序等。 l _ 3 舭数据存储技术 1 3 1 订l 文档类型 x m l 文档主要有两种类型 删:1 以数据为中心( d 酿 啪m c ) ;2 以文档为中心 ( d o c m n e n t - c 州c ) 。 以数据为中心( 血协渤舾c ) 的沮。文档着重于文档中的数据,而非文档格式,如航 班信息、销售定单、科学计算结果等。这种文档的数据般由机器产生,来源于传统数 据库中的数据。主要应用在电子商务、日潆、e a i 等领域,集成不同数据源的数据,相 互交换信息。以数据为中心的文档具有的特点是:1 结构化的数据;2 数据粒度大小 适中;3 很少或没有混和内容;4 文档顺序不重要。 4 内蒙古科技大学硕士学饿论文 以文档为中心d o 翱m 扣c 铋砸c ) 魈难。文档主要是用来表示人类自然语言接述的 数据,如电予邮件、书和用户手册。这种文档舆有更复杂的结构,一般不是机器自动产 生豹。强兹,w 曲上驰大部分数据都w 以表承成这釉文档。以文档为中心的文档具有的 特点趄:1 半结构化域非结构化的数据;2 鞍多的混和内容;3 文档顺序重骚。 1 3 2 讧l 文档存罐模式 幽于) q 吡是一种元标记语言,在帝0 定旺规范后,面临的一个问题是怎样处瑗 “l 的标记数据。膊前m m ,o 糟c l e 等许多组织都致力于这方面的研究工作。它们的 基本思想是将岘标记数据放入一定的结构中,这祥对数据的检索、分析、篼新和输 出就能够在爨加容易镣理的系统和较为熟悉的环境下滋行。一种比较黩然的想法是采用 数据库对岖。数据进行存取和操作,将半绦祷他数攥转换为结构化数据,通过查询数 据库来提取、综合和分析) 。帆文档的数据。这样不仪可利用相对成熟的数据库技术, 而且也代表了未来网络发展静趋势。) 。咀,数据库作为一种新塑的数据库技术,主要窝 三种类型嗍:本源v 也数据库n = 娜b x s l :工垴憎c “w 强 x s 潞式使趸模叛蔑囊l 采表达它镁豹套谗。“殛始嘏脚懈踟h ”支持在) 澄髓中熬 表达式,“d 妇硎俐”是在模式被匹配时才起作用,“尺绒l 跚m 明r ”常常在查询结聚 孛攒定元素瓣标签。 每个模板规则由两部分缀成:一个模式和一个绩果模板。通过文档的内容匹配模 叛,寒攮孬鞠寝戆查诲爨穆缮到套谗缝皋。) ( 辍互鹣功戆在予支持殓戚文拦麴转换:龛 许克隆查询的文档和创造新的元素来构造查询结果。 ( 3 ) l 露f e l l o r e l 最初被设计为s t 瞰l 矗蝴大学l 0 汁划的半结构化数据的查询语言,它使用 “s 戡e c t f 翔0 艇w 麟”子句采惫送查询。 例如: s e l 嘲丑攘匏 t e o m b 谗南k b 峨b 秽i c e ) = 3 0 “s e l e c t ”子匈酝含了梅造器,“触n ”裙“抵”予键指定模式帮过滤鳕泰条 件。 ( 4 ) x q l x q l 凇v 匝q m 搿b n g 嗽g e 被着作是m 模式的一个扩展。x q l 的基本结构符裔 畦己、查诲、转换搂式穰赣按静蒸零结穗。 x q l 的语法类似乎u 砒目录导航,它使用单斜杠和双斜杠遍历啜层次。x q l 将 个礤既交稿卷俸蔑粼豹标号褥,节赢淡嚣文麟实傣、嚣素、鬟往、娃遴撵令窝注释。 ( 5 ) 肌q l x 撇毛是一个被a 豫善实验室设诗竞戏静藤型熬旺纛游逶言。象s 藏o q l 一 样) 0 “l q l 允许嵌套置询。从语法角度来看味i e r :归l o c k 有两部分:“w 眦”子旬和 “e 涨s 强t 激”予固。鬻饿垃透露枣一令袋多令裘询块缀残。 x m i ,q l 的基本形式如下: 8 内蒙古科技大学硕士学位论文 幽秽8 f d 曲一w h e r e ( 1 。删m 铆 c o n s t r i c t ( 啦,) 捌& 七 ) 率 ( 6 ) x q u e r y x q u c 扩叫来源于一个叫q u i 妒1 1 的查询语言,当一个查询以“f l w r ,表达式描述 时,它是一个功能语言,由“f o r ”、“u 玎”、“w 既r e ”和“r e n i n ”子旬组 成。“f o r ”和“l e t ”子句绑定值到变量上,而“f o r ”和“u 汀”子句绑定的元组 用可选的“w 哦”予旬来完成过滤操作。“r e l l 瓜n ”子句输出查询结果。 1 5 课题研究的目的及意义 本课题研究的目的是建立面向对象皿数据的索引模式,基于此索引模式能够实 现面向对象皿。数据的面向对象特征的查询。 m 。具有很强的表达能力,而面向对象特征具有很强的建模能力。在帆中引 入面向对象的概念能够提高咀。模式语言的建模能力,而现有的索引模式不能够支持 面向对象特征的沮,查询。因此建立面向对象咀。数据的索引模式和基于此索引模 式能够实现面向对象特征的“l 查询就显得尤为重要。 9 一 内蒙古科技大学硕士学位论文 2 面向对象的) 函几 m t e r n c t 的迅速发展,使其成为全球信息传递和共享的最重要资源。皿,是由嵌套 的标记元素构成的自描述标记语言,它正成为b f e m e t 上信息表示和数据交换的主要标 准,因此皿数据的存储和查询技术也就成为当前研究的热点。 面向对象的方法具有很强的建模能力,例如继承、非单调继承、多态性、复杂数据 结构等。如何将面向对象的特征引入到儿中,以提高v i i 。语言的建模能力是一个 非常重要的研究课题。 由此面向对象的) 亿存储模型和用面向对象的特征扩展) 0 m 。r l 查询语言被提 出。 2 1 面向对象的儿数据 基于面向对象的特征具有很强的建模能力,以此来扩展沮。可以增强咀。模式 语言的建模能力。而现有的) m 几模式语言,如d i d 、) 函几s c h e 眦、 s o x 网、 ) r 】、s c h e m a 们n 嗍、d s d 口5 1 。除了儿s c h a 、s o x ,其余的根本不支持继 承,而s o x 仅支持单继承,儿s c l l e i 强也不支持多重继承网。但可以通过对d 皿l 或 咀。s c h 锄a 的扩展使其完全支持面向对象的特征。 沮。是用于w e b 信息交换的层次数据,而咀文档是由一系列嵌套结构构成 的,元素由其子元素构成。面向对象的) m 几文档含有元素层次、继承、多重继承的信 息口7 1 。沮。文档中的结构信息由d 1 d 来进行描述,包括为文档提供一个结构框架;为 元素定义一个内容模型、数据类型和数据约束等。扩展的d h ) 描述了面向对象的一些 重要概念,例如:元素继承层次、多重继承等信息。m 。数据是儿模式的一个实 例,一个) 0 咀,模式可以对应多个讧l 文件。遵循) 0 此核心规则的文档是良构文 档,遵循沮。核心规则并符合指派给该文档的d 1 d 或模式的文档是有效文档。 图2 1 给出一个典型的大学应用。包含了p 懿o n 、s t l l d e n t 、t e a c h c r 、t a 、c o u 巧e 、 l h l d e 疋o u r 和灯a d c a i | r s c 。基于扩展的d m ,图2 1 表示的意义介绍如下: ( 1 ) 属性 图2 1 中包含了普通属性、m 、m 砌三f 和r e f s 四种属性。用0 和属性名 来表示一个普通属性,如图2 1 中元素绯l d e n t 的属性m o 是一个普通属性。一个d 属 性使用 和属性名来表示,如p i d 和c i d 是元素p e r s o n 和c o u r s e 的各自i d 属 性。用 开头的标记名和一一每来表示一个i 砸f 属性。类似的一个i d r e f s 1 0 内蒙吉辩技大学硕士学诬论文 属性用 开头的标记名和一每来表示。例如s n 】d e m 中的元素t a k e s 有一个 i d 砌弹s 属性 黜,这是一个弓i 用愀元豢鲍属性。 p e m c a t “e ( 的d 啦嘛e f o 啦d 州撇靠 一c 蝴出愀 口蝴 e m 蛐u t e o c * m a 拙黼。 一 c 哪憾r i n s 埘l e ! 一 c 口a 妇l 蛔m o r e 甘_ “啦g * h k e l 融g 扣一m _ 匹g t n 卜唧 囊- 王唾t 秘s 枷呻 n e 妇c d e f c “螂0 孕“0 a u b e ( ”日嘶姒摇蜘c h 慨 圈毛l 元素蘑次暴镄 犯) 元素 有简单元紫和复杂元素之分,简单冗素使用口表示。例如p e r s o n 中的元素 耀辩耧幻m 枷是楚攀元素。复杂砖素镬麓表示,爨魏p 懿。珏孛熬元素 a d d r 。 ( 3 ) 继承 在两个复杂元素之间存在子元素和超元索,这两个元素存在继承关系,用 专来表示子元素撵自麓元素。援鲤脚嚣素畜耀令予嚣索s 氛幽穗藉 惋a c h c r ,这两个子元素同时指向p e 啪n 这个父元索。 ( 4 ) 露含 内紫吉辩技大学硕士学侥论文 包含关系使用标记符号和,没有标记符号的表示仪一个包含 关系,l 表示零个或一个包含关系, 三一表示零个或多个包含关系, 一表承一个或多个包含关系。例如元素a d d r 姐娥素s t r 喊、嘶、s 蠛船和z 砸, 瑟元素强i v 蠢攀个或多令嬲元豢程零令或多令e 酬粼嚣素组或。 圆熏载、隧断和重愈名 在一个元索层次中,子元素可以从超元素中阻断丽索和属性,也可以煦命名从超元 素继承的元索荦日属性。用朴液承重载,例如p c r s o n 元素的a d d r 在s t i m 咖中被一个 简单元素所熏躐。用* 和辍斟臻- e l e m s 标记表示默断,其中翔q ) e r 吒l e 联l s 标记说明 跌该超元素继承熊元素凌蔫毪在予惩索孛被隈羝,铡懿攘元素妇蕊娌审隧羧了麸超元 素p c r s o n 继承豹元素酗珊栅。+ 器辍删e 舭豳黔i 瑚描e 标记表承黧命名,其 中s u d e r 吒l e m o l d 一啪e 标记说明趣惩素的元素或属憔名森子元素中被重命名了,例如在 元素1 a 中从s t l 触骶l t 继承的d e p t 冗索被重命名为s l l d 州州e p t 。 2 _ 2 扩展d ,m 选择d 珊i 繁扩震圭要戆骧嚣必; f 1 ) 拶r d 瓣表示 常简洁,易予壤解; ( 2 ) 对d 1 所进行的扩展很霹易应用到其他肌模式语言中去,仅仅是借助于 d t d 简洁的寝泳和易于理解性来描逑我们的扩展。 扩展后的d 下d 能够支持元索继承层次、多重继承、重载、阻断、多态和冲突处理 蔽裁。 2 ,2 1 元素屡次 扩展l ;用i s a 子旬作为元素声明的语法如下: 。 在携a 缝褥“f l s a ,蹦翳司饿搬嘲蹩鲥谴】”孛,萄戆有一令或多令越元素数继 承。也可馘憝该愆嚣没有趣元豢,戳为该结擒是可逡瓣。e l 燃敷蝮_ 。o | 斑踌 致醐e l s 的语法 与d t d 中的潞法相同。在一个元索层次中,子元素继敝超元素的元素和属性,需在元 素模型中添加附加的明确的元索和鹪性。 扩展2 :元索和属性的继承阻断语法如下: ! e l e 磁粼t 锄碰珏秘l 嚣 ; : 元素或属性继承阻断使用“b l o c f r o ms l 洲e m e n t n 础s 1 i s t ”结构。 2 1 2 t 2 冲突处邂 奏多羹继承洚突羲会存在。凌鬻2 。2 孛元素弘麸嚣令超元素螺罐e 躐秘钕畦搿中 继承元素和属性。由于a d 蠡萃酲d a p t 在两个超元素中被定义,这里两个;串突需要解决。 在扩展d 1 m 中有三种方法用来处理冲突。第一种方滋,冲突解决声明详绷地指定了从 哪个超元素继承的元素或属性,例如:结构“ o p e r s o ni n g t a n c c p p e 捂o np i d 掣1 0 0 0 蠡k 霸毒渤强矗l 洲p c y o 睫冁o 妒 1 9 6 5 埘- 0 7 饥i 删1 d 曲睁 a d 出 z i p k l r 6 p 6 叫z 睁 奄矗盼3 l o 糯i v e 菇缸吲妇嚣 恕渤 z 妒x l s5 8 6 嘲:妒 嘲d 翻争咖pc s 嘲l 矗飘 堪婶p f a d d r 5 0 拈3 2 2 撕e p h o n e 掣s # p q 商端蝴# s 3 8 0 ”挣 咖d c 以to i 8 一2 0 。s n o 一s l 0 0 0 0 0 0 珊- s e i n s 潲c e ( 函翻挣7 。8 d s 嘲啦畦s t 吲列出、, q a m ph 血删u 畦i o nl od b s 确瓣 一t e a c h e rb 驺舰邯心 b a s i cc o n c 岫 q e 璐c ro i d 一3 攮。毋i l 拶 懿c 8 v 赡掘坛甜2 0 0 扩挣 a i l “s r l v a 髓a v a ,n 翻i i e 啪蝴t e h 州p 3 o 肛 1 9 5 伽6 2 6 啪i n l l d 种睁 叫m l d e f c o u h e 岛协e e 伊5 6b r o n 刮咐p q 豳嗽转y 蟾话噬抟硝羽妒挣 q i p l ( 2 8 6 m 8 删p t a l l 出b y t 嘲h 粥。3 0 0 0 4 0 ”胁 匈黼秘h p2 3 1 4 弱3 娟阳啦d 娜e 一髓d & # s e 舞i s l 秘 l 妒1 2 0 0 0 0q l a 妒。 d e p pc 伽叩呻蜘圳印护 ( 鼢酶e s h 镕e 尹c s 2 c s 3 耱 豳2 4 萋乎图2 。l 的) m 纯文档实铡 1 6 内蒙古科技大学硕士学位论文 2 2 3 2 多态引用 用多态引用扩展d t d ,类似于多态元素。例如一个教师可能教好几门课程,包括 u n d e 坨a u r s e 和g r a d c o u r s e 。如图2 2 定义的搬d 嫩元素和图2 4 的实例文档,t e a c h c s 是 一个i d r e f s 到c o u r 的引用。如果多态元素能够被系统支持,那么在实例文档中下面 六个组合是有效的。 ( 1 ) a t e 孤舰e r t c a c h 鼯“m 硝; ( 2 ) at e a c h 盯t e a c h 鹤m m e r g 叫s 骼; ( 3 ) at e 解1 1 e rt e a c i 把s 毋谢g d l 黼; ( 4 ) a t a t e | c h 髂u r s ; ( 5 ) at at o a c h e s 瑚d e 圮伽魄s ; ( 6 ) a t a 溅s 鲈a d c ( 峨s ; 首先在扩展5 中扩展d r e f 和r e f s 的定义,详细说明了由d 锄指向 t a r g e t i 丑锄。在扩展6 中介绍了多态元素的概念。 扩展5 :) r e f 或者m 砌强s 被约束至u 给定类型的元素,语法如下: 例如:图2 2 的扩展d 1 d 模式所定义的m 砌臻s 属性乜妇s 的c o u r s e s 声明如下: ! a t n ,i s t t a i 【髂c 0 i s 豁) r e f sc 0 辩群n 眭l l m d 意义是u r s 船被允许指向仅是c o u 雠的实例。 扩展6 :如果一个m 砌硪s ) 属性被使用在一个给定元素中,它可能指向元素或它的 子元素的实例。是一个多态引用。 如上例,踟f s 属性c o u r s e s 可以指向c o u 睇元素实例,也可以指向它的子元素 1 】i 】d e 心o u r 和g r 甜c a u r 。 2 3 面向对象咀。数据的查询语言 2 3 1 概述 v i l 查询语言主要是关于数据的提取、交换和整合。许多查询语言最重要的部分 是数据模型和语法,之间的关系也很相似。到目前为止已有好几种) 。吼模式语言被提 出,例如:d o m 圆、x s l 数据模型旧、v mq 嘲y 数据模型例,这些都是采用基于低 级数据模型。 为了提取和重构m 。文档信息,有多种沮,查询语言被提出,例如:) 0 “i q l 、l o r e l 、订l g l 2 9 】、x q l 等。但这些查询语言存在的主要问题是在查询语言结构 1 7 内蒙杏辩技大学硬士学位论文 中垮焱逮郏分_ 裾结果擒造罄分混台了,实嚣上楚继零了s 镰谬法。铡如:k 嘴l 搜爰了 “s e l e c t f r o m w 糯肛”语法;) 讯m q l 使用了“w 瑚璁e 。c o n s h c t ”子句, 其中“w 疆灶”字句是查询数舞都

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论