(计算机应用技术专业论文)基于xml的高校媒体资源的共享与检索.pdf_第1页
(计算机应用技术专业论文)基于xml的高校媒体资源的共享与检索.pdf_第2页
(计算机应用技术专业论文)基于xml的高校媒体资源的共享与检索.pdf_第3页
(计算机应用技术专业论文)基于xml的高校媒体资源的共享与检索.pdf_第4页
(计算机应用技术专业论文)基于xml的高校媒体资源的共享与检索.pdf_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

摘要 论文题目:基于x m l 的高校媒体资源的共享与检索 学科专业:计算机应用技术 研究生:樊映宇签名: 指导教师:崔杜武教授签名: 摘要 在高校的信息化建设过程中,因为各种原因使各个部门根据各自的信息需要和特定的 应用选择了各自的软硬件环境,因此各种媒体资源( 图、文、声、像) 是按部门或功能进行 组织和管理的,这导致了高校数据资源与服务的孤立。 面对这些信息孤岛,本文研究了如何对媒体资源的描述信息进行集成,以及在此基础 上如何对媒体资源实现共享,并建立了高校资源共享模型。共享模型借鉴了w e b 服务与 p 2 p 的部分互补特征,利用w e b 服务技术中协调者的集中服务和p 2 p 模式中资源的边缘 化分布,来实现校园网内的文件交换。系统利用x m l 对媒体资源进行统一的描述,并将 所有资源的描述信息集中于目录服务器中进行统一的管理,并接受用户的查询,而媒体资 源则分散在用户终端上,由用户进行管理,如此即减轻了服务器的负担也增强了资源管理 的灵活度。 由于媒体资源的共享信息以x m l 形式存储于服务器,为了提高x _ m l 的检索效率, 建立索引是一种有效的方法。为了满足结构复杂,数量众多的x m l 信息检索的需要,系 统建立了一种高效的基于倒排表的“文档一关键字一节点 两级索引结构,该结构在不显 著增加索引空间占用的情况下包含了更加丰富的x m l 文档的结构和内容信息,缩小了索 引检索时文档搜索的范围,提高了检索的效率。本文根据t f i d f 算法的基本思想,给出 了一种计算x m l 查询结果相关度的方法,该算法以已有的信息检索理论中结果相关度的 计算方法为基础,既考虑了x m l 数据中关键字出现的位置,又考虑了x m l 文档的树型 结构对查询结果相关度的影响,从而提高了检索的效率。 在以上研究的基础上,我们设计并实现了高校媒体资源共享与检索系统。系统实现了 媒体资源的发布,媒体资源的检索,媒体资源的维护等功能。系统经过测试,实现了其所 设计的功能,达到了其设计目的。 关键字:信息孤岛;资源共享;x m l 检索;倒排序索引 a b s t r a c t t i t i e :t h er e t r i e v a la n ds h a r i n g0 fm e d i ar e s o u r c e s b a s e do nx m ll nc o l l e g e sa n du n i v e r s i t i e s m a j o r c o m p u t e ra p p l i c a t i o n n a m e = y i n g y u f a n s u p e r v i s o r - p r o f d u w uc u i a b s t r a c t s i g n a t u r e :血= 2 丛坠丝 s i g n a t u r e : d u r i n gt h ei n f o r m a t i o nc o n s t r u c t i o no fu n i v e r s i t i e s ,d i f f e r e n td e p a r t m e n t sc h o o s er e s p e c t i v e e n v i r o n m e n to fs o f t w a r ea n dh a r d w a r eb a s e do nt h e i ro w ni n f o r m a t i o nr e q u i r e m e n ta n ds p e c i a l a p p l i c a t i o n s t h e r e f o r e ,v a r i o u sd a t aa r eo r g a n i z e da n dm a n a g e da c c o r d i n gt od e p a r t m e n t sa n d f u n c t i o n s t h a tl e a d st ot h es o l i t a r yo fd a t ar e s o u r c e sa n ds e r v i c e so fc o l l e g e sa n du n i v e r s i t i e s f a c i n gt ot h e s ei n f o r m a t i o ni s o l a t e di s l a n d s ,t h es h a r i n gm e t h o do fm e d i ar e s o u r c e sb a s e do n d e s c r i p t i o ni n f o r m a t i o ni n t e g r a t i o ni ss t u d i e di nt h i sp a p e r , a n dt h es h a r i n gm o d e lo fm e d i a r e s o u r c e si sb u i l t t h em o d e ld r a w sl e s s o n sf r o mw e bs e r v i c e sa n dp 2 p sp a r t i a lc o m p l e m e n t a r y c h a r a c t e r i s t i c s s y s t e m u s e sc o o r d i n a t o r sc e n t r a l i z e ds e r v i c e si nt h ew e bs e r v i c e sa n d m a r g i n a l i z a t i o nd i s t r i b u t i o no fr e s o u r c e si nt h ep 2 pm o d e lt or e a l i z ef i l e se x c h a n g ei nc a m p u s n e t w o r k s y s t e m u s e sx m lt o u n i f i e d l yd e s c r i b em e d i ar e s o u r c e s ,a n dp u t st h ea l l o f d i s t r i b u t i o ni n f o r m a t i o ni n t ot h ed i r e c t o r ys e r v e rt om a n a g e t o g e t h e r s ot h ed i r e c t o r ys e r v e rc a n r e c e i v et h eq u e r yo fu s e r s b u tt h em e d i ar e s o u r c e sa r ep u ti nt h eu s e r s t e r m i n a l sa n dm a n a g e d b yu s e r s ,t h r o u g h t h a t w a ys e r v e r s l o a d a r er e d u c e da n df l e x i b i l i t yr a t i oo fr e s o u r c e s m a n a g e m e n ti se n h a n c e d s h a r i n gi n f o r m a t i o no fm e d i ar e s o u r c e sa r es t o r e di ns e r v e rb ym e a n so fx m l f o r i m p r o v i n gr e t r i e v a le f f i c i e n c yo fx m l ,b u i l d i n gi n d e xi sa ne f f e c t i v em e t h o d f o rm e e t i n gt h e n e e d so fx m lr e t r i e v a lw i t hc o m p l e xs t r u c t u r ea n d m u l t i p l eq u a n t i t y , s y s t e mb u i l d sa ne f f i c i e n t ”d o c u m e n t k e y w o r d n o d e ”t w o l e v e li n d e xs t r u c t u r eb a s e do ni n v e r t e di n d e x t h es t r u c t u r e i n c l u d e sa b u n d a n ts t r u c t u r ea n dc o n t e n ti n f o r m a t i o no fx m lw i t h o u ts i g n i f i c a n t l yi n c r e a s i n g s p a c e so fi n d e xa n dr e d u c e ss e a r c h i n gr a n g eo fi n d e x ,s or e t r i e v a le f f i c i e n c yo fx m li s i m p r o v e d ac a l c u l a t i o nm e t h o do fc o r r e l a t i o nd e g r e eb a s e do nt f - i d fi sp u tf o r w a r di n t h i s p a p e r a c c o r d i n gt o t h ec a l c u l a t i o nm e t h o do fr e s u l tc o r r e l a t i o nd e g r e ei nt h ee x i s t e n t i n f o r m a t i o nr e t r i e v a lt h e o r y , t h i sm e t h o dc o n s i d e r st h ei n f l u e n c eo ft h ea p p e a r a n c ep o s i t i o no f x m l k e y w o r d sa n dt r e es t r u c t u r eo fx m ld o c u m e n t s b yt h a t ,t h er e t r i e v a le f f i c i e n c yo fx m l l 西安理工大学硕士学位论文 i si m p r o v e d a c c o r d i n gt ot h es t u d yu p o n ,t h es y s t e mo fm e d i ar e s o u r c e ss h a r i n ga n dr e t r i e v a li nc o l l e g e s a n du n i v e r s i t i e si sd e s i g n e da n dr e a l i z e d t h es y s t e mr e a l i z e st h ef u n c t i o n so ft h em e d i a r e s o u r c e si s s u e ,m e d i ar e s o u r c e sr e t r i e v a la n dm e d i ar e s o u r c e sm a i n t e n a n c e t h es y s t e mw a s t e s t e da n dv e r i f i e d ,a n dt h e nt h es y s t e mf i n i s h e dt h ef u n c t i o n sa n da c h i e v e dt h ed e s i g ng o a l k e y w o r d s :i n f o r m a t i o ni s o l a t e di s l a n d ;r e s o u r c es h a r i n g ;x m lr e t r i e v a l ;i n v e r t e di n d e x 2 独创性声明 秉承祖国优良道德传统和学校的严谨学风郑重申明t j 本人所呈交的学位论文是我 个人在导师指导下进行的研究工作及取得的成果乱尽我所知,除特别加以标注和致谢 。 一一 的地方外l 论文中不包含其他人的研究成果。? j 与我一同工作的同志对本文所研究的工, 作和成果的任何贡献均已在论文中作了明确的说明并已致谢。+ 本论文及其相关资料若有不实之处i 一由本人承担一切相关责任 论文作者签名:;望兰盎宝。,2 0 0 矿年一参月:冯+ 自 学位论文使用授权声明 本人垄噬:翌- 在导师的指导下创作完成毕业论文,本人已通过论文酌答辩, 并已经在西安理工大学申请博士硕士学位二。本人作为学位论文著作权拥有者,一同意 授权西安理工大学拥有学位论文的部分使用权;即:气) + 已获学位的研究生按学校规定 提交印刷版和电子版学位论文,i 。学校可以采用影印、一缩印或其他复制手段保存研究生 上交的学位论文:一可以将学位论文的全部或部分内容编入有关数据库进行检索;2 ) 为 教学和科研目的,学校可以将公开的学位论文或解密后的学位论文作为资料在图书馆、 资料室等场所或在校园网上供校内师生阅读i 浏览。 本人学位论文全部或部分内容的公布,( 包括刊登) 授权西安理工大学研究生部办 理。 ( 保密的学位论文在解密后适用本授权说明) 论文作者签名鬈竺塞主喜师签名;磷多月。铀 绪论 1 绪论 1 。1 课题背景 自2 0 世纪9 0 年代以来,国际教育界出现了以信息技术( i t ) 广泛应用为特征的发展 趋势,国内学者称之为教育信息化现象。随着信息服务产业迅猛的发展、现代网络技术和 媒体技术的应用,教育信息化已在全球不断深入“1 。作为2 1 世纪教育改革的重要方向, 我国教育决策者高度重视教育信息化建设,抢占教育信息化“制高点 ,促进教育信息化 的发展。 但由于种种原因,很多学校都遇到了一个非常棘手的问题:校园内的应用系统造成众 多“信息孤岛一纠的存在。例如,因为各个应用系统都拥有自己的用户管理模块,使得 用户需要记忆多套用户名和密码才能登录各个系统。由于各系统相互独立,用户没有一个 统一的界面访问这些系统,用户不得不登录多个应用系统才能获得需要定期查看的各种数 据汇总情况。这给用户的使用操作带来很大不便。 可以说:“信息孤岛在如今的高校信息化系统中普遍存在。而“信息孤岛”对高校 信息化所产生的不利影响主要如下: 第一,数据的一致性无法保证。这主要是以下的原因所造成的,一方面高校的各个子 系统是各自独立的,另一方面各个子系统又有很多基础数据是相同的。这样一来,那些相 对独立的子系统无法共享基础数据。 第二,信息无法共享和利用。虽然一些高校一定程度上实现了信息的共享,但面对浩 瀚如海的信息却不知如何充分的利用它们。这对共享的信息是一种极大的浪费。 随着信息化产业的不断发展,以及“数字校园 概念”。的提出,我国大部分高等院 校均己启动了校园网建设,而且发展迅速,为高校管理信息系统提供了网络平台。高校网 络化管理信息系统承担着学校教学、科研、管理以及对外交流等任务,对提高学校的管理 水平和教学质量有十分重要的意义。 近几年,高等院校面临着招生规模扩大、教学管理复杂程度提高以及对外交流活动更 为频繁等问题。伴随着信息化建设的不断深入,大部分学校加快了局域网建设的步伐,并 自行研制或选用商业管理软件提高教学管理效率与质量,部分财政管理机关也指定所辖学 校使用特定的财务管理软件,行政管理部门也开始实现了办公自动化,使高等院校信息化 建设工作上了一个新台阶。 但是,学校各管理部门选用的系统应用在不同领域,管理着不同的对象,但它们之间 也有很多交叉甚至重复的信息和数据,同时由于各个系统独立运行,使学校内部系统间很 容易形成一个个的“信息孤岛 ,相互间没有通畅的信息交流与共享。总结起来,主要有 以下几方面问题: 西安理工大学硕士学位论文 ( 1 ) 软硬件发展不够协调”。; ( 2 ) 缺少有力的组织机构,信息化建设方向不明确; ( 3 ) 部门之问条块分割,缺乏统一接口和标准: ( 4 ) 存在异构数据,信息无法共享; ( 5 ) 服务粗糙,缺乏深层次的增值服务“。; 这突出表现为不同阶段实施的系统由于接口不一致,无法衔接而形成信息孤岛、自动 化孤岛和流程孤岛;由于标准、规范不统一、平台不统一、数据格式不统一造成的信息异 构。另外,依赖于多个系统的需求越来越多、系统间流程的自动衔接需要越来越多,例如 学生入学注册,需要使用教务管理系统,而教务系统需要同财务管理的交费系统结合起来 才能完成完整的注册过程,但目前无法做到,给管理工作带来很大的难度。 因此,为了实现信息共享和利用,在不改变现有硬件和软件的情况下,数据集成成了 一种被广泛运用的技术。异构数据源“。的集成最早可以追溯到多数据库集成技术。多数 据库集成系统支持用户使用单一数据定义和操作语言,同时访问多个独立的数据源。2 0 世纪9 0 年代中期w w w ( w o r l dw i d ew e b ,万维网) 和i n t e m e t 的出现进一步推广了数据集 成的概念。人们要求数据集成系统不仅能集成数据库系统中的结构化的数据,而且能集成 非数据库系统中的半结构化的数据;不仅能集成传统数据,而且能集成多媒体数据;不仅 能集成己有数据源中的数据,而且能集成随时加入的新数据源中的数据。也就是说,数据 集成系统必须具有可扩展性,可以实现数据源的“即插即用,这是传统的数据集成技术 难以实现的。 异构数据源集成系统的作用是提供一个统一的查询手段和查询界面“。,支持对网络 上异构的数据源的查询。其中的关键是如何以一种统一的数据模式描述各数据源中的数 据,屏蔽它们的平台、数据结构等异构性,实现数据的无缝集成。己有的数据集成技术, 存在一些不足很难实现上述的集成目标。 x m l 的出现将数据集成的研究推向了一个新的阶段。x m l 具有内容的自描述性、跨 平台性、内容和显示分离、可扩展性等特点”。,为数据访问和交换提供了一种新的模式, 使描述各种格式的数据成为可能。基于煳l 的各种技术的不断涌现,将使x m l 成为一 种新的数据互操作标准。 1 2 课题的研究内容与目的 根据高校信息管理的现状和问题,本课题主要以研究高校的媒体资源共享和检索为重 点。其具体内容如下: ( 1 ) 数据资源的共享。系统设计实现了一种资源描述集中与资源自身分散相结合的共 享模型。其利用p 2 p 9 1 和w e bs e r v i c e sn 0 1 互补的特性,实现了资源描述的集成和资源 的自治。其提供由全体用户共同参与的资源管理与更新,使得共享系统的资源更加的丰富、 2 绪论 管理更加便捷。 ( 2 ) 数据资源的描述。系统对高校图、文、声、像资源进行了统一的集中描述,其以 c n m l 为基础并借鉴了广播电视音像资料编目规范、高校档案分类方法等标准,对高校 资源进行了详细的描述,这为资源的共享提供了基础,也为资源的检索提供了丰富的描述 信息。 ( 3 ) 建立各种查询方式。常用检索:建立常见检索条件的选择,为用户建立快速的检 索通道。深度检索:按用户的指定的检索项对资源描述x m l 文档进行检索。分类检索: 对常见查询资源进行分类,以引导用户进行查询。个性化检索:允许用户定制自己的检索 条件集来进行的检索。 ( 4 ) x m l 的检索。因为共享系统中大量采用x m l 作为高校资源的描述格式,而为了 提高x m l 检索的效率,系统提出了一种基于倒排序的“文档一关键字一节点”两级索引 结构,该索引优化了对x m l 数据的结构和内容数据的索引,通过减少索引检索时文档搜 索的范围和索引的读取次数,来提高检索的效率。 本课题的主要目的是对高校由多个部门生成的各种形式、内容的媒体资源进行统一的 描述,在此基础上,实现对高校媒体资源的共享,并通过多种检索手段来方便用户对共享 资源的查找;其中为了提高系统检索的效率,重点研究了x m l 检索中索引的建立与查找, 提高了基于关键字的x m l 数据检索的检索效率。 西安剪g _ t - 大学硕士学位论文 2 高校媒体资源的共享 2 1 共享的含义与目的 鲍勃麦特卡尔夫法贝, i j ( b o bm e t c a l f e sl a w ) 揭示了电话网络的真实价值,即电话网络 的价值按用户数量的平方速度增长,用公式表示为:v _ - n 2 ,其中,v 表示电话网络的真 实价值,n 表示该电话网络的用户数量“。这一法则不仅适用于电话网络、计算机网络, 因为信息资源共享也具有明显的网络效应,所以其同样适用。信息资源有着与普通物质资 源极为不同的特征,其本身不会随着获取资源的用户数量增加而使得的资源量减少。相反, 其随着访问用户的增多,自身的提供量不仅不会衰减,其使用效益反而会增加“一。正是 因为这一特征,使得资源共享的研究不断地进行着。 资源是实际存在于人类社会,并且能被人们开发和使用,为使用者创造财富的能量、 物质和信息的总称。 信息资源“,则是指以计算机及其相关设备为载体,蕴藏在网络上的各种形式的信 息集合。集合中的对象可以是数据、软件、计算能力、网络带宽等。 资源共享”,通常是指网络中的用户可以把自己的资源与其他计算机用户分享,这 些资源包括硬盘空间、处理器的利用、文件系统、打印机等,以满足人们对网络资源需求 的过程。 需要说明的是:本文中所指的资源只涉及各类文件数据,资源共享是一种文件交换的 服务。共享服务能为用户使用资源时提供很大的方便。 资源共享的目的是使组织中的每个人都能够在一定范围内最大限度地利用信息资源。 信息资源不同于物质资源。物质资源在共享的过程中会随用户的增多而使人均拥有量减 少,信息资源因为其可无限复制性而具有可共享性,即与别人分享后并不降低自身的价值。 信息资源共享的实质是通过协调信息资源在时效、区域、部门数量上的分布,使其布局更 加合理,让用户的信息需求得到最大限度的满足,信息资源发挥最大效用。 所以,如能建立一个相对开放的基于校园网的资源互换平台,能在其上提供丰富的教 育、学习资源,则能给学生和教师们更加广阔的空间,益于师生之间便利的交流信息、共 享资源,并能突破教学在地点、媒介和时间上的限制,发挥学生的主观能动性和学习积极 性,更加自主地学习知识,同时也让教师获取更多优秀的教育信息、教育方法,提高教学 的效果。所以共享系统应该具备的以下特征: ( 1 ) 结点之间通过直接的交互而实现文件交换;资源分布在各个结点中,而不是仅集 中在一个服务器中管理;结点具有动态性和即时性。 ( 2 ) 共享服务是基于服务提供者、服务请求者以及服务注册中心三种角色之间的交互; 交互具体涉及到共享服务的发布、检索、绑定三种操作。 4 高校媒体资源的共享 2 2 共享系统的结构 以下从系统的三个角色的功能着手,进行系统结构的介绍。如图2 1 所示: 图2 1 系统角色功能图 f i g u r e2 - 1t h er o l ec h a r to fs y s t e mf u n c t i o n 协调者:在整个系统中较其它结点而言,协调者是服务能力最强、最适合担任目录服 务的计算机。它的职责是:担任结点的注册中心和资源描述信息的收集、发布的服务代理, 建立当前所有注册结点提交的共享文件目录、维护共享资源以及其描述信息。 服务提供者:服务提供者由校园中的非协调者扮演,完成注册到协调者、发布共享文 件的信息和下载地址、向服务使用者提供本地文件下载。 服务使用者:服务使用者同样也由非协调者担任,它可以无需注册和登录便直接到协 调者上查找自己所需的文件信息、获得服务提供者的计算机名或p 地址来与服务提供者 互连,并实现文件的下载。 根据校园的物理布局,将整个网络中的每台计算机看成若干p e e r 结点。在图2 2 中, 这些结点充当着基本结构中的三个角色:协调者、服务提供者和服务使用者。除协调者外, 它们都可随意的加入和退出网络,结点间的通信完成资源的互换操作,协调者与结点的通 信则是对已注册结点的探测,判断其是否已经退出网络。 5 西安理工太学硕士学位论支 削2 - 2 系统节点分布圈 f i g u 把2 - 2 t h ed i s t r i b u t i o nc h a n o f s y s t e mn o d e s 取校园网中原有的台w e b 报务器配置为协调者,承担目录服务的作用。在其上仅 存储共享的目录信息,但并不存储文件本身,文件存放在其他计算机中。除协调者外的其 他计算机可以同时身兼两职,既是服务提供者,又是使用者。三者相交互完成“发布”、 “查找”、“绑定”操作。如图2 - 3 所示: 2 3 共享系统的构造 图2 - 3 系统结构圈 f i g u r e 2 - 3 t h es h c m 弛c h a l _ t o fs y s t e m 整个系统以协调者为中心,其它对等结点提供和获取资源,将中心负担分数到边缘。 采用基于w e b 的被动发布目录信息方式,依赖用户主动或定时通过协调者查找、上传和 下载共享资源信息协调者的功能直接嵌入到网络中已有的一台服务器中,无需再配备新 的目录服务器,代码功能全部在协调者上部署实现。虽然进行文件交换时,非协调者本身 一 豫溥 g 羔 迤 步 n 簖 高校媒体资源的共享 要求既是客户端又是服务器,但:m 协调者结点无需安装任何软件就可通过低成本、简单易 用的客户浏览器完成获取资源、发斫i 资源的操作。对于校园网内的任一计算机用户,其不 需要安装特定的程序,就能够实现资源的共享;对于目录服务的协调者,无需添加专属的 设备,就可提供资源注册、资源发布。这样的一种设计模式较好地融合了成本低廉、易用、 便于管理等特性。 2 3 i 用户种类 对于相对开放的资源共享系统而言,针对安全性问题而进行用户分类管理,身份认证 和授权机制是解决用户安全性问题的一个切实可行的方法,根据不同的安全级别将用户分 类,分类后的用户只能拥有与其级别相应的权限“”0 在系统使用过程中,人群的设置分 为两大类:普通用户和管理员。 ( 1 ) 普通用户 未注册时,用户可以浏览、下载其他用户发布的文件信息及其相关内容;通过用户添 加功能,注册成为新用户,然后进行系统登录;登录用户不仅可浏览、下载发布的文件及 其相关内容,还可以提供共享文件信息,供其他用户使用,并具有将本人所上传的文件信 息进行编辑和删除的权限。 ( 2 ) 管理员 未登录时,可以浏览、下载其他用户发布的文件信息及其相关内容;登录系统后,不 仅可以拥有未登录时的功能,还可以发布资源信息,维护和更新注册用户信息和共享资源 信息,更改普通用户的权限,使之成为管理员级别的用户“”。 2 3 2 资源的收集与发布 1 、资源收集方案 考虑到校园网内用户的通常是静止的,即口地址是固定分配给某个用户的,所以 可以利用保存在目录信息中的口地址或通过用户直接指定计算机名来找到用户提交的共 享文件。如果用户对本机操作中,更改了d 地址或计算机名,则需修改原本提交到目录 服务器的共享目录信息,否则,无法到达共享文件的实际地点。p 地址和计算机名在资 源的收集与发布过程中是一个非常关键的内容。 目录信,皂, ( i n f o r m a t i o no f d i r e c t o r yi nd a t a b a s e ) 的收集: 在资源共享系统中,有一个很重要的步骤就是要为共享提供准确、合适的文件描述数 据。此部分记录了关键的信息,为资源的成功共享奠定了基石。 目录信息是由一条条记录组成的,一条记录就标识用户参与的一次文件提供。协调者 的目录信息格式如下表2 1 所示: 7 西安理工大学硕士学位论丈 表2 1 目录信息表 t a b l e2 - 1t h et a b l eo fc a t a l o g u e 属性描述 r e s o u r c e s l d 被发布的资源的i d 编号 r e s o u r c e s n a m e 被发布的资源文件名称 c a t e g o r y被发布的资源文件所在的分类目录 u s e r l d 提供共享文件的用户在共享系统上 的注册编号 p c n a m e 共享文件的来源,所存储的计算机名 称或口地址 r e s o u r c e s l n f o对发布的文件进行的细节说明,用户 在阅读文件说明后,能对该共享有更 明确的了解 p u b l i c t i m e 文件发布的时间 r e m a r k 备注信息 用户i d 是、资源发布时间这两项不会在发布页面中显示出来的。它的提供只为系统 专用,在程序中进行处理。对于服务使用者在获取文件过程中,他们只能看到资源m 、 资源名称、目录、机器名或p 地址、资源详细信息、备注,这主要是从系统的安全性和 信息的有效性两方面考虑的。用户在查询自己需要的信息时,在协调者向外只需发布与查 询文件相关的信息,而涉及到文件提供者个人信息和与之无关的内容,都予以保护,这些 信息对于服务使用者来说是多余的、无效的。 为了方便用户对共享资源的检索,系统对目录信息中的r e s o u r c e s i n f o 属性进行了细 化。本系统借助了多方面的标准,建立了适合描述高校媒体信息的模型,此模型以元数据 “为资源描述方法,以x m l 为元数据承载形式,统一了高校资源的描述方式,为信息 的共享和检索提供了支持。系统借鉴了新闻行业的中文新闻信息置标语言“”( 简称 c n m l ) 对元数据的定义和描述,对高校数据的描述进行了标准化。在c n m l 的基础上, 本系统还借鉴了广播电视音像资料编目规范“”( 第1 部分:电视资料) 、世界各国和地 区名称代码、语种名称代码( 第2 部分) 、电视录像片评审标准、高校档案分类方法等标 准对本系统的元数据描述进行了进一步的完善,使之能够更加全面的对媒体资源进行描 述,最终形成了本系统的资源元数据描述模板,为以后的资源检索打下了坚实的基础。 元数据在本系统中占着重要的地位,其从各个角度描述了系统资源的属性,为系统资 源的访问提供了统一的接口,其是实现共享的基础,也为实现深度检索提供了依据。所以, 系统提供了对元数据的维护功能,使用户可以按需要丰富元数据,以实现对资源更全面的 描述。元数据以x m l 文件存储,系统提供给管理员一个标准元数据模板,管理员和用户 可以对标准模板进行修改和保存,以后用户就可以以此为资源描述模板对资源进行描述。 高校媒体资源的共享 以下为某一图片的描述性元数 | l 模板的片断: 樱花道 c n 李明 2 0 0 7 0 5 0 9 j p g i m a g e 9 西安j e _ r - 大学硕士学位论丈 l3 0 3 2 0 0 0 2 0 0 0x13 0 3 在本系统中,文件的收集主要有以下两种途径: ( 1 ) 用户端信息收集 用户端信息收集是共享系统主要的文件收集方式。首先,用户需要对其所要共享的资 源进行编目,编目是根据元数据模板对其相应的项进行赋值操作,用户编目越详细,则对 资源属性的描述越清晰,并可使用户对资源的搜索越精细。然后,用户只需一个简单的操 作,将本地计算机上的文件描述信息通过特定的w e b 页面发送给提取信息的目录服务器, 同时,协调者监听所有到达目录服务器的数据,提取文件提供者的h t t p 请求信息,并将 其记录到目录清单中,这样就可以让更多的用户使用其上的文件了。通过用户端信息的收 集,则可以形成由校园网内的全部用户共同提供的资源池,从而形成一个资源丰富,更新 速度快,管理方便的系统。对于普通用户来说,各自拥有一定的信息资源存在于计算机上, 如果将它们孤立起来,成为一些小的信息孤岛,则造成资源的浪费,但是利用共享平台, 就能将其资源更好的利用。 ( 2 ) 服务器端信息收集 管理员也可以直接通过服务器收集数据,发布共享信息,此部分是沿袭集中式的系统 的资源提供方式,这是系统中辅助的资源提供方式,其便于学校机构有效地实现官方的第 一时间发布、维护权威信息、优秀课件。自提倡信息化教学后,学校积极鼓励教师采用多 媒体课程教学,挑选出本校教师们自制的一些优秀教学课件或获奖课件的实例和制作方法 在网上发布,让更多的教师懂得制作方法和运用实例教学。在服务器端进行文件收集的好 处是由权威机构组织和管理的信息,能更好地保障服务访问的可靠性。 2 、资源发布方案 文件信息的对外发布有许多组织形式,如:按学科发布、根据文件类型组织发布、按 资源的性质发布及依据资源的共享时间发布等。 ( 1 ) 按学科发布是指将用户上传的共享信息根据其归属学科科目分类,每一个科目独 立设置一个板块,信息在对应板块中发布。 ( 2 ) 按文件的类型发布是指通过截取共享文件的后缀( 扩展名) 来组织分类,后缀完 全匹配者归属同类,不匹配者则增加该类。 ( 3 ) 按资源的性质发布是依据文件的用途进行组织分类,常见的类型有:视频、电子 书、教育教学软件、网络安全软件、娱乐游戏等。 l o 高校媒体资源的共享 ( 4 ) 按资源的共享时问发斫i 则是通过识别被用户指定为共享资源的时问的先后顺序来 进行发斫j 。 经过具体分析以上四利t 信息发布的组织形式,本共享系统决定采用第4 种方式按资源 的共享时间发和信息。数掘的发稚按照资源排队的先后顺序,最后插入目录队列中的数据 将被视为最新提交的内容,发布在页面顶端,其后的资源,同样也以时问为关键字,时间 值越大,其新鲜度越高。 2 3 3 资源共享与发布流程 系统的主要目标是提供一个易用、快捷的应用平台为最终用户服务,减少系统升级的 工作量,实现客户端零安装。系统的流程如图2 - 4 所示,主要如下: ( 1 ) 用户进入信息资源共享系统主界面。 ( 2 ) 对功能模块进行选择操作,分别转入资源提供或资源获取。 ( 3 ) 注册新用户或者用户登录,输入用户名和口令,将用户名和口令发送到数据库进 行验证。 ( 4 ) 系统根据合法用户的身份允许用户进入资源添加界面,进行资源发布;非法用户 将不能进行资源发布。 ( 5 ) 直接进行资源定位,获取资源信息。 ( 6 ) 资源定位模块将用户的需求发送给服务端的相应数据库访问组件。 ( 7 ) 系统将用户的请求发送给目录服务器,并将结果传送到相应模块。 ( 8 ) 将动态生成的结果以h t m l 形式返回给用户。 e 三驾 图2 - 4 资源共享与发布流程图 f i g u r e2 - 4t h ef l o wc h a r to fr e s o u r c e ss h a r i n ga n dp u b l i s h i n g 西安理工大学硕士学位论文 2 3 4 服务描述 1 、p e e r 结点每次连接到网络,系统选择已知的协调者,目录服务的探测通过h t t p 进行。p e e r 搜索并下载文件的整个过程如图2 5 所示。 2 、服务提供者成功探测到协调者( 目录服务器) 后,注册到协调者,发布自己的共 享信息。将自己当前的i p 地址、捌有的共享文件、共享文件存放路径等信息发送给协 调者,加入协调者的目录,这些信息以后将用于和其它结点直接建立连接,对外提供 文件共享。 3 、服务使用者访问协调者并获取资源,有两种情况:( 1 ) 能够找到资源。( 2 ) 找不 到与用户所需要的资源。这里对于第( 1 ) 种情况又有两种可z 月匕t - , :找到资源且资源所有者 在线和找到资源但资源所有者并不在线。对于前一种可能,则直接由协调者提供目前 在线有效文件的目录信息,服务使用者选择所需信息,成功完成资源查找。当服务使 用者选择所需信息后,并不能完成资源的获取,而是出现系统提示,表示当前所需文 件的存放结点为不在线,只能是稍后再执行搜寻,这是针对第二种可能的。对于第( 2 ) 种情况,协调者上所有目录信息都查找完成后,未能找到符合的文件信息,说明校园 网上根本不存在所寻找的文件“”。 4 、完成信息的查找,协调者向服务使用者结点发送持有该文件的服务提供者结点 的i p 地址和存放路径等信息,来响应使用者的请求。 5 、服务使用者根据协调者所提供的信息,下载目标文件,下载完成后双方终止连 接。 6 、当结点决定退出时,无需从该协调者撤销注册信息。协调者会在使用者获取共 享文件时,对注册结点进行通信,判断该结点是否已经退出。 本地文件il 资源信息li 本地文件 汪耳 注册 通信 注册 。 土 塑警霉一服务使用者 资源地址l 注通 册信 服务提供者 本地文件 图2 - 5 资源获取过程 f i g u r e2 - 5t h ep r o c e s so fr e s o u r c e so b t a i n i n g 高校媒体资源的共享 2 4 共享系统性能分析 2 4 1 联合受益分析 校园网资源共享系统有特定的用户群,是面向高校师生丌放的,有范围的限定。将资 源共享系统的用户数量设定为q m ,一位资源提供者可为一位资源获取者创造的利益为b 。, 那么,该资源提供者可为用户群创造总的利益为b m ,其等于所有用户各自受益之和,即 q - 既= y 挑。如果在一个系统中,仅由一台服务器单纯的向用户提供资源,而用户不能参 篙 与到资源提供行列里来的话,该系统的联合受益“为b m 。 但是,如果有x 位用户同时都作为资源提供者进行资源系统的构建,用户数量依然为 q m 不变,校园内的资源提供能力之和将上升到q = ,理想状态下,用户之间的资源 交换的受益将上升到口= 玩q 。= q 瓯 ,其增加量为 n = lm = l = l p b = b - b , = q 吃一包- - ( q - 1 ) z 吃。那么,这种由所有用户参与资源提供的共享系 n 罩ln = l = l 统的联合受益相比单一资源提供者的系统的增值为ub “一。这一受益分析同样也适合于 信息资源的存储空间。 值得注意的是,一旦参加资源互换的各提供者所提供的资源几乎相同,想通过用户之 间互换资源构成一个庞大的资源系统就不能完整的实现,必须考虑服务提供者提供的资源 重复率的问题。但校园网中众多用户获取资源的途径不仅仅只限于资源共享系统,所以这 种情况通常是不存在的。因此,只有当资源重复率在合理且协调的时候,才能给予共享系 统一个良好的支撑,并能保障用户在访问资源时可以有效地到达服务路径。 2 4 2 服务器硬盘占用量分析 在传统的集中式的资源管理平台中,硬盘剩余空间是随着文件数量的增加而减少的 “l z 4 j 。而在本系统的集中分布型控制模式中,充分利用了客户端计算机所空闲的资源, 扩大了系统总体的存储容量。将集中的存储模式“内容位于中心”转变为“内容位于边缘 模式,无需增加服务器硬盘容量,且可大规模的提供共享资源。尽管共享文件数量在不断 的增加,然而硬盘空间占用量的变化并不明显,此时占用硬盘空间的仅仅为共享用户提供 的p 地址和资源描述信息。网络中大量的计算机能力和网络资源被利用,整个系统的计 算能力和网络资源随着用户数的增多而增多,资源共享系统可通过用户提供资源的扩大来 达到资源共享系统的资源扩张。 1 3 西安理工大学硕士学位论文 2 4 3 服务器负载 对二f 传统的集中式资源管理平台,伴随并发传输文件数的增多,分配给每个文件的服 务器的出口带宽将随之减少。当文件传输量为l 时,该文件独享服务器带宽,而文件传输 量为1 1 时,占用链路的带宽扩大到单个数据流的n 倍,此时服务器的负载也增长为单个数 据流服务的n 倍。而本系统所构造的集中分布式控制模型,合理地利用客户端网络带宽资 源“来提高整个系统的性能,其对服务器的能力和服务器端网络带宽没有太高的要求, 在建立整个系统时不用考虑增加集中式结构中的服务器和网络基础设施等设备,不但成本 降低了,而且解决了服务器访问瓶颈或需要采用集群式服务器所产生的问题。例如,b 、 c 、d 、e 、f 五个用户为下载某些文件同时访问协调者a ,a 只需为他们提供对应文件的 下载地址,而不需要提供下载的实际文件。因此,对协调者a 的性能和出口网络带宽的 要求降低了。在文件传输的过程中,被占用的服务器出口带宽为0 。因为,共享文件是分 别存放在一般用户的本地硬盘上的,文件交换也只是在用户计算机间发生。 2 4 4 管理及维护复杂度分析 作为一个共享系统,其文件的数量多、种类全才能吸引更多的用户来使用,管理复杂 度低和维护更新速度快才能有长久的生命周期。传统的资源管理平台采用集中式模式,这 使得其管理只能由服务器端进行,而随着共享文件数量的增加,系统维护人员的工作复杂 度也就随之增加。而本系统不但克服了纯分散式p 2 p 结构缺乏管理“、管理困难的问题, 而且延续了服务器的辅助角色。协调者上的目录信息按照上传资源的新旧程度排放,有利 于服务使用者快速的定位到最新信息。资源的维护和管理,由协调者和服务提供者完成。 资源的提供与更新由所有用户共同参与,因此大大降低了管理和维护的复杂度。 1 4 资源的检索 3 资源的检索 资源共享后,为了帮助用户快速的找到其所需要的资源,检索是一个重要的手段。系 统提供了各种检索手段来帮助用户发现其所需资源。对常见的查询,系统提供条件组合式 的数据库查询,系统对把常见的查询条件保存到数据库,如此,一方面减小了数据所占的 存储空间,另一方面也加快了用户的查询速度。针对图、文、声、像的特殊属性,系统提 供基于描述性x m l 文档的查询,因为元数据x m l 文档对资源的描述详细,并且x m l 拥有数据库没有的结构化特点,所以对其进行查找能够更准确的找到用户想要查询的资 源,但其缺点是查找速度要慢于数据库查找。系统还提供了分类查询、定制主题查询来丰 富查询功能。分类查询是对常见的查询资源进行分类,并一步步引导用户缩小查找范围, 从而减小用户在大量的查找结果中寻

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论