




免费预览已结束,剩余1页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
11 基于动态超文本的文献检索的设计与实现卢苇 王利强(计算机科学系)摘要本文提出了一种适用于Internet上文献资料检索的超文本动态生成方法,并定义了一种用于表示超文本链接的图超文本链接网(HyperText Link Net,HTLN)。关键词 超文本 文献检索 国际互联网 环球网11.1 1 引言 随着国际互联网(Internet) 和环球网(World Wide Web,即WWW)的迅速发展,全国大部分大学已建立自己的校园网,并通过中国教育科研网(Cernet)接入Internet。大部分网络用户感觉到国外的网络信息纷乱芜杂,真正有用的不多,而国内的上网资源简直少的可怜。遍览全国高校提供的上网信息,介绍学校概况的居多,而真正有价值的信息则很少。鉴于目前这种状况,迫切要求各高等院校在网上提供一批有价值的高水平的文献资料,供高校师生检索和查询。只有大量有价值的信息上网,校园网和Cernet才能真正发挥它们的作用,为教育和科研服务。 传统的手工文献检索方式,已落后于飞速发展的科技水平,远远不能满足科研和教学的需要。现代的计算机图书情报管理系统,虽然具有存储量大,检索速度快等特点,但由于它的传统的字符界面,给不熟悉计算机的用户带来很大的不便。Internet与超文本(Hypertext)技术的发展,为文献资料的检索和查询带来了一场新的革命。将文献数据存储到WWW服务器上,用户利用电话线或局域网,可以很方便地访问其上的信息,由于超文本提供了简单易用的用户界面,因此普通用户很容易使用浏览工具(如Netscape、Explore等)进行信息的查询与检索。 在WWW服务器上超文本的组织方式有多种,我们在这里提出了一种新型的动态超文本的存储与生成方案,并给出了程序的实现算法。11.2 2 超文本的组织 在WWW服务器上可以按照不同的方式组织超文本,使之更有效地提供检索服务。最常用的组织方式主要有以下几种 (1)、目录树方式 假设有如图1所示的文献分类,按传统的目录树分类方式,可在计算机上组织为图2所示的形式。自然科学 数学 计算机科学 物理学 图形图形技术 数据库技术 网络技术 关系数据库 面向对象数据库 知识库图1 sciencemathematics computer physicsgraph&image database network RDB OODB KB 图 2 这种组织方式清晰明了,易于扩充。但由于目录较多,为维护、更新带来较大的难度。用户的检索只能分级进行,不能直接对文献标题和关键词进行模糊查找。如果数据量较大,进行文献的检索则颇费周折。 (2)、利用关系数据库存储 可以把文献资料编辑为超文本的形式,存储到如图3所示的关系中。文章编号分类号文章标题关键词内容(超文本方式)A0001TP02现代通讯技术微波通讯、红外通讯现代通讯技术图 3 网络技术 这里你可以查询有关 最新的网络技术 以太网技术 10Base-2 10Base-2技术 10Base-5 10Base-2 10Base-T 利用细缆 快速以太网技术 交换以太网技术 FDDI技术 ATM技术 图 4 利用关系型数据库系统,很容易实现对超文本的维护和检索,但如果要动态地对超文本信息进行更新,则有一定的难度。例如有图4所示的超文本链接,如果有关10Base-2的以太网技术已经过时,则可以在关系中将有关10Base-2的文章删去,但因为原来在多处文章中有指向10Base-2的超文本链接,需查找出所有引用10Base-2的文章,将链点信息删除。利用图3所示的关系结构则较难实现。 基于以上存储方式的优点与不足,我们提出了以下超文本文件组织方式。 因为超文本本身是利用超链点相互指向的,可利用图的方式来表示这种链接。 t1 c2 c1 c4 t2 C3 c5 t3 c7 c6 图 5 我们把这种图定义为超文本链接网(HyperText Link Net,简称HTLN)。HTLN由以下几部分组成 (1)、分类集合C C=c1, c2 cn是分类的有限集合,n=0。 (2)、超文本文件集合T T=t1, t2tm是超文本文件的有限集合,m=0。 可知分类集合C与超文本文件集合T之间没有公共元素,即CT=。 (3)、分类结点的链接关系I 定义Ici为由ci指向分类结点集I(ci)的有向边,I(ci)C。 (4)、超文本链接关系O 定义Oci为由ci指向超文本文件结点集O(ci )的有向边,其中O(ci) T;定义Oti为由ti指向分类结点集或超文本文件结点集O(ti )的有向边,若xO(ti)则有(xC且xT)或(xC且xT)。 我们将HTLN记作H=(C, T, I, O)。则图5可表示为 H=(C, T, I, O) C=c1, c2, c3, c4, c5, c6, c7 T=t1, t2, t3 I=Ic1 Ic2 Ic3 Ic4 Ic5 Ic6 Ic7 I(c1)=c2, c3, c7, I(c2)= , I(c3)=c3, c5, c6, I(c4)= , I(c5)= , I(c6)= , I(c7)= O=Oc4Ot1Ot2Ot3 O(c4)=t1, t2, t3, O(t1)=t2, t3, O(t2)= , O(t3)=c6 对于不同的用户,他们期望的O(超文本文件链接关系)是不同的。这时可将O进一步定义为 设Ok为用户K定义的O关系,即Ok(ti)为用户K定义的由ti指向的分类结点或超文本文件结点。整个HTLN中的O=O1 O2 Os,此时s=0,系统共有s个用户。 依据同样的方法可以对I进行分类。 易证此时由C和I组成的图为一棵树。由C、T、I、O组成一个有向图。关系T编号关键词kkkk(1)、查询 步骤1用户输入用户名、口令 步骤2依据当前用户名称查找关系I,找到树的根结点,作为当前结点,返回用户 步骤3询问用户符合当前要求吗?若符合,退出 步骤4依据集合I、O,查找当前结点的下一结点。转步骤3(2)、增加结点或链接 步骤1用户输入用户名、口令 步骤2依据当前用户名称查找集合I,找到树的根结点,作为当前结点,返回用户 步骤3将结点插入此处吗?若插入转步骤5 步骤4依据集合I、O,查找当前结点的下一结点,转步骤3 步骤5在集合C或T中增加新结点 步骤6在集合I或O中增加新的元素,表示新增加的链接 步骤7添加其他链接吗?若添加,则转步骤6,否则退出 有向图的存储有多种方法。因为关系数据库的存储及检索效率较高,而且易于维护,因此我们把C、T、I、O分别表示成相应的关系,存储到数据库中。关系C编号名称C1自然科学关系T编号文献名称内容T1高等数学关系T编号作者T1张三关系I编号ciI(ci)用户关系Oc编号ciO(ci)用户关系Ot编号tiO(ti)用户11.3 3 算法实现 (3)、超文本生成算法 步骤1生成超文本头标记如等 步骤2判断当前结点pC还是pT,将关系C或T中的名称插入此处 步骤3插入超文本标记如等 步骤4若pT,依据关系T中关键词、文献内容等生成超文本的部分 步骤5检索p的下一级结点,提示与p有关的链接,如 参考以下文献文献1、文献2 注(1)、此处的超文本链接应如此定义相关文献,假设在bin目录下存在一个名为RunCGI的CGI(Common GateWay Interface,通用网关接口)程序。有关CGI程序的设计参见1。 (2)、结点删除的算法与结点插入的算法相似,此处略。 11.4 4 系统结构 Netscapeh或Explore 电话线 Web CGI ODBC Data http Server 程序 Base PC图 9 如图6所示,假设用户的PC通过电话线连接到Web Server上。当用户PC上的浏览器向服务器发出请求后,Web Server识别出该请求为调用CGI程序,于是通过操作系统激活相应的CGI程序,CGI程序根据Web Server传给它的参数,利用ODBC(或其它数据库访问接口)访问相应的数据库,并将查询出的结果生成超文本返回给Web Server,Web Server再利用http协议将超文本传输到用户的PC上,通过浏览器显示出来。11.5 5 小结 本文提出的超文本动态生成的方法不仅适用于文献资料的检索,同时可用于其它方面超文本的动态生成。以往人们设计的Web页面虽然美观漂亮,但需人工制作,浪费了大量的人力物力,并且不利于信息的更新。本文所提的方法可以在原有文本文件的基础上(对于没有文本文件的文献资料,可利用扫描识别的方法生成文本文件),动态生成超文本。这种超文本不仅有利于信息的及时更新,而且减少了人工制作,具有很大的现实意义。特别是文件中的超链点可以依据当前用户的不同而产生不同的形式,如某个链接对用户A是可见的,而对于用户B是不可见的,而且用户还可以根据自己的需求自行建立超链点,同时又不影响他人的使用(即对他人这种链点是不可见的)。 参考文献 1、Rick Stout . World Wide Web Complete Refrence . McGraw-Hill 2、卢开澄等. 图论及其应用. 清华大学出版社2 Designing&Inplementing of Inquiring Document Base On Dynamic HypertextLuWei WangLiQiang(Computer Science Department)Abstract: This p
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年事业单位笔试-四川-四川公共卫生管理(医疗招聘)历年参考题库典型考点含答案解析
- 2025年事业单位笔试-北京-北京预防医学(医疗招聘)历年参考题库典型考点含答案解析
- 2025年事业单位笔试-北京-北京中医骨伤科学(医疗招聘)历年参考题库典型考点含答案解析
- 2025年事业单位笔试-内蒙古-内蒙古皮肤病与性病学(医疗招聘)历年参考题库典型考点含答案解析
- 2025年事业单位工勤技能-黑龙江-黑龙江保健按摩师三级(高级工)历年参考题库含答案解析
- 机械基础知识培训教材课件
- 新解读《GB-T 14218-2018电子调光设备性能参数与测试方法》
- 团队总监面试题目及答案
- 铁道建筑面试题目及答案
- 体能中心面试题目及答案
- 送达地址确认书(完整版)
- 四川滑雪场商业综合体设计方案文本含个方案 知名设计院
- 日立电梯常用零配件价格清单
- 单位人事证明(共7篇)
- 水泵设备单机试运转记录
- 保密管理-公司涉密人员保密自查表
- 日常安全检查记录
- 速成意大利语(上)
- 压型钢板组合楼板设计计算表格
- Q∕SY 1535-2012 海底管道混凝土配重层技术规范
- T∕CADERM 2002-2018 胸痛中心(基层版)建设与评估标准
评论
0/150
提交评论