下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第 4 章 计算机存取系统,4.1 计算机信息存取系统基本结构,计算机存取系统是利用计算机对一定范围内的信息集合进行选择、记录、存储与排序,以便用户采用科学手段与技术从中获取必要和充分信息资源的计算机信息系统。计算机信息存取系统也是一个关于目标、设备、人员、规则、程序、状态、信息资源与检索方法及策略的信息集合体。,1. 硬件设备(Computer Hardware) 这是系统用于处理数据的各种硬设备的总称,即所谓的计算机外部设备和用于控制计算与处理数据用的中央处理机(主机)以及存储数据与程序指令的主存储器和外部存储器等机器设备,包括主机、外围设备和数据处理或数据传送有关的其他设备。如图 4.1
2、 显示了计算机存取系统硬件组成。,图 4.1 计算机存取系统硬件组成,2. 软件设备 (Software) 软件设备是信息存取系统中各类程序和各种文件数据的总称,分为系统软件和应用软件。 系统软件的主要功能是,把应用程序送入或读入主存储器内,进行输入输出管理等。存取系统的软件设备如图 4.2 所示。,3. 机读数据库(Database) (1) 从数据的存取方式划分,有关系型 数据库、层次型数据库和网络型数据库 (2) 从数据存储的介质划分,有磁带数据库、磁盘数据库和光盘数据库 (3) 从数据类型划分,有文献数据库、数据型数据库、事实型数据库、多媒体数据库和超媒体数据库, 文献数据库 文献数据
3、库包括书目型数据库、全文型数据库和超文本数据库 3 种形式。 书目型数据库的著录项目基本与印刷型的目录、题录和文摘型检索工具一样,是二次文献的集合。,书目数据库的层次关系如下: 记录(Record) 它是书目数据库文档的基本组成单位,也是描述某一信息实体特征数据的集合,由逻辑上相关的若干字段(著录项目)组成。 字段(Field) 它是记录(Record)的组成单位,是用来描述信息实体某一属性的数据。在书目数据库中,一个字段就是传统手检工具中的一个著录项目。 文档(File) 文档是按照一定的结构组织而成的一组属性相同的记录的集合,它是书目数据库组织的基本形式。书目文档一般存储在磁带、磁盘和光盘
4、等媒体上。按照存取方式与组织结构,可将文档划分为顺排文档(Sequential file)和倒排文档(Inverted file)。,书目数据库中的主文档(Master file)通常是顺排文档,它将每件信息的全记录进行线形排序,提供按物理顺序的检索途径。 倒排文档是把记录中的可检字段及其属性值提取出来,按其属性的某种顺序进行再组织以成为可以用作索引的文档,这种倒排文档亦称索引文档。主文档以文献的全记录为处理和检索单元,而倒排文档则以文献的属性字段为处理和检索单元。 全文数据库是一种存储文献全文或其中主要文献部分的源数据库,分为直接原文型和摘录型两种形式。,全文数据库的主文档以记录为单位存储全
5、文,倒排文档则是由原文中的可检项和与其相对应的原文地址组成的索引文档,这两个部分通过指针联系起来。检索时,首先从倒排档中索取有关信息的地址集合,进行逻辑运算,然后从主文档中提取所有命中文献。 超文本数据库是一种按信息之间的关系非线性地存储、组织、管理和检索信息的工具。, 数据型数据库 数据型数据库存取的主要内容是各类数据,也可以说,数据型数据库是机读数据的集合。 事实型数据库 事实型数据库是一种以“事实”为对象的非文献型数据库,其存储内容多是有关人物、机构、地域、事件等一般性描述的信息,学术界常称之为“参考性数据库”或“指南性数据库”。, 多媒体数据库 多媒体数据库是传统数据库的扩展,它在关系
6、数据库的基础上增加了处理复杂对象和多媒体信息的能力,它支持多媒体数据类型(Text、Image、Graph、Audio 等)和变长字段类型及其相应操作,采用面向对象的概念,将每个媒体数据模型化为存取对象。, 超媒体数据库 超媒体数据库是超文本技术与多媒体技术在网络数据库的设计、研制、管理与利用中应用的产物。,4.2 计算机存取系统工作流程与功能 信息存取系统的功能与 6 个子系统相对应可以总括为 6 个方面,即输入功能、处理功能、存储功能、传输功能、输出功能和控制功能。这 6 个功能模块相互联系、相对稳定,既展示了系统为实现信息资源的有效输入、有效存储、有效控制和有效检索的总体目标,也表明了系
7、统为实现目标所包含的 6 个工作环节,见图4.3。,1. 输入子系统 输入子系统的输入功能包括:其一,针对系统建设的目标,广泛选择和搜集特定范围内的信息资源,其二,将从各地各类媒体上收集到的相关信息按照系统所规定的格式进行登载与记录。目前信息资源的收集和输入方式有两种:一是人工收集与录入,二是计算机自动收集。 2. 处理子系统 处理子系统的主要职责是处理加工经过鉴定、选择好的数据和信息,使之成为易于存储和检索的形式。,3. 存储子系统 所谓信息存储即将加工处理后的信息,按照某种规则和技术有序聚积在存储载体上以构成可检文档的技术工作。 4. 传输子系统 数据传输子系统的功能主要是通过计算机与通信
8、线路的连接、完成信息编码的传递、转接、处理与接受等工作。 数据传输的基本程序如图 4.4 所示。,5. 输出子系统 信息存取系统的总体目标是快速、全面、准确地满足各类信息用户不同信息需求的检索要求。输出子系统的功能就是根据用户需求有效输出各类最终信息产品。 输出(检索)子系统的状况,可以通过用户界面是否直观明了,检索软件功能是否齐全好用,检索方式是否灵活多样,检索策略可否保留,辅助索引是否齐备,检索途径是否丰富,输出格式是否多样等表现出来。 总体说来,系统能否根据自然语言或代码语言所表达的提问,从信息存储中迅速调出符合提问的各类数据,这是评价系统的重要标准之一。,6.控制子系统 控制子系统的基
9、本功能就是根据存取系统内部状态和外部环境的变化,适时进行管理与调节,以保障系统的有效输入、有效存储、有效输出等环节的协调运行。 目前对信息系统进行控制主要有集中控制、分散控制和多层控制等方式。,4.3 计算机信息存取系统类型,4.3.1 按信息特征划分的系统类型 计算机信息系统按存取信息的特征划分,有文献存取系统、事实存取系统、数值存取系统、图像存取系统。,1. 文献存取系统(Document Access System) 文献存取系统包括书目(目录、题录、文摘)、全文和超文本三种类型的存取系统。 文献存取系统的主要特点是对书目数据库和全文数据库进行管理和维护,提供查询文献线索或全文的检索途径
10、;系统中记录格式固定,数据结构简单,连续性、累积性强,建设与维护费用低,便于生产其他类型的书目产品。,2.事实型存取系统(Fact Access System) 事实型存储系统是一种直接面对各类事实与事项提问的信息存取系统。 3. 数值型存取系统(Numerical Access System) 支持此类存取系统的数据库是数值型数据库。 4. 图像存取系统(Image Access System) 图像存取系统是一种存取图像、图形及其说明文字等信息的计算机系统,这类系统为用户提供各种图像或图形信息存取功能。,4.3.2按工作方式和存取介质划分的系统类型 计算机信息按系统工作方式与存取介质划分,
11、有单机存取系统、联机存取系统、光盘存取系统和 Internet 网络存取系统。,1.单机存取系统(Off-Line Access System) 单机存取系统是以脱机批处理方式进行工作的,无须远程终端,也没有通信网络。用户无法和系统进行交互作用,也无法随机控制检索过程。这类存取系统一般由专职检索人员定期批量处理用户检索提问,然后把处理结果反馈给用户。,2. 联机存取系统(On-line Access System) 联机存取系统采用了联机分时处理工作方式提供信息检索,所谓联机处理即由用户从终端设备直接与系统进行会话式检索,用户可以浏览数据库,及时调整检索策略。所谓分时,即多个用户可以同时占有一
12、个联机系统分时共享系统的软硬件资源和数据库。早期联机信息存取系统主要由联机中心、用户终端、通信网络和联机数据库构成,联机存取系统的构成如图4.5 所示。,3. 光盘存取系统(CD-Disc Access System) 这是一种以高密度的光盘存储器为信息存储介质,利用激光与电子集成等技术实现信息的数字化存储,采用光盘驱动器和微机读取与检索光盘数据的计算机存取系统。 光盘存取系统主要有两种类型: (1)单机光盘存取系统 (2) 网络光盘存取系统,4.Internet 网络信息存取系统(Internet Resource Access System) 如图 4.7 所示。和传统的联机存取系统不同的
13、是,凡是利用统一 TCP/IP 通信协议的计算机和网络都可以联入 Internet,在因特网上发布信息或访问网上信息资源。目前,Internet 网上已经开发出来的用以收集和查询网络信息资源的工具有:菜单式信息存取系统(Gopher 等),超文本信息存取系统(WWW 等),电子公告信息存取系统(Usenet,BBS 等),基于 Internet 的联机存取系统(DIALOG,STN 等)等。,4.3.3按检索词的性质划分的系统类型 计算机信息按检索词的性质划分,有规范词信息存取系统和非控词存取系统。 1. 规范词存取系统 以受控词(叙词、标题词、单元词)为存取(Access)标识所建立的信息存
14、取系统即为规范词存取系统。此类系统的主要特点是,作为存取点的词语受主题词表的严格控制,主题词之间的关系通过等级结构和参照系统等方式进行显示。 2. 非控词存取系统 非控词即指自然语言,自然语言在网络信息存取系统中使用极为普遍,常用于存取系统的自然语言首推关键词法。,4.3.4按文档组织方式划分的系统类型 计算机信息按文档组织方式区分有顺排存取系统和倒排存取系统。,1.顺排文档存取系统(Sequential File) 所谓顺排文档即指文档中的全部记录按照存取号(如文摘号等)从小到大依次存取信息的系统(一般指记录存入数据库的时间顺序),顺序号越小,记录存入数据库的时间越早,反之,存入的时间越晚。
15、各记录之间的逻辑顺序与物理顺序一致。,2. 倒排文档存取系统(Inverted File) 将文档记录中的可检字段及其属性值,或称文献特征标识(即索引单元,如题名、著者、叙词、自由词、机构出版年等)抽取出来,按照字段属性的某种顺序进行排序与存储,使之成为可以用作索引的文档,因此倒排文档也可称作为索引文档。 顺排文档存取系统与手工检索工具中的正文部分对应,倒排文档则相当于手工检索工具的辅助索引。顺排文档以文献的全记录为存取单元,倒排文档则以文献的特征项(字段)为存取对象。,4.3.5按信息存取方式划分的系统类型 计算机信息按信息存取方式划分,有文件存取系统、数据库存取系统、主题树存取系统、超媒体
16、存取系统、数字图书馆和虚拟图书馆存取系统。,1.文件存取系统 文件存取系统也称电子文件存取系统。根据美国联邦文件管理术语手册的定义,电子文件是“存储形式只能由计算机处理的文件,也叫机读文件和自动化数据处理文件”。,2.数据库存取系统 数据库存取系统是计算机文件存取方式的发展,它是逻辑相关的记录和文件的集合。数据库系统不仅存储以共享为目的的数据,而且还存储数据之间的逻辑关系,它将所有存储在独立文件中的记录归并在一个数据库内,以方便不同应用程序的存取。 鉴于数据库处理海量信息的能力和优势,现已成为存取网络信息资源的重要方式,一些重要的网络查询工具,如 Archie、WAIS、Lycos、Alta
17、Vista、Open Text 等都是极受用户青睐的 Web 数据库存取系统。,3. 主题树存取系统 其基本原理是,为方便用户查询各类网上数据,首先根据某种事先确定的层层隶属的概念体系,将网络信息以超文本链接的方式,按照不同学科专业与区域主题的特征进行分门别类的逐层组织,以便于用户采用浏览方式逐级遨游,直到找出所需要的信息线索,再通过线索直接连接到相应的网络信息资源。,4. 超媒体存取系统 这类系统的特点是,可将多种媒体的信息以超文本方式集中组织,并采用非线形的网状方式表示块状信息。 在超媒体存取系统中,节点是信息存取的基本单位,节点内容有文本、图像、视频、声音、动画等各种信息。在超媒体存取系
18、统中,用户不必顺序地沿着时间或空间轴按部就班地搜寻,也不必担心在浏览时会迷失方向或引起混乱。相反,用户可在检索过程中,不受复杂的检索语言控制,跳跃式地沿着交叉链在信息海洋中自由航行,根据需要猎取目标信息。 超媒体存取系统的优势还在于,其节点结构可以任意改造或扩充,节点内容可以根据需要随时调整与更新;以链路联系或分隔各节点信息,有利于动态地实现网络信息的整体控制和分段控制。,5. 数字图书馆和虚拟图书馆存取系统 其基本原理是利用键盘输入或光学字符识别等技术将图书情报部门的原有馆藏以数字化方式进行存储,并将其挂于互联网上,再通过互联网为远程用户提供检索、查询与利用。,数字图书馆存取系统的核心是馆藏
19、资源的数字化处理、网络化应用和分布式管理,并在关系数据库基础上实现数字信息的组织、管理、发布、传输与查询及全球的信息资源共享。,虚拟图书馆存取系统,这是一种针对某学科或专业领域的需要,将互联网上的有关领域的各类信息资源线索,包括与该学科领域有关的研究机构、实验室、学术期刊、电子书籍、会议论坛、专家学者的 URLS(统一资源定位器)、HTTP、Gopher、FTP、USENET 等系统地组织起来,存放于某一网页,供用户浏览与检索的信息存取系统。用户通过激活相关网络线索(超链接),可以浏览到大量相关学科领域的信息资源。,4.4 计算机存取系统检索机制与系统评价 4.4.1 计算机存取系统检索机制
20、计算机存取系统一方面要把丰富的信息资源处理加工成索引文档与数据库,或通过超文本方式将不同计算机上的各类信息资源通过链指针有机地结合在一起,再通过超文本传输协议(HTTP)实现信息检索。另一方面,则要把复杂多变的用户需求变成系统可以识别与操作的提问检索式和链路途径。,目前,计算机信息存取系统用于信息资源与检索需求之间的相似性比较机制主要有以下几种类型: 1.单一整词检索机制 这是一种完整单元词全等比较检索的形式。 2. 截词检索机制 主要用于词干(词根)相同,词义相近或同一词的单复数形式或同一词的动、名词形式,英、美不同拼写方式等检索词查询。这是一种检索词与索引词进行片段相似性比较的方式。,3. 词组(多元词)检索机制 指对多个整词的固定词组形式所进行的匹配比较 4. 布尔逻辑检索机制 指由若干单元词或词组构成的逻辑组合比较 5. 相邻度检索机制 这是一种用于多个单元词之间位置逻辑的比较检索,6.加权运算机制. 在检索过程中,根据用户的实际需要及侧重点,对检索式中的若干检索词,根据其对检索课题的重要程度事先分别指定不同的权值及其临界值,系统便会一边检索一边计算被检记录所包含相关索引词的权值之和,并将命中记录按权值大小排列。 7. 自由文本检索机制 所谓自由文本检索机制,即提供从文档中的任意篇、章、节、句
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 师范学校财务管理制度
- 带转换层的高层建筑结构设计方案与分析概述
- 盲板抽堵作业管理制度培训
- 设备设施维护保养制度培训
- 用电安全教育和培训检查制度培训
- 电机车司机安全行为规范培训课件
- 2026年广东舞蹈戏剧职业学院单招职业倾向性考试题库及参考答案详解
- 2025年行车工安全操作与职责培训
- 2026年平顶山工业职业技术学院单招职业倾向性考试题库完整答案详解
- 2026年广西培贤国际职业学院单招职业倾向性测试题库附参考答案详解(综合卷)
- 缝纫工培训课件
- 化工安全培训课件 教学课件化工安全生产技术
- 水果干制品(无核蜜枣、杏脯、干枣)HACCP计划
- 学前教育学第2版全套PPT完整教学课件
- 护理伦理学(第二版)高职PPT完整全套教学课件
- 货架技术要求
- 本科专业评估指标体系
- 钻孔灌注桩专项施工方案
- 2023版中国近现代史纲要课件第一专题历史是最好的教科书PPT
- 耳尖放血课件完整版
- 绳正法曲线拨道量计算器
评论
0/150
提交评论