信息资源的网络管理.ppt_第1页
信息资源的网络管理.ppt_第2页
信息资源的网络管理.ppt_第3页
信息资源的网络管理.ppt_第4页
信息资源的网络管理.ppt_第5页
已阅读5页,还剩83页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第5章信息资源的网络管理 信息系统与信息网络信息系统的开发方法网络信息资源的组织网络信息资源检索 5 1信息系统与信息网络 信息系统的概念信息系统的发展阶段信息网络的概念信息网络的分类 系统 系统定义贝塔朗菲 相互作用的诸要素的综合体 系统特性 集合性 整体性 相关性 界限性 环境适应性 目标性 层次性 信息资源中的信息 信息技术与信息人员等要素都不能单独发挥作用 必须按一定的原则加以配置构成一个有机的整体 信息系统 信息系统的概念 信息系统 InformationSystem 是以提供信息服务为主要目的的数据密集型 人机交互的计算机应用系统 它在技术上有4个特点 1 涉及的数据量大 数据一般需存放在辅助存储器中 内存中只暂存当前要处理的一小部分数据 2 绝大部分数据是持久的 即不随程序运行的结束而消失 而需长期保留在计算机系统中 3 这些持久数据为多个应用程序所共享 甚至在一个单位或更大范围内共享 4 除具有数据采集 传输 存储和管理等基本功能外 还可向用户提供信息检索 统计报表 事务处理 规划 设计 指挥 控制 决策 报警 提示 咨询等信息服务 信息系统的基本结构 就用途来说 信息系统基本结构一般可分为四个层次 1 硬件 操作系统和网络层 是开发信息系统的支撑环境 2 数据管理层 是信息系统的基础 包括数据的采集 传输 存取和管理 一般以数据库管理系统 DBMS 作为其核心软件 3 应用层 是与应用直接有关的一层 它包括各种应用程序 例如分析 统计 报表 规划 决策等 4 用户接口层 这是信息系统提供给用户的界面 信息系统的功能 信息采集信息处理信息存储信息管理信息检索信息传输 信息系统的类型 电子数据处理系统 ElectronicDataProcessingSystems EDPS 20世纪50 60年代初 管理信息系统 MIS 60 70年代 决策支持系统 DecisionSupportSystems DSS 和专家系统 ExpertSystems ES 70 80年代 办公自动化系统 OfficeAutomationSystems OAS 和多媒体系统 MultimediaInformationSystems MISS 80 90年代之后 信息网络的基本概念 信息网络主要是指各种信息系统所构成的信息网络体系和为了支持这个网络系统有效运行所需要的网络标准 通信协议 操作规程 传输编码 等 信息网络的分类 按网络拓扑结构分 环型 星型 树形 总线型 复合型网络等 按网络的地域范围分 国际网 国内网 地区网等 按网络用途分 军用网 民用网 综合信息网 专业网或行业网等 按传输速度分 高速信息网和中 低速信息网 按连接范围分 局域网 城域网和广域网 按照连线属性分 有线网 光纤网 无线网 5 2信息系统的开发方法 结构化系统开发方法原型法面向对象的开发方法计算机辅助开发方法 5 2 1结构化系统开发方法 是将整个信息系统的开发过程 包括分析 设计 实现 运行 维护 从头到尾看作一个周期 将整个周期划分为若干阶段 预先明确规定每一阶段的任务 而后按一定准则顺序完成 是一种预先严格定义需求和任务的方法 基本思想 用系统的思想和系统工程的方法 用户至上的原则 结构化 模块化自上而下地对生命周期进行分析与设计 结构化系统开发方法的五个阶段 整个开发过程分为五个依次连接的阶段 系统规划阶段系统分析阶段系统设计阶段系统实施阶段系统运行与维护阶段 1 系统规划阶段 主要任务是明确系统的方法要求 并进行逐步的调查 通过可行性的研究确定下一阶段的实施 2系统分析阶段 主要任务是对组织结构与功能进行分析 理清企业业务流程和数据流程的处理 并且将企业业务流程与数据流程抽象化 通过对功能数据的分析 提出新系统的逻辑方案 3系统设计阶段 主要任务是确定系统的总体设计方案 划分子系统功能 确定共享数据的组织 然后进行详细设计 如处理模块的设计 数据库系统的设计 输入输出界面的设计和编码的设计等 4系统实施阶段 主要任务是讨论确定设计方案 对系统模块进行调试 进行系统运行所需数据的准备 对相关人员进行培训等 5系统运行与维护阶段 主要任务是进行系统的日常运行管理 评价系统的运行效率 对运行费用和效果进行监理审计 如出现问题则对系统进行修改 调整 结构化系统开发方法的特点 预先明确用户需求 从需求出发设计系统 有目的 有步骤地对系统的环境 目标 限制条件 功能 效益等进行科学的调查分析 从上到下地设计或规划信息系统 对生命周期中的需求分析 系统设计和系统实施各阶段进行明确分工并严格分离 强调文档的标准化 规范化和确定化 以保证各阶段衔接 运用系统分解和综合技术 将复杂系统简明化 强调阶段成果的审定和检验 以便减少系统中的隐患 5 2 2原型法 原型设计法是设计者初步了解用户需求以后 即先构造一个系统的模型 然后经用户试用 再不断完善扩充的方法 系统模型的构造原则是 集成原则 即充分地利用现有的软件 小系统原则 即模型应是能完成系统功能的最小系统 可以再逐步扩充 有相应的运行支撑软件 如数据库管理系统 人 机界面及第四代计算机语言等 原型法的主要步骤 确定系统的基本要求和功能 建造结构仿真模型 运行 评价 修改原型框架 原型法的特点 并非所有的需求都能预先定义或按定义执行 强调快速地构建原型 因而尽量使用软件开发工具和已商品化的软件包 为人们提供一个生动 动态的演示模型 更加直观生动 鼓励用户对需求提出更多 更高的要求 从而使信息系统能真正满足管理和决策的需要 5 2 3面向对象法 是建立在 对象 概念基础上的方法学 对象是由数据和容许的操作组成的封装体 与客观实体有直接对应关系 一个对象类定义了具有相似性质的一组对象 所谓面向对象 就是以对象为中心 在定义对象的基础上建立类和类的层次结构与继承机制 通过消息的传递实现对象之间的彼此通信 面向对象的开发过程 包括以下几步 识别对象及其属性 识别每个对象涉及的操作 建立对象间的接口 实现每个对象 面向对象一般分为四个阶段 系统调查的需求分析 分析问题的性质和求解问题 整理问题 程序实现 面向对象开发方法的特点 引入了数据抽象和封装 类 继承和消息传递等概念 突破了传统的数据与操作分离的模式 将数据与有关的操作封装为对象 较好地实现了数据的抽象 在对象间的关系上 不像结构化设计那样只有模块间的调用 而是采用了较灵活的消息传递方式 由于引入了类和继承的概念 便于实现系统软件的演化和扩充 设计思想接近客观实际并符合人类惯常的思维方式 类 就是对具有相同数据和相同操作的一组相似对象的定义 继承 是指能够直接获得已有的性质和特征 而不必重复定义 封装 数据和实现操作的代码集中起来放在对象内部 使用对象 只需知道它向外界提供的接口形式而无须知道它的数据结构细节和实现操作的方法 5 2 4计算机辅助开发方法 它不是独立的方法 而是为具体的开发方法提供的支持工具 是把原先手工完成的开发过程转变为由自动化工具和支撑环境来完成的自动化开发过程 计算机辅助开发方法的特点 解决了从客观对象到软件系统的映射问题 支持系统开发的全过程 自动检测的方法大大的提高了软件的质量 使软件的各部分能重复使用 加速了系统的开发过程 简化了软件的管理和维护 产生出统一的标准化的系统文档 5 3网络信息资源组织 网络信息资源的特点网络信息资源的类型网络信息资源的组织技术网络信息资源的组织方法 1 网络信息资源的特点 1 内容丰富 数量大 2 多媒体 多类型 多语言 传播范围广泛 3 信息构成复杂 缺乏管理 4 交互性强 5 分散性和动态性 因特网上的信息资源 下面简称网络信息资源 有广义和狭义之分 广义的网络信息资源包括用于网络信息组织 管理和传播的软硬件设备 人员以及网络信息内容 狭义的网络信息资源则指网络信息内容 本章所论述的网络信息资源仅指狭义的概念 从字面上讲 网络信息资源指通过计算机网络可以利用的各种信息资源的总和 具体地说就是指以数字格式将文字 图像 声音 动画等多种形式的信息存放在光 磁等载体中 并通过网络通信 计算机或终端等方式加以利用的信息资源 随着因特网的迅速发展和普及 网络信息资源主要指放置在因特网上的信息内容集合 2 网络信息资源的类型 人们在从事网络信息资源管理和利用过程中 提出了对网络信息资源的不同分类方案 1 按所对应的非网络信息资源划分 网上图书馆藏目录 网上电子书刊 网络数据库 动态信息 娱乐资源 网络游戏等 2 按人类信息交流的方式划分 非正式出版信息 半正式出版信息 正式出版信息 3 按信息资源的来源机构划分 政府机构及社会团体 教育部门及各类研究机构 公司企业 新闻媒体 个人资源 4 按信息资源的学科内容划分从信息资源的学科内容看 网络信息可分为政治信息 学术信息 经济信息 教育信息 文化信息等 3 网络信息资源的组织技术 文件方式主题树方式数据库方式超媒体方式 4 网络信息资源的组织方法 元数据METADATADCMARC通用标准标记语言SGML 1 元数据的概念 Metadata 所谓元数据是一组描述数据本身基本特征和属性的数据 又称为 数据的数据 从本质上说 元数据是一种数据结构标准 它提供了一种框架体系和方法来描述 表征数字化信息的基本特征 并通过一套通用的编码规则 将来源各异的数字化资源归纳到一个标准的体系中 元数据的成分 元数据的成分至少要包含 标识符 存取文献所要求的硬件 软件与操作系统 脱机文献 如CD ROM等 的形体描述 编码标准与版本 数字文献的迁移史与其预期效果 有助于确定数字文献真实性的数据 版权管理信息以及版本与日期等 元数据的种类 1 艺术作品描述类目 CDWA 2 编码文档描述 EAD 3 VRA核心类目 VRAcore 4 机读目录 MARC 5 都柏林核心集 DC 艺术作品描述类目 CDWA CDWA即CategoriesfortheDescriptionofWorksofArt 是描述艺术作品的结构化工具 主要应用于艺术作品 珍善本和其它三维作品 它的描述重点在于 可动 的对象及其图像 它有27个数据单元 每一单元还包括若干子单元 包括主题 记录 管理等项目 编码文档描述 EAD EAD即EncodingArchivalDescription 主要用于描述档案和手稿资源 并利用网络检索和获取档案手稿类信息资源 其高层元素主要有 头标 前面事项 档案描述 每一高层元素又包括多个小项以及若干细项 它能适应任何长度的目录和记录 并能描述在各种媒介上的所有类型的档案 EAD体系由三部分组成 数据模型 SGML文件类型定义和档案目录 可视资源委员会核心元数据 VRAcore VRA即VisualResourcesAssociationCore 最初是为在网络环境下对艺术 建筑等艺术类视觉资料的著录而起草 以后逐渐扩大应用到非艺术类顶域 目前VRA核心类目格式由两部分组成 作品著录类目 用于任何一种作品实体或某种视觉文献所记载的原始作品 多为三维作品 的著录 包括作品类型 尺寸 主题等19个数据单元 视觉文献著录类目 用于记载某种作品实体的视觉文献的著录 包括视觉文献类型 视觉文献格式等9个数据单元 都柏林核心集 DC DC即DublinCoreMetadata 是在充分吸纳了图书情报界所具有编目 分类 文摘等经验 同时在利用计算机 网络的自动搜索 编目 索引 检索等研究成果的基础上发展起来的 它是描述 支持 发现 管理和检索网络资源的信息组织方式 其最大特点是数据结构简单 信息提供者可直接编码 都柏林核心元素集 DublinCore 都柏林核心集产生于1995年3月在美国俄亥俄州的Dublin召开的第一届元数据研讨会 1998年9月 因特网工程特别小组 IETF 正式接受DC为网络资源描述的正式标准 RFC2413 并予以发布 DC的15个元素 机读目录 MARC 它被广泛用于图书馆书目记录数据 是目前图书馆描述 存储 交换 处理以及检索信息的基础 MARC记录的总体结构有以下特点 可变格式可变长字段的记录格式 采用目次方式 每条MARC记录分三个区 头标区 目次区 数据区 机读目录MARC 机读目录 MachineReadableCatalogue 简称MARC 亦称 马克 所谓机读目录 是指以代码形式和特定结构记录在计算机存储介质 磁盘 光盘 上 用计算机识别和阅读的目录 MARC的种类 LCMARC 美国国会图书馆 1965年美国国会图书馆创建MARC 70年代后MARC 格式 也称LCMARC 被接受为国际标准 UNIMARC IFLA于1972年研究了一种国际机读目录格式UNIMARC USMARC 美国CAN MARC 加拿大UKMARC 英国MARC21 即 21世纪的MARC 1997年2月 USMARC和CAN MARC两种MARC格式实现了统一 新的MARC格式在1998年被命名为MARC21 CNMARC ChinaMARCformat 1996年7月1日起实施 CNMARC的基本结构 由24个字符构成 由三个数字型的字段标识号以及字段长度和字段起始字符位置构成 CNMARC记录举例 数据字段区 记录头标区 地址目次区 标识信息块 编码信息块 著录信息块 附注块 国内使用块 主题分析块 知识责任块 国际使用块 标识语言SGML SGML StandardGeneralizedMarkupLanguage 即标准通用标记语言 是1986年出版发布的一个信息管理方面的国际标准 ISO8879 该标准定义独立于平台和应用的文本文档的格式 索引和链接信息 为用户提供一种类似于语法的机制 用来定义文档的结构和指示文档结构的标签 制定SGML的基本思想是把文档的内容与样式分开 SGML的作用 SGML规定了在文档中嵌入描述标记的标准格式 指定了描述文档结构的标准方法 目前在WEB上使用的HTML格式便是使用固定标签集的一种SGML文档 用SGML可以支持无数的文档结构类型 并且可以创建与特定的软硬件无关的文档 因此很容易与使用不同计算机系统的用户交换文档 对SGML的认识 SGML实际上是一种元语言 元语言是一套用来描述其它特定语言的通用规则 因此也被称作标记语言 SGML有较强的灵活性 它是一个开放的标准 适用于任何一种信息结构 可扩展 能同任何等级的结构一起使用 是最佳的数据存储格式 正是因为同样的原因 导致在小型的应用中难以普及 HTML HTML即HypertextMarkupLanguage 是为网页创建和其它可在网页浏览器中看到的信息设计的一种超文本置标语言 XML的涵义 XML是ExtensibleMarkupLanguage的缩写 即可扩展标记语言是一种您可以用来创建自己的标记的标记语言 XML实际上是Web上表示结构化信息的一种标准文本格式 它没有复杂的语法和包罗万象的数据定义 是一种跨平台的 与软 硬件无关的 处理信息的工具 XML同HTML一样 都来自SGML 标准通用标记语言 XML的作用 XML是被设计用来存储数据 携带数据和交换数据的 它不是为了显示数据而设计的 通过XML 你可以在HTML文件之外存储数据 在不使用XML时 HTML用于显示数据 数据必须存储在HTML文件之内 使用了XML 数据就可以存放在分离的XML文档中 这种方法可以让你集中精力去到使用HTML做好数据的显示和布局上 并确保数据改动时不会导致HTML文件也需要改动 这样可以方便维护页面 把数据转换为XML格式存储将大大减少交换数据是的复杂性 并且还可以使得这些数据能被不同的程序读取 XML示例 XML的特点 可扩展性 XML允许使用者创建和使用他们自己的标记而不是HTML的有限词汇表 企业可以用XML为电子商务和供应链集成等应用定义自己的标记语言 甚至特定行业一起来定义该领域的特殊标记语言 作为该领域信息共享与数据交换的基础 灵活性 XML提供了一种结构化的数据表示方式 使得用户界面分离于结构化数据 所以 Web用户所追求的许多先进功能在XML环境下更容易实现 自描述性 XML文档通常包含一个文档类型声明 因而XML文档是自描述的 不仅人能读懂XML文档 计算机也能处理 XML表示数据的方式真正做到了独立于应用系统 并且数据能够重用 XML文档被看作是文档的数据库化和数据的文档化 有简明性 它只有SGML约20 的复杂性 但却具有SGML功能的约80 XML比完整的SGML简单得多 易学 易用并且易实现 XML与HTML的区别 XML是用来存放数据的 XML不是HTML的替代品 XML和HTML是两种不同用途的语言 XML是被设计用来描述数据的 重点是 什么是数据 如何存放数据 HTML是被设计用来显示数据的 重点是 显示数据以及如何显示数据更好 HTML是与显示信息相关的 XML则是与描述信息相关的 SGML XML和HTML的关系 SGML通用标记语言HTML超文本标记语言XML可扩展性标记语言HTML和XML都派生于SGML HTML是SGML实际应用 XML是SGML的一个精简子集 XML被设计描述数据 HTML被设计用来显示数据 5 4网络信息资源的检索 主题指南检索搜索引擎检索 1主题指南 主题指南 Subjectdirectory 是一种可供检索和查询的等级式主题目录 以超文本链接的方式将不同学科 专业 行业和区域的信息按照分类或主题目录的形式组织起来 如SOHU 阿里巴巴网站等 2搜索引擎 搜索引擎 searchengines 是对互联网上的信息资源进行搜集整理 然后专供用户查询的系统 如百度 Google Yahoo 等等 一个搜索引擎一般包括信息搜集 信息整理和用户查询三部分 搜索引擎 搜索引擎是一种能够通过internet接受用户的查询指令 并向用户提供符合其查询需求的信息资源网址的系统 它是一些在web中主动搜索信息 网页上的单词和特定的描述内容 并将其自动索引的web网站 其索引内容存储在可供检索的大型数据库中 建立索引和目录服务 一些搜索引擎搜索网页的每一个单词 而另一些搜索引擎则只搜索网页的前二百至五百个单词 当用户输入关键词查询时 该搜索引擎会告诉用户包含该关键词信息的所有网址 并提供通向该网络的链接 搜索引擎既是用于检索的软件又是提供查询 检索的网站 所以 搜索引擎也可称internet上具有检索功能的网页 搜索引擎的结构 搜索器 蜘蛛程序 分析器索引器检索器用户接口 搜索器 主要功能是在互联网中漫游 发现和收集信息 它通常是一个遵循一定协议的计算机程序 即蜘蛛程序 spider 分析器 即分析程序 功能是理解搜索器所搜索的信息 它通常是一些特殊算法 从spider程序抓回的网页源文件中抽取出索引项 索引器 将生成从关键词到URL的关系索引表 索引表一般使用某种形式的倒排表 即有索引项查找相应的URL 检索器 主要功能是根据用户输入的关键词 在索引器形成的倒排表中进行查询 同时完成页面与查询之间的相关度评价 对将要输出的结果进行排序 并提供某种用户相关性反馈机制 用户接口 时输入用户查询 显示查询结果 提供用户相关性反馈机制 主要目的是方便用户使用搜索引擎 高效率 多方式地从搜索引擎中得到有效 及时的信息 搜索引擎的结构 网络蜘蛛 索引库 搜索引擎软件 网络蜘蛛 网络蜘蛛 spider 是一个功能很强的程序 它会定期根据预先设定的地址去查看对应的网页 如网页发生变化则重新获取该网页 否则根据该网页中的链接继续进行访问 网络蜘蛛访问页面的过程是对互联网信息的遍历过程 为了保证网络蜘蛛遍历信息的广度 一般事先设定一些重要的链接 然后对这些链接进行遍历 不断记录 不断遍历 直至访问完所有的链接 索引 网络蜘蛛将遍历得到的页面信息存放在临时数据库中 为了提高检索效率 需要按照一定的规则建立索引 索引一般按照倒排文档的格式存放 索引项有元数据索引项和内容索引项两种 元数据索引项与文档的语意内容无关 如作者名 URL 更新时间 编码 长度 链接流行度等等 内容索引项是用来反映文档内容的 如关键词及其权重 短语 单字等等 搜索引擎软件 该软件用来筛选索引中无数的网页信息 挑选出符合查询要求的网页并将它们进行分级排序 与查询关键词关联越大的排得越靠前 然后将分级排序后的结果显示给查询用户 搜索引擎的主要指标 响应时间 用户提交查询请求与结果返回之间的平均时间间隔 召回率 一次搜索结果集合中符合用户要求的数目与文档库中所有相关结果总数之比 衡量搜索引擎的查全率 准确率 一次搜索结果集合中符合用户要求的数目与该次搜索结果总数之比 衡量搜索引擎的查准率 受欢迎程

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论