信息资源的网络管理.ppt

上传人：x*** IP属地：四川上传时间：2020-03-26 格式：PPT 页数：88 大小：281KB 积分：15 举报 版权申诉

已阅读5页，还剩83页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

第5章信息资源的网络管理信息系统与信息网络信息系统的开发方法网络信息资源的组织网络信息资源检索 5 1信息系统与信息网络信息系统的概念信息系统的发展阶段信息网络的概念信息网络的分类系统系统定义贝塔朗菲相互作用的诸要素的综合体系统特性集合性整体性相关性界限性环境适应性目标性层次性信息资源中的信息信息技术与信息人员等要素都不能单独发挥作用必须按一定的原则加以配置构成一个有机的整体信息系统信息系统的概念信息系统 InformationSystem 是以提供信息服务为主要目的的数据密集型人机交互的计算机应用系统它在技术上有4个特点 1 涉及的数据量大数据一般需存放在辅助存储器中内存中只暂存当前要处理的一小部分数据 2 绝大部分数据是持久的即不随程序运行的结束而消失而需长期保留在计算机系统中 3 这些持久数据为多个应用程序所共享甚至在一个单位或更大范围内共享 4 除具有数据采集传输存储和管理等基本功能外还可向用户提供信息检索统计报表事务处理规划设计指挥控制决策报警提示咨询等信息服务信息系统的基本结构就用途来说信息系统基本结构一般可分为四个层次 1 硬件操作系统和网络层是开发信息系统的支撑环境 2 数据管理层是信息系统的基础包括数据的采集传输存取和管理一般以数据库管理系统 DBMS 作为其核心软件 3 应用层是与应用直接有关的一层它包括各种应用程序例如分析统计报表规划决策等 4 用户接口层这是信息系统提供给用户的界面信息系统的功能信息采集信息处理信息存储信息管理信息检索信息传输信息系统的类型电子数据处理系统 ElectronicDataProcessingSystems EDPS 20世纪50 60年代初管理信息系统 MIS 60 70年代决策支持系统 DecisionSupportSystems DSS 和专家系统 ExpertSystems ES 70 80年代办公自动化系统 OfficeAutomationSystems OAS 和多媒体系统 MultimediaInformationSystems MISS 80 90年代之后信息网络的基本概念信息网络主要是指各种信息系统所构成的信息网络体系和为了支持这个网络系统有效运行所需要的网络标准通信协议操作规程传输编码等信息网络的分类按网络拓扑结构分环型星型树形总线型复合型网络等按网络的地域范围分国际网国内网地区网等按网络用途分军用网民用网综合信息网专业网或行业网等按传输速度分高速信息网和中低速信息网按连接范围分局域网城域网和广域网按照连线属性分有线网光纤网无线网 5 2信息系统的开发方法结构化系统开发方法原型法面向对象的开发方法计算机辅助开发方法 5 2 1结构化系统开发方法是将整个信息系统的开发过程包括分析设计实现运行维护从头到尾看作一个周期将整个周期划分为若干阶段预先明确规定每一阶段的任务而后按一定准则顺序完成是一种预先严格定义需求和任务的方法基本思想用系统的思想和系统工程的方法用户至上的原则结构化模块化自上而下地对生命周期进行分析与设计结构化系统开发方法的五个阶段整个开发过程分为五个依次连接的阶段系统规划阶段系统分析阶段系统设计阶段系统实施阶段系统运行与维护阶段 1 系统规划阶段主要任务是明确系统的方法要求并进行逐步的调查通过可行性的研究确定下一阶段的实施 2系统分析阶段主要任务是对组织结构与功能进行分析理清企业业务流程和数据流程的处理并且将企业业务流程与数据流程抽象化通过对功能数据的分析提出新系统的逻辑方案 3系统设计阶段主要任务是确定系统的总体设计方案划分子系统功能确定共享数据的组织然后进行详细设计如处理模块的设计数据库系统的设计输入输出界面的设计和编码的设计等 4系统实施阶段主要任务是讨论确定设计方案对系统模块进行调试进行系统运行所需数据的准备对相关人员进行培训等 5系统运行与维护阶段主要任务是进行系统的日常运行管理评价系统的运行效率对运行费用和效果进行监理审计如出现问题则对系统进行修改调整结构化系统开发方法的特点预先明确用户需求从需求出发设计系统有目的有步骤地对系统的环境目标限制条件功能效益等进行科学的调查分析从上到下地设计或规划信息系统对生命周期中的需求分析系统设计和系统实施各阶段进行明确分工并严格分离强调文档的标准化规范化和确定化以保证各阶段衔接运用系统分解和综合技术将复杂系统简明化强调阶段成果的审定和检验以便减少系统中的隐患 5 2 2原型法原型设计法是设计者初步了解用户需求以后即先构造一个系统的模型然后经用户试用再不断完善扩充的方法系统模型的构造原则是集成原则即充分地利用现有的软件小系统原则即模型应是能完成系统功能的最小系统可以再逐步扩充有相应的运行支撑软件如数据库管理系统人机界面及第四代计算机语言等原型法的主要步骤确定系统的基本要求和功能建造结构仿真模型运行评价修改原型框架原型法的特点并非所有的需求都能预先定义或按定义执行强调快速地构建原型因而尽量使用软件开发工具和已商品化的软件包为人们提供一个生动动态的演示模型更加直观生动鼓励用户对需求提出更多更高的要求从而使信息系统能真正满足管理和决策的需要 5 2 3面向对象法是建立在对象概念基础上的方法学对象是由数据和容许的操作组成的封装体与客观实体有直接对应关系一个对象类定义了具有相似性质的一组对象所谓面向对象就是以对象为中心在定义对象的基础上建立类和类的层次结构与继承机制通过消息的传递实现对象之间的彼此通信面向对象的开发过程包括以下几步识别对象及其属性识别每个对象涉及的操作建立对象间的接口实现每个对象面向对象一般分为四个阶段系统调查的需求分析分析问题的性质和求解问题整理问题程序实现面向对象开发方法的特点引入了数据抽象和封装类继承和消息传递等概念突破了传统的数据与操作分离的模式将数据与有关的操作封装为对象较好地实现了数据的抽象在对象间的关系上不像结构化设计那样只有模块间的调用而是采用了较灵活的消息传递方式由于引入了类和继承的概念便于实现系统软件的演化和扩充设计思想接近客观实际并符合人类惯常的思维方式类就是对具有相同数据和相同操作的一组相似对象的定义继承是指能够直接获得已有的性质和特征而不必重复定义封装数据和实现操作的代码集中起来放在对象内部使用对象只需知道它向外界提供的接口形式而无须知道它的数据结构细节和实现操作的方法 5 2 4计算机辅助开发方法它不是独立的方法而是为具体的开发方法提供的支持工具是把原先手工完成的开发过程转变为由自动化工具和支撑环境来完成的自动化开发过程计算机辅助开发方法的特点解决了从客观对象到软件系统的映射问题支持系统开发的全过程自动检测的方法大大的提高了软件的质量使软件的各部分能重复使用加速了系统的开发过程简化了软件的管理和维护产生出统一的标准化的系统文档 5 3网络信息资源组织网络信息资源的特点网络信息资源的类型网络信息资源的组织技术网络信息资源的组织方法 1 网络信息资源的特点 1 内容丰富数量大 2 多媒体多类型多语言传播范围广泛 3 信息构成复杂缺乏管理 4 交互性强 5 分散性和动态性因特网上的信息资源下面简称网络信息资源有广义和狭义之分广义的网络信息资源包括用于网络信息组织管理和传播的软硬件设备人员以及网络信息内容狭义的网络信息资源则指网络信息内容本章所论述的网络信息资源仅指狭义的概念从字面上讲网络信息资源指通过计算机网络可以利用的各种信息资源的总和具体地说就是指以数字格式将文字图像声音动画等多种形式的信息存放在光磁等载体中并通过网络通信计算机或终端等方式加以利用的信息资源随着因特网的迅速发展和普及网络信息资源主要指放置在因特网上的信息内容集合 2 网络信息资源的类型人们在从事网络信息资源管理和利用过程中提出了对网络信息资源的不同分类方案 1 按所对应的非网络信息资源划分网上图书馆藏目录网上电子书刊网络数据库动态信息娱乐资源网络游戏等 2 按人类信息交流的方式划分非正式出版信息半正式出版信息正式出版信息 3 按信息资源的来源机构划分政府机构及社会团体教育部门及各类研究机构公司企业新闻媒体个人资源 4 按信息资源的学科内容划分从信息资源的学科内容看网络信息可分为政治信息学术信息经济信息教育信息文化信息等 3 网络信息资源的组织技术文件方式主题树方式数据库方式超媒体方式 4 网络信息资源的组织方法元数据METADATADCMARC通用标准标记语言SGML 1 元数据的概念 Metadata 所谓元数据是一组描述数据本身基本特征和属性的数据又称为数据的数据从本质上说元数据是一种数据结构标准它提供了一种框架体系和方法来描述表征数字化信息的基本特征并通过一套通用的编码规则将来源各异的数字化资源归纳到一个标准的体系中元数据的成分元数据的成分至少要包含标识符存取文献所要求的硬件软件与操作系统脱机文献如CD ROM等的形体描述编码标准与版本数字文献的迁移史与其预期效果有助于确定数字文献真实性的数据版权管理信息以及版本与日期等元数据的种类 1 艺术作品描述类目 CDWA 2 编码文档描述 EAD 3 VRA核心类目 VRAcore 4 机读目录 MARC 5 都柏林核心集 DC 艺术作品描述类目 CDWA CDWA即CategoriesfortheDescriptionofWorksofArt 是描述艺术作品的结构化工具主要应用于艺术作品珍善本和其它三维作品它的描述重点在于可动的对象及其图像它有27个数据单元每一单元还包括若干子单元包括主题记录管理等项目编码文档描述 EAD EAD即EncodingArchivalDescription 主要用于描述档案和手稿资源并利用网络检索和获取档案手稿类信息资源其高层元素主要有头标前面事项档案描述每一高层元素又包括多个小项以及若干细项它能适应任何长度的目录和记录并能描述在各种媒介上的所有类型的档案 EAD体系由三部分组成数据模型 SGML文件类型定义和档案目录可视资源委员会核心元数据 VRAcore VRA即VisualResourcesAssociationCore 最初是为在网络环境下对艺术建筑等艺术类视觉资料的著录而起草以后逐渐扩大应用到非艺术类顶域目前VRA核心类目格式由两部分组成作品著录类目用于任何一种作品实体或某种视觉文献所记载的原始作品多为三维作品的著录包括作品类型尺寸主题等19个数据单元视觉文献著录类目用于记载某种作品实体的视觉文献的著录包括视觉文献类型视觉文献格式等9个数据单元都柏林核心集 DC DC即DublinCoreMetadata 是在充分吸纳了图书情报界所具有编目分类文摘等经验同时在利用计算机网络的自动搜索编目索引检索等研究成果的基础上发展起来的它是描述支持发现管理和检索网络资源的信息组织方式其最大特点是数据结构简单信息提供者可直接编码都柏林核心元素集 DublinCore 都柏林核心集产生于1995年3月在美国俄亥俄州的Dublin召开的第一届元数据研讨会 1998年9月因特网工程特别小组 IETF 正式接受DC为网络资源描述的正式标准 RFC2413 并予以发布 DC的15个元素机读目录 MARC 它被广泛用于图书馆书目记录数据是目前图书馆描述存储交换处理以及检索信息的基础 MARC记录的总体结构有以下特点可变格式可变长字段的记录格式采用目次方式每条MARC记录分三个区头标区目次区数据区机读目录MARC 机读目录 MachineReadableCatalogue 简称MARC 亦称马克所谓机读目录是指以代码形式和特定结构记录在计算机存储介质磁盘光盘上用计算机识别和阅读的目录 MARC的种类 LCMARC 美国国会图书馆 1965年美国国会图书馆创建MARC 70年代后MARC 格式也称LCMARC 被接受为国际标准 UNIMARC IFLA于1972年研究了一种国际机读目录格式UNIMARC USMARC 美国CAN MARC 加拿大UKMARC 英国MARC21 即 21世纪的MARC 1997年2月 USMARC和CAN MARC两种MARC格式实现了统一新的MARC格式在1998年被命名为MARC21 CNMARC ChinaMARCformat 1996年7月1日起实施 CNMARC的基本结构由24个字符构成由三个数字型的字段标识号以及字段长度和字段起始字符位置构成 CNMARC记录举例数据字段区记录头标区地址目次区标识信息块编码信息块著录信息块附注块国内使用块主题分析块知识责任块国际使用块标识语言SGML SGML StandardGeneralizedMarkupLanguage 即标准通用标记语言是1986年出版发布的一个信息管理方面的国际标准 ISO8879 该标准定义独立于平台和应用的文本文档的格式索引和链接信息为用户提供一种类似于语法的机制用来定义文档的结构和指示文档结构的标签制定SGML的基本思想是把文档的内容与样式分开 SGML的作用 SGML规定了在文档中嵌入描述标记的标准格式指定了描述文档结构的标准方法目前在WEB上使用的HTML格式便是使用固定标签集的一种SGML文档用SGML可以支持无数的文档结构类型并且可以创建与特定的软硬件无关的文档因此很容易与使用不同计算机系统的用户交换文档对SGML的认识 SGML实际上是一种元语言元语言是一套用来描述其它特定语言的通用规则因此也被称作标记语言 SGML有较强的灵活性它是一个开放的标准适用于任何一种信息结构可扩展能同任何等级的结构一起使用是最佳的数据存储格式正是因为同样的原因导致在小型的应用中难以普及 HTML HTML即HypertextMarkupLanguage 是为网页创建和其它可在网页浏览器中看到的信息设计的一种超文本置标语言 XML的涵义 XML是ExtensibleMarkupLanguage的缩写即可扩展标记语言是一种您可以用来创建自己的标记的标记语言 XML实际上是Web上表示结构化信息的一种标准文本格式它没有复杂的语法和包罗万象的数据定义是一种跨平台的与软硬件无关的处理信息的工具 XML同HTML一样都来自SGML 标准通用标记语言 XML的作用 XML是被设计用来存储数据携带数据和交换数据的它不是为了显示数据而设计的通过XML 你可以在HTML文件之外存储数据在不使用XML时 HTML用于显示数据数据必须存储在HTML文件之内使用了XML 数据就可以存放在分离的XML文档中这种方法可以让你集中精力去到使用HTML做好数据的显示和布局上并确保数据改动时不会导致HTML文件也需要改动这样可以方便维护页面把数据转换为XML格式存储将大大减少交换数据是的复杂性并且还可以使得这些数据能被不同的程序读取 XML示例 XML的特点可扩展性 XML允许使用者创建和使用他们自己的标记而不是HTML的有限词汇表企业可以用XML为电子商务和供应链集成等应用定义自己的标记语言甚至特定行业一起来定义该领域的特殊标记语言作为该领域信息共享与数据交换的基础灵活性 XML提供了一种结构化的数据表示方式使得用户界面分离于结构化数据所以 Web用户所追求的许多先进功能在XML环境下更容易实现自描述性 XML文档通常包含一个文档类型声明因而XML文档是自描述的不仅人能读懂XML文档计算机也能处理 XML表示数据的方式真正做到了独立于应用系统并且数据能够重用 XML文档被看作是文档的数据库化和数据的文档化有简明性它只有SGML约20 的复杂性但却具有SGML功能的约80 XML比完整的SGML简单得多易学易用并且易实现 XML与HTML的区别 XML是用来存放数据的 XML不是HTML的替代品 XML和HTML是两种不同用途的语言 XML是被设计用来描述数据的重点是什么是数据如何存放数据 HTML是被设计用来显示数据的重点是显示数据以及如何显示数据更好 HTML是与显示信息相关的 XML则是与描述信息相关的 SGML XML和HTML的关系 SGML通用标记语言HTML超文本标记语言XML可扩展性标记语言HTML和XML都派生于SGML HTML是SGML实际应用 XML是SGML的一个精简子集 XML被设计描述数据 HTML被设计用来显示数据 5 4网络信息资源的检索主题指南检索搜索引擎检索 1主题指南主题指南 Subjectdirectory 是一种可供检索和查询的等级式主题目录以超文本链接的方式将不同学科专业行业和区域的信息按照分类或主题目录的形式组织起来如SOHU 阿里巴巴网站等 2搜索引擎搜索引擎 searchengines 是对互联网上的信息资源进行搜集整理然后专供用户查询的系统如百度 Google Yahoo 等等一个搜索引擎一般包括信息搜集信息整理和用户查询三部分搜索引擎搜索引擎是一种能够通过internet接受用户的查询指令并向用户提供符合其查询需求的信息资源网址的系统它是一些在web中主动搜索信息网页上的单词和特定的描述内容并将其自动索引的web网站其索引内容存储在可供检索的大型数据库中建立索引和目录服务一些搜索引擎搜索网页的每一个单词而另一些搜索引擎则只搜索网页的前二百至五百个单词当用户输入关键词查询时该搜索引擎会告诉用户包含该关键词信息的所有网址并提供通向该网络的链接搜索引擎既是用于检索的软件又是提供查询检索的网站所以搜索引擎也可称internet上具有检索功能的网页搜索引擎的结构搜索器蜘蛛程序分析器索引器检索器用户接口搜索器主要功能是在互联网中漫游发现和收集信息它通常是一个遵循一定协议的计算机程序即蜘蛛程序 spider 分析器即分析程序功能是理解搜索器所搜索的信息它通常是一些特殊算法从spider程序抓回的网页源文件中抽取出索引项索引器将生成从关键词到URL的关系索引表索引表一般使用某种形式的倒排表即有索引项查找相应的URL 检索器主要功能是根据用户输入的关键词在索引器形成的倒排表中进行查询同时完成页面与查询之间的相关度评价对将要输出的结果进行排序并提供某种用户相关性反馈机制用户接口时输入用户查询显示查询结果提供用户相关性反馈机制主要目的是方便用户使用搜索引擎高效率多方式地从搜索引擎中得到有效及时的信息搜索引擎的结构网络蜘蛛索引库搜索引擎软件网络蜘蛛网络蜘蛛 spider 是一个功能很强的程序它会定期根据预先设定的地址去查看对应的网页如网页发生变化则重新获取该网页否则根据该网页中的链接继续进行访问网络蜘蛛访问页面的过程是对互联网信息的遍历过程为了保证网络蜘蛛遍历信息的广度一般事先设定一些重要的链接然后对这些链接进行遍历不断记录不断遍历直至访问完所有的链接索引网络蜘蛛将遍历得到的页面信息存放在临时数据库中为了提高检索效率需要按照一定的规则建立索引索引一般按照倒排文档的格式存放索引项有元数据索引项和内容索引项两种元数据索引项与文档的语意内容无关如作者名 URL 更新时间编码长度链接流行度等等内容索引项是用来反映文档内容的如关键词及其权重短语单字等等搜索引擎软件该软件用来筛选索引中无数的网页信息挑选出符合查询要求的网页并将它们进行分级排序与查询关键词关联越大的排得越靠前然后将分级排序后的结果显示给查询用户搜索引擎的主要指标响应时间用户提交查询请求与结果返回之间的平均时间间隔召回率一次搜索结果集合中符合用户要求的数目与文档库中所有相关结果总数之比衡量搜索引擎的查全率准确率一次搜索结果集合中符合用户要求的数目与该次搜索结果总数之比衡量搜索引擎的查准率受欢迎程

人人文库> 全部分类> 教育资料 > 课件下载

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

信息资源的网络管理.ppt

文档简介

温馨提示

最新文档

评论

信息资源的网络管理.ppt

文档简介

温馨提示

最新文档

评论

相关文档