第6课-信息资源的网络管理.ppt_第1页
第6课-信息资源的网络管理.ppt_第2页
第6课-信息资源的网络管理.ppt_第3页
第6课-信息资源的网络管理.ppt_第4页
第6课-信息资源的网络管理.ppt_第5页
免费预览已结束,剩余72页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息资源管理 杭州电子科技大学管理学院余彩霞博士aima y QQ 58532145 信息资源的网络管理 6 1信息系统和信息网络6 2信息资源的布局和共享管理6 3网络环境中的信息资源管理 6 1信息系统和信息网络 信息系统在信息资源管理过程中的地位日益重要信息系统为信息资源管理提供了创新手段信息系统管理已成为信息资源管理的核心内容之一 研究的背景 信息系统的基本内涵 广义理解 范围很广 各种处理信息的系统都可算作信息系统 包括人体本身和各种人造系统 狭义理解 指基于计算机的系统 是人 规程 数据库 硬件和软件等各种设备 工具的有机集合 它突出的是计算机和通信等技术的应用 我们的理解 把负有信息采集 组织 加工 传递和服务职责的信息资源管理机构和各种基于计算机的处理信息的系统统称为信息系统 组成层次包括基础设施层 数据处理层 应用层和用户接口层 信息系统的发展历程 1 电子数据处理系统 EDPS 2 管理信息系统 MIS 3 决策支持系统 DSS 和专家系统 ES 4 办公自动化系统 OAS 和多媒体信息系统 MMIS 信息系统的功能信息采集信息处理信息存储信息管理信息检索信息传输 EDPS 这一阶段从20世纪50年代初商业界第一次用计算机处理工资单 财务报表 账单等开始 此系统中 数据的采集 编辑 加工 输出等一系列处理都是严格地按照事先给定的步骤进行的 系统目标与决策无直接关系 其目的仅是为一个部门处理和获取有关数据 因而是一种纯数据处理系统 MIS 设想最早出现于1961年 到了20世纪70年代初 以数据库 数据通信为基础 以方法库 模型库应用为特点的管理信息系统得到了发展 是一个人机结合的辅助管理系统 面向管理 具有系统管理信息的功能 可以通过信息流对管理活动进行有效的协调 约束和控制 可以辅助并优化决策 但仅限于结构化的管理问题 DSS 美国学者莫顿于20世纪70年代初首次提出 其特点是重在 支持 而非决策工作的自动化 ES 研究 研制与开发活动始于20世纪80年代中期 用于处理那些通常需要经验和专门知识才能解决的问题的信息系统 涉及的问题领域如复杂的诊断 计划安排 预测 监督与控制和数据分析与解释等 OAS 利用现代信息 管理科学和行为科学 对各类办公信息进行采集 加工 存储和交换的 具有办公室自动化系统 管理信息系统和决策支持系统等综合功能的人机系统 MMIS 多媒体技术问世于20世纪80年代中后期 在90年代得到了迅猛发展 作为数据库技术和多媒体技术集成之结果的多媒体信息系统 近年来颇为引人注目 成为广受重视的研究和开发领域 在信息资源管理中作用信息系统是现代信息资源管理思想的物化形式改变信息资源管理的理念拓宽信息资源管理的领域提高信息资源管理的效率促进信息资源管理的科学化和规范化 6 1 2信息系统的开发和建设 基本方法生命周期法原型设计法面向对象的系统开发方法 生命周期法 发展演变在生命周期法的基础上发展起来的 它产生于20世纪70年代 是目前应用得最普遍的一种开发方法 所谓生命周期法 就是按照信息系统生命周期的概念 严格地按照为系统生命周期的各个阶段规定的步骤去开发系统 开发步骤 系统规划 系统分析 系统设计 系统实施 系统运行和维护 原型设计法 主要特点 与生命周期法比较 不注重对信息系统的全面 系统的详细调查与分析 而是本着系统开发人员对用户需求的理解 与用户共同确定系统的基本要求和主要功能 接着在强有力人 软件环境支持下先快速实现一个初始模型系统 原型 然后反复修改来实现系统 开发步骤 面向对象的开发方法 基本思想客观世界是由各种各样的对象组成的 每种对象都有各自的内部状态和运动规律 不同对象之间的相互作用和联系构成了各种不同的系统 在设计和实现一个客观系统时 在满足需求的条件下 可以将系统设计成由一系列对象构成 所谓对象是一些不可变的 相对固定 部分组成的最小集合 即对象 通过这样的分析 再用面向对象的程序设计语言来实现系统 开发步骤 程序实现 系统调查和需求分析 分析问题的性质和求解问题 整理问题 信息系统建设 管理背景信息系统投入正式使用后 就进入了系统运行与维护阶段 这个阶段的工作是做好系统的正常管理维护工作 保证信息系统正常 可靠 安全地运行 并不断完善系统 以增强系统的生命力 延长系统的生命周期 提高系统的管理水平和经济效益 为了能使系统高效顺利的运行 需要必要的组织保障 对系统运行情况进行记录 做好系统的日常维护工作 系统建设的组织保障 硬 保障 硬 保障是物理设备的保障 软 保障 软 保障则是要减少人为因素对系统的损害 主要通过一些规章制度来实现 系统日常运行管理 系统运行情况的记录记录的内容是每天计算机的运行 应用系统的使用 数据备份 存档等情况 审计踪迹 AuditTrail 审计踪迹是指系统中设置了自动记录功能 能通过自动记录的信息发现或判明系统的问题及其原因 应急措施的落实为了减少意外事件对信息系统的损害 首先要制定应付突发性事件的应急计划 系统服务及维护 硬件维护定期的设备保养性维护突发性故障维修软件维护正确性维护适应性维护完整性维护预防性维护数据维护 6 1 3信息网络 内涵 指各种信息系统所构成的信息网络体系以及为了支持这个网络体系有效运转所需要的网络标准 通信协议 操作规程 传输编码等 分类 按网络的拓扑结构分类 分为 环形网络 星形网络 树形网络 总线形网络和复合型网络等 按网络的地域范围分类 可分为国际 国内 地区等 按网络的用途分类 可分为军用信息网 民用信息网 或者综合信息网 专业或行业信息网等 按网络的传输速度分类 可分为高速信息网和中低速信息网 6 2信息资源的布局和共享管理 信息资源的布局信息资源的共享 信息资源的布局 信息资源的布局是指信息资源在时间 空间和数量三个方面的有效配置 时间上空间上数量上 信息资源配置的对象应当面向宏观国民经济的运行 调配包括信息资源在内的物质资源 人力资源 管理资源 金融资源等各种资源 以保证整个社会的信息产出数量和产出结构优化 从横向看 它应考虑产业配置和行业配置 从纵向上看 它应包括信息的生产 扩散 组织 交换 利用的全过程 资源的横向配置反映为部门 行业或地区之间的宏观布局 1 信息资源的区域配置 信息生产应优先考虑选择在在经济技术发达的地区投入资源发展信息生产 2 信息资源的行 产 业配置 信息资源行 产 业配置在宏观上表现为信息产业在整个国民经济投入产出中的比重 在微观上则表现为信息产业内行业和部门间的资源配置 信息资源的纵向配置是指只有符合资源增殖的投资项目 才能吸引资源的流入 信息资源的横向与纵向配置是互为条件 互相影响的 信息资源配置理论研究的根本任务不是对实际的信息资源配置提供一个简单的调整方案 而是要构造一种优化配置的机制 信息资源配置的特性l层次性 2动态性 3渐进性 信息资源布局的目标和原则 目标 在一种由多个信息系统相互连接而形成的信息网络中 从网络整体需要出发 进行信息资源布局 通过网络内各信息系统的协调合作 逐步形成一个互通有无 互相补充 方便用户的信息资源结构体系 从而在有限的客观条件下 利用群体优势 以尽可能小的投入发挥尽可能大的网络中各类信息资源的整体效益 布局原则 l 满足需求原则 2 系统性 完整性原则 3 合作性原则 4 一致性原则 影响信息资源有效配置的因素市场竞争和价格体系信息资源管理立法管理体制信息资源使用者情况技术条件 信息资源的市场配置 信息资源的市场配置是通过市场机制对信息生产的自组织过程实现的 它表现在5个方面 1 市场可以减少信息生产的不确定性影响2 市场能自动地使企业 个人甘冒创新风险 为信息生产提供动力3 市场通过价格信号引导信息生产4 市场竞争的压力迫使企业不断创新5 市场制度有助于培育创新的主体 企业家 市场可以减少信息生产的不确定性影响 市场机制则允许多个企业为某一新产品进行竞争性的研究开发 从实际效果上看 这种做法的效率往往更高 这是因为多路并进 有助于尽快找到正确的途径 其次 技术争先会形成一个竞争性的环境 从而刺激信息生产效率的提高 市场能自动地使企业 个人甘冒创新风险 为信息生产提供动力 信息生产的风险是明显存在的 但另一方面也有巨大的吸引力 在纯粹的计划体制中 缺乏有效的激励机制 市场通过价格信号引导信息生产 市场把信息生产成功与否的裁决权交给消费者 这既达到了使信息生产服务于消费者目的 又达到了引导信息生产的目的市场竞争的压力迫使企业不断创新 在市场体制下 技术水平低 创新能力差的企业会自动被市场淘汰 企业不创新就等于自杀 市场竞争的压力迫使企业不断创新市场制度有助于培育创新的主体 企业家 熊彼特所说的企业家 是创新的组织者 当我们把目光投向实际的信息资源配置时至少有2个重要的问题是我们所必须正视的 1 一般均衡假定不能成立2 信息活动是一种特殊的经济活动 1 并非所有的信息活动都是直接面向市场的 2 一部分信息服务 如图书馆服务 是作为公共物品免费提供给公众的 政府决不能因为不赚钱就关掉所有的图书馆 3 信息产业是一种 体系性产业 在宏观信息资源配置的问题上 市场机制的作用是有限的 必须由政府直接参与并主要依靠政策引导和政府直接投入来保障信息产业的投入产出总量水平 6 2 2网络环境中的信息资源布局 在全球信息资源网络中定位 在全国信息资源网络中定位 6 2 3信息资源共享面临的问题 传统的信息资源共享研究主要从两个方面来解决 一是考虑信息资源在地理区域上的合理布局和配置来实现最大限度的共享 二是通过信息提供者之间的合作来实现资源共享 但到目前为止 我国信息资源共建共享发展仍极为缓慢 面临的问题 信息安全问题国家主权问题知识产权问题语言障碍问题 从个体利益出发的行为往往不能实现团体的最大利益 同时也揭示了个体理性本身的内在矛盾 从个体利益出发的行为最终也不一定能真正实现个体的最大利益 甚至会得到相当差的结果 信息机构信息资源共享本来可以使每个加盟信息机构增加得益 从而提高整个社会信息资源的经济效率 同时 信息共享程度越高 信息机构得益也越大 但在共享中 每个信息机构都试图给予对方较少的信息而增加自己的得益 结果使采取共享的信息机构的利益得不到保障 基于此 我们认为促进信息资源共享要从以下几方面努力1 建立长期预期和信誉机制 以形成信息机构信息资源共享 这是信息机构信息资源达成共享的基础 2 减少共享成本 共享成本的降低意味着共享效率的改进 所以对不必要的共享成本应该尽量消除 3 设计激励制度 由于信息机构之间的利益不平衡 拥有资源多的大型信息机构不愿与资源少的小型信息机构共享 以及信息资源共享普遍存在着 搭便车 的现象 这就需要设计激励制度 6 3网络环境中的信息资源管理 组织方式有四种 文件方式 数据库方式 主题树方式和超媒体方式 6 3 1网络环境中信息资源的组织 文件方式 简单方便 Internet提供了诸如FTP一类的协议来帮助用户利用那些以文件形式保存和组织的信息资源 但文件方式只能是网络信息资源管理的辅助形式 或者作为信息单位成为其他信息组织方式的管理对象 数据库方式是当前普遍使角的网络信息组织方式 能处理大量数据 但缺乏灵活易用的界面机制 主题树方式提供了一个基于树浏览的简单易用的网络信息检索与利用界面 但不适合建立大型的综合性的网络资源系统 只适用建立专业性或示范性的网络信息资源体系 例如一些著名的搜索引擎工具 超媒体方式是因特网上占主流地位的信息组织方式 是利用超文本技术以更适合于信息的自然结构的方式来组织信息 能够充分表达各种信息之间内在的联系 让使用者能够方便 灵活地浏览 获取所需要的信息 网络环境中信息资源组织的技术手段 网络环境中信息资源组织的技术手段主要集中在通用标记语言和元数据 都柏林核心集 SGML StandardGeneralizedMarkupLanguage 是数据描述 数据模型化和数据交换的标准 是一种描述结构的模式语言 也是标识这些结构的置标语言 SGML是一个复杂的系统 就语言而言它是一种电子文献的格式 即标准结构化文献格式 或描述文献的一种计算机语言 HTML是SGML的一种简化应用 用于创建Web页和Web信息发布的第一个通用语言 它提供跨平台的文档共享 它有一个固定的SGML规范声明及相应的DTD 并且着重在如何将信息显示出来 而不是考虑如何将文件数据结构化 XML是SGML的一个子集 其设计目标是使SGML能够像HTML一样通过Web发送 接收与处理 它充分利用SGML特征并且简单易用 保留了SGML80 的功能 却使复杂度降低了20 XML文件可以独立于Internet存在 其平台无关性将对Web产生巨大的影响 2 元数据元数据是关于数据的有结构的数据 或者定义和描述其它数据的数据 它规定了数字化信息的组成 其基本功能在于规范数据组织 便于检索和传递 本质上说 元数据 Metadata 是一种数据结构标准 元数据概念最早起源于计算机科学 如数据字典 和图书馆界 如编目规则 机读目录记录格式 元数据在其他很多领域也已经有应用 如在地理界的应用相当成熟 并实现了标准化 元数据 Metadata 是随着因特网上海量和迅速增长的信息资源和传统的资源组织方式的局限性 而成为人们关注的焦点的 根据其功能 元数据可以被划分成三种基本类型 知识描述型元数据 用来描述 发现和鉴别数字化信息对象 如MARC等 结构型元数据 用来描述数字化信息资源的内部结构 比前者更侧重于数字化信息资源的内在的形式特征 如目录 章节 段落等特征 存取控制型元数据 用来描述数字化信息资源能够被利用的基本条件和期限 以及指示这些资源的知识产权特征和使用权限 3 都柏林核心元数据格式 DC DC元数据格式是通过举办一系列研讨会的形式发展起来的 第一次研讨会于1995年3月在美国俄亥俄州的都柏林举办 这些研讨会和会后相关的工作最终产生了由Weibel等人于1998年提出的一个精简的元数据集 都柏林核心元素集 DubilnMetadataCoreElementsSet 简称都柏林核心元数据 DC DC元数据所包含的三个大类十五个要素 可基本揭示信息资源的特征 第一大类为描述资源内容的要素 第二大类为描述知识产权的要素 第三大类为描述资源外部属性的要素 DC的创制为专业或非专业编目人员 网络信息创编者提供一个简单 实用而又有效的信息描述工具 DC元数据所包含的十五个要素 1 题名 Title 资源的名称 通常由创作者或出版者赋予 2 著者或创作者 AuthororCreator 对于创建资源的知识内容负有主要责任的个人或组织 如文献的作者 视觉资源的艺术家 摄影师或插图绘画者 3 主题词和关键词 SubjectandKeywords 表示资源主题内容的单词或词组 属于主题编目的范围 见下面的主题标引小节 4 描述 Description 资源内容的文本描述 如文献的文摘 视觉资源的内容描述等 5 出版者 Publisher 负责使资源能够以现有形式获得的实体 如出版社 大学里的部门或社团实体 6 其他贡献者 OtherContributor 在创作者 Creator 项中未指明的 对资源作出了重要贡献 但其贡献次于创作者项中指明的个人或组织所做的贡献的其他个人或组织 如编者 转录者和说明者 7 日期 Date 与资源的创建或可获得性相关的日期 8 资源类型 ResourceType 资源的种类 如网页 小说 诗歌 工作报告 技术报告 散文和词典 9 形式或格式 Format 资源的数据形式和尺寸 如大小 持续时间 可选择 10 资源标识符 ResourceIdentifier 用来唯一标识资源的字符串或数字 如URL和URN 11 来源 Source 有关另一资源的信息 当前资源源于该资源 12 语言 Language 资源的内容中所使用的语言 13 相关资源 Relation 另一资源的标识符及其与当前资源的关系 14 覆盖范围 Coverage 资源内容的空间或时间方面的特征 15 权限管理 RightsManagement 有关作品版权生命和使用方面的规范 DC的优点 鼓励作者和出版者以自动资源发现工具能收集的形式提供元数据 鼓励包含有元数据的模块的网络出版物工具的创造 DC生成的记录能作为更详细的编目记录的基础 所以 在数字化图书馆的信息发现 信息检索和信息组织诸方面 元数据都起着十分重要的作用 它为分布式数据发现和检索奠定了基础 6 3 2网络环境中信息资源检索的焦点 智能化搜索引擎 1 网络搜索技术的产生与发展1993年2月 Internet技术取得了突破性进展 第一个图形界面浏览器Mosaic的发布解决了远程信息服务中的文字显示 数据链接以及图像传递等问题 次年Netscape推出了Navigator 互联网成为了信息传递 交流的最有力的工具之一 随着网络技术的飞速发展和Internet的商业化 网上的信息几乎是呈指数级增长 单凭简单的浏览工具很容易迷失在信息的海洋中 需要一种在信息海洋中航行的导航系统 即搜索引擎 1994年春天 目录式搜索引擎出现并占据了主要地位 它依靠人发现网上的信息 由编辑人员对知识进行甄别和分类 用户可以利用这种分类结构进行浏览 但目录式搜索引擎还不是严格意义上的搜索引擎 目录检索系统数据量有限 更新不及时 成本较高 迫切需要一种全自动 大数据量的网络搜索工具 1994年夏天 以Lycos AltaVista Infoseek Excite为代表的第一代搜索引擎诞生 当时的数据量不到100万网页 检索响应速度相对比较长 在10秒以上 1995年12月第二代搜索引擎出现 以AltaVista和Inktomi为代表 它们拥有数据量已经达到5000万页网页 专门在后台提供搜索引擎技术和服务的专业化公司已经产生 G使用了超链分析与根据用户的点击行为来分析与重排序 搜索得到的结果相关性程度较高 而且比较符合用户的点击习惯 同年还出现了一种新的搜索引擎 元搜索引擎 1998年 第三代搜索引擎出现 以Google和百度为代表 Google提供一系列革命性的新技术 包括完善的文本对应技术和先进的PageRank排序技术 后者可以保证重要的搜索结果排列在结果列表的前面 2 按照搜索引擎提供的功能和使用的技术来分 目前Internet上的搜索引擎大致可以分成三类 1 一般搜索引擎 2 元搜索引擎 3 专用引擎 3 搜索引擎的结构 1 搜索器其主要功能是在互联网中漫游 发现和搜集信息 它通常是一个遵循一定协议的计算机程序 即蜘蛛程序 Spider 它日夜不停地运转 要尽可能多 尽可能快地抓取网页 搜集各类信息 在Internet中信息是用HTML语言描述的 不同的HTML页面通过其中所包含的超级链接互相联接 这些超级链接以URL UniformResourceLocator 信息资源的标准通用地址 的方式被表示出来 Spider程序从一个起始的URL集开始 顺着URL中的超链接 HyperLink 以宽度优先 深度优先或启发式方式循环地在互联网中搜集信息 2 分析器和索引器分析器即分析程序 功能是理解搜索器所搜索的信息 它通过一些特殊算法 从Spider程序抓回的网页源文件中抽取出索引项 索引项有形式索引项和内容索引项两种 形式索引项如作者名 URL 更新时间 编码 长度 链接流行度 LinkPopularity 等等 内容索引项是用来反映文档主题内容的 如关键词及其权重 短语 单词等等 内容索引项可以分为单词索引项和多词索引项 或称词组索引项 两种 单词索引项对于英文来讲是英语单词 比较容易提取 因为单词之间有天然的分隔符 空格 对于中文等连续书写的语言 必须进行词语的切分 还要给内容索引项赋予不同权值 以表明这些与网页内容的相关程度 以判断网页内容 3 索引器索引器将生成从关键词到URL的关系索引表 索引表一般使用某种形式的倒排表 InversionList 即由索引项查找相应的URL 索引表也可能要记录索引项在文档中出现的位置 以便检索器计算索引项之间的相邻关系或位置关系 Proximity 并以特定的数据结构存在硬盘上 索引器可以使用集中式标引算法或分布式标引算法 当数据量很大时 必须实现即时索引 InstantIndexing 否则不能够跟上信息量急剧增加的速度 标引算法对索引器的性能 如大规模峰值查询时的响应速度 有很大的影响 一个搜索引擎的有效性在很大程度上取决于索引的质量 4 检索器检索器的主要功能是根据用户输入的关键词 在索引器形成的倒排表中进行查询 同时完成页面与查询之间的相关度评价 对将要输出的结果进行排序 并提供某种用户相关性反馈机制 检索器常用的信息检索模型有集合理论模型 代数模型 概率模型和混合模型四种 5 用户接口用户接口的作用是输入用户查询 显示查询结果 提供用户相关性反馈机制 主要的目的是方便用户使用搜索引擎 高效率 多方式地从搜索引擎中得到有效 及时的信息 用户接口的设计和实现使用了人机交互理论和方法以充分适应人类的思维习惯 用户输入接口可以分为简单查询和复杂查询 高级检索 两种 简单接口只提供用户输入查询串的文本框 复杂接口可以让用户对查询进行限制 如逻辑运算 与 或 非 等 站点聚类 内容聚类 相近关系 相邻 NEAR 域名范围 如 edu com 出现位置 如标题 内容 信息时间 长度等等 4 当前搜索引擎发展面临的主要问题 网络信息量迅猛增加 人工无法对它们进行有效的分类 标引和利用 信息的有序化组织如何评价信息的有用性如何在速度和效率上进行仔细的权衡搜索对象主要是文本 能否有更多的图片 电影 音乐等如何将网络信息有序化 3 新一代智能搜索引擎研发方向 1 网络蜘蛛智能化 2 能为特定用户提供相关信息 3 搜索引擎人机接口智能化 课堂作业 1 在日常生活中 信息无处不在 为了更好地利用信息资源 通常要对信息资源进行较好的管理 不属于常见管理方法的是 A 数据库管理B 人工管理C 文件管理D 自然管理2 在日常生活里经常发生的事情中 不属于信息资源管理的是 A 每隔 段时间整理更新一次家里的电话号码本B 整理个人电脑中的资料 将不同类型的资料存放在不同的文件夹中C 用数码相机拍照片D 根据自己的喜好 整理浏览器中的收藏夹3 下列日常生活经常发生的事情中 不属于信息资源管理的是 A 为自己的研究资料建立数据库B 整理个人电脑中的资料 将不同类型的资料存放在不同的文件夹中C 用媒体播放器播放音乐D 整理手机中的电话号码簿 4 关于信息资源管理的方法的说法正确的是 A 人工管理 文件管理 数据库管理都有其适用的场合B 文件管理只能通过

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论