信息管理原理与方法 习题答案.docx_第1页
信息管理原理与方法 习题答案.docx_第2页
信息管理原理与方法 习题答案.docx_第3页
信息管理原理与方法 习题答案.docx_第4页
信息管理原理与方法 习题答案.docx_第5页
免费预览已结束,剩余32页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章 习题参考答案一名词解释信息 信息资源 信息化 信息管理 信息资源管理 数据 知识 CIO 信息的生命周期 企业信息管理师 信息管理学(1)信息信息分为“本体论层次信息”和“认识论层次信息”。本体论层次信息定义为事物运动的表征(即表现出来的特征),它包括事物内部结构和外部联系的状态及方式;认识论层次信息定义为主体所感知或表述的事物运动的表征。认识论层次信息包括事物运动表征的形式、含义和效用,借用语言学中的相应概念,分别称为语法信息、语义信息和语用信息。(2)信息资源信息资源(Information Resources)是经过人类开发与组织的信息、信息技术、信息人员要素的有机集合。信息资源既包括信息,又包括信息人员、信息技术及设施;而信息仅指信息内容及其载体。(3)信息化国内关于信息化的定义主要有三种代表性的观点:信息化是指信息技术和信息产业在经济和社会发展中的作用日益加强,发挥主导作用的过程。信息化主要有三个相互联系的方面:一是信息技术本身的发展及其产业化;二是基于信息技术的信息产业(包括信息设备制造业、信息传输业和信息服务业)的发展;三是信息技术手段在经济和社会领域中的广泛应用。这种观点是由科技界的专家提出来的,其意义在于把信息化按“技术-产业-应用”的逻辑表述出来,体现了通过高新技术的产业化和高新技术的应用,推动经济和社会发展的思路。信息化是指利用现代电子信息技术,实现信息资源高度共享,发掘社会智能潜力,推动经济和社会的优质发展。这种观点最初是由信息内容提供者提出的,其意义在于特别强调信息资源的开发和利用,认为信息化的本质是实现信息资源的高度共享,充分发掘社会智能潜力。信息技术的应用只是手段而不是目的,应用信息技术的目的是开发和利用信息资源,实现信息资源的共享,从而再通过“智能潜力”的提高,达到“优质发展”的要求。信息化的内涵包括两个方面一是利用信息技术改造国民经济各个领域,加快农业的工业化和工业的信息化进程。信息技术和信息产业不仅是国民经济的一个产业支柱,而且是一个“发动机”,可以推动其他产业部门的更新换代和现代化。二是利用信息技术提高国民经济活动中信息采集、传输和利用的能力,提高整个国民经济系统运行的生产率和效率,加强国民经济的国际竞争能力。这种观点的意义在于强调了信息手段的应用效用和价值。(4)信息管理信息管理(Information Management)是一个很宽、正在发展的概念,它一般存在两种基本理解。 狭义的信息管理狭义的信息管理认为信息管理就是对信息本身的管理,即以信息科学理论为基础,以信息生命周期为主线,研究信息的“采集、整理、存储、加工(变换)、检索、传输和利用”的过程。其目标就是要掌握信息的运动规律,并充分利用信息进行管理决策。 广义的信息管理广义的信息管理认为信息管理不单单是对信息的管理,还包括对涉及信息活动的各种要素,如信息、技术、人员、组织进行合理组织和有效控制。在广义的信息管理概念中,信息被当作一种资源,信息管理则包括信息资源的管理和信息活动的管理。在比较信息资源管理和信息活动管理之前,有必要先明确信息资源和信息活动的概念。(5)信息资源管理信息资源管理是为了确保信息资源的充分开发和有效利用,以现代信息技术等作为手段,对信息资源实施计划、组织、指挥、协调和控制的一种人类管理活动。(6)数据 知识数据(Data)是载荷或记录信息并使之按照一定规则排列组合的物理符号。它可以是数字、文字、图像、声音、视频数据,也可以是计算机代码。知识是信息接收者通过对信息的提炼和推理而获得的认识,是人类通过信息对事物运动规律的把握,是人的大脑通过思维重新组合的、系统化的信息集合。(7)CIOCIO是一个组织(企业或政府部门)中负责信息管理(包括信息技术系统,如计算机系统和通讯系统等)的战略策划、规划、协调和实施的高级官员,通过谋划和指导信息资源的最佳利用来支持组织的目标。(8)信息的生命周期信息的生命周期主要包括信息的收集、组织、存储、检索、传输、加工(变换)和利用七个阶段。(9)企业信息管理师企业信息管理师是指从事企业信息化建设,承担信息技术应用和信息系统开发、维护、管理以及信息资源开发管理工作的复合型人员。该职业共设三个等级,分别为:助理企业信息管理师(国家职业资格三级)、企业信息管理师(国家职业资格二级)、高级企业信息管理师(国家职业资格一级)。(10)信息管理学信息管理学是一门研究人类信息管理活动的规律及应用的学科。它研究如何科学地组织、管理信息资源和信息活动。信息管理学既是管理科学的一个重要领域,又是信息科学的一个重要分支。二填空1信息管理的基本职能包括计划、组织、指挥、协调和控制 。2信息管理学实用体系框架包括信息资源管理、信息技术应用 、 信息系统建设 、信息经济研究 。3信息管理的发展时期包括传统管理、技术管理、资源管理和知识管理。4信息管理学的源科学主要有图书情报学(包括图书馆学、情报学、档案学、文献学等)、管理学(包括管理信息系统、工商管理学、公共管理学)和信息科学(包括计算机科学、信息工程、软件工程、网络工程等)。三论述题1分析信息管理的含义。答:信息管理(Information Management)是一个很宽、正在发展的概念,它一般存在两种基本理解。 狭义的信息管理狭义的信息管理认为信息管理就是对信息本身的管理,即以信息科学理论为基础,以信息生命周期为主线,研究信息的“采集、整理、存储、加工(变换)、检索、传输和利用”的过程。其目标就是要掌握信息的运动规律,并充分利用信息进行管理决策。 广义的信息管理广义的信息管理认为信息管理不单单是对信息的管理,还包括对涉及信息活动的各种要素,如信息、技术、人员、组织进行合理组织和有效控制。在广义的信息管理概念中,信息被当作一种资源,信息管理则包括信息资源的管理和信息活动的管理。在比较信息资源管理和信息活动管理之前,有必要先明确信息资源和信息活动的概念。与管理的一般职能相同,信息管理也有计划、组织、指挥、协调和控制五个主要职能。2论述信息资源管理既是一种观念,也是一种模式。答:该时期的主要特征是涉及信息活动的各种要素都被作为信息资源的要素纳入管理的范畴,是一种综合性、全方位的集成管理,是信息管理的高级形式。在这个时期,“信息是个人、组织和社会生存与发展的战略资源”的认识正在成为共识,并指导人们的信息活动。信息是一种资源。这不仅是由信息本身的重要作用,而且是由信息量的快速增长所决定的。信息资源这个概念可以有两种不同的理解,即狭义的信息资源和广义的信息资源。前者是指信息本身,即经过加工处理的,有序的、有用的数据的集合。后者是指信息活动中各种要素的总称(包括信息、技术、设备、资金和信息生产者等要素)。本书采用综合的观点,认为信息资源是经过加工处理的、有序的、有用的数据以及各种信息活动要素的集合。信息资源管理(Information Resource Management,IRM)的概念最早是由霍顿(Horton)1979年提出的。信息资源管理作为管理科学中一种新的管理观念和模式,是随着人们对信息作为一种资源来管理的需求日益加强而产生的。3分析信息和信息资源的差别。信息是经过加工处理的,有序的、有用的数据的集合。信息资源是指信息活动中各种要素的总称(包括信息、技术、设备、资金和信息生产者等要素),它是经过加工处理的、有序的、有用的数据以及各种信息活动要素的集合。4论述信息管理的组织机构和信息管理的发展趋势。组织机构反映了组织中不同成员、不同部门之间的分工协作关系。信息管理的组织机构是实施信息收集、加工、存储、传递等有关信息管理活动的组织形式,包括情报所、统计局、图书馆及其他政府信息服务机构等非营利性信息机构和以咨询公司为代表的营利性信息机构,主要分为基于CIO的企业信息管理组织模式和基于CIO的政府信息管理组织模式。对信息管理的重视是从最近半个世纪开始的。回溯信息管理的历史发展,可以粗略地将其划分为传统管理、技术管理和资源管理三个典型的发展时期。现在,又提出了信息管理发展阶段的新假说,认为信息资源管理是信息管理发展过程中的一个时期,认为信息资源管理经历了传统管理阶段、技术管理阶段和资源管理阶段,目前信息管理正步入知识管理阶段。知识管理(起源于20世纪80年代)是在克服信息资源管理目前固有的局限性的基础上发展起来的。5分析信息化的内涵和我国信息化建设的发展状况。国内关于信息化的定义主要有三种代表性的观点:(1)信息化是指信息技术和信息产业在经济和社会发展中的作用日益加强,发挥主导作用的过程。信息化主要有三个相互联系的方面:一是信息技术本身的发展及其产业化;二是基于信息技术的信息产业(包括信息设备制造业、信息传输业和信息服务业)的发展;三是信息技术手段在经济和社会领域中的广泛应用。这种观点是由科技界的专家提出来的,其意义在于把信息化按“技术-产业-应用”的逻辑表述出来,体现了通过高新技术的产业化和高新技术的应用,推动经济和社会发展的思路。(2)信息化是指利用现代电子信息技术,实现信息资源高度共享,发掘社会智能潜力,推动经济和社会的优质发展。这种观点最初是由信息内容提供者提出的,其意义在于特别强调信息资源的开发和利用,认为信息化的本质是实现信息资源的高度共享,充分发掘社会智能潜力。信息技术的应用只是手段而不是目的,应用信息技术的目的是开发和利用信息资源,实现信息资源的共享,从而再通过“智能潜力”的提高,达到“优质发展”的要求。(3)信息化的内涵包括两个方面一是利用信息技术改造国民经济各个领域,加快农业的工业化和工业的信息化进程。信息技术和信息产业不仅是国民经济的一个产业支柱,而且是一个“发动机”,可以推动其他产业部门的更新换代和现代化。二是利用信息技术提高国民经济活动中信息采集、传输和利用的能力,提高整个国民经济系统运行的生产率和效率,加强国民经济的国际竞争能力。我国的信息化建设起步较晚,与世界发达国家相比,在许多方面还有不少差距。但改革开放以来,我国的信息业已经有了突飞猛进的发展。20世纪80年代中期,国务院批准了国家经济信息系统的建设。1993年12月,由中央24个部委参加的国家经济信息联席会议提出了“三金”工程(即“金桥”工程、“金卡”工程和“金关”工程),后来发展为“金”字系列工程,从而拉开了我国经济信息化建设的序幕。“金”字系列工程主要的工程名称及简称如表1.1所示。经过十多年的建设,多数“金”字工程已经开通并投入使用。“三金”工程和“金”字系列工程,加上各种专用网和公用网,构成了我国的信息高速公路,推动着我国全面信息化的进程。6分析基于CIO的企业信息管理组织模式。在国外,大部分企业都设有信息主管部门(Information Department,ID)。在国内,企业目前多数把ID这一职能挂在某一部门,比如厂办、企管办、信息中心、科研和技术部门、财务部门等。这种模式不利于充分发挥信息管理部门为企业的战略目标服务的职能。信息管理部门不应该是组织内部的技术、生产、销售、财务或人事等部门的附属机构,而应该是与它们并列的集技术与管理于一体的管理机构。既要把信息管理部门视为独立的管理机构,又不能把信息管理部门看作是计算中心、网络中心的名词更换,而应该赋予它信息管理的职能。规模比较大的企业都应设置独立的ID,设置专职工作人员来做这方面的工作。这个部门过去类似于一个管理部门,但现在是组织高层机构的直属部门,它由一个负责信息系统建设的信息化委员会来领导。企业信息管理的组织机构主要承担四个功能:信息汇总与收集; 信息管理与检索;信息分析与处理;信息协调与沟通。信息管理部门的领导人被称为信息主管(Chief Information Officer,CIO),也称首席信息主管或首席信息官。CIO是一个组织(企业或政府部门)中负责信息管理(包括信息技术系统,如计算机系统和通讯系统等)的战略策划、规划、协调和实施的高级官员,通过谋划和指导信息资源的最佳利用来支持组织的目标。第二章 习题参考答案一.名词解释(1)信息收集:信息收集就是信息的接收或汇集。它是指根据特定的目标和要求,将分散蕴涵在不同时空域的相关信息,通过特定的手段和措施,采掘和汇聚的过程。信息收集是信息处理过程的起点,并贯穿于信息处理过程的始终。(2)信息感知:信息感知,就其本身而言,它只是感受到了事物运动状态及状态变化方式的形式化方面,并不理解事物运动状态及其变化方式的逻辑含义和它的效用价值。因此,信息感知的输出结果只是语法信息,而不是语义信息或语用信息。(3)数据采集:信息传感一般是指通过物理手段收集信息,就是我们一般意义上的数据采集。(4)模式识别:基于语法信息的信息识别模型正是人工智能中模式识别理论所研究的基本问题。这里,所谓模式,就是某种事物运动状态及其变化方式的形式,即语法信息。因此,模式识别就是语法信息的识别。二.论述题1. 信息收集的原则是什么?有哪些常用方法?答:(1)信息收集的原则主要有可靠性原则、完整性原则、实时性原则、准确性原则和易用性原则。(2)信息收集的常用方法有调查法,观察法,实验方法,文献检索和网络信息收集。信息收集的方法还有查阅法、视听阅读法、集采法、联系法等2. 调查法有哪些方式?实验法有哪些形式?根据加工深度,文献是如何分类的?答:(1)调查方法一般分为普查和抽样调查两大类。普查是调查有限总体中每个个体的有关指标值。抽样调查是按照一定的科学原理和方法,从事物的总体中抽取部分称之为样本(Sample)的个体进行调查,用所得到的调查数据推断总体。抽样调查是较常用的调查方法,也是统计学研究的主要内容。抽样调查的关键是样本抽样方法、样本量大小的确定等。样本抽样方法,又称抽样组织的方式,决定样本集合的选择方式,直接影响信息收集的质量。抽样方法一般分为非随机抽样、随机抽样和综合抽样。对于个体的调查,若是涉及到人,则主要采用两种调查方式:访问调查法和问卷调查法。(2)实验方法也有多种形式,如实验室实验、现场实验、计算机模拟实验、计算机网络环境下人机结合实验等等。现代管理科学中新兴的管理实验,现代经济学中正在形成的实验经济学中的经济实验,实质上就是通过实验获取与管理或经济相关的信息。(3)文献根据加工深度的不同可分为四个级别:零次文献、一次文献、二次文献和三次文献。所获取的相应信息分别是零次信息、一次信息、二次信息和三次信息。零次文献是指未经出版社发行的或未进入社会交流的最原始的文献,如私人笔记、考察笔记等,内容新颖,但不成熟,不公开交流,难以获得。一次文献是以作者本人取得的成果为依据而创作的论文、报告等经公开发表或出版的各种文献,如期刊论文、科技报告等。其特点是内容新颖丰富、叙述详尽以及参考价值大,但数量庞大而且分散。二次文献是指报道和查找一次文献的检索工具书刊,如各种目录、题录、文摘和索引等。二次文献是按照特定目的对一定范围和学科领域内的一次文献进行鉴别、筛选、分析、归纳和加工整理等,使之有序化后出版的。其主要功能是检索、控制一次文献,帮助人们较快地获取所需的信息,具有汇集性、工具性、综合性和交流性等特点。三次文献是根据二次文献提供的线索,选用大量的一次文献的内容,经过筛选、分析、综合和浓缩而再度出版的文献,包括专题评述、年鉴、百科全书、词典、导读与文献服务目录、工具书目录等。3. 简述网络信息的收集系统的组成以及各部分的主要作用。答:组成见图2.2。各部分主要作用:网络信息搜索是基于网络信息收集系统自动完成的。网络信息搜索系统首先按照用户指定的信息需求或主题,调用各种搜索引擎进行网页搜索和数据挖掘,将搜索的信息经过滤等处理过程剔除无关信息,从而完成网络信息资源的“收集”;然后通过计算机自动搜索、重排等处理过程,剔除重复信息,再根据不同类别或主题自动进行信息的分类,从而完成网络信息的“整合”;分类整合后的网络信息采用元数据方案进行索引编目,并采用数据压缩及数据传输技术实现本地化的海量数据存储,从而完成网络信息的“保存”,当然要通过网络及时更新;经过索引编目组织的网络信息正式发布后,即可通过检索为读者提供网络信息资源的“服务”。网络信息收集系统是一个汇集了各种网络信息收集技术的计算机程序集成系统,其中主要采用了网页收集、网络信息挖掘和网络信息过滤等技术。4. 对信息源进行评价的方法有哪些?简述间接评价法的具体程序。答:(1)对信息源进行评价一般采用两种方法:一种是信息工作者根据对信息源的一般要求对信息源进行评分,这种方法称为直接评价法:另一种是调查信息利用者对各种信息源的利用情况或由信息利用者根据自己的实践需要来评价信息源,该方法称为间接评价法。(2)间接评价法的具体程序参见书本2.4.1章节。5. 对信息收集的效率如何评价?信息准确度的比较评价怎么进行?信息的经济性评价从哪些方面进行?答:(1)对于信息收集的过程,可以用收全率、收准率、及时率、费用率和劳动耗费等五个指标来衡量和评价其效率,这些指标一般通过信息内容与信息需求的相关程度(切题性或相关性的概念)来确定。(2)信息评价的另一个重要方面是比较评价信息的准确度,可以从两种角度来进行。第一种角度包括下面三种方法:从不同的信息源获得同一性质的信息,对这些信息进行比较;定期地、系统地收集信息,调查过去同种信息是否出现并和新获取的信息进行比较评价;从多种信息源搜集、分析同种信息和相关信息,与切题的信息进行比较评价。第二种角度是从信息所含的六个要素出发评价信息的准确度。任何信息都包含六个要素:内容(What)、原因(Why)、时间(When)、地点(Where)、人(Who)、状况(How),即“5W1H”。对信息进行比较评价时,要把信息分解成上述六个方面,其步骤大致如下:把信息分成六个要素,按要素分成不同的组;分析各组中有无共同点,把具有共同点的信息抽出来;将抽出来的具有共同点的信息要素构成信息形态;把组成信息形态的要素分别同原信息进行比较;根据比较结果,对被认为最有共同点的原信息做进一步调查检验,分析它与其他信息的相关程度、相关的交接点等。(3)为了经济而有效地搜集信息,可以从以下几个方面出发来进行信息评价:对所需信息存在率的评价:这一步要调查有关的信息源、载体、实物(产品等)是否存在,如果存在,要用什么方法从何种途径获得,评价获取的难易程度。对所需信息适合率的评价:评价获取的信息与所需信息的内容吻合程度。例如,解决问题的有效程度,为利用该信息而需要加工处理的必要程度等都是评价的尺度。 对所需信息可靠性的评价:对于二次信息和三次信息,应评价其性质、加工深度、是否能获得证明来确认其可靠性。此外,由于信息既可以传递某一事物或课题的全部内容,也可以传递部分内容,因此,根据其所处的位置便可评价信息的可靠性。6. 简述数据采集系统的基本功能和基本组成部分。答:数据采集系统的软件功能十分丰富,主要功能有(1)系统总貌。提供所有输入点信号的位号、名称、单位、当前指示值、上下限及有关说明;(2)流程图画面。显示过程对象带检测点的整个工艺流程图、动态显示各测点位置及当前值、各设备运行状态(如开停、超限等);(3)历史数据。存储并显示有关测量点在一定时间范围内的一定时间间隔的实时数据值;(4)历史趋势。存储并显示有关测量点在一定时间范围的变化曲线。相关参数曲线可同时在一幅画面上用不同颜色显示,即趋势分组;(5)量程分段及线性化处理。为提高显示精度,可将某些参数的量程分成数段,每屏一段,并可用软件方式对被测量过程进行线性化处理;(6)打印或通信。可实现定时或即时打印或通信。此外,根据用户要求,可编制其它管理和服务程序,如操作指导、统计分析等。数据采集系统的结构参见图2.6。7. 阐述模式识别的处理过程及各部分的主要功能。答:参见图2.8给出了模式识别的基本过程。对于非电量输入模式,首先必须先把它们转换成电信号,然后通过模/数转换,使之成为计算机能接受的数字量。为了使输入模式满足识别的要求,还要根据具体情况对模式进行预处理,如滤波、坐标变换、图象增强、边界检测等,以便滤除样品收集过程中掺入的干扰和噪声,并人为的突出有用信号,使模糊的模式变得清晰,以得到良好的识别效果。经过预处理后 ,要根据识别方法的要求对满足识别要求的模式进行抽取、选择特征和基元,作为识别的依据。这是模式识别的关键,对识别的效果有直接的影响,好的模式特征能使不同类别的模式表现出很大的差别,有利于设计出性能较高的分类方法。8. 模式识别有哪些主要方法?简述它们的主要特点。答:模式分类的方法大致可分为统计识别方法、句法结构方法、模糊判决方法和人工神经网络方法四大类。统计识别方法是从被识别的模式中选择能足够代表它的若干特征,每个模式的特征都组成一个特征向量,于是每一个模式就在特征空间中占有一个位置。可以用不同的方法来分割特征空间,使得同一类模式大体上都在特征空间的同一区域中。这样,对于待分类的模式,就可根据它的特征向量位于特征空间中哪一个区域而判断它属于哪一类模式。句法结构方法立足于分析模式的结构信息,可以把模式类比于语言中句子的构造。句子由单词按文法规则构成,同样,模式由一些模式基元按一定的规则组合而成。分析模式如何由基元构成的规则,就是结构分析的内容,这相当于对一个句子作句法分析。句法结构模式识别就是检查代表这个模式的句子,是否符合事先规定的某一类文法规则。如果符合,那么这个模式就属于该文法所代表的那个模式类。模糊判决方法以模糊数学为基础,是一种集合运算。对某模糊集合设计隶属度函数,作为样品与模板间相似程度的度量,从而将模糊集合划分为若干子集,然后根据就近原则分类。人工神经网络方法以神经生理学和神经心理学为基础,是一个模拟神经机理的非线性动态系统。它通过对样本的学习建立起记忆,然后将未知模式按其最接近的模式进行判别。这四类方法各有优缺点,但在图象识别中都得到了广泛应用。前两类方法发展得比较成熟,是研究模式分类的基础方法。模糊数学和人工神经网络应用于图象识别领域也取得了较大进展,拓宽了研究者的思路。三.讨论题信息收集还有哪些新技术(除了书本所介绍的技术外)?如何评价网络信息的价值?请举出实际例子。说明讨论题要求学生从其他途径,如查阅资料,上网等方式,结合实际具体例子解答。第三章 习题参考答案一、名词解释(1)信息组织:信息组织即信息的序化,是按照一定的科学规则和方法,通过对信息的外在特征和内容特征的描述和序化,实现无序信息向有序信息的转化。(2)主题法:在信息组织中,“主题” 是指信息所论述的主要对象,包括事物、问题、对象等。而经过选择,用来表述信息主题的词语,则称之为主题词。主题法是直接以表达主题内容的词语作检索标识、以字顺为主要检索途径,并通过详尽的参照系统等方法揭示词间关系的标引和检索信息方法。(3)叙词:叙词是信息组织的主题法中出现的一个词语,是指从自然语言中精选出来的、经过严格处理、作为文献主题标识的语词。(4)HTML:Hyper Text Markup Language,是一种用来制作超文本文档的简单标记语言。HTML语言通过使用各种标记(tags)来标识文档的结构以及超链(Hyperlink)的信息。用HTML编写的超文本文档称为HTML文档,它能独立于各种操作系统平台(如UNIX,WINDOWS等)。(5)XML:eXtensible Markup Language,XML是一种“语义标记语言”,它具有通过标记清晰地表达语义的能力。XML将信息的内容、结构和表示分开定义。XML文档存储数据本身,通过标记来组织数据内容。在网络环境下,XML的用途主要有两个:一是作为元标记语言,定义各种实例标记语言标准;二是作为标准交换语言,担负起描述交换数据的作用。(6)元数据:元数据(metadata)是“关于数据的数据”,是对数据进行组织和处理的基础,是用来描述数字化信息资源并确保这些数字化信息资源能够被计算机自动辨析、分解、提取和分析归纳的一种框架或一套编码体系。美国图书馆学会和存取委员会给元数据作出如下定义:元数据是结构化的编码数据,用于描述载有信息的实体特征,以便标识、发现、评价和管理被理解的这些实体。二、思考题1. 简述信息组织的含义和要求。答:信息组织即信息的序化,是按照一定的科学规则和方法,通过对信息的外在特征和内容特征的描述和序化,实现无序信息向有序信息的转化。信息组织可以帮助用户有效获取和利用信息以及实现信息的有效流通和组合。信息组织的要求如下:(1) 信息特征有序化。一是要将内容或外在特征相同或者相关的信息集中在一起,把无关的信息区别开来;二是集中在一起的信息要有系统、有条理,按一定标识呈现出某种秩序,并能表达某种意义;三是相关信息单元之间的关系要明确化,并能产生出某种关联性,或者能给人某种新的启示。(2) 信息流向明确化。现代管理科学的基本原理表明,信息作用力的大小取决于信息流动的方向。信息整序要做到信息流向明确化。首先,要认真研究用户的信息需求和信息行为,按照不同用户的信息活动特征确定信息的传递方向;其次,要注意根据信息环境的发展变化不断调整信息流动的方向,尽量形成信息合力。(3) 信息流速适度化。信息流速的不断加快使人们感受到巨大的信息压力,眼花缭乱的信息流可能会降低决策的效率。同时,人们面对的决策问题在不断地发展变化,信息需要也在不断地更新。为此必须适当控制信息流动速度,把握信息传递时机,提高信息的效用。2. 主题法的分类有哪些?答:在信息组织中,“主题” 是指信息所论述的主要对象,包括事物、问题、对象等。而经过选择,用来表述信息主题的词语,则称之为主题词。主题法是直接以表达主题内容的词语作检索标识、以字顺为主要检索途径,并通过详尽的参照系统等方法揭示词间关系的标引和检索信息方法。主题法的分类:(1)标题法:是一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。(2)元词法:是一种以元词作为主题标识,通过字面组配的方式表达文献主题的主题法。(3)叙词法:是以从自然语言中精选出来的、经过严格处理的语词作为文献主题标识,通过概念组配方式表达文献主题的主题法类型。(4)关键词法:是一种以关键词作为主题标识,通过字面组配或者概念组配的方式表达文献主题的主题法。3. 比较等级列举式分类法的类目划分与分面组配分类法的分面分析。答:等级列举式分类法主要是将所有的类目组成一个等级系统。从理论上说,这种分类体系可以不断递分下去直至不必再分的基本类。分面组配式分类法是在类目之间完全采用分面结构、将文献的内容分为若干个因素,从分面寻找相应的类号,并按照一定的次序将其排列组配成一个完整的分类号。如文献内容的分面可以从A主体因素、B通用因素、C空间因素、D时间因素、E文献类型因素来进行。4. 分析HTML和XML的关系。答:HTML是SGML的一个实例,它的DTD作为标准被固定下来,因此,HTML不能作为定义其它标记语言的元语言。XML是SGML的一个子集,严格地讲,XML也还是SGML。与HTML不同的是,XML有DTD,因而也可以象SGML那样,作为元语言,来定义其它文件系统。所以,XML的用途比HTML的用途更加广泛。如果把标记语言分为元标记语言和实例标记语言的话,XML是元标记语言,而HTML是实例标记语言。5. 简述HTML的基本结构。答:除了一些个别的标记外,HTML文档的标记都可嵌套使用。通常由三对标记来构成一个HTML文档的基本结构,它们是:头部信息文档主体,正文部分 其中在最外层,表示这对标记间的内容是HTML文档。之间包括文档的头部信息,如文档总标题等,若不需头部信息则可省略此标记。标记一般不省略,表示正文内容的开始。6. 什么是XML?它有什么特点?答:eXtensible Markup Language,XML是一种“语义标记语言”,它具有通过标记清晰地表达语义的能力。XML将信息的内容、结构和表示分开定义。XML文档存储数据本身,通过标记来组织数据内容。XML有如下特点:(1)简洁性;(2)创建标记的能力;(3)数据内容与数据显示相分离;(4)开放性;(5)高效性、可扩充性;(6)国际性。7. 举例分析XML文件的逻辑结构。答:逻辑上而言,XML文件由声明,元素,注释,字符引用和处理指令组成,所有这些都在文档中用显式标记指明。8. 举例分析元数据的格式。答:元数据的格式通过三层结构来定义:内容结构、句法结构和语义结构。内容结构(Content Structure),即对该元数据的构成元素及其定义标准进行描述。元数据一般有以下构成元素:描述性元素;技术性元素;管理性元素;复用元素。句法结构(Syntax Structure),即定义元数据结构以及如何描述这种结构,它包括元素的分区、分层、分段组织结构;元素结构描述方法,一般用XML DTD来定义;DTD描述语言;元数据复用方式。语义结构(Semantic Structure),即定义元数据元素的具体描述方法,包括三个层次: 元素定义; 元素内容编码规则定义; 元素语义概念关系。9. DC的元素有哪些?答:都柏林核心集包括15个元素,这15个元素可分为三个种类:内容、知识产权和实例化。有七个元素用于描述内容:Coverage、Description、Type、Relation、Source、Subject和Title。描述知识产权的元素共四个:Contributor、Creator、Publisher和Rights,开发者利用这些元素声明是谁创建并拥有资源,人们可以对这些资源做什么。实例化元素共四个:Date、Format、Identifier和Language。10. RDF的含义是什么?由哪些部分组成?答:RDF:Resource Description Framework,资源描述框架,是W3C组织于1999年颁布的。它的功能是利用当前存在着的多种元数据标准来描述各种网络资源,形成人机可读的、可以由计算机自动处理的文件。RDF的目标是建立一个供多种元数据标准共存的框架。RDF框架由三个部分组成:RDF Data Model、RDF Schema和RDF Syntax。Data Model形成对资源的形式描述;Schema定义描述资源时需要的属性类及其意义、特性;Syntax则把形式描述通过其宿主语言XML转换成机器可以理解和处理的文件。第四章 习题参考答案一、名词解释(1)信息存储:是指通过多种形式记录和排序信息的过程。它包含三层含义:一是将所采集的信息按照一定规则记录在相应的信息载体上;二是将这些载体按照一定的特征和内容性质组织成系统有序的、可供自己或者他人检索的集合体;三是应用计算机等先进的技术和手段,提高信息存储的效率和信息利用水平。(2)信息检索:是指从以任何方式组成的信息集合中,查找特定用户在特定时间和条件下所需信息的方法与过程。(3)数据仓库: Data Warehouse,是一个面向主题的(Subject Oriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策。(4)语义编码:语义编码就是用一组数字或字符描述客观实体或实体的属性。(5)语义网:是互联网研究者对下一代互联网的称谓,通过扩展现有互联网,在信息中加入表示其含义的内容,使计算机可以自动与人协同工作。也就是说,语义网中的各种资源不再只是各种相连的信息,还包括其信息的真正含义,从而提高计算机处理信息的自动化和智能化。(6)Ontology:本体,是共享概念模型的形式化规范说明。本体的概念包括四个主要方面:概念化:客观世界的抽象模型;明确:概念及它们之间的联系都被精确定义;形式化:精确的数学描述;共享:本体中反映的知识是其使用者共同认可的。二、简答题1. 简述信息组织、存储与检索的关系。答:信息组织、存储与检索三者是不可分割的。信息检索是通过信息存取系统(即检索工具)来实现的,任何一种信息存取系统都包括信息存储子系统和信息检索子系统,它们是同一事物中既相互对立又相互联系、互为依存的两个方面,而信息存取系统的建设,需要信息组织。信息组织在信息资源开发中具有重要的地位,在信息管理中具有承上启下的作用,它是建立信息系统的重要条件,是信息存储与检索的基础。所以,三者是不可分割的。2. 简述信息存储的含义及作用。答:信息存储是指通过多种形式记录和排序信息的过程。它包含三层含义:一是将所采集的信息按照一定规则记录在相应的信息载体上;二是将这些载体按照一定的特征和内容性质组织成系统有序的、可供自己或者他人检索的集合体;三是应用计算机等先进的技术和手段,提高信息存储的效率和信息利用水平。存储子系统的建设,要求根据一定的原则记录和描述信息或知识载体的内容与形式特征,然后按特征序化成各类信息集合并组织成系统。信息存储部分是揭示信息特征、整序信息、建设系统的过程。只有经过记录、描述与组织序化的知识集合,才能提供有效的信息检索。因此,信息存储是基础,信息检索是目的。3. 信息存储体系的内容是什么?答:本书描述的信息存储体系是指计算机信息存储体系。计算机信息存储体系是利用计算机对一定范围内的信息集合进行选择、记录、存储,以便用户采用科学手段和技术获取必要和充分信息资源的计算机信息系统。从整体上看,计算机信息存储系统包括硬件、软件和数据库。4. 简述数据仓库的特点及数据库与数据仓库的区别。答:数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。数据仓库的特点及数据库与数据仓库的区别如下: 面向主题,数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据是按照一定的主题域进行组织; 集成的,数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息; 相对稳定,数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新; 反映历史变化,数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息。5. 语义网由哪几层构成?每一层的含义是什么?答:理论界一致认同的语义网模型由以下几层构成:第一层:Unicode与URI,是整个体系结构的基础。其中Unicode负责处理资源的编码, URI负责资源的标识;第二层:XML+NS(Namespace)+ XML Schema。负责从语法上表示数据的内容和结构,通过使用标准的格式语言将网络信息的表现形式、数据结构和内容分离。第三层:RDF+ RDF Schema,它提供的语义模型用于描述网上的信息和类型。第四层:本体词汇层(Ontology Vocabulary)。负责定义共享的知识,描述各种信息之间的语义关系,揭示信息本身和信息之间的语义。第五层:逻辑层(Logic)。负责提供公理和推理原则,为智能服务提供基础。第六层证据层(Proof)和第七层的信任层(Trust)负责提供认证和信任机制。6. 简述Ontology与传统数据库的区别。答:本体可以用于描述比普通数据库更复杂的对象的语义结构,因此它很适合于描述异种的、分布的、半结构的信息资源,如网上的信息。本体模型与传统数据库的不同之处在于:(1)定义本体模型的语言比通常数据库所使用的语言在语义、语法上更加丰富;(2)本体模型所描述的信息是半结构化的自然语言文本而非列表式的信息;(3)一个本体模型必须使用用于信息共享和交换的公用的术语;(4)一个本体模型提供的是一个特定领域的知识模型而非数据容器的结构。7. 分析信息检索的分类以及信息检索系统的分类。答:信息检索根据检索的目的和对象不同,可以分为书目信息检索、全文信息检索、数据信息检索和事实信息检索。信息检索系统是拥有一定的存储、检索技术装备,存储经过加工的各类信息,并能为信息用户检索所需信息的服务系统。信息检索系统按使用的技术手段可分为手工检索系统、机械检索系统和计算机检索系统。8. 分析搜索引擎的原理及相关技术。答:搜索引擎(Search Engines)是指对WWW站点资源和其它网络资源进行标引和检索的一类检索系统机制。从广义上讲,搜索引擎应包括两部分:一是对信息的采集、存储和组织。二是信息检索。从狭义上讲,搜索引擎是针对用户而言的,即进行信息检索。其基本检索构成主要是从这一层面来进行描述的。主要由关键词检索和分类浏览两部分构成。一个搜索引擎由搜索器、索引器、检索器和用户接口四个部分组成。(1)搜索器,搜索器的功能是在互联网中漫游、发现和收集信息。(2)索引器,索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。(3)检索器,检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。 用户接口,用户接口的作用是输入用户查询、显示查询结果、提供用户相关性反馈机制。第五章 习题参考答案 1答:语义和语用信息是建立在语法信息的基础之上,有了语法信息,用户就可以从中获得相应的语义信息和语用信息。因此,信息传输所关心的是语法信息,而与信息的内容和价值无关。信息传输系统是为大量用户服务的,而用户的访问情况是随机的,各个用户所要传递的信息也是系统设计者事先无法预料的,再加上传输过程中出现的随机干扰情况等等。因此,信息传输需要考虑的,也不是一般的语法信息问题,而主要是概率性的语法信息问题。2答:信息传输的一般模型对基本模型中的变换和还原变换进行了扩展,另外考虑了信息传递过程中的安全因素,加入了加密与解密环节。3答:变换过程变换是指把要传输的信息从信源映射到某种物理载体上,在源事物的运动表征与载体的某种物理量之间建立恰当的映射关系的过程。这种映射关系必须能够还原,比如一一对应关系。这个变换的过程实际就是编码的过程,通过编码把消息变换成适合信道传输的信号。还原变换就是变换的逆过程。实际上就是译码,把信道输出的编码信号(已迭加了干扰)反变换为信息。一般认为这种变换是可逆的。4答:(1)0.469比特/符号 信源剩余度为53.1% (2)S的紧致码为: 平均码长为1码符号/信源符号 (3) 编码效率:0.469 码剩余度:53.1 编码效率:0.727 码剩余度:27.3 编码效率:0.880 码剩余度:12 编码效率:0.951 码剩余度:4.95答:设信源符号的概率分布为,并设及。 则,二元霍夫曼码为(00,01,10,11)的信源的所有概率分布必满足 二元霍夫曼码为(0,10,110,111)的信源的所有概率分布必满足 6答:(1)采用等长编码 编码设计为:00,01,10,11 码元/符号 (2)采用不等长编码(霍夫曼编码) 编码设计为:0,10,110,111 码元/符号 7答:申农第一定理 离散无记忆信源的N次扩展信源, ,其熵为,并有码符号集X, 。对信源进行编码,总可以找到一种编码方法,构成唯一可译码,使信源中每个信源符号所需的平均码长满足或者 它说明离散无记忆无噪声平稳信源存在有效的编码方法,人们可以通过这种编码来提高信息传输效率,而不会引起失真。 8答:二进制霍夫曼编码为(0,11,000,001,010,0110,0111) 平均码长为2.72二元符号/信源符号 编码效率为95.9第六章 习题参考答案1答:此码能检测出所有发生小于等于4位码元的随机错误,可以纠正所有发生小于等于2位码元的随机错误。采用择多译码的译码规则来计算,若,则译码错误的概率为。2答:(1)最小距离

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论