版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信息管理学基础信息管理学是信息管理与信息系统专业的一门专业基础课。信息管理的实践虽然源远流长,可以追溯到遥远的古代,但作为一门学科的信息管理则是现代计算机和通信技术广泛应用于人类信息活动各环节的基础上发展起来的新兴学科领域,这个领域年轻同时又极具活力。前言课程内容简介本书从人类社会信息过程出发考察信息管理活动,重点介绍和讨论了信息和信息管理的内容及特征,信息的交流传递,信息分布,信息获取,信息组织,信息检索,信息系统,信息服务,信息机构及其管理,信息政策与信息法律等方面的内容;同时结合网络及数字环境,讨论了信息管理具体领域在网络环境中的应用,以及所出现的新发展和新动向。前言1信息与信息管理1.1.1信息的概念早期对信息字面上的理解通信领域:有序程度的度量和负熵,用以减少不确定性生命科学领域:生命体中的信号科技领域:科学研究、技术创新、产业部门发展成果、行业研究报告、中外专利、标准等资源经济领域:企业、商品(价格)、顾客、市场等方面的信息哲学领域:事物的一种普遍属性1.1关于信息(1)本体论层次的信息
事物存在的方式和运动状态的表现形式。“事物”泛指存在于人类社会、思维活动和自然界中一切可能的对象。“存在方式”指事物的内部结构和外部联系。“运动”泛指一切意义上的变化,包括机械的、物理的、化学的、生物的、思维的和社会的运动。“运动状态”则是指事物在时间和空间上变化所展示的特征、态势和规律。1.1.1信息的概念(2)认识论层次的信息在认识论层次上,信息定义为:主体所感知或表述的事物存在的方式和运动状态。在本体论层次上,信息的存在不以主体的存在为前提。在认识论层次上,没有主体就没有信息。认识论层次的信息概念比本体论层次的信息概念具有更为丰富的内涵。首先,作为主体的人具有感知能力,能够感知到事物的存在和运动状态;其次,人具有理解能力,能够理解事物的存在和运动状态的特定含义;第三,人具有目的性,能够判断事物的存在方式和运动状态对其目的而言的效用价值。1.1.1信息的概念信息存在的普遍性和客观性信息产生的广延性和无限性信息在时间和空间上的传递性
信息对物质载体的独立性
信息对认识主体的相对性
信息对利用者的共享性
信息的不可变换性和不可组合性信息产生和利用的时效性1.1.2信息的特征按信息描述的对象划分,可分为自然信息、生物信息、机器信息和社会信息。按信息的性质划分,可分为语法信息、语义信息和语用信息。从利用者观察的角度和过程划分,可分为实在信息、先验信息和实得信息。按信息的传递方向划分,可分为纵向信息、横向信息和网状信息。按信息的内容划分,可分为经济信息、科技信息、政治信息、文化信息、政策法规信息、娱乐信息等等。1.1.3信息的分类按信息的作用来划分,可分为有用信息、无用信息和干扰信息。按信息的运行状态划分,可分为连续性信息、间隔性信息、常规性信息和突发性信息等。按信息的流通渠道划分,可分为正式信息和非正式信息。按信息的记录方式划分,可分为语声信息、图像信息、文字信息、数字信息和计算信息等。按信息的来源划分,可分为内部信息和外部信息(如组织内部、外部)等等。1.1.3信息的分类
数据是载荷或记录信息的按照一定规则排列组合的物理符号。它可以是数字、文字、图像,也可以是声音或计算机代码。人们对信息的获取只能通过对数据背景和规则的解读。背景是接收者针对特定数据的信息准备。
信息是数据载荷的内容,对于同一信息,其数据表现形式可以多种多样。
数据+背景=信息
1.1.4信息链中的
数据、信息与知识
知识是信息接收者通过对信息的提炼和推理而获得的正确结论,是人通过信息对自然界、人类社会以及思维方式与运动规律的认识与掌握,是人的大脑通过思维重新组合的、系统化的信息集合。从信息到知识的转化可表示为:
信息+经验=知识
知识的传输一般遵循如下模式:
传输者的知识→数据→信息→接收者的知识
1.1.4信息链中的
数据、信息与知识数据、信息和知识的包含关系及相互转化关系可以用图1-1和图1-2表示。1.1.4信息链中的
数据、信息与知识图1-1数据、信息和知识的范围数据信息知识1.1.4信息链中的
数据、信息与知识KDI经验(体验、学习)背景(认识、解读)表达(组合、排列)图1-2数据、信息和知识的相互转化1.2.1信息与物质和能量
物质、能量和信息是支配人类社会发展的三大基本要素,并称当代社会的三大支柱性资源。物质提供材料,能量提供动力,信息提供知识。如果没有物质,什么也不存在;如果没有能量,什么也不会发生;如果没有信息,任何事物都没有意义。同时,它们有着完全相似的生产、流通和分配过程。1.2信息化与信息社会1.2.1信息与物质和能量物质能量信息物质产品的生产、加工和分配领域·机器制造·化工产品·电子产品·建筑·农业生产︰能源的生产、加工和-分配领域·电能·热能·光能·核能·其他能︰信息的产生、加工收集、存贮和分配领域·市场信息·计划信息·金融信息·原材料信息·科学技术信息︰物质产品的生产、收集、存贮、加工和分配能源的生产、收集、加工、存贮和分配信息的产生、收集、加工、存贮和分配运输系统能源系统信息系统、通信系统表1-1物质、能量、信息在社会生产中的关系“信息化”的概念来源于日本。1963年,梅棹忠夫在其所著的《信息产业论》一书中首先向人们描绘了“信息革命”和“信息化社会”的前景。1967年,日本政府的一个科学、技术、经济研究小组依照“工业化”概念,正式提出了“信息化”概念——信息化是向信息产业高度发达且在产业结构占优势地位的社会(即信息社会)前进的动态过程,它反映了由可触摸的物质产品起主导作用向难以捉摸的信息产品起主导作用的根本性转变。1.2.2信息化
信息化在各国的发展美国:1993(NII),1994(GII),1996(NGI)……欧盟:信息化的特征:从工业社会转向信息社会日本:《日本信息技术基础设施建设新政策》,2001(“IT基本法”和“E-Japan战略”),2003(“E-JapanII战略”)……韩国:1996《信息化促进基本法》,1999“网络韩国21世纪”……1.2.2信息化
我国信息化的进程1993年底,我国经济信息化建设的协调和决策机构“国民经济信息化联席会议”在北京正式成立,确定“三金”工程是我国国民经济信息化建设的主体工程。2001年通过的十五计划纲要中,第一次明确提出了“三网融合”。2008年以后,三网融合进程加速。2010年1月,国务院总理温家宝主持召开国务院常务会议,决定加快推进电信网、广播电视网和互联网三网融合。2010年至2012年重点开展广电和电信业务双向进入试点,探索形成保障三网融合规范有序开展的政策体系和体制机制。2013年至2015年,总结推广试点经验,全面实现三网融合发展。1.2.2信息化信息社会与以前的社会形态相比,发生了一系列突出的变化,主要表现在:(1)信息、知识和智能是社会发展的决定力量;(2)信息技术、信息产业、信息经济成为科技、经济和社会发展的主导因素;(3)信息劳动者、知识阶层将发挥更大的作用;(4)由于信息技术在资料生产、科研教育、医疗保健、企业和政府管理以及家庭中的广泛应用,从而对经济和社会发展产生了巨大而深刻的影响,从根本上改变了人们的生活方式、行为方式和价值观念。1.2.3信息社会1.3.1信息管理的概念及对象1.3信息管理概述图1-3人类社会信息过程信息流考察人类社会信息过程,当信息生产出来(产生)之后,便要流向特定的利用者,于是在信息生产者和利用者之间形成了源源不断的“流’,即信息流。信息流一般经由两条渠道从生产者流向利用者,一条渠道是信息由信息生产者直接流向信息利用者,另一条渠道是信息在信息系统的控制下流向信息利用者。前者称为信息传递的非正规渠道,后者称为信息传递的正规渠道。1.3.1信息管理的概念及对象信息管理的概念
信息管理(狭义)就是对信息本身的管理,即采用各种技术方法和手段(如分类、主题、代码、计算机处理等等)对信息进行组织、控制、存贮、检索和规划等,并将其引向预定目标;
信息管理(广义)不单单是对信息的管理,而是对涉及信息活动的各种要素(信息、人、机器、机构等)进行合理的组织和控制,以实现信息及有关资源的合理配置,从而有效地满足社会的信息要求。1.3.1信息管理的概念及对象信息管理的对象社会信息现象是普遍存在着的,人类信息管理活动的范围也是十分广泛的。并且,随着信息管理活动的发展,信息管理的规模不断扩大,信息管理的对象也愈益复杂,信息管理的对象归纳起来主要包括信息资源和信息活动两大方面。1.3.1信息管理的概念及对象(1)信息管理的目标----总目标信息管理的总目标为:保证社会信息流在不同渠道中有序流动,信息的开发和利用在有领导、有组织的统一规划和管理下,协调一致、有条不紊地进行,使各类信息以更高的效率、效能,更低的成本在国家社会进步、经济发展、人民物质文化生活水平提高中充分发挥作用。1.3.2信息管理的目标和任务(1)信息管理的目标----分目标信息的生产与开发分目标。主要是根据社会经济的发展来合理组织、规划信息的生产和开发,确保相关的潜在信息能及时地、经济地转化为现实的信息资源,供人们使用。信息利用分目标。主要是按照社会化、专业化和产业化的原则合理组织信息的流通和分配,确保信息能得到充分有效的利用。信息管理机制分目标。按照社会信息过程的特征和规律,建立科学、合理的信息管理机制,完善信息开发利用的保障体系。1.3.2信息管理的目标和任务(2)信息管理的任务----宏观层次上宏观层次的信息管理主要是宏观层次上通过国家有关政策、法规、管理条例等来组织、协调信息的生产和开发利用活动,使信息按照国家宏观调控的目标,在不影响国家信息主权和信息安全的前提下得到最合理的开发和最有效的利用。1.3.2信息管理的目标和任务(2)信息管理的任务----宏观层次上的具体任务(1)制定信息开发战略、策略、规划、方针和政策(2)制定信息管理的法律、规章和条例,建立信息管理的监督和保障体系(3)综合运用经济、法律和行政手段协调各部门、各地区和各企业之间的关系,明确各级信息开发利用机构的责、权、利界限(4)加强国家信息基础设施和网络建设1.3.2信息管理的目标和任务
(2)信息管理的任务----微观层次上
微观层次的信息管理是在最基层的组织一级上对信息的管理活动,一般由各级政府部门、信息机构和企业等基层组织负责实施。其主要任务是认清组织内各级各类人员对信息的需求,合理组织和开发信息,向他们提供,实现信息的效用价值。1.3.2信息管理的目标和任务(2)信息管理的任务----微观层次上的具体任务(1)调查和了解组织或机构内部各类人员信息需求,制定一个满足不同需求的折中方案(2)搞清组织或机构内外信息来源和信息获取渠道(3)选择适用信息技术,建设组织或机构内部信息系统和网络,确定信息加工处理、存贮、检索和传递方法,建立组织或机构内部的高效信息保障体系。(4)对信息管理的绩效进行评价1.3.2信息管理的目标和任务从技术角度,信息管理主要研究用手工方式和计算机方式(当前主要是计算机网络方式)对信息进行收集、加工、处理,使之有序化存贮、便于快速检索并传递给特定的利用者从经济角度,主要研究以信息的生产、流通和利用为基础的信息市场,信息产业、信息经济的形成、发展、特征和运行模式,信息资源的优化配置,信息技术的评价选择以及信息经济效益评价等方面的问题。1.3.3信息管理的视角从行政和法律角度,立足于政府职能,运用行政手段(政策、计划、规划)和法律手段,对信息活动进行调节和控制,着眼于协调和解决社会信息化过程中出现的新矛盾、新冲突、新的利害关系,促进社会更充分地利用信息,更好地发挥信息的社会功能,为实现某种发展目标服务。从人文角度,立足于研究信息流控制中的道德、伦理、文化因素的影响和建设。尤其是在网络环境下,人们的信息行为仅仅依靠行政和法律手段是难以有效约束的,必须通过人文精神的培养来规范人们的行为,对信息活动进行管理。1.3.3信息管理的视角“信息生命周期”(InformationLifeCycle)是信息运动的自然规律。在信息生命周期基础上衍生出来的信息生命周期管理(InformationLifeCycleManagement,ILM)不仅是某种或几种软硬件产品,而是一种结合了人员、流程和技术,旨在有效管理数据和信息的战略。确切的说,信息生命周期管理是一种信息管理模型,对信息进行贯穿其整个生命周期的管理,从创建到使用到归档和处理,它是一种针对信息主动管理的过程策略,其宗旨在于保证信息传播的连续性。1.3.4信息管理流程:
信息生命周期管理(ILM)图1-4信息生命周期管理的六个阶段图1-5信息流通过程1.3.4信息管理流程:
信息生命周期管理(ILM)
追溯信息管理的历史沿革,我们可以将其划分为四个典型的阶段:传统管理阶段技术管理阶段资源管理阶段知识管理阶段1.4信息管理的沿革与发展
这一阶段以信息源管理为核心,以图书馆为象征,同时也包含档案管理和其他文献资料管理。文字的产生图书馆便应运而生。图书馆引入管理的概念出现科技信息机构。“源”管理向“流”控制过渡。1.4.1传统管理阶段这一阶段以信息流的控制为核心,以计算机为工具,以自动化信息处理和信息系统建造为主要工作内容。计算机实现对文献信息流的控制。管理信息系统(MIS)的诞生和发展。决策支持系统(DSS)和专家系统(ES)国际大型联机信息检索系统迅速发展微型计算机的发展1.4.2技术管理阶段
两个背景:技术管理阶段纯粹的技术手段不能实现对信息的有效控制和利用;当代社会经济发展使得信息成为一种重要的资源
定义:信息资源管理是信息管理的一种延伸和发展,是用技术、经济、人文对信息进行管理的产物,也是从经济学资源配置和管理中高层战略需求的角度对信息活动进行资源性质的管理。1.4.3资源管理阶段认识框架相近的主题概念发源领域,管理特征基本功能与目标
传统框架图书馆管理、文献工作图书馆文献管理、手工管理信息保存网络框架图书馆网络、信息基础结构标准化图书馆、通讯基础设施管理信息社会传播微观框架数据处理(DP,EDP、ADP)、信息处理、数据库办公事务、统计操作、事务管理信息有序系统框架信息系统、MIS计算机技术管理信息社会服务应用系统政策框架信息政策、信息法律知识产权法律、技术政策人文管理协调、控制资源框架信息经济、信息资源管理(IRM)工商行政管理集成管理、经济管理信息战略利用1.4.3资源管理阶段表1-2信息管理不同框架的比较信息资源管理的局限性:①仅关注显在知识的管理而忽略隐性知识的管理,大大限制了管理范围和信息管理效能的发挥②仅关注人类智力劳动的最终成果而忽略学习与创新过程,不能实现全方位的信息管理。③仅关注将信息提供给利用者而对利用者需求信息重视不够,限制了信息效用价值的实现。④仅关注信息在组织内部的免费流动而忽视信息的增值问题,影响了组织对信息的评价。1.4.4知识管理阶段知识作为组织资产的重要性在20世纪80年代中期逐渐被人们认识到,而“知识管理”一词出现于1989年。20世纪90年代中期,随着互联网的普及和应用,知识管理迅速推广。知识管理的前提:信息及信息系统的准确性、及时性、可用性,并能够以易于利用的方式提供信息。知识管理的实质:将结构化与非结构化的信息与人们利用这些信息的规则联系起来。知识管理的主要目标:改善组织或机构获取、共享和利用知识的能力。1.4.4知识管理阶段
第1章为本教材的导论章节,介绍了信息的概念、特征、分类,并从信息链的角度分析了数据、信息和知识等相关概念及其之间的关系;将信息化和信息社会作为信息管理的社会背景,对相关问题进行了讨论;阐述了信息管理的概念、对象、目标和任务,分析了信息管理的多重视角,结合信息生命周期管理的阶段对信息管理流程作了简要介绍;最后讨论了信息管理的沿革及发展阶段,对不同阶段的产生、阶段特征、管理任务、内容和方法、以及阶段之间的关系进行了详细考察。本章内容提要
本章的重点包括:结合实际的应用领域。认识和理解信息、信息管理等基本概念信息管理研究及实践的多重视角,及不同视角的特点信息生命周期管理的思想及方法信息管理的发展历程及阶段划分本章重点2信息交流信息交流是信息管理领域研究的核心内容,其研究主要集中在信息交流的模式与特征、信息交流用户行为与心理分析等方面,并对作为信息交流对象的信息内容本身有着深切的关注。现代通信技术与网络技术从根本上改变了人类社会的形态结构,也对信息交流活动产生了深刻的影响。信息交流的每一次革新,都为社会带来了巨大的变革,也对信息管理活动带来了新的研究课题和研究空间。2信息交流2.1.1信息交流的分类信息交流与传播是人类社会和自然界中最普遍的现象,只要宇宙间有事物的存在和运动,就有相应的信息产生,就会伴随着信息的交流与传播。我们可以将信息交流划分为下列几种形式:2.1信息交流的基本概念传统上理解的信息交流是在同一时间平面上实现的,是一种横向交流或共时交流,亦即此时此地或此时彼地的交流。传统理解的缺陷:仅仅在同一时间平面即横向去理解信息交流是不够的,还必须在不同的时间平面上,从纵向去考察人类社会的信息联系即历时信息交流,才能全面理解人类社会信息过程,科学地实施信息管理。当前的定义:信息交流是指不同时间或不同空间上的认知主体(人或由人组成的机构、组织)之间借助于相应的符号系统所进行的知识、消息、数据和事实等信息的传递与交流的过程。2.1.2信息交流的含义与特征2.1.2信息交流的含义与特征信息交流共时交流(消除空间障碍)历时交流(消除时间障碍)交流手段互联网、传真、电话、电报、广播、电视、邮政、身势、旗语、钟、鼓、灯、烽火、口语、实物等刻制光盘、拷贝磁盘、录音、录像、照相、绘画、文献、档案、古迹、文物、口语等图2-1信息交流的手段和媒介图2-2共时交流与历时交流的关系2.1.2信息交流的含义与特征信息交流过程的特点信息交流过程,必须有一个信息传递者(Sender,简称S),他是信息的初始来源,实际上是信息生产者;一个信息接收者(Receiver,简称R),他实际上是信息的最终利用者。信息交流实质上是一种单向传递。当我们分析交流过程时会发现,信息的流动永远是S流向R,是一种时间不可逆过程。信息交流还必须是交流双方的目的行为,即S与R均是故意要传递与接收信息。若仅有一方故意,则不属于信息交流行为。也就是说,R有信息需求,S有目的地提供。2.1.2信息交流的含义与特征图2-3信息交流与认识过程
信息交流实质上涉及两个最基本的概念:“信息”与“交流”,信息交流过程涉及的都是人的主观信息,对于信息发送者S和接受者R而言,都有一个主观信息客观化、客观信息主观化的过程。认知过程,这是信息获取和生成的前提,任何人都是通过客观信息来认识世界的,其主观信息是客观信息的映射或反映。信息输出(表出)过程,即人脑内部的信息通过人的行为转化为外部信息。2.1.3信息交流行为2.1.3信息交流行为人的行为目的行为信息行为非信息行为非目的行为潜意识状态下的行为对于S来说,根据人的行为目的性的特点,我们可以将人的行为分为目的行为和非目的行为,目的行为又可依其与信息交流的相关性分为信息行为和非信息行为。信息行为包括言语、书写、身势等,非信息行为包括如体力劳动、机器操作等。我们可以对人的行为划分如下:对R而言,其行为同样也包括目的行为和非目的行为两种。目的行为也可分为信息行为和非信息行为,如听、读、触、味、嗅等过程均和信息吸收密切相关,是信息行为;体力劳动、机器操作等虽然与信息有关,但不是以吸收信息为目的,所以称为非信息行为。综合S、R的信息交流行为,可以得出下列关系:2.1.3信息交流行为信息交流行为输出行为接收行为书写、言语、实物样品、绘画、符号特征等(S行为)阅读、艺术品欣赏、电话、电视收听收视等(R行为)(1)信息发送者,也称信息传递者或信息生产者,是信息的初始来源,信息传递链上的初始环节。(2)信息接收者,或称受信者,是信息的最后接受者或利用者。(3)交流通道,即信息达到受信者所经过的渠道。对于S和R而言,发送和接受信息的基本通道是交流双方的感官系统,包括视觉、听觉、味觉、嗅觉、触觉等。其他通道或技术系统仅仅是这些感官通道的扩展、延伸或变换。2.1.4信息交流的条件和要素(4)符号体系,信息传递交流时依附的载体。它包括语言、文字、手势、表情、信物、烽火狼烟、旗语、计算机语言等,同时还包括这些符号体系内部各符号元素之间互相联系与组织的方式及规则。(5)知识信息库,人脑知识信息的总称,包括人所创造的各种知识或信息,是信息交流的最根本来源和最终极的归宿。(6)支持条件,信息交流得以实现的保障。它包括:①自然条件,如光、声、电、空气在传导信息时的作用;②技术条件,包括各种通讯技术、存贮、处理技术等等;③社会条件,即信息交流的社会保障体系,如法律、政策等。2.1.4信息交流的条件和要素2.2.1香农-维弗的通讯模型
1949年,信息论创始人、美国数学家香农(C.E.Shannon)与维弗(W.Weave)为解决机器间信息互换在当年的《通讯的数学理论》中提出了著名的通讯模型。2.2信息交流的模式图2-4Shannon-Weave的通讯模型该模型把信息交流描述成一种单向的线性过程,整个过程由五个环节构成。信源负责发出要传递的信息,此信息会经编码器编码而采用与所经渠道相适应的信号形式到达解码器,解码器的功能与编码器相反,它将接收到的信号还原为信息并发送到交流的目的地,即信宿。噪音指一切传播者意图以外的、对正常信息传递的干扰。2.2.1香农-维弗的通讯模型图2-4Shannon-Weave的通讯模型1948年,美国政治学家哈罗德·拉斯韦尔(HaroldLasswell)在其发表的《传播在社会中的结构与功能》一文中,最早以建立模式的方法对人类社会的传播活动进行了分析,提出了著名的“5W”模式,即用五个问题的回答来描述传播行为,分别是谁(who),说了什么(says
What),通过什么渠道(inWhichchannel),对谁(toWhom),取得了什么效果(withWhateffect)。“5W”模式界定了传播学的研究范围和基本内容,影响极为深远。2.2.2拉斯韦尔的5W模式图2-5拉斯韦尔5W模式美国著名传播学家威尔伯·施拉姆(WilburSchramm)在1955年发表的论文《传播如何得以有效进行》中提出了信息交流的三个模式。第一个模式与Shannon-Weave的通讯模型十分相似(如图2-6(a)所示)。2.2.3施拉姆模型图2-6施拉姆模型(a)2.2.3施拉姆模型第二个模式中,施拉姆把交流的简单模式推进为一个比较复杂的模式。他指出,两个试图交流的个人必须积累有相当的共同经验,即在信源和信宿之间,只有在其共同的经验范围之内才真正有所谓的交流,因为只有这个范围内的信号才能为信源和信宿所共享(如图2-6(b)所示)。图2-6施拉姆模型(b)第三个模式中,施拉姆模式又进一步发展成一个表明人类交流的两个个体之间有相互作用的模式。按照施拉姆的观点,信息交流双方都必须将想要表达的意义制成代码,传递给对方,同时须将对方传送来的信息译码并作出解释以产生意义。通过信息的传送与反馈,个体之间形成了信息互动。从这个意义上说,信息交流过程就是一个循环往复、不断反馈的过程。这个模式也被称为施拉姆“循环模式”(如图2-6(c)所示)。图2-6施拉姆模型(c)2.2.3施拉姆模型此外,施拉姆还提出了能充分体现大众传播特点的“大众传播过程模式”,认为构成传播过程的双方分别是大众传播与受众,二者之间存在着传递与反馈关系(如图2-6(d)所示)。图2-6施拉姆模型(d)2.2.3施拉姆模型S-C-R模式是英国信息学家BrainC.Vickery和AlinaVickery提出的关于信息交流和传递的模式。信息交流就是从信息从信息源出发,经由各种渠道和媒介,而后传递到信息接收方的过程。从形式上看,S-C-R模式的三个要素分别对应于通讯模型中的信源-信道-信宿。而与通讯模型的机器信号传递相比,S-C-R模式强调的是人本社会传播,涉及到许多人文因素,如社会地位和认知对个人吸收信息的影响等。2.2.4维克利的S-C-R模式图2-7维克利的S-C-R模式20世纪中叶,美国社会学家H.门泽尔(Menzel)从载体角度对信息交流过程进行了系统的研究,提出了著名的“正式过程”和“非正式过程”交流模型。在这种模型下,社会中的信息交流被分为正式交流和非正式交流两种基本形式。这一理论经前苏联情报学家、教育家А.И.米哈依洛夫整理,得到了广义的科学交流系统模式。这种模式将科学交流分为正式交流和非正式交流。2.2.5А.И.米哈依洛夫广义的科学交流系统模式2.2.5А.И.米哈依洛夫广义的科学交流系统模式正式过程非正式过程个人接触图2-8广义的科学交流系统2.3.1社会信息流的形成社会信息流是一种普遍存在的社会信息现象,是信息从生产者S,经过或不经过其他社会环节,最终转移到利用者R的流动过程。文字产生之前的口语时代,人类只能在看得着、听得见的有限范围内面对面地交流。文字和各类符号的出现,信息存贮技术和传输技术的发展,信息的传播突破了时空的限制。人类的信息需求和利用不断趋向社会化、综合化、多样化,社会信息流变得越来越复杂。2.3信息交流机制2.3.2信息交流与传播中的栈一个信息链:上图中节点可以进行信息的存贮、转换、处理、传递,称为“信息栈”。信息栈(以W表示),是信息从S向R流动过程中所经过的环节。S与R的直接交流则可称之为“零栈交流”。其余可以称之为“栈交流”。图2-9著者到读者信息流S与R之间的信息交流可图示如下:2.3.2信息交流与传播中的栈图2-11信息传播的栈模式信息栈的特征与职能根据信息栈W的功能特征将其分为时间栈和空间栈。时间栈主要实现信息的时间传递,有档案馆、博物馆、图书馆、美术馆、文献中心等;空间栈主要实现信息的远距离传递,有新闻、报纸、互联网、邮政系统、广播电视等。2.3.2信息交流与传播中的栈信息栈的职能从S或前栈获取信息,并加以处理、转换、存贮、积累和选择;对R或后栈传递信息。信息栈虽然经常被R当成直接信息源,但实质上它仅仅是信息交流中的一个节点,其真正的信息来源是分散于各个时代、各个地区的信息生产者S,他们是社会信息的初始来源。信息中心、图书馆、数据中心等的职能只是信息传递的社会机制。2.3.2信息交流与传播中的栈信息交流分为直接交流(零栈交流)与间接交流(栈交流),直接交流是由S、R直接完成信息传递。而间接交流由于交流者双方(S,R)无法直接实现,信息交流需要在人与人之间完成。信息交流中的社会代理(或中介)是指信息交流双方(S或R)在信息交流过程中由于无法直接将信息传递给另一方(R或S),于是将信息交流行为转移到社会中的信息栈,由信息栈代理S或R来传递交流信息,从而完成信息交流。信息栈被称为代理者(A),栈交流被称为社会代理交流。2.3.3直接交流与社会代理交流直接交流与社会代理交流的比较(1)直接交流的媒介系统是纯自然的和客观的,没有社会因素的介入;而社会代理交流则是借助于社会系统的介入才完成的交流。直接交流生动、直观、反馈迅速、时间间隔短;而社会代理交流则没有这些特征。(2)直接交流中,源信息(即S提供的信息)或需求信息(R提出的信息)是直接沟通的,信息内容不会受到社会系统的干预和控制;而社会代理交流的源信息和需求信息均需由A代理,由于表述与转换因而常常发生变化。许多专职的社会代理信息机构比较严谨,直接交流则具有较大的随意性。2.3.3直接交流与社会代理交流直接交流与社会代理交流的比较(3)S—R直接交流都是共时交流,而社会代理交流既有共时交流,又有历时交流,历时交流又有回溯式和未来式两种,其信息传递的时间范围及空间范围都比较大,且能有效地对S、R进行匹配。(4)直接交流是S—R关系,社会代理是S—A—R关系(5)当A出现多级代理时,根据其传递性特点,可以将与其直接联系的一次代理视为全部代理。2.3.3直接交流与社会代理交流信息交流中的交换过程信息交换过程是指信息自S流向R,而R则以相应行为对S予以回报的过程。(1)S—R式。信息直接从S流向R,S与R直接完成交流,这种交流回报可以是经济式的,也可以是社会式的。(2)S—A—R式。在S(A)—R传递中,R只与A联系,而A与R的联系既可以是经济式也可以是社会式的,它们之间的联系独立于S—A的关系。同样在回报关系上,S—A中S所获的回报来自于A,而A又从R获得回报,R所给予的回报可以传递、也可以不传递给S。虽然信息具有传递性,且是S→R,但回报却不具备传递性,而且往往是滞后的传递。2.3.3直接交流与社会代理交流(1)多向主动传递
多向主动传递是S或A针对整个社会的需要将自己生产或收集到的信息主动传递给事先未确定的接收者(R)。(2)单向主动传递
单向主动传递是S或A将信息传递给事先确定的接收者(R)(3)多向被动传递
多向被动传递事先也没有确定的接收者,是A面向整个社会开展的信息服务,也称为无向被动传递。(4)单向被动传递单向被动传递主要指由S或A开展的信息咨询服务,这种信息传递也称为有向被动传递。2.3.4信息传递模式2.4.1网络信息交流的兴起网络作为一种新兴的信息载体,与传统的载体相比,具有许多不可比拟的优势,主要表现在:①网络的传播与更新速度快,提供了最快捷、最便利的传播方式;②信息量大,内容丰富;③检索方便,便于保存;④超文本和多媒体的结合,丰富了网络信息内容;⑤交互性强,这是网络媒体最独特的特征之一,用户可以及时获取信息以及其他用户的回应和反馈,形成双向交流。2.4网络应用:网络信息交流根据中国互联网络信息中心(CNNIC)发布的《第26次中国互联网络发展状况调查统计报告》,截至2010年6月,我国网民主要网络应用使用行为主要包括信息获取、交流沟通、网络娱乐、商务交易四大类。可以看出,以网络工具为媒介的信息交流呈高速增长,除了电子邮件、论坛等传统方式外,以博客、社交网站为代表的新型交流方式正日益受到人们的青睐。2.4.1网络信息交流的兴起表2-1各类网络应用使用状况及用户增长(1)网络信息交流模式该模式中,信息用户分为四种:①网络信息的生产者②网络信息发布者③网络信息执行者④网络信息使用者将网络信息交流过程分为三个阶段:信息产生阶段信息交流阶段信息接收阶段。2.4.2网络信息交流的模式及特点图2-12网络信息交流模式(2)网络环境下的正式交流与非正式交流和传统信息交流不同,网络环境下无论是正式信息交流还是非正式信息交流,都是以网络载体为媒介,信息的存在和传输形式都是基于网络,他们之间载体的界限被模糊化,因而对二者的定义和类别划分需要进行新的分析,可以从以下两个方面来展开。2.4.2网络信息交流的模式及特点网络信息交流的来源:①来自于传统正式交流渠道的信息②网络原创信息网络信息交流的实现途径:①web发布类②网络搜索引擎③电子邮件类④BBS论坛类⑤实时交互类网络环境下非正式交流相对于传统非正式交流,具有一些明显的优势:第一,网络非正式交流可以不受时间和空间的限制,更加方便,大大提高了交流的效率。第二,网络非正式交流的间隔时间更短,交流更迅速、更快捷,可非常方便地以实时方式与同行进行切磋交流。第三,网络非正式交流的成本更低。与此同时,网络信息的可信度、网络安全问题、网络非正式交流方式使用的普及度等也是网络非正式交流需要解决的问题。2.4.2网络信息交流的模式及特点(3)网络信息交流中的栈我们把网络信息交流所需要的载体、使用工具和平台,统称为网络信息交流的中介。根据中介对信息交流内容控制程度的不同,可以将其划分为纯技术型中介、内容选择控制型中介和内容完全控制型中介。与之相对应,可将网络信息交流分为零栈交流、准栈交流和有栈交流。2.4.2网络信息交流的模式及特点短信QQBlogRSS开放存取专业网站门户网站电子出版物数据库发行商数字图书馆纯技术型中介内容选择控制型中介内容完全控制型中介零栈交流准栈交流有栈交流交流类型中介类型图2-13网络信息交流中的中介与栈(1)Web2.0的涵义及特点Web2.0的核心理念可以归结为它所包含的三大文化,即自由、开放和共享。Web2.0代表了未来互联网的发展,其带来的是理念上的发展,具有去中心化、开放与分享、共同参与创作、自组织协同性、可再混合性等独特属性。2.4.3Web2.0环境下的信息交流2.4.3Web2.0环境下的信息交流表2-2Web2.0和Web1.0的比较
Webl.0Web2.0发展时间1993年-2003年2003年以来应用基础操作系统浏览器或桌面软件模式阅读的网络,被动的接受信息读写的网络,主动参与创作奉献信息传播目的满足尽可能多的用户的共同需求满足尽可能多的用户的个性需求信息交互方式网站对用户群体、内容的P2P互动传播内容形式静态网页动态的发布,记录浏览方式浏览器浏览器、RSS阅读器等,加上很多通过Web分享的其他内容,更加互动,更像一个应用程序而非一个网页体系架构客户/服务器体系(Client/Server)Web服务体系内容创作者网页创作设计人员任何人话语权主导者技术精英阶层草根,大量业余人士网络增值基点信息加工服务深化(2)Web2.0的交流工具及应用Web2.0是一个新时代,也是一个信息交流的新环境,它的时代精神就是开放和沟通。在这个新的交流环境里,其工具应用主要有Blog(博客)、Podcasting(播客)、RSS(阅读器)、Wiki(维基)、Tag(标签)、SNS(社会性网络服务)等。2.4.3Web2.0环境下的信息交流(3)Web2.0对网络信息交流的影响
作为一种新的交流环境,Web2.0对网络信息交流产生了明显的影响,主要表现在:第一,信息源主体的改变。第二,信道的多渠道和反馈机制的复杂化。第三,信息交流中的信源由个体走向群体。2.4.3Web2.0环境下的信息交流移动信息交流是在移动网络兴起和发展下的一种新兴的信息交流方式。移动网络是指从可连接到无线网络的移动设备(如智能手机、平板电脑等)上使用互联网连接的应用程序或基于浏览器访问互联网。移动网络的特点主要表现在:(1)持续的网络连接性。(2)位置感知。(3)交互功能。2.4.4移动信息交流通过移动网络,用户可实现的具体的信息交流应用包括:E-mail、短信、语音通话、下载或在线体验音乐/视频、在线游戏、下载软件、即时通信、移动社交网络、移动搜索(包括多媒体搜索、本地搜索、购物搜索、二维码搜索)、移动博客等。截止2009年8月底,中国手机上网用户为1.81亿,手机上网用户整体呈现稳定增长的趋势。2.4.4移动信息交流2.4.4移动信息交流图2-14手机上网应用的用户规模本章内容提要本教材是从人类社会信息过程出发来考察信息管理活动,在第1章导论章节之后,第2章对人类社会信息交流活动进行了概观性的介绍,包括信息交流的含义、分类、信息交流需要具备的条件和要素;通讯、政治学、传播学、信息学、社会学等不同领域视角下的信息交流模式;重点分析了信息交流中的栈、直接交流和社会代理交流等信息交流机制方面的问题;最后专门对网络环境下信息交流进行了讨论,包括网络信息交流的模式及特点、以及Web2.0下的信息交流、移动信息交流等新动向。
本章的重点包括:1、信息交流需要具备的条件和要素;2、信息栈的含义及功能;3、有信息栈参与的社会代理交流的特点,及其与直接交流(无信息栈参与)的比较;4、网络信息交流的特点,及其与传统信息交流的比较。本章重点3信息交流本章先以文献信息为对象,从纵向(随时间变化的分布动态)和横向(在不同载体和领域的分布状态)来研究信息分布的特征和规律,介绍一些文献信息分布的主要经典定律。在此基础上,对网络环境下信息资源的分布进行初步的探讨。3信息分布3.1.1马太效应的表现和作用形式核心趋势高产作者群体的形成期刊信息密度增大高频词汇的确立集中取向一篇论文多次被引一个网站被众多用户点击3.1信息产生与分布中的
马太效应信息分布的富集现象突出重点、摒弃平均,为信息源的选择、获取、评价和利用提供依据,降低信息管理成本,提高信息利用效益。核心信息源忽略分布在其他信息源中有价值的信息马太效应青睐名人、拒绝新人的习惯势力限制了新思想、新知识和新信息的产生及传播3.1.2马太效应的负面影响信息的离散分布是信息的重要属性,它表现为信息的内容单元以不同方式从不同角度分布于各种载体中,信息的离散分布具有复杂的机理,本质上是由信息的生产和利用决定的。3.2 信息内容的离散分布规律布拉德福发现,某一学科领域中的相关论文在期刊中的分布是不均匀的,而且具有明显的集中与分散规律。他在长期的观察和统计基础之上,提出了有名的“布拉德福分散定律”(Bradford’sLawofScattering)布拉德福定律的区域表述形式:如果将科学期刊按其刊载某个学科主题的论文数量,以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的‘核心’部分和包含着与核心部分同等数量论文的随后几区,这时核心区和后继各区中所含的期刊数成1∶a∶a2的关系(a>1)。3.2.1布拉德福定律表3-1应用地球物理学论文的布氏分布3.2.1布拉德福定律如果横坐标取期刊按载文量递减排列时的顺序号n的对数,纵坐标取1至n号期刊所载论文的累积数,我们将绘制出的曲线称为布拉德福分散曲线。BR(n)DNLogenR(N’)COAR(N)n1R(n1)N’图3-1布拉德福分散曲线3.2.1布拉德福定律布拉德福分散曲线由三部分构成,先是一段上升的曲线AC,然后是一段直线CB,最后是下垂的曲线。B.C.布鲁克斯用下述模式来表示布拉德福定律:布拉德福定律有两个基本要点:一是频次等级排序,形成主体来源(期刊)的有序目录;二是确定相关论文在主体来源中的分布规律。具体方法则包括区域分析和图形描述,虽然两者数值并不相等,但它所揭示的都是论文在期刊中的分散规律。
布拉德福定律主要揭示的是宏观层次的信息(文献)离散分布,而对于微观层次的信息(内容单元)分布的研究则基本上是空白。3.2.1布拉德福定律如果将一篇较长文章(约5000字以上)中每个词按其出现频次递减排列起来(高频词在前,低频词在后),并用自然数给这些词编上等级序号,出现频次最高的为1级,其次为2级……这样一直到D级,如果用f表示词在文章中出现的频次,用r表示词的等级序号,则有:
式中c为常数。上式称为齐夫定律。3.2.2齐夫定律如果建立f与r的直角坐标系,用纵坐标表示词的等级序号,横坐标表示出现频次,就得到一条双曲线。如果等级r与频次f都取对数,则双曲线变成一条直线。与之等价的数学表达式为:3.2.2齐夫定律RfLgrLgf140005.9922000.695.3031331.104.8941001.384.605801.614.386661.794.197581.944.068502.083.919442.203.7810402.303.69表3.2词频分布3.2.2齐夫定律f25020015010050300r132564LgfLgr图3.2齐夫词频分布曲线图3.3齐夫词频对数分布分布曲线图中的虚线表示理想化形式,一般地,斜率为b的任一直线可表示为3.2.2齐夫定律信息生产者在信息生产过程和生产结构中呈现何种规律,这种规律对信息分布有何影响,这是一个意义重大而又很难的课题。本节将以科学信息的生产为基础来研究和回答这一问题。3.3信息生产者分布规律
1926年,统计学家洛特卡经过大量统计和研究,在美国著名的学术刊物《华盛顿科学院学报》上发表了一篇题名为“科学生产率的频率分布”的论文,旨在通过对发表论著的统计来探明科技工作者的生产能力及对科技进步和社会发展所作的贡献。3.3.1洛特卡定律洛特卡选择美国《化学文摘》和德国奥尔巴赫《物理学史一览表》为数据源研究科技工作的论著数量分布。他统计分析了《化学文摘》1907~1916年10年累积索引中的部分作者,即姓氏以字母A和B开头的6891位作者。分别列出发表过1篇、2篇,一直到346篇论文的人数。《物理学史一览表》包括了1900年前物理学领域内出现的1325位物理学家及其论著,取其全部数据进行统计。3.3.1洛特卡定律洛特卡以论文数(x)和作者数(yx)的对数为横坐标和纵坐标(即logx和logyx)作图,两组数据都是直线(如图所示)。图中虚线表示《化学文摘》数据,实线代表《物理学史一览表》的数据。用最小二乘法计算拟合直线的斜率,近似为-2。LogyxLogx10532151253010020图3-4洛特卡分布曲线3.3.1洛特卡定律根据洛特卡分析,在论文数x和作者数之间存在下列关系:式中,
是发表了论文x篇的作者数,n和c是对应于这一典型数据集合而估计出来的两个常数,n的数值在2上下波动。通过变换可以得到下面的公式:3.3.1洛特卡定律令,实际表示写x篇论文的作者出现的频率.是新的常量,表示作者取样总数比例,这样可以写成:两边积分得:
于是,C=0.6079=60.79%3.3.1洛特卡定律按照平方反比分布,所有生产一篇论文的著者的比例刚刚超过60%。例如在《物理学史一览表》数据中,共有1325名作者,写一篇论文的为784人,占总数的59.2%。如果取绝对数,则可表述为:生产2篇论文的作者大约是生产1篇论文作者数的(即)生产3篇论文的作者大约是生产1篇论文作者数的(即)生产n篇论文的作者大约是生产1篇论文作者数的3.3.1洛特卡定律在某一特定领域中,全部论文的半数系由该领域中全部作者的平方根的那些人撰写的。该定律可表示为:
(3-13)
式中,n(x)为撰写x篇论文的作者数;I=nmax为该学科规定时期内最高产的作者数;N为该学科领域全部作者总数。m可由下式确定:
(3-14)
3.3.2普赖斯定律研究信息在时间轴上的动态分布规律可以揭示信息的增长与老化,用科学高效的理论模型来刻画信息随时间的推移所表现出来的趋势,把握信息量的变化,对信息实施动态管理。3.4 信息对时间的分布规律(1)普赖斯曲线如果我们以文献量为纵轴,以历史年代为横轴,把各不同年代的文献量在坐标图上逐点描绘出来,然后以一光滑曲线连接各点,则可十分近似地表征文献随时间增长的规律。这就是著名的普赖斯曲线。3.4.1指数增长律F(t)1001019001950t1665100001000180017501850图3-5普赖斯曲线
通过对曲线分析,普赖斯最先注意到文献增长与时间成指数函数关系。如果用F(t)表示时刻t的文献量,则指数定律可表为下式:…………(3-22)式中:a是统计的初始时刻(t=0)的文献量;
e=2.718;b表示持续增长率。
人们还常常用文献量翻一倍的时间来衡量文献的增长速度,即…………(3-23)式中:t′为文献量翻倍时间,b为持续增长率。3.4.1指数增长律实际的统计发现,不同时期、不同级别、不同质量、不同学科领域的文献信息增长态势是不一样的。勒希尔考察了不同质量级别的文献增长状况,发现它们的增长速度差别很大。勒希尔认为,文献的数量与其质量有关。他定义λ(0≤λ≤1)为文献的质量级别,则不同级别上的文献量为[F(t)]λ。他给λ的具体值如下:λ=1:至少是一般文献(实际代表所有文献)λ=3/4:至少是有意义的文献λ=1/2:至少是重要的文献λ=1/4:至少是非常重要的文献λ=0:第一流的文献对于第一流的文献(即λ=0),文献数量为lnF(t)。
3.4.1指数增长律(2)生长曲线
普赖斯指出,考虑物质的、经济的、智力的及时间的影响和限制,文献信息的增长更趋近于生物的生长曲线(LogisticCurve),即最初生长或繁殖很快,随着时间推移,其生长速度越来越慢,以致几乎不增加了。其方程为:
……(3-24)式中:F(t)代表时刻t的文献量,k为文献增长的最大值。3.4.1指数增长律F(t)tK/2Lna/kb图3-6生长曲线3.4.1指数增长律一般来说,在不同的阶段科学文献增长的态势是不同的。学科处于诞生和发展阶段,文献量指数增长,文献的寿命较短。学科进入相对成熟阶段,文献增长就不能总保持原有的指数速率,增长率变小,曲线变得平缓,文献寿命相对变长。某一知识领域的研究取得重大进展后进入相对成熟的阶段。内容上更新的文献又将进入一个新的急剧增长时期(如指数增长)。然后又进入一个稳定时期。文献的增长往往会出现几个急剧增长时期和几个相对稳定时期,呈现出错综复杂的格局。一般说来,对不同的领域,描述其文献增长的生长线中各个常数(a,b和k)也是不相同的。3.4.1指数增长律
利用指数曲线和生长曲线来研究文献增长、预测未来文献总量必然会有局限。这是因为:①指数增长定律的产生,首先是普赖斯分析研究物理学文献数量的增长时提出的,然后把这一结果扩大到科学期刊和其他类型的出版物上,绘制了普赖斯曲线。把对文献某一方面、某一历史阶段的研究成果,推广到文献的全部领域,根据是不充分的。②利用上述二曲线对文献增长所作的预测,依据的是预测学中的趋势外推法。文献作为传播信息这一复杂系统中的子系统,其增长规律受到许多因素的影响和制约,只有利用系统论的观点对其作系统分析,才能得到比较符合实际的结果。3.4.1指数增长律文献老化的表现
文献信息的老化一般指这样四种情形:文献中所含信息仍然有用,但现在已被包含在更新的其他论著中;文献中信息仍旧有用,但现在正处于一个人们对其兴趣下降的学科文献中的信息仍旧有用,但为后来的著作所超越信息不再有用文献半衰期所谓文献的半衰期,是指某学科领域现时尚在利用的全部文献中的一半是在多长一段时间内发表的。3.4.2逐渐过时律普赖斯指数
普赖斯指数,即某一学科领域内,对发表年限不超过5年的文献的引用次数与总的引用次数之比值。一般来说,普赖斯指数越大,半衰期就越小,文献老化的速度越快。3.4.2逐渐过时律
用纵坐标表示现在正被利用(引证)的文献的被引量,横坐标表示时间,我们可以绘制出文献的老化曲线。相应的方程可表示为:
C(t)=ke-at
………(3-26)式中:C(t)表示发表了t年的文献的被引次数,k是常数,随学科不同而异,a为老化率。被引证次数C(t)0.5出版年龄tt1t2t3图3-7文献信息老化曲线3.4.2逐渐过时律文献老化的影响因素
(1)文献增长。文献的增长和老化是一个事物的两个方面,它们从不同的侧面来描述科学的发展,阐明科学知识的修正率。(2)学科差异。世界上93%~98%的科学杂志引用寿命为20年左右,但并不是所有这些学科的文献老化速率都大体一致,相反,彼此之间差异甚大。(3)学科发展阶段的差异。即使是同一学科,不同的时期或阶段,文献的半衰期不尽完全相同。(4)信息环境和需求。不同信息用户对文献的需求是不同的,因而信息利用者的需求及所处的信息环境的研究十分必要。3.4.2逐渐过时律在本节中,我们将主要根据该领域相关研究论文的成果,从信息内容分布、信息生产者分布和时间分布三个方面来探讨网络信息的分布规律。3.5网络应用:
网络信息资源的分布规律3.5.1网络信息内容的分布规律通过一些工具性网站2003年5月1日-3日中“网络经济”这个条目命中的网页数量的集中与分散分布发现,其分布的近似曲线与布拉德福分布曲线比较接近。图3-8以“网络经济”为主题的网页的布氏分布曲线网络信息资源内容分布仍然满足集中与分散规律,但分散的趋势较文献信息的趋势更加明显。台湾学者蔡明月于2002年5月5日至7日,利用google搜寻引擎,以“电子图书馆or数字图书馆or数字博物馆”,并配合设限网域site:tw的检索策略,查寻台湾地区建立的有关数字图书馆主题的网页。最后共得5850个网页,其中907个为商业(.Com)机构所制作,4259个为教育(.Edu)网站,政府(.Gov)单位制作的有387个,网络事业(.Net)单位制作了23个;另外246个是由组织机构(.Org)所制作,最后个人(.Idv)制作的网页亦有28个。图3-9为根据统计数据所绘制的“数字图书馆”网页之布拉德福分布图,其横轴为单位排名之自然对数,纵轴为累积的网页数。3.5.1网络信息内容的分布规律可见,其分布曲线与典型的布拉德福分布图颇为相近。首先,排名前十名的网站形成一非线性的曲线,继之为一线性的区域,当排名超过55左右之后,网页累积之曲线斜率开始变小,形成一尾端下滑的偏垂区段。位于曲线部分前十名的网站则形成所谓的核心网站。图3-9以“数字图书馆”为主题的网页(台湾地区)的布氏分布曲线3.5.1网络信息内容的分布规律选择校园BBS来研究网络生产者的分布规律武汉大学珞珈山水BBS(2003年5月5日)发文3307篇,作者1171人根据普赖斯定律,生产者开根号的人数生产信息总数的一半,即的人要发文1653篇3.5.2网络信息生产者的分布规律发文篇数作者数累积篇数累积作者数%数据点斜率7717710171-3.84858119930.256-4.09350124940.342-1.95341337270.598-2.81638141080.683-1.74837144790.767-4.344311478100.854-6.081281506110.939-0.932262558131.11-2.545251583141.196-1.895231606151.281-0.823213669181.537-2.005202709201.708-2.160192747221.879-1.865182783242.05-1.613174851282.391-2.683163899312.647-1.681153944342.904-1.6751441000383.245-1.6071251060433.672-0.8031181148514.355-1.9601071218584.953-1.3269121326705.978-1.784881390786.661-0.9187161502948.027-1,39866+1538+100+8.54+-表3-3珞珈山水BBS部分发文情况(2003年5月5日)3.5.2网络信息生产者的分布规律实际的结果34位作者仅只发文944篇,还不足总数(3307篇)的1/3BBS中生产者的分布不如科学文献分布那么集中在蔡明月的研究中,她继续采用“数字图书馆”网页的数据样本,进一步利用洛特卡定律与普赖斯定律检验网页生产力分布。5850个网页共由392个单位所制作,其中174个单位只生产一个网页,占全部单位数的44%。超过100个网页的单位有11个,所制作的网页共计2889个,约占全部网页的50%。即有关数字图书馆一半的网页是由这些单位生产的,其中前9个单位均为教育机构,另外2个分别为商业与政府机构。3.5.2网络信息生产者的分布规律根据普赖斯定律,全部“数字图书馆”的网页制作机构为392个,开根号得19.8个。换言之,最多产的20个单位所制作的网页应达全部网页的半数,即2925个;实际上,前20个单位制作的网页总量为3589个,占所有网页的61%。此外,根据数据,只生产一个网页的单位占全部单位的44%。此数值与洛特卡原始定律中发表一篇文献的作者人数约占全部作者数之60%,有颇大的差异。利用最小平方差的方法求得洛特卡定律中的直线斜率值为-0.7,与洛特卡原始定律之n值(-2)差异亦相当大。因而数据样本中,“数字图书馆”网页制作单位的生产力分布与普赖斯定律和洛特卡定律都不相符。3.5.2网络信息生产者的分布规律推论
上面分析的BBS的情况可能并不能代表网络信息资源生产者的频率分布,而且所选数据也不够完整。但就此所得到的新的结论是:著者的集中程度比传统文献低,著者分布更加广泛而且相对均衡。而这一点却与蔡明月关于“数字图书馆”网页生产者分布的结论恰好相反。比较分析这两个研究,“数字图书馆”的主题更加专业化,对于生产者的要求较高,而BBS的发文要容易很多,生产者的门槛相对降低。由此我们可得到的推论是,网络条件下的信息生产表现出不同的规律,生产者的分布与信息内容的专业化程度密切相关,信息专业化程度越高,则生产者的集中程度就越明显;反之,生产者的分散程度就越明显。3.5.2网络信息生产者的分布规律
网络信息的增长规律(1)单一网站网页数量的增长规律研究者:阎劲松和沙勇忠研究对象:搜狐新闻的网页数数据来源:Baidu在线检索新闻频道观测时间:2005年1月1日-2006年12月31日3.5.3网络信息的时间分布规律表3-5搜狐新闻网页数量与时间汇总的部分数据仅存在正式交流过程的单一网站,其成熟期内的网页数量累积数按照二次曲线稳步增长,增长速度比线性增长快,而比指数增长慢。如果用F(t)表示时刻t的网页累积数,则二次曲线定律可表示为:图3-11
搜狐新闻网页累积数随时间分布的散点图为何呈现二次曲线增长?
在文献计量学领域,正式交流只能导致直线增长,正式交流与非正式交流同时存在则会导致指数增长。3.5.3网络信息的时间分布规律(2)特定学科/主题领域中网页数量的增长规律研究者:苏金燕、周春雷、罗力研究对象:Altavista搜索引擎检索词:“knowledgemanagement”采集时间:1980年至2007年①“年”尺度增长模型
②“月”尺度增长规律3.5.3网络信息的时间分布规律
网络信息的老化规律造成网络信息老化的因素(1)网络信息的增长。(2)网络信息的更新。(3)网络信息的消失。(4)网络信息的语用衰减。此外,网络信息的老化还受到另外一些因素的影响,就内因来说,比如网络信息的类型、性质和发展阶段等;就外因来说,如科技的进步,用户需求的变化和社会环境的变化等。3.5.3网络信息的时间分布规律半衰期则是评价网络信息老化程度的重要测度指标。网络信息半衰期的定义:(1)借鉴文献半衰期中的被引半衰期与引用半衰期的定义。①网络信息被引半衰期是指:某一站点的全部信息在某一时间段内被引用或被链接的所有信息中较新的一半是在最近多长时间内发表的。②网络信息引用半衰期是指:某一站点的全部信息在某一时间段内引用或链接的所有信息中较新的一半是在最近多长时间发表的。(2)以网络信息研究对象特征对网络信息半衰期定义。①宏观网络信息资源半衰期是指:某主题领域网络信息资源所含链接的链宿所指资源中较新的一半是多长时间内产生的。②微观网络信息资源半衰期是指:指向该网络信息资源的全部其他网络信息资源的二分之一是在其发布后的多长时间内出现的。3.5.3网络信息的时间分布规律研究者:朱梦娴、许鸿翔、高静研究对象:社会标签网站delicious一天中更新的80622条书签实验过程:①根据用户标注的标签进行内容分类②测度不同内容类型的网络信息资源的半衰期图4-1计算机技术、娱乐、社会和生活四大类半衰期3.5.3网络信息的时间分布规律研究者:马费成、夏永红研究对象:中文学术资源网、外文学术资源网、论坛网站、新闻网站和大型网站研究方法:引文分析法和链接分析法图3-22五类网络信息生命周期观测结果图3-23网络信息的生命周期曲线图3.5.3网络信息的时间分布规律了解和掌握信息分布的规律是开展信息管理活动的条件。第3章首先介绍了信息产生与分布中存在的马太效应,而后从信息内容的分布、信息生产者的分布和信息对时间的分布三个层面,介绍了文献信息分布的主要经典定律,揭示了信息分布的特征和规律;在此基础上,结合网络信息资源的特点,通过相关实证研究论文的引入和借鉴,对网络环境下信息资源的分布进行了初步的探讨,指出网络环境下信息资源的分布已成为信息分布领域研究的新课题。本章内容提要
本章的重点包括:1、掌握信息产生和分布中的马太效应;2、掌握反映信息内容分布规律的两大定律:布拉德福定律和齐夫定律;3、掌握反映信息生产者分布规律的两大定律:洛特卡定律和普赖斯定律;4、掌握信息在时间上的分布规律,包括指数增长率和逐渐过时率(半衰期和普赖斯指数);5、了解网络信息分布出现的新特征和新规律,并思考传统的信息分布规律在网络环境下的适用性。本章重点4信息获取“信息源”的定义:人们在科研活动、生产经营活动、文化活动和其他一切活动中
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年新疆铁道职业技术学院单招综合素质考试模拟试题含详细答案解析
- 2026年宁夏葡萄酒与防沙治沙职业技术学院高职单招职业适应性测试备考题库及答案详细解析
- 2026年河南经贸职业学院单招综合素质考试模拟试题含详细答案解析
- 2026年长治职业技术学院单招综合素质考试参考题库含详细答案解析
- 2026上半年云南事业单位联考丽江市招聘610参考考试试题及答案解析
- 2026贵州黔南州面向大学毕业生退役士兵公开招聘事业单位工作人员54人考试重点题库及答案解析
- 2026年辽宁石化职业技术学院单招职业技能考试备考试题含详细答案解析
- 2026年厦门安防科技职业学院高职单招职业适应性测试备考题库及答案详细解析
- 2026年安徽黄梅戏艺术职业学院单招综合素质笔试模拟试题含详细答案解析
- 2026年甘肃能源化工职业学院单招职业技能考试备考试题含详细答案解析
- 三级医院营养科建设方案
- (2025年标准)彩礼收条协议书
- 宾得全站仪R-422NM使用说明书
- ASTM-D1238中文翻译(熔融流动率、熔融指数、体积流动速率)
- 短视频创作-短视频手机拍摄与剪辑
- 2025年国家公务员考试《申论》真题及答案解析(副省级)
- 车辆挂靠驾校合同协议
- 贵州省遵义市2024届高三第三次质量监测数学试卷(含答案)
- 江苏省劳动合同模式
- 速冻食品安全风险管控清单
- DL∕T 5342-2018 110kV~750kV架空输电线路铁塔组立施工工艺导则
评论
0/150
提交评论