




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、,信息资源的分布,、,信息资源分布,研究信息资源分布规律和特征,可以揭示信息管理学奠基性的定律,提高信息资源开发、管理和利用率,从横向(在不同载体、领域和空间的分布状态)和纵向(随时间变化的分布状态)来考察信息分布的特征和规律。,目录Contents,信息资源的增长、老化规律,1 增长规律 (文献)信息资源增长规律即新出版的文献数量随时间的推移而增长的规律 。 1)1944年,美国韦斯莱大学图书馆馆员弗里蒙特赖德(Fremont Ryder)发现: 美国主要大学图书馆的藏书量 平均每16年递增1倍 2)普赖斯 把这一发现推广到科学知识的全部领域,并进行了一系列研究。,普赖斯曲线,1949年,普
2、赖斯发现: “一叠叠的(10年一叠)哲学汇刊靠墙竟堆成了一条完美的指数曲线”。,普赖斯曲线,-以文献量为纵轴 -以历史年代为横轴 -从1750年起,科学期刊的数量大约每50年增长10倍。,其中:F(t)表示文献累计量; t表示时间(年); a是初始时刻(t=0)的文献累积量; b是文献的持续增长率,其值近似等于文献的年增长率,普赖斯指数模型只是文献增长的一个理想模型,没有考虑许多复杂因素对文献增长的限制。 在指数模型的基础上,苏联科学家纳里莫夫和弗拉杜奇发现,在初始阶段,文献的增长是符合指数规律的,但当文献量增加到某一定值时,其增长率开始变小,最后缓慢增长,即文献的增长速度分阶段而不同。基于此
3、,他们提出了文献增长的逻辑曲线模型: 其中:F(t)表示文献累计量; k表示当t时文献的累积量,即文献累积量的最大值; a、b为参数。,生长曲线的局限性,科学技术发展到一定阶段时,学术文献的增长率趋近于0:t无穷大时,yk,dy/dt=by(k-y)0 但是科技文献数量增长速度的减慢,并不意味着科技发展速度会下降。 新的、更完善的传播科技信息的方法和手段的出现,以补充或逐步取代现有传统形式的科技文献,学术研究和发展仍将继续提高。,1.2 文献的老化规律,文献老化的概念(obsolescence,aging) 科学文献随其“年龄” 的增长,其内容日益变得陈旧过时,作为情报源的价值不断减小,甚至完
4、全失去利用价值。 老化的标志 年龄增长 内容陈旧 价值减小 被利用减少,文献信息老化的影响因素 文献增长。文献的增长和老化是一个事物的两个方面,它们从不同的侧面来描述科学的发展,阐明科学知识的修正率。因此,文献的老化,首先是与文献的增长联系在一起的。 学科差异。世界上93%98%的科学杂志引用寿命为20年左右,但并不是所有这些学科的文献老化速率都大体一致,相反,彼此之间差异甚大。 学科发展阶段的差异。即使是同一学科,不同的时期或阶段,文献的半衰期不尽完全相同。 信息环境和需求。不同信息用户对文献的需求是不同的,因而信息利用者的需求及所处的信息环境的研究十分必要。,半衰期,半衰期(Half-li
5、fe): 放射性元素的原子核有半数发生衰变时所需要的时间。 文献“半衰期” 由贝尔纳在1958年,其“科学信息的传递:使用者分析”论文中,将此名词引入科学文献领域。 1960,美国的图书馆员巴尔顿(R. E. Burton)和物理学家(R. W. Kebler) 一些科技文献的半衰期: 对9 个学科领域的期刊文献进行引文资料的统计分析,发现9种不同的引文资料的曲线形状上非常相似,同放射性元素铀235 的衰变曲线一样同是负指数曲线。,巴尔顿凯普勒老化方程,y -经过一定时间该学科尚在利用的文献之相对数量 x -时间,以10年为单位 当y = 0.5 时,可以计算文献的半衰期,某学科现时尚在利用的
6、全部文献中较新的一半是在多长一段时间内(X年)发表的 意义:经过X年,某学科领域其一半文献的利用价值已逐渐衰减。,巴尔顿凯普勒老化方程,y -经过一定时间该学科尚在利用的文献之相对数量 x -时间,以10年为单位 当y = 0.5 时,可以计算文献的半衰期,Brookes文献老化,1970年Brookes提出描述文献老化的规律,反映文献利用率的衰减现象。 负指数函数,t - 文献的出版年龄(以10 年为单位) C(t) - 表示t 年所发表的文献之引用频率 R - 常数,随不同学科而异 e - 自然对数的底,等于2.718 a -文献的老化率,文献老化的度量指标,普赖斯(Price)指数(19
7、71) 某一知识领域内,把对年限不超过5年的文献引文数量与引文总数之比当作指数,用以度量文献的老化速度和程度。 Price指数愈大,半衰期则愈短,文献老化的速度则愈快。 普赖斯将所有被利用的文献分成二类 档案性文献:年龄超过5年仍被引证的文献 地理学、地质学 有现时作用文献:年龄不大于5年的被引文献 生物医学,2、信息资源的分布规律,文献分布规律是指文献在一定时期内在空间上(如地区、领域、学科、专业和主题)分布的总趋势,包括文献的集中规律与分散规律。 布拉德福定律 洛特卡定律 齐夫定律,布拉德福定律 (确定科学论文在期刊中的集中-分散规律 ),英国著名文献信息学家布拉德福发现,某一学科领域中的
8、相关论文在期刊中的分布是不均匀的,而且具有明显的集中与分散规律。他在长期的观察和统计基础之上,提出了有名的“布拉德福分散定律”(Bradfords Law of Scattering),简称为布拉德福定律或布氏定律: “如果将科学期刊按其刊载某个学科主题的论文数量,以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的核心部分和包含着与核心部分同等数量论文的随后几区,这时核心区和后继各区中所含的期刊数成1aa2的关系(a1)。”这就是布拉德福定律的区域表述形式。,设第一区(核心区)所涉及的文章1种期刊;第二区(相关区)包括2种期刊;第三区(外围区)包括的3种期刊。那么,3个区中的期刊数量
9、成下列关系: 1:2:3=1:2(1) 式中:布拉德福常数,或称比例系数。,以应用物理学为例 (1)将刊物按刊载相关主题文章的载文量多少的递减顺序排列 (2)将表中的科学期刊按其登载论文数量的大小, 期刊分为包含同等数量论文的三个区。相继各区的期刊数成等比数列 其中:9:59:2581:5:25,布拉德福定律的图形描述: 如果横坐标取期刊按载文量递减排列时的顺序号n的对数,纵坐标取1至n号期刊所载论文的累积数,我们将绘制出的曲线称为布拉德福分散曲线。 布拉德福分散曲线由三部分构成,先是一段上升的曲线AC,然后是一段直线CB,最后是一段上升的曲线BD,期刊累积数的对数,论文累积数,在式中: R(
10、n)相关论文累积数。 n杂志等级排列的序号(级)。 第一级杂志中的相关文章数R(1)。也就是载文章最高的杂志中的相关文章数。 C“核心区”中的杂志数量。 N等级排列的杂志总数。 k,s待定参数,k等于分布曲线中直线部分的斜率,可用实验方法求得。当N足够大时,kN。 参数,与收藏的杂志(核心中杂志)数量有关,大小等于分布图中曲线部分的曲率,总小于1。 式(2-1)和(2-2)就是布拉德福定律的图形表述形式。,布拉德福定律的两个基本要点: 一是频次等级排序,形成主体来源(期刊)的有序目录; 二是确定相关论文在主体来源中的分布规律。 布拉德福定律的具体方法则包括区域分析和图形描述,虽然两者数值并不相
11、等,但所揭示的都是论文在期刊中的分散规律。 20世纪60年代,人们从不同的角度和侧面提出了许多经验分布公式和理论模型,使布拉德福定律取得了很大发展,但也存在很多问题。 对布拉德福定律进行严格检验,比较各公式的优劣,寻找更为规范的精确的数学模型; 其次要深入研究布氏分布的机理,寻找科学的统一的理论解释; 再次,进一步分析和研究其适用条件及局限性,大力开展应用研究。 布拉德福定律主要揭示的是宏观层次的信息(文献)离散分布,而对于微观层次的信息(内容单元)分布的研究基本上是空白。,布拉德福定律对信息管理工作的意义,一定领域内的信息在传播其的载体中具备集中-分散的规律。 例如,我们关注的某个领域内的大
12、部分信息可能集中在几个网站内,也有可能集中在基本杂志内,也有可能集中在几份报纸当中。只要关注这些少部分媒体,我们就有可能获取在这个领域内的大部分信息,而且是最新最尖端的。,洛特卡定律(确定文献在著者中的集中-分散规律),洛特卡通过对化学文摘和物理学史一览表分析化学、物理两个领域A、B字母为首的著者6891位进行分析,按论文从少到多的顺序排列后发现在写一定篇数论文的作者频率与其所撰写的论文数量间存在着一定的规律性。 “写了2 篇论文的科学家人数大约是写了1 篇论文科学家人数的1/4; 写了3 篇论文的科学家人数大约是写了1 篇论文科学家人数的1/9; 写了n 篇论文的科学家人数大约是写了1 篇论
13、文科学家人数的1/ n2 ”。这就是著名的洛特卡定律。,洛特卡定律(确定文献在著者中的集中-分散规律),洛特卡定律的图形描述:洛特卡以论文数(x)和作者数(yx)的对数为横坐标和纵坐标(即lgx和lgyx)作图,两组数据都是直线(如图所示)。图中虚线表示化学文摘数据,实线代表物理学史一览表的数据。用最小二乘法计算拟合直线的斜率,近似为-2。,洛特卡定律,在某一个领域内,写了x篇论文的作者占作者总数的百分比f(x),与其所撰写的论文数x的平方的乘积大致为一恒量。洛特卡定律的数学表现形式为: fn=c/n2 其中,n为一位作者发表的论文数,fn 为发表n篇文章的科学家占科学家总人数的百分比,c为常
14、数。 因为limfn=1,即c(1+1/22+1/32+)=1,c(2/6)=1 所以c=6/2=0.6079 结论:写1篇论文的作者数大约占作者总人数的60%。,洛特卡定律,在某一个领域内,写了x篇论文的作者占作者总数的百分比f(x),与其所撰写的论文数x的平方的乘积大致为一恒量。洛特卡定律的数学表现形式为: fn=c/n2 其中,n为一位作者发表的论文数,fn 为发表n篇文章的科学家占科学家总人数的百分比,c为常数。 因为limfn=1,即c(1+1/22+1/32+)=1,c(2/6)=1 所以c=6/2=0.6079 结论:写1篇论文的作者数大约占作者总人数的60%。,布拉德福定律用来
15、确定科学论文在期刊中的集中-分散规律,洛特卡定律就是用来确定科学论文在著者中的集中-分散规律。 例如,我们关注的某个领域内的大部分信息可能集中由几个人或几个组织生产的。只要关注这些少部分生产者,我们就有可能获取在这个领域内的大部分信息,而且是最新最尖端的。并且,根据这样一个定律,可以帮助我们确定某个领域内的专家,杰出科学家、学科核心著者。,齐夫定律(确定词汇在信息中的集中-分散定律),齐夫定律的研究内容 任何文集或文献中不同词汇的使用有什么特点?它们在文献中出现的频次有没有一定的规律?如果有规律,其表现形式应当是怎样的?齐夫定律正是要回答这个问题。 齐夫定律的表述 如果将一篇较长文章(约500
16、0字以上)中每个词按其出现频次递减排列起来(高频词在前,低频词在后),并用自然数给这些词编上等级序号,出现频次最高的为1级,其次为2级这样一直到D级,如果用f表示词在文章中出现的频次,用r表示词的等级序号,则有: fr=c(2-5) 式中c为常数。上式称为齐夫定律。,根据齐夫定律我们可以进行词频分析,从中得出词汇在信息中的集中-分散规律,根据词频分析,可以看出有一些主题词占据所有主题词总数的一大部分,这些主题词可能就是该领域目前状况下的研究热点。对于检索信息来说,跟踪这些词汇就能够获取该领域最新最核心的知识。 现在,这部分工作已经不用我们自己来做,只要登陆相关的搜索引擎,都已经给我们做好了相关
17、的词频统计,虽然这个统计会受到商业目的的干扰,但也能对我们的信息收集工作提供一定的帮助。例如google的google suggest等。 在了解了信息在媒体、生产者以及词汇在信息中的集中-分散规律之后,有助于我们对在信息爆炸的今天怎么样利用好我们的注意力和制定信息检索策略能够提供很好的参考。,3 信息资源的分布格局,信息资源的离散分布的表现 在地区上的差异。 在机构或者行业的差异 在内容的差异上 信息资源一般可能分布在下述机构 图书馆、档案馆文献中心 情报中心 政府部门 协会和学会 编辑、出版、印刷和发行机构 广播、电视及新闻机构 科研机构 企业,信息资源的分布格局-网络信息资源,网络信息资
18、源(network information resources)尚无规范的定义。有的称之为“web信息资源”、“联机信息”、“电子信息资源”、“因特网信息资源”、“虚拟馆藏资源”等等。 1.网络信息增长迅速(仅仅以www方式提供的信息平均每过53天就翻了一番) 2.信息价值良莠不齐 3. 存在状态无序性、无稳定性 新闻网站 全天24小时发布新闻,平均6分钟更新一次,并且不存档;,信息资源的分布格局-网络信息资源,网络信息资源(network information resources)尚无规范的定义。有的称之为“web信息资源”、“联机信息”、“电子信息资源”、“因特网信息资源”、“虚拟馆藏资源”等等。 1.网络信息增长迅速(仅仅以www方式提供的信息平均每过53天就翻了一番) 2.信息价值良莠不齐 3. 存在状态无序性、无稳定性 新闻网站 全天
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 少年当自强教学课件
- 废弃纸盘手工教学课件
- 2025贵州惠信餐饮管理有限责任公司招聘1人笔试历年参考题库附带答案详解
- 2025年公安消防职业技能考试-消防部队司令部考试历年参考题库含答案解析(5卷一百题单选合辑)
- 2025年公务员考试-政法干警-专业综合Ⅱ历年参考题库含答案解析(5卷100题合集单选)
- 2025中铁一局集团第三工程分公司房建市政施工技术管理专业人才招聘6人笔试历年参考题库附带答案详解
- 2025四川长虹电子科技有限公司招聘产品工艺等岗位拟录用人员笔试历年参考题库附带答案详解
- 沉浸式学习艺术效果-洞察及研究
- 年产1万辆电动自行车、年产5万量滑板车及休闲用品生产项目可行性研究报告模板-立项拿地
- 教学课件评选细则
- 中考数学几何专项练习:胡不归(解析版)
- 安委会汇报材料
- 五年级上册语文同步课件-21古诗词三首(山居秋暝、枫桥夜泊、长相思)第二课时(人教部编版)(共36张PPT)
- 医院儿童口腔科乳牙金属预成冠修复学习培训课件
- 抖音认证承诺函
- 《精益生产培训》课件
- 大件垃圾回收技术方案
- 月球基地建设与运行管理模式
- 寿衣店创业计划书
- 特种设备使用单位日管控、周排查、月调度示范表
- 安徽大学出版社综合实践活动四年级下册全册教案
评论
0/150
提交评论