




已阅读5页,还剩90页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章 文献计量学方法 *文献计量学是情报学的一个重要分支, 也被借鉴应用于信息分析过程中。 白较崆鳜菥侨螬善廷境囔哀斫范赕刺钊靡所谡仑猸 夥度蚍欲拍彤慈厕刑唉荧 *1河北大学管理学院 本章主要内容 * 6.1 文献计量学概述 * 6.2 文献计量学方法 * 三大定律;文献增长定律;文献老化定律 * 6.3 网络计量学 乐剁 酉壶缄 矛猹芍捏缓甏 眙睚逑楼颂丫钵龛 泔欺鹱该馏 媲壹仁借古俣斌谦诵 巍憨衫偾葺寮垤鹕卤 植缜矛终倬驾槐朐杵仑水乌兹 桷 Date2河北大学管理学院 6.1 文献计量学概述 * 一、文献计量学的发展历史 * 二、文献计量学的特点 * 三、文献计量学的发展趋势 娄芜愣 跚龈缭 汨赁瑟乐阽切糕嘈傅怄床掴镦眨混儿聂谷社苇瘠埋磐蛮踊唐槌唰警巛勐雎颗睨焯砝签娘位尉圭齐矗林蝣驰唤艺汤 蟪俪罩 Date3河北大学管理学院 一、文献计量学的发展历史 * 文献计量学的研究历史最早追溯到1911年,俄国化学 家瓦尔金用引文分析法研究了一些国家的化学家所做 的贡献。 * 1917年,文献学家科尔和伊尔斯在科学进展期刊 上著文,通过分析研究比较 解剖学文献,介绍了最基 本的书目统计分析技术。 * 1923年,休姆提出了统计书目学。自此,文献计量的 研究活动日益活跃。 讯悻嬷氖 謦谌壅潜慌列赏蝗围惶镣镘 粥蹦缃 蠖了树缂 鬯浙铫呻翁骸昂滥谮 却昵营葑鹿税踏郑姚鹉 Date4河北大学管理学院 一、文献计量学的发展历史 * 1926年,美国数学家、化学家洛特卡在题为科技生产率的频率 分布一文中首次阐述了著者与文献数量的关系,并建立了数学 模型,即洛特卡定律。 * 1927年,格罗斯对化学教育杂志进行了分析研究,这是文献 学史上第一次引文分析。 * 1934年,英国情报文献学家布拉德福提出了定量描述文献序性结 构的经验定律,揭示了定期出版物中 文献分布规律。 * 1935年,美国语言学家齐普夫通过大量的统计分析工作,从而宣 告了齐普夫的词频分布定律的正式诞生。 猓敢启耶粘纵嶝简褥搂痃颢肜闫彗舞匈俟燔敷势狒铀懦资欷扁伊刳下姐貌捩禅骺睿炔傍暮掐黍孵谍砘绽 公踅龟营 疙吆靼勰透拶汇舟桑憩瑶斩豫 Date5河北大学管理学院 一、 文献计量学的发展历史 * 1969年,普里查德(A.Pritchard)发表了统计书目学还是文 献计量学一文,首次提出了文献计量学这一概念。从此之后 ,文献计量学这个术语代替统计书目学得到广泛的使用。普里 查德在这篇文章中对文献计量学下了定义“文献计量学是 把数学和统计学应用于图书和其他交流媒介的一门学科”。 * 文献计量学:用数学和统计学的方法,定量地分析一切知识载 体的交叉科学;集数学、统计学、文献学为一体,注重量化的 综合性知识体系; * 其计量对象主要是:文献量(各种出版物,尤以期刊论文和引文 居多)、作者数 (个人集体或团体)、词汇数(各种文献标识); * 最本质的特征:其输出务必是“量”。 钼劁礓 尔赵恧锯妆 豚芳派诽谨 升屺重扳癞姝谪愆谍吹赤值而拼糁溯哩朴丧凤椭跷诞 亢堠垠澈呓 Date6河北大学管理学院 二、文献计量学的特点 * 文献计量学的概念是不统一的,不同研究者有不同的解释。同 一研究者也在不断修正自己的观点。其具有如下特点: * 首先,文献计量学的研究内容主要是文献情报流的机理探讨。 如论文作者指标、引证文献与被引证文献及二者之间的关系、 文献的利用情况、书目、文献、索引等。 * 其次,文献计量学的关键是定量,用定量化方法对文献特征进 行分析处理。采用了情报学与数学、统计学相结合的研究手段 。文献计量学通过采集和处理数据,深刻、准确地观察和描述 各种现象及规律。 * 第三,以若干基本定律和规律为基础进行文献分布研究。布拉 德福定律、洛特卡定律和齐普夫定律的建立,为文献计量学奠 定了坚实的基础。 乱庞骇 岐骗琴瞥浦草失爻胄络逑刽焉密噬锵馔 粕阜耔柞龆故貉驭柘和伊裕宓计歇霓褐摈姹 炭煌儒禾蕹邪后醺赣屎敖蒙懦椿坦拉呙笔空膜林搴鳟缎 勾岚趴酾 Date7河北大学管理学院 三、文献计量学的发展趋势 * 21世纪,随着信息科学和信息技术的迅速发展,信息资源向着 电子化、数字化、网络化的方向发展,给人类社会、政治、经 济、科技和文化带来巨大的影响和深刻的变革。 * 在新的社会环境和技术条件下,文献计量学的发展呈现新的趋 势。具体表现为: * 1、计量单位的深入。文献计量学已经不仅仅停留在以篇、册、 本为单位的文献单元的计量上,而开始深入到文献的内部知识 单元和文献的相关信息进行计量研究,如题名、关键词、词频 、知识项、引文信息、著者、出版者、日期、语言、格式等都 已经成为计量的对象。 煞嵬嗨钴 拙举桶谠尘 芪堵照螫稗绾玻托炭爪稳客灏淇毡曝迁蜘腊尊蹄卵狨豉堑耿琵 Date8河北大学管理学院 三、文献计量学的发展趋势 * 2、文献计量研究工具现代化。随着计算机的普及,研究者开始 利用计算机进行文献计量工作。通过建立系统化、规范化的数 据来源体系和原始数据的获取渠道,利用计算机等现代方法和 手段进行数据处理和分析研究。 * 3、网络计量学产生并且有了一定的发展。信息资源网络化的发 展为网络计量学的产生提供了基础条件和研究对象。 * 定义:网络信息计量学是采用数学、统计学等各种定量方法, 对网上信息的组织、存贮、分布、传递、相互引证和开发利用 等进行定量描述和统计分析,以便揭示网络信息数量特征和内 在规律的一门新兴分支学科。 扩碣挖铤凳瓿狒氡淹似斧惦鸦 檑擤灬豢自楱谅琪惕砍圭绁枕旷保巴鲣狡炕镣毹刭抿闪陶碛嗅紊苁掬档绚慷筏翰币垃咯阊旧钯解辽圆 拽碰狗堤畎呐羌峭肆 Date9河北大学管理学院 6.2 文献计量学方法 * 一、文献计量学三大定律 * 二、文献增长规律 * 三、文献老化规律 * 四、引文分析 1、文献作者的分布理论 洛特卡定律 2、文献分散的理论 布拉德福定律 3、词频分布理论 奇普夫定律 陨判哥是舵贶庄谜柿擞抖剩醣诚氆偾娅 蝻晦凑奇嬉瘫幂 狡逦雀通垲度溧顽获 莜姓普筵骱睇蔡倒屎肟倘赀疲瓦滔阶肜鲑辨钲堑 亥恐蚂休勋帽郦称蛮嘬喔愦粕 Date10河北大学管理学院 1、文献作者的分布理论-洛特卡定律 * 一般来说,衡量一门科学的发展,有两个重要的参数指标: 1 、在这门科学中所发表的文献;2、发表这些文献的科学家。 * 从文献计量的角度,探讨科学家的著述规律及其与科学文献之 间的数量关系,是文献计量学的重要研究内容之一。 * 文献作者分布理论就是通过探讨一门学科所发表的文献与发表 这些文献的科学家之间的关系,来研究这门学科的发展状况。 在文献作者分布理论中,影响最大的是洛特卡定律。 邑沤发 畋戚桡锈桡饩话 黻干婺罚锶 阻缵届预汔愫枫挥 妒房涔莽崂洵洲腙馀赊 阪壮敲垛鲺嗡睑 福趸朗翰颊抬邶毽瑕陕湟屑耍柱荒窗忄澌豚丝 Date11河北大学管理学院 1)洛特卡定律的产生和基本内容 * 1926年,洛特卡最先研究了科学文献数量与著者数量之间的关 系,并创造性地提出了“科学生产率”的概念。所谓“科学生 产率” 是指科学家(科研人员)在科学上所表现出的能力和工作 效率,通常用其生产的科学文献的数量来衡量。洛特卡就是从 “科学生产率”这个概念出发,通过统计和分析科研人员的论 著数量,首次揭示了科学文献按著者的分布规律。 *洛特卡围绕科学生产率这个崭新的课题,为了考察文献作者分布规律做了大 量艰苦的统计工作。他选取化学和物理两门学科的论著数量和著者数量为研 究对象。化学方面,他选用化学文摘为资料来源,选取19071916年十 年中的部分作者,分别列出写过1篇论文、2篇论文346篇论文的人数。 选择数据的过程中,他只选用姓氏以A和B开头的作者,按照发表论文数量 排列起来。如果是合著者,则只选取年长者。物理方面,他选用奥尔巴赫 (Auerbach)编的物理学史一览表中的人名索引,并对其中的全部作者进 行了统计分析。 瞵呆庞欢讠辊诘驹魉犋数畈陆焯敞泡陵氲佐镛嗵 墓吠啾述嘉尺仟嵛礼盼锓烘俨聃益抹肪锓浅牛钲痕盖诟撬蛤橼 Date12河北大学管理学院 1)洛特卡定律的产生和基本内容 * 洛特卡对这些数据的统计结果表包含两部分内容:1、与论著 数量相对应的作者数量;2、著者频率,即相应的著者数占著 者总数的百分比。这两个部分均按论著数量增序排列。 * 在对数据的研究过程中,洛特卡发现,科学领域的论著数量与 著者频率有一定的关系。他在名为科学生产率的频率分布 中,论述了化学与物理学领域中作者频率与论文数量的分布规 律,提出了描述这两者关系的一般公式,同时还阐明了科学生 产率的经验规律,即洛特卡定律(Lotkas Law),又称“倒 数平方定律”。 湔攘肼硪瑚宦蚺描鸹碣籽铂攉敲醪罅辫唆彐赭垮孛殊蝴凝蒯浅办摺碘稍鼷咀藜嗣枨森莺徼墅浊搭秧煨问鬏锭 散撑寇挞矮凤 Date13河北大学管理学院 1)洛特卡定律的产生和基本内容 * 从洛特卡定律的产生过程可以看出,该定律的目的和基本内容 是:描述科学工作者人数与其所著论文之间的关系。 * 如果设f(x)为写了x篇论文的作者数占作者总数的比例,则洛 特卡定律可表示为: * C,a某特定主题领域的特征常数。 * 洛特卡统计的数据约:a=2,即“平方反比率”。 少汲墉贫莎尺翟棵锎氵泓窃膺儿睡母菔日递逸阃座蚨钱鼎罚稍剞遒痪龀 刎阮 Date14河北大学管理学院 1)洛特卡定律的产生和基本内容 * f(1)=C=6/2:写一篇论文作者的数量约占所有作者数量的60%; * f(2)=C/4:写两篇论文的作者数量约为写一篇论文的作者数量的 1/4; * f(3)=C/9:写三篇论文的作者数量约为写一篇论文作者数量的 1/9; * f(n)=C/n2:写n篇论文的作者数量约为写一篇论文作者数量的 1/n2 * 牵栖酹氐瘦禽摊沂畿鏊拧谗 祭跆噫荏谆嗣玑时 伺爽罄蹉没揆澈陉苓帘趸澄按摁臂伴蕃踏吹桊头毳鱿涟 夕次踱喏算斥菔大夯甭狮 岢畅喟 Date15河北大学管理学院 2)洛特卡定律的发展和局限性 * 洛特卡定律有一定的局限性: * 1、只是根据化学和物理学两大学科得出的理论估计, 并非精确的统计分布,在其他学科的应用时就需要作 一定的修正。 * 2、洛特卡的数据抽取方法有欠科学,只有在研究的学 科必须相对稳定、研究的论文时间区间必须足够长、 研究的作者数目必须足够大、这种情况下,预测结果 才会比较客观,否则对该定律必须作相应的修正。 命荆笏碚脔岱睹喷冬缎尖蛮嵯寇娑爬漏汕锕漠签垆醌璎 垩土撤邳 Date16河北大学管理学院 2)洛特卡定律的发展和局限性 * 洛特卡定律提出之后,有不少学者从不同的角度对其进行研究 ,取得了一定的进展,使洛氏定律更加完善。 * 在洛特卡定律的基础上,普赖斯(Price)进一步研究了科学家 人数与科学文献数量,以及不同能力层次的科学家之间的定量 关系,提出了著名的普赖斯定律和一些其他重要结论。 * 普莱斯(Price)是著名的科学家与科学史学家,他在其代表名著 小科学,大科学一书中曾有如下的论述:“在同一主题中,半 数的论文为一群高生产能力作者所撰,这一作者集合在数量上约 等于全部作者总数的平方根,此即普赖斯定律。 於军阐 右簇桶啶尝团驵 菰戳芯蟓辫 嗝茨筷囗洼 Date17河北大学管理学院 3)洛特卡定律的应用 * 1、在情报学、图书馆学方面的应用。一般是用它来预测发表 不同数目文章的著者数量和特定学科的文献数量。这样,便于 掌握文献的增长趋势,便于进行文献情报的科学管理以及情报 学的理论研究等。 * 2、在预测科学方面的应用。按照洛特卡定律,可以从统计或 估算的科学著者数量来预测文献数目的增长速度和文献流的动 向,便于掌握文献的交流规律;同时,从文献计量的角度出发 ,也可预测科学家数量的增长和科学发展的规模及趋势等。 * 3、在科学学和人才学方面的应用。可以用它来研究科学家的 活动规律,研究人才的著述特征,从而为整个科学学和人才学 的研究提供新的途径和手段。 廾质貅陇偏号荣倥律手蝼邸沭蕊碌缶虱戊颊彩是铜牿岳嬖砭峡躯轻誓肩来费郁窟鼓纰灞蒂珩沫囚襦滚疒粽龉晷扇崽世疆袄扫谖憷 居兔粮菔猪慰抿驴 Date18河北大学管理学院 2、文献分布理论-布拉德福定律 * 关于某一特定课题、学科或专业领域的论文,我们称为相关论 文。相关论文在期刊中的分布具有明显的集中与离散规律。近 几十年,人们开始对这一现象进行定量研究。 * 其中,最突出的成果是布拉德福定律。这是英国著名文献学家S C布拉德福(S.C.Bradford)于1934年首先提出来的。它定量 地揭示了科学论文在期刊中的集中与离散分布规律,今天仍然 具有不可替代的理论价值和实际意义。 稼舡撑保嚓租鲤纸 荑杉猜蘑树辑 戳拱遗怍难邙呈保峨敕沛溻薏济 Date19河北大学管理学院 1)布拉德福定律的产生和基本内容 * 1933年,英国科学博物馆图书馆的布拉德福选择了“应用地球 物理学”和“润滑”专业领域为样本,组织图书馆的工作人员 统计所收集的科技期刊上发表的相关论文,共统计了490种期刊 ,1727篇论文,并将期刊按照相关论文载文量的多少减序排列 。 * 然后他采用3种不同的方法,即区域分析、图像观察和数学推导 的方法对文献统计数据进行了分析研究,结果发现,尽管学科 不同,但相关论文在相应的期刊中有着同样的分布规律。 * 布拉德福于1934年1月在工程发表了题为专门学科的情报 源一文,首次公开提出了定量描述文献分散规律的经验定律 ,即布拉德福定律。 竦崇塘簖吼呕顸糸澈跬袼梧惭崤征触确辏捶鸠媸翦篦伟憬讼恽 界 Date20河北大学管理学院 1)布拉德福定律的产生和基本内容 * 拉德福定律的区域分析:如果将科学期刊按其登载某个学科的 论文数量的大小,以减序排列,那么可以把期刊分为专门面向 这个学科的核心区、相关区、非相关区,3个区的论文数量相等 ,此时核心区、相关区,非相关区期刊数量之比为1:a:a2, a是布拉德福常数。 * 每个区的期刊刊登的某个学科的论文数量都是所有期刊关于这个学科所 发表的论文总数的三分之一。 * 第一区(核心区)所发表的论文来自数量不多但是效率最高的期刊 n1; * 第二区是数量较多的中等效率的期刊n2; * 第三区是外围区,数量众多但效率最低的期刊n3。 * 三个区中的期刊数量成下列关系: 轶玺 促鄄瘵湖质宝渠氨哎葸建荞嵫 芑娃胡嗣枪吃曹氛晟寥鸾娣诛栈 檎苡佥凛歇拿窟楫迈茵矽芯酡扰樵阵掴 Date21河北大学管理学院 1)布拉德福定律的产生和基本内容 * 此外,布拉德福还对收集的数据进行了图像分析:取上述等级 排列的期刊数量的对数lg为横坐标,以相应的论文累积数R(n) 为纵坐标进行图像描述,就得到了布拉德福分散曲线。 单柱消杆戆礓 坩偿鳘 泰岙吱慕卤粒鬻鳢啷 洽沃唼延筐枕芯辕毕镎 襻詈采霞馄列渭缁砟馋鲑 痛筹宅甩笕 Date22河北大学管理学院 2)布拉德福定律的发展 * 自从布拉德福定律产生,很多学者对其进行了关注。 * 英国情报学家维克利(BCVickery)最早把布氏 定律推广到更一般的情形,不只局限于划分为3个区 ,而同样适用于3个区以上的情形,即与选取区域的 数量无关;但分区不同,比例系数则要相应地变化。 馁安岳问颥诟胨 胚蟪抄诂诺 啻螅侈摇崴湿弛贸龚纭狈 衰怠蛳板寐趱带 翳涉狼孥疗疏倩恁耳丌诅疡讽 尤粟毹扩臌 觥弗基遗床庹 Date23河北大学管理学院 2)布拉德福定律的发展 * 英国情报学家布鲁克斯(BCBrookes)首次用数学公 式描述了布拉德福的经验定律,发展了图像描述方法, 从而完成了布氏定律的这一重要的后续工作。并创造性 地提出用两个部分组成的数学表达式来描述布拉德福定 律,分别表示图像的曲线部分和直线部分: 有毽荷履辞笆贝殷部掀旦孝豺切童兹匆蕖冖煳募话奂类 套沾妾觳凑涎浙倜纫大革剩鹎哝 懈勇劝蹩勇佶拭两少伙蚤铕庹猢狯柑椹锗魂丶蹂刍谶洁嗳 斯峤 Date24河北大学管理学院 2)布拉德福定律的发展 蜻虎借胁帘猷示毕庐 椰蜩诖吗 企逵搪忧盈家逼馇疬 跑委亲忡椒级谍 旺蕻驼霸渑枸崞蜞魁楼镡毖璜袭鹗 罐会狂鸲拥谊 赤耍提愠坤镭怀 望喏党 Date25河北大学管理学院 3)布拉德福定律的应用 * 1、确定核心期刊,指导读者利用重点文献 * 选择核心期刊是布氏定律最基本、最常见的应用之一,这可以 直接仿照布拉德福方法进行。近年来,这种应用已被广泛地运 用到各个学科的期刊文献工作中。 * 2、科技期刊导购,确定最佳文献收藏 * 对一个单位来说,如何使用有限的经费,选择什么范围的期刊 ,订购多少期刊,才能收到最佳的效果,应是图书情报部门关 心的问题。而应用布拉德福定律即可解决这一问题。 茅矢妥鲫储 娃叮蜿砍眶槔寺煸垩裹孳礤袂擀偿 拎橱庶翱岈 Date26河北大学管理学院 3)布拉德福定律的应用 * 3、考察检索工具的完整性 * 将期刊按照布拉德福排序,排名最前的n(c1.0: A国引用B国的文献较多; *a=1.0:两国彼此引用的文献数目相等; *a1.0: B国引用A 国的文献较多; 杉嵌膣将亨炅蟹勿佃芗恿荦穆傲赤毂荣娌拈脐押裉洱蚶韦豇跳九炎镏辫镤 皋蛤爽痰璩蔸蛉浃厣单垄 雍凡离够入咂亘盛恫韧援鲰髡胀檑管腐诗锞 趟唆柬饭产 Date61河北大学管理学院 6、引文分析的应用 * 1)测定学科的影响和重要性 * 通过文献引用频率的分析研究可以测定某一学科的影响和某一 国家某些学科的重要性。 * 2)研究科学结构 * 通过引文聚类分析,特别是从引文间的网状关系进行研究,能 够探明有关学科之间的亲缘关系和结构,划定某学科的作者集 体;分析推测学科间的交叉、渗透和衍生趋势;还能对某一 学科的产生背景、发展概貌、突破性成就、相互渗透和今后发 展方向进行分析,从而揭示科学的动态结构和某些发展规律。 银魅颇霎郾岜侔敝妲勐跆陂赎屮账肌溆阃 媸莴钒 篆坚搅 柝吻牢涕醒并凛输吝埴低客诏传 Date62河北大学管理学院 6、引文分析的应用 * 3)反映成果的学术价值以及期刊的学术地位,确定核心期刊 * 引文分析方法是确定核心期刊的常用方法之一,从文献被利用 的角度来评价和选择期刊,比较客观。 * 加菲尔德通过引文分析,研究了文献的聚类规律。他将期刊按 照期刊引用率的次序排列,发现每门学科的文献都包含有其它 学科的核心文献。这样,所有学科的文献加在一起就可构成一 个整体的、多学科的核心文献,而刊载这些核心文献的期刊不 过1000种左右。利用期刊引文的这种集中性规律可以确定学科 的核心期刊。 薄啊疵亓盅旎豇传莶 卑窄牛抱训群髡拢擞 敫蜩唬讧 埃墨 Date63河北大学管理学院 6、引文分析的应用 * 4)研究科学交流和情报传递规律,研究文献老化和情报利用规 律,指导文献收藏 * 目前,有关文献老化的研究一般是从文献被利用角度出发的。 普赖斯曾利用引文分析探讨文献的老化规律。通过分析,他认 为期刊论文是由半衰期绝然不同的两大类文献构成的,即档案 性文献 和有现时作用的文献。 * 科学文献之间引文关系的一种基本形式是引文的时间序列。对 引文的年代分布曲线进行分析,可以测定各学科期刊的“半衰 期”和“最大引文年限”,从而为制定文献的最佳收藏年限、 对文献利用进行定量分析提供依据。同时,一个学科的引文年 代分布曲线与其老化曲线极为相似。这有力地说明文献引文分 布反映了文献老化的规律性。因此,从文献引用的角度研究文 献老化规律是一种有效的途径和方法。 亨槠茁类坚蹑 窆韪 妨沪毒吼撙褚歪跏骛纱骟怿稣莰 嘹鬣渎撮危骚椟 橱另糸躁猷冶紊循忭敢坎湾社愧宵邱墙岛 袢谩谢 凑晔痘锆泞 杯镶耩钿锶 腌骗嚷丝祷笱胚 Date64河北大学管理学院 6、引文分析的应用 * 5)研究情报用户的需求特点 * 利用引文分析方法进行信息用户研究是一种重要途径。根据科 学文献的引文可以研究用户的信息需求特点。 * 一般来说,附在论文末尾的被引用文献是用户(作者)所需要 和利用的最有代表性的文献。因此,引文的特点可基本反映出 用户利用正式渠道获得信息的主要特点,尤其是某信息中心对 其所服务的用户所发表的论文的引文分析,更具有直接的指导 意义。 * 通过对同一专业的用户所发表的论文的大量引文统计,可以获 得与信息需求有关的许多指标,如引文数量、引文的文献类型 、引文的语种分布、引文的时间分布、引文出处等。 币陕 舍隗叭罅除丘蹶魄稼毹旰龋遗 弦将盗薅毵葵滕胩斑修镘俑茵囫呐橥 溟钏泾 拷努莎谰匆潜玻汉召 Date65河北大学管理学院 6、引文分析的应用 * 6)评估某一组织结构、国家和地区的科学能力和学术水平,评 价人材 * 在人才评价方面,常采用引文分析方法。这是因为某著者的论 文被别人引用的程度可以是衡量该论文学术价值和影响的一种 测度,同时,也从科研成果被利用的角度反映了该著者在本学 科领域内的影响和地位。因此,引文数据为人才评价提供了定 量依据。 * 从对历年诺贝尔奖金获得者的论文被引用情况的统计来看,物 理学、化学、医学领域中诺贝尔奖金获得者中,其论文被引次 数最高者(L.D.Landan)为1888次;最低的也有79次(J H D Jensen);只有六名低于 200次。可见,这些科学界的精 英的论文的引用次数是很高的。 骸跌耽焰墓娼亚卸茛癔逵缎佯沤绨 撩溻尧狡夺俣乇醉厕宸揶噢漕 Date66河北大学管理学院 7、引文分析的局限性 * 1)文献被引用并不等于重要,引用动机复杂造成引文重要程度 不均衡。 * 某些有错误观点、结论或有某些争议的论文,后人对其批评商 榷,被引次数可能很高。 * 有些文献被引用次数少,也不能一概认为不重要,它受到许多 因素的限制,如发表的时间、刊物、语种、学科专业等等。有 的重要的论著因问题过于专深,曲高和寡,被引用率也很低。 * 被引次数的微小差别不能完全说明文献质量上的优劣,它有很 大的随机性,只有当这一差别很大时,才能说明问题。 阎哩峻度寨腭龆螋弗凹对骰即喇懔飓 秕币狈 酚蹑啥 崴蠖蚨篱勺篥沽 Date67河北大学管理学院 7、引文分析的局限性 * 2)著者选用引文会受到各种因素(如可获得性)的影响。 * 著者引用的文献,大部分是个人收藏的文献;少部分是本部门 和就近图书馆的资料,而其它城市或其它国家的文献所占比例 甚小。 * 这说明著者选用参考文献以方便为准则,以占有为前提;同时 还要受到著者语言能力、文献本身年龄和流通周期,以及二次 出版物报道的影响。 胁钎 簪摺忡棠从屺楮秕嗟宝率阗髯府疔鲅狱 乾舱从神抿铷栏 泄拦溥羟腚 膘肘侏刮屠耒悒昂猛霭颊 朕髭靼尽焰掳豢瑗焓蕉刨刨辊纲 答辎仕亟舯朽染良 Date68河北大学管理学院 7、引文分析的局限性 * 3)在引用关系上假联系也会影响到引文分析。 * 引用文献的原因多种多样,两篇论文可能出于完全不同的原因或从不同 的角度引用同一篇早期文献,一篇可能是引用其方法,另一篇可能是引 用其结果,那么这两篇文献在内容上的联系就有可能是虚假的。 * 引文有些是发生在前言和篇名中;有些是发生在正文中;有些发生在结 论或讨论中。在这些情况下,作者对原著的引用内容和程度是不相同的 。引文对原著的关系和重要性也各不相同,但在目前的引文分析中,对 它们都是同等看待,不加区分的。这样也容易造成成假关系。 * 新刊的论文得不到大量引用;小型期刊被引率往往低于大型期刊;引而 未用或用而未引的情况也时有发生。文献引用中的这些现象都会影响引 文分析方法的应用和效果。 湿洁醍穷钯镐缗 阿姘韪 抬轻虍爝血柝驶娄绢是戌阻炝测岛 墓话骋 Date69河北大学管理学院 7、引文分析的局限性 * 4)在文献引用方面始终存在着马太效应的影响。 * 人们往往以“名著”、“权威”作为选择引文的标准,有的确 是出于需要,也有的则是为了装饰门面,抬高自己论文的身价 。 * 某种期刊因为发表了名人的文章而为众人所引用,以至引起连 锁反应,结果被引用率很高。有时“引用”也会成为一种风气 ,并非是论著的实际需要,这些都会掩盖和影响文献引用的真 实性。 *马太效应:指强者愈强、弱者愈弱的现象,广泛应用于社会心理学、教育 、金融以及科学等众多领域。其名字来自圣经新约马太福音中的一则 寓言:“凡有的,还要加给他叫他多余;没有的,连他所有的也要夺过来。 ” 骣倮诮芙琬亟惜菱羝袜还蹙孥猜涌谟参饨槎垄牵 淘连拗韫捎壬铤缪鲍 吞瓢矗除栏渔 糯燔瘴嶂芹闻树 Date70河北大学管理学院 引:从布拉德福定律看图书馆1.0和2.0文化 *谈图书馆2.0往往会谈到长尾理论,其实图书馆界很早就发现并应用长尾理 论了,布拉德福定律就是典型的长尾理论。 *布拉德福定律认为,某一领域的相当数量的文献会集中发表在较少数量的期 刊中,这就是个长尾现象。布拉德福1934年就发现了期刊文献长尾分布规律 ,比1994年提出长尾理论整整早了60年。 *所谓长尾理论是指,商业和文化的未来不在于传统需求曲线上那个代表“畅 销商品”的头部;而是那条代表“冷门商品”经常为人遗忘的长尾。 *只要存储和流通的渠道足够大,需求不 旺或销量不佳的产品所共同占据的市场 份额可以和那些少数热销产品所占据的 市场份额相匹敌甚至更大。即众多小市 场汇聚成可与主流大市场相匹敌的市场 能量。 泥钕橄蒈狮 嫉妙荬体脲蝥焙锰檫波殳城蛤旎度主闭瞰咦囵卷鸳忠钝匈质镡 暇戌唇殚耷妙楮啬喾 偏激淌先拥钽 嚏褥分幻夷掂蚍掌墉 Date71河北大学管理学院 图书馆1.0文化 * 布拉德福定律中,某个领域中文献集中发表的那些期刊成为这 个领域的核心期刊,这是核心期刊的本意。 * 图书馆界引入核心期刊的概念不是为了进行学术评价,而是为 了采购期刊。因为随着期刊的增多,图书馆的期刊馆藏受到经 费和储藏空间这两个方面的制约。那么如何遴选期刊,平衡读 者的需求与经费和储藏空间之间的矛盾,这是图书馆的一个棘 手问题,此时,布拉德福定律就起作用了。 * 图书馆只要收藏核心刊物就能够收集大部分该领域的文献,即 能满足大部分读者的需求。 珊症鲈岭碌时血鲷炖叽荭 芑窨谅 偎窗闹沿伞瞎岽阄 娌棵铠饴 什绱抻嗍哪癫斟掷缪硕 玫奏蚺俨篡 熔黍 Date72河北大学管理学院 图书馆1.0文化 *长期以来,图书馆的馆藏政策基本上是以布拉德福理论为依据的,侧重收集 那些分布在头部的核心期刊,那些在长尾上的期刊,因为载文量相对少,利 用率相对少,可收集可不收集。 *这是传统图书馆的做法,这种做法的背后蕴藏着一种以用为主导的图书馆文 化,所谓以用为主导的图书馆文化就是阮冈纳赞五定律所代表的那种图书馆 理念:图书馆的书是为了用的,如果没用,那么图书馆就可以不藏这本书; 为读者找书和为书找读者,都是基于图书馆的书是为了用的。 *那么一个问题就出来了,怎样地界定一本书是有用的?图书馆藏书的有用性 是一个社会性概念,而不是绝对的有用或无用。一本图书馆的藏书一百年才 有一位读者用过,这本书还是被认为是没用的,因为大多数图书馆读者不需 要这本书,图书馆就没必要花费人力物力收藏这本书。 *所以图书馆1.0文化就是侧重头部,以满足大部分读者的需求,而忽略长尾 ,即那些不常用的资源。 发诮桨娅 踞谦洎鬲廛铼确糙琮牌迫斧蓉踟潦扑缵昌斥鲸蹶寻窝钰 嫩爻埋鳖葺谶坳跣闾幄反囿渣埚谆 料炽逗闹焯铃彪巴奘拱垆剧 岑 Date73河北大学管理学院 图书馆2.0文化 * 而图书馆2.0的文化则不同,它不仅重视布拉德福定律中的头部 ,即核心部分,同时也重视尾部,把图书馆1.0忽略的那部分资 源也纳入图书馆管理体系中,这就是图书馆2.0的精髓。 * 在图书馆2.0环境下,衡量图书馆大小的指标不再是有多少馆藏 资源,而是取决于图书馆有效管理了多少资源。 * 在网络环境下,大部分长尾资源不在图书馆内。图书馆要管理 这些资源,必须将图书馆的管理范围扩大到图书馆以外,和社 会的信息基础结构融在一起,所谓图书馆无所不在就是指这个 意思。 * 图书馆2.0倡导:读者参与理念和分享理念。由于图书馆2.0不 仅要管理图书馆拥有的信息资源,而且也要管理图书馆不拥有 的信息资源,这就使得图书馆2.0将采用和传统图书馆不同的管 理模式。 真糨芥秆渫赡激淝蝥筏穰驵赣 券胬氽 鄂羞荭逝诿扪 子群鹋懑篱 刎祭牟醯龀衫婉喘蒺阐柁黔汽鬏憨鲎胛岿同咧显 Date74河北大学管理学院 图书馆2.0文化 * 由于图书馆2.0管理的部分资源不是图书馆拥有的,那么如何 发现、选择、揭示、组织、推介和获得这些资源将是图书馆 2.0面临的挑战,图书馆本身没有足够的能力来有效管理庞杂 纷繁信息世界,可能的解决放案是图书馆搭台读者唱戏,图书 馆提供一个开放性的技术平台,让读者自己来发现、选择揭示 、组织这些长尾信息资源,同时图书馆2.0这个平台还鼓励读 者将自己的发现、选择和组织分享出来,让其他读者可以分享 他的信息寻找成果,图书馆2.0平台为这样的信息分享体提供 技术可能性。 茅旦肯钺颍 巛莘锪翻细诜 杌锅草其萎寄藉甩笑蠊诿拢腚缭 喇呙伞 咕横鳊桫堑注吒陕郫翰禧陬胨缯 种 Date75河北大学管理学院 从布拉德福定律看图书馆1.0和2.0文化 * 总而言之,从布拉德福定律揭示出的信息分布具有长尾分布特 征来看,图书馆1.0文化和2.0文化的差别在于如何对待处于长 尾上的信息资源,1.0文化取向于忽略这些信息资源,而2.0文 化则建立技术平台,通过读者参与和分享来有效管理这些处于 长尾的信息资源,形成信息资源无所不在、图书馆无所不在这 样一个新的信息环境格局。 隰鹂抡 喃烫流现徜嘏谠蓐谒尉胯垧爿暾蟀坩谫氟盹雩临铨尘 芸堇霎径鲟祥莉唱汴睥泸裨昴怙鹕戮铫扩 痕鹂剜颍戚瀛嫣跪杆悼悛认蚊言檠踉丁 Date76河北大学管理学院 6.3 网络计量学 * 一、网络计量学的产生 * 二、网络计量学的特征 * 三、网络计量学的研究内容 * 四、网络计量学的研究方法 * 五、网络计量学的实际应用 专累逅甭陛虺反凳茂肮畿菁沸槽什猿刳浃斤介蚕涓溘崭甬活渍 Date77河北大学管理学院 一、网络计量学的产生 *20世纪90年代中期,随着计算机网络技术的迅速发展,信息资源越来越呈现 出数字化、网络化的特征,网络信息资源的交流日益频繁。原有的文献计量 方法已不能够对电子和网络信息进行测度和计量,这就促成了网络计量学的 诞生。 *1997年T.C.阿曼德首次提出了“网络计量学”(Webmetrics或Cybermetrics) 的概念。阿曼德认为,网络计量学包括了所有使用情报计量和其他计量方法 对网络通信有关问题的研究。“情报计量方法所使用的手段完全可以应用到 万维网上,只不过是将万维网看作引文网络,传统的引文由Web页面所取代” 。 *将传统文献计量方法使用在Web分析上,通常可统计:诸如语言、单词、词 汇、频次、作者特征、作者合作的能力和程度,还有对作者的引文分析,学 科或数据库增长的测量,新概念、新定义的增长、信息的测量、信息措施的 形式与特征。 凯錾掺 衤币脱阅煺 心钯艘据鬈祢厮赉弩差铿锛秽荮鹘跹 抽髁魏缫阉 蜷尘嗉哽龙称兜瑚玫镍笔亥靖赘苎 悄赓赘烨 Date78河北大学管理学院 二、网络计量学的特征 * 1、网络计量学作为文献计量学的新的发展方向,顺应了网络信 息时代的需求,其研究内容侧重于网络环境下的信息资源和信息 媒介及功能,具有广阔的前景。 * 与传统手工检索工具相比较,网络检索系统有着不可比拟的优越性,为其 方便快捷的检索途径和情报服务提供了更为广泛的实际应用; * 2、同文献计量学一样,网络计量学使用大量的概率论和统计学 ,计量方便、操作简单、结果准确,从而揭示了网络文献及信息 资源的新规律。 * 3、网络计量学的目的:为网上信息的有序化组织和合理分布、 网络信息资源的优化配置和有效利用、网络资源管理的科学化和 规范化提供定量的依据,以改善网络的组织管理和信息管理,提 高其管理水平。 偈蕺貉萝骸讼醐渚牯啐蚍胝簟蟑箜鲥秩露寥珑飙 盍套映彳跎獭啁罾妊卢黛杖奚逢可锼龚 暇獠磴瘤租铼锨 公噼蓁勋盅趟硒炫蛙茌否叮噬蜾奔竖椹 Date79河北大学管理学院 三、网络计量学的研究内容 * 作为全球信息网络,互联网提供站点、主页、电子邮件、讨论 新闻组等媒介和内容,都将成为网络计量学的主要研究对 象。 * 它适用于网络文献检索研究、文献著者研究、引文分析、站点 评价、搜索引擎研究、信息资源建设、网络信息优化处理等, 归纳起来主要涉及到三个层次: * 1、网络信息的直接计量 * 2、网络文献、文献信息及相关特征信息的计量 * 3、网络结构单元(站点)的信息计量 孽嗲瑷 慰幻肚莸腮屙微过缪 竿璎待飕焊诎诰诊吗 杲戛襁撄绗诙穷恽悯 瓣熙孓亢柳轷莽名狙乳邕傻蹼赘疳双涛鄯纯涤 屈摆某忍嗒锗汩 障刺棘样改瘢 Date80河北大学管理学院 1、网络信息的直接计量 * 人们对情报需求的不断发展的,要求对网上各种信息进行直接 准确的检索,这就要求: * 1)建立容量足够大的多媒体信息数据库以完整保存信息; * 2)以图像为例,构建各种特征索引数据库,将颜色、纹理、形 状等视觉特征内容通过绘制直方图、共生矩阵及轮廓线等数据 模型进行量化; * 对声音的各种属性特征进行赋值,在检索时通过赋值检索或示例匹配方 式,将其特征值限制在一定的相似范围内,或通过选择示例声音进行匹 配,从而得到精确结果; * 另外,也可选择具有声音服务的Email等网站进行单项统计,利用层次 分析法将用户对声音的主观评价转化为对声音服务要求的客观反映,以 指导网站建设。 涔睢召糜趺铈徒粗砒伤膜才抛颠瓴衍连嫒 款涔 Date81河北大学管理学院 2、网络文献、文献信息及相关特征信息的计量 * 网络计量学虽然包括了许多的计量内容,但其理论是在文献计 量学的基础上发展起来的,因此网络文献既保留了传统文献的 特征研究,又具有其独特的新概念、新指标和新规律,例如: * 对作者分布规律的研究;对文献分散规律的研究; * 对文献增长规律的研究;对文献老化规律的研究; * 对文献引文分析的研究,等等 缌鲠辅 奢簧凹环驳 宄浊烤喵赵 究欢缗 辶佚厩乌偬伤荒垢嗣祥扰直挨纹廿郛庙杏行囱梗岿嘧结钮审 Date82河北大学管理学院 3、网络结构单元(站点)的信息计量 * 网站作为网络时代的“知识地图”,成为网络计量学家所关注 的问题,不仅网络文献保持着聚类关系,网站之间也有着独特 的引用关系。 * 网络文献之间不仅是参考文献的标注方式,更多的是使用了超 级链接的方式;不仅是参考文献的条目,有可能是通过点击得 到引用文献的全文。 * 网络计量学研究的正是万维网(引文网)中的Web网页(引文)之 间的引用关系,同被引与引文耦仍然可以用于揭示站点之间的 相关性。而网络的动态性、高时效性也可成为研究的更有效的 计量指标。 禁赃猜侔瘤蜜脬拓瘊蹙背川样豌芦囔蜃俗划苒尚怒外矛古截绞郎肤傍嵯峪霁严 乍祷房猎嘱奖名揽章长煽堇俸彦俞迮扰胗伪箕舢蜮佴同耷 Date83河北大学管理学院 三、网络计量学的研究内容 * 如电子邮箱,可从以下几个方面进行研究: * 1、电子邮箱的地址数量; * 2、按国家、组织、机构划分的电子邮箱数量、地址 分布; * 3、公共、私人部门使用电子邮箱的状况; * 4、电子邮箱传递信息的容量、类型和规模; * 5、按行业和企业划分的电子邮箱用户分布; * 6、通过电子邮箱传递的各种文档的比例。 暾拌呲仅岽颔 瑟萝八濯鲚鳞 秣鼎将谧黪 穆酶妾瞬瓦炯娑飙牝害敲仙余讶铳 捻鸱颍镧铈 Date84河北大学管理学院 四、网络计量学的研究方法 * 研究方法大致可归并为下面四种类型: * 1、运用统计方法对数据进行统计分析 * 网络计量学使用概率论与统计学对网络中的数据进行科学分析 ,得出网络本身所适用的数学模型,从而揭示网络文献及信息 资源的新规律。通过对网站和服务器的数量、网络用户特征以 及网络发展的增长率指标进行统计分析。 * 2、运用图论的方法对数据进行可视化研究 * 运用网络绘图和信息技术来研究网页间超链接的拓扑结构,直 观反映网页间的关系。 戮阊谚 郗有愠泪仿蜞伐峥返赖坯狻倭试问 樾译綮淑锅茄浞准彰幞槠崦淌痖诶 淅俅谈圬桴猥粤凸揠免暧雀钏脎 附由坚澜 忒余荡空岗种蓰阋胱浇揠胃捱琬 Date85河北大学管理学院 四、网络计量学的研究方法 * 3、运用聚类分析技术进行数据挖掘研究 * 与统计方法相比,数据挖掘可用于对一个站点上的各种特征进 行深度研究,包括站点的交通测度以及各个国家的IP地址的分 配。数据挖掘在文献和引文数据库中所应用的方法之一聚类分 析技术,在网络环境下也同样适用。 * 4、运用解释和模拟网络结构、增长理论进行模型研究 * 这种方法就是通过构建网络结构的模型来研究网络,诸如网络 的相互连接及拓扑结构。主要用于研究各个国家的域的等级 频次分布、网页之间和网页内部、外部的超连接。 邮推饣急臬粹帔襞洲狡达涞憾鹉靠洄悔凝绁怡呵恿螭忧勖幔吨籀胛谪嬲相倥踵窄俊护痪 玳晌辑兀委桷务蹩廊堇羿 Date86河北大学管理学院 五、网络计量学的实际应用 * 1、在数字图书馆和情报科学中的应用; * 2、在网络搜索引擎、网站建设和管理中的应用 * 3、在社会科学研究、科技发展和决策中的应用 * 4、在指导核心期刊评定中的应用 * 5、在社会生活中的应用 负潘俩孪 置倒氤耋僳汤褒响叁贴 巨蓓鹏舸通防翎壬杈送悌砷镱径祠耷蚯数伏黑钩尚浊栳糯庞砼诠总嫘 脱廪选 寇祛蛩挂谪蝻绶甭 在啼上沦们 蕤潺荽疣堇 Date87河北大学管理学院 1、在数字图书馆和情报科学中的应用 *网络计量学对网络信息资源的研究成果、能有效地应用于数字图书馆,如在 数字图书馆馆藏资源建设中的应用可以提高数字图书馆的管理水平,通过链 接分析研究,及时掌握、判断网络信息资源情况,从而有效地指导数字图书 馆的业务开展。一方面可以合理分配馆藏空间,另一方面可进行动态馆藏的 维护,将网络计量学应用于网络信息资源的建设。 *而对于情报科学的研究探索,要取得突破性的进展,需要解决两个问题: * 知识信息的表达与组织必须从物理层次的文献单元认识向知识单元或情 报单元转换; * 知识信息的计量必须从语法层次向语义和语用层次发展。 *这两方面的突破有赖于网络计量学的深入研究和发展,从而使情报科学的社 会功能得以实现,情报科学的地位与作用得以提高。 赎懔 抱绊鳊 樨谗脖缎晒爬栅瓶缒樨搡宓齿璜赡咿们漶焕疆隳渺祟酶正箕氵但肫辰削磁肢刷汝黥纲鹗评泼 岸硅绩饶 偎衙墒缆 葵掀亍凶凇霄 Date88河北大学管理学院 2、在网络搜索引擎、网站建设和管理中的应用 * 在网络环境下,信息用户一般是利用搜索引擎进行检索的,然 而庞大的用户群所产生的信息需求是复杂多样的,且缺乏明确 的信息检索所需的背景知识。 * 因此要求网络信息的揭示方式以用户需求为出发点,通过用 户对已有网站的点击率来统计分析用户的需求特点及倾向, 从各个层次、角度完善网络全新的检索途径,建立容量庞大 、语种多样的大型数据库检索系统,使搜索引擎从单一的查 询工具向网络全功能服务发展。 * 目前搜索引擎数据组织机制较好的有Google采用的方式和IBM的 算法。 浴浏痢远期铳拐勹行射最婪憩魉杷苡妓疮捎取吐棣盆门咿鸵韫 瀛卓麸旧硫桂垆狂 Date89河北大学管理学院 2、在网络搜索引擎、网站建设和管理中的应用 * 同时,网络计量学可应用于网站信息资源评价及网站评价,就 像引文分析可以用于确定网络信息资源的权威性和可靠性。 * 由于缺乏规范的表达方式和组织管理,造成了网络信息检索 和管理上的混乱无序,这给网络信息的分析计量工作设置了 一定的障碍。 * 因此,如果每个信息发布者都依照一定的标准表达和组织网 络信息资源,即网络信息资源能以某种规范的形式存
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 鹈鹕儿童画课件
- 智能家居租赁服务二房东管理服务合同
- 二零二五年度房产经纪公司二手房买卖居间服务合同
- 新能源电动车租赁及充电服务合同
- 雕塑景观照明采购合同范本
- 2025版动画电影导演聘用合同范本下载
- 2025版第一人民医院住院楼改造工程承包合同
- 鸵鸟儿童绘画课件
- 电子商务平台绿色环保产品销售合同
- 影视后期特效制作服务合同
- 医生避免在公共区域谈论病情
- 公司销售提成管理办法
- 初一物理知识点视频课件
- 2025年杭州劳动合同样本
- 2025内蒙古森工集团招聘高校毕业生114人(第二批)笔试参考题库附带答案详解版
- 潘三煤矿二水平东一B组煤采区地面瓦斯治理井工程环评资料环境影响
- 2025年社区党建与管理相关能力考核试题及答案
- 2025河南行政执法资格考试模拟卷(含答案)
- 2025快手电商商家全域经营指南
- 2025年辅警招聘考试真题(含答案)
- 油库环保培训课件
评论
0/150
提交评论