5布拉德福定律_第1页
5布拉德福定律_第2页
5布拉德福定律_第3页
5布拉德福定律_第4页
5布拉德福定律_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

会计学15布拉德福定律集中与分散规律实验参考表格12345678910期刊名称期刊性质论文关键词所属学科涉及各专业论文数第1页/共59页第五章科学信息的集中与分散规律张雪艳第2页/共59页教学要求掌握文献分散规律研究中的相关概念。熟悉Bradford定律的文字描述及其数推导。掌握Vickery对Bradford定律的修正。掌握Brookes公式及其参数。掌握Bradford定律应用中的基本技术和方法。主要内容Bradford定律的产生。Bradford定律的区域、图象和数学描述。Bradford定律的几个重要推论及其分析。Bradford定律的应用技术和方法。第3页/共59页第一节布拉德福定律的形成背景一、几个基本概念相关文献(relevantliterrature)凡属同一个学科、专业或特定主题的文献。非相关文献(unrelatedliterature)文献分布规律文献在一定时期内空间上分布的总趋势。布拉德福定律(文献数量/期刊数量)洛特卡定律(文献数量/著者数量)齐夫定律等(文献中词频/等级序号)第4页/共59页第一节布拉德福定律的产生二、布氏定律的创始人——布拉德福

S.C.布拉德福(SamuelClementBradford,1878一1948)是世界著名的文献学家和化学家。创立了布拉德福文献分散定律,是文献计量学的主要奠基人。布拉德福是一位多产作家,主要有:《理论科学与应用科学著作的分类》、《分类原理》、《科技目录的组织》、《图书馆编目》等他还发表过许多论文,较著名的有:《国际十进分类法的起源、目的、结构及其使用》、《文献工作五十年》、《科学技术的全部文就工作》、《专门学科的情报源》,等等第5页/共59页三、布拉德福定律的产生背景文献分散是普遍的客观现象科学统一性原则文献统计研究是布氏定律产生的基础布拉德福认为,总是会有若干期刊,它们的内容与某个学科更近些;而总会有数量更多的期刊,它们的内容离这个学科更远些;专门面向这个学科的核心期刊,亦即大量包含这个学科内容的最少数的那一部分期他论述这个学科的论文,数量一定要多于论述有关学科的论文第6页/共59页

四、布拉德福定律的产生

琼斯和布拉德福的研究琼斯(E.L.Jones):《最新应用地球物理学目录》(AppliedGeophysics,1928-1931),季刊,4年《润滑作用目录季刊》(Lubrication,1931.6-1933),2.5年布拉德福:BradfordS.C.SourcesofInformationonSpecificSubjects[J].Engineering,1934.BradfordS.C.Documentation[M].London:CrosbyLockwood,1948.第7页/共59页观察结果:文献的分散各学科专业文献除了密集地登载于本学科的专业期刊,即“核心期刊”(coreperiodicals)外,还登载于大量本专业的边缘期刊(borderlineperiodicals),即“相关期刊”,以及更一般化的其它学科的期刊(gerneralperiodicals)上。由于后二者期刊的分散,难以查找特定专业的论文,因此往往导致专业文献的漏摘、漏标,使得大量论文“流失”。第8页/共59页核心期刊效应二次文献在摘录某一专业论文的时候,往往注重学科影响较大的“核心”类期刊,而忽视了非核心类的相关期刊,造成大量论文的重复摘录。对此,布拉德福提出了一个带有规律性的假设,即:任何学科的绝大多数专业文献都集中于少数的本专业的期刊内,但同时也散布于其它的相关期刊中。布拉德福的上述研究结论对于探讨文献分散规律是致关重要的。后经布拉德福的同事,琼斯(E.luncastJones)的继续研究得以深入。第9页/共59页核心期刊效应具有广泛性二次文献(文摘、提录、索引)的核心期刊效应1967年,UNESCO的一篇文章指出:“从物理学和化学领域的重要文摘杂志中发现了一条规律,它们所列出的或编成文摘的75%的论文仅来自它们所收摘的全部期刊的10%”流通量的核心期刊效应1969年,[美]高夫曼(W.Goffman)等人通过统计分析证实,按期刊流通量数据的分布近似服从布拉德福文献分散规律,存在核心期刊效应。被引量的核心期刊效应1971年,加菲尔德(Garfield)在统计了2000种期刊中的100万篇参考文献后发现,24%的被引频高的文章出自25种期刊,50%的出自152种期刊,75%出自767种期刊,而其余的被引文章则散布在数量大得多的期刊中。证明了被引文章在期刊上的分布也有一个较为集中的核心区与广为分散的相关区。第10页/共59页有许多研究表明,由上述因素派生的其他因素如:被摘率、影响因子、即时被引率等也都具有核心效应。核心期刊(Core

Journals):“某学科(或专业,或专题)的核心期刊,是指该学科所涉及的期刊中,刊载论文较多的(信息量较大的),论文学术水平较高的,并能反映本学科最新研究成果及本学科前沿研究状况和发展趋势的,较受该学科读者重视的期刊。”

——《中文核心期刊要目总览》基本标准:“载文量多”、“收录量大”和“被引次数多”。第11页/共59页第二节

布拉德福定律的内容

一、布拉德福定律的区域划分和文字描述数据统计按每种期刊刊载相关论文数量的大小递减排列,即“降序排列”(见B项)。第12页/共59页应用地球物理学润滑ABCDEABCDE1931930122122018621790.30111823400.30115632350.4771155550.47714842830.6022136810.69914653290.69921071010.84513563640.7881981100.90312873920.84538111341.04112084120.9033714155195416151611.176416134931.11475221961.342115145081380514195781.279133372431.568112205901.301252622931.792211226121.34210211643952.125510276621.431

A:期刊数量(种)

B:每种期刊相关论文数

C:A项累积和

D:A×B的累积和

E:logC39306891.47788387531.58077458021.653116568681.748125689281.833174859961.92923310810652.03349215711632.196169132613322.513布拉德福数据第13页/共59页区域划分将观察数据在递减排列的基础上,按如下原则划分为三个区。使各区域中期刊对应的论文数量大致相等。分区期刊载文数量(篇/年)应用地球物理学润滑期刊数量论文数量期刊数量论文数量IN>494298110II1>N≤45949929133III0>N≤1258404127152第14页/共59页Bradford'sLawofScattering9sources429articles59sources499articles258sources404articles核心区相关区边缘区第15页/共59页文字描述

“Ifscientificjournalsarearrangedinorderofdecreasingproductivityofarticlesonagivensubject,theymaybedividedintoanucleusofperiodicalsmoreparticularlydevotedtothesubject,andseveralgroupsorzonescontainingthesamenumberofarticlesasthenucleus,wherethenumberofperiodicalsinthenucleusandsucceedingzoneswillbeas1:a:a2...”

第16页/共59页

如果将科学期刊按其登载某个学科的论文数量的大小,以递减顺序排列,那么可以把期刊分为专门面向这个学科的核心区和包含着与核心区同等数量论文的几个区。这时,核心区与相继各区的期刊数量成1:a:a2

……的关系。

式中a

为布氏系数。根据布氏数据,a≈5第17页/共59页二、图像描述及数学推导图像描述

布拉德福相关论文分布曲线A4.0

A-应用地球物理学B-润滑学论文累积数lognAB15001200900600300

20406080100第18页/共59页2023/1/16第五章布拉德福定律20两种表示法是等价的吗?比较:假设一定时间内(通常为一年)共有N种期刊刊载了某学科的论文(简称为“相关论文”)K篇,将这N种期刊按照所载“相关论文”的数量降序排列,然后,将该序列划分为三个区,使得每个区所包含的”相关论文“的数量相等(即“K/3篇”),则:区域法:各区的期刊数量满足等比关系;

n1:n2:n3=1:a:a2

(a>1)图像法:前面各区的期刊累积数量满足等比关系。

α:β:γ=1:b:b2

(b>1)其中,α=n1;β=n1+n2;γ=n1+n2+n3

结论:“区域表示法”和“图像表示法”之间,存在着无法统一的矛盾。第19页/共59页2023/1/16第五章布拉德福定律21两种表示法哪个更准确?“区域派”F.F.Leimkuhler、W.Goffman、……“图像派”B.C.Brookes、M.G.Kendall、……第20页/共59页2023/1/16第五章布拉德福定律22文献为什么“离散”?科学统一性原则:每一个科学学科都或多或少,或远或近地与其他任何一个学科相关联。因此,属于某学科的文献,不仅仅会出现在这个学科的专业期刊上,而且也时时可能出现在其他学科的期刊上。文献为什么“集中”?成功产生成功的原则(thesuccess-breeds-successprinciple):一种期刊的文献量越大、质量越高的期刊,作者就越愿意将自己的文章刊登在这些期刊上,形成了一种“堆加效应”。“文献分布的集中与离散规律”第21页/共59页第三节

布拉德福定律的修正和发展

一、维克利推论

英国文献学者维克利(B.C.Vickery)对布拉德福定律研究的两项重要突破:

推论1.严格讲,布拉德福曲线的“PB”段并非一直线。

推论2.三个区域的划分并非是唯一的,区域数量可扩展。

第22页/共59页二、布鲁克斯公式及其参数分析(一)布鲁克斯公式

1968年和1969年,英国著名文献学家布鲁克斯(B.C.Brookes)分别在《文献工作》(JournalofDocumentation)和《自然》(Nature)上公开发表文章(Bradford'slawandbibliographyofscience,Nature,1969(224):953-956),先后针对布拉德福文献分散曲线给出了相对应的数学模型,对布氏图形法的发展做出了突出的贡献。第23页/共59页1968年布鲁克斯提出的公式中,只对布拉德福曲线采用唯一的数学模型进行表示,即:

R(n)=klnn

1969年,布鲁克斯提出采用“分段”的方法,对布氏曲线采用不同的数学模型进行描述的设想,并建立了相应的数学模型,即:

R(n)=αnβ(1≤n<c)R(n)=kln(n/s)(c≤n≤N)第24页/共59页A4.0

A-应用地球物理学B-润滑学论文累积量R(n)lnnAB15001200900600300

20406080100R(n)=αnβ(1≤n<c)R(n)=kln(n/s)(c≤n≤N)s第25页/共59页布鲁克斯的数学公式ant(1≤n≤c)R(n)= Klg(n/s)(c<n≤N)R(n)----对应Nde相关论文的累计数n为期刊等级排列的序号a为第一级期刊中相关论文量R(1)C----核心区的期刊种数,即由曲线过度到直线交点对象的n值N为期刊排列的期刊总数t为参数,与核心区的期刊数量相关,大小等于曲线的曲率K为系数,等于分散曲线中直线部分的斜率S为参数,等于图象直线部分向横坐标延伸并与其相交点的n值第26页/共59页(二)Brookes公式的几何性质1.对R(n)=klnn模型的分析(1968)对于模型R(n)=klnn

设lnn=x

则R(n)=kx当x=0R(n)=0即lnn=x=0

此时,n=1即:R(1)=0结论错误:在按论文数量等级降序排列组织数据中,等级序号为1的期刊发表的相关主题论文数量为零!这个结果与数据分布实际是不相符合的。第27页/共59页应用地球物理学润滑ABCDEABCDE1931930122122018621790.30111823400.30115632350.4771155550.47714842830.6022136810.69914653290.69921071010.84513563640.7881981100.90312873920.84538111341.04112084120.9033714155195416151611.176416134931.11475221961.342115145081380514195781.279133372431.568112205901.301252622931.792211226121.34210211643952.125510276621.431

A:期刊数量(种)

B:每种期刊相关论文数

C:A项累积和

D:A×B的累积和

E:logC39306891.47788387531.58077458021.653116568681.748125689281.833174859961.92923310810652.03349215711632.196169132613322.513布拉德福数据第28页/共59页2.对R(n)=kln(n/s)模型的分析(1969)对于模型R(n)=kln(n/s)

设lnn=x

则R(n)=klnn-klns=kx-klns当x=0即lnn=x=0

此时,n=1R(1)=-klns式中,k>0,s>0当s>1,R(1)<0当s=1,R(1)=0只有当0<s<1,R(1)>0显然,R(1)<0和R(1)=0的结果与数据分布实际是不相符合的,因此必须对布氏曲线采用不同的数学模型分段描述。第29页/共59页(三)Brookes公式的参数分析1.可以证明:在N足够大时,

k≈N

N——期刊总量,即在等级降序排列中最末一级期刊的等级序号。

将k≈N代入模型:R(n)=kln(n/s)(c≤n≤N)中,则可得到以下重要结果:

第30页/共59页应用地球物理学润滑ABCDEABCDE1931930122122018621790.30111823400.30115632350.4771155550.47714842830.6022136810.69914653290.69921071010.84513563640.7881981100.90312873920.84538111341.04112084120.9033714155195416151611.176416134931.11475221961.342115145081380514195781.279133372431.568112205901.301252622931.792211226121.34210211643952.125510276621.431

A:期刊数量(种)

B:每种期刊相关论文数

C:A项累积和

D:A×B的累积和

E:logC39306891.47788387531.58077458021.653116568681.748125689281.833174859961.92923310810652.03349215711632.196169132613322.513布拉德福数据1158116411591165……16813251331R(N-1)13261332R(N)第31页/共59页2.参数s的意义布氏分散曲线中“直线”部分的反向延长线在横轴上的交点为lns。可通过作图获得。布鲁克斯认为,s值的大小可用于衡量被调查文献所属学科(专业)的范围。一般情况下,s值的大小随专业范围的扩大而相应增大。不同学科,其s值亦不同。

s↑→学科范围↑在R(n)=Kln(n/s)中,令R(n)=0则lnn=lns

(在横轴上的交点)第32页/共59页lnsR(1)=α

第33页/共59页学科范围和相应的s值学科S值维生素学1.0图书馆学1.0情报科学2.6计算机科学2.4肌肉纤维3.0热带和亚热带农业8.4农业经济和农业科学12.0第34页/共59页3.参数的几何意义对于曲线部分即,曲线部分交于纵轴的焦点为为等级序号为1的论文数量R(1)的值。第35页/共59页lnsR(1)=α

第36页/共59页三布拉德福定律的解释

(一)、布拉德福定律的形成机理

学科因素学科的分化、交叉与渗透——相同主题论文在不同学科期刊中的分布。社会因素老子/马太效应(MatthewsEffect)——成功产生成功,累积优势分布。最省力法则(PrincipleofLeastEffort)——核心信息源的自我选择,文献的堆积效应。第37页/共59页格鲁斯指出“布拉德福曲线在进入直线部分后,并非无休止地直伸下去,后来总要弯曲下垂,因而使得布拉德福定律的图形变为明显的三个部分:上升的曲线部分,直线部分和弯曲的下垂部分。Groosdroop第38页/共59页(二)、布拉德福定律的适用条件学科(专业或主题)的范围应该界定清楚。对所研究学科文献的时间期限的选择应该恰当。即“载文量”的确定和计算应取一定时期该学科文献载文总量的均值(一般以“年”为单位),而非每种期刊的平均载文量。对所研究的期刊论文的统计应该尽量充分。可以采用具有权威性,且覆盖面相对较广的二次文献做为数据的来源。第39页/共59页第四节

布拉德福定律的应用

第40页/共59页一、布拉德福定律在文献收藏和管理中的应用

1.核心期刊的确定

思考:以上按期刊载文数量的绝对值来组织数据,将位于C以前的期刊均视为核心期刊,而其后的期刊不论其实际质量如何均被排斥在核心期刊之外,这样是否合理?第41页/共59页结论:核心区的大小可以根据需要划定。核心区应遵循包含较少数量的期刊、对应较大评价量的原则。当需要较完整收藏和较高文献保障率的时候,可以选择较大的评价量(如80%),当需要少量最精粹的出版物的时候,可选择较少的评价量(如30%)。第42页/共59页2.优化期刊采购方案

f=50%、70%、90%s=3,N=600$30/刊/年所需经费?→第43页/共59页3.考察专著的分布,确定核心出版社

216核心出版社第44页/共59页二、布拉德福定律在情报检索中的应用计算拟检索的某学科或专业论文及其相应期刊的数量根据检索要求,估算被检期刊的最小数量检出效率的计算参数值s与论文检出效率(a2)的关系期刊检出效率(a1)与论文检出效率(a2)之间的关系第45页/共59页1.计算拟检索的某学科或专业论文及其相应期刊的数量获取原始数据等级降序组织数据图形分布观察选取“直线”上两点联立方程求解(s、N)第46页/共59页R(n1)R(n2)第47页/共59页2.根据检索要求,估算被检期刊的最小数量令f为论文的检出要求(检出率),则

例:如果f=50%,N=320,s=2,根据上式计算得知,被检期刊数量至少应达到25种才能满足50%的论文覆盖率(查全率)。第48页/共59页3.期刊检出效率(a1)和论文检出效率(a2)的计算期刊检出率(a1)论文检出率(a2)第49页/共59页4.参数值s与论文检出效率(a2)的关系

a2=f(s)求导即随着参数s

值↑,论文检出效率a2↓。第50页/共59页5.期刊检出效率(a1)与论文检出效率(a2)之间的关系将期刊检出效率公式a1=n/N

代入论文检出效率公式,可推导:此时,若已知要求检索论文的检出效率(a2

),以及期刊的平均载文量(),利用上式很容易计算出能够满足论文检出效率的期刊检出效率(a1

)的值。第51页/共59页三、在其他领域中的应用

核心资源分布的多学科研究核心资源分布的社会学理论老子学说(Laozi'stheory)马太效应(Mattheweffect)卢梭定律(Roussean'slaw)(1712—1778年)本书是1755年卢梭应法国科学院的征文而写的论文,文中提出了私有制的出现是人类不平等的起源这一光辉思想。恩格斯对此书评价很高,认为它是十八世纪中辩证法的杰作。第52页/共59页

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论