科学计量学的研究主题与发展-基于普赖斯奖得主的扩展作者共现分析_第1页
科学计量学的研究主题与发展-基于普赖斯奖得主的扩展作者共现分析_第2页
科学计量学的研究主题与发展-基于普赖斯奖得主的扩展作者共现分析_第3页
科学计量学的研究主题与发展-基于普赖斯奖得主的扩展作者共现分析_第4页
科学计量学的研究主题与发展-基于普赖斯奖得主的扩展作者共现分析_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

科学计量学的研究主题与发展基于普赖斯奖得主的扩展作者共现分析 情报学报第卷第期,年月,年月日作者简介许诲云,女,年生,博士研究生,主要研究方向知识管理与科学评价。 。 方曙,男,年生,研究员,博士生导师,主要研究方向科技情报分析与研究、图书情报科学理论与应用研究。 科学计量学的研基于普赖斯奖得主许海云,(中国科学院国家科学图书中国科学院研究生摘要科学计量学()是用数学方法研究中较为成熟的定量研究方法被用于多个科学领域的研究与方法,针对传统的分析方法存在的不足给出分析说明者共现网络的结构特征进行测度。 本文选择截止到奖得主作为分析对象,通过这位在科学计量学领域有突体结构和研究合作网络特点。 关键词科学计量学作者共现作者同被9社会,(,(),科学计量学诞生于世纪年代初,是一门用数学方法研究科学的量化特征和发展机制的学科,科学计量学通过计量信息的获取与存储、知识的生产与流动、知识的离散与重组,辅助学科领域的研究者发现领域研究的热点及前沿,并作出科学评价。 科学计量学作为科学学研究中较为成熟的定量研究方法已被用于多个科学领域的研究与应用。 从普赖斯的巴比伦以来的科学和大科学,小科学到加科学计量学的研究主题与发展基于普赖斯奖得主的扩展作者共现分析菲尔德的科学引文索引,科学计量学在科学学研究中尤其在描述学科的演进发展方面取得了诸多卓有成效。 世纪末期,科学计量学在经历了一段强劲发展之后进入了反思的过程。 科学计量学、知识可视化不仅同基于非相关文献的知识发现一样面临着科学知识巨量性的挑战,而且还面临着科学知识复杂性的挑战。 诸多学者在反思中提出颇有争议的问题,不同研究者的研究方法、研究对象、指导思想等大相径庭,因此需要对科学计量学自身进行多方面的深入研究。 不少学者通过选取代表性的科学计量学领域的期刊和作者,对科学计量学研究的主题结构、前沿领域或者与其他学科的交叉性等多个方面做了研究。 把科学计量学研究内容主要分为个部分科研指标与科学活动评价,科学技术的文献计量信息系统,科学与技术的交互作用,科学学科领域的认知结构及社会组织结构。 将科学计量学的分为个主要的分支学科领域结构科学计量学、动态科学计量学和评价科学计量学。 以往通过共现方式对学科主题及结构的研究大都选取高被引作者或者关键词高频共现进行分析,而由于学科知识的复杂性,高被引的另一类现象值得我们深入研究。 根据引文半衰期的不同,科学文献可分为持续高被引的经典文献和在短暂时间内达到被引峰值的过渡文献和文献,而有的过渡文献转化为了研究领域的经典文献,而有的过渡文献仅成为一段时间内的关注热点文献。 因此通过高被引和强共现的方法研究学科主题和结构可能带来偏差。 本文借助广义的作者共现分析方法,选择截止到年为止的位普赖斯奖()奖得主作为分析对象,通过这位在科学计量学领域有突出贡献的作者共现分析,发掘科学计量学研究领域的主体结构和研究合作网络特点,以及科学计量学近几十年的研究主题的发展变迁。 本文选择研究领域内得到学科共同体承认的重要研究人员作为共现作者分析数据,可以在一定程度上弥补仅依靠高被引和强共现的数量确定学科主题和结构的潜在问题。 作者共被引分析方法传统的作者同被引方法年和分别提出共被引分析方法,其基本定义为当两篇文献(作者)同时被三篇文献引用,那么这两篇文献(作者)就存在共被引关系。 年德瑞克赛大学的和提出了作者共被引分析方法(,)。 作者共被引的假设前提是经常一起被引用的作者,则表示他们在研究主题的概念、理论或方法上是相关的。 为此,共被引分析认为作者共被引的次数越多,他们之间的关系就越密切,“距离”也就越近。 利用现代的多元统计技术如因子分析、聚类分析和多维尺度分析等,则可以按这种“距离”将一个学科内的重要文献(作者)加以分类,从而鉴别学科内的科学共同体或隐性学术群体(),绘制“科学地图”,使之可视化()这种方法从特定学科或特定领域的核心著者的同被引入手,探讨学科结构和流派等问题。 同传统的学者个人归纳、访谈调查等主观分类方法相比,共被引分析最大的优势是它的客观性、分类原则的科学性和数据的有效性。 经过多年的发展,特别是提供的引文数据库使引文结构的大样本统计分析越来越便利,共被引分析已成为实证研究科学共同体的结构的主流方法,广泛用于很多学科领域。 借助网络检索工具的作者共被引扩展广义作者共现共被引分析的目标是分析研究对象的关联强度,从而根据科学共同体的划分而分析研究领域主题的划分,而这种联系强度借助网络检索工具可以得到很大程度的完善。 两个作者除了同时被第三个作者引用说明他们存在研究主题的联系,以下几种情况同样能说明作者间存在关联,存在研究主题的联系()一个作者常引用另外一个作者的论文,或者文中常引用另外一个作者的论点;()两个作者常合作发表论文;()两个作者常共同出现于同一篇文献之中。 找到更多表征两作者之间联系的变量可以使他们之间的关联强度更准确,对于数据库检索而言目前还不能实现这种多角度的共现检索,但借助网络搜索工具(谷歌学术)可以在一定程度上实现这种多角度的共现分析。 分析过程本文按照提出的分析的六步过程情报学报第卷第期年月进行分析选择共被引作者、检索共被引频次、构造共被引矩阵、转化为相关系数矩阵、多元分析和结果解释。 同时本文针对传统的分析方法存在的不足给出分析说明,并给予相应的改进。 选择共现作者并获取共现矩阵普赖斯()是对科学计量学的奠基和发展起着最重要作用的科学家,被称作“科学计量学之父”。 年普赖斯去世,为纪念他对科学计量学学科建设的卓越贡献,科学计量学领域设立了以他的名字命名的最高学术成就奖普赖斯奖()。 普赖斯奖得主是科学计量学研究中最有影响的代表人物,他们为开创或发展当代科学计量学做出了突出贡献并产生了巨大影响,他们所代表的学科领域、相互关系以及最为关注的研究课题值得我国科学计量学界密切关注。 该奖项自年首次颁奖至今已颁发了届,共人获奖。 本文选择位普赖斯奖获得者作为共现分析的对象,普赖斯奖得主获奖年份及姓名与国籍见表。 由于的对收录对象具有局限性,而和对引文分析的介入,使得引文分析能力更加强大。 已有研究,表明的对会议论文以及非英语的出版物覆盖更为全面,对引文数据更为全面。 因此本文对位普赖斯奖获得者的共被引分析选用进行检索,参考已有研究的检索方法“作者作者发文量载文”。 但这样的检索策略虽然可以在一定程度上去除一些计量著者发文等相关的文章,避免放大学者之间的共被引强度,但是位获奖得主的计量学研究对象因为涉及文献计量方法,所以自身包括大量对文献计量研究的关键词,因而上述检索策略会在很大程度上减弱作者之间的联系强度。 本文检索策略为在高级检索界面“包含全部字词”对话框中输入“作者作者”,该检索策略的检索结果包括()期刊中,参考文献中同时引用作者与作者的著作的论文;()作者与作者合作发表于期刊的论文;()作者发表于期刊并且文中引用作者的文章,作者同理;()作者发表于期刊并且文末参考文献中出现作者的文章,作者同理;()作者与作者同时在研究(科学计量学)内容的论文;()作者与作者同时在研究内容的文末的参考文献中出现。 上述六种主要情况中第一种属于和提出的作者共被引分析方法(),但按照本文扩展的作者共现分析,后面五种也是两个作者之间关联紧密度的体现。 经过获奖得主的两两组合,得到最终的同被引作者共现矩阵,表给出部分数据。 表普赖斯奖得主获奖年份及姓名与国籍年份获奖者国籍年份获奖者国籍美国美国美国德匈匈牙利荷兰苏联比利时美国比利时美国荷兰英国丹麦捷克美国匈牙利美国荷兰匈牙利美国法国英国瑞典英国科学计量学的研究主题与发展基于普赖斯奖得主的扩展作者共现分析表赖斯奖得主的作者共现矩阵(部分)相关系数矩阵分析的对角线取值的问题存在诸多争论。 和曾将对角线值定为排序前三的共被引频次之和的一半;主张对角线值定为缺失值;主张应该使用作者自己与自己实际共被引次数;则建议使用最大值来确定对角线的值。 本文认为共现作者自身应该和自己的共现关联度最强,且作者自身被引频次同时应该是该作者与其他作者共被引频次中的最大值,且本文所获取的作者共现矩阵数据也符合本观点,因此本文取作者与自己的共引次数作为共现矩阵的对角线值。 对于共现矩阵相关系数的选择,多数研究采用传统的皮尔逊相关系数法,但已经说明了皮尔逊相关系数仅仅是表明两个变量的线性相关,并不适合处理作者共现强度相关性问题,应用皮尔逊相关系数存在诸多问题首先,皮尔逊相关系数存在数据的敏感性。 皮尔逊相关是对正态分布数据的积距相关性测度,总体的皮尔逊相关系数是通过原点矩来定义的,所以二元概率分布的总体协方差以及变量边缘总方差必须是有意义且是非零的。 因此,在实际应用过涉及数据在尾部集中分布,或者是存在零模块的矩阵应用皮尔逊相关系数是不合适的。 其次,对于二元正态分布,若已知变量的边缘分布的均值和标准差,那么由皮尔逊相关系数就可以完全确定该分布的特性,并且样本的相关系数是总体相关系数的极大似然估计,并且具有渐进无偏性和有效性。 对于非正态分布情况就改变了,但不论变量之间的联合概率密度函数是否是正态的,皮尔逊相关系数都是用来衡量两随机变量之间的线性相关程度的,样本相关系数依然是渐进无偏的,但可能不是有效的估计。 同时曾验证了转化为皮尔逊相关系数会引起信息缺失,并建议采用原始矩阵代替相关系数矩阵。 本文认为同一领域不同研究主题的论文引用也存在引用行为的差异,应用原始数据做统计会带来误差,因此主张采用对原始共现矩阵做标准化处理,并选用相关系数作为度量强度标准。 多元分析过程和解释()聚类分析利用统计软件做共被引作者的聚类分析,在上文分析的基础上选择系统聚类方法的组间聚类法,度量标准选择区间标准的相关系数法,并按照个案的得分进行标准化,得到树状图如图所示。 通过图的作者共现聚类,可以直观的看出位作者在科学计量学领域研究中的共现强度的亲疏远近关系,而且位作者并没有明显的划分为为几个主体,从而也说明为作者的研究并非仅涉及主题单一,因此,需要借助因子分析和多维尺度分析进一步进行研究流派的划分。 情报学报第卷第期年月()因子分析因子分析中取特征值大于的个特征因子,它们能够解释全部方差的,且每个因子的负载大小相差较小。 作者共现分析的因子分析作者负载矩阵(负载?略)见表。 图作者共现聚类表因子分析作者负载(负载省略)作者作者科学计量学的研究主题与发展基于普赖斯奖得主的扩展作者共现分析图多维尺度分析图()多维尺度分析本文未采用通过原始共现矩阵创建邻近矩阵()的方法,而是选择从数据创建的方法,非相似矩阵的构建选择区间标准的欧式距离,并按照得分方式进行标准化处理。 多维尺度分析的聚类结果如图所示(标准化初始应力)。 对照聚类分析和因子分析的结果,由于因子分析的方差解释能力不是很理想,同时多维尺度分析的压力系数不是太理想,本文在定量研究的基础上,结合已有研究成果,以及对共现作者的文献阅读,合并第一和第四主成分,将共现分析作者群分为类。 第一类作者群为引文分析理论的研究群;第二类作者群为评价计量研究群;第三类作者群为知识图谱研究群;第四类作者群为共现分析主题的研究群。 其中,和这五位作者为引文分析理论的主要研究者,同时他们是早期计量学的主要研究者,因此共现的强度也较大。 ,和这位作者为评价计量的主要研究者。 ,和,是研究知识图谱主题的主要研究者,从多维尺度分析图中可看出他们位于位共现作者网络的中卜,知识图谱研究位于科学计量学研究的中卜位置,知识图谱研究是近几年科学计量学研究的热点。 知识图谱的研究需要综合包括科学计量学在内的多方面知识基础,属于交叉研究领域,包括引文计量分析,评价计量分析,共现分析以及计算机可视化技术等。 ,和这位作者为共现分析的主要研究群体。 作者共现的网络结构分析过程及解释传统分析方法中的因子分析和多维尺度分析虽然提供了可视化的直观图,但缺乏确定聚类结果的指标,因此在最终的聚类结果分组时还要更多的借助主观判别。 另外,从上文的分析过程及结果可看出,对于探索型问题的研究在应用因子分析方法选取主要因子时往往造成信息的损失,而多维尺度分析在数据由高维降到降维时也会出现压力系数不够理想状况下的数据结构的扭曲。 借助目前的社会网络研究方法中的网络指标,分析位作者构成的共现网络的密度,共现的核卜边缘结构,得到位普赖斯奖得主的共现网络结构特征,寻找更为核卜的作者,对因子分析方法及多维尺度分析方法形成补充。 ()共现网络图利用的知识图谱可视化软件对作者共现矩阵做可视化,根据原始矩阵数据的数值特征,本文选择共现强度大于的节点阈值,该作者共现网络属于权重无向网,可视化结果如图所示。 情报学报第卷第期年月图作者共现网络图从作者共现网络图中可以直观地看出,在一定的共现阈值下(共现强度大于的节点),作者间的共现强度差异较大,并出现了孤立点。 但可以看出该位科学计量学研究的重要人物在较大阈值下仍存在共现关系,并且多数作者之间都互有联系,属于紧密联系的网络,并且存在多个联系的中间人。 ()共现网络的密度网络的密度描述了一个图中各个点之间关联的紧密程度。 一个“完备图”指的是一个所有点之间都相互邻接的图。 密度这个概念试图对线的总分布进行汇总,以便测量图在多大程度上具有这种完备性。 固定规模的点之间连线越多,该图的密度就越大。 具体地说,密度指的是一个图中各个点之间联络的紧密程度。 网络结构中存在紧密和松散两种关系,两种关系对于网络内成员的沟通和交流的影响是不同的。 对于关系紧密的网络,网络成员之间的合作行为会比较多,信息的流通会相对的容易和顺畅,反之则不利于信息的流通。 分析位作者共现网络的密度值可以衡量科学计量学的重要研究人员在合作交流以及研究交叉的程度。 而且整体网络的密度越大,该网络对其中行动者的态度、行为等产生的影响可能越大。 联系紧密的整体网络不仅为其中的个体提供各种社会资源,同时也成为限制其发展的重要力量。 本文利用沿路径将原始的共现矩阵二值化处理,在框中选择“”,在框中输入不同的共现频次值(),得到不同阈值下的网络密度,计算结果见表。 通过图可以看出随共现频次的变化网络的密度和标准差的变化趋势,网络密度随着共现频次的增加而减弱,而关系标准差先是增长之后也呈减弱趋势。 可见作者之间的共现关系随着共现频次的增加先是趋于不一致,随共现频次的继续增长又趋于平稳,共现频次约集中在,的区间范围内。 通过表和图可以看出位普赖斯奖得主的研究联系密切,虽然关系的强度不同,通过直接或者间接的联系都有所交叉,也促进了科学计量学各个研究主题的交叉扩散。 ()网络核心边缘结构分析核心边缘结构是由若干元素相互联系而构成的中心紧密相连、外围稀疏分散的网络结构。 这种类型结构中,处于核心区域的节点将不能分割为多个互斥子群的网络结构,同时处于边缘的节点仅与各B相对的某些核心节点保持紧密关系,而外围节点彼此之间联系稀疏并呈现散射状边缘分布。 本文利用对位作者在科学计量学研究领域的共现网络进行核心边缘结构分析,计算出每位作者的核心度,同时确定出整个共现网络的核心人物。 本文使用原始共现矩阵作为数据,在中沿路径,选算法,所得计算结果按照从高到低的顺序排列如表所示。 科学计量学的研究主题与发展基于普赖斯奖得主的扩展作者共现分析表共现网络的密度及标准差共现频次网络密度关系标准差共现频次网络密度关系标准差图网络密度与标准差趋势散点图情报学报第卷第期年月表共现网络的核心度排名作者核心度排名作者核心度位普赖斯获奖者的共现网络相关系数为,排名在前的作者是核心区作者,集中度为。 因此这位作者在与其他作者的科研交流与合作中发挥着更积极的作用。 的核心度最高(),的核心度最低(),这一结果可参照图的作者共现网络图可以看出提出的共现分析是科学计量学目前用于主题前沿发现以及科研合作的中要方法,共现分析也是目前科学科学知识图谱用于前沿发现的重要算法,对整个科学计量学的交流网络起

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论