版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
文献共被引方法在宇称不守恒发现过程中的应用
科学哲学的研究表明,虽然没有深入研究科学发现的严格逻辑渠道,但科学发现有几种模式,其特点是。指的是科学发现中不同元素和环节之间的关系或关系的形式。这种形式可代表科学发现的某些类型。在科学发现中没有普适的逻辑结构,但是在相似的科学发现类型中可以有相似的模式,了解这些模式有助于我们理解特定的科学发现,进而有助于我们认清科学发现的本质。很少有研究从科学文献或科学知识的角度探究科学发现诸要素间的联系,进而总结科学发现模式。那么,如何建立科学发现的知识结构,如何通过知识结构反映科学发现的知识来源、知识间的关系与知识更新的过程,进而总结出相应的科学发现模式,就成为知识视角下研究科学发现的重要问题。本文试图通过科学计量学的方法,以“宇称不守恒”这一获得诺贝尔奖的重大科学发现为案例,对此问题进行探讨。1科学问题的提出波普尔认为在物理世界与人的主观精神世界外,还存在一个由客观知识构成的世界,并把它们分别称为世界1、2、3。世界3由世界2所创造并且反馈于世界2,制约着科学家的主观精神世界。这说明科学家的主观看法不仅取决于科学家的非理性思维,还取决于世界3所代表的客观知识世界的发展历史。新的科学发现所产生的科学知识在进入世界3后,会改变其结构从而改变其产生科学问题的“问题情境”。世界1与世界3不能直接相互作用,它们必须通过世界2的中介功能才能完成相互间的互动。也就是说作为客观知识的科学是不能直接从物质世界得到,也不能作用于物质世界。它必须通过人的主观精神的作用先把自然客体或现象化为主观的想法和经验,然后才可能纳入到科学知识体系中去;反之,科学定律或科学理论也只有通过人的主观理解才能应用于具体的物质世界。在波普尔的三个世界体系中,世界3提供了科学家所研究的科学问题的“问题情境”,并具有蜘蛛网样的结构。科学知识产生于世界2与世界3的互动中,并且本质上就是发现知识间的潜在联系。这种互动可简单描述为:科学家利用世界3中的知识进行加工创造解决科学问题,产生新的知识,从而改变了世界3中的原有知识结构;反过来,世界3构成了科学家进行科学研究的背景知识,制约着科学家的研究领域和研究问题,规范着科学家的研究手段和方法。更新后的世界3又导致新的科学问题需要在新的知识场中加以解决。科学知识的生产,就是这样一个循环往复的过程。中国科学家赵红洲则从科学概念与知识单元的关系入手,提出科学发现的过程“都是先把结晶的知识单元游离出来,然后再在全新的思维势场上重新结晶的过程。这种过程不是简单的重复,而是在重组中产生全新的知识系统,全新的知识单元。……,(科学)创造的过程乃是知识单元的重组过程,乃是新知识单元的创生过程,乃是旧单元变革为新单元的过程。”因此世界3不但具有自主性,还具有动态性。自主性表明了科学知识间的普遍联系,动态性则反映了建立知识间联系的过程。科学家对科学知识的游离、重组与更新,则构成了世界3发展变迁的动力因素,同时也表明科学发现的新知识与原有的知识具有遗传与继承关系。科学活动中做出的科学发现主要以科学文献的形式加以表达,如论文、专著、报告等。科学文献的主要功能是“形成、介绍和保存科学知识。科学文献由科学家在科学活动中创造,并用来与其他科学家进行交流、传授科学知识、固化科学知识”。同时,“(1)科学文献是科学思想、科学观念和科学知识的载体,因而它常常被等同于科学理论本身;……;(5)科学的创造、继承和创新、发展,本质地表现为科学文献的创作与解释的循环过程或形式”。上述分析表明科学文献既是科学知识的载体,其创作与更新的过程也反映了科学家进行科学创造的过程。科学文献也是世界3的重要组成部分。在文献间知识联系的基础上,科学文献间形成了知识网络,反映了世界3中的知识结构。网络的演化对应着世界3中的结构变迁。由此,我们可能通过科学文献间知识上的联系来构建科学发现的知识结构。2科学发现—研究现状加菲尔德(EGarfield)是较早利用文献对科学发现进行研究的学者。1964年,加菲尔德以艾萨克·阿西莫夫(IsaacAsimov)的著作《遗传密码》(TheGeneticCode)为蓝本,利用文献间的引用关系绘制了从孟德尔(GregorMendel)直到1961年尼伦伯格(MarshallNirenberg)获得诺贝尔奖为止共40个DNA发展过程中关键事件的引文关系图。通过引用强度的测度,详细展示了DNA研究的发展历程及各个科学事件间的相互联系。斯莫尔(HSmall)依据参考文献的共被引反映了引文中的概念间的联系,采用共被引强度作为测度指标,利用最小生成树算法确定共引关系中的主路径,考察分析了学科间知识上的联系。雷迭斯多夫(LoetLeydesdorff)利用加菲尔德开发的引文分析软件——Histcite,在原有引文网络节点的出度入度指标基础上,引入信息理论中的信息熵做为文献间知识变迁程度的测度,采用Pathfinder算法来确定引文网络中的主路径,并以此研究了富勒烯和碳纳米管两个领域的发展路径。芝加哥大学的斯沃森(DRSwanson)较早提出了基于文献的科学发现概念。这种方法有两种模式:一是利用词的共现现象与中介研究领域,通过专家辅助在两个从文献角度看不相关的领域建立相应的联系,从而为科学研究人员提供参考并有助于科学假说的生成;二是利用已知有联系的两个领域,通过词的共现现象寻找中介研究领域,并在它们之间人工建立词间的联系,同样用于科学假说的生成。陈超美通过对科学发展具有重大转折意义的科学发现进行文献共被引分析,提出了结构洞特征和概念假设突变是科学发现的重要机理之一。加菲尔德和斯莫尔的研究视角侧重于从宏观来看待科学发现间的关系。如加菲尔德对DNA的研究时间跨度近70年,研究重点在DNA领域中重大科学事件间的联系上;斯莫尔则从科学统一性入手,重点研究科学知识在学科间的转移模式;雷迭斯多夫关注科学发现所引发的效应;斯沃森的方法则致力于辅助科学家生成科学问题及提出科学假说。陈超美则通过研究代表科学发现的经典文献在科学知识网络中的结构与时间特征,试图总结科学发现的一般机理。这些研究都没有涉及到科学发现的知识结构,即科学发现是在怎样的知识基础上产生的?这些知识间具有什么样的联系?知识更新具有怎样的过程?3研究方法和数据3.1共被引分析的应用本文使用的方法为科学计量学中普遍应用的文献共被引分析方法(Co-citationAnalysis)。一组文献(被引文献)共同被同一篇或同一组文献(施引文献)引证,则被引证的前一组文献形成共引关系,由此建立起共被引分析方法。它包括文件、作者、机构、期刊和学科的共被引分析等。共引关系的实质,在于一组被引文献的知识联系与知识扩散,对共引文献中知识单元的分析和游离并为一组施引文献对知识单元的重组所反映的研究前沿提供知识基础。由于被引文献将可能继续被引用,且被引用要迟滞一段时间,因此共引分析具有动态性、持续性,其结果也必然具有滞后性。但可通过分析施引文献反映的研究前沿加以弥补。这些特点使得共引分析可以展现知识结构关系与动态变化。目前共被引分析被广泛应用于知识结构与学科结构间的演化关系、研究前沿的探测、研究主题的涌现、关键文献的确认等方面。在共被引网络中,节点表示文献,节点间的连线表示两点所代表的文献存在共被引关系,连线的强度,也即共被引强度,由余弦指数加以测度。其计算方法如下:其中F(A)表示文献A在给定文献集合中出现的次数;F(B)表示文献B给定文献集合中出现的次数;F(A,B)表示文献A、B共同出现的次数。该指数的取值范围在0至1之间,值越大,表明知识单元间的共现强度越高。3.2知识群的形成共被引强度也是对文献进行聚类分析的基础。文献的共引关系表征了文献的相似性,因此可以进行文献的共被引聚类。这意味着一篇论文只有与其他文献具有某种相似性,进入特定的文献聚类中才有价值和意义,否则将被边缘化。文献通过聚类分析构成相应的聚类,我们称这样的文献聚类为知识群。在本文中采用的聚类方法如下:(1)生成表征文献共被引关系的共现矩阵;(2)从矩阵中找到最大共现值的那对文献,作为一个知识群的起始单元;(3)找出与这对起始单元中的任一个有共现关系的文献,并按余弦指数进行降序排列成表;(4)从这个表中依次选择文献放入相应的知识群中,直到其中的成员达到10个为止;(5)从矩阵中把这些已进入知识群的文献删除。然后重复步骤(2)到(4),直到所有文献都进入相应的知识群中为止。出于分析方便的考量,人为规定每个知识群最多10个文献。另外,有些知识群中的文献也会少于10个。3.3研究指标(1)相关指标的计量方法用来描述给定知识群中知识单元之间的紧密程度。该指标有多种计量方法,如平均值、中值、平方和等。本文中用给定知识群中节点之间的余弦指数之平均值来进行计量。(2)中心性知识群的大小用来描述给定知识群与其他知识群的位置关系。一个知识群与其他知识群相连的边数越多,则该知识群的中心性相对其他知识群就越大。中心度的计算也有很多方法,如连接强度之和、连接强度的平方和的平方根等。本文中用给定知识群中文献与其他知识群中文献的余弦指数之和进行计量。(3)在各领域内集中开展知识群战略坐标以知识群的中心度为横轴,密度为纵轴。用于探测知识群间的层次结构。一般来讲,处于第一象限的知识群具有比较高的中心度和密度值,这意味着它们在整个研究领域中居于中心位置且获得较多的研究。处于第二象限中的知识群中心度较高但是密度较低,说明它们在领域中与其他知识群联系密切但获得的研究不充分。位于象限三中的知识群自身获得了比较充分的研究但处于整个领域的外围。这些知识群的中心度相对较低但密度较高。象限四中的知识群则属于领域中的边缘地带。表明它们受到的关注较少。在本文中,战略坐标的原点由各知识群的密度与中心度的平均值来确定。(4)知识群间的联系在共被引分析中,文献通过聚类分析进入相应的知识群。网络中某个节点与其他节点的联系就被分成两部分:与其所处知识群内部的节点间的联系,称为内部连接,决定相应知识群的密度指标;与知识群外的其他节点间的联系,称为外部连接,决定了知识群在整个领域中的地位,即中心度指标。这些外部连接反映了知识群间知识上的联系。本文中以知识群中的节点与其他知识群中的节点间的共现强度之和来表征一个节点的外部中心度。很明显,每个知识群都有一个外部中心度最高的节点。这些节点相互间的联系就构成了知识群间知识流动的主要通道。(5)知识组的平均年龄用来表征知识群所代表的知识“新”“旧”程度。其值为知识群中各节点文献的发表时间平均值。值越大,说明知识群代表的知识越新,反之就越老。(6)共引网络的知识特性知识链路表征了知识群间知识上的联系与演化。在本文中,利用知识群中最大外部中心度的节点来构建知识链路。方法如下:首先确定外部中心度最大的那个点,作为路径的起始点。与其连接强度最大的其他点作为第二个点,从网络中删除起始点,以每二个点作为起始点,再寻找与其连接强度最大值的点作为路径上的第三个点。依次重复这个步骤,直到所有点都进入路径为止。值得注意的是,因为不能保证取得的各知识群最高外部中心度的点相互间都有连接,所以路径在生成时有可能中断。如果出现这种情况,则把中断点与其有最高连接值的点相连,然后重复前述步骤。此时的路径将具有带分支的树形结构。由于共引网络是无向网络,网络中所有的连线都没有方向。本文中利用知识流动的单向性来确定知识链路的方向。选取具有最大平均年龄的知识群作为其他知识群流动的方向与目的地,从而确定知识链路的整体方向。3.4聚类算法和市场算法本文所使用的CitespaceII分析软件是由美国德克塞尔大学(DrexelUniversity)陈超美教授开发的科学计量分析软件,可对webofscience中的数据进行共被引分析与共词分析。该软件运用EM(expectationmaximization)聚类算法、谱聚类算法(spectralclusteringalgorithm)、突显检测算法(burstdetectionalgorithm)、最小生成树算法(minimumspanningtree)、剪枝算法(pruningalgorithms)、路径发现算法(pathfinderalgorithms)和社团发现算法(community-findingalgorithm),从文献数据中识别不同的聚类、检测突现的词和被引文献、聚类之间的关键点(pivotalpoint),并对运算结果进行可视化处理,以不同的几何元素和色彩绘制出直观的网络图谱。在CiteSpace绘制的图谱上,节点间的连线颜色取决于一对文献的共被引强度首次达设定的阈值时所处时间段,不同时段(timeslice)的共被引连线按不同的颜色加以区分。3.5杨李二人科学发现的知识基础1957年,中国科学家杨振宁、李政道由于发现在弱相互作用下宇称不守恒,共同获得当年的诺贝尔物理学奖。本文以此为案例,分析其发现过程中的知识来源与构成、知识间的相互关系以及知识更新的过程。1956年,杨振宁与李政道在《现物理评论》(PhysicalReview)共同发表了《对弱相互作用中宇称守恒的质疑》(Questionofparityconservationinweakinteractions)一文,正式提出了在弱相互作用中宇称不守恒的观点。这篇论文共有19篇参考文献。利用文献耦合的方法,通过这些参考文献可以找到与这篇论文知识上有联系的相关文献。这些相关文献的知识基础就可以认为也是杨李二人做出科学发现的知识基础,其结构表明了科学发现的知识结构。同于共被引分析时间上的滞后性,为了更准确地表达出从知识基础到新知识的产过程,我们还选取了1956至1957年引用杨李二人经典文献的论文作为分析数据的补充。本案中的所用数据都来自webofscience的ScienceCitationIndex-Expanded数据库。根据前述原则,19篇参考文献到1956年为止共收到121条引用,时间分布为1946年至1956年;发现宇称不守恒的文献从1956年至1957年,共被77篇论文引用过。两项合计共有198篇论文。4知识群中外部中心度的对应关系利用CitespaceII软件,分析1946年至1957年的数据。时间段设为11年,提取出现五次或以上的参考文献进行共被引分析。数据去噪后,共有59篇参考文献达到阈值进入分析。这些文献所形成的共被引知识网络图谱见图1。59个节点文献由据颜色区分成两部分:绿色连线及其节点表现了导致宇称不守恒发现的知识基础,黄色部分为做出宇称不守恒发现后生成的新知识群。两部分的颜色变迁表征了由知识基础到科学发现的知识演化过程,反映了知识流动的方向。网络中共有456条边,整体密度为0.2665,说明网络中的节点平均而言只与小部分其他节点相连接,进而表明网络中的结构洞比较丰富。利用前述聚类方法,图谱中的59篇参考文献共生成7个知识群,其内容见表1。各知识群的主题用其内部中心度最大的两篇文献表示,见表2。结合表1与2,可以看到,知识群1与知识群7以实验为主研究原子核的极化现象,这些现象证明在强相互作用下宇称是守恒的;知识群2的研究内容为弱相互作用;知识群3则是由杨振宁与李政道在理论上证明弱相互作用中宇称不守恒后引发的相关研究,其中包括吴健雄所做的对他们理论走到证实作用的关键实验;知识群4的研究内容为τ介子衰变;知识群5研究内容为K介子;知识群6则与宇称守恒的理论相关。由此可见,有关宇称不守恒问题的产生与τ介子衰变、K介子、宇称守恒、原子核的极化(强相互作用)、弱相互作用等知识有关。利用CitespaceII提取上述59篇文献所形成的共现矩阵,统计各知识群的相关指标,并确定的各知识群中外部中心度值最大的节点文献。统计结果见表3。其中知识群1、7位于战略坐标的第三象限,表明其研究内容相对成熟。这两个知识群的主要研究内容是原子核的极化,也就是强相互作用下的宇称守恒的有关实验;知识群4、5、6位于第二象限,表明其研究内容处于新兴活跃位置。这三个知识群的主题都与(介子、K介子和宇称守恒相关。知识群4位于第四象限,说明在相关研究中对弱相互作用的研究没有引起重视;知识群1位于第一象限,表明杨振宁与李政道有关宇称不守恒的发现引发了大量关注与兴趣。表4的内容为外部中心度最高的节点文献标题,表5列出了各知识群外部中心度最高的节点文献间的共现关系。按表1中列出了各知识群的平均时间可知知识群3的平均时间最新(1956.78)。故以知识群3中的外部中心度最高的节点文献为其他知识群知识流动的目的地,按前述3.3节的路径生成方法,确定各知识群间知识上的联系,结果见图2。由图2可以清楚看到,汇聚到杨振宁与李政道发表的经典文献的知识链共有三条:(1)单独由知识群2构成;(2)由知识群6、4、5构成;(3)由知识群1、7、5构成。其中路径2和3在知识群5处交汇,然后再到知识群1。这些路径表明了宇称不守恒理论发现的知识来源与知识基础。其中路径3中的两篇节点文献(知识群1、7)都与原子核的极化反应实验有关(表4)。结合它们所在知识群的研究主题(表2),这些实验研究证明了在强相互作用与电磁作用下宇称是守恒的。路径3中的两个知识群在数据集中处于战略坐标中的第三象限(表3),说明这些研究相对比较成熟,与其他知识群间的联系不是很紧密。可以认为它们代表了领域中相对成熟的知识。路径2的两篇节点文献(知识群6、4)与核粒子的不稳定性有关,结合其所在的知识群主题,表明它们主要是研究τ介子的衰变。这两个知识群在战略坐标中都位于第二象限,说明它们吸引了科学家相当的兴趣,但是研究的并不充分。事实上正是在这个主题中存在着现有理论无法解释的问题:在奇异粒子中存在着θ和τ两种粒子,它们都是K介子。一个带电荷的τ粒子能衰变成两个τ介子;一个带电荷的τ粒子能衰变成三个。π介子的宇称是奇宇称。这样,按宇称守恒定律,θ粒子应当有偶宇称,而τ粒子应当有奇宇称。这个结论与后续获得的有关θ和τ粒子的实验事实不相符:这两种粒子的质量和寿命都大致相同,大量证据表明它们是同一种粒子。这就是当时理论物理学中有名的θ—τ难题。这两条知识链汇聚于知识群5。知识群5的研究主题为K介子衰变及其寿命。在其最高外部中心度文献(MassDegeneracyoftheHeavyMesons(重介子的质量衰变))中杨振宁,李政道就已经通过分析暗示了在弱相互作用宇称可能是不守恒的。结合弱相互作用的相关研究(知识群2),最终相关知识汇聚到杨振宁与李政道发表的经典文献——Questionofparityconservationinweakinteractions。注意到知识群2位于战略坐标的第四象限,且在知识流动的路径中只与代表科学发现的知识群3相连。表明当时对θ—τ难题的研究中,很少有人意识到现有实验证据并不支持弱相互作用中的宇称守恒。在知识群3中,内部中心度最高的文献是吴健雄的ExperimentalTestofParityConservationinBetaDecay(β衰变中的宇称不守恒)。这个实验证明了杨李二人理论的正确性,从而迅速使得相关研究成为领域中的核心主题。5弱相互作用下宇称不守恒量通过构建科学发现的知识结构(共被引网络图谱与知识群链路),清晰地反映了科学发现的知识来源
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- CAD制图考题及详解
- 电磁兼容题库及分析
- 2026广西贺州经济技术开发区管理委员会招聘1人考试备考试题及答案解析
- 2026年联合收获机械行业分析报告及未来发展趋势报告
- 植被更新与灌木栽植方案
- 2026黑龙江佳木斯汤原县不动产登记中心招聘公益性岗位2人考试参考题库及答案解析
- 医院电梯运行管理方案
- 2026上海市青年报社公开招聘(第二批)笔试参考题库及答案解析
- 2026青岛数据资产登记评价中心有限公司招聘4人笔试备考题库及答案解析
- 2026年马鞍山市当涂县人民医院周转池编制公开招聘工作人员核减岗位考试备考试题及答案解析
- 密封条范文模板(A4打印版)
- 二级减速器链传动课程设计
- GB/T 6547-1998瓦楞纸板厚度的测定法
- 水库运行管理试题
- 第10-11课情感分析课件
- 服装制作水平提高QC教学课件
- 无创呼吸机课件
- 一汽大众产品开发过程课件
- 反恐应急演练过程记录表
- 《中国古代文学史》宋代文学完整教学课件
- 兰州兴元铸锻有限责任公司轧钢生产线技术改造项目 环境影响报告书
评论
0/150
提交评论