CiteSpace最全教程(安装、介绍、调整与美化解读)_第1页
CiteSpace最全教程(安装、介绍、调整与美化解读)_第2页
CiteSpace最全教程(安装、介绍、调整与美化解读)_第3页
CiteSpace最全教程(安装、介绍、调整与美化解读)_第4页
CiteSpace最全教程(安装、介绍、调整与美化解读)_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

目录TOC\o"1-5"\h\z目录10关于CiteSpace2什么是CiteSpace?2什么是科学知识图谱?3CiteSpace的五大理论基础3CiteSpace的应用现状3一、CiteSpace的下载与界面介绍.4安装介绍4软件分区介绍4CiteSpace可视化界面简介7分析步骤10二、CiteSpace的数据来源与下载:分析的原料在哪里111、在WoS上下载数据122、在CNKI上下载数据13三、CiteSpace的分析原理:我们如何挖掘现有数据151、共被引分析152、共词分析163、突现分析17聚类分析195、CiteSpace其他功能区20四、CiteSpace挖掘的三个方面:知识基础、学科结构、研究前沿201、知识基础的获取202、学科结构的获取223、研究前沿的获取22五、关键词分析的可视化处理(实战-附详细说明)230可视化窗口调整23调整与美化24年轮式25调整聚类的数量:25聚类结果总结表26时间线与时区图27突发性结果的查询28一个关键词的分析29在科研工作中,我们常常需要面对海量的文献,如何在这些文献当中找出值得精读、细读的关键文献,挖掘学科前沿,找到研究热点就成为了开展研究之前首先需要解决的问题。CiteSpace作为一款优秀的文献计量学软件,能够将文献之间的关系以科学知识图谱的方式可视化的展现在操作者面前,既能帮助我们梳理过去的研究轨迹,也能使得我们对未来的研究前景有一个大概的认识。CiteSpace又翻译为“引文空间”,是一款着眼于分析科学分析中蕴含的潜在知识,是在科学计量学、数据可视化背景下逐渐发展起来的引文可视化分析软件。由于是通过可视化的手段来呈现科学知识的结构、规律和分布情况,因此也将通过此类方法分析得到的可视化图形称为“科学知识图谱”。正如科学计量学界的权威专家刘则渊教授对CiteSpace知识图谱形态的概括一样,“一图展春秋,一览无余;一图胜万言,一目了然”。近年来,使用CiteSpace开展的研究、发表的论文呈现不断上升的趋势。根据中国知网的统计,2017年相关论文已经达到388篇;到2018颖而出呢?我认为,在深入的把握CiteSpace的原理的基础上,熟稔相关操作背后的含义,对CiteSpace软件的应用达到游刃有余,这样才能知道自己的研究需要什么,做到“知己”。同时了解相关文章的研究套路,清晰他们的研究内容和研究思路,取其精华,规避其错误,做到“知彼”。下面根据我个人的一些学习的体会和实际使用的情况对CiteSpace使用过程来跟大家做一个基础性的介绍。0关于CiteSpace1.什么是CiteSpace?CiteSpace是一款着眼于分析科学文献中蕴含的潜在知识,并在科学计量学、数据和信息可视化背景下逐渐发展起来的一款多元、分时、动态的引文可视化分析软件。什么是科学知识图谱?科学知识图谱是以知识域为对象,显示科学知识的发展进程与结构关系的一种图像。3.CiteSpace的五大理论基础(1)托马斯库恩的科学发展模式理论科学发展是科学革命的历史过程(前科学——常规科学——科学危机——科学革命——新常规科学)。科学发展的本质常规科学与科学革命、积累范式与变革范式的交替运动过程库恩理论关于发现的涌现、经典名著是科学的转折点等观点在CiteSpace生成图谱中得到实现,库恩的科学革命的结构是CiteSpace设计的哲学基础。(2)普赖斯的科学前沿理论普赖斯提出“参考文献的模式标志科学研究前沿的本质”理论,并认为“研究前沿是基于新近研究成果,随着发展知识网络也会变得越来越密”。在CiteSpace中设计了从知识基础“共被引文献聚类”到研究前沿“施引文献”的映射。(3)结构洞和克莱因伯格突发探测技术结构洞理论认为处于结构洞位置的个体通过信息过滤而能获得更多的竞争优势和创新能力。在CiteSpace中,使用节点在网络中的中介中心性来测度结构洞及转折点。探测频率突增的算法。如果一篇论文的引用频次突然呈现急速增长,那么最稳妥的解释就是这篇论文切中了学术领域这个复杂系统中的某个要害部位。知识网络中这样的节点通常揭示了一项很有潜力或让人很感兴趣的工作。(4)科学传播的最佳信息觅食理论信息搜索就像人类和动物捕获食物,认为我们在信息搜索中倾向于能量消耗最小化。(5)知识单元离散与重组理论任何一种科学创造的过程,都是先把结晶的知识单元游离出来,然后在全新的思维势场上重新结晶的过程。4.CiteSpace的应用现状CiteSpace在国内的应用领域主要集中在图书馆与档案管理、管理科学与工程以及教育学方面,分析的数据源主要为WoS、CSSCI以及CNKI;分析的时间长度有一半以上超过了十年;国内的学者使用Citespace主要是对研究热点、研究前沿和研究趋势进行探测。在研究中主要使用citespace的文献共被引、共词网络以及作者共被引功能;在对生成的图谱的解读时主要针对高频节点、聚类知识群、高中介中心的节点和图谱的基本图例说明。

一、CiteSpace的下载与界面介绍1.安装介绍访问/〜cchen/citespace/download下载CiteSpace,一般下载最新版。当前(2018年10月14日)最新版为5.3.R4,新版本在原来版本的基础上增加了引文级联引用功能。下载完成后解压,打开StartCiteSpace_Windows.bat。一般选择英文。EnterthenumbBTofyourlocalefromthefolLawLngDptions:二USA:US,en'-Chinese2CNBzh-AnyOth^rL&c©l«j.iPcountry/lanffuag&・Esit[L2.X4J?!Startin呂CiteSpacE进入下一个界面,提醒使用者在使用这个软件开展研究的发表论文的时候,别忘了把软r匚ilH(r匚ilH(wRHlEDfr*1-口XCdcJii^iLirl«.lClMKiCln■Urv垃innvri件开发者的论文引用上,不同意就用不了,那我们当然选择同意。1ElijklhH|JUn[丈IjJ塑■讣曲竺1Btf-PWWWM*r^iH?叶nHlihla显伸VMEk|Wt:mp+rM.HWLAPTWQZQ.UAHmwC1软件分区介绍CiteSpace的功能区域很质朴,分为执行操作区、时间选择区、文本处理功能区和网络配置功能区等。在随后的论述中,再对这些功能区进行逐一展开。

Auther为作者合作分析,citespace软件给出了合作网络中,包含了各个作者在网络中的重要性指标及网络属性。Ps该领域作者之间的合作关系,是否有合作。作者机构国赢术语关键:Institution为机构合作分析功能。可以得到各个研究领域中的研究力量分布。iypnftrftHIa疋知血井折的冃的Aulboihi割匸如耐邛Jmac,Kfl*Brt二CFE匕世L茂锂irbJiW旳仆或•比圖晌"皈“叫d叫Um」肿的、叶闭出册折Term为词贡献分析功能。Citespace软件中的term表示文章中的标引词,term来源可以来自文章标题、摘要及关键词部分,citespace软件运行过程中如果采用了term词标示,需要在面板termsource模块下选择term的来源,可以选择一个来源,也可以选择多个来源。使用term分析要比关键词分析更深入到文本内容,反映出来的信息也更全面。Ps:而在termsource中选择title或摘要又必须在termtype中选择nounphrase,(ps:在citedreference/journal/auther中通过两次点击citationburst来提取突现词,而在关键词分析中,利用burstdetecting来探测突变词)

词共现网络,此网络可以反映出某一领域当前研究热点及过去产生过哪些热点研究。主題.关世词或內旳分炎的共现廿折■换曲旅.t,321514hml主豊、英用逊或旳词共现网络,此网络可以反映出某一领域当前研究热点及过去产生过哪些热点研究。主題.关世词或內旳分炎的共现廿折■换曲旅.t,321514hml主豊、英用逊或旳5^35曲菽EJ;升祈Category为学科共现分析功能,用于交叉学科的分析,分析对象为文档中的SC字段,通过构建学科关联网络,可以揭示出各个学科之间的内在联系,Paper为文献耦合分析功能,分析施引文献之间的耦合关系,及两篇文献引用了相同的一篇或多篇参考文献,得到的结果为文献耦合网络。文献的耦合分析.swi^nsia.htmihttp://biqfi.:i:isixeneL师文献的耦合分析.swi^nsia.htmihttp://biqfi.:i:isixeneL师禹kig;Grants为基金分析功能,分析文献的基金资助情况,得到的结果为资助基金的共现网络。Pruning

Pathfinder路径找寻pruningslilcdenetworks修剪slilcde网络minimumspanningtree最小生成树pruningthemergednetwork修剪合并的网络visualizationClusterview-static:查看静态集群Clusterview-animated:集群视图动画shownetworksbytimeslices:按时间片显示网络showmergednetwork:显示合并后的网络共被引分析取he蹶^左共被引分析取he蹶^左氛“.立貳的斗皓弓务折•任占的口匿引•昔析U匪蕊刘的Ktfi引廿祈.节点的大小代憲文駅.期利财忖的H[引iktt.连$的插也崔丸戸战共輕引自时可.3.CiteSpac3.CiteSpac可视化界面简介调整背景为黑底还是白底聚类:有时点击后,没有立刻呈现聚类的阴影,稍等即可聚类标签的提取上提供了三种标签来源:标题、关键词、摘要三种标签提取算法LSI/LLR/MI(1):三者之间区别我觉得并不大,目前较多的人使用LLR(2):使用哪种算法,还需考虑能否生成聚类报告,如果不能,也没必要使用Timeline分析:注意光选择reference,是无法呈现Timeline分析的点击这个会使得点与点之间的连线变直一:节点信息的列表区I左ICiteSpace:DisplayM&rged-(c)2003-202CFill厝DataVisualiza(Iobi曲亡占LlnKaLab-^l«IrateJl11o||*l*o|VisibleCaun1Cent...YearKeyw口「e0.U5-2019*830.092019计算机•630.10Z019672019650.202019610.092019佶息立全600.092.019土的IF510.072019云讣St4-1O.Q72000吝应奋饴410.072019计算机朗蚂*400.042QOOw=ll"『导航主座*26I.JILI2D1Q埶堀表全3DZ01SF整性3?I'lI'口Z013料亲芒I里290.03zoig应用270.022019270.0220DO•■-(Lh260.0520192.6o.oe2.019/■-I-25l.l1.12019佶耳化25I..I1.':.l2000可用性240.D52Q19埶拒中心*22o.tn2000Count:出现次数Centrality:中心性Year:首次出现年份,如果显示为零,点击菜单栏Nodes->ComoutNodeCentrality即可Keywords:关键词若想隐藏某个节点,可以点击首列的Visible,去掉“7”即可。:CiteSpace快捷功能色为白色。三:网络聚类及其命名为网络的聚类;代表聚类的命名术语是从施引文献的标题(T)、关键词(K)或者摘要(A)中提取,在实际研究中,比较常用的是从标题中提取名词性术语为聚类命名。依次为:聚类的时间演化、LSI方法、LLR对数似然算法、MI(互信息算法)四:节点样式的快捷调整前两个为节点的年轮表示方法、节点以中介中心性的大小进行显示。后面的不常用五:快捷功能区(后面详细介绍)六:主板2快捷功能区介绍2.1Iabels:标签的设置a:调整主题网路的字号标签、b:调整除了主题网络分析以外的其他网络节点字号c:显示或隐藏网络中连线的标签和强度、调整标签大小d调整聚类的命名的字号,调整聚类命名的显示e:调整聚类和节点标签,避免标签之间覆盖Layout:网络的布局调整网络布局方式

IlLiCorrlrdPjndl—□XCtMTMpBar-felnH*加CUAMILIMK-LffMCIviH砂飙剛DWBjWIO'1舟J=■View:可视化的调节a:利用鱼眼图对Timeline进行调整b:调整Timeline视图中聚类标签的位置行距以及连线Search:节点信息的检索链接修改参数后,点击“Refresh”更新突发性探测的结果,点击“View”查看突发性探测的结果Clusters:聚类信息的显示分析步骤数据源的诜择ICSSCIICNKIWebofScience数据采集及数据清洗ICSSCIICNKIWebofScience数据采集及数据清洗1科学知识图谱绘制-I合作网络II引文网络II共现网络II共被引分析®K616LGUCGOvnipoLQC!4©qqomugi0b^bGLQQiaufIIQvn(poLQ|U2IIQvn(poLQ|U2(i^n(iouQC°nu^Ol^uwQK6AM0LqQq^ig^oi!学科研究进展与趋势学科研究热点与前沿学科核心期刊群学科引文历史学科核心作者群相邻学科间关系二、CiteSpace的数据来源与下载:分析的原料在哪里使用CiteSpace分析某一主题的研究历史与研究前沿,第一步就是要从文献数据库上下载到一定数量的文献信息。外文文献信息一般在webofscience(WoS)上下载得到,中文文献信息一般在中国知网(CNKI)上下载。CiteSpace是基于WoS的数据格式进行开发的,可以根据下载得到的数据进行合作网络分析、共现分析和共被引分析,在非WoS数据库下载得到的数据都需要先转化为WoS的数据格式,根据相应数据库的数据维度各有其相对应的适用范围。就数据库的深度看,外文数据库我们一般使用WoS,中文数据库一般使用CNKI。另外,中文的文献数据库还有CSSCI数据库、CSCD数据库等,外文的文献数据库还包括Scopus数据库、Derwent专利数据和其他专业领域的数据库等,下载方法参考《CiteSpace:科技文本挖掘及可视化》第2讲。在数据检索时,一般有两种检索策略,分别是:按照关键词检索按照期刊检索我们以按照关键词检索为例,说明如何从文献数据库中,下载得到我们所需要的文献数据。1、在WoS上下载数据在WoS上下载数据,访问WoS的官网。操作的第一步是登录,假如没有账号,需要先行注册一个。没有登录的话,是无法下载数据的。以关键词“学习成果评价”为例,键入其英文“learningoutcomeassessment”,数据库选择“WebofScience核心合集”,检索类型选择“主题”,时间跨度选择“所有年份”。我所在的学校购买到的数据库是从1985年开始的,时间跨度可能对有些朋友而言不够长。当前国内购买WoS数据库跨度最长的地方是中科院文献情报中心,是从20世纪初期就开始的,有需要的朋友可以到那里进行数据下载。得到如下页面。从页面中可以看出,该主题词下的索引结果有10054条。下一步,需要对检索结果进行精炼。文献类型选择“文章”,点击精炼。得到的最终检索结果为7050条,这些文献数据使我们最终想要的。文献翹*□ARTICLE(7,050)PWKEEDlHtSPAPER(2.4&2)FrtVIEW1679)LDlTDRJALMATERMM.岡MEETINGABSTRACT(330随后,滑到底部,将记录改成每页显示50条。回到顶部,按照下图步骤,分别点击“选择页面”,“添加到标记结果列表”,就完成了这一页面的数据添加。最后点击“下一页”,循环这个过程。WoS最多支持500条数据保存一次。在标记完500条数据后,选择“保存为其他文件格式”。閒为其臟式&保存至EndNoteonllrie'Of保存至EndNotedesktopkiU喩保存莹险h机血ID-找展写了这些出版誉站怯保存为其他文4惓式hITS随后,记录内容选择“全纪录与引用的参考文献”,文件格式选择“纯文本”,点击“发送”,就可以得到刚才我们标记过的500条文献信息了。下载得到的内容包括论文标题、作者、资助基金、关键词、来源期刊、所属领域、论文摘要、参考文献等等。对余下文献信息做相同的操作,即可以得到所需要的数据全集。Tips:关键词的翻译,例如“学习成果评价”,找出几篇以“学习成果评价”为关键词的引用率较高的文献,中外比较类(例如比较教育学)的研究最好。参考其下的英文对照翻译,综合选择即可以得到我们需要的英文关键词。查看相关数据时,最好时候Notepad++、sublimetext等编辑器。格式更加醒目、清晰。2、在CNKI上下载数据在CNKI上,同理,访问,键入检索词“学习成果评价”,每页显示选择“50”,勾选“全部选中”按钮,点击到下一页,同样以500条数据为一次下载。在选择完毕后,点击“导出/参考文献”。计量可视叱分析选择RefWorks,点击“导出”,就完成了本次下载。得到的数据维度比WoS得到的数据维度要少一下,仅包括作者、标题、来源期刊、关键词、摘要等。对余下数据做同样的操作,就可以得到中文的数据集。監『Asrr;pprw-s?博富宁可員n;评tr■SDL11icva^iHLj.vjKiJf:JFJJ!ER.rf-TWa*主事肓曲梶为吋・看况兀平宣宜怕讽1Ht^liHM3|-Ud*31Jl-iKI4/TUEra£iii'IffEiiunfl:.n]hL世C.T■7:IB.1inWit^-r<X01■T4-V.'Q<4WtftHT—U*iWWnfflFFnr*■-!■卄KLW*T:!■T.Vdt;■出!Sttfi上;EM“訶"■■»上^ridMrvalu4trnt>.>rLHELinfoy^r4HK-7^i"Dv]pliLncthv^tfip^r«tlELcd■MLjnLa在得到数据集后,需要将这些数据集转化为CiteSpace可以识别、读取的数据格式。参考如下tips即可完成转换。Tips:CiteSpace自带有数据转换的功能,但不太好用,容易出现一些问题。推荐下载使用格式转换器。转换器下载链接转换后会将原本集合在一个txt文件中的数据打散,生成一条数据一个txt的形式,txt文件过多会极大的降低了CiteSpace的运算速度。为了解决这个问题,打开命令行工具(cmd),输入下面的代码,将这些TXT合并成一个。引自:将多个txt文件合并成一个cdF:\study\citespace\data(改成自己的数据存储路径)type*.txt>allData.txt三、CiteSpace的分析原理:我们如何挖掘现有数据在获取特定主题的数据后,自然而言我们会冒出一个问题:“我们拿这些数据用来做什么?”CiteSpace的最大的作用,就是能够在这些枯燥乏味、机械重复的数据中挖掘出我们想要的东西。那么,这是依靠什么原理实现的呢?1、共被引分析在了解共被引分析前我们需要对引文分析有个概念,引文就是论文后面的参考文献。有学者认为,引文分析就是对科学期刊、论文、作者等分析对象的引用和被引用现象进行分析以揭示其数量特征和内在规律的一种信息计量研究方法。在了解引文分析法之前我们首先要知道,学者为什么要在其论文中印证前人的研究成果。为什么要引证:为了对先驱者表示崇敬。为了对相关工作表示赞赏,同时表示对同行的尊敬。为了对方法或仪器设备表示认同。为了向读者提供阅读背景。为了纠正自己的工作。为了纠正别人的工作。为了批评前人的工作。为了支持某种论断。为了提醒人们注意即将发表的工作。为了找到那些传播不广、索引很差又未被引证的文献而提供线索。为了验证科学事实和数据,例如援引物理常数等。为了鉴别曾讨论过某个思想或概念的原始文献。为了鉴别某个时代的某个概念或术语的原始文献或其他著作。为了对别人的工作或思想提出反证-否定性论断。为了与别人论争某个观点的优先权。从上面这么多引用原因我们不难看出,被引文献与当前文献在内容上是相关的。论文引用其他论文的行为可以看做是知识从不同的研究主题流动到当前所进行的研究,是知识单元从游离状态到重组产生新知识的过程。发表的论文被其他论文引用是这个过程的持续。由于这种引证行为的客观存在,随着科学研究的不断推进,引文网络也就自然而然的形成了。一篇特定的论文,引用的文献称为引用文献(即后向引证关系),这篇论文发表后,引用这篇文章的论文称为施引文献(前向引证关系)。在引证网络的基础上,延伸出两个重要的概念一个是共被引分析,另一个是耦合分析。共被引分析挖掘参考文献之间的关系,耦合分析挖掘施引文献之间的关系,这里着重讲共被引分析。共被引分析(Co-Citationanalysis)是指两篇文献共同出现在第三篇施引文献的参考文献目录中,则这两篇文献形成共被引关系。通过对一个引文网络进行文献共被引关系挖掘的过程,就可以认为是文献共被引分析的过程。例如下图文献pb1和文献pb4在三篇论文中共同引用,那么他们的共被引次数为3次,通过一定的计算方式可以得到他们的关联强度。共被引次数越多,这说明这两篇文献相似之处越大,关联强度也越大。分析的步骤为:先从文献信息中归纳得到引证矩阵,在引证矩阵的基础上生成共被引矩阵。使用可视化技术,将共被引矩阵可视化为网络。2、共词分析在进行共词分析之前,首先需要先了解词频分析。词频是指所分析的文档中词语出现的次数。词频分析就是在文献信息中提取能够表达文献核心内容的关键词和主题词频次高地分布,来研究该领域发展动向和研究热点的方法。在词频分析的基础上,对词频网络进行的更高层次的分析称为共词分析。共词分析的基本原理是对一组词两两统计它们在同一组文献中出现的次数,通过这种共现次数来测度他们之间的亲疏关系。它需要满足以下几个方面的假设。共词分析的假设前提:作者都是很认真的选择他们的技术术语的;当在同一篇文章中使用不同的术语时,就意味着这些不同的术语之间的关系并不是微不足道,它们一定是被作者认可和认同的;如果有足够多的作者对同一种关系认可,那么可以认为这种关系在他们所关注的科学领域中具有一定意义;当针对关键词时,经过专业学习的学者,在其论文中标引出来的关键词时能够反映文章的内容的,是值得信赖的指标。在作者标引关键词时,通常也会受到其他学者成果的影响而在论文中使用相同或类似的关键词标引自己的论文。分析的步骤与共被引分析相近:先从文献信息中归纳得到关键词矩阵,在关键矩阵的基础上生成共词矩阵。使用可视化技术,将共词矩阵可视化为网络。共词分析原理图3、突现分析CiteSpace提供Burstdetection的功能来探测在某一时段引用量有较大变化的情况。用以发现某一个主题词、关键词衰落或者兴起的情况。Burstdetection有突变,突发,剧增,等等几种常见的翻译。基本意思是一个变量的值在短期内有很大变化。CiteSpace将这种突变信息视为一种可用来度量更深层变化的手段。CiteSpace中Burstdetection用于两类变量:施引文献所用的单词或短语的频次被引文献所得到的引文频次下面简单说明以下具体步骤。1。施引文献所用的单词或短语的频次A)选BurstTerms之后,如看到如下提示:CiteSpacefoundexistingburstterms.Youmayusethem,orre-runthedetectionproccess,whichmaytakeseveralsecondstocomplete.这说明你已经做过burstdetection,如果你愿意使用上次的结果,你不再需要做什么,可直接按GO.这样产生的网络会包括你上次burstdetection所选中的词。见图1。如果你想重新做一遍burstdetection,按DetectBursts的按键。CiteSpace会给你两个选择见图2)。B)如选plaintext,稍等片刻之后,SpaceStatus窗口中会出现像:870bursttermsdetected.这说明CiteSpace发现870个词有跃迁现象。下面的操作和A相同。C)如选nounphrases,如果当前的数据从未抽取过名词短语,则会看到提示:Runnounphraseselectionfirst,thenrunthisfunction.接步骤D.D)抽取名词短语在TermType中选NounPhrases,提示两个选择:CreatePOSTags和DoNotCreatePOSTags.注意,CreatePOSTags可能会需要几分钟或者更长的时间来完成。在SpaceStatus可见类似下面的提示:CiteSpaceispre-processingdatafiles.Pleasewait...Years:10Uniquesourcerecords:3255这时抽取程序尚未开始运行。如想看到抽取结果,可在NodeTypes中选Terms,也可同时选掉CitedReferences(当然保留也可以)。总之,这个过程只是个中间步骤。可将TopNperslice选得很低,像5或10。按GO.

这一步完成后,可继续C.便会在SpaceStatus里看到这样的提示29bursttermsdetected.短语burst的个数一般会比单词的小许多。见图3。2.引用次数的Burst这个操作就简单得多了。在网络显示的上方有一个CitationBurst的按键。按2次即可看到图中加上了一些红色的圈圈儿。•USERGENERATEDENTENT■■打黒^善虑RedcorvTE/vrCOLLABQ^AHOW-L'SETJ-CFK^TEDSQVVENTT-upKjc*--HK>rJhwilhMniQ^nlCiUliuH&hIIK>3*M.W-MMMtnmme*•KMIJ%?jCH1sell■a学忖C^-TVNW3311sii)1^7^maMMMtnmme*•KMIJ%?jCH1sell■a学忖C^-TVNW3311sii)1^7^ma!■mi!■"!All卞H*S«3«PL'-MM:-rilU31!i-w刖的三三三三一一一三4、聚类分析聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程,以分析对象的相似性为基础。聚类分析有许多不同的算法,CiteSpace提供的算法有3个,3个算法的名称分别是:LSI浅语义索引、LLR对数极大似然率、互信息。对不同的数据,3种算

法表现一样,可在实践中多做实践。关于这3种算法,可以参考如下文章做进一步了解:LSI浅语义索引文本主题模型之潜在语义索引(LSI)LLR对数极大似然率Likelihoodratiotest互信息互信息(MutualInformation5、CiteSpace其他功能区对于共被引分析,CiteSpace提供了引文共被引、作者共被引和期刊共被引3种不同类型的分析方法。对于共现分析,CiteSpace提供了术语、关键词、来源、领域4种不同的共现分析。Z一駅玫期书舛听fj一24||j"JLiCilli^i|CHiarail9>:v-「T1_功能区图例无论是共被引分析还是共现分析,在生成网络时都需要根据共被引次数或共现次数计算网络节点之间的连接强度。CiteSpace提供了4种网络节点强度计算的方法,一般不做改动,选择默认方法。StFOfl'Pltlfouridv5r<¥4iWlh*SJkjiivPMIllopNT腫冊Q-lntra]CrijaUncn-UhaaelN~|Mcllm|WJaccardledctcc^unedmrvIramediAsice.四、CiteSpace挖掘的三个方面:知识基础、学科结构、研究前沿CiteSpace能够在海量的文献数据中,能够以较为简单的操作步骤挖掘出我们所需要的特定主题的三个方面的信息,包括该研究主题的知识基础、相应的学科结构和最新的研究前沿。在进行进一步的论述之前,我们先来简单介绍CiteSpace这个软件的操作步骤。1、知识基础的获取任何一个研究主题,背后都会有一个较为完整的知识体系作为支撑。这个研究主题越成熟,这个知识体系越完整,越丰富。我们知道共被引网络是由参考文献组成的网络。我们获取的这一主题的论文,其知识构成在很大程度上是由其参考文献的知识流动汇集得来的。那么由参考文献组成的共被引网络则能够很好的揭示某一个研究主题的“先验知识”,即我们可以通过获取参考文献的共被引网络的方式,得到某一研究主题的知识基础。以关键词“高等教育”为检索对象,得到2.5万余条数据,得到的共被引网络如下:颜色的冷暖代表了时间的远近,颜色越暖,时间越近;颜色越冷,时代越久远。那么通过对网络进行分析,对其中关键节点(即关键文献)进行研究,就可以知道,支撑支撑高等教育发展的知识基础在时间上的发展演进情况。那么我们需要研究哪一个阶段的高等教育历史,就得找到相应时段高等教育知识基础的书籍进行研读、浏览和整理。对这个结果网络进行聚类分析,可以看到各个阶段知识基础的主题的变化情况,方便我们进行主题聚焦。可以看到,在最近的研究中,知识基础为反馈”类的文献,此时研究也许会以这个为出发点展开研究。在了解整体的知识基础的框架和演进趋势后,我们如何对关键文献进行定位?我们主要关注2个方面:高频节点:代表高被引的文献,是某个领域或多个领域的重要知识基础。高中介中心性节点:代表与多篇文献形成共被引关系的文献,与多篇文献均有关系,起到“交通枢纽”的作用。相对而言,是本领域内的关键文献;同时,也是这段时期内的关键文献,在一定程度上代表着这段时期的研究热点主题。中介中心性是指:一个结点担任其它两个结点之间最短路的桥梁的次数。一个结点充当“中介,啲次数越高,它的中介中心度就越大。那么我们可以知道,同时具备高中介中心性和高频特性的节点,就是本领域内的关键文献,也是这段时期内的关键文献,代表着这段时期的研究热点主题。

2、学科结构的获取一篇论文的关键词代表着这篇论文的论述重点,在一定程度上反映了这篇论文的学科结构。使用关键词共现网络,能够将数据全集中的学科结构清晰的展示出来。每一个节点代表一篇文献,节点越大,说明该关键词词频越大,与主题的相关性越大。同样,节点的颜色代表时间:颜色越暖,时间越近;颜色越冷,时代越久远。乍轎虐ft,W+ltfjMfeMfl林灯叫霜严丄***■艸.

曲砂硏幡”::囂x#」R:rf•"占^'H!iX.亍■'ftmtn*iiE■XflUt.囱“aq3匸4*>1.A7«fj丘nzei*Emif:nn好轴创卄捕"H允丄.也T・i:f.'ftAfunnirA4'liilfRffIfXTilh'it^斎酗界佯MM需弊ItflMM躍血c¥aPYQH中国高等教育学科结构3、研究前沿的获取使用前面提到的burstdetection,可以获取到相关研究主题的研究前沿。在获取研究前沿前,需要先点击NounPhrases,选择CreatePOSTags。然后把BurstTerms选中,点击detectBursts。在弹出框中选择nounphrases。ChocsFSomfc^sof匚andidatffTermsTwi凶aiidna滋lermaar^如加l除"Nounphrasesarcidmitiri^dwithpar1-cit-s<wc-rhhbggmgi-网i.IcjUIjE-inisarcKicnflTliiHlE»yaaJidin^-window\ermxeIccIh.WhichBsurc-ewouMywum?|ricuiipTrusei-planIjed在知识图谱的界面,旁边有个ControlPanel,点击Burstness,点击Refresh,就可以生成我们所需要的关键词图片图。

-■1匚ontrolPaneJ—□X1BuirttnesASMrchClustersLatsisLajrouiViewsConfiuurethgm(xl9l;flx^e^G/^209叫20TheNirniterotStatesxlQ.']i.dxlQ.']i.dMinimumDuration2RefreshRefreshVIA开i±*■恃-SXS-^竝缁”2017naait133.E5T胆3XJ1EMCE»LEM国CI&432DO2ilW3XJ1—■MMEC-9EUEKifl2OtQ三屮优虚4J=l£7a2MNJX[3SUQ泊工宙J7.KE2W3XE^‘——Knnv烷酊Ed2MM?W3玄E豪罕盹44血陷空仙2X0——話!9EX2HULWKT?玄<H2竺血爼空阳・・•71£3H2Ml?20£e9.777512317也土奋*K9:4-l2IU•KIT—UK1QL.77EH20122XL7”■悔PI削斫M3SMHU2G17Ai.auifl.91272IU3C-17SBZfU3?17关键词分析的可视化处理(实战-附详细说明)0可视化窗口调整调整好参数等,点击Go!运行,得到可视化窗口后,如下:进入可视化界面后,可以先点击a图标,进行聚类,如果得到的效果不好,可以点击聚类图标后面的T、K或A来以不同的方式进行聚类;也可以点击LSI、LLR、MI、USR用不同的算法来进行聚类,从而选取最合适的结果。等聚类完成后,可以调整d栏,调整聚类的字体的大小。通过改变b栏可以调整对关键词重复出现次数的限制,通过c栏,调整关键字的字体大小。1调整与美化往往软件刚跑出来的结果图并不清晰,而是混乱地堆叠在一起(如下图),因此我们要对其进行微调。1)调整标注阈值、字体大小、节点大小Heywwd|l#iiiILdw应'〜[冃上比mitwwFimrwiiLTShoviFivqwvIfCT曲3)调节节点的形状谄Fine(MingMwivSlupe(KrvMiQKfe!T«ftw^・*Uwshk>d『HE谄Fine(MingMwivSlupe(KrvMiQKfe!T«ftw^・*Uwshk>d『HE问Pjtli^iin.,0Tt»RHbgHictoqn11Ortit♦t皿皿匸皿TlifltRgle■ModeDutl»e匸okKSquare>1Node-aLniiciIsb«h.Clu<ler4MriwwlkCwrl^trilern4)调节标注字的颜色L*c«BddiDiwind£・bTIdimLn典權ArKtaI断注宇擁的嗫酋n也iWkvL妙*OwM#1L¥+L*c«BddiDiwind£・bTIdimLn典權ArKtaI断注宇擁的嗫酋n也iWkvL妙*OwM#1L¥+:SlW^iild*ClLHttfLiriKliPitvilIEmI却*琢h・W

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论