《文献计量学实务》doc版.doc_第1页
《文献计量学实务》doc版.doc_第2页
《文献计量学实务》doc版.doc_第3页
《文献计量学实务》doc版.doc_第4页
《文献计量学实务》doc版.doc_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章文献计量学实务1第一节Web of Science1第二节运用Excel2No.1 文章类型5No.2 语言6No.3 期刊6No.4文章页数6参考文献数6No.5国家分析6No.7国家分析9No.6作者分析11No.7成长趋势12影响因子13作者关键词13研究领域14文献计量模式分析14被引用率14第三节14第四节15第五节15第三章文献计量学实务第一节Web of Science进行搜索:在search框内敲入所需要查找的关键词,不同关键词间用and或or连接。如通常格式可为:(XX or XX or XX)and XX*。*可要可不要,表示后续内容可任意。点击search。(如:搜索吸附领域粘土的文献,可敲入:(adsorption or sorption) and clay*。点击Refine your results下的SubjectCategories从众多领域中选出所需要关注的领域内的文章,点击VIEW RECORDS。对所有文献进行了初步筛选。Add to marked list在网页右下方Output Records:下的Records选择所需要输出的文献序号,ISI一词输出可以最多500篇,所以我们通常选1500,依次5011000,等等。点击右下Add to marked list。此时网页整上方会出现有红勾的Add to marked list,点击。Step 1. Select the fields to include in the output下选择所需要输出的数据项。通常我们做分析时候应选上除cited references和abstract外的所有项。这两项是由于内容较多,EXCEL处理起来不便,所以通常不选。Step 2. Select an option.我们需要选择的是Tab Delimited(Windows).接下来很重要的一步是我们应在“Automatically delete selected records from the Marked List after output is complete.”前打勾,否则在后续输出时候会因对前面输出项目的记忆造成干扰。点击SAVE TO FILE。在下个网页中会输出一个记事本(.txt)格式的文档,对其内容全选复制贴贴入新建EXCEL中,便自动输出各项数据。此时可进行下一查找:直接点击BACK,然后RETURN 即可。需要注意的是在后续贴入EXCEL时,每次再贴入EXCEL的第一行都是标题,应该删除。重复执行,最终便可得到我们所需领域的文献数据。如果我们在电脑里安装有软件Reference Manager或者 EndNote,也可直接将文献输出其中进行管理。前面的操作基本雷同,只是再Add to marked list后Step 1. Select the fields to include in the output后所选项重点可变为选择Author(s),Title,Title,abstract*,keywords及times cited等所需项。Step 2. Select an option.我们需要选择的是 Field Tagged.然后在下面小方框打勾,再点击SAVE TO FILE。第二节运用Excel通过第一节我们对所需查找领域文献全部已经输出为EXCEL形式数据,接下来可对其进行整理分析。 (一)前期处理步骤:1首要的工作是保存好原始数据,在EXCEL里将其所在sheet命名为OD(original data的缩写),方便我们在后续处理工作中进行核对。2数据的初步处理,包括:(1)先从原始数据库中找到我们想要进行分析的部分保留,其它意义不大的可直接删除。新建一个sheet,将OD的全部数据复制过来,将其命名为D。可删除的列有:CA,SE,AB,EM,CR,PU,PI,PA,J9,JI,PD,VL,IS,PN,SU,SI,BP,EP,AR,DI,GA。(注:各列title所代表的含义见附二。)(2)可将年份PY进行排列,如从按ZA降序排序得20061995,按AZ则相反。因为我们从WOS中所下当年的文献只是一部分,数据不完全,所以在分析的时候,通常删去当年的文献。快捷方法举例:选定年份PY列,查找2005,找到第一个的上面所有行即为2006年的文献,对其全选删除(鼠标右键+D)即可。(3)因为我们通常只分析的文章类型为article,所以对DT列可进行同(2)操作,排序后删除除article外的所有文献所在的行。(4)将最左边第一列改为排列序号:标题PT变为No.;在单元格A2敲入1,A3敲入2,选住A2,A3,双击即得1,2,3,4依次排列序号。(小提示:在此步骤前可将所有数据按年份排列,再加序号)3进一步处理:为方便后续操作,如在国家分析时,EXCEL会把“USA”与“ USA”识别为两个不同的国家,所以之前我们可先进行处理。用ctrl+ F查找替代功能,将D中的所有“, ”换成“,”;“; ”换成“;”。还有在整个EXCEL处理中注意标点都要用英文的标点。这一步极其重要。!附一 常用快捷键:ctrl+oror or 快速到达所在列/行的最上or下/ 左or右一个单元格;(小提示:查找时若从某行或列的有内容单元格选起,则到达位置为最后一个有内容单元格;若即从空白格选起,则到达位置为最后一个空白格相邻的下个有内容单元格。下面2),3)同,一定要注意操作的连续性)2)shift+oror or 向上or下or左or右选住连续的几列/行;3)ctrl+ shiftoror or 分别向上or下or左or右全选;4)ctrl+ F查找(查找功能默认为大小写不做区分);ctrl+ C 复制;ctrl+ V粘贴;ctrl+ S保存;ctrl+ Z撤销;5)F4固定;6)Delete 将单元格中内容去除为空白;鼠标右键D 完全将单元格删除。附二 小技巧1若对某列进行数据透视,其第一行应为标题行,否则EXCEL便把内容的第一行自动作为标题,最简单的是敲入0;2 当某区域有非常多内容(如国家或作者)需处理时,可全选贴入WORD进行处理,可加快运行速度。3EXCEL的单元格标准宽度设为8.38。附二 标题的含义:ABAbstractADAddress地址AUAuthor作者BPBeginning pageBSBook series subtitleC1Research addressesCICity 城市CPCited patentCRCited referencesCUCountry国家DEAuthor keywordsDTDocument typeEPEnding pageEREnd of recordFNFile typeGAISI document delivery numberGPGroup Author团体作者IDKeyWords PlusISIssueJ929-character source title abbreviationJIISO source title abbreviationLALanguageNRCited reference countOGOrganization组织PAPublisher addressPDPublication datePGPage countPIPublisher cityPNPart numberPSProvince/State省/州PTPublication type (e.g., book, journal, book in series)PUPublisherPYPublication yearRPReprint addressSAStreet Address街道地址SEBook series titleSGSuborganization次级组织SISpecial issueSNISSNSOSource (journal title)来源(刊名)SUSupplementTCTimes citedTITitle (article title)标题(文章标题)TSTopic专题UTISI unique article identifierVLVolumeVRFile format version numberWPPublisher web addressZPZip/Postal Code邮政编码(二)具体分析No.1 文章类型常见的文献类型有Article,Correction,Editorial Material,Letter,Note,Review几种。可在OD中,对DT进行数据透视。(注意这里是在原始表格OD中分析,以下其他都是在新的表格D中分析)1.在菜单“数据”下选择“数据表和数据透视图”:指定待分析的数据源类型为:Microsoft Office Excel数据列表或数据库;所需创建的报表类型选:数据透视表。点击“完成”。2.出现一个sheet:在提示框“数据透视表字段列表”中选择DT,点击“添加到”;再据提示“请将数据项拖至此处”将DT拖入。3结果示例如下:计数项:DTDT汇总Article1148Correction1Editorial Material9Letter6Note4Review14总计1182新建一个sheet,命名为Da。将数据透视表内容复制过去,计算各项比例。可按文章数P从大到小进行排序。结果示例如下:DTP%Article114897.12352Review141.184433Editorial Material90.761421Letter60.507614Note40.338409Correction10.08460211825百分比有效位数处理(注:后续数据分析中若涉及数据百分比,根据需要同此操作,不再重述):通常保留两位有效数字,使用工具“减少小数位数”,可分批处理,如97.1235297,再1.1844331.2,再0.3384090.34等。No.2 语言同前“No.1 文章类型”操作,对LA进行数据透视,所得新的sheet命名为LA。No.3 期刊同前“No.1 文章类型”操作,对SO进行数据透视,所得新的sheet命名为SO。No.4文章页数同前“No.1 文章类型”操作,对PG进行数据透视,所得新的sheet命名为PG。参考文献数同前“No.1 文章类型”操作,对NR进行数据透视, 所得新的sheet命名为NR。No.5国家分析首先区分两种作者联系方式。RP: 通讯地址,只有一个作者;C1:研究地址,多个作者。示例RP:Acemioglu,B(作者),Kahramanmaras Sutcu Imam Univ(机构),Fac Sci & Arts,Dept Chem,TR-46100 Maras,Turkey(国家) 通讯作者(RP1),所在机构(RP2)将RP列排序, copy入新的sheet。(排序原因是考虑到后续处理如合并函数的操作连贯性要求);对RP列用分号进行分列:数据分列分割符号分号完成;在RP列前插入新的一列,命名为RP1。在A2中键入CONCATENATE函数(从“fx”中的“全部函数”中选择):Text1:B2Text2:,Text3:C2Text4:,完成后点回车键,即在A2中可显示公式有:=CONCATENATE(B2,C2,)。再双击两次A2,于是A列全列便可得。(小提示1:Tab键会经常用到,如由Text1按Tab键一次到Text2,两次即到Text3。后续处理中在对较多单元格使用合并函数时,如可首先从Text1起依次左手按两次Tab键,右手选择单元格B2,C2,D2,E2;然后再从Text2起依次左手按两次Tab键,右手连续按,或;,即得用,或;合并单元格的效果。结果示例如:=CONCATENATE(B2,C2,D2,E2,F2,G2)。需要注意的是,根据需要在最前一个或最后一个考虑是否加入,或;,以及加几个的问题。)(小提示2:在C2后加,的原因因为RP列可能为空白格,若不加合并后则会出现有的格为,的情况,补充两个,后则变成有“,”,而以前的非空白格则会在后面有“,”,于是我们再进行取代操作,见步骤5,就可以了。)将A列整列点右键进行复 .制,再选择性粘贴(选择“数值”粘贴)。此步也很重要,以后会经常用到!取代,为无,取代,为无。至此A列即完成了RP1。可删除B,C列。现在的B列即为机构。将其命名为RP2。可删除后面多余的其他列。对RP1,RP2分别进行数据透视,得到我们想要的分析。 通讯作者所在国家(RP3)考虑到国家问题处理稍微复杂,故区分开来作处理。这里的方法可作为模板应用,接下来后续国家处理时不再详述。1查找*Hong Kong,Peoples R China取代成Hong Kong(香港问题先处理);2查找*,取代为无。因为RP的最后一个是国家,此操作便可将其前的内容全部去掉。3处理美国,将其统一为USA(USA原本有四种形式存在:USA; NC 27695 USA;CA 90807;CA):*USA取代成USA;*0取代成USA;*1取代成USA;*2取代成USA;*9取代成USA;取代两个字母结尾的:这里要用到查找字母个数的函数LEN,并进行数据筛选。插入新的一列,在A2中键入LEN函数(从“fx”中的“全部函数”中选择):Text:B2完成后点回车键,再双击两次A2,于是A列全列便可得。选住A1,操作:数据筛选自动筛选。此时对A1格下拉,便可看到A列有的各数字。如果有2,则选定,会出现所有含两个字母的行,可依次将其对应单元格修改为USA。将*USAUSA取代为USA。可多点“全部替换”两次,确保把可能出现的有三个USA的情况都替换完全。此时可把A列删除,并取消自动筛选。4处理英国,将其统一为UK。(UK原本有四种形式存在: North Ireland; Scotland; Wales;England)。5至此以上四步完成国家取代的基本工作,为防止遗漏,可对整列进行自动筛选检查,及时纠正遗漏。然后可运用数据透视表对RP3进行处理分析。6国家的其他处理,可根据需要选择:更改更合适的大小写,将全列复制贴入WORD文档,格式更改大小写句首字母大写,然后贴回EXCEL。另外,WORD文档里有快捷键shift+F3可对全部字母改大(小)写;EXCEL有公式LOWER可对全部改小写。又如可换Peoples R China为China等等。附三 处理以美国以数字结尾情况的另外方法根据结构CA 90807思考新的替代法。在处理完香港后,取代“,”为“, ”(如果国家多时则要在分列前就进行取代);查找*,取代为无;*USA取代成USA;查找 ? ?取代为USA;对应查找两个字母的要改为查找三个字母,取代为USA;(因此时各国家前加入了空格)*USAUSA取代成USA;将USA取代成 USA,此时得到结果为所有国家前都有一个空格。(因在上步操作中USA前没有了空格,为一致所以要再加上)。No.7国家分析通讯与研究合并地址(C1+RP)No. + RP贴到新的Sheet,先去除RP中的作者(为方便后续分析)。方法为:分列:在分列时选择最左边两列不导入,或者分列后直接删除左边两列;自动筛选,最远的字段第一行打0,在单元格右下方以实心的十字时拖动向左,第一行所有横列都变成0(防止在合并时遗漏后面的列);用,合并。注意最后一列后加“,”,取代“,”为“,”,再取代“,”为无。可多取代几次至完全。(很多的逗号取代越来越少) (小提示:什么时候对国家需要排序呢?一种是合并函数使用时,连续性的要求。但若是连序号一起复制过来,则不需。这是最重要一个原因;另外就是再后面处理许多国家,将后续列依次前贴至第一列时很必要;还有就是删除重复国家时很有用,尤其是出来开始较少国家时等)2在RP前贴入C1,插入新一行用;合并。注意C之前和D之后一列都要加“;”。取代“;”为“;”,再取代“;”为无。(存在有5,3,2个分号的情况)。3至此完成了C1+RP的操作,在原数据库D中的C1前贴入此列。一定要注意在贴回的时候对应序号一致,在后续操作中都要重视此问题,不再重述。 无重复的通讯与研究合并地址的国家(CC1+RP)No.+ C1 + RP贴到新的Sheet,用;分列,自动筛选,标0;对国家进行处理;国家处理完毕后,由于同一栏勿有重复的国家名称,所以用MATCH函数,同一行每个国家只留下一个名称。在序号(A列)跟国家(B列与之后的列)之间插入一系列新的字段,成为作为MATCH函数处理的字段。插入方法为ctrl+shift全选国家部分,右键菜单选择插入即可。在B1插入函数中选择MATCH:lookup_value 选择你要比对那栏的国家所在格(如H1)lookup_array 所查对格后面整行作为比对出,是否有与其有重复(如可按I1右拖即可)Match_type 输入0(表示H列作为第0列,则I为第1列)B列第一栏框中,以实心的十字点向右拖至G1,再整行双击两下使往下整栏函数设定格式相同;对B至G列进行自动筛选。如C列会有N/A与1,2,3,4,5等数字出现: N/A代表同一横列中没有与I列相同的国家字段; 数字2代表同一横列中从J列数第2列,即K列有与I列相同的国家。在B列中筛选数字:可先将H列冻结,把与H列国家相同的第1列整栏用Delete键删除,再删除第2,3列等等,所有数字处理完毕后注意切记要再B列选择“全部”打开,并将H列解冻。依此类推到C,D,E所有列字段比对完毕,即处理完所有同一笔数据中重复的国家名称。一定要注意对应列关系。小提示:比对时可发现G列,即插入的最后一列全部为N/A,可直接删除。全部完成后,发现都变成了N/A,将其删除即可。4.以CONCATENATE函数功能用,把同一横列所有国家合并到同一栏。还是注意在最后一个TEXT里为两个逗号。选择性粘贴后,把,取代成无,把,取代成无即完成。5把处理完逗号问题的国家复制贴回D sheet开设一个新的column名称叫CC1RP。 分析国内合作与国际合作单一国家:No.+ CC1 + RP贴到新的Sheet,用,分列,自动筛选,标0;2然后从B列开始A-Z排序, C ,D依此类推,连续排序至最后字段,所有空白格即在下方了;3在C列用Ctrl,找到C列最下面的位置,其所在行之下的行的即为单一国家;4按CtrlShift框起单一的B列国家,复制贴到新的sheet做数据数据透视表与图报表(分析得知单一国家的项目SP与计数P)。合作国家:1回到处理所有国家的sheet,扣除刚才复制到新Sheet的B列单一国家部份,其余从B列至最后面的所有列即为合作国家(可以看到同一横列的数据有两个以上的国家);2.全选复制至一个新的sheet,去掉序号No.列和第一行。3把合作国家各个列从B开始一列一列剪贴到A列下面,也就是全部贴成一列国家。刚开始列比较多时可采取的操作为:将A行复制,在A列的最下方选择性粘贴(注意这里要选择“转置”),再删除A行。依次做几行,至列较少为止。最后将A一列国家做数据透视表(分析得知合作国家的项目CP与计数P)单一与合作国家一起分析:1.在一个新的sheet中,贴入SP,CP及各自计数项P。2VLOOKUP函数功能合并处理单一国家及合作国家成为一个合并的表格:将单一国家及合作国家贴到同一列A中,做数据数据透视表与图报表(得知此DATA中所有国家名称);把所有国家的名称贴到新的sheet,此列命名为C/T(即Country/Territory),该sheet可命名为Country%; 将上述已分析过的单一与合作国家贴到此sheet,在列C/T右边插入新的一列,运用VLOOKUP函数:【把找到相同的国家的数字贴到lookup的字段中】Lookup_value A2Table_array SP,P(或CP,P)两列,且用F4固定Col_index_num 2Range_lookup false 分别找到SP与CP对应的P,把找到的N/A值单元格(代表找不到)皆改为0。再分别算单一国家、合作国家、所有国家的百分比等,对其按大小排序可得到想要的结论。对小数点的处理:有效位数两位数。最后得到结果格式如下:C/TSPP%CPP%TP%IP%其中TPSP+CP;IP=SP/TP*100No.6作者分析作者人数(No.AU)1. No. + AU贴到新的Sheet,对AU进行排序。将Anoy排在上面(表示作者不详)。2用;对其分列,自动筛选,打入0。3在列AU前插入一列,运用COUNTA函数:Value1:按住C1,ctrl+shift向右再对B1以为实心的十字点双击便得整列的值。选择性粘贴入数值。4便得No.AU,可将其贴入原sheet D中。对其进行数据透视。得到不同作者数对应的文章数。个人文章数排名这是很有益的操作,可以使我们得知该领域谁发表的文章最多,在下面的分析中我们还可得知谁以第一作者发表的文章数最多,从而了解大师何在。1将AU复制至新的sheet,排序去除不明作者。分列;自动筛选,第一行全打0。2依次对每一列进行排序,完成后同前操作,依次从B开始一列一列剪贴到A列下面。全部贴成一列后,进行数据透视。第一作者文章数排名1 将AU复制至新的sheet。查找;*变成无,便得到第一作者。或者对其用;进行分列,保留最前面的列即是第一作者。2 对第一作者列FAU进行数据透视。No.7成长趋势这里仅用数据说明,更清晰的表示可用EXCEL图表功能来描述趋势。大体为插入图表X,Y散点图更详细的图表格式设置,暂不作详述。主要仍是运用数据透视表功能,在数据sheet 中作数据透视。为描述每年所发表文章的趋势,可首先选PY项,点击“添加到”。1 据提示“请将数据项拖至此处”将PY拖入。PY,P;2 从左上角将PY拖出,再据提示“请将数据项拖至此处”将No.A拖入。注意这里的No.A为求和项而非计数项。得到作者个数No.A,P;3 从左上角将No.A拖出,再据提示“请将数据项拖至此处”将NR拖入。得到参考文献数NR,P;4 从左上角将NR拖出,再据提示“请将数据项拖至此处”将PG拖入。得到文章页数PG,P;5 其他更多分析雷同。所得结果大体格式为:PYPNO.AUNO.AU/PNRNR/PPGPG/P199525672.6842617.042208.81996441222.77272782818.818184129.3636361997551753.181818115821.0545555110.018181998521502.884615123523.754668.9615381999631822.888889135421.4920669511.031752000721982.75169023.472226849.52001993103.131313230923.323238979.06060620021043533.3942312619250096220031524973.269737372224.4868414109.27631620041736013.473988454826.2890215779.11560720051996593.311558507825.5175916558.316583总和/平均103833143.1926782496724.0529996089.256262小提示:是求和项还是计数项由分析需要决定,只需要双击左上角单元格两次,在弹出提示框中将汇总方式选择为“数值计数”或是“求和”。通常我们这里分析除了No

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论