




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
不同数据库中机构检索的检索方法及技巧论文 当前,很多高校科研管理部门每年都会进行科研成果统计,对本机构内科研活动状况进行定量测定。通过不同数据库的机构检索,能够反映高校科学研究的动态和水平,从而为在院校的学科建设、科研规划、人才培养、宏观决策的制定等方面建立机构知识库提供重要依据;同时也有助于与拥有相近学科的高校进行横向比较。在实际工作中,经常会接到某高校科研处的委托,请求检索该高校人员在某个时间段(常常是逐年委托连续起来)发表的论文在国内外着名检索工具中的收录情况,借以统计该机构的科研成果。 1机构检索中遇到的问题 在检索时发现,机构中英文名称不规范的情况很普遍,如机构名称有常用名称和别名,机构名称采用缩写或简写,机构改名后仍然有为数不少的作者沿用原来机构的英文名称。还有一些作者在发表论文时未使用所在机构的正式英文名称,有好几种非正式名称出现1-2.这给检索过程中想要求全带来极大的困难。另外,不同的数据库收录论文时着录规则不同,如果检索策略不对,会导致检索结果出入很大3.笔者根据实际工作中积累的经验,介绍以机构委托时通常会用来统计的数据库以及在不同数据库中检索的具体方法及技巧,确保检索机构的查全率和查准率。 2机构检索时通常选取的国内外着名数据库 现在很多高校都是综合性大学,理工文史哲经管农医教各学科都有。所以在成果统计时可以大致按照自然科学和社会科学来分类。其中,自然科学类常用的数据库有SCI、EICompendex、CPCI-S、MEDLINE、CSCD、KI等,社会科学类常用的数据库有SSCI、A&HCI、CPCI-SSH、CSSCI等。这其中又区分这些数据库的核心版和非核心版的收录情况。这些数据库都是在国内外有重大影响力的数据库,其中有专门收录期刊论文的,或专门收录会议论文的,也有都收录的。 除了上述检索收录时常用的数据库,基本科学指标数据库(EssentialScienceIndicators,简称ESI)也是机构检索的重要工具,它是由世界着名的学术信息出版机构美国科技信息所(ISI)于xx年推出的衡量科学研究绩效、跟踪科学发展趋势的基本分析评价工具,是当今世界范围内普遍用以评价大学、科研机构、个人国际学术水平及影响力的重要指标。 3不同数据库中可以使用的着录规则特征及基本检索方法 机构人员发表论文时一般都会在作者地址中留下机构名称、具体地址及邮编,团体作者也符合这个特点。所以检索时考虑凡地址字段中出现该机构名称即可确认是该机构人员发表的论文。 不同数据库对信息的着录规则不同,会导致同样的检索策略检索出的结果差别很大。而同一家数据库商所做的同一平台上的数据库的着录方法是基本一致的,所以这里按照不同的平台来介绍。 3.1ISI平台 目前,我们常用的是ISI平台上的WebofSci-enceCoreCollection数据库集,包括:SCI/SSCI/A&HCI/CPCI-S/CPCI-SSH/CCR/IC等7个数据库,该平台还有MEDLINE/BIOSIS等数据库。 通过在作者地址中输入机构和/或地点的完整或部分名称,可以检索“地址”字段。例如,Univ和University可查找记录中的地址字段出现检索词“Univ”的机构。 可以使用逻辑运算符(AND、OR、NOT、NEAR和SAME)和通配符(*$?)来组合检索使检索结果更精确。但是检索包含上述逻辑运算符的地址,需要将该运算符名称括在引号内。 在检索时,逻辑运算符和通配符的使用与其他数据库的不同点在于:SAME运算符指定了由运算符连接的检索词位于同一地址,而不仅仅是位于相同的字段,使得检索结果更精确。 使用NEAR/x可查找由该运算符连接的检索词之间相隔指定数量单词的记录。该规则也适用于单词处于不同字段的情况,用数字取代x(x15)可指定将检索词分开的最大单词数。 通配符星号(*)表示任何字符组,包括空字符,只能放在词尾。 通配符问号(?)表示任意一个字符,用于单词中间。 通配符美元符号($)表示零或一个字符,可用于词尾或词中间。 3.2EngineeringVillage平台 目前,国家图书馆仅购买了该平台的EICom-pendex数据库,所以以下只针对该数据库的检索规则进行介绍。 作者地址字段Authoraffiliation简写为AF字段。EICompendex数据库提供了该字段的索引,但实际按照作者机构检索时发现效果很不理想,原因在于作者对机构名称的书写不规范,用索引列表很难穷尽。 EICompendex数据库也提供了逻辑运算符(AND、OR、NOT、NEAR、ONEAR和SAME)和通配符(*$?)组合检索来提高检索效率和精准度。 但是具体的使用方法和含义不尽相同。 截词符星号(*)用来检索以相同字母开始的单词。 通配符问号(?)表示任意一个字符,用于单词中间。 美元符号($)表示词干搜索条件。在一个完整的单词前面加上$,可以将其各种形式的变形都搜索出来。 位置算符NEAR或ONEAR限制检索时两个词组之间距更邻近,ONEAR更是限定了词与词之间的先后顺序。但它们不能与*、?、()、“”同时使用。 3.3ESI数据库 ESI数据库的功能主要包括3个方面:引用排行(CitationRankings)、高被引论文(MostCitedPa-pers)和引用分析(CitationAnalysis)7.ESI根据各机构不同学科领域10年内论文的被引频次的总和对机构进行排名。ESI中机构名称都很规范,只考虑机构的正式英文名称即可。 可以按学科浏览,查看在同一学科不同机构的排名情况;也可以进行机构检索,查看同一机构在不同学科的排名情况;也可以检索该机构近10年来在某学科的高被引论文数或热点论文数。 机构检索时默认在地址字段检索,只要包含该机构名称就符合检索条件。可以浏览字顺表进行机构检索,或用机构正式英文名称的缩写进行检索;输入“HARVARDUNIV”,对应机构名称就是HAR-VARDUNIV;输入“HARVARDUNIV*”,检索结果为包含前述两个词的任一地址,如:HARVARDUNIV或HARVARDUNIVMEDICALAFFILIATES. 3.4中文数据库CSCD/CSSCI/KI CSCD数据库机构字段只需了解加双引号(“”)是精确检索。不加是模糊检索。 CSSCI数据库中作者机构字段默认就是精确检索。 KI数据库中单位字段提供精确或模糊两种选择。这里要说明的是在机构检索时需要选择“模糊”,因为KI中“精确”是与所输入检索词完全匹配,而机构地址通常都是某大学某学院某系等信息,选择“精确”就会造成漏检很多。 中文数据库由于没有语言问题,相对来说检索规则也较简单,不再另述其检索技巧。都可以区分核心版和非核心版。需要注意的是,一定要将机构名称的常用名、别名、简写或缩写找全,并配合地址和邮编来检索,这样才能保证检索结果既全面又准确。 4机构检索在英文数据库中的检索技巧 根据我们多年的实际工作经验,认为初步设定检索式时要尽可能的放大范围以保证检索全面;同时,既考虑增加检索条件,又要使用算符,确保检索准确性。当机构名称较长时,不容易引起干扰;机构名称简单,则干扰项会很多。 4.1机构名称较长,直接用机构名称检索引起的干扰项较少 以华北水利水电大学为例,检索该机构xx年发表的论文在数据库中收录情况。 该机构的正式英文名称及邮编为:NorthChinaUniversityofWaterResourcesandElectricPower,HenanZhengzhou450011地址字段输入邮编450011,浏览可发现该机构的其他不规范写法,例如:“水利”有用WaterResources或WaterConservancy,“水电”有用ElectricPower或hydroelectricPower,“学院”有用U-niversity或institute. 以SCI为例,SCI数据库中地址字段检索时默认词与词之间的精确顺序,构造检索式如下:ad=(N*China(Univ*orinst*)Water(Conservan*orResource*)(Elect*orHydroelec*)Powe*or450011)以EICompendex为例,EICompendex数据库检索时默认词与词之间就是“and”关系,不指定检索词的顺序。这个原则适用于地址字段。所以实际检索时要具体情况具体分析。考虑到该机构名称较长,模糊检索,干扰项也不会太多。所以直接将检索式变更为EI中格式即可,如下:(N*Chinaand(Univ*orinst*)andWaterand(Con-servan*orResource*)and(Elect*orHydroelec*)andPowe*)wnAFor450011wnAF 4.2机构名称简单,直接用机构名称检索引起的干扰项很多 当机构名称较短时,就会有很多干扰项。如检索“河北大学”,该机构正式名称及地址如下:HebeiUniversity,HebeiBaoding071002在SCI地址字段输入HebeiUniv*检索,会发现以HebeiUniv*打头的各种干扰项,如:HEBEIUNIVTECHNOL、HEBEIUNIVERSITYOFTECH-NOLOGY、HEBEIUNIVERSITYOFSCIENCETECH-NOLOGY、HEBEIUNIVECONBUSINESS等等;在EI地址字段输入HebeiUniv*检索,会发现只要地址字段中包含了Hebei和University两个词,就满足了检索条件,导致检索结果极不精确,除了上述干扰项,还会有诸如:HEBEIMEDICALUNIVER-SITY、HEBEINORTHUNIV、HEBEIUNITEDUNIV等等。 这时,一方面可以通过增加检索条件,如将机构名称与地址或邮编组合检索来缩小范围使得检索结果更精确。也避免了漏检同时将地址和邮编都写错的情况。 以xx年SCI收录为例:原检索式:ad=(hebeiuniv*)andpy=xx检索结果:1023条修改为:ad=(HebeiUniv*and(Baodingor071002)andpy=xx,检索结果:469条可以看出修改后的检索式大大提高了准确率。 然后再在这个相对准确的结果中去确认就容易得多。 以上操作都是基于先将范围最大化从而不会漏检,保证检索结果更全面的角度出发。 另一方面,巧妙使用数据库中的算符以提高准确率。 以河北北方学院xx年发表论文的SCI收录情况为例:机构正式名称及地址:HebeiNorthUniversity,hebeiZhangjiakou075000North在数据库中有可能以NORTH或N或Northern出现。 构造原检索式:ad=hebein*univ*andpy=xx检索结果:450条情况1:粗略浏览检索结果发现干扰项HEBEINORMALUNIVERSITY很多,去除干扰项,检索式修改为:ad=(hebein*univ*nothebeinorm*univ*)andpy=xx检索结果:59条但这样会将地址字段既有河北北方学院又有河北师范大学的条目也去掉,所以补充修改检索式为:(ad=(hebein*univ*nothebeinorm*univ*)orad=(hebeinort*univ*andhebeinorm*univ*)andpy=xx检索结果:60条情况2:使用地址与名称组合检索。如上文中介绍,在SCI地址字段检索时,算符SAME有将检索词限制于同一地址检索的功能,所以做对比如下:原检索式:ad=(hebein*(univ*orcoll*)and(zhangjiakouor075000)andpy=xx检索结果:60条修改为:ad=(hebein*(univ*orcoll*)same(zhangjiakouor075000)andpy=xx检索结果:58条可见,使用same算符后检索结果更精确。 再以EI数据库中地址字段检索举例说明:原检索式:Hebeinorth*univ*wnaf发表时间:xx年检索结果:640条(可以单独检索hebeinuniv*以补充全面)如上文介绍,位置算符NEAR或ONEAR可以使检索结果更准确。可以修改检索式如下,以便看出其中差别:#1HebeiNEARnorthNEARuniversitywnaf发表时间:xx年检索结果:92条#2HebeiONEARnorthONEARuniversitywnaf发表时间:xx年检索结果:76条#3HebeiNEAR/0northNEAR/0universitywnaf发表时间:xx年检索结果:74条#4HebeiONEAR/0northONEAR/0universitywnaf发表时间:xx年检索结果:74条注释:#1和#2中没有指定相邻几个词时,默认是4个词。即NEAR等同于NEAR/4. 可以看出,检索结果变少,范围缩小。以上检索默认数据库打开Autostemming功能,自动进行词干检索,如north的变形northern也包含在检索结果内。这个功能也可以通过使用词干搜索符号($)实现。修改检索式为:#5HebeiONEAR/0$northONEAR/0$universityWNAF发表时间:xx年检索结果:74条但是,由于NEAR或ONEAR算符不能与*、?、()、“”同时使用,尤其是截词符*,这就使得检索结果不全面,如检索式#1到#5均无法检索到uni-versity的缩写univ. 以上仅是为了说明算符的重要性,在实际检索时要将上述几项合并使用。 5建议 (1)有关单位规范机构和地址名称及其英文翻译名称,科技工作者在撰写论文时也要采用正式
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年漳州能源社会招聘模拟试卷及答案详解(各地真题)
- 消费行业产品安全与品质保证承诺书5篇
- 科技智能产品迭代服务承诺函3篇
- 2025广东湛江经济技术开发区建设投资发展集团有限公司招聘党群工作部副经理1人考前自测高频考点模拟试题及答案详解(必刷)
- 所有人员生产安全风险控制承诺书(8篇)
- 2025广东江门市蓬江区教师招聘23人模拟试卷及答案详解(必刷)
- 2025年海南澄迈县专职社区工作者招聘以(第4号)考前自测高频考点模拟试题及答案详解(名校卷)
- 2025年阜阳市临泉华源医院导诊人员招聘15人考前自测高频考点模拟试题附答案详解(黄金题型)
- 2025年4月广东深圳光明区政务服务和数据管理局招聘一般类岗位专干5人模拟试卷及答案详解(全优)
- 2025广东依顿电子科技股份有限公司招聘高级经理岗模拟试卷及参考答案详解1套
- CJJ-T 135-2009 (2023年版) 透水水泥混凝土路面技术规程
- 高教社马工程人力资源管理教学课件unit1
- 因离婚给孩子申请改姓协议书
- 用车登记表(标准模版)
- GB/T 9871-2008硫化橡胶或热塑性橡胶老化性能的测定拉伸应力松弛试验
- GB/T 12190-1990高性能屏蔽室屏蔽效能的测量方法
- 01第一章-稻谷的加工汇总课件
- 六年级LOGO小海龟编程
- 非ST段抬高心肌梗塞指南课件
- 驻足思考-瞬间整理思路并有力表达
- Unit 2 Lesson 3 Running and Fitness 课件 高中英语新北师大版必修第一册(2022-2023学年)
评论
0/150
提交评论