第二讲 计算机检索技术ppt课件_第1页
第二讲 计算机检索技术ppt课件_第2页
第二讲 计算机检索技术ppt课件_第3页
第二讲 计算机检索技术ppt课件_第4页
第二讲 计算机检索技术ppt课件_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

.,科技文献检索与利用,卢坚图书馆.信息咨询部lujian课程EMAIL:kjwxjsk2012密码:pass2012,.,2,第二讲计算机检索技术,一、检索的含义二、检索语言三、检索工具四、检索技术五、检索步骤与策略,.,3,一、检索的含义,文献检索是检索者使用某种手段(手工、计算机或其他),借助某种工具(印刷型检索工具、计算机检索系统等),查找所需文献信息的的活动和过程。,.,文献特征,文献标识,课题特征,检索表达式,文献,分析,检索工具(系统),用检索语言对文献进行描述,检索需求,分析,用检索语言对课题进行描述,是否匹配,否,输出结果为零,得到检索结果,是,检索原理示意图,情报工作人员,(提问标识),文献存储过程,检索过程,检索者怎样才能找到自己需要的资料呢?,.,5,二、检索语言,1.检索语言的定义,检索语言应文献存储和检索的共同需要而编制的专门语言,是标引文献特征和表达检索需求的一种标识系统。,.,6,二、检索语言,2.检索语言的作用储存文献特征标引的依据检索检索提问表达的依据便于文献集中化、系统化和组织化保证检索者按不同需求检索文献时能有较高的检全率和检准率,.,7,二、检索语言3.检索语言的类型,检索语言,表达文献外表特征语言,表达文献内容特征的语言,分类分类号,主题,关键词主题词,题名书名、篇名、刊名,著者个人、团体,文献编码书号、刊号、报告号,.,8,分类语言,用分类号来表达标引和表达文献内容特征的一种检索语言。,世界上有哪些著名的分类体系?中国图书馆图书分类法IPC国际专利分类法杜威十进制分类法(DDC)国际十进制分类法(UDC)美国国会图书馆分类法(LCC),.,中国图书馆分类法(中图法),基本22大类,A马列毛邓,B哲学宗教,T工业技术,TB一般工业技术,TD矿业工程,TE石油天然气工业,TV水利工程,TB1工程基础科学,TB2工程设计与绘测,TB3工程材料学,TB9测量学,TB30工程材料一般性问题,TB31金属材料,TB37耐腐蚀材料,Z综合性图书,.,中图法从大类到小类,层层展开,不断细分,形成完整的学科知识体系。T工业技术TP自动化技术计算机技术TP3计算机技术TP39计算机的应用TP393计算机网络TP393.4国际互联网,.,索书号:TN911/846TN911/855TN912/123,图书排架规律:奇数列的书架先以两列书架为一单元,最后再以三列书架为一单元,按从左至右,由上而下的规律排架。图书排序规律:先比较分类号,再比较书次号。分类号或书次号中的数字不按数值大小而是从左到右逐个数字进行比较,小在前大在后,比如:在分类号TN911完全相同的情况下,书次号846排在855的前面。,.,图书排架规律:偶数列的书架以两列书架为一单元按从左至右,由上而下的规律排架。,.,13,关键词语言,直接从文献的题名、正文或者摘要中抽取具有检索意义的词来标引和表达文献内容特征的检索语言。所有的数据库、搜索引擎都支持关键词语言。,.,14,主题词语言,用规范化词来标引和表达文献内容特征的检索语言。搜索引擎不支持主题词语言,有些数据库会提供在线主题词表如EI、Inspec。,什么是规范词?也叫受控词controlledterm。举例:“维它命C”有“VC”、“维-C”、“维生素C”、“抗坏血酸”不同的说法,但是规范词“维生素C”(汉语主题词表),.,主题词汉语拼音Xianxiangguan主题词显像管主题词英译名kinescopePicturetubeY显像管D电视显像管监视管F彩色显像管固体显像管黑白显像管S电子束管Z电子管C显示管指示管,注释:Y用项符号:表示该主题是正式主题词D代项符号:表示该主题是非正式主题词F分项符号:表示该主题是“显像管”的分主题词,即下位词S属项符号:表示该主题是“显像管”的上位主题词Z族项符号:表示该主题是“显像管”的族首词(大主题词)C参项符号:表示该主题是“显像管”的相关主题词,.,Inspec叙词表,.,词表的作用,1.词表是主题检索中确定规范词的主要依据;2.明确上下位概念,逐级展开相关词的等级关系;3.词表是了解课题专业技术背景的科学依据;4.词表是选择检索英文关键词的重要工具;,.,18,三、检索工具,1.检索工具的定义用来存储、报道和查找文献的工具。在计算机检索阶段,文献检索工具一般特指各类文献数据库。特点:1.详细地著录了文献的外部特征和内容特征2.具有既定的检索标识,如主题词、分类号、作者姓名等3.全部文献根据标识系统、科学地排列成为一个有机的整体4.提供多种检索途径,.,19,三、检索工具,2.文献数据库的类型(1)书目数据库(Bibliography、Catalogue)(2)文摘数据库(Abstract)(3)全文数据库(Fulltext)(4)数值、事实数据库(numericalFact),.,20,三、检索工具,(1)书目数据库报道和揭示图书、期刊的外部特征(包括题名、著者、出版社、出版时间、文献类型、语种)的检索工具。通过它可以了解出版和收藏信息。目录报道和揭示的一般是整本书和整种刊例如:全国新书目馆藏书目OPAC联合目录WorldCat,.,21,三、检索工具,(2)文摘数据库报道和揭示文献的外部特征(题名、著者、出处、卷期、页码、时间、文献类型、语种),同时对文献的内容进行摘要性描述的检索工具。文摘报道和揭示的一般是单篇文章例如:EI、SCI、ISTP、INSPEC,.,三、检索工具,(3)全文数据库除了报道和揭示文献的外部特征、内容摘要以外还提供原始文献全文。例如:超星数字图书馆、中国期刊全文数据库、万方博硕论文全文数据库、PQDD、EBSCO、IEEE、ScienceDirect、Emerald、Springer,22,.,23,三、检索工具,(4)数值、事实数据库报道和揭示各类数据(参数、指标等)和事实(人物、事件、机构)信息的数据库。例如:国研网、国泰安CSMAR数据库、中经网、万方中国企业数据库、全球产品样本库等、北大法意数据库,.,24,3.文献数据库的构成要素,(1)文献资源指数据库收录的文献类型,一个数据库可以有一种或者多种类型的文献;可以是文献线索或全文。,.,25,(2)检索字段(Field)也叫检索点、检索途径,分为两类:内容特征的字段:关键词(keyword)、主题词(subject)、摘要(Abstract)、分类号(classfieldcode)外表特征的字段:文献题名(Title)、作者(Author)、作者单位(affiliation)期刊名(sourcetitle/Publicationtitle)、出版年份(Year)等。,.,26,字段示例(1):,【篇名】大学图书馆在线信息素质教育平台的构建【作者】宋琳琳;【作者单位】武汉大学信息管理学院;【文献出处】图书情报工作,2009年07期期刊荣誉:中文核心期刊要目总览ASPT来源刊中国期刊方阵CJFD收录刊【中文关键词】在线信息素质教育平台;信息素质教育;大学图书馆;【摘要】从总体构架、用户层次、功能模块、技术支持、资源数据库5个方面介绍信息素质教育平台的构成及功用,分析其有用性,以解决当前信息素质教育领域存在的数字化程度不高、缺乏合作交流等问题。证明在线信息素质教育平台是大学图书馆开展信息素质教育的理想选择。【分类号】G258.6,.,27,字段示例(2):,Accessionnumber:20113914372427Title:AdaptingAODVwithhigh-throughputforAMIsmartmeternetworksAuthors:Zhou,Xiaohui(1);Wang,Fangfang(1)Authoraffiliation:(1)InstituteofComputerScience,HangzhouDianziUniversity,Hangzhou,310018,ChinaSourcetitle:AdvancedMaterialsResearch,Volume:317-319,Issuedate:2011,Publicationyear:2011,Pages:1127-1131ISSN:10226680,ISBN-13:9783037852163Documenttype:Conferencearticle(CA)Controlledterms:Design-Manufacture-Routers-Routingalgorithms-ThroughputUncontrolledterms:Distancevector-Expectedtransmissioncounts-Hellomessage-High-throughput-NS-2-Routertables-Running-in-Smartmeters,.,28,(3)检索方式分类浏览Browse基本检索BasicSearchSimpleSearch高级检索AdvancedSearch专业检索ExpertSearch,.,各种检索方式优缺点比较,.,30,(4)检索结果排序相关度、出版日期、被引频次(5)检索结果分析、统计对检索结果分析统计可以发现隐含在相关文献中的一些规律。如课题发展研究趋势、热点、著名研究机构和个人、交叉应用等。一些著名的检索工具如SCI和EI提供这样的功能。,.,31,(6)检索结果的下载、保存方式在线打印、本地全文下载或全文链接、邮件接收、参考文献管理软件输出(7)个性化服务检索界面个性化、检索历史保存、RSS、Alert(8)使用说明一般包括数据库的基本介绍(包括收录文献的类型、涵盖的学科范围和回溯文献的时间)和检索技巧及范例。,.,32,四、检索技术,常用检索技术(1)布尔检索(2)截词检索(3)位置检索(4)精确检索特殊检索技术引文检索、跨库检索、跨语言检索,.,33,1.布尔检索Boolean,用布尔逻辑算符来规定检索词之间的逻辑关系的一种检索技术。种类:逻辑与(AND、*)、逻辑或(OR、+)、逻辑非(NOt、-)广泛应用于搜索引擎和数据库,.,34,()逻辑“与”AND;*用于概念交叉和限定。起缩小检索范围和提高文献查准率的作用。例如:查“分布式网络系统”方面的文章分布式AND网络系统分布式*网络系统,.,35,2)逻辑“或”OR;+用于概念并列和补充。可扩大检索范围,提高查全率。例如:查“计算机”方面的文章计算机OR电脑计算机+电脑,.,36,3)逻辑“非”NOT;-用于概念间的排斥,剔除无关概念,提高查准率。例如:查非酒精类饮料方面的文章。饮料NOT酒精饮料酒精,.,37,4)优先算符“()”可以改变布尔逻辑的正常运算次序。布尔逻辑运算次序为:非(NOT)与(AND)或(OR)例如:大学生OR研究生NOT就业(大学生OR研究生)NOT就业两者检索结果不同。,.,38,2、截词检索truncation,可检索具有相同词干或词根的词,用来提高查全率。常用截词符“*”、“?”、“#”、“!”、“$”,它是特殊的逻辑“或”运算。种类:前截断、后截断和中间截断多用于英文搜索引擎和数据库,.,39,)computer*可检索包含computers、computerize、computerise等文献。)*Computer可检索包含computer、minicomputer、microcomputer等文献。)wom?n可检索到包含woman、women等文献。提示:截词符必须紧跟词干;词干不能截得太短,要合理。不同数据库的截词符不太一样,要参照数据库说明。,.,40,、位置算符proximity,可限制检索词之间的位置,优化检索结果,提高检准率。种类:(With)、(Near)、Same,.,41,()位置算符():用于两个检索词之间,限定两个彼此接近,前后次序不可颠倒。例如:electronic(W)resources可检索出包含electronicresources和electronicofresources的文献()位置算符():用于两个检索词之间,限定两个词彼此接近,前后次序可以颠倒。例如:information(N)retrieval可检索出包含informationretrieval,retrievalinformation,retrievalofinformation,retrievaloflawinformation,retrievalofChineselawinformation的文献,.,42,()位置算符的变体(n)、(n):n表示两个词之间最多可插入的词,含义同和算符。()Same算符:表示两个词必须在同一个字段(或自然句)中。,.,使用位置算符要注意的问题,英文数据库常用多数用于数据库的专业检索方式(需输入检索指令的检索)不同的数据库用到的位置算符不一样,使用前查看检索提示或相关帮助,SD,EI,.,4.精确(exact)检索,两个或多个词不能拆开,不能互换位置,中间不能插入任何字符。不同的数据库对精确检索的规定不一样,部分数据库使用”,如EI(“intelligentcontrol”);部分数据库使用空格即可,如IEE/IEEE(intelligentcontrol);还有一些数据库通过特定程序控制。,springer,.,5.引文检索,引文检索也叫回溯检索,就是利用文献与文献之间的引证关系检索相关文献的方法。通过引文检索可以多方位了解课题研究情况,追溯课题研究发展的脉络,发现相关研究等。,.,什么是引文reference,citation,一篇论文,这篇论文的参考文献,.,从一篇高质量论文出发探寻该领域发展道路,CitedReferences越查越旧TimesCited越查越新RelatedRecords越查越深,分析:学科分布、发展趋势等,.,48,五、检索步骤和策略,.,(一)课题分析:明确检索需求、确定查找范围,检索目的:大致分为三种类型普查型需要全面收集有关某一主题的文献资料,强调“查全率”。如查新攻关型需要收集某一特定方面的文献资料,旨在解决科研生产中的关键问题,不强调文章的数量,解决问题即可。探索型了解和掌握某一领域的研究现状,最新研究动向和研究成果,要求查到的文章具有新颖和及时的特点,对“查全率”和“查准率”不一定有较高的要求,.,查找范围:主题、学科范围、文献的类型、年限、语种,.,51,(二)选择检索工具,书目数据库,文摘数据库,数据、事实数据库,WWW,全文数据库,.,52,文摘数据库和全文数据库,文摘数据库大的公司,全文数据库1学术出版社,全文数据库2代理公司,全文数据库3学会、协会,文摘数据库1,文摘数据库2,.,(三)确定检索词,构建检索表达式,主题词:用于主题字段的检索词,规范化检索词(词表)关键词:用于非主题字段(题名、摘要等)的检索词,非规范化检索词,表达内容特征的途径:主题途径、分类途径、主题分类途径提炼检索词,表达外部特征的途径直接输入检索词即可,如题名、作者,ISSN等,.,确定检索词,第1步:简短写出主题句第2步:将所有和主题相关的关键词和短语标出来第3步:如果选用主题词检索,查词表;如果选用关键词检索,对关键词进行补充、替换和删除补充同义词、近义词、缩写、不同拼写例如:网络因特网webWWW(wideworldweb)brainstorm,brainstorm,brain-storm,brain-storms,brainstorming,brainstorming,brain-storming替换当检索词过于宽泛,可用下位词替换;当检索词太狭义,过于具体,可用上位词替换例如:火箭发动机、液体火箭发动机、液氢/液氧发动机删除没有检索意义的词;存在蕴含关系可合并的词例如:研究、探讨、讨论、系统;计算机因特网因特网,.,构造检索式,注意:在构造检索表达式之前一定弄清所用数据库的检索功能和支持的操作算符,这样才能有效地进行检索,用布尔逻辑符、截词符、位置符、精确符等连接检索词,来表达检索词之间的逻辑关系。,.,检索课题1.神经网络在旋转机械故障诊断中的应用研究,第1步:标出和主题相关的关键词神经网络在旋转机械故障诊断中的应用研究第2步:删除不必要的检索词删除“应用”和“研究”(原因:意义过于宽泛,没有检索意义)第3步:对核心词进行补充和扩展神经网络人工

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论