《计算机检索基础》PPT课件_第1页
《计算机检索基础》PPT课件_第2页
《计算机检索基础》PPT课件_第3页
《计算机检索基础》PPT课件_第4页
《计算机检索基础》PPT课件_第5页
已阅读5页,还剩74页未读 继续免费阅读

VIP免费下载

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第二节文献检索基本知识,2.11检索原理,检索表达式,文献标识,检索工具(系统),是否匹配,否,输出结果为零,得到检索结果,是,情报工作人员,2.11检索原理,文献著录:是指按照一定规则分析、选择、记录文献信息的过程。,款目,文献标引:对文献的内容特征及其他有检索意义的特征,进行分析、描述并用检索标识记录下来,作为存取依据的文献处理过程。标引方式:,分类标引(归类)主题标引,2.11检索原理,分类标引(归类)依据一定的分类语言对信息资源的内容特征进行分析、判断,赋予分类标识的过程。,几种常用分类法:中国图书馆分类法(99年,第四版)中国科学院图书馆分类法杜威十进制分类法(DDC)国际十进制分类法(UDC)美国国会图书馆分类法(LCC),2.11检索原理,2.11检索原理,中国图书馆分类法(中图法),基本22大类,A马列毛邓,B哲学宗教,T工业技术,TB一般工业技术,TD矿业工程,TE石油天然气工业,TV水利工程,TB1工程基础科学,TB2工程设计与绘测,TB3工程材料学,TB9测量学,TB30工程材料一般性问题,TB31金属材料,TB37耐腐蚀材料,Z综合性图书,小练习,TN3/99228,TN3/22,TN21/52,TN3/68412007,TN3/126,请将下列索书号的图书正确排架:,A,B,C,D,E,主题标引在主题分析的基础上,以一定的词表或标引规则为信息资源赋予主题词、表达其内容特征的过程。,受控标引(依据词表汉语主题词表)自由标引,2.11检索原理,汉语主题词表,包括主表、附表、词族索引、范畴索引和英汉对照索引分3卷:第1卷:社会科学部分,收录主题词23500余条第2卷:自然科学部分,收录主题词65200余条,非正式主题词12913条第3卷:附表,如:论资产者在市场经济初期的作用受控标引:资产阶级-市场经济自由词标引:资产者-市场经济,问题:两种不同的标引方式会对检索产生什么样的影响?,主题概念,文献标识,主题概念,检索表达式,文献,主题分析,检索工具(系统),用检索语言对文献进行描述,检索需求,主题分析,用检索语言对文献进行描述,是否匹配,否,输出结果为零,得到检索结果,是,检索原理图,情报工作人员,(提问标识),文献存储过程,检索过程,怎么没有检索到自己想要的文献呢?,弄清检索类型,检索题目:1.余秋雨.历史的脸谱北京:文化艺术出版社.2007年2.杨叔子,吴波,胡春华等.网络化制造与企业集成J.中国机械工程,2000,11(1-2):45-493.中国2006年的外汇储备是多少美金?,选择检索途径,选择检索工具,选择检索方式,如何检索,A.数据(data)检索B.事实(fact)检索C.文献(document)检索,2.21信息检索的类型(根据检索的内容来看),检索题目:1.余秋雨.历史的脸谱北京:文化艺术出版社.2007年2.杨叔子,吴波,胡春华等.网络化制造与企业集成J.中国机械工程,2000,11(1-2):45-493.中国2006年的外汇储备是多少美金?,外部特征的检索途径:文献载体的外表上标记的可见的特征,如题名(刊名、书名、篇名)、作者、出版地、号码等,内容特征的检索途径:文献所载知识信息中隐含的、潜在的特征,如分类号、主题词等,据此有分类途径(分类号),主题途径(关键词、主题词)和分类主题途径。,检索题目:1.余秋雨.历史的脸谱北京:文化艺术出版社.2007年2.杨叔子,吴波,胡春华等.网络化制造与企业集成J.中国机械工程,2000,11(1-2):45-493.中国2006年的外汇储备是多少美金?,A,B,C,D,E,F,G,H,2.22文献信息检索途径,规范词检索(受控词)用依据词表而来的规范化的词进行检索,自由词检索用题名、摘要和正文中的关键词进行检索,检索题目:1.余秋雨.历史的脸谱北京:文化艺术出版社.2007年2.杨叔子,吴波,胡春华等.网络化制造与企业集成J.中国机械工程,2000,11(1-2):45-493.中国2006年的外汇储备是多少美金?,自行车、脚踏车、单车,二者的比较,小练习:,A受控字段:资产阶级B受控字段:资产者C题名字段:资产阶级D题名字段:资产者,1:用下列检索方法检索论文1,哪种方法能够命中?2:用下列检索方法检索论文2,哪种方法能够命中?3.用下列检索方法检索,哪种既能检索到论文1又能检索到论文24.如果用题名字段进行检索,如何才能又检索到论文1又检索到论文2,论文1:论资产者在市场经济初期的作用论文2:论民族资产阶级对中国资本主义萌芽的影响,检索工具的类型1(据文献收录内容):综合型:包含多种学科(理工或人文或社科或全部或某类)如CNKI中国期刊全文数据、科学引文索引、工程索引专业型:只包含某一学科,如化学文摘、物理文摘专题型:只包含某一特定对象或专题,如中药炮制研究文献目录单一型:某一特定类型文献,如专利文献通报,Whichone?,检索题目:1.余秋雨.历史的脸谱北京:文化艺术出版社.2007年2.杨叔子,吴波,胡春华等.网络化制造与企业集成J.中国机械工程,2000,11(1-2):45-493.中国2006年的外汇储备是多少美金?,2.23检索工具,检索工具的类型2(据载体):书本式:连续出版的;单卷形式的;附录式,即附在图书的后面的部分卡片式:很少用缩微式:很少用机读式:如计算机检索系统,2.23检索工具,检索工具的类型3(据功能):目录(catalogue):对一个单独的出版实体(书、刊等)进行记载,指明基本内容和收藏地,如馆藏目录(OPAC),联合目录、国家书目等题录文摘(abstract)全文(fulltext)(计算机),对文献中的内容按照条目进行揭示,并指明出处。题录只提供简单的信息,文摘除基本信息外还提供文章的摘要,全文型检索工具可直接获取原文,一般为网上数据库,Whichone?,检索题目:1余秋雨.历史的脸谱北京:文化艺术出版社.2007年2.杨叔子,吴波,胡春华等.网络化制造与企业集成J.中国机械工程,2000,11(1-2):45-493.中国2006年的外汇储备是多少美金?,2.24检索工具,手工检索印刷型检索工具计算机检索计算机检索系统,2.24检索方式,检索型的工具书(二次文献)(很少用)参考型工具书(三次文献):年鉴、百科全书、手册等词语型工具书(三次文献):字典、词典其他(三次文献),2.24检索方式,手工检索:,参考型工具书百科全书(Encyclopedia)荟萃多门或一知识的大型参考型工具书特点:全面、精确、新颖、权威性例如:中国大百科全书美国百科全书(EAmerican)不列颠百科全书(EBritannica)科利尔百科全书(ColliersE),2.23检索方式,手工检索,手册(Handbook)简明扼要地概述某一专业或某一方面的基本知识以及一些基本的公式、数据、规章和条例等特点:简洁、实用、便于查找例如:建筑工程手册数学手册世界近代史知识手册各国货币手册,2.24检索方式,手工检索,年鉴(Yearbook)记录一年之内的大事集,它将一年之内的重要时事、统计数据等汇集起来并按年度连续出版。特点:数据新、系统、全面、权威例如:中国科技统计年鉴上海经济年鉴中国人物年鉴中国教育年鉴,2.24检索方式,手工检索,名录是一种专门对人名、地名、机构名称进行汇集并简要介绍的工具书,可分为人名录、地名录和机构名录例:国际名人录中国地名录中国工商企业名录大全,2.24检索方式,手工检索,词语性工具书,各类字典和词典如辞海,我国最大的一部综合性百科词典,除了字词外还收录了成语、典故、历史、事件、科学成就、各学科的名词术语、人物及著作等,2.24检索方式,手工检索,表谱性工具书以简略的文字来记录史实、时间、地理等资料的工具书,可查考历史年代、历史大事、换算不同的年、月、日,以及查考人物生平与官职、地理沿革等功能分年表:如中外历史年表、自然科学大事年表;历表:如中华实用历书、百年通历;表谱:查考人物、官职、地理及科技数据等资料:如物理学常用数表、历代名人表谱,其他,2.24检索方式,手工检索,政书记载历代典章制度的史书,是中国特有的工具书种类图录性工具书以图像为主、文字为辅反映客观事物的工具书如地图、历史图录、人物图录、艺术图录,2.24检索方式,手工检索,计算机检索的优点检索方便、灵活,速度快,可直接获取全文,对相关文献可进行有效链接缺点所检即所得,可能由于人为或计算机系统的因素而查找不到,2.24检索方式,计算机检索,计算机检索系统,检索终端,通信网INTERNET,服务器(数据库/文档),计算机检索,2.24检索方式,认识数据库数据库是组织信息的一种常见的方法,内容结构如下:,文档1(file):一张表就是一个文档,字段(field),记录(record),文档2,文档n,数据库(database),数据库结构图,字段(数据库)=款目(著录、标引)=检索点/检索入口/检索字段(检索界面)/检索项/检索途径,和内容相关的字段:基本索引字段,如题名、摘要和外部特征相关的字段:辅助索引字段,如作者、作者单位,数据库的类型:,综合型(多学科,如EI、SDOL);单一型(单一学科,如数学评论、AIP),全文型(可直接获取全文,如SDOL、Springer);文摘型(只有摘要,不能直接获取原文,如EI、SCI);,专利数据库、学位论文库(PQDD)、期刊数据库(中国期刊网、SODL)、会议论文库(ISTP,万方会议论文库)、综合型(EI|、SCI),数据型数据库、事实型数据库,WhichDatabase?,选择数据库时应考虑数据库的以上特点以及语种、年限等因素。,AreyousearchingInternetgame?,计算机检索语言让计算机能够理解的语言,计算机检索,2.24检索方式,1.张艺谋在九十年代拍摄的电影是哪几部,想表达复杂的概念,2.SO2、NO2、CH4分别对大气层的影响,3.学生(除小学生外)对网络游戏认识的调查,用逻辑算符把若干个检索词或词组连接起来,构成一个检索式,指定这些词在文献中出现或不出现的条件:1.逻辑“与”“同时”的关系:逻辑算符:AND;*例如:查分布式网络系统方面的文章分布式AND网络系统(分布式*网络系统)查中国科学院王晓光的文章中国科学院AND王晓光(中国科学院*王晓光),逻辑组合检索,2.逻辑“或”“或者”的关系:逻辑算符:OR;+例如:查二氧化硫方面的文章二氧化硫ORSO2(二氧化硫+SO2)查传感器方面的文章sensorORdetector(sensor+detector)3.逻辑“非”“不属于”的关系逻辑算符:NOT;-例如:查非酒精料方面的文章饮料NOT酒精(饮料酒精),4.嵌套检索根据检索需求多次运用逻辑算符例:查本科生或研究生的就业问题(本科生OR研究生)AND就业查有关造纸废水处理方面的文章(papermakingORpaperpulp)ANDwastewaterAND(treatORtreatment),使用逻辑组合检索需注意的问题:1.中文数据库中多用*、+、-符号;英文数据库一般用ANDORNOT表示布尔逻辑运算2.有些数据库可多次使用二次检索3.有括号时,先执行括号里面的运算,没有括号时,ANDORNOT的运算顺序在不同的系统里有不同的规定,如在Dialog里,是按照NOTANDOR的顺序执行,碰到下列情况怎么办?,ManagemanagementmanagingColorcolourSinksinkingsanksunk,截词检索用某个符号来代替英文单词的一部分,通常用于相同词干或部分拼写相同的词,常用的截词符(wildcardsortruncation)有:*?$等无限截词(一个符号可代替任意个字母):Treat*:Treattreatingtreatedtreatmentsul*ate:sulphatesulfate有限截词(一个符号只代替零或一个字母):Wom?n:womanwomen,其他类型的截词:,springer,如:词根截词,SDOS,使用截词检索需注意的问题:1.仅对英文数据库2.不同的系统使用的截词符号是不一样的,使用前应查看检索提示或相关帮助,EI,SDOS,检索时会经常遇到这样的问题?,这些数字表明,这所大楼的构造是不合理的,究其根本原因,是对地基的控制出了偏差。这篇文章研究了数字控制技术在智能化机械加工中的应用,并提出了一种新的方法我们发明了一种新的方法,以实现对这种新型设备数字化的控制,检索式:“数字and控制”,位置检索,位置符号(proximityoperators):指定词与词位置关系的符号,W/n算符两侧的两个检索词按此前后衔接的顺序排列,词序不可变,词与词之间相互距离不超过n个词N/n算符两侧的检索词之间的距离不超过n个词,词序可变Same算符两侧的检索词在同一个子字段或同一个自然句中(Sentence)Paragraph算符两侧的检索词在同一个段落中,摘要:智能交通系统是解决当今交通问题最有前途的手段之一,而交通信息的分析与处理是其核心问题。首先介绍智能交通系统的信息特征及其分析要求,剖析了当前国内外常用的分析方法在信息处理与辅助决策方面存在的不足,提出了一个完整的、针对智能交通行业的交通信息智能分析与辅助决策系统模型。该模型以数据挖掘技术为核心,全面运用了新一代决策支持系统理论和计算智能技术,最后阐述了模型的各主要组成部分及其关键技术与实现方案。关键词:数据挖掘;智能交通;信息分析;决策支持,小练习:下面哪个检索式可以找到下列文章?,A.智能交通Same模型B.数据Same分析C.数据挖掘Same模型D.数据挖掘Paragraph模型,使用位置检索需注意的问题:,1.英文数据库常用2.多数用于数据库的专业检索方式(需输入检索指令的检索)3.不同的数据库用到的位置算符不一样,使用前查看检索提示或相关帮助,EI,SDOL,精确(exact)检索检索特定的句子或词组,EI,使用精确检索需注意的问题:不同的数据库对精确检索的规定不一样,部分数据库使用”,如EI(“intelligentcontrol”);部分数据库使用空格即可,如IEE/IEEE(intelligentcontrol);还有一些数据库通过特定程序控制,,springer,禁用词,扩大检索范围的方法,考虑同义词或近义词(使用布尔逻辑符or连接)使用上位词(如飞行器航天飞机载人航天飞机)使用截词符选择较大检索范围的字段如摘要,缩小检索范围的方法,使用and、not等限制检索范围使用位置算符选择检索范围较小的字段使用二次检索使用下位词使用精确检索,2.3检索步骤,明确检索需求、确定查找范围选择检索工具确定检索词,构造检索表达式实施检索策略修改检索策略索取原文,第一步:明确检索需求、确定查找范围,检索目的:大致分为三种类型普查型需要全面收集有关某一主题的文献资料,强调“查全率”。如查新攻关型需要收集某一特定方面的文献资料,旨在解决科研生产中的关键问题,不强调文章的数量,解决问题即可。探索型了解和掌握某一领域的研究现状,最新研究动向和研究成果,要求查到的文章具有新颖和及时的特点,对“查全率”和“查准率”不一定有较高的要求,查找范围:主题、学科范围、文献的类型、年限、语种,第二步:选择检索工具,印刷型检索工具,网络数据库,WWW,馆藏目录,文摘数据库和全文数据库,文摘数据库大的公司,全文数据库1学术出版社,全文数据库2代理公司,全文数据库3学会、协会,文摘数据库1,文摘数据库2,网络资源和专业数据库,第三步:确定检索词,构建检索表达式,主题词:用于主题字段的检索词,规范化检索词(词表)关键词:用于非主题字段(题名、摘要等)的检索词,非规范化检索词,表达内容特征的途径:主题途径、分类途径、主题分类途径提炼检索词,表达外部特征的途径直接输入检索词即可,如作者,ISSN号等,确定检索词的方法:,第1步:简短写出主题句第2步:将所有和主题相关的关键词和短语标出来第3步:如果选用主题词检索,查词表;如果选用关键词检索,对关键词进行补充(头脑风暴)、替换和删除补充同义词、近义词、缩写、不同拼写例如:网络因特网webWWW(wideworldweb)brainstorm,brainstorm,brain-storm,brain-storms,brainstorming,brainstorming,brain-storming替换当检索词过于宽泛,可用下位词替换;当检索词太狭义,过于具体,可用上位词替换例如:火箭发动机、液体火箭发动机、液氢/液氧发动机删除没有检索意义的词;存在蕴含关系可合并的词例如:研究、探讨、讨论、系统;计算机因特网因特网,检索题目:用放电等离子烧结技术制备新型NdFeB永磁材料的研究,第二步:删除不必要的关键词:,第三步:对核心关键词进行补充,技术、研究(删除理由:没有检索意义);制备、新型、材料(删除理由:意义蕴含,且“新型”意义模糊),放电等离子烧结同位词SPS(缩写)上位词等离子烧结NdFeB同位词钕铁硼(汉语名称)上位词稀土铁硼上上位词永磁,构造检索表达式,注意:在构造检索表达式之前一定弄清所用数据库的检索功能和合法和操作算符,这样才能有效地进行检索,嵌套检索、逻辑组合检索、截词检索、位置检索、字段选择、精确检索,(钕铁硼OR稀土铁硼ORNdFeBOR永磁)AND(SPSOR放电等离子烧结OR等离子烧结),第四步:实施检索策略,检索词?检索式?检索系统?检索途径:主题途径、分类途径、分类主题途径?检索方式:简单检索、高级检索、专业检索?,第五步:修改检索策略,检索结果过多缩小检索范围检索结果过少扩大检索范围检索结果相关度小修改检索词、检索式,更换检索系统,第六步:获取原文,获取原文的途径:馆藏目录查找原始出版物,如期刊、图书、学位论文等全文数据库通过网络直接下载原文原文传递通过图书馆的原文传递服务,获取原文的步骤:,分析文献源(source):出版物、年、卷、期、页码,是否在校全文数据库中,是,OK,学校是否有印刷版,是,OK,提交图书馆进行原文传递,否,否,知道文献的题名,还可偿试用篇名检索摘要数据库链接到原文原文数据库直接下载NSTL原文传递搜索引擎直接下载,查找原文的过程中应注意的问题:1.识别文献类型(GB/T7714-2005):1)赵凯华,罗蔚茵.新概念物理教程:力学M.北京:高等教育出版社,19952)MARTING.ControlofelectronicresourcesinAustraliaM/PATTLELW,COXBJ.Electronicresources:selectionandbibliographiccontrol.NewYork:TheHaworthPress,1996:85-96.3)InternationalFederationofLibraryAssociationandInstitutions.Namesofpersons:nationalusagesforentryincataloguesM.3rded.London:IFLAInternationalOfficeforUBC,1977.,图书,4)中国力学学会.第3届全国实验流体力学学术会议论文集C.天津:出版者不详,19905)钟文发.非线性规划在可燃毒物配置中的应用C/赵玮.运筹学的理论与应用中国运筹学会第五届大会论文集.西安:西安电子科技大学出版社,1996468-4716)GANZHAVG,MAYREW,VOROZHTSOVEV.Computeralgebrainscientificcomputing:CASC2000:proceedingsoftheThirdWorkshoponComputerAlgebrainScientificComputing,Samarkand,October5-9,2000C.Berlin:Springer,c2000.,会议论文,7)U.S.DepartmentofTransportationFederalHighwayAdministration.Guidelinesforbandingexcavatedacid-producingmaterials,PB91-194001R.Springfield:U.S.DepartmentofCommerceNationalInformationService,1990.8)WorldHealthOrganization.Factorsregulatingtheimmuneresponse:reportofWHOScientificGroupR.Geneva:WHO,1970.,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论