版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、2.4 计算机信息检索概述,2.4.1计算机信息检索定义 2.4.2计算机信息检索系统构成 2.4.3检索式的拟订,2.4.1计算机检索定义,计算机检索指利用计算机及相关设备进行的文献信息检索。 信息检索技术正向两个方向迅速发展: 一是在深度上提高管理和组织信息的能力 传统信息检索向全文文本、多媒体、多载体、多 原理等新型信息检索的发展. 二是在广度上提高管理和组织信息的能力 文献资源的网络化和分布化,面向Internet中浩瀚无垠的资源。,2.4.2 计算机信息检索系统构成,服务器 通信网络 检索终端 数据库,服务器,服务器是检索系统的核心部分,在检索过程中需要处理大量的指令和数据,要求服务
2、器必须有相当高的运算速度和处理能力,并且有相当大的存储能力 服务器包括硬件和软件。硬件决定了系统的检索速度和存储容量,软件则充分发挥硬件的功能,进行信息的存储、处理、检索以及整个系统的运行管理。,通信网络、检索终端,通信网络是联系检索终端与计算机的桥梁。可以通过端口访问主机 检索终端是用户与检索系统传递信息进行人机对话的装置。主要指微机终端。,数据库,数据库是一系列信息记录的集合,是检索系统中的信息源。 数据库分为两大类: 文献数据库:书目数据库,全文数据库 非文献数据库:数值数据库,指南数据库,术语数据库,图像数据库,书目数据库,只存储有关主题领域各类文献资料的书目信息,为用户鉴别和获得有关
3、文献提供必要的文献属性和来源指示。 数据来源于期刊论文、会议论文、研究报告、专利文献、学位论文、图书、政府出版物、报纸等各种不同的一次文献,是经过加工、压缩的派生性数据。 书目数据库包括文摘索引数据库和图书馆目录数据库(机读目录),全文数据库,存储文献全文或其中的主要部分的源数据库。 例: 中文CNKI数据库 外文EBSCO 、OVID数据库 Springer电子全文期刊 Nature电子全文期刊 特点: 直接性,能直接检出原始文献或解决问题所需要的文献资料,不必进行二次检索 详尽性,用户可以直接查到文献正文中的每一段、每一句、每个词。,非文献型数据库,数值数据库(Numeric Databa
4、se ): 指专门提供以数值方式表示的数据(或包括其统计处理表示法)的一种数据库。准确的数据运算能力。生成用户所需的报表。有数据分析能力。,指南数据库,指南数据库: 存储的数据一般用来描述人物、机构、研究项目、产品或商品等资源。如人物传记数据库,公司名录数据库,基金指南库,产品指南库,软件数据库等,术语数据库,术语数据库:指专门存储名词术语信息、词语信息以及术语工作和语言规范工作成果的数据库,各种电子化辞书也包括在内。如中华人民共和国国家标准术语工作 计算机应用 数据类目,图像数据库,图像数据库(Graphics Database ):指用来存储各种图像信息及有关文字说明资料的一种源数据库,主
5、要应用于建筑、设计、医学影像、图片或照片等资料类型的计算机存储与检索。,2.4.3检索式的拟订,布尔逻辑检索算符 位置检索算符 截词检索算符 字段揭示及限制算符 其它符号 注意事项,布尔逻辑检索算符,1逻辑“与” 用“and”、“*”或者空格表示。 在网络搜索引擎中习惯用空格代替“and”。 【实例】检索“中国人民政府”这个网站,可以输入“中国*政府”、“中国 and政府”、“中国 政府”等。,2逻辑“或” 用“or”、“十”或逗号表示。 在网络搜索引擎中习惯用逗号代替“OR”。 【实例】在搜索引
6、擎中输入“计算机,多媒体,Windows98”则查询至少包含“计算机”、“多媒体”、“Windows 98”三者之一的信息。,3逻辑“非” 用”not” 或”-”表示 【实例】输入“automobile not car”,就要求查询的结果中包含automobile(汽车),但同时不能包含car(小汽车)。 在搜索引擎中输入“电视台-中央电视台”,查询结果不包含“中央电视台”。,位置检索算符,常用的位置检索算符有以下几种: 1.邻近位置检索算符(W) 【实例】Powder(W)Coating表示这两个单词相当于一个组合词。 2.邻词位置检索算符(nw) 【实例】Fluidized
7、bed reactor(流化床反应器)可用Fluidized(1W)reactor检索,中间可存在1个词。,【实例】用EBSCO数据库检索税收改革文献,检索式“tax W8 reform”表示tax一定在前,距离reform最多是8个词汇,因此可以检索出 “tax reform”,不能检索出“reform of income tax”。,注意Tax 与reform的距离,3.句子位置检索算符(S),A(s)B表示A和B必须同时出现在记录的同一个句子或短语中,但次序可能随意改变,A与B之间可以有若干个其他的词。 有的数据库用“(N)” 表示(S)。,截词检索算符,1. 后截词 后截
8、词就是保持检索词的前部分的检索。中文数据库里面习惯称为“前方一致”。 【实例】输入“tele*”,将检索出telecommunications、telecom、telephones 、television等开头字母为tele的词。,2. 前截词 【实例】如果要把含有“computer”、“microcomputer”、“minicomputer”这三个词的文献全部检索出来, 在多数外文数据库只要输入“*computer”即可。中文数据库里面习惯称为“后方一致”。,3. 中间截词 【实例】在多数外文数据库输入 “B?nard”可命中Banard和Bnard。 【实例】在多数外文数据库输入“sul
9、*ate”,检索结果将包含“sulphate”、“sulfate”等。,4. 前后截词 中文数据库里面习惯称为“中间一致”。 【实例】在多数外文数据库输入“*computer*” 能检出含有“computer”、“computerized”、 “computerization”、“computers”、“microcomputer”、“minicomputer” 这些词的全部文献记录。,字段揭示及限制算符,字段揭示符 用文字或字母来表述某字段所代表的含义。 如字段揭示符“AUTHOR”或“作者”或“AU”表示作者字段 字段限制符 用来连接字段揭示符和检索词的算符,表明检索词隶属于
10、某字段。 如Proquest数据库中,检索式AU(JOHN)中,()为字段限制符,将检索词JOHN限定到AU字段中,即检索出的文献的作者是JOHN。 相同的检索词在不同的字段中检索到的结果不同,常有的字段:,题名字段 TI=Title 文摘字段 AB=Abstract 叙词字段 DE=Descriptor 自由词字段 ID=Identified 著者字段 AU=Author 著者机构字段 CS=Corporate Source 刊名字段 JN=Journal 出版年字段 PY=publication Year 文献类型字段 DT=Document Type 语种字段 LA=Language,例
11、:检索式computer/ti 表示在题目中查找含有computer一词的文献 例:检索式 Cs=Peking university 表示检索著者单位为北京大学的所有文献,字段揭示及限制算符,【实例】用中文科技期刊数据库检索机械产品采用计算机辅助设计的论文。 用不同字段作为途径,如下所示: 选择”u=任意字段” 输入“计算机辅助*产品”,查出12篇; 选择“t=题名”输入“计算机辅助*产品”,查出2篇; 选择“k=关键词”输入“计算机辅助*产品”,查出2篇; 检索入口 选择“c=分类号”输入“机械产品”的分类号“TH122”年限设定 查到243条。,选错了字段,还可能导致检索失败
12、。 例如:某学生检索课题 “纳米技术在除螨功能纺织品中的应用”, 在检索中国国家知识产权局的专利时,无论选择“名称”还是“摘要”字段,输入:纳米 and螨虫 and纺织品,检索结果都是零。 后来选择“名称”字段输入“纳米”,选择“摘要”字段输入“螨”,选择“主分类号”字段输入国际专利分类号 “D部纺织与造纸”的纺织类的“织物的处理类”分类号“D06”,检索结果是一篇名为一种纳米防螨抗菌针织服装的生产工艺。 造成漏检的原因是事先不知道该专利的准确名称,没有提取准确的检索词,也没有考虑发挥不同字段的协同作用。,找到专利分类表纺织类号码,多字段协同的检索过程,检索结果,其它符号,1括号
13、 括在其中的操作符先起作用。 2引号 引号内的检索项以整体形式出现。 3个别数据库使用的特殊符号 某些搜索引擎使用加号(+)表示该单词必须出现。,【实例】在某些搜索引擎中输入“电脑+电话+传真”就表示要查找的内容必须要同时包含“电脑、电话、传真”这三个关键词。 个别数据库例如“国研网”、山东标准网使用“&”代替“and”;欧洲专利局光盘数据库的“without”、美国专利商标局数据库的“andnot”就是通用的“not”。,Proquest所用的运算符号within 3,pre/1,注意事项,1. 正确理解数据库检索标识 2. 确保检索策略与课题的匹配性 1) 检索项与检索词的正
14、确匹配 2) 检索式中各个检索项或检索元素之间的逻辑关系 3) 课题的隐含主题概念的挖掘,1. 正确表达课题,不能总是简单地把课题名称当成文献的题目直接检索。 用中文科技期刊数据库检索有关“法律的渊源”的期刊论文,有的题目是法制的渊源,而关键词是“法律”,所以最好选择关键词字段而不是标题字段输入“法律*渊源”。,【实例】某专利申请的主题涉及商店待出售衣服上防止衣服被偷窃的装置,该装置由两个从衣服正反面锁合在一起的部件组成,其中一个部件上有针状结构,另一个部件上有将针啮合住的机构,欲将这两部分分开时,如果不用特殊工具,机构中的装有液体的小容器就被损坏,液体流出,污染衣服。要检索这类专利信息,如何
15、表达检索课题的意图?,【题解】课题不能简单地表达为“防止衣服被偷窃的装置”,而要表达为关键词“防盗”(theftproof)、“液体”(liquid)与“衣服”(cloth)和国际专利分类号例如物理部的G08B15/02、G08B13/00、G09F3/03、生活部的A44B9/18等。在发明名称字段输入“防盗and衣服”,加用分类号,在结果中选择摘要或者发明名称字段再输入关键词“液体”作进一步检索。如果检索到的信息不是很多,可逐一浏览。为了避免漏检,还可以增加上述关键词的同义词。,在书目数据库中人名多半可以作为责任者,而且检索时不必考虑责任者的年龄和是否健在,因此有些初级检索者错误地把这些概
16、念用在期刊论文的检索上。,【实例】检索著名经济学家胡鞍钢2000年在中国软科学上面发表的论文,如果用中文科技期刊数据库可以这样输入“A=胡鞍钢*J=中国软科学”,时间限定 。但是要检索关于研究鲁迅的论文,输入“鲁迅”时必须选择途径为标题或者关键词,不能选择为作者途径。这是因为“鲁迅”在这里是被研究的对象而不是论文的作者。,2. 确保检索策略与课题的匹配性,1) 编检索式时最重要的是注意检索项与检索词的正确匹配。例如当选择的检索项是关键词,输入的检索词就必须是关键词,如果一个词不能完整地表达检索要求,需要进一步描述时,只能添加关键词,用算符来联结它们,而不能用一个句子来代替。例如检索“法律的渊源
17、”的中英文信息,虽然用“法律的渊源”、on sources of law这样的词组能够在一些数据库实现检索,但是检索量少,严格说不算是检索式。检索式顾名思义就像数学的算式一样必须有加减乘除的符号,而不是仅有长串数字。,2)注意检索项之间的逻辑关系。,特别要区分课题与论文标题的区别,不能做字面的解析。 例如研究“法律与经济和政治的关系”的课题,需要检索的信息是法律与经济或者政治两者之一的关系,因此“经济”与“政治”的关系是“逻辑或”,不是“与”,则检索式“法律*(经济+政治)”比“法律*经济*政治”检索的范围大得多。,反过来,有的课题应该用“逻辑与”的关系, 例如检索“缓释制剂在中药中的应用”,
18、在中文科技期刊数据库的检索式应该是 选择题名或者关键词字段(代码是m=)输入“缓释制剂*中药”,但是不少学生采用了检索式“缓释制剂+中药”,这样检索到许多含有“缓释制剂”与“中药”之一的论文,“缓释制剂”与“中药”没有必然联系。,检索式“缓释制剂*中药”的结果,检索式“缓释制剂+中药”的结果,3)注意隐含概念,3) 用词汇检索时,一定要对课题的主题概念、特别是课题的隐含主题概念认真分析,掌握课题的内容实质,概括出能最恰当地代表主题概念的检索词,同时注意用词的通用性、准确性和规范性。例如“知识产权”一词隐含着“专利权”、“版权”、“著作权”等概念。 若用中文科技期刊数据库检索,参考检索式是:知识
19、产权+(专利权+版权+著作权+商标权+工业产权)。,如果词汇涉及面太广,难以一一枚举,最好用分类号。 例如检索“工农业废水循环利用”、“纳米技术在生物学领域的应用”等课题,用中国图书馆分类号表达工业(T)、农业(S)、生物学(Q),才能保障查全率。 而“废水”和“纳米”是比较专指的检索词,也没有形成学科,所以直接作为关键词,不用分类号表达。同时,检索式前面排列范围比较狭窄的检索项例如“废水”、“纳米”,后面连接范围较宽的检索项例如工农业的分类号,可以提高速度。,若用中文科技期刊数据库检索,参考检索式是: M=废水*利用*(循环+合理)* C=(T+S) M=纳米*C=Q 4)当检索过于复杂,检
20、索要求难以用一个检索式来表达时,应该采用分步检索或二次检索以提高查准率。,仅使用关键词或者题名检索的结果,结合工业、农业分类的检索结果,检索专利文献,仅使用专利分类号检索有结果,其中一篇的名称没有“工业”,却是工业废水处理工艺的专利,2.5检索和分析的步骤,1检索准备 2选择合适的检索工具 3选择检索途径 4拟订检索式 5实施检索 6筛选文献 7索取原文,步骤示意图,2.5.1检索准备,1. 弄清课题学科属性、专业范围及其相关内容 2. 弄清检索课题的信息类型和时间要求 3. 考虑课题的特殊要求 4. 明确用户自身的信息需求,【例题】中文研究课题为“法国文艺复兴时期文学作品浅析”。要求查询国内
21、中文检索工具。如何具体分析课题?,【题解】: (1)学科属性、专业范围 属于社会科学,具体属于外国文学,还涉及外语等多学科。 (2)文献类型 文献类检索结合事实数据类检索: 事实数据类检索包括 查询“文艺复兴”这个概念 文艺复兴时期有多长? 在该期间法国诞生了哪些重要的有影响的作品?可以从百科全书、文学辞典等参考工具书中查到。,文献类检索就是查询是否有前人撰写的法国文艺复兴时期文学作品浅析的期刊论文、学位论文、专著或者网页。 (3)课题的特殊要求 补充检索标识:文学家、F拉伯雷、小说、巨人传。 因为查阅中国大百科全书第5卷2757页上关于F拉伯雷的记载,知道在当时的法国文学家F拉伯雷以长篇小说
22、巨人传在欧洲获得崇高声誉。,2.5.2筛选文献,对于课题查新和写开题报告而进行的检索 1.还应将所有相关文献信息汇总,并分析梳理,编辑,选择密切相关文献,调阅文献的全文,提取有关数据及指标。 2.应当根据课题的科学技术要点,将检索结果分为密切相关文献和一般相关文献。对相关文献情况及对相关文献的主要论点进行对比分析。,2.5.3获取原文,1网上传递原文 2就近借阅 3特种文献的索取方式,2.6综合检索案例,【综合案例】如何检索课题“遥感技术在土地利用规划中的应用”的中外文信息? 提示:遥感在土地利用规划方面中主要是利用遥感提供的瞬间成像,对地表面一定区域景观的真实、客观的记录和形象显示,对土地利
23、用及发展趋势作出更好的预先估算。,2.6课题:遥感技术在土地利用与规划中的应用,1. 分析课题: 1)学科范围 本课题的学科分类主要属于“地球科学”,跨多科学,根据中国图书馆图书分类法的类目设置,涉及“遥感”及其分类号P237,土地规划学及其分类号F301.2、自动化技术/计算机技术类及其分类号TP7; 2)时间范围 查找最近10年的文献。 3)文献类型 主要属于文献类检索,信息类型涉及图书、学位论文、期刊、专利、报纸等文献类型。 4)语种 先查中文,后查外文,2. 选择检索工具 1) 中文数据库(部分) 维普中文科技期刊数据库、清华同方CNKI的论文库、国家科技图书文献中心、万方公司数据库、
24、中国国家知识产权局 2)外文类数据库(部分) 综合数据库EBSCO的学术期刊库ASP 、荷兰ELSEVIER数据库、Engineering Index(美国工程索引)、欧洲专利局、美国专利商标局数据库(可以通过中国国家知识产权局链接)、搜索引擎Google。,2. 选择检索工具,就本题而言,首选的检索工具是维普中文期刊数据库,是收录全国1989年以来各类科技期刊最全、更新速度最快的中文期刊全文数据库,正合本题使用,而期刊文献具有连续性与新颖的特点,是最重要的信息源之一。 备选的检索工具:第一是同方或者万方硕士博士论文数据库,检索学位论文。学位论文写作周期长,篇幅较大,内容成熟系统,能全面反映各
25、方面的资料。第二类是综合类EBSCO、ELSEVIER数据库等。,3. 确定检索途径 本课题可选用主题(关键词)途径为主,结合分类途径。 4. 确定检索词: 通过清华开发的CNKI数据库的博士硕士论文数据库可以检索到论文的英文关键词,首选的检索词:土地利用(land use)、遥感技术RS(Remote Sensing)、规划(planning) 备用的同义词:土地:land、ground、earth、soil;利用:use、exploitage、utilization;规划:plan、program、project,5. 拟定检索式(部分) 1) 中文科技期刊数据库的检索式:k=遥感*(土地
26、利用+土地规划+技术)*c=(TP7+F301.2+P237),图2-3中文科技期刊库检索界面,综合检索案例 2)外文检索范例之一,图2-4 图书馆外文数据库EBSCO界面,进入Ebsco数据库,综合检索案例,图2-5图书馆外文数据库EBSCO界面,3)搜索引擎Google的检索式:,遥感 土地 (利用 OR 规划) OR(land use planning Remote Sensing),图2-6 Google的界面,6. 实施检索,筛选检索结果,按照参考文献格式列出部分信息: 1) 期刊论文 李巧玲.区域土地利用规划研究中遥感空间信息系统技术的应用.湛江海洋大学学报,1999. 2) 网络
27、论文 吴秋华 白强.鄂伦春旗土地利用遥感动态监测信息系统.www.G,7. 索取原文,获取原文的方法较多,参考答案: 期刊、学位论文、电子图书和专利直接点击阅读原文。 图书馆收藏的纸本图书需要借阅; 国家科技图书文献中心的文献可以付费从网上传递原文。 中文科技期刊数据库、万方学位论文等和中国国家知识产权局专利数据库提供图片格式的原文文件; EBSCO、ELSEVIER等外文数据库大多有论文原文。 书生之家、超星等数字图书馆提供图片格式的电子图书。,检索表达式构造实例,例:检索计算机网络方面的文献,检索表达式为: “计算机*网络 网络*计算机” 两个检索表达式是等价的。 表示只要两个检索词是同一文献中出现即可。 可以检索有关计算机网络文献的文献,也可以检索有关网络计算机方面的文献,例: 查找版权中涉及图书馆方面的文献 检索表达式为: Library* copyright Librar
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 26年银发护理质控要点总结课件
- 26年慢病老人饮食调理课件
- 2025年中广核笔试试题及答案
- 中小学教师副高级职称晋升讲课答辩真题附答案初中语文部分
- 房地产销售个人工作总结
- 财务成本专责个人工作总结
- 腹膜透析置管术前术后护理
- 残障人士现金业务办理指南
- 2025-2026学年鸡西市高三3月份模拟考试历史试题含解析
- 基于小学生体验式学习的城市垃圾分类政策实践探索教学研究课题报告
- 衡阳县岣嵝峰林场招聘社区网格员考试试题附答案详解
- 视频监控系统技术规范书
- 2026云南昆明市国和勘察规划设计院有限公司招聘工作人员3人考试备考试题及答案解析
- 低碳城市智慧路灯节能改造升级方案
- 第二轮土地承包到期后再延长30年试点工作意见政策解读
- 2026年监考人员培训试题及答案
- 2026年上海市奉贤区高三二模数学试卷及答案解析
- 医院屋顶光伏施工造价预算方案模板
- 2026年大连市教育基金会招聘工作人员备考题库含答案详解(满分必刷)
- 2026年原料药国际注册策略与实践
- 从创意到创业知到智慧树章节测试课后答案2024年秋湖南师范大学
评论
0/150
提交评论