[初中教育]哈工程-信息检索课件.ppt_第1页
[初中教育]哈工程-信息检索课件.ppt_第2页
[初中教育]哈工程-信息检索课件.ppt_第3页
[初中教育]哈工程-信息检索课件.ppt_第4页
[初中教育]哈工程-信息检索课件.ppt_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

问题反馈,人文类图书少、图书陈旧 电子阅览室网速慢 电子书 图书排架问题 随书光盘问题 占座 电梯 图书预约,第一次实习反馈,第一题 普遍不错,但有个别同学缺乏对材料的整理能力,无用信息太多。 第二题 期刊数量是变化的,但数量级一般稳定 第三题 很多同学受到scopus的误导 第四题 理解上有歧义 第五题 要求是英文全文数据库,但还是有很多同学列举了很多文摘库、引文库 第六题 普遍答的不好,很多同学表达了想法、感受、给予评价,带有强烈的主观色彩,参考答案,三:校园网范围内可以访问到几种电子书数据库,请从收录种数、学科等方面描述它们的异同; 四:校园网内可以访问到几种中文期刊数据库,收录年限分别是?在该平台上分别还可以访问到哪些资源? 五:校园网范围内可以访问到哪些英文全文数据库,请列举其中8个并说明其所属的公司或学会。 六:根据你的了解为图书馆电子资源做个综述。,信息检索的基本过程,前期准备 第一步:分析检索课题 第二步:选择数据库 第三步:确定检索策略 第四步:实施检索 第五步:获取与利用 第六步:管理与评价,熟悉图书馆、知识的准备、课题的选择,分析课题、明确信息需求及研究范围;提炼关键词,试检、确定检索词、编制表达式,目录、索引、文摘、全文,检索策略调整,文献传递,科学引用、参考文献管理,数据库及数据库检索,数据库概述 数据库的结构 数据库的类型 数据库的内容与范围 检索途径 检索标识,数据库功能 数据库的检索技术 检索结果的处理 数据库的个性化功能 数据库的帮助文件 检索方法与策略,一 数据库概述,数据库是发展历史最久、影响最广的一种电子信息资源,它产生于20世纪50年代末60年代初,在70年代得到迅速发展,到80年代逐步走向成熟。 数据库(Database)是长期储存在计算机内、有组织的、可共享的数据集合。 一个数据库就是一个电子仓储。与传统的印刷型文献相比,数据库只不过是充分利用了现代信息技术处处理手段,为知识内容更换了存储介质,并基于数据库的有序结构、专业内容、索引和词表功能等通过检索界面为用户提供更加便捷的信息服务 。,二 数据库的结构,文档(File)是数据库中数据组织存储的基本形式,是数据和信息有序集合,由若干条记录组成,一个或若干个文档构成一个数据库。 记录(Record)是数据库的基本单元,是对某一实体属性进行描述的结果。 字段(Field)是记录的基本组成单元,是有关一篇文献或称一条记录的基本数据单元,每一个字段都反映该篇文献的一个方面的信息,组合在一起形成对一篇文献信息的内容特征和外表特征的完整描述。 一个数据库可以有一个或多个文档,一个文档由若干条记录构成,而一条记录由若干字段构成。,三 数据库的类型,(1)参考数据库(Reference Database) 参考数据库是指包含各种数据、信息或知识的原始来源和属性的数据库,它会引导检索者到另一信息源以获得原文或者其他细节。一般来说,参考数据库主要是针对印刷型出版物开发的。 参考数据库主要包括:书目数据库、文摘数据库、索引数据库。书目数据库主要是针对图书进行内容及存储地点的报道与揭示,如馆藏机读目录数据库;文摘和索引数据库则针对期刊论文、会议论文、学位论文等进行内容提炼和属性加工。它提供确定的文献来源信息,供人们查阅和检索,但一般不提供原始文献的馆藏信息。如剑桥科学文摘数据库(CSA)、工程索引数据库(EI)等等。,(2)全文数据库(Full-Text Database) 全文数据库是指收录有原始文献全文的数据库。以期刊论文、会议论文、学位论文、研究报告、法律条文和案例、商业信息等为主。,(3)事实和数值型数据库(Factual/ Numeric Database) 事实型数据库是以提供可用的事实为目的的一类数据库。此处的“事实”可以是既有数字又有文字的统计资料,也可以是文字的知识资料或信息资料,也可以是一篇叙述性文献,如:万方数据中的中国企业公司与产品数据库 数值型数据库是以数值为主要内容的数据库,除存储各类数值如科学技术数据、社会资源数据、商业经济、地理环境数据外,还存储运算公式、图谱、表格等。如金融、证券系列数据库中的货币兑换、化学物质结构数据库、生物蛋白质序列数据库等,大多属于此类。 事实与数值数据库的作用就是提供对特定的事实或数值的检索与利用,直接面向问题以特定的事实或数字回答用户的查询。从某种程度上说,事实及数值数据库的作用大致相当于传统的参考工具书。,四 数据库的内容与范围,在选择数据库资源时,需要考虑以下几个问题: (1)数据库的主题范围 如果只是一般性了解,可以阅读数据库主页上的简介。如果需要进行具体深入的了解,可以浏览数据库设置的分类列表、主题列表以及刊名列表。 (2)数据库的时间范围 可以在数据库的时间限定里通过下拉列表来查看。,(3)数据库的数据类型 数据库仅提供文摘还是可以提供全文,提供的内容仅是文本,还是兼有图表、公式等等。 (4)数据库的更新频率 一般情况下,文摘类数据库更新快,如EI、SCI都是周更新;全文类数据库中,如果是由集成商提供的一般均会滞后,如果是学、协会主办的电子期刊,就会与印刷版同步更新甚至会有网络预印本(电子版先于印刷版发布的称为网络预印本)。,五 检索途径 一般包括文献信息的内容特征和外表特征途径。,内容特征途径,外表特征途径,主 题 途 径,分 类 途 径,代 码 途 径,其 他 途 径,编 号 途 径,机 构 名 称 途 径,责 任 者 途 径,题 名 途 径,六 检索标识,检索标识,即检索词,是指能表达检索课题主题概念和信息需求的名词术语、分类号、名称及代码等的总称,包括主题词、关键词、名称、分类号、分子式、专利号及各种号码等。它与检索途径相对应,是检索途径的具体化。 如主题途径的检索标识就是主题词,分类途径的检索标识就是分类号,著者途径的检索标识是著者姓名,其他依此类推。,弄清什么是检索课题、检索词及字段,了解意大利著名作家艾珂的生平及作品 艾柯作者(著者、责任者),字段 检索入口 检索途径,检索词 检索标识,检索课题,七 数据库功能,数据库功能是指数据库在交互界面上提供给用户的基本功能。一般包括浏览与检索两大功能。,浏览(Browse),浏览是由系统提供一个树状结构的概念等级体系,用户可以沿着这棵树进入不同的分支,到达叶子节点,并在节点看到检索结果列表。 浏览功能最重要的作用就是为用户提供一个知识体系,让用户可以俯瞰全貌,了解某一方面的信息总体情况。 最常见的分类浏览、期刊导航等都是数据库浏览功能的体现。,检索功能,与系统的检索技术紧密结合。常见的的检索功能有:初级检索、高级检索、专家检索、辅助检索、二次检索、组合检索、跨库检索等。,初级检索-高级检索-专家检索,初级检索(primary search)又称为基本检索(basic search)、快速检索(quick search)、简单检索(simple search),初级检索为用户提供一个相对单一的检索界面,帮助非专业或初入门用户方便地提交检索提问。页面上通常只有一个检索词输入框,只能限定在一个字段中,或在系统指定的字段中进行检索,提交检索词后,系统将提问发送到指定的一个或几个字段中进行匹配运算。 高级检索的形式与功能与初级检索基本一致,本质并无差别,只是增加了逻辑关系的选择。用户只需要在下拉列表中点选即可实现不同字段之间的组配检索、检索操作更为灵活方便,检索结果更为精确、全面。,专家检索为专业人员设计。仅在检索界面提供一个输入框,需要自行编制检索表达式执行检索。专家检索对检索者的要求较高,检索者需要对数据库的检索规则相对熟悉。, 辅助检索 辅助检索,顾名思义,只是检索的辅助选项,一般可以通过词表、索引和各种检索限定来进行。,a.词表检索(thesaurus) 按照现代检索语言的发展,目前数据库通用的是叙词语言,基于叙词语言提供词表检索或同义词索引。通过词表,有助于选择数据库索引的规范词,也能提供相关词、上位词、下位词,b. 索引检索(index) 索引是一个线性的表单,可以将任何一个字段中的具体概念按字母顺序线性排列起来,不分等级。用户通过检索,可以定位在索引中的任意某个位置,并浏览在这个位置附近的所有内容,进而查询所选内容对应的结果列表。 索引的种类很多,如人名索引、出版物索引、地名索引、主题索引、机构索引等,c.限定检索条件(limiter) 数据库通常会以菜单的方式将所有限定的内容排列出来,以供检索时进行选 择,最常见的检索限定包括出版时间、更新时间、主题范围、文献类型、语种、来源文献范围等等, 二次检索 (Refined Search),又称“在结果内检索” 在检索结果内进一步检索,使结果更精炼、准确。, 组合检索(combined search),在一个不间断的检索操作过程中,数据库会自动记录每一次检索所用的策略、时间、检出记录数。用户可以根据需要在此基础上进行合并检索。合并检索时,每一个单独检索所用的限制条件,在合并检索时会同时满足。 如下图,先行执行了S1与S2两个检索操作,S3是执行S2与S1的“与”运算。具体操作步骤是在S2执行结束的当前状态下,选中S1前的“添加至检索中”的复选框,点击“合并检索”后的“添加”按钮。需要注意的是,并不是所有的数据库系统都有这项功能。, 跨库检索,八 信息检索技术,布尔逻辑检索 位置算符检索 截词检索与词根检索 字段检索 全文检索 其他检索技巧,例:在维普数据库查找有关UFO的资料,概念分析:UFO 不明飞行物,1 布尔逻辑检索,布尔逻辑检索即运用布尔逻辑算符对检索词进行逻辑组配,表达两个概念之间的逻辑关系。,A AND B A*B,A OR B A+B,A NOT B A-B,课堂练习,WTO框架下的中国市场经济 WTO 中国 市场经济 对宋词韵律的美学思考 宋词 韵律 美学 潜器的文献普查 潜器 潜水器 水下机器人,在EI中了解一下我校师生发表论文的情况,Ei数据库的位置算符: near/0 与 onear /0 near /0 词间顺序不固定 onear /0 词间顺利固定,Harbin onear/0 Engineering onear/0 University,2 位置算符检索,位置算符检索即运用位置算符表示两个检索词间的位置邻近关系,又叫邻接检索。这种检索技术通常只出现在西文数据库,在全文检索中应用较多。 如果说布尔逻辑算符是表示两个概念之间的逻辑关系的话,位置算符表示的是两个概念在信息中的实际物理位置关系。,3 截词检索(truncation)与词根检索(stemming),用截词符号“?”“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。这种检索技术可以扩大检索范围,提高查全率,主要用于西文数据库检索。中文数据库通常不使用这种技术。,4 字段(field)检索,字段检索即指定检索词出现的字段,被指定的字段也称检索入口、检索点、检索途径。检索时,系统只对指定字段进行匹配运算,提高了效率和查准率。 在数据库中,字段名称通常放置在下拉菜单中。 检索字段可以几个字段同时使用,以提高查准率,这种方式通常出现在数据库的复杂检索或高级检索中。,5 全文检索,全文检索是指直接对原文进行检索,从而更加深入到语言细节中去。它扩展了用户查询的自由度,使用户能对原文的所有内容进行检索,检索更直接、更彻底。 全文检索技术通常用于全文数据库和搜索引擎中,使用全文检索可能会提高查全率,但同样也会有很多不相关的信息出现。因此在标引工作做得比较好的数据库中,这种方法是在进行其它字段的检索后,仍无法得到满意的结果时才会使用。,6 其他检索技术,嵌套技术(优先算符nesting):即用括号将优先检索的检索式括起来,系统会首先检索括号中的概念。也有检索系统会使用默认布尔逻辑算符顺序或二次检索方式来提供优先运算方式。,大小写敏感(case sensitive):指西文检索系统中对用户检索式包含的大小写的处理方法。不同的系统处理方式不同。例如:检索词为“Apple”,有些系统严格地按照用户输入的大小写来处理,则检索结果只是“苹果”计算机、“苹果”牛仔裤或其他苹果品牌,这就是大小写敏感。有些系统的检出结果还会包括苹果等植物名称,就是大小写不敏感。,禁用词表(stop words):在西文数据库检索中,系统对信息进行标引时,不能做标引词或检索词的语词,包括介词、冠词、代词、连接词、某些形容词或副词等。这部分词语由于使用频率过高,不能反映信息的实际内容,即使用户输入,系统也不会对其进行检索,又称停用词。如a an in for the should she well only等。由禁用词构成的词表成为禁用词表,不同检索系统的禁用词表略有不同,要注意查看。,九 数据库的个性化功能,注册个人帐户 存储检索历史 定制个性化服务,十 数据库的帮助文件,了解某个数据库的具体使用,详读数据库的帮助文件。,检索方法与策略,1 信息检索方法概述,所谓检索方法,就是制定正确、恰当的检索策略,为检索过程进行指导,目的是为了优化检索过程,提高检索效率,全面、准确、快速、低成本地找到所需信息。 检索策略是为实现检索目的而制定的具体检索方案。 编制检索策略主要包括检索方式的选择、检索范围的限定、信息资源的取舍、确定检索词以及利用相应检索语言编制检索表达式等环节。 对于一个具体的检索过程而言,编制出一个好的检索策略,使其能够确切地反映检索需求,就有可能使检索者以最短的时间和最低的成本获取最满意的检索结果。编制检索策略对检索过程能否顺利进行具有举足轻重的重要影响。,2 信息检索策略的制定与实施,分析课题 选择数据库 确定检索词 构造检索表达式 确定检索途径 对检索策略进行调整 实施并输出

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论