




已阅读5页,还剩42页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,第三讲 信息检索策略与信息需求分析,2,信息检索中需要了解的 几个基础知识 1、信息特点 2、信息语言 3、信息检索技术,第一节 信息检索基本知识,3,1、信息特点 文献信息分类特点 方便文献信息的排架,便于索取; 类目的结构严谨,逻辑性强; 适合学术信息资源的组织。 网络信息分类特点 根据网络信息的存在状况和当前上网用户的特点来编制的,科学性、系统性稍差; 适合大众信息资源的组织。 数据库信息分类特点 结合文献信息分类和网络信息分类的优点 方便浏览和检索,4,2、信息语言,5,3、信息检索技术 计算机信息检索技术是用户信息需求和文献信息集合之间的匹配比较技术。 布尔逻辑检索、截词检索、邻近检索、短语检索、字段检索、网络信息检索 几乎所有的检索系统都有布尔逻辑检索、截词检索(模糊检索)和限制检索,而不同的检索系统又会有一些特殊的检索技术和功能。,6,第二节 信息检索策略,7,一、什么是信息检索策略?,执行一个课题的检索是有过程、分步来完成的,检索步骤的科学安排称为检索策略(retrieval strategy),它是为实现检索目标而制定的全盘计划或方案。特别是在计算机检索中,策略问题是明确提出来的,必须慎重考虑,因为它可能要完成的是一个比较复杂、精细的检索课题,又是在人与机器的对话、交互中实现的。,8,二 信息检索步骤,分析检索课题,明确信息需求 选择检索工具,了解检索系统 确定检索途经,选定检索方法 实施检索策略,浏览初步结果 调整检索策略,获取所需信息,9,1、分析检索课题 明确信息需求,检索需求类型 主题概念分析(注:是课题检索的重点和难点) 检索目的(申报课题、开题报告、学术论文、成果查新、课程论文、商业需求以及其它需求类型等) 文献类型(期刊论文、会议论文、科技报告、图书、专利、标准、网站等) 结果形式(全文、文摘、题录、数值、事实等) 检索年限(如2000年以来的文献) 语种(中文、外文;英文、日文) 检索结果数量(100?50?),10,1.1 检索需求类型,查找某概念的确切含义 如:什么是“blog” 查找某概念的背景知识 如:谁最先发现青霉素 查找某些事物的数值及量化指标,特征型知识: 一般通过事实型、数值型数据库和搜索引擎获得。,11,查找某一学科的一般知识 如:关于分子生物学有哪些专著 查找学科专业领域的新进展 如:有关纳米技术的研究综述 查找课题相关的专业文献 最常见的!,关联型知识: 文献数据库,12,1.2 主题概念分析,从熟悉的已知文献信息入手 分析检索课题的内容实质 找出隐性的主题概念并将抽象的主题概念转化为具体的概念 找出核心概念,排除无关概念和重复概念,简化逻辑关系 明确概念间的逻辑关系,13,例如:,从镀锌残渣中回收锌工艺? 实际是:从高品位镀锌残渣中分离铁 所以课题可以这样表述: “从锌块中分离铁”,14,隐性主题具体化,如:酸洗费液的处理 处理:“回收”、“再生”,如:煤灰利用 具体利用:?,检索式: (粉煤灰+煤炭)*(利用+砖+水泥+混凝土+路基+),15,找出核心概念,简化逻辑关系,并不是概念越多越好! 抓住主题的核心:最能表达检索课题内容,而且具有实际检索意义的关键词。 如“利用稻米皮糠提取天然食品色素” 稻米、皮糠、提取、天然、食品、色素 稻米、色素,16,排除检索意义不大的词,排除检索意义不大而且比较泛指的概念 如:展望、发展趋势、现状、近况、生产工艺、应用、利用、作用、方法、影响、制备、结果 不要望词生义,17,明确概念间的逻辑关系,同义词、近义词是或的关系 上位词 即扩检,如“教育心理学” 下位词 即缩检,如“智育心理”、“德育心理”、“美育心理”、“教学心理学”、“学习心理学”、“教师心理学”、“学生心理学”等。 若多个下位词都用来检索,相对于一个上位词来说,一般是扩检。 一个下位词相对于一个上位词来说,一般是缩检。,18,如何选词,表示具体事物名称的名词术语,如汽车、变压器、反应堆、水稻、坐标仪等; 表示事物的状态或现象的名词术语,如强度、失真、土壤熟化、日冕、船舶过载等; 表示科学分类的名词术语,如数学、物理学、中医学、电子学、建筑工程、水利工程等; 表示研究方法、技术方法的名词术语,如分析(化学)、针刺手法、有限元法、结构功能法、力学性能试验等;,本页面内容参考汉语主题词表,19,表示工艺方法、加工技术的名词术语,如铸造、锻造、热处理、焊接、酿造、取心钻进、爆破成型、激光切割等; 表示化学元素、化合物、金属材料与合金的名词术语,如钠、氧原子、族元素、钠化合物、硅化物、硫酸、钛络合物、钉胺、呋喃、吡啶、醇聚四氟乙烯、丁二酸()以及如金属板耐蚀钢、耐蚀合金等; 表示国家名称、地名、组织机构名称及人名的专有名词以及文献类型、文献载体的名词术语,,20,2.选择检索工具 了解检索系统,与检索主题相关的检索工具有哪些?*(主要看数据库的学科覆盖范围) 与检索需求的文献类型相关的检索工具有哪些?(如:哪些数据库或网站中含有会议论文) 语种、年限、结果形式(全文还是文摘) (如检索19891994年的文献,选择维普还是cnki),21,2.1 选择检索工具的一般方法,根据不同的文献类型和语种需求选择 根据利用方便、使用熟练的程度选择 根据相应速度、获得支持和帮助的程度选择 根据数据量、信息年限的需求选择 根据经验和推荐选择,22,2.2 选择的前提:知道有哪些信息源,图书馆网站的书目、数字资源列表 搜索引擎 如:谷歌图书搜索、百度图书搜索、谷歌学术搜索、谷歌专利搜索等 网络目录 / 提供公共信息的专门网站,如标准 开放获取信息资源,如arxiv预印本文献库,23,2.3 如何了解一个数据库,国际国内的在学术等领域的影响或地位 服务形式(web、光盘、联机检索、单机) 校内、国内、国外。镜像 涵盖学科或主题范围 文献类型(出版形式、内容层次) 收录年限,收录对象 数据量(记录数) 文种 更新频率 访问模式(口令,ip控制) 其它信息:帮助信息、出版者、发行者、在同行中的地位。,24,如何了解一个数据库 样例:书生数字图书,国内重要的数字图书之一 服务形式:web/镜像 涵盖学科或主题范围:所有学科 文献类型(出版形式、内容层次等): 电子图书,全文(一次文献) 收录年限,收录对象: 20012003,纸本图书的数字化 数据量(记录数):11.4万 文种:中文 更新频率:年 访问模式:ip控制,25,2.4 如何检索一个特定的数据库,宏观上了解数据库,熟悉界面。 利用数据库提供的检索指南(帮助、faq)。 了解检索与浏览模式(一般检索、高级检索、分类检索、特色检索等;按主题浏览、按出版物字顺浏览等)。 检索结果的获得(多种全文格式、题录信息保存、提供预印本) 其它特色功能(检索策略保存、信息定制) 全文阅读工具(pdf、专用阅读器),26,2.4 如何获得数据库的检索帮助与指南信息,一般数据库界面上都有“帮助”或者“检索指南”。 图书馆等文献机构发布数据库时提供的使用帮助。 通过google等搜索引擎搜索。 如:filetype:ppt 中国期刊全文数据库,27,3. 确定检索途经,选定检索方法,有什么样的检索标识或检索语言,就有什么样的检索途经(检索标识:题名、主题或关键词、摘要、全文、作者、机构、分类、出版物名等),28,回顾:信息检索方法,29,3.1 间接检索法(即检索方法),间接检索法是借助于检索工具查获所需文献的方法,包括顺查法、倒查法和抽查法。 顺查法 是经过分析,确定查找的起始年代,再利用选定的检索工具由远及近地逐年查找文献的方法。 它适用普查一定时间的全部文献,查全率较高,并能掌握课题的来龙去脉,了解其研究历史、研究现状和发展趋势。,30,倒查法 此法与顺查法相反,是按照时间范围,利用选定的检索工具由近及远地逐年查找,直到查到所需文献为止。 由于这种方法重点是查检近期文献,所以能获得较新的文献信息,节省检索时间。 然而不如顺查法查全率高,容易产生漏检的现象。,31,是根据检索需求,针对所属学科处于发展兴旺时期的若干年进行文献查找。 用这种方法能获得一批具有代表性、反映学科发展水平的文献,检索效果和效率较高,但必须熟悉学科发展的特点。,抽查法,32,追溯检索法,也叫扩展法、追踪法。此法不是利用确定的检索工具,而是利用已知文献的某种指引,如文献附的参考文献、有关注释、辅助索引、附录等,追踪查找文献。 根据已知文献的指引,查找到一批相关文献;再根据相关文献的有关指引,扩大并发现新的线索,去进一步查找。如此反复追踪扩展下去,直到检索到切题的文献。 用追溯法检索文献,最好利用与研究课题相关的专著与综述,因为它们所附的参考资料既多且精。 在检索工具不全、文献线索很少的情况下,可采用此法。,33,追溯检索的更多应用,文章参考文献更多文章 文章作者文章 作者文章 作者团体更多作者文章 链接网站更多链接 期刊论文图书 图书期刊论文,34,追溯检索的作用,用较少的文献引出较多的文献 了解科学研究的前期工作基础、相关文献、经典著作、主要作者、重点期刊等。,35,3.2 直接检索法,是指直接通过浏览、查阅文献原文而获取所需文献信息的方法。这种方法不依靠检索工具,所以不是严格意义上的检索方法,36,优点:能够明确判断文献所包含的信息是否需要 缺点:是难以获得全面的文献,且费时费力,具有一定的盲目性和偶然性。 如果检索课题单一,文献相对集中,又熟悉检索书刊,可用这种检索方法。 对于有多个主题、文献离散度较大的课题,则不宜用此法 由于直接检索具有准确性和实用性优势,能满足用户直接获取文献的要求,因而是文献检索的必要手段。,37,3.3 文献信息老化规律的应用,随着时间的推移,信息的价值会逐渐衰减乃至失效。文献信息表现出老化规律。文献信息老化的情形有: 所含信息仍有用,但现在已经被包含在其它更新的文献中。 所含信息仍有用,但现在正处于人们对其兴趣下降的阶段。 所含信息仍有用,但为后来的文献所超越。 所含信息不再有用。,38,老化规律应用-限定年限的检索方法,在进行文献信息检索时,注意文献出版年的限定。学术信息的半衰期一般是35年。许多信息的老化如艺术品、经济信息、市场信息等表现出跳跃性。有时突然失效,有时永不失效。 查阅文献信息时尽量选取较新的文献。同时要顾及较早的文献。一般性研究可选择近5年来的文献即可。了解背景资料的则要长得多。 对发达国家的文献的利用可以在中文文献年限的基础上增加310年。,39,文献的半衰期:某学科领域现时还在利用的全部文献中的一半是在多长的时间内发表的。例如:物理学文献的半率期是4.6年,即是说:现时仍在利用的物理学文献的50,其出版年龄不超过4.6年。 半衰期与文献的增长、学科差异、学科发展的阶段和信息环境与需求有关。,40,4.实施检索策略, 浏览初步结果,在课题检索需求分析和了解检索系统的基础上,应用检索技术具体去检索! 注意逻辑组配、限定。 检索结果的选择与判断 注意排序和输出结果的设定 注意下载相关全文阅读器,41,检索结果内容的判断,看检索结果记录的标题和摘要是否为课题检索需要 注意根据信息来源判断信息的价值 看结果数量(太多或太少都不合适) 适当利用关联检索和类别检索功能扩展检索领域和范围 根据以上对检索结果内容的判断,调整检索策略,42,5.调整检索策略, 获取所需信息,根据初步检索结果判断,调整检索策略(检索需求;检索途径;检索方法;扩展检索、限定检索等),43,5.1 扩展检索的方法,上位词 同义词 多种写法 用or 检索系统的关联检索、相关关键词检索、引文检索等等,44,5.2 缩检的方法,下位词 专指的词 单元词合并为词组,如“互联网、使用、状况”合并为一个词组“互联网使用状况”, 精确检索 用and 和not 各种限度检索,45,挑选检索结果,获取所需信息,下载全文;保存题录文摘;文献传递与馆际互借;信息格式的转
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 丹阳市2025年江苏丹阳市事业单位集开招聘工作人员65人笔试历年参考题库附带答案详解
- 2025甘肃人力资源服务股份有限公司招聘36人(第一期)笔试参考题库附带答案详解
- 2025年甘肃省临夏亿农农牧投资有限公司招聘80人笔试参考题库附带答案详解
- 2025山东省国际信托股份有限公司招聘8人笔试参考题库附带答案详解
- 2025安徽菱安医疗器械有限公司招聘操作工等岗位14人笔试参考题库附带答案详解
- 2025四川南充市蓬州发展投资集团有限责任公司招聘10人笔试参考题库附带答案详解
- 2025中广国际有限公司高校毕业生招聘2人笔试参考题库附带答案详解
- 2025上半年浙江金华金义新区发展集团招聘11人笔试参考题库附带答案详解
- 危险废物安全培训记录课件
- 地铁反恐安全培训内容课件
- 通信工程安全员考试题库案例题汇总
- 频谱监测及瞬态信号捕获技术课件
- 宣城万里纸业有限公司年产15万吨高强度瓦楞包装用纸及5万吨纱管纸技改项目环境影响报告书
- 贵州某二级公路施工组织设计KK
- 推广普通话课件
- GB/T 16714-2007连续式粮食干燥机
- 五年级《欧洲民间故事》知识考试题库(含答案)
- 派车单(标准样本)
- 少先队大队委申请表
- 浦东机场手册
- 柴油机负荷特性曲线比较课件
评论
0/150
提交评论