信息检索过程与策略.ppt_第1页
信息检索过程与策略.ppt_第2页
信息检索过程与策略.ppt_第3页
信息检索过程与策略.ppt_第4页
信息检索过程与策略.ppt_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

3.3 信息检索过程与策略,3.3.1 信息检索的一般步骤,5 索取原始文献,4 查找和阅读文献线索,3 确定检索途径、检索方法,2 选择检索工具或检索系统,1 分析检索课题、明确检索要求,3.3.2 检索策略,什么是检索策略?(备注) 所谓检索策略广义上是指为实现检索目的而制订的全盘计划和方案;狭义讲是指检索式。,检索式是用来表达用户提问的逻辑表达式,是检索策略的综合体现,通常由检索词和各种逻辑算符、位置算符及检索系统中规定的其他连接符号构成。,在计算机检索中,检索策略直接关系到检索结果的成败,要想构造高水平的检索策略,不仅要求用户对检索系统十分了解,还需要对检索课题进行深入的分析并能灵活运用各种检索方法和技巧。,检索策略- 1. 概念,(1)从检索过程上定义:在分析情报提问实质的基础上,确定检索途径与检索用词,并明确各词之间的逻辑关系与查找步骤 的科学安排。 (2)从用户方面定义:反映用户检索意图的方针和计划,也是用户检索目标的体现。 (3)从检索整体上定义:为实现检索目标而指定的全盘计划和方案,是对整个检索过程的谋划和指导。,2. 检索策略的制定,(1)列出检索课题的学科范围,主题内容及其检索目标。 (2)选择相关数据库。 (3) 对检索提问进行概念分析,选择能代表各概念面的检索项,把提问的主题概念转换成适合检索系统的检索词,完成由概念表达到计算机系统所能接受的检索标识的转换。 (4)拟订检索表达式 (5)编排具体的检索程序 以上步骤不一定按顺序执行,可根据所检课题和所使用的检索系统的情况灵活运用。其中(3)和(4)是比较重要的。,3. 几种检索策略,计算机检索策略是近几年才得到人们的重视和广泛研究的,很多检索策略只不过是某种检索方式或检索式构造方法,真正称得上检索策略的还不多。其中,美国人鲍纳(Charles Bourne)提出的检索策略影响较大:,(1) 最专指面优先 首先从课题中最专指的概念入手,浏览结果后如发现检得文献相当少,那么检索者通常不把其他概念再加到检索式中去。 (2) 最低登录量优先 “属于美国女童子军成员的学生在高等教育中的成功率” (the Girl Scouts),(3) 积木型 把检索课题剖析成若干个概念,先分别对这几个概念进行检索,在每个概念中尽可能多的列举相关词,同义词,近义词,并用布尔算符连接成检索式。 用or连接成子检索式,再用AND把所有概念面的子检索式连接起来,构成一个总检索式。 优点:能提供较明确的检索逻辑过程,以后容易检索和理解。,子检索式1:S1=(Cancer or Carcinoma) AND (Lung or Lungs ) 子检索式2:S2=smoker or smokers or smoking or cigar or cigarette 总检索式:S=S1 AND S2,“肺癌与吸烟” Cancer smoker(s) Carcinoma smoking Lung(s) cancer cigar cigarette ,(4) 引文珠型增长 直接检索课题中最专指的面开始,以便至少检索出一篇命中文献。然后审阅这批文献,从中选出一些新的相关检索词,补充到检索式中去。 检索式以极生动的、经验的方式发展,最具有交互性。,(5) 逐次分馏 先确定一个相当大的范围广的概念,然后逐步提高检索式的专指度,得到一个较小的命中文献集,继续提高检索式的专指度,逐渐缩小命中文献,直到满意为止。,检索流程(构建检索策略的步骤),分析课题内容 选择信息资源/检索系统 构造检索式 选择检索点 实施检索 分析检索结果,调整检索策略 跟进检索,一、 分析课题的内容,1 明确检索目的 需要关于某一课题的系统详尽的信息 需要关于某一课题的最新信息 了解一些片断信息,解决一些具体问题 电子商务的发展与应用综述 IT新技术在电子商务中的应用 怎样用Web service技术构建电子商务平台,2 明确课题的主题或主要内容 要形成若干个既代表信息需求又有检索意义的主题概念,包括所涉及的主题概念有几个,概念的专指度是否适合,哪些是主要的,哪些是次要的,概念之间关系如何等,3 课题涉及的学科范围:搞清楚课题所涉及的学科领域、是否跨学科研究 4 所需信息的数量、语种、年代范围、类型等具体化指标,例:检索课题-不锈钢焊接,二、选择信息资源/检索系统,是否与检索课题相关的资源都要检索 选择哪些学科的信息资源 选择哪些语种的信息资源 信息资源覆盖的年限是否符合需求 信息资源的特点及针对性,三、构造检索式 选择检索点,检索式 是表达用户检索提问的逻辑表达式,由基于检索概念产生的检索词和各种组配算符构成。 检索点 即检索途径或检索入口、检索字段。检索点正确与否,决定着检索结果的数量与质量。,检索策略技巧 识别关键的概念。 如果需要的话,确定从这些概念中选择的术语。 适当的限定你的检索日期,研究群体等等。 实践帮助。由于个人选择和职业需求的不同,策略和风格也将有所不同。,一个检索课题往往涉及多个概念,选择检索词时首先要将检索课题涉及的所有概念分离出来,并针对每一个概念选择尽可能多的检索词。分析概念可从课题名称入手,出现在课题名称中的词并不一定都是概念词。,如:“吸烟与心脏病的关系” 可以表达为connection between somking and heart disease 通过分析发现,其中,只有somking和heart disease两个概念词,而“connection between”则不属于概念词。 概念1:somking 概念2:heart disease,有些课题的实质性内容往往很难从课题名称上反映出来,需要从中提取隐含概念,另外有些检索词已含有的概念,在选词时应予以排除。 例: 聚乙烯的合成 聚乙烯 合成 垃圾的处理 垃圾 处理 回收 再生 玻璃纤维增强石膏制品 玻璃纤维 石膏,针对每一个概念,选择与之相关的同义词或相关词 与somking相关的词有:smoker,smokers,tobacco等; heart disease的同义词有cardiopathy,heart trouble, heart attack. 将这些相关词记录下来,用于构造检索式: 概念1:somking,smokers,tobacco 概念2: cardiopathy, heart disease,heart trouble, heart attack,选定检索词的方法 利用上下位词或特有名词及同义词、近义词、相关词, 查阅工具如专业词表词典,字典, 分类表等 根据词表或数据库中的索引选词 从专业词典、百科全书等参考工具中选词 利用中文全文数据库选择英文检索词,编制检索式 使用逻辑算符(AND, OR, NOT) 、截词、位置算符, 限制检索条件至作者, 刊物或年代 . 调整其他设定 选定检索结果的显示方式 日期, 相关度等排序,例,(smok* OR tobacco) AND (cardiopath* OR heart disease OR heart trouble OR heart attack),“吸烟与心脏病的关系”,四 实施检索,可利用数据库提供的不同级别的检索界面进行检索 -初级检索 -高级检索,五、 分析检索结果 调整检索策略,不满意 满意,不滿意 非目标的结果,检查检索名词的拼写 增加检索名詞的准确性 查阅工具如 词表,字典, 分类表及字汇表, 刪除错误的名词 审查被检索的数据库 查阅数据库的说明及期刊列表以确定是否覆盖你所要的主题,重新检索,不滿意 结果太多,增设限制条件至特定栏位及年代 增加检索名词的准确性 - 查阅工具如 词表,字典, 分类表及字汇表 增加检索策略的准确性 增加使用 ANDs; 减少使用 ORs,重新检索,不滿意 结果太少,检查检索名词的拼写 增加检索名词的普遍性 -查阅工具如 词表,字典, 分类表及字汇表 扩大检索策略 减少使用ANDs; 使用Ors连接同义词及相关词 增加被检索的数据库 确定其他数据库是否覆盖你所要的主题,重新检索,检索式的反馈调整,用户情报需求的随机性和动态性 对用户需求的分析和表达往往因人而异 检索系统本身功能不够完善 适当调节检索式中泛指词、专指词和相关词之间的数量比例及逻辑组配关系来改善检索效果 查全率扩检 查准率缩检,查全率扩检,降低检索词的专指度,可从词表或检出文献中选一些上位 词或向关词补充道检索式中。 调节检索式的网络度,如删去某个不甚重要的概念面 进行族性检索,可采用分类号检索或采用一组近义词或同义 词或相关词用OR连接在检索式中。 进行截词检索 增加检索途径,如将主题途径和非主题途径结合起来使用。 取消某些限制过严的前后缀符、限制符等,查准率缩检,在有一定查全率的基础上再进行缩检 提高检索式的专指度 用AND连接一些进一步限定主题概念的相关检索项,增加相互制约 限制检索词出现的可检字段,用位置控制符控制检索词的词间顺序与位置 利用限制符、前缀符等限制输出文献的外部特征,加强针对性 利用NOT限制与情报提问不相关文献的输出,检索检索噪音。 进行加权检索,从定量角度加以控制,满 意,是否已全部获取所需? 打印、电邮 或 存档 需否获取与题录相关的全文 ? 连接全文工具或使用全文服务,六 跟进检索,查看适当的题录以查找其他有关的文献及检索方式 查看名词索引从而定出与已找得的文章相关的额外检索名词 进行作者检索以找出其合著者 查看文章参考目录以找出相关文章,课后作业,1. 在图书馆主页的哪一个栏目中,可以查询我馆订购的网络数据库? 2. 我馆订购的中英文数据库中哪些是综合性数据库?哪些是专业性数据库?请分别列举出3例,并简要说明每一数据库的收录内容,如学科范围、文献类型等) 3. 请列举中、外文全文型数据库,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论