计算机信息检索原理.ppt_第1页
计算机信息检索原理.ppt_第2页
计算机信息检索原理.ppt_第3页
计算机信息检索原理.ppt_第4页
计算机信息检索原理.ppt_第5页
已阅读5页,还剩48页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2020 2 12 第2章计算机信息检索原理 1 文献检索 任课教师蒋永新办公室 图书馆207室电话 66132072 2020 2 12 第2章计算机信息检索原理 2 教学日历 2020 2 12 第2章计算机信息检索原理 3 1 1信息时代与文献课 p 1 3 文献课是知识时代培养学生终身所需的信息意识与获取文献信息能力的重要课程 是一门科学方法课 文献课对学生不断吸取新知识 改善知识结构 有着重要的意义 2020 2 12 第2章计算机信息检索原理 4 1 1信息时代与文献课 在社会信息化的进程中 文献信息检索的意义日益变得重要 文献信息数量激增 知识的更新速度在加快 信息知识的有效期在缩短 信息获取成为一门专门的技术 2020 2 12 第2章计算机信息检索原理 5 1 1信息时代与文献课 教材 人文社会科学信息检索教程 蒋永新鲍国海等编著2003年上海大学版 2020 2 12 第2章计算机信息检索原理 6 1 1信息时代与文献课 课程的主要内容为 文献信息概论 专业信息源及文献信息的手工检索原理 计算机信息检索原理 综合性光盘和网络数据库及其使用方法 互联网信息的检索和利用 2020 2 12 第2章计算机信息检索原理 7 1 1信息时代与文献课 文献检索课的两个基本要求 要求学生掌握主要检索工具的使用方法 能够选择数据库 制定检索策略 分析检索结果 能够独立地完成检索课题 掌握获取原始文献的主要方法 要求学生培养信息意识 具体来说是要求形成信息就是价值 就是效益 就是生存权的自觉意识 2020 2 12 第2章计算机信息检索原理 8 1 1信息时代与文献课 平时练习作业占总分30 其中文献类型识别10 中国期刊网作业25 EBSCO作业30 OPAC20 搜索引擎 百度 15 出勤 缺勤一次扣除平时总分的10 期末考试 机考 安排在第10周 成绩占总分70 2020 2 12 第2章计算机信息检索原理 9 网络课件的注册登陆和使用 文献课网络课件 在互联网终端上 网址 http 202 120 121 238 2048用自己学号和身份证号码登录 注意教师和班级的选择 周一7 8节 DJ204教室 网络课件用于预习复习 特别用于通过练习题目 掌握重点知识与教师的联系 教学留言版 2020 2 12 第2章计算机信息检索原理 10 第2章信息检索原理 2020 2 12 第2章计算机信息检索原理 11 第2章信息检索原理 本课要点 文献信息数据库的类型和结构计算机信息检索的基本步骤检索概念的分析方法和检索词的处理方法检索策略调整的基本方法 2020 2 12 第2章计算机信息检索原理 12 第2章信息检索原理 本章要求自学的内容 信息检索原理 文献信息检索的类型 检索效果评价信息检索系统的构成 印刷型信息检索系统的类型 信息检索语言 2020 2 12 第2章计算机信息检索原理 13 2 1信息检索的基本概念 信息检索是指从任何信息集合中查找所需信息的活动 过程与方法 2020 2 12 第2章计算机信息检索原理 14 2 1信息检索的基本概念文献信息的内外部特征 与文献信息主题内容密切相关的信息称为文献信息的内容特征 文献信息内容特征主要有各种形式的主题词和分类号 与文献信息主题内容没有关系或关系不大的信息称为文献信息的外表特征 例如著者 著者单位 期刊名称 专利说明书的专利号 科技报告的报告号等 2020 2 12 第2章计算机信息检索原理 15 2 2 3计算机信息数据系统 p 25 文献信息数据库的定义和种类数据库的构成文档 记录 字段数据库检索原理 2020 2 12 第2章计算机信息检索原理 16 2 2 3文献信息数据库原理 定义 p 25 数据库是指至少由一种文档 file 组成 能满足特定目的或特定功能数据处理系统需要的数据集合 2020 2 12 第2章计算机信息检索原理 17 2 2 3数据库构成 从使用者观点观察 数据库主要由 文档 记录 字段 三个层次构成 文档 记录 字段 2020 2 12 第2章计算机信息检索原理 18 2 2 3数据库构成 文档 从数据库的内部结构来看 文档的概念是指数据库内容的组织形式 一般地说 一个数据库至少包括一个顺排文档和一个倒排文档 顺排文档是按照记录号顺序组成的数据集合 是数据库的主体 正文 倒排文档是按照一定的属性顺序 对顺排文档的内容 重新排列组成的数据集合 对数据库正文起索引作用 2020 2 12 第2章计算机信息检索原理 19 2 2 3数据库构成 文档 记录号标识词11计算机 软件 安全12软件 网络13网络 安全 软件 标识词记录号安全11 13计算机11软件11 12 13网络12 13 标识词记录数安全2计算机1软件3网络2 主文档 倒排文档 索引引词典倒排文档 2020 2 12 第2章计算机信息检索原理 20 2 2 3数据库构成 记录 记录是文档的基本单元 它是对某一实体的全部属性进行描述的结果 在全文数据库中 一个记录相当于一篇完整的文献 在书目数据库中 一个记录相当于一条文摘或题录 2020 2 12 第2章计算机信息检索原理 21 2 2 3数据库构成 记录示例 p 25 Title Theeconomicsoffleetmanagementcomputing Subject s CLIENT servercomputingSource AmericanCityCosteffectiveness AN 9608140975ISSN 0149 337XDatabase AcademicSearchElite 2020 2 12 第2章计算机信息检索原理 22 2 2 3数据库构成 字段 p 26 字段是记录的基本单元 它是对实体的具体属性进行描述的结果 在书目数据库中 记录中含有题名 著者 出版年 主题词 文摘等字段 2020 2 12 第2章计算机信息检索原理 23 2 2 3数据库构成 字段 2020 2 12 第2章计算机信息检索原理 24 2 2 3数据库构成 字段 2020 2 12 第2章计算机信息检索原理 25 2 3文献信息检索方法 p 26 p 27 按照检索工具使用与否区分的类型 直接检索法 直接从报刊杂志中通过浏览的方法从中获取所需信息的一种方法 是一种获得最新信息的方法 但很难快 准 全地查获所需的信息 间接检索法 通过检索工具的指引进行查找 获取所需信息的一种方法 效率高 效果好 2020 2 12 第2章计算机信息检索原理 26 2 3文献信息检索方法 p 26 p 27 按照使用的检索工具区分的类型 追溯法 是利用已有的文献后面所附的参考文献追查原文 从而获得一批相关文献信息的查找方法 常用法 是利用目录 题录 文摘或数据库等各种检索工具来查找文献的方法综合法 综合使用追溯法和常用法两种方法 2020 2 12 第2章计算机信息检索原理 27 2 3 2文献信息的一般检索步骤 明确检索要求 分析课题概念选择需要使用的数据库构成检索策略根据检索结果调整检索策略输出检索结果 2020 2 12 第2章计算机信息检索原理 28 2 3 2文献信息的一般检索步骤1 明确检索要求和检索 搞清楚本课题属于什么学科 所需情报的文献类型及语种 查找文献的年代 所需文献的最佳篇数 允许支配的检索费用 2020 2 12 第2章计算机信息检索原理 29 2 3 2文献信息的一般检索步骤2 选择数据库 按照课题的检索要求和目的 选择收录文献种类 专业覆盖面 年代跨度对口的数据库 当需要查找最新文献信息时 选择数据更新周期短的数据库 当还需要获取原文时 选取原文获取较容易的数据库 2020 2 12 第2章计算机信息检索原理 30 2 3 2文献信息的一般检索步骤2 数据库的选择 2020 2 12 第2章计算机信息检索原理 31 2 3 2文献信息的一般检索步骤2 数据库的选择 文科常用的文献数据库 中文类文科常用数据库 中国期刊网 全文数据库 文理各科维普期刊网 全文数据库 文理各科社科报刊数据库 文摘数据库 文科人大复印资料数据库 全文数据库 文科外文类文科常用数据库 EBSCO 文摘 全文数据库 文科为主Kluwer 全文数据库 文理各科 2020 2 12 第2章计算机信息检索原理 32 2 3 2文献信息的一般检索步骤 3 确定检索途径4 记录和阅读文献线索5 索取原始文献p 30 2020 2 12 第2章计算机信息检索原理 33 2 4检索概念的分析和扩展方法 p 30 1 课题分析方法2 课题背景知识的获取方法 2020 2 12 第2章计算机信息检索原理 34 2 4检索概念的分析和扩展方法 p 32 1 基于同物异名的名称扩展法 1 寻找同一事物的学名和俗名 商品名和代号等如 贸易与商业 便携式录音机和walkman 涉外与对外 刊物与杂志 2 寻找同一事物的简称 全称 音译和意译等如 外语与外国语言 worldwideweb WWW 互联网与因特网 科技与科学技术 培养与教育 2020 2 12 第2章计算机信息检索原理 35 2 4检索概念的分析和扩展方法1 基于同物异名的名称扩展法 3 寻找同一事物名称的近义词和反义词如 教学与培训 教育 研究与分析 比较 理论 变化 翻译与直译 意译 美术与艺术 英汉与汉英 否定与肯定 4 如果是英语 寻找同一事物名词的单复数 不同词性 英美语的不同形式如 cheque与check colour和color stock和share等 2020 2 12 第2章计算机信息检索原理 36 2 4检索概念的分析和扩展方法 2 基于内容分析的概念扩展法 1 上位概念扩展法 分析检索对象的学科归属 如 英语与外语 美术与艺术 上海图书馆与公共图书馆 词法与语法专利与知识产权 继承法与民法 唐诗与古诗 词法与语法等 2 下位概念扩展法 又称概念分析的树形展开法 如 英语外贸应用文英汉科技翻译书信函电公文化学机械通信口译笔译 2020 2 12 第2章计算机信息检索原理 37 2 4检索概念的分析和扩展方法2 基于内容分析的概念扩展法 3 隐含概念扩展法如 投资管理 的显见主题是 投资管理 隐含主题还有 投资法规 投资法律 又如 作家笔下的主人公特征比较 隐含主题还有 文学作品 和 小说 2020 2 12 第2章计算机信息检索原理 38 2 3 3检索概念分析和扩展方法3 基于检索结果的概念扩展法 对初步检索结果进行分析 往往能够得到与课题相关的新的检索概念 将这些概念经过重新组合 就可以达到扩展检索结果的目的 2020 2 12 第2章计算机信息检索原理 39 2 6 2计算机检索策略的构成方法1 布尔逻辑算符 或 OR 运算符S11834companyS22022enterpriseS33647companyORenterprise使用于具有基本相同或近似概念的同义词 同族词之间 enterprise company 2020 2 12 第2章计算机信息检索原理 40 2 6 2计算机检索策略的构成方法1 布尔逻辑算符 与 AND 运算符WTOChinaS112940WTOS22173ChinaS3842WTOANDChinaWTOANDChina使用于需要组配不同概念的检索词之间 2020 2 12 第2章计算机信息检索原理 41 2 6 2计算机检索策略的构成方法1 布尔逻辑算符 非 NOT 运算符S1110PATENTS2325GERMANS3108PATENTNOTGERMANPATENTNOTGERMAN使用于需要从某个概念中剔除另一个概念的场合 patent German 2020 2 12 第2章计算机信息检索原理 42 2 6 2计算机检索策略的构成方法2 优先处理算符 p 41 SAORB 集合号为S1 SCORD 集合号为S2 SS1ANDS2 S AORB AND CORD 使用优先处理算符 2020 2 12 第2章计算机信息检索原理 43 2 6 2计算机检索策略的构成方法3 截词算符 p 41 当某些英语检索词词干相同 词义相近 但词尾或词中间有变化时 多数英语单词的单复数变化和英美不同拼写形式 可以采用截词符 或称通配符扩展检索词 无限截词 以任意词尾变化为特征例如 manag work 有限截词和屏蔽符 以单个字母变化为特征 例如 m nmoderni ation 2020 2 12 第2章计算机信息检索原理 44 2 6 2计算机检索策略的构成方法3 截词算符 p 41 一是截词符要紧接在词干后面 截词符和词干之间不能有空格 二是避免将检索词的词干截得过短 一般应在三个字母以上 三是截词应该使用得合理 一般不可能出现词尾变化的单词 例如management protection等 其后不必再使用截词 四是从希望出现的单词中取尽可能多的公共字母作为词干 以提高查准率 比如在对manage managing managed management和manager作截词运算时 词干应使用 manag 而不应使用 man 2020 2 12 第2章计算机信息检索原理 45 2 6 2计算机检索策略的构成方法4 位置算符 指定检索词之间的距离和出现的顺序的算符 W 算符两侧的检索词次序不能颠倒 两词之间不允许有其他的词或字母 但允许有空格或 或 号 Wn 算符两侧的检索词之间最多允许插入n个词 两个检索词词序不允许颠倒 2020 2 12 第2章计算机信息检索原理 46 2 6 2计算机检索策略的构成方法4 位置算符 N 算符两侧的检索词必须紧密相连 两词之间不允许有其他的词或字母 但词之间次序可以颠倒 Nn 算符两侧的检索词之间最多可插入n个单词 且这两个检索词的词序任意 2020 2 12 第2章计算机信息检索原理 47 2 6 2计算机检索策略的构成方法5 字段限制 字段限制适用于在已有一定数量输出记录的基础上 通过指定字段的方法 减少输出篇数 提高检索结果的查准率的场合 篇名作者刊名主题词 20

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论