




已阅读5页,还剩166页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
网络信息检索与利用 主讲人 夏立新教授博士生导师华中师范大学信息管理系 contents 信息检索的过程 关于钢铁与冶金的网络信息资源 检索的方法及其选择 信息检索的定义及重要性 检索过程的控制 检索结果的评价 1 1信息检索的定义 广义的信息检索全称为 信息存储与检索 是指将信息按一定的方式组织和存储起来 并根据用户的需要找出有关信息的过程 狭义的信息检索为 信息存储与检索 的后半部分 通常称为 信息查找 或 信息搜索 是指从信息集合中找出用户所需要的有关信息的过程 狭义的信息检索包括3个方面的含义 了解用户的信息需求 信息检索的技术或方法 满足信息用户的需求 1 2信息检索的重要性 任何一个人都有信息检索的需求 无论是去图书馆看书 还是网上搜索资料 无论是用百度还是用谷歌 无论是查阅期刊 还是从数据库中下载文献 都是信息检索的过程 信息检索的重要性可见一斑 下面从科研和决策的角度来简要解释信息检索的重要性 1 2 1科研方面 选择研究课题无论哪方面的课题 都应来源于人类已有的科学技术知识 也就是前人或他人的研究工作 科技创新的研究工作都是把前人或他人研究的终点及取得的成果作为研究的起点 而找到这个终点与起点的唯一办法就是搜集信息资料和积累知识 文献信息检索对课题选择过程中找到研究的起点 避免重复性的研究工作 起着非常重要的作用 提出研究的内容及方案论述即将开展研究课题的国内外发展动态 实验手段和经济效益分析 第一步和第二步95 属于信息调研工作 进行试验研究我们在研究课题的同时 可能别人也在研究 必须了解研究课题情况 广集他人智慧 为我所用 才能使研究进展更快 才能走在别人的前面 撰写研究报告 或论文 同样需要引用最新的资料 1 2 2决策方面 信息是领导决策活动的基础决策活动是一个由信息系统 智囊系统 决策系统 和监督系统组成的科学决策体系 而要完成一项科学决策 每个子系统都不同程度渗透着信息检索工作 决策的过程就是信息利用的过程 信息检索工作贯穿决策的始终 信息是领导科学决策的桥梁采用科学思维和科学计算方法 通过对大量前瞻性信息的检索分析和利用以辅助决策 是科学决策化的主要手段 信息是领导决策成功的重要依据谁检索的信息多 检索的快 检索的准确 谁就能赢得决策工作的主动权 2 信息检索的过程 2 1分析用户的信息需求2 2了解检索工具或系统的基本情况2 3制定检索策略2 4拟定并执行具体的检索步骤2 5获取并整理检索结果2 6分析评价检索结果 用户的信息需求层次 客观信息需求 RIN RealInformationNeed 认识到的信息需求 PIN PerceivedInformationNeed 表达出来的信息需求 即检索提问 Request 以及检索提问表达式 Query 2 1分析用户的信息需求 在图中 学术研究人员在探索未知 解决实际问题的过程中 总存在着一定的信息需求 这是一种完全由客观条件决定 不以学术研究人员主观认识为转移的需求状态 我们称之为 客观信息需求 RIN 认识到的信息需求不同于客观信息需求 它只是客观信息需求的一种心理认知状态 由于主观因素和意识的作用 学术研究人员认识到的信息需求 PIN 可能仅仅只是客观信息需求 RIN 的一部分 甚至有可能是对客观信息需求产生错误的认识 为了满足自己的信息需求 学术研究人员试图充分而准确地表达认识到的信息需求 于是 产生了检索提问 Request 检索提问通常用人工语言予以表达 有时也用自然语言予以表达 在检索提问的基础上 使用检索用词 如系统词表中语词 以及其他非受控语词 和 系统 语言 如布尔逻辑算符 截词算符 位置算符等 构造检索提问表达式 Query 相对于信息检索对象 信息集合 客观信息需求 RIN 认识到的信息需求 PIN 检索提问 Request 以及检索提问表达式 Query 共同构成学术信息需求集合 即Infoneed RIN PIN Request Query 2 1 1信息需求的主题特征对用户提出的课题进行主题概念分析 按主题概念的层次性从泛指到专指层层展开 层层深入 将其分为一个或多个概念块 我们称之为 概念组面 在说明主题的结构中 最常用的是 事物 部分 方面 和 类称 特称 这 个概念 事物就是课题讨论的对象 例如 汽车 部分是指所讨论对象的一个组成部分 例如 轮胎 方面是指研究对象或其部分的某一方面问题 例如 耐磨性 类称 与 特称 是属种关系 如 轮胎 与 汽车轮胎 前者是类称 后者是特称 特称事物既可以直接表达 如 汽车轮胎 也可以用 类称 特称限定词 的方式表达 如 轮胎 汽车 典型的主题结构是 事物 事物种类 特称 事物的部分 部分的部分 事物的方面 方面的方面 地区 时间 文献类型 具体的主题 一般仅有上述典型结构中的若干个构成因素 同时 各学科 专业也有具体的典型主题结构 虽不尽相同 但大同小异 这样比较典型的主题结构可以为我们分析检索课题的主题概念 形成概念组面提供框架 2 2了解检索工具或系统的基本情况检索工具或系统的研制者情况检索工具或系统的收录范围检索工具或系统所提供的检索途径及相应功能 检索途径按内容可分为两类 一类是泛指性强 做选题时常用的分类检索 一类是专指性强 选题成功时使用的主题检索 2 3制定检索策略常用的联机检索策略有积木型相关词 同义词 近义词用OR连接成子检索式 引文珠形增长从已知的相关课题的少数几个检索词入手 找到新的检索词 补充到检索式当中去 逐次分馏逐渐提高专指度 2 4拟定并执行具体的检索步骤 2 5获取并整理检索结果2 6分析评价检索结果查全率 RecallRatio R 查准率 PrecisionRatio P R 检索出来的相关文献数量 系统中所有的相关文献数量P 检索出来的相关文献数量 检索出来的文献总量 比如我们需要一些与未来钢铁行业发展方向相关的文献 我们选择的数据库是中国期刊网 我们构建的检索词为 钢铁行业 发展趋势 我们采用的策略是逐次分馏 从图中我们可以看到 我们能搜出316个结果 数量比较多 但是仔细看结果 有很多是04 05甚至是03年的文献 这些都很老旧了 于是我们把文献的发表时间限制为2009 12 19到2011 12 19 再看一下检索的结果会如何 如下图 虽然得到的结果只有78条 比前面少了 但是再来看一下文献发表的时间 可以很明显的看到 所检索到的结果时间都是最近一两年的 更加符合我们的现实需求 从这些文献中得到是的信息更加有参考价值 而且我们可以通过限制文献的作者 作者的单位 文献的出版社以及国家和各级科研项目来逐步提高专指度来限制检索的范围 还可以更改或增加检索词来进一步检索 最后得到我们比较满意的结果 3关于冶金方面的信息资源 3 1关于冶金方面的图书资源3 2关于冶金方面的论文资源3 3关于冶金方面的专利资源3 4关于冶金方面的标准资源 3 1关于冶金方面的图书资源 图书是一种成熟定型的出版物 是迄今为止最主要的文献类型 也是图书馆藏书最主要的部分 图书是系统了解和掌握一门学科知识的最基本文献 图书在专业领域知识的学习和科研中有着不可替代的作用 图书资源一般分为书目资源和图书全文资源 3 2 1书目信息资源 书目是图书目录的简称 一般而言 用户都认为图书内容很重要 而图书书目似乎意义不大 其实不然 首先 书目可以引导用户学习 若读者要了解某专业领域的知识 在正式阅读相关图书资源前 有必要通过书目来检索需要阅读哪些图书 决定图书的阅读顺序 了解哪些图书是这个领域最为重要和经典的 这显然有助于用户的学习和研究 其次 书目本身的编撰十分优秀 具有很高的学术价值和参考价值 通过阅读书目 读者可以了解某一时期内某一学术领域的概貌 因此 书目对于学习和研究具有重要的意义 书目信息资源可以通过以下几个个主要途径来获取 传统书目工具书 馆藏书目检索系统 图书网站的网络书目 搜索引擎 30 传统书目工具书 全国总书目 查找已经出版的图书年鉴性编年总目 根据全国的呈缴本编辑成的目录性工具 可用于了解我国解放后我国书刊的出版信息 全国新书目 查找正在出版的图书收录有全国各出版社近期出版的新书 新华书目报 查找将要出版的图书 分 社科新书目 和 科技新书目 两种 用于报道最近出版和即将出版的新书 中国图书在版编目快报 周刊出版社目录报道本出版社出版的图书 有图书内容简介和征订目录两种 如 内部书征订目录 31 馆藏书目信息检索系统 馆藏书目检索系统一般称为OPAC OnlinePublicAccessCatalog 即联机公共检索目录 介绍3种主要的联机公共检索目录 世界联合书目数据库中国国家图书馆联机公共目录查询系统CALIS联合目录 32 世界联合书目数据库简介 网络地址 http worldcat org WorldCat是由联机计算机图书馆中心 OnlineComputerLibraryCenter 简称OCLC 组织 世界上上万图书馆参加的全球联合编目数据库 创建于1971年 是目前世界上最大的数据库 覆盖了400多种语言 4000年来有记录的知识每10秒钟就有一个图书馆增加一条新纪录到WorldCat数据库目前 WorldCat包括7000多万种图书和其他资料的书目 以及这些资料的13亿多个馆藏地点 33 WorldCat检索界面 高级检索入口 用户登录界面 34 高级检索界面 检索限制条件 检索字段的选择 结果显示 二次检索限制条件 点击图书名 获得更详细的信息 结果显示的选择 中国国家图书馆联机公共目录查询系统 网址 中国国家图书馆是我国国家总书库 全面收藏了我国的正式出版物 是世界上收藏中文文献最多的图书馆 中国国家图书馆联机公共目录查询系统检索主页 用户登录界面 匿名也可以登陆 但仅限于使用检索功能 数据库的选择 检索字段的选择 高级检索入口 结果显示 图书作者信息 图书书名 图书类型 图书出版时间 图书馆藏地点 相关操作导航 CALIS简介 中国高等教育文献保障系统 ChinaAcademicLibrary InformationSystem 简称CALIS 是经国务院批准的我国高等教育 211工程 九五 十五 总体规划中三个公共服务体系之一 CALIS的宗旨是 在教育部的领导下 把国家的投资 现代图书馆理念 先进的技术手段 高校丰富的文献资源和人力资源整合起来 建设以中国高等教育数字图书馆为核心的教育文献联合保障体系 实现信息资源共建 共知 共享 以发挥最大的社会效益和经济效益 为中国的高等教育服务 CALIS简介 从1998年开始建设以来 CALIS管理中心引进和共建了一系列国内外文献数据库 包括大量的二次文献库和全文数据库 采用独立开发与引用消化相结合的道路 主持开发了联机合作编目系统 文献传递与馆际互借系统 统一检索平台 资源注册与调度系统 形成了较为完整的CALIS文献信息服务网络 迄今参加CALIS项目建设和获取CALIS服务的成员馆已超过500家 CALIS检索页面 检索字段的选择 检索词输入框 检索方式的选择 CALIS高级检索页面 检索限制条件 检索字段的选择 简单检索结果页面 检索式 可进一步检索 点击后显示结果 各语种检中结果列表 检索结果列表 输出选择 出版信息 点击Y获得收藏该书的图书馆 作者信息 点击书名获得该书的详细信息 图书网站的网络书目 图书网站分为以下几种 综合类出版信息网站 如中国出版信息网一是图书出版社的网站 如中信出版社二是专门销售图书的网站 如当当网它们都会发布很多图书目录信息 而且这些信息的及时性较强 包括很多关于此类书籍较为完整的信息内容 不失为一种重要的网络书目检索资源 综合类出版信息网站 中国图书出版网中国出版信息网部分知名出版社网站 中信出版社 科学出版社 3 1 2图书全文信息检索 虽然书目包含很多信息 但是远不如图书全文的信息量大 用户要想得到更为详细而具体的信息 就必须获取图书的全文信息资源 网络上图书的全文信息资源可以通过以下几个途径获得 电子图书数据库搜索引擎 电子图书数据库 目前国内能够提供全文图书查询有 方正电子图书 apabi 超星数字图书馆 书生之家 中国数字图书馆电子图书读秀学术搜索 或者 外文电子图书系统 OCLCNetLibrary电子图书Springer在线 图书只有少部分提供全书 可查文摘 Worlde BookLibrary电子图书数据库以超星电子图书为例 进行介绍 超星电子图书 网址 超星数字图书馆是国家 863 计划中国数字图书馆示范工程项目 由北京世纪超星信息技术发展有限责任公司联合国内几十家大型图书馆开发的数字图书馆 与2000年1月在互联网上正式开通 超星数字图书馆是目前全球最大的中文数字图书馆 其数字图书资源涵盖中图法22个大类 内容涉及十几个专业 资源总量已经累计到160多万种 并以每天100多万页的速度递增 超星电子图书镜像网站首页 点击中图法类名右栏出现本类图书 输入书名 作者或关键词快速检索 可以限制更多条件 使检索结果更精确的高级检索 超星电子图书的检索 超星提供了三种图书检索方式 1 按照中图法的类目分类浏览 点击左栏的类名 就会在右栏获得相应类别下的图书 2 快速检索 输入检索词按照书名 作者 主题词检索 3 高级检索 可以同时对书名 作者 主题词和出版年代进行限制 还可以将结果按照出版日期或者书名进行排序 高级检索 图书的浏览与下载 上下翻页 点击书名 点击下面的 下载 选项可保存全文 对文字进行识别 保存为文本格式 关于全文图书数据库要说明的两个问题 一是要想能阅读全文 必须拥有访问的权限 读着可以购买相关服务或者在一些购买此类服务的机构或者图书馆内部来访问 二是在用户计算机上需要事先安装阅读器 由于版权问题 不同厂商的电子图书浏览器只能查看自己生产的电子图书 利用搜索引擎获取全文电子图书 利用搜索引擎获取全文电子图书的方法有两个 一是利用搜索引擎直接检索相关电子图书全文 二是利用搜索引擎自身提供的全文电子图书服务 例如 google图书 和 百度文库 以google图书为例 进行介绍 Google图书 网址 它是google搜索引擎和各个达成合作协议的图书馆和出版商联合推出的一项专门提供在线全文图书资源的主题搜索引擎 用户只需通过该搜索引擎即可完成检索和浏览全文的所有操作 而且其中大部分资源都为免费资源 Google图书主页 检索词输入框 高级检索入口 Google图书高级检索页面 检索限制条件 结果显示的选择 结果显示 点击书名 可获取更详细的信息 需要说明的两点 一是由于版权原因 并非所有图书和图书的所有内容都可以查看原文 而且图书是以图片的方式来提供 因此用户不能直接复制图片中的文字内容 二是借助google搜索引擎的检索功能 用户还可以基于图书中出现的文字来进行全文检索 3 2论文资源检索 相对于图书而言 论文是一种更为重要的学术研究资源 虽然内容可能没有图书成熟和全面 但它的主要特点在于时效性强 便于读者及时了解和跟踪相关领域的最新前沿问题 按照发行的途径不同 论文可以分为期刊论文 会议论文和学位论文三种形式 电子论文可以通过数据库和搜索引擎两种途径来检索获得 3 2 1电子论文数据库检索 主要介绍利用专业数据库进行三种常见电子论文检索方法 分别是期刊论文 会议论文和学位论文的检索 一般而言 这些专业的数据库通常都需要登陆付费才能使用全文浏览和下载功能 期刊论文的检索 目前主要的期刊全文数据库有 中国知网期刊全文数据库重庆维普期刊数据库万方数据资源系统ElsevierSDOSSpringerLink全文期刊检索系统Kluwer期刊全文数据库EBSCOhost全文数据库以中国知网期刊网为例 中国期刊网简介 中国期刊全文数据库隶属于中国知识基础设施工程 CNKI 收录1994年以来国内公开出版的8 200种核心期刊与专业特色期刊的全文 积累全文文献2 200万篇共分十大专辑 理工A 数理力天地生 理工B 化学化工冶金环境矿业 理工C 机电航空交通水利建筑能源 农业 医药卫生 文史哲 政治 军事与法律 教育与社会科学综合 电子技术与信息科学 经济与管理 期刊导航 高级检索 专业检索 初级检索 分类导航 检索结果显示 提供与当前检索词的相似词 与当前检索词的相关词 文献分组排序方式选择 文献浏览排序选择 检索结果显示方式选择 学位论文的检索 学位论文是高等学校和研究机构的毕业生为取得学位资格撰写的学术性研究论文 根据授予学位级别的不同 一般分为学士论文 硕士论文 博士论文 其中博士学位论文有较高的学术参考价值 国内学位论文的检索系统 综合性检索系统中国学位论文文摘数据库 万方 中国优秀博 硕士论文全文数据库 CNKI CALIS高校学位论文库 国外学位论文检索系统 PQDD数据 PQDD博硕论文数据库简介 PQDD博硕士论文数据库是ProQuestInformationandLearning公司产品 它是世界著名的学位论文数据库 收录有欧美1 000余所大学文 理 工 农 医等领域的博士 硕士学位论文 是学术研究中十分重要的信息资源 收录时间 1851 今收录范围 欧美1000多所大学的博 硕士学位论文的题录和文摘 1995年以后的论文可以看到前24页的扫描图像中国购买了PQDD数据库中的部分全文 ProQuest学位论文基本检索 检索词输入框 高级检索入口 学科导航 用户登录界面 高级检索页面 检索字段的选择 检索限制条件 或与非 的选择 ProQuest学位论文基本检索结果 ProQuest学位论文检索详细信息 会议文献 会议文献是指国内外各种学术会议上宣读或交流的论文 报告 会议记录等文献资料 会议文献多以会议录 图书 期刊 科技报告 声像资料等形式发行 会议信息的获取方式有 可以通过中国学术会议在线网获取中文会议信息专业网站和机构了解会议召开计划通过搜索引擎查找 国内检索系统有 中国学术会议论文全文数据库 万方 中国重要会议论文全文数据库 CNKI 中国科技图书情报中心会议论文文摘库 可通过文献传递服务获取全文 会议文献 国外会议专业网站或机构 国外会议专业系统 文摘居多 ISIProceedings ISTP ISSHP 1998 汇集了世界上最新出版的会议录资料 包括专著 丛书 预印本以及来源于期刊的会议论文 提供了综合全面 多学科的会议论文资料 可以看到论文的题录和文摘OCLCProceedings国际学术会议录目录 1993 OCLCFirstsearch中的一个子库 该库可以检索到 大英图书馆资料提供中心 的会议录OCLCPapersFirst国际学术会议论文索引 1993 OCLCFirstsearch中的一个子库 该库收录了世界各地学术的会议论文 它涵盖了英国图书馆文献供应中心的所出版过的会议论文及资料 万方中国学术会议论文文摘数据库 万方中国学术会议论文文摘数据库 中国学术会议论文全文数据库 主要收录1998年以来国家级学会 协会 研究会组织召开的全国性学术会议论文 数据范围覆盖自然科学 工程技术 农林 医学等领域 是了解国内学术动态的必要工具 中国医学学术会议论文文摘数据库是解放军医学图书馆收集建立的医学学术会议文献数据库 该数据库适合各类医学院校 医院 医学图书馆和个人使用 是了解国内医学会议论文及会议信息的重要工具 SPIE 美国光学工程师学会 会议文献数据库收录SPIE的会议文献 内容涉及光学 光子学 成像和电子学领域的研究 工程和应用专业 该数据库是SPIE会议文献的篇名数据库 覆盖SPIE1400卷以后的所有会议文献中的论文 万方中国学术会议论文文摘数据库 数据库选择 检索字段的选择 检索词输入框 时间范围选择 3 2 2搜索引擎的电子论文检索 搜索引擎通常也提供了电子论文的检索和全文下载功能 和专业数据库不一样 这里免费的资源居多 这些电子论文主要来源于期刊论文 会议论文和部分学位论文 也有一些研究报告和技术报告等 在质量和版式上没有专业数据库出版的那样优秀 但仍然是值得好好利用的资源 主要介绍googlescholar GoogleScholar简介 GoogleScholar收录来自学术出版商 专业协会 预印本库和大学等方面的学术信息资源 内容覆盖同行评论的文章 peer reviewedpapers 论文 theses 图书 books 预印本 preprints 摘要 abstracts 技术报告 technicalreports 等学术文献 主要包括学术和技术领域的专业数据库 学术性和技术性出版商的网页 研究机构 通常是大学 的局域网 简单检索界面 高级检索入口 参数设置 帮助 检索词输入框 高级检索界面 检索限制条件 结果显示的选择 3 3专利的检索 专利文献包含了已申请或被确认为发现 发明 实用新型和工业品外观设计的研究 设计 开发和实验成果的有关资料 以及保护权利人的所有有关资料 其主要形式有专利说明书 专利公报 专利文摘 专利索引和专利分类表等 专利信息的检索主要有两种途径 一是专利数据库检索 二是搜索引擎检索 国内综合类专利检索系统主要有 中国知识产权局专利检索系统 3 3 1专利数据库 国外专利检索系统有 美国专利与商标局专利数据库 免费 http parft uspto gov 欧洲专利局专利检索系统 免费 冶金和钢铁专业类检索系统有 冶金专利信息数据库 万方专利数据库 高级检索 经典检索 2020 3 25 专利检索结果 2020 3 25 检索结果排序 二次检索 二次检索 专利分类 组织分类 年份分类 相关检索 专利的详细信息 相关分析 在专利的详细信息页面提供了相关分析 相关专利 系统根据检索表达式推荐相关的专利 点击专利名称可以直接进入专利的详细信息页面 相关论文 系统根据和当前专利相关的论文 点击论文标题 进入该论文的详细信息页面 也可以点击全文下载链接 获取论文 相关检索词 系统根据当前的标准 动态的推荐相关检索词 3 3 2搜索引擎中的专利信息检索 搜索引擎也提供专利信息的检索 而且多以免费方式来提供服务 如 百度专利 以百度专利为例 百度专利搜索主页界面 检索词输入框 在百度专利搜索里检索 钢铁切断机 的相关专利检索结果页面 百度专利搜索查看专利的详细信息页面 标准 标准是对重复性事物和概念所做的统一规定 它以科学 技术和实践经验的综合成果为基础 经有关方面协商一致 由主管机构批准 以特定形式发布 作为共同遵守的准则和依据 简洁地说标准是指对工农业生产和工程建设的产品质量 检验方法和技术要求等方面所做的统一规定 是有关方面应共同遵守的技术依据与准则 标准文献是标准化工作的成果 标准文献主要是指与技术标准 生产组织标准 管理标准以及其它具有标准性质的文件所组成的特种科技文献体系 标准文献的重要性 标准文献是一种重要的科技出版物 通过标准可以了解世界各国的经济政策 技术政策 生产水平 加工工艺水平 标准化水平 自然条件 资源情况等 在科研 工程设计 工业生产 企业管理 技术转让等方面 采用标准化的概念 术语 符号 公式 量值 频率等有助于克服技术交流的障碍 采用国内外先进的标准可改进产品质量 提高工艺水平和技术水平 采用标准可以规范工程质量的鉴定 产品的检验 以标准为依据控制产品指标 统一试验方法等 采用标准可以简化设计 缩短时间 节省人力 减少不必要的试验计算 减少成本 保证产品质量 采用标准可以使企业与生产机构经营管理活动统一化 制度化 科学化和文明化 标准文献的检索可以通过以下几个途径 标准数据库搜索引擎 中文标准数据库 网上中文标准数据库很多 有的是学会与协会办的 有的是各省市 各行业办的 此外有的综合性数据库中包含了标准数据库 如 万方数据库 中有中国标准 国际标准与各国标准 这些数据库大部分需要先注册 后登录 免费检索 检索结果可获得标准题目 标准号 起草日期 颁布日期等 但不提供全文 若想获取全文 必须支付费用 如购买其数据库 或购买阅读卡等方式 下面列出一些可检索标准文献的数据库网址 中国标准咨询网 其它可检索标准文献的数据库网址 中国标准化协会 检索国际与国外标准文献的外文网站 中国标准化杂志 中国标准咨询网 网址 该数据库为国内首家标准全文网站 由北京中工技术开发公司与他人合作建立 产品有标准全文光盘和标准题录光盘 电子版标准全文 收录的标准比较丰富 包括中国标准 国际标准 ISO 国际电工标准IEC 美国标准 ANSI 美国材料与试验学会标准 ASTM 美国机械工程师学会标准 ASME 美国电气与电子工程师学会标准 IEEE 美国保险商实验室标准 UL 英国标准 BS 德国标准 DIN 日本标准 JIS 等 检索方法该数据库提供简单检索与高级检索两种方法 中国标准咨询网首页 标准数据库的查询 标准全文的查询 用户登陆界面 高级检索界面 检索结果页面 查看标准的详细信息 2020 3 25 4 计算机信息检索的基本方法4 1布尔逻辑检索定义 严格意义上的布尔检索法是指利用布尔运算符号连接各个检索词 然后由计算机进行相应逻辑运算 以找出所需信息的方法 它使用面最广 使用频率最高 布尔逻辑检索的基础是逻辑运算 逻辑运算中最常用的是布尔逻辑运算符 即 与 或 非 三种运算符号 用它们可以表示概念之间的逻辑关系 布尔检索的三种逻辑运算符也可以混合使用 比如我们想要检索一款相机的相关信息 要求这款相机可以是传统相机也可以是数码相机 但必须要是长焦的 而且不能事进口的 则针对这个信息需求 我们用布尔检索模型来进行检索 可以构建一下运算式 传统相机OR数码相机 AND长焦 NOT进口 4 2截词算符原因 在英语词汇中 一个词可能有多种形态 如词的单 复数形式的不同 英美拼写方法不同 词性不同等 如果检索时将这类词全部输入进去 会增加检索时间和费用 采用截词法可解决这一问题 所谓截词检索 是指在检索标识中保留相同的部分 用相应的截词符代替可变化部分 检索中计算机会将所有含有相同部分标识的记录全部检索出来 常用 符号表示 4 2 1有限截断 即在检索词后后截几个有限的字母 如名词的单复数 动词的词尾变化等 如输入computer 表示有0 1个字母变化 可检出computer和computers 输入stud 表示截断处有0 3个字母变化 可检出study studies studied studing 4 2 2无限截断 在检索词后加一个 表示该词后可加任意个字符 使用无限截词 所截词根不能太短 否则会输出许多无关文献 造成误检 如 computer 可检出computers computering computered computerization 4 2 3中间截断 在检索词中间加一个或几个 号 主要解决一些英美拼写不同 单复数形式的不同的词的输入 可简化输入 如 输入wom n可检出woman women 4 3加权检索加权检索是某些检索系统中提供的一种定量检索技术 加权检索同布尔检索 截词检索等一样 也是文献检索的一个基本检索手段 但与它们不同的是 加权检索的侧重点不在于判定检索词或字符串是不是在数据库中存在 与别的检索词或字符串是什么关系 而是在于判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度 加权检索的基本方法是 在每个提问词后面给定一个数值表示其重要程度 这个数值称为权 在检索时 先查找这些检索词在数据库记录中是否存在 然后计算存在的检索词的权值总和 权值之和达到或超过预先给定的阈值 该记录即为命中记录 运用加权检索可以命中核心概念文献 因此它是一种缩小检索范围提高检准率的有效方法 但并不是所有系统都能提供加权检索这种检索技术 而能提供加权检索的系统 对权的定义 加权方式 权值计算和检索结果的判定等方面 又有不同的技术规范 4 4引文索引检索4 4 1引文的定义 据各种图书情报学专业词典的解释 引文 citations 一是指引用资料 即在一个著作中引用其他作品的片段内容或他人所发明的定义定理 二是指参考文献 bibliographicreferences 是指为撰写或编辑论著而引用或参考的有关文献资料 通常附在论文 图书或每章 节之后 有时也以注释 附注或脚注 形式出现在正文中 国家标准 文后参考文献著录规则 2005年修订版的定义则为 文后参考文献 为撰写或编辑论文和著作而引用的有关文献信息资源 中国图书情报界及学术界普遍接受这种解释 4 4 2引文索引检索的优越性引文索引是将来源文献 发文 和被引文献 引文 按照引证和被引证的关系进行编制的二次文献 它把一篇论文通过引文的关系 与其他论文联系起来 在不同的论文作者之间建立起学术联系 从而形成一个庞大的资料库 不仅提供一般数据库的检索功能 还提供了从引文途径检索文献的方法 相比一般的检索方法 引文索引检索有其独特的优越性 1 引文数据库所录入的数据客观地记录了科学发展进程中研究论文的情况 反映出人类科学研究中历史的记载与现实研究之间继承与发展的关系 从中可以追溯学科知识的进化 揭示学科发展过程 2 国内的文献数据库大多为浅标引 每篇文献只有3 5个主题 关键 词 许多重要内容不一定都能在检索词中标引出来 靠一般检索就难以查到 若这些内容被其它文献所引用的话 通过引文索引就可能获得 3 引文数据库比一般文献题录数据库具有更多的检索功能 如按刊名 卷期 机构名 地区 基金项目 年代 出版社和杂志社等进行检索 可以了解论文被引用次数 引用期刊种数和引用作者人数 从而对论文做出定量化的评价 4 引文所联系的学科范围广 因为在进行学术研究中 经常会从其他学科中的期刊论文中吸收有价值的思想和方法 用于解决本学科的实际问题 这就是学科交叉行为 学科交叉是学术研究中必然出现的 而通过引文可以揭示学科之间相互的影响和渗透 5 只要选好一篇论文或发现在某一主题或专题下难以用有限的关键词表述的相关文章 即可进行查询工作 便于不熟悉分类体系和主题词表的用户使用 引文检索体系不仅可以从文献引证的角度评估文章的学术价值 还可以迅速方便地组建研究课题的参考文献网络 在进行科研课题检索时 虽不宜单独使用引文法 但对一个完善的课题设计方案来说 引文法已不可或缺 因其可以从文献的引证关系角度来提供检索途径 这样不仅能揭示某个课题某一时期的进展情况 而且可以把该课题的过去 现在 未来的信息连到一起 课题检索使用引文法 一般可与题录型检索工具结合 采用综合检索法 4 4 3几种常见的引文数据库1 WebofScience 1997年 ISI推出了引文索引的网络版 WebofScience 简称WOS 囊括三大引文数据库 SCI SSCI和A HCI 和两个化学数据库 CCR IC 以ISIWebofKnowledge作为检索平台 WebofScience充分利用了InternetWeb技术 将传统的引文索引与先进的Web技术相结合 使其检索功能更加强大 便捷 准确和全面 2 中国科学引文数据库 ChineseScienceCitationDatabase CSCD 该数据库由国家自然科学基金委员会和中国科学院共同资助 中国科学院文献情报中心承建开发 创建于1989年 CSCD是一个集多种功能为一体的综合性数据库 数据库编制全面参照美国 科学引文索引 SCI 的编制体系 因此被称为中国的SCI 来源期刊为我国各学科领域具有权威和代表性的重要核心期刊和优秀期刊千余种 分核心库和扩展库 CSCD收录的学科范围有 数学 物理学 力学 化学 天文 地球科学 生物学 农林科学 医药卫生 工程技术 环境 管理科学等 其中医药卫生收录有38万余条 CSCD可提供被引著作 被引文献 被引书刊 来源著者 第一著者 关键词 著者机构 第一机构 来源期刊 文章题名 省市地区 实验室等12种检索途径 是我国科学文献计量和引文分析研究的重要工具 具有很高的权威性 3 中国科技论文与引文分析数据库 CSTPC CSTPI 该数据库由中国科技信息研究所研制 集文献检索 引文与论文统计分析于一体 数据库通过定量和定性方法 收录了我国各学科期刊3800多种 且每年做出调整 该研究机构自1988年以来 每年发布年度研究报告 并对国内期刊论文的引文进行统计分析工作 编辑出版 中国科技期刊引证报告 客观地反映全国科技队伍和科技力量的地区分布情况 发展速度 历史进程和走势 是我国第一个从事科学计量学和文献计量学理论研究与应用 并向社会提供相关咨询和定期发布统计研究报告的专门机构 具有政府权威性 因此也备受研究人员和科技管理部门的重视 4 5模糊检索又称概念检索 当我们输入一个检索词时 搜索引擎不仅反馈包括了该关键词的网址 同时也发来与关键词意义相近的内容 比如 我们查找 查询 一词时 模糊检索会反馈来包含了 查询 查找 查一查 寻找 搜索 等内容的网址 反馈网址的排列 一般是完全符合关键词的在最前边 其次是相近的 现在大多数搜索引擎都有这种功能 只是模糊的程度不同 4 6位置算符检索位置算符是表示检索词之间位置关系的一种运算符 由于英文对一句话有多种表达方法 写法可能不同 如 GPS在铁路桥研究中的应用 这个课题 用英文表达可能是 UsingofGPSinRailwayBridge 也可能是 UsingofGPSinBridgeofRailway 因而可能编制出这样的检索式 GPSAND Railway 2N Bridge 我们可以通过位置检索提高检索的准确率 4 6 1 W 算符与 nW 算符W是word与with的缩写 特点 W词序不变 中间不可插词 但两词间可有一个标点 连字符或空格 nW词序不变 中间可插入N个词 如 potential w energy可能检出potentialenergyandfunction如 gone 2w wind可能检出gonewiththewind4 6 2 N 与 nN 算符N是near的缩写特点 N词序不限 中间不可插词 但两词间可有一个标点 连字符或空格 nN词序不限 中间可插入N个词 如 econom 2N recovery可能检出economicrecovery recoveryoftheeconomy 4 6 3同字段检索A F B F是field的缩写 特点 A B两词必须出现在同一字段中 词序与词量不限 如 environment F impact DE 表示两个词必须同时出现在叙词字段内 4 6 4同句检索A S B S是sentence的缩写 特点 A B出现在同一自然句中 子字段 其词序与词量不受限制 如 electric S plant可检出electricpowerplants如 EI中的NEAR PQDD中的W n 两词间距小于n个单词 且前后位置任意 Pre n 两词间距小于n个单词 且前后位置一定 4 7字段限制检索组成数据库的最小单位是记录 一条完整记录中的每一个著录事项为字段 献书目型数据库的记录基本包括下列字段 1 存取号字段 AN AccessNumber 这是计算机检索系统为每个数据库的每篇记录规定的能被计算机识别的特定号码 在同一数据库中 每篇文献记录只有一个存取号 2 篇 题 名字段 TitleField TI 3 文摘字段 AbstractField AB 4 叙词字段或受控词字段 DestriptorField DE 或ControlledtermField SU 这一字段是标引人员给文献标引的反映其主题概念的词 这些词来自规范化的词表 也称主题词 5 自由词字段或非受控词字段 IdentifiedField ID KeywordField KY UncontrolledtermField 这一字段也是标引人员给文献标引反映其主题概念的词 但这些词不是规范化词表中的词 6 著者机构子段 corporatesource CS或AF 7 刊名字段 journal JN或ST 8 出版年子段 publication year PY 9 文献类型子段 documenttype DT或TY 10 语种子段 language LA 11 分类号子段 classification CC 注意事项 作者检索的缩写形式 在SCI中 姓 全称 空格名 首字母并且连写 如 LIDR GONGJY 在EI中 姓名 全称 中文 姓 全称 名 缩写 机构检索中 SCI中有多个作者单位 在同一字段中EI只收入第一作者的单位 多字段检索时要选所有字段 allfield 4 8括号检索用于改变运算的先后次序 括号内的内容做优先运算 用 可以表示优先级 如比较 GPSORGIS ANDChinaGPSORGISANDChinaEI中的表示方法 RelevanceAND AalbersbergwithinAU OR coolwithinAU 4 9短语检索即精确检索短语用 表示 检索出与 内形式完全相同的的短语 以提高检索的精确度和准确度 4 10自然语言检索直接采用自然语言中的字 词 句进行提问式检索 同一般口语一样 这种基于自然语言的检索方式又被称为 智能检索 适合不太熟悉网络信息技术的人员使用 支持自然语言检索的有中文的悠游 英文的AltaVista Excite Infoseek HotBot AskJeeves等 4 11多种语言检索提供多种语言的检索环境供用户选择 系统按用户选定的语种进行检索并反馈结果 支持多语种检索的如 中文天网 英文AltaVista Google等 4 12字母大小写检索如果用户的检索式用小写字母表示 搜索工具既匹配大写又匹配小写 如 china 瓷器 china 中国 如果用大写字母表示 搜索工具认为用户指定了只要大写 就只会查找那些与用户键入的输入形式完全相同的结果 如 china 只检索出china AltaVista等搜索引擎支持区分大小写的检索 扩检与缩检在实际的检索过程中 用户在检索结果的基础上可能又有新的发现 并进而产生进一步检索的要求 这两种情况都要求在原来检索结果的基础上采取扩检或缩检的措施 使检索结果尽可能达到预期的检索效果 下面就简要归纳下计算机信息检索可以采取的扩检和缩检的措施 5检索过程的控制 5 1扩检措施对查全率要求较高的检索课题 检索过程的控制主要从扩检入手 5 1 1选用多个检索系统 工具 或同一检索系统中的多个数据库 文档 因为不同的检索系统有不同的收集范围和准则 选用多个检索系统 虽然检索结果重复现象增多 但查全率也会相应提高 对于同一学科领域的不同方面或不同范围的数据 有的检索系统采用不同的数据库或文档来组织 5 1 2降低检索词的专指度 尤其对于采用受控语言检索的系统 可以从系统词表 主题分类表 叙词表等 中或命中文献中选一些上位词检索或者在上位类目中检索 受控语言是根据情报检索的需要而创制和不断改进的 其发展过程是从分类语言 标题语言 叙词语言 到为实现自然语言检索而设计的后控制语言等 分类标识能提供族性检索 有利于扩检和缩检 从而实现不同范围内的查全 5 1 3调节检索提问表达式的网络度 可以删除某个不重要的概念组面 例如 在 不锈钢的加工 这一检索课题中 有两个概念组面 不锈钢 stainlesssteelorrustlesssteel 和 加工 machiningorprocess 当用完整的检索提问表达式 stainlesssteelorrustlesssteel AND machiningorprocess 在数据库中检索时 如果没有相匹配的结果或者检索的结果不理想 这时可以去掉一个概念组面 加工 即采用提问表达式stainlesssteelORrustlesssteel进行检索 5 1 4采用截词检索截词的形式通常有前方一致 后方一致和中间一致 有的检索系统提供了截词检索功能 运用这样的检索系统从事网络信息检索时可以采用系统规定的截词算符将某一单元词可能构成的全部复合词进行检索 这肯定有助于增加命中文献的数量 当然 另一方面 采用截词检索也可能导致大量误检 5 1 5利用布尔逻辑 或 连接同义词 近义词或词的不同拼写形式 即增加用 OR 逻辑连接的相关检索词 在人类语言中词的同义关系普遍存在 有的研究人员将这种同义关系归纳为8种类型 它们是 同义词之间的关系 如义务教育和普及教育 俗称与学名之间 如西红柿和蕃茄 旧称与新称之间 如钶与铌 简称与全称之间 如鄂与湖北 同一产品的命名 绰号与型号之间 如 熊猫 飞机与F 14飞机 不同译名之间 如公共小汽车与巴士 逻辑代数与布尔代数 不同拼写形式之间 如鱼具与渔具 color和colour catalog和catalogue 倒置词序与自然词序的词组之间 如 数学 初等 与 初等数学 5 1 6增加检索途径用户可尽可能地利用检索系统所提供的各种检索途径 如题名 作者 出版者 关键字或词 以及其它有检索意义的单元 有的系统还提供了各种检索途径的逻辑运算 如中国期刊网的高级检索功能提供了篇名 作者 关键词 全文 机构 中文摘要 引文 基金 中文刊名 年 期等几乎所有可能的检索途径 并且提供了任意四种检索途径的逻辑运算 AND和OR 5 1 7取消某些过严的限制 适当使用关键字或词在标题 文摘 甚至全文中查找 例如中国期刊网 如果使用关键字或词在关键词字段中检索 效果不理想 可以考虑使用同样的关键字或词在篇名 中文摘要 甚至全文中检索 5 1 8分层次进行检索将要求检索的内容分析为不同层次及同一层次的不同方面 然后从这几个层次和方面分别进行检索 再对各层次检出的文献进行分析 综合 得出完全相关的文献 5 2对查准率要求较高的检索课题 检索过程的控制主要从缩检入手 5 2 1提高检索词的专指度 如果说降低检索词的专指度可以增大检全率的话 提高检索词的专指度自然会提高检准率 5 2 2提高检索提问表达式的网络度 通常的做法是在检索提问表达式中增加概念组面 例如 不锈钢的加工 这一课题的检索中 如果在相应的数据库中检索 使用一个概念组面 输入检索提问表达式 stainlesssteelorrustlesssteel 命中记录条数繁多或者其检索结果与不锈钢的加工方面相关的文献很少 就可以使用两个概念组面 输入检索提问表达式 stainlesssteelorrustlesssteel AND machiningorprocess 就可以减少命中记录条数 提高专指度 从而提高查准率 5 2 3 增加概念进行限制 用逻辑乘连结主题词来限定主题概念的相关检索项 利用NOT限制一些不相关的概念 用AND连接的两个检索词表示这两个检索词必须同时出现在结果中才满足检索条件 检索式AandB所表达的复合概念相当于包含检索词A的结果集与包含检索词B的结果集的重叠部分 而用NOT连接的两个检索词表示应从第一个概念中排除第二个概念才满足检索条件 检索式AnotB所表达的复合概念相当于包含检索词A的结果集中不包含检索词B的结果集的部分 很显然 这样的限定或连接可以缩小检索范围 5 2 4利用某些检索系统所提供的限定检索功能这是计算机情报检索系统广泛采用的一种检索方法 它可以缩小检索范围 减少无关信息的输出 从而实现缩检的目标 5 2 5利用某些检索系统提供的二次检索功能例如在中国期刊网中检索 不锈钢的加工 方面的文献 我们先输入不锈钢 检索的出来的文献有85633条 再输入 加工
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安全教育的培训反思课件
- 废弃房屋改造工程方案(3篇)
- 2025年度医护人员针对性普法知识考试题库及答案(共十套)
- 冬泳基地修缮工程方案(3篇)
- 牧场疫情防疫安全培训课件
- 农业产业强镇资金申请政策与农业产业链延伸报告
- 2025年工业互联网平台数据备份恢复策略的产业链创新驱动模式
- 高考加油信范本
- 社交媒体营销协议分享
- 社区预算推广方案设计
- 白内障囊外摘除联合青光眼人工晶体植入术后护理查房
- 2025年《临床输血技术规范》
- 2024年内蒙古中国神华煤制油化工有限公司招聘真题
- 减糖与健康口腔课件
- 新时代学校思想政治工作评价机制研究
- 2025秋统编版(2024)道德与法治二年级上册第四单元《第16课 祖国 我为您自豪》教学设计
- 消防维保质量管理及保证措施
- 2025年上海市(秋季)高考语文真题详解
- 品牌沙龙活动策划方案
- 子宫肌瘤的治疗与护理
- 传统文化公司管理制度
评论
0/150
提交评论