政务信息管理_第1页
政务信息管理_第2页
政务信息管理_第3页
政务信息管理_第4页
政务信息管理_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第5章 政务信息检索,学习重点,本章学习重点主要有:正确理解并掌握信息检索(主要是文本信息检索)的主要技术与方法;了解并熟悉信息检索操作的基本流程;了解相关的政务信息检索工具/系统,并能在实际工作中适时熟练地加以使用,引子,工欲善其事,必先利其器 -论语,所谓“信息检索”,广义地说,是指将信息按照一定的方式组织和存储起来,并能根据信息用户的需要找出其中相关信息的过程。因此,从本质上讲,信息检索是一种有目的和组织化的信息存取活动,其中包括了“存”和“取”两个基本环节,5.1 信息检索概述,5.1.1 信息检索的基本概念,5.1.2 信息检索的基本原理,我们可以把信息检索的基本原理抽象、概括为一句

2、话:对信息集合与需求集合的匹配与选择,一般认为,以印刷文献为检索对象的手工检索操作,成熟于19世纪30年代,从那时到现在,信息检索经历了巨大的变化与发展。特别是最近50年来,计算机作为一种基本信息处理工具的出现及其在信息检索领域的成功应用,更使得信息检索领域的面貌发生了根本性的变化,5.1.3 信息检索的发展简史,简单回顾信息检索的发展与变化,可以把它的进步历程划分为以下3个不同的历史阶段,手工检索阶段(1830s-1970s,计算机化检索阶段(1950s-1990s,网络化检索阶段(1990s-,5.2 信息检索的主要技术与方法,5.2.1 基本信息检索技术,1)布尔检索,布尔检索是各类检索

3、工具提供的一种最基本的检索方式。通常,用户在检索时需要使用不同的布尔逻辑运算符号把检索词与检索词连接起来,以较为准确地表达检索要求。主要的布尔逻辑运算符号有以下三种,布尔逻辑与(and,布尔逻辑或(or,布尔逻辑非(not,所谓截词检索,是指在检索时使用词的一个局部(某些位置上的字符被截去)进行检索匹配,并认为凡满足这个词局部中的所有字符要求的记录,都为命中结果。截词检索需要使用专门符号(截词符),以指定截词的具体位置与截断字符的数量。 按照截词位置的不同,截词检索分为右截词、左截词和中间截词三种,2)截词检索,3)短语检索与位置检索,短语检索是一种固定词组检索。通常,在检索屏幕上选择【短语检

4、索】或【Phrase Search】等按钮,或者使用双引号( “ ” )将多个检索词引起来,就可实施短语检索,位置检索比短语检索要来得灵活、富于变化。一般地,按照对各检索词之间应满足的位置关系要求的不同,可以有多种不同类型的位置检索,例如邻近检索、同句检索、同字段检索等,其中以邻近检索最为多见,4) 限制检索,限制检索的目的主要也是为了提高检索的准确率。信息检索系统的限制检索技术一般是通过限制检索词在命中结果记录中的出现位置(主要指记录的不同字段位置)来实现的,这种限制检索技术也因此称为“字段检索,1)导航与浏览 传统的信息检索方式是通过提供能表达检索要求的关键词,在数据库索引文档进行快速匹配

5、而直接地获取检索结果,这种方式一般也称为“查询”(searching)。现在,查找和发现信息还可以通过“浏览”(browsing)方式来实现,5.2.2 新兴信息检索技术,2)自然语言检索,自然语言检索是指用户在检索时,可通过检索界面输入用自然语言表达的检索要求,检索系统会按照提问语句检索出用户需要的有关信息,3)相似检索,在检索过程中,人们有时会发现检索结果中某个结果非常符合自己的需要,希望能依此为根据或线索,进一步检索到与该结果类似的新的信息。目前,很多搜索引擎都提供这样的检索功能,并称之为“相似检索,5.2.3 其他相关与辅助检索技术,1)检索结果的排序输出,2)检索结果的可视化,3)检

6、索结果的翻译,4)其他 区分大小写检索 繁简体汉字转换 中英文混合检索,5.3 政务信息检索的基本流程,5.3.1 分析用户的信息检索请求,1) 明确检索目的,2)检索请求的内容特征分析,3)检索请求的形式特征分析,5.3.2 了解检索工具/系统的基本情况,检索工具或检索系统的研制者情况; 检索工具或数据库的收录范围; 数据库的标引处理规则及所使用的词表; 工具或系统提供的主要检索途径及相应功能,用户的信息检索请求经过深入分析而形成比较准确、完整的表达之后,接下来就进入相关检索工具/系统的选择。在对众多检索工具/系统全面了解的基础之上,确认本次检索所要使用的对口工具/系统(一个或多个),进一步

7、地,还需要对选中的工具/系统进行详细了解,具体包括,所谓“检索策略”,是指为实现检索目标而制定的全盘计划和方案,是对整个检索过程的谋划和指导。利用手工检索工具进行检索时,检索策略一般存在于检索者头脑中,并可在检索过程中根据不同情形随时进行调整,因此手工检索的检索策略问题一般较少受到重视。但是,对于各种联机查询操作,由于检索匹配操作是由计算机程序来控制、执行,检索者与具体的检索过程是分离的,因此,事前制定适宜的联机检索策略,对一次成功的联机查询是非常重要的,5.3.3 制定检索策略,常用的联机检索策略主要有,1)搭积木式,2)滚雪球式,3)剥竹笋式,5.3.4 拟定并执行具体检索步骤,在已经制定

8、的检索策略的指导与控制下,针对一个特定的用户查询要求,具体的检索操作步骤主要有,选择并输入检索词,选择检索词的组配连接符号,例如布尔算符、截词符、位置算符、括号等,初步浏览检索结果,选择检索路径,使用合适的相关反馈调整方法,对检索结果进行优化,通过执行具体的检索操作并获得了用户比较满意的检索结果后,在检索结果的界面屏幕上,大多数检索系统一般还提供有一系列功能选项或按钮,用以帮助用户整理检索结果,并最终得到真正能为用户方便使用的结果集合。比较常见的检索结果整理或后处理功能主要包括: (1)输出或显示格式的选择 (2)排序方式的选择 (3)处理方式的选择 (4)原始文献获取方式的选择,5.3.5

9、获取并整理检索结果,一次完整的信息检索作业的最后环节是对本次检索进行分析与评价,主要涉及以下一些方面的内容,5. 3. 6 分析评价检索操作与检索结果,检索结果分析,检索系统功能的评价与认识,检索中存在的主要问题,数据库检索系统是目前电子信息资源检索的主要工具。通常,检索系统中提供检索的数据库产品都是由某个数据库生产商加工、生产和销售的,根据载体的不同又分有光盘版、网络版(Web版)等不同版本。为了赢得市场,在信息服务业占据竞争优势,数据库生产商对其产品的质量有严格的要求,收录进数据库的相关信息一般经过人工的筛选和控制,因此,不论是存储信息的可靠性、累计性与学术性,还是查询信息时的便利性,数据

10、库检索系统都能很好地满足用户的要求。也正是因为如此,一般地,数据库检索系统的使用需要支付一定的费用,5.4 常用政务信息检索工具/系统,UnCover数据库检索系统,UnCover是美国CARL(Colorado Alliance of Research Libraries)公司的主要产品之一。该数据库建立于1988年,是目前世界最大的期刊数据库之一,到目前为止,收录期刊18000余种,拥有期刊文献700多万篇,并且还在以每天5000篇的速度不断更新和扩充,UMI数据库检索系统,该数据库系统由美国著名的数据库公司UMI制作,包括学术期刊图书馆、博硕士论文数据库等,OCLC FirseSerac

11、h数据库检索系统,FirseSerach数据库检索系统是OCLC于1991年推出的基于WWW的信息检索服务产品。该系统包含80多种不同的数据库产品,涉及众多学科和专业,Academic Universe-LEXIS-NEXIS学术大全数据库检索系统,美国LEXIS-NEXIS公司创始于1973年,其数据库内容涉及新闻、法律、政府出版物、商业信息、及社会信息等,其中法规法律方面的数据库是LEXIS-NEXIS的特色信息源,具有非常大的影响力,尤其在法律业界具有很高知名度,GPO-美国政府出版物数据库主要报道与美国政府相关的多个方面的文件,具体包括:国会报告、国会意见听证会、国会辩论、国会档案、法

12、院资料以及由美国具体实施部门出版发行的文件,数据库包含的内容范畴是与美国政府有关的所有相关主题。时间上覆盖了从1976年以来的资料,GPO-美国政府出版物数据库检索系统,中国期刊网(http:/) 中国期刊网是中国知识基础设施工程(CNKI)的重点项目之一,由清华大学中国学术期刊(光盘版)电子杂志社研制,1999年开通运行,中文期刊数据库 中文期刊数据库是重庆维普资讯公司的产品,分有题录文摘版和引文索引版,最早以光盘形式提供服务,九十年代后期与著名中文搜索引擎悠游合作推出中文期刊咨询网(http:/),目前可以通过该网站免费访问使用,人民大学书报资料中心复印报刊资料全文数据库(1995-) 该

13、光盘数据库所包含的内容为人大书报资料中心精选全国各报刊上所发表的人文社会科学论文的全文资料。每年有四张盘,其中马列、哲学、社科总论、政治、法律一张盘,经济一张盘,文化教育体育一张盘,语言、文学、艺术、历史、地理及其他一张盘。 中文社科报刊篇名数据库(1993-) 中文社科报刊篇名数据库(1993-)是由上海图书馆制作的,其印刷型检索工具即为大家熟悉的全国报刊索引(社科部分,中国资讯行-中国中央及地方政府机构库,中国资讯行有限公司1995年成立于香港。多年以来,中国资讯行一直致力数据库存量建设,目前,无论以内容还是数量计,皆被公认为中国数据库服务领域的权威,已拥有三百多万篇资料,内容涉及经济、商

14、业、科技及政府数据,5.4.2 网络搜索引擎,Google http:/ AltaVista http:/ NorthernLight http:/ Yahoo! http:/ Excite http:/ 新浪 http:/ 搜狐 http:/ 悠游 http:/ 网易 http:/ 百度 http:/,本章小结,本章共设有4节内容。在第一节,首先对信息检索的基本概念与信息检索的基本原理进行介绍、解释与阐述,然后简单回顾了信息检索的发展历史。第二节结合当前流行的信息检索技术,分别举例说明各种主要技术方法的使用。在此基础上,第三节内容以政务信息检索为应用领域,对政务信息检索流程进行了较为详细的剖

15、析。最后一节配合检索案例,对一些常用的政务信息检索系统或工具进行了介绍和说明,思考与练习题,1. 什么是信息检索? 它有哪些主要类型? 2. 信息检索的基本原理是什么? 3. 信息检索技术主要经历了哪些不同发展阶段? 4. 试分析查询和浏览两种信息检索方式各自的适用情形。 5. 什么情况下需要扩大检索结果? 有哪些具体方法或措施? 6. 什么情况下需要缩小或约束检索结果? 有哪些具体方法或措施? 7. 请举例说明一次比较完整的政务信息检索操作流程。 8. 结合自己的工作需要或学习兴趣,利用多种主要的中英文搜索引擎对某一特定的政务信息管理专题进行较为全面的网络信息检索,并整理检索结果。能否据此再

16、写作出一篇具有一定深度的研究报告或综述论文,9. 尝试使用合适的检索工具或系统,完成以下信息检索请求: (1) 英国是世界上最早建立国家公务员(文官)制度的国家。请查找相关文献,了解撒切尔夫人上台后对英国文官制度进行改革的具体措施。 (2) 我国改革开放以来制定了许多行政法规,为依法行政提供了前提和依据。请查找这些法规的名称与基本内容。 (3) 西方国家普遍建立有行政咨询组织或系统,它们或独立研究国家公共政策,或承担政府部门委托的咨询任务,为政府提供咨询服务。请查找介绍美国著名咨询机构“兰德公司”或“基辛格国际咨询公司”的有关文献资料。 (4) 香港特别行政区政府自1997年7月1日成立以来,已顺利渡过了它的第一个五年执政期。请

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论