胡林峰V200841155_第1页
胡林峰V200841155_第2页
胡林峰V200841155_第3页
胡林峰V200841155_第4页
胡林峰V200841155_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、论文题目:计算机检索程序、步骤学生姓名:胡林峰学号:V200841155指导老师:谈发堂专业班级:2008模具设计与制造1班完成时间:2010年6月30号华中科技大学科技文献检索与写作题目:计算机检索程序、步骤 1计算机信息检索的原理 计算机信息检索是指利用计算机存储和检索信息。具体地说,就是指人们在计算机或计算机检索网络的终端机上,使用特定的检索指令、检索词和检索策略,从计算机检索系统的数据库中检索出所需的信息,继而再由终端设备显示或打印的过程。为实现计算机信息检索,必须事先将大量的原始信息加工处理、以数据库的形式存储在计算机中,所以计算机信息检索广义上讲包括信息的存储和检索两个方面。 计算

2、机信息存储过程是:用手工或者自动方式将大量的原始信息进行加工,具体做法是将收集到的原始文献进行主题概念分析,根据一定的检索语言抽取出卞题词、分类号以及文献的其他特征进行标识或者写出文献的内容摘要。然后再把这些经过“前处理”的数据按一定格式输入计算机存储起来,计算机在程序指令的控制下对数据进行处理,形成机读数据库,存储在存储介质(如磁带、磁盘或光盘)上,完成信息的加工存储过程。 计算机信息检索过程是:用户对检索课题加以分析,明确检索范围,弄清卞题概念,然后用系统检索语言来表示卞题概念,形成检索标识及检索策略,输入到计算机进行检索。计算机按照用户的要求将检索策略转换成一系列提问,在专用程序的控制下

3、进行高速逻辑运算,选出符合要求的信息输出。计算机检索的过程实际上是一个比较、匹配的过程,检索提问只要与数据库中的信息的特征标识及其逻辑组配关系相一致,则属“命中”,即找到了符合要求的信息。如图所示。2计算机信息检索的步骤 进行计算机信息检索,一般来说要经过以下基本程序:分析检索课题,选择检索系统及数据库,确定检索词,构建检索提问式,上机检索并调整检索策略,输出检索结果。2. 1分析检索课题 利用计算机信息检索系统获取文献信息的用户,一般分为直接用户和间接用户两种类型。直接用户是指最终使用获得的信息进行工作的用户(如科研人员,竹理者,决策者等);间接用户是指专门从事计算机检索服务的检索人员。检索

4、人员在接到用户的检索课题时应首先分析研究课题,全面了解课题的内容以及用户对检索的各种要求,从而有助于i1:确选择检索系统及数据库,制定合理的检索策略等。分析检索课题时应从以下儿方面进行:(1)弄清用户信息需求的日的和意图;2)分析课题涉及的学科范围、卞题要求;( 3)课题所需信息的内容及其特征;( 4)课题所需信息的类型,包括文献类型、出版类型、年代范围、语种、著者、机构等; 5)课题对查新、查准、查全的指标要求。2. 2选择检索系统和数据库 在全面分析检索课题的基础上,根据用户要求得到的信息类型、时间范围、课题检索经费支持等因素综合考虑后,选择检索系统和数据库。i1:确选择数据库,是保证检索

5、成功的基础。选择数据库时必须从以下儿个方面考虑:(1)数据库收录的信息内容所涉及的学科范围;( 2)数据库收录的文献类型、数量、时间范围以及更新周期;( 3)数据库所提供的检索途径、检索功能和服务方式。2. 3确定检索词 检索词是表达文献信息需求的基本元素,是计算机检索系统中进行匹配的基本单元。检索词选择正确与否,直接影响着检索结果。在全面了解检索课题的相关问题后,提炼卞要概念与隐含概念,排除次要概念,以便确定检索词。检索词的确定,一般有以下儿种方法: (1)先选用主题词。当所选的数据库具有规范化词表时,应优先选用该数据库词表中与检索课题相关的规范化卞题词,从而可获得最佳的检索效果C (2)选

6、用数据库规定的代码。许多数据库的文档中使用各种代码来表示各种卞题范畴,有很高的匹配性。例如,世界专利文摘数据库中的分类代码,化学文摘数据库中的化学物质升记号。 ( 3)选用常用的专业术语。在数据库没有专用的词表或词表中没有可选的词时,可以从一些己有的相关专业文献中选择常用的专业术语作为检索词。 ( 4)选用同义词与相关词。同义词、近义词、相关词、缩写词、词形变化等应尽量选全,以提高查全率。2. 4构建检索提问式 检索提问式是计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符、截词符以及系统规定的其他组配连接符号组成。检索提问式构建得是否合理,将直接影响查全率

7、和查准率。构建检索提问式时,应准确运用逻辑组配运算符: (l)使用逻辑“与”算符可以缩小命中范围,起到缩检的作用,得到的检索结果专指性强,查准率也就n。 (2)使用逻辑“或”算符可以扩大命中范围,得到更多的检索结果,起到扩检的作用,查全率也就高。 ( 3)使用“非”算符可以缩小命中范围,得到更切题的检索效果,也可以提高查准率,但是使用时要慎重,以免把一些相关信息漏掉。 另外,在构建检索提问式时,还要注意位置算符截词符等的使用方法,及各个检索项的限定要求及输入次序等。2. 5上机检索并调整检索策略 构建完检索提问式后,就可以上机检索了。检索时,应及时分析检索结果是否与检索要求一致,根据检索结果对

8、检索提问式作相应的修改和调整,直至得到比较满意的结果。 (1)检索结果信息量过多。产生检索结果信息量过多的原因可能有以下两点:一是卞题词本身的多义性导致误检;一是对所选的检索词的截词截得太短。在这种情况下,就要考虑缩小检索范围,提高检索结果的查准率。调整检索策略的方法如下: 咸少同义词与同族相关词; 廖曾加限制概念,采用逻辑“与”连接检索词; 倒吏用字段限定,将检索词限定在某个或某些字段范围; a吏用逻辑”非”算符,排除无关概念; 回周整位置算符,由松变严。 (2)检索结果信息量过少。造成检索结果信息量少的原因有以下儿点:首先,选用了不规范的主题词或某些产品的俗称,商品名称作为检索词;其二,同义词、相关词、近义词没有运用全;其三,上位概念或下位概念没有完整运用。针对这种情况,就要考虑扩大检索范围,提高检索结果的查全率。调整检索策略的方法如下: 选全同义词与相关词并用逻辑”或”将它们连接起来,增加网罗度; 咸少逻辑“与”的运算,丢掉一些次要的或者太专指的概念; C去除某些字段限制; 回司整位置算符,由严变松。2. 6输出检索结果 根据检索系统提供的检索结果输出格式,选择需要的记录以及相应的字段(全部字段或部分字段),将结果显示在显示器屏幕上、存储到磁盘或直接打印输出,网络数据库检索系统还提供电了邮件发送,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论