哈师大信息检索复习资料_第1页
哈师大信息检索复习资料_第2页
哈师大信息检索复习资料_第3页
哈师大信息检索复习资料_第4页
哈师大信息检索复习资料_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.信息的特性:信息的最基本特征:普遍性,客观性,流动性与传递性,无限性,可度量性, 依附性。衍生特征:多样性与综合性,相对性与有效性,积累性与价值性,共享性, 异步性,不完全性,污染性。客观性:信息不是物质,也不是能量,是客观事物运动、变化特征与规律的 客观描述,信息统一于物质世界,其根源是物质世界,它与整个世界共存。2.填空文献既不是知识本身,也不是记录知识的物质载体本身,而是两者的 结合,即:文献=知识+载体。3简答信息、知识、情报、文献四个概念的关系:信息是广泛存在于自然 界、人类社会、人类思维之中的事物普遍联系方式;知识是人类社会中经过人类 加工的系统化信息,情报尽管不全部是知识,但

2、绝大部分的情报表现为运动着、 传递着的知识;文献则是记录人类信息、知识、情报的一切载体。4名词信息检索的概念:广义的信息检索是指将信息按一定的方式组织和 存储起来,再根据信息用户的需要找出有关信息的过程。它包括信息的存储和检 索两个过程。信息存储是对信息进行收集、标引及著录,并加以有序化编排,编 制信息检索工具的过程;信息检索是从大量的信息中查找出拥护所需的特定信息 的过程。广义的信息检索主要是面向信息工作者而言的。狭义信息检索仅指信息的检索过程,即信息用户根据自己的需要,利用信息检索 工具,在信息集合中查找出所需要的信息的过程。也就是我们平常所说的信息查 索。5文献检索:是以特定的文献为检索

3、对象,包括全文、目录、索引、文摘、题 录等;检索结果是文献资料,包括关于文献的信息或文献全文。6 选择或填空特性检索:是从具体事物或课题某一方面出发所进行的信息检索,强调检索的准 确性,即追求高的查准率,对查全率要求不高,只要检索得到的文献信息能够满 足用户的需求即可。族性检索:是从学科或专业出发所进行的信息检索,强调检索的全面性,即追求 较高的查全率,需要想用户提供系统安全信息的检索。为了避免漏检现象的发生, 这种检索一般对于检索的准确性即查准率要求较低。定题检索:查找有关特定主题最新信息的检索,又称为 SDI 检索。其特点是只检 索最新的信息,时间跨度小。回溯检索:查找一段时期内有关特定主

4、题信息的检索,也称为追溯检索。7填空著录:就是对文献信息的外表特征和内容特征按特定的文献信息著 录规则进行分析、选择和记录的过程。文献著录的结果叫文献著录的款目。标引:是指文献信息工作人员按一定的规则和方法,把具有检索意义的特征标识 指引出来,而后作为信息存储与检索的依据。文献信息的特征标识,又称排检标目,就是作为文献著录款目排序的依据。8 选择追溯法:是指利用已知文献末尾所附的引用文献或参考文献由近及远地进行追踪 查找相关文献的方法,又称“追踪法”、“引文追溯法”。循环法:是将工具法和追溯法加以综合运用的方法,又称为综合法。9 选择国家书目是出版物的国家登记制度的产物,是有关一个国家全部出版

5、物的现状和 历史记录。馆藏目录:是用来反映图书馆等信息部门所藏文献状况的目录。它代表了收藏单 位实有的文献,是馆藏文献的缩影。联合目录:是汇总若干个图书馆或其他信息收藏单位收藏文献而编制的目录。10题录型检索工具题录是以单篇文献为基本著录单位,是对单篇文献外部特征(文献题名、著录姓 名、文献出处等)的揭示与报道,无内容摘要,迅速报导文献信息的一类检索工 具。它与目录的主要区别是著录对象不同。目录著录的对象是单位出版物,题录 的著录对象是单篇文献。如期刊中的一篇文章、图书中的一个章节等,都是题录 的著录对象。题录的著录包括:篇名、著者姓名、文献出处(母体出版物名称、 卷、期、页、出版年分)等外表

6、特征。11在题录与文摘并存的情况下,题录刊物的作用主要是作为当年文献的检索工 具,而不是作为长期使用的检索工具。随着相应的文摘杂志的出版,它的作用便 可被文摘杂志所取代。因为文摘有摘要,能更充分、更准确地揭示文献的内容。 并且文摘杂志本身一般都附有各种辅助索引,这些辅助索引能提供的检索途径一 般也比题录更为多样和方便。12索引型检索工具 索引是根据一定的需要,把特定范围内的某些重要文献如一种或多种书(刊)里 的具体内容,如书名、篇名、主题、字句、人名、地点、机构名、分子式等,经 过分析分别摘录出来,指明出处,并按照一定的方法编排。为读者提供文献线索 的一种检索工具。索引一词借自日文,从英文音义

7、为“引行”。我国原来又有“通 检”、“备检”等名称。索引不仅广泛存在于各种书刊等文献中,而且更多地见于 作为辅助检索系统而附在不同类型的检索工具之后,为检索工具提供了更多的检 索途径。13索引与书目的异同:索引与书目的相同之处是索引不能直接提供文献本身, 而只能提供查找文献的线索;二者的区别则在于,书目是以文献整体作为记录和 检索单元,而索引则是以文章篇目或文献内容中的字、词、句、专名、主题等作 为检索单元,因此索引较之书目可以更深入地揭示文献中具体内容的出处,能够 提高文献检索的深度和效率。14文摘型检索工具:文摘是以简明扼要的文字来摘述文献的主要内容和原始数 据,注明出处,并以一定的方法加

8、以编排,向读者报道最新研究成果,传递文献 信息和查找文献线索的一种检索工具。文摘是系统报道、积累和检索文献的重要 工具,是二次文献的核心。与题录相比,除含有题录的外部特征以外,还具有内 容文摘。15文摘是原始文献的浓缩,概括地陈述其内容,并注明出处,目的在于报道新 的科学成果,是传播文献信息的重要方式,使人们能以较少的时间和精力,掌握 有关文献的现状及其基本内容,了解本专业的发展水平和最新成就,从而吸取和 利用他人已有的科研成果。是检索工具的核心。其特点为:文摘即具有检索意义, 又具有报道作用。作为检索工具的文摘,不仅提供文献的线索,指导阅读原文, 而且揭示文献的主要内容,系统报道某一学科或相

9、关学科的最新消息,可供读者 直接阅读,掌握文献中的精华。16 名词解释报道性文摘:是用来概述原文的内容要点(尤其是内容的创新 点),向读者提供原文中的定量信息和定性信息的一种文摘。报道性文摘是原文 的浓缩,基本上能反映原文的技术内容,信息量大,参考价值高。读者通过阅读 这种文摘,一般可以代替看原文。报道性文摘一般在 200-300 字左右,长的可达 500 字以上。填空是否大多采用报道性文摘与报道质量的高低是衡量文摘水平高低的重 要标准之一。17.选填查全率=检出的相关文献数三系统中相关文献总数X100%查全率可表达为 a/(a+c).查准率二检出的相关文献数三检出的文献总数X100%查准率可

10、表达为 a/(a+b) 18.填空四部分类法:不仅成为我过古代信息资料分类法的典范,而且至尽 仍是类分古籍的主要依据。19百科全书具有概述性、完备性、权威性、易检性,可读性、及时新颖性等特 点。20中国大百科全书是我国第一部具有权威性的大型综合性百科全书。21 年鉴:是系统汇集上一年度重要的文献信息,逐年编纂连续出版的资料性工 具书。22 选择年鉴具有资料权威、及时新颖、连续性等特点。23类书是辑录文献中的史实典故、名物制度、诗赋文章等,按类或按韵编排, 以便寻检和征引的工具书。或者简单说,类书是采集群书,区以部类,以便寻检 和征引用的工具书。24政书是辑录文献中的典章制度资料,分门别类地加以

11、编排和叙述,以便查考 的工具书。简言之,政书是典章制度的专书。25 填空美国工程索引(the Engineering Index)简称EI,是世界上著名的检索工 具书之一,在世界的学术界,工程界,信息界中享有盛誉。它是检索工程技术领 域文献的最主要的工具之一。英国科学文摘(Science Abstracts)简称SA,是世界上著名的检索工具书 之一。他是检索物理学,电气工程与电力学,计算机与控制方面文献的最重要工 具之一。美国化学文摘(CHEMICAL abstracts),简称CA,是世界上著名的检索化学 化工专业文献的文献刊物。美国科学引文索引(Science Ci tati on Ind

12、ex)简称SCI,双月刊,是SC I编辑出版的引文索引中最重要的一种。SCI是一种科技和学术方面的综合性 检索刊物。26.简答上机检索并调整检索策略构建完检索提问式后, 就可以上机检索了。检索时, 应即使分析检索结果是否与 检索要求一致,根据检索结果对检索提问式作相应的修改和调整,直至得到比较 满意的结果。检索结果信息量过多 产生检索结果信息量过多的原因可能有以下两点:一是主题词本身的多义性导致误检;二是对所选的检索词的截词截得太短。在这种情况下,就要考虑缩小检索范围,提高检索结果的查准率。调整检索策略的方法如下:1,减少同义词与同 族相关词。2,增加限制概念,采用逻辑“与”连接检索词。3,使

13、用字段限定, 将检索词限定在某个或某些字段范围。4,使用逻辑“非”算符,排除无关概念。5,调整位置算符,由松变严,(F)f(W)检索结果信息量过少造成检索信息量少的原因有以下几点:首先,选用了不规范的主题词或某些产品 的俗称,商品名称作为检索词;其二,同义词、相关词、近义词没有运用全;其 三,上位概念或下位概念没有完整运用。针对这种情况,就要考虑扩大检索范围, 提高检索结果的查全率。调整检索策略方法如下:1,选全同义词与相关词并用 逻辑“或”将他们连接起来,增加网罗度;2,减少逻辑“与”的运算,丢掉一 些次要的或者太专指的概念;3,去除某些字段限制;4,调整位置算符,由严变 松,(W)f(F)

14、。27中国学术期刊收录了国内中英文核心期刊和专业期刊 5000 余种,分为理工A、理工B、理工C、农业、医药卫生、文史哲、经济政治与法律、教育与 社会科学、电子技术与信息科学共九个专辑。28维普中文期刊数据库由中国重庆维普咨询公司出版,收录中文期刊 12000 余种,基本容纳了国内出版的自然科学期刊、部分社科期刊及港台核心期 刊。内容涉及理、工、农、医及社会科学等领域,是目前国内收录中文期刊最全、 报道文献两最大的综合性文献数据库。28 简答网络信息资源的特点( 1 )容量大、增长快( 2 )时效性强( 3 )内容丰富、形式多样( 4 )便于查询( 5)共享程度高( 6 )信息资源能够重复使用

15、( 7 )信息资源具有很强的目标导向29简答网络信息资源存在的问题(1)信息无序性,信息质量难以保证( 2)信息更迭无法预测( 3)信息出版非线性化( 4)网络信息版权保护问题( 5 )网络信息安全问题8)信息资源具有流动性30 简答电子期刊与电子形式的期刊的区别在于:前者是指完全以计算机技 术和网络技术为依托而编辑、出版和发行的期刊;而后者则是指已经发行的印刷 型期刊的电子版置于网上供人们检索。31 填空书生之家图书网主要提供 1999 年以来中国大陆地区出版新书的全文 电子版,包括社科、人文、自然科学和工程技术等类别,提供图书的作者、出版 信息、内容摘要及书评等,可网上选购。32填空Apa

16、bi数字图书是由北大方正推出的,无论在技术支持还是商业推广 上 Apabi 都是国内电子图书的楷模。33简/搜索引擎工作原理:使用自动索引软件,通常称为机器人(Robot)、 爬虫(Crawlers)、蜘蛛(Spiders)等计算机程序来发现、收集并标引网页,建立 数据库;以Web形式提供给用户一个检索界面,供用户输入检索关键词、词组或 短语等检索项;代替用户在数据库中查找出与提问匹配的记录,并返回结果且按 相关度排序输出。34简答搜索引擎:是指因特网上专门提供检索服务的一类网站,这些网站 通过网络搜索软件或昂落登陆等方式,收集因特网上大量网站的页面,经过加工 建库,从而能够对用户提出的各种查

17、询作出反应,提供用户需要的信息。34 简答搜索引擎的劣势现在的搜索引擎只要通过Robot将网页的全部或部分内容下载到自 建索引库中,由于下载的页面许多是无用或暂时信息,既影响检索速度,也增加 了用户检索负担。由于搜索引擎一般都采用关键词检索方式,但许多情况下,用户很 难简单地用关键词或关键词之间的组配来准确地表达真正需要的信息内容,表达困难导致检索困难。(3)每个引擎的覆盖面都相当有限。经考察研究发现,没有一个搜索引擎的索引量超过整个网页的 1/6(4)搜索的结果不精确。搜索结果的精确性是由查询词与网页的相关性来确定的,常常输入一个单一的查询词能返回数万篇结果,或者零篇结果。35 简答如何对待

18、检索结果(1)可只阅读搜索结果的前几条信息。因为大多数搜索引擎都将最符合要求的网页列在前面,虽然返回的搜索结果成千上万,但经常是需要的网页地址 就在最前面的一页。(2)缩小搜索范围。当返回的网页太多,而需要的网页地址并不在最前面的几页时,可通过改变关键词、改变搜索范围、使用逻辑符AND及引号方法缩 小查询范围。(3)找不到网页的对策。首先检查是否拼写错误,接着看搜索关键词之 间有没有自相矛盾的地方,如果仍不能成功地搜索,可换一种搜索引擎,也许会 得到用户所期望的结果。因为每个搜索工具功能虽大体相同,但检索方式和拥有 资料的侧重点不同。(4)如果用以上策略仍不能找到所需网页,也不必太失望。可链接相近 的网页,也许能到理想目的地的链接,或直接与已搜索到的主页管理者写 E-MAIL 寻求帮助。36百度现在是国内最大的商业化全文搜索引擎,占国内 80%的市场份额。如今的 Google 已经坐上了世界头号搜索引擎的宝座。37论述:手工信息检索技术方法手工信息检索工具是指用人工方式(即通过手翻、眼看、脑子想)来查找文献线 索的工具。即指印刷

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论