版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
MLIS图书情报信息检索试卷及答案一、单项选择题(共10题,每题1分,共10分)以下不属于信息检索核心构成要素的是A.检索主体B.检索客体C.检索系统D.检索经费答案:D解析:信息检索的三大核心构成要素为发起检索需求的检索主体、被查找的信息资源(检索客体)、承载信息查找功能的检索系统,检索经费属于影响检索可实现性的外部因素,不属于核心构成要素,因此D选项错误。某用户检索某主题的学术文献,系统共检出120篇文献,其中与主题相关的文献有90篇,已知该数据库中存储的该主题全部相关文献共100篇,本次检索的查全率为A.90%B.75%C.80%D.120%答案:A解析:查全率的计算公式为“检索出的相关文献量/系统中全部相关文献总量”,本题中对应数值为90/100=90%;B选项75%是本次检索的查准率(90/120),C选项无对应计算逻辑,D选项检出相关文献量不可能超过系统总相关文献量,因此A为正确答案。要查找同时包含“人工智能”和“图书馆服务”两个概念的文献,应使用的布尔逻辑算符是A.逻辑与B.逻辑或C.逻辑非D.截词符答案:A解析:逻辑与的作用是连接必须同时满足的多个检索概念,只有同时包含所有连接的概念的文献才会被命中,符合本题需求;逻辑或用于连接同义相关概念,满足其一即可命中,逻辑非用于排除特定概念的文献,截词符不属于布尔逻辑算符,因此A为正确答案。ISBN号属于以下哪类文献的专属标识A.学术期刊B.正式出版图书C.发明专利D.国家标准答案:B解析:ISBN是国际标准书号的缩写,是正式出版图书的专属标识;学术期刊的专属标识为ISSN(国际标准连续出版物号),专利有专属的专利申请号/公开号,国家标准有专属的标准编号,因此B为正确答案。叙词语言属于以下哪类信息检索语言A.自然语言B.分类检索语言C.受控主题语言D.关键词语言答案:C解析:叙词是经过人工规范化处理的主题词,统一了一词多义、多词一义的语义问题,属于典型的受控主题语言;关键词语言属于未经过规范的自然语言,分类检索语言是用分类号表达主题的检索语言,因此C为正确答案。已知某篇文献的准确篇名,要快速定位到该文献,最合适的检索方式是A.字段限定检索B.模糊检索C.追溯检索D.浏览检索答案:A解析:字段限定检索可以将检索词限定在特定文献字段中匹配,将已知的准确篇名限定在篇名字段检索,即可快速精准定位目标文献;模糊检索适合检索词不确定的场景,追溯检索是从已有文献的参考文献查找相关资源,浏览检索适合没有明确检索目标的场景,因此A为正确答案。科研立项查新检索的核心目的是A.获取相关文献的全文B.判断拟立项研究内容的新颖性C.统计相关领域文献的被引次数D.评估相关领域作者的学术水平答案:B解析:查新检索是通过全面检索国内外公开文献,对比分析拟立项/待鉴定成果的研究内容是否已经被公开报道,核心目的是判断其新颖性,为科研管理提供客观依据;其他选项均属于常规学术检索的功能,不是查新检索的核心目的,因此B为正确答案。以下属于二次文献的是A.硕士学位论文B.百科全书C.文摘数据库D.会议论文答案:C解析:二次文献是对大量分散的一次文献进行整理、加工、提炼后形成的有序化检索工具,文摘数据库属于典型的二次文献;学位论文、会议论文属于作者原创的一次文献,百科全书属于在一二次文献基础上深度整合的三次文献,因此C为正确答案。当检索结果数量过少、无法满足需求时,以下调整检索策略的方式不合适的是A.减少逻辑与的限定条件B.补充同义词、近义词用逻辑或连接C.扩大检索的时间范围D.增加更多的主题限定词答案:D解析:增加更多主题限定词会进一步缩小检索范围,导致检索结果更少,不符合扩检需求;其余三个选项均属于常见的扩大检索范围、提升查全率的调整方式,因此D为正确答案。开放获取学术资源的核心特征是A.内容完全没有版权限制B.用户可以免费获取并在版权范围内合理使用C.仅能在高校图书馆内部访问D.仅包含学术期刊论文类资源答案:B解析:开放获取资源的核心是打破付费壁垒,向所有公众免费开放,用户可在版权约定的范围内合理使用;开放获取资源依然受版权保护,并非无限制使用,也不限制访问主体范围,资源类型包含图书、期刊、会议论文、预印本、数据集等多种类型,因此B为正确答案。二、多项选择题(共10题,每题2分,共20分)以下属于经典信息检索模型的有A.布尔检索模型B.向量空间模型C.概率检索模型D.随机森林模型答案:ABC解析:布尔模型、向量空间模型、概率模型是信息检索领域发展成熟的三类经典检索模型,分别对应不同的检索匹配逻辑;随机森林属于机器学习分类算法,不属于信息检索模型范畴,因此ABC为正确答案。使用布尔逻辑或算符可以实现的效果有A.扩大检索范围B.提高检索查全率C.缩小检索范围D.提高检索查准率答案:AB解析:逻辑或用于连接同义、近义、相关的多个检索概念,只要满足其中任意一个概念的文献都会被命中,因此可以扩大检索范围,避免漏检相关文献,提升查全率;缩小检索范围、提升查准率是逻辑与算符的作用,因此AB为正确答案。以下属于文献外部特征的有A.作者姓名B.文献题名C.文献出版来源D.文献核心主题答案:ABC解析:文献外部特征指与文献内容无关、属于文献本身外在属性的特征,作者、题名、出版来源均属于外部特征;文献核心主题属于文献的内容特征,因此ABC为正确答案。以下可能导致检索查准率偏低的原因有A.检索词使用了范畴过大的上位词B.未对检索字段进行限定,默认在全文检索C.使用逻辑或连接了大量无关概念D.逻辑非算符使用过量答案:ABC解析:上位词范畴过大、未限定检索字段导致匹配范围过宽、逻辑或连接无关概念都会导致大量不相关文献被命中,拉低查准率;逻辑非使用过量会导致相关文献被排除,拉低查全率,不会影响查准率,因此ABC为正确答案。以下属于开放获取学术资源载体的有A.预印本服务平台B.商业付费学术期刊数据库C.高校机构知识库D.公共数字图书馆开放资源库答案:ACD解析:预印本平台、机构知识库、公共数字图书馆开放资源库均属于免费向公众开放的开放获取资源载体;商业付费数据库需要用户付费购买使用权才能访问,不属于开放获取范畴,因此ACD为正确答案。叙词语言的应用优势包括A.具有规范性,消除了一词多义、多词一义的语义歧义B.支持概念组配,可以灵活表达复杂的复合主题C.完全符合普通用户的自然语言使用习惯D.便于实现主题的精确检索答案:ABD解析:叙词是经过人工规范化处理的受控语言,消除了语义歧义,支持多概念组配,检索精准度高;但叙词需要用户掌握规范的术语表达,不符合普通用户的自然语言使用习惯,学习成本较高,因此ABD为正确答案。追溯检索法(引文追溯法)的特点包括A.不需要依赖完整的学术检索系统B.可以通过已有文献的参考文献找到更早的相关研究C.容易出现漏检,查全率偏低D.检索结果的查全率极高答案:ABC解析:追溯检索法是从已有文献的参考文献、引证文献入手查找相关资源,不需要依赖专业检索系统,可以挖掘早期的相关研究,但没有被该文献引用的相关研究容易被漏检,因此查全率较低,D选项表述错误,ABC为正确答案。以下属于信息检索效果评价指标的有A.查全率B.查准率C.系统响应时间D.服务器吞吐量答案:ABC解析:查全率、查准率是评价检索效果的核心指标,系统响应时间是评价检索系统服务性能的重要指标,三者都属于信息检索评价范畴;服务器吞吐量是计算机硬件系统的性能指标,与信息检索效果无关,因此ABC为正确答案。专利文献检索可以满足的需求有A.了解某技术领域的最新发展进展B.规避研发过程中的专利侵权风险C.判断专利申请的新颖性D.获取相关技术的国家标准全文答案:ABC解析:专利文献是技术方案的公开载体,90%以上的最新技术成果会首先在专利文献中公开,通过专利检索可以了解技术进展、判断新颖性、规避侵权风险;国家标准全文属于标准文献范畴,无法通过专利检索获取,因此ABC为正确答案。在信息检索中使用截词符可以实现的效果有A.避免漏检同一词根的不同词形变体B.扩大检索范围C.提高检索查全率D.实现检索词的精确匹配答案:ABC解析:截词符是将检索词的某一部分截断,匹配具有相同前缀/后缀的所有词汇,适合处理同一词根的不同时态、单复数、派生词等情况,可以扩大检索范围、提升查全率;截词符属于模糊匹配工具,无法实现精确匹配,因此ABC为正确答案。三、判断题(共10题,每题1分,共10分)关键词语言属于受控主题语言,具有统一的规范标准。答案:错误解析:关键词是直接从文献内容中提取的自然语言词汇,没有经过统一的规范化处理,一词多义、多词一义的问题普遍存在,属于非受控的自然语言范畴,叙词语言才是受控主题语言。查全率和查准率之间存在互逆相关关系,通常提升查全率会伴随查准率下降,反之亦然。答案:正确解析:这是信息检索领域的经典规律,二者的互逆关系源于检索范围的调整,扩大检索范围提升查全率时会纳入更多不相关文献导致查准率下降,缩小检索范围提升查准率时会排除部分相关文献导致查全率下降。ISBN是国际标准连续出版物号,主要用于标识学术期刊类文献。答案:错误解析:ISBN是国际标准书号,用于标识正式出版的图书;国际标准连续出版物号的缩写为ISSN,是学术期刊的专属标识。逻辑非算符的作用是排除包含特定概念的文献,使用的数量越多,检索的查全率越高。答案:错误解析:逻辑非算符会排除所有包含指定概念的文献,使用数量越多,越容易误排除相关的文献,反而会降低检索的查全率。三次文献是在大量一次、二次文献的基础上整理、分析、综合形成的,综述、百科全书都属于三次文献。答案:正确解析:三次文献是对一、二次文献的深度整合加工,具有综合性、参考性强的特点,综述、百科全书、年鉴、研究报告等都属于典型的三次文献。为了提升检索结果的准确性,检索所有类型的文献都应该使用精确匹配模式。答案:错误解析:当检索词存在多种词形变体、需要覆盖同义概念时,使用模糊匹配模式可以避免漏检相关文献,并非所有场景都适合使用精确匹配,需要根据检索需求灵活调整。开放获取资源没有版权限制,用户可以随意修改、传播、商用。答案:错误解析:开放获取资源只是取消了付费获取的壁垒,大多仍然保留原作者的版权,用户仅能在版权约定的范围内合理使用,随意修改、商用可能涉及侵权。字段限定检索是指将检索词限定在特定的文献字段中匹配,将检索词限定在篇名字段可以有效提升检索结果的相关性。答案:正确解析:篇名是文献核心主题的高度概括,限定篇名字段检索时,命中的文献主题相关性远高于全文任意位置匹配的结果,可以有效提升查准率。科研查新检索只需要检索中文文献即可,不需要检索外文资源。答案:错误解析:查新检索需要覆盖国内外所有公开发表的相关文献,仅检索中文文献会漏检外文的相关研究成果,无法准确判断研究内容的新颖性,影响查新结论的客观性。文献被引频次是指该文献被其他公开文献引用的次数,可以作为评价文献学术影响力的参考指标之一。答案:正确解析:被引频次反映了该研究成果得到的行业关注度,被引频次越高通常说明该文献的学术认可度越高,是目前评价学术影响力的常用参考指标之一。四、简答题(共5题,每题6分,共30分)简述信息检索的基本流程。答案要点:第一,明确检索需求,确定检索的目标、主题范围、所需文献类型、时间范围、查全查准优先级等;第二,选择合适的检索工具,根据检索需求匹配对应的综合数据库、专业数据库或专属检索系统;第三,制定检索策略,提取核心检索词,梳理检索词之间的逻辑关系,确定检索字段、匹配模式;第四,执行检索并动态调整策略,根据检索结果的数量、相关性调整检索词、逻辑算符或字段限定,直到结果符合需求;第五,筛选并获取目标文献,对检出文献进行相关性甄别,获取全文或所需的信息内容。解析:上述五个步骤是信息检索的标准实施流程,其中检索策略的动态调整是核心环节,需要根据检索结果的反馈灵活优化,避免出现漏检或无关结果过多的问题,不同的检索需求可以对各环节的权重进行调整。简述查全率和查准率的定义及二者的相互关系。答案要点:第一,查全率是指检索出的相关文献数量占检索系统中全部相关文献总量的比例,反映检索系统对相关文献的覆盖程度,数值越高说明漏检的相关文献越少;第二,查准率是指检索出的相关文献数量占检索出的全部文献总量的比例,反映检索结果的相关性,数值越高说明误检的不相关文献越少;第三,二者存在互逆相关关系,在其他检索条件不变的情况下,扩大检索范围提升查全率时,通常会伴随查准率的下降,缩小检索范围提升查准率时,通常会伴随查全率的下降。解析:查全率和查准率是评价检索效果的两个核心指标,实际检索中不存在查全率和查准率都达到100%的理想状态,需要根据具体需求平衡二者,例如查新、综述类检索优先保障查全率,特定文献查找、精准调研优先保障查准率。简述布尔逻辑算符的三种基本类型及各自的作用。答案要点:第一,逻辑与,通常用AND、*表示,用于连接需要同时满足的多个检索概念,作用是缩小检索范围,提升检索的查准率;第二,逻辑或,通常用OR、+表示,用于连接同义、近义、相关的多个检索概念,作用是扩大检索范围,提升检索的查全率;第三,逻辑非,通常用NOT、-表示,用于排除包含特定概念的文献,作用是过滤不相关结果,优化检索的准确性。解析:使用布尔逻辑算符时需要注意运算优先级,通常逻辑非的优先级最高,其次是逻辑与,最后是逻辑或,必要时可以使用括号调整运算顺序,保证检索策略符合预期的逻辑关系。简述受控语言和自然语言在信息检索中的优缺点。答案要点:第一,受控语言的优点是规范性强,统一了一词多义、多词一义的语义歧义,检索的精准度高,缺点是灵活性差,用户需要掌握规范的术语体系才能使用,学习成本较高;第二,自然语言的优点是符合用户的日常表达习惯,不需要额外学习专业规则,使用灵活便捷,缺点是缺乏统一规范,容易因语义歧义导致漏检或误检,检索的准确性较低。解析:目前主流的检索系统都会结合两类检索语言的优势,既提供规范化的叙词表供专业用户使用,也支持关键词等自然语言检索,兼顾检索的易用性和准确性。简述专利文献的特点及检索价值。答案要点:第一,专利文献的特点包括内容新颖,90%以上的最新技术成果首先在专利文献中公开,涉及技术领域广泛,内容详实具备实用性,具有法律效力,公开及时;第二,专利文献的检索价值包括了解技术领域的发展现状和趋势,避免重复研发投入,判断技术方案的新颖性和创造性,规避研发过程中的专利侵权风险,参考先进的技术解决方案。解析:专利文献是技术信息的重要载体,公开时间通常比学术期刊早1到2年,是科研、技术研发过程中非常重要的信息来源,能够为技术创新提供重要的参考支撑。五、论述题(共3题,每题10分,共30分)结合实际案例,论述人工智能技术的发展对图书情报领域信息检索的影响。答案:人工智能技术的发展从底层逻辑、服务模式、用户体验等多个维度重构了图书情报领域的信息检索服务,既带来了显著的变革价值,也产生了新的问题需要应对。首先,人工智能提升了检索系统的语义理解能力,解决了传统检索仅能匹配字面的痛点。传统的关键词检索、布尔检索只能匹配字面相同的内容,很容易出现语义歧义,比如用户检索“苹果”,传统检索会同时返回水果和科技公司的相关内容,而基于大语言模型的语义检索可以识别用户的检索意图,结合用户的检索上下文、历史检索记录判断用户需求,比如用户检索语境是数码产品领域,就优先返回科技公司的相关文献。国内某高校图书馆引入的智能语义检索系统,通过意图识别功能,将模糊主题检索的结果准确率提升了40%以上,大大降低了用户筛选文献的成本。其次,人工智能实现了从“人找信息”到“信息找人”的模式转变,提升了信息获取的效率。传统检索是用户主动发起的被动服务模式,用户需要自行构造检索策略查找资源,而人工智能可以基于用户的研究方向、历史检索记录、阅读偏好等用户画像数据,主动推送符合用户需求的最新资源,比如很多学术数据库的智能推荐功能,会根据用户之前下载的图书情报领域信息检索相关论文,主动推送该领域最新的研究成果、相关的会议通知等信息,大大降低了用户主动查找信息的时间成本。第三,人工智能拓展了信息检索的覆盖范围,实现了多模态检索能力。传统检索主要针对文本内容,无法处理图像、音频、视频等非文本资源,而基于计算机视觉、语音识别的人工智能技术可以实现多模态内容的检索,比如很多地方档案馆推出的智能档案检索系统,用户上传一张老照片,就可以检索到馆藏中相关的所有照片、档案、新闻报道等资源,打破了文本检索的局限,拓展了信息检索的服务边界。当然,人工智能在信息检索中的应用也存在一些新的问题,比如算法偏见可能导致小众主题、冷门研究的文献被过滤,用户的检索行为、阅读数据的收集可能带来隐私泄露的风险,部分生成式检索返回的结果存在虚构文献的问题。未来需要在技术优化的同时,完善相关的管理规范,在保障用户权益的前提下充分发挥人工智能的技术优势,进一步提升信息检索的服务质量。解析:本题的分析逻辑是从优势、挑战两个维度展开,结合图书馆、学术数据库的实际应用案例论证,明确人工智能是对传统检索模式的升级而非替代,最终目标是提升用户的信息获取效率,分析时需要兼顾技术价值和潜在问题,体现论述的全面性。结合科研工作的实际需求,论述如何制定合理的检索策略以平衡查全率和查准率。答案:查全率和查准率的平衡没有固定的统一标准,核心是匹配科研工作的实际需求,通过需求锚定、策略制定、动态调整三个环节的优化,实现检索效果的最优。首先,要先明确检索的核心需求,确定查全和查准的优先级。不同的科研场景对检索的需求完全不同,如果是开展科研立项查新、撰写领域文献综述,需要全面掌握该领域的所有相关研究成果,避免遗漏重要的研究进展,这时候就要把查全率放在优先级更高的位置;如果是查找某篇特定的文献、验证某个具体观点的出处、调研某细分方向的研究成果,就要把查准率放在优先级更高的位置,避免无关结果的干扰。比如某科研人员要撰写图书情报领域近十年信息检索技术发展的综述,首先就要明确优先保障查全率,尽可能覆盖所有相关的研究成果,避免因为漏检导致综述内容存在缺陷。其次,根据优先级制定对应的检索策略。如果优先保障查全率,要尽可能收集所有核心检索词的同义词、近义词、相关术语、不同表述方式,用逻辑或连接,减少不必要的逻辑与限定条件,适当使用截词符覆盖不同词形变体,扩大检索的时间范围、数据库覆盖范围,不做过多的字段限定;如果优先保障查准率,要使用更精准的下位词,增加逻辑与的限定条件缩小范围,将检索字段限定在篇名、关键词、摘要等相关性更高的字段,使用精确匹配模式,必要时使用逻辑非排除不相关的概念。比如前述的综述检索,就可以把“信息检索”“文献检索”“情报检索”“智能检索”等同义相关概念用逻辑或连接,同时将检索时间范围放宽到最近二十年,覆盖所有相关的研究成果;如果是要查找某篇关于“大语言模型在高校图书馆智能检索系统应用”的特定论文,就可以把三个核心概念用逻辑与连接,限定在篇名字段检索,快速定位到目标文献。最后,要根据检索结果的反馈动态调整策略。检索策略不是一次制定就一成不变的,要根据返回结果的数量、相关性灵活调整,如果检索结果数量过少、相关结果不足,就要减少逻辑与的限定,补充同义词,扩大检索范围;如果检索结果数量过多、不相关文献占比高,就要增加限定条件,用逻辑非排除不相关概念,缩小检索范围。比如前述综述检索过程中,如果发现结果里有大量计算机领域的纯算法研究内容和图书情报领域的需求无关,就可以用逻辑非排除“算法优化”“模型架构”等相关概念,在保障查全率的基础上适当提升查准率,降低筛选成本。综上,查全率和查准率的平衡核心是服务于实际科研需求,不存在绝对的最优策略,只要最终检索结果能够满足用户的使用需求,就是合理的检索策略。解析:本题需要结合具体的科研场景,明确优先级确定、策略制定、动态调整三个环节的可操作方法,用实际的检索案例说明不同需求下的调整方式,突出方法的实用性,避免空泛的理论论述。论述开放获取运动的发展对学术信息检索产生的影响。答案:开放获取运动倡导学术成果免费向所有公众开放,打破传统商
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 夏季高温中暑急救处置预案
- 家庭玻璃门窗清洁作业操作标准
- 健康餐盘配置标准
- 有限空间事故应急救援规程
- 复合肥质量验收标准与技术规范
- 间歇性断食营养管理操作规范
- AIoT 2.0重塑智能硬件行业分析报告:让设备真正“听懂、看懂、思考”
- 西药药理学试卷及解析
- 药品库存管理规范标准流程
- 污染物排放总量控制办法
- 爱情片《百万英镑》台词-中英文对照
- 商品七大异常状态及处理
- 金属矿床开采新技术技术
- FBCDZ系列通风机为对旋式防爆主要通风机
- GB/T 37669-2019自动导引车(AGV)在危险生产环境应用的安全规范
- 第四章 AP1000反应堆结构设计(杜圣华)
- 几起重大工程质量安全事故原因
- 设备供货安装方案(通用版)
- 中考物理题型二《开放、推理类题》
- 第二节 金属的腐蚀和防护PPT课件
- 2011年天津市高考物理试卷
评论
0/150
提交评论