信息检索考试题库(带教材页码,附答案)_第1页
信息检索考试题库(带教材页码,附答案)_第2页
信息检索考试题库(带教材页码,附答案)_第3页
信息检索考试题库(带教材页码,附答案)_第4页
信息检索考试题库(带教材页码,附答案)_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

信息检索考试题库(带教材页码,附答案)一、单项选择题(每题2分,共30分)1.信息检索中“信息”的核心属性是()。A.客观性B.传递性C.价值性D.时效性答案:C(教材P5,定义部分强调信息的“有用性”即价值性)2.以下属于三次文献的是()。A.会议论文B.百科全书C.专利说明书D.学位论文答案:B(教材P12,三次文献包括综述、百科全书、年鉴等二次加工成果)3.布尔逻辑检索中,“ANOTB”的检索结果是()。A.包含A或B的文献B.同时包含A和B的文献C.包含A但不包含B的文献D.不包含A和B的文献答案:C(教材P85,布尔逻辑“非”运算的定义)4.查全率(Recall)的计算公式是()。A.相关文献中被检出的数量/检出文献总数B.检出文献中相关的数量/相关文献总数C.检出文献中相关的数量/检出文献总数D.相关文献总数/检出文献中相关的数量答案:B(教材P120,查全率=(检出相关文献数/系统中相关文献总数)×100%)5.CNKI中国知网中,“篇名”字段对应的英文标识是()。A.TIB.AUC.KYD.AB答案:A(教材P152,CNKI字段代码表中“篇名”对应TI)6.以下不属于特种文献的是()。A.标准文献B.图书C.专利文献D.会议文献答案:B(教材P23,特种文献包括专利、标准、会议、学位论文等,图书属于普通文献)7.元数据(Metadata)的核心功能是()。A.数据加密B.描述数据特征C.数据存储D.数据传输答案:B(教材P187,元数据是“关于数据的数据”,用于描述信息资源的特征)8.截词检索中,“comput”可以检索到()。A.computerB.computeC.computingD.以上均是答案:D(教材P92,右截断符“”表示任意字符匹配,可检索以“comput”开头的词)9.WebofScience的核心合集不包括()。A.SCI-EXPANDEDB.SSCIC.CPCID.中国知网答案:D(教材P165,WebofScience核心合集包括SCI、SSCI、CPCI等,中国知网是独立数据库)10.以下属于扩检技术的是()。A.使用下位词B.增加限制字段C.使用精确匹配D.缩小时间范围答案:A(教材P110,扩检通过使用上位词、同义词、减少限制等方式扩大检索范围,下位词属于缩检)11.专利文献的法律状态信息主要通过()字段获取。A.专利号B.专利权人C.专利类型D.法律状态答案:D(教材P210,专利数据库中“法律状态”字段明确标注授权、失效等信息)12.信息可视化工具Tableau主要用于()。A.文本挖掘B.数据图表展示C.文献计量分析D.元数据管理答案:B(教材P245,Tableau是专业的数据可视化工具,侧重图表交互展示)13.学术不端检测系统(如Turnitin)的核心技术是()。A.机器学习B.自然语言处理C.信息检索D.数据加密答案:C(教材P270,检测系统通过比对文本与数据库中的文献,本质是信息检索技术的应用)14.知识图谱(KnowledgeGraph)的基本单元是()。A.节点与边B.关键词C.文档D.数据库答案:A(教材P295,知识图谱以“实体-关系-实体”三元组为基本单元,表现为节点和边的网络)15.以下属于零次文献的是()。A.手稿B.期刊论文C.科技报告D.年鉴答案:A(教材P11,零次文献是未公开的原始记录,如手稿、实验记录)二、多项选择题(每题3分,共30分,少选、错选均不得分)1.文献的构成要素包括()。A.知识内容B.记录载体C.记录符号D.传播渠道答案:ABC(教材P8,文献由知识内容、记录载体、记录符号三要素构成)2.搜索引擎的组成部分包括()。A.爬行器B.索引器C.检索器D.用户接口答案:ABCD(教材P135,搜索引擎由爬行器、索引器、检索器和用户接口四部分组成)3.以下属于电子图书数据库的是()。A.超星读秀B.中国知网C.万方数据D.书生之家答案:AD(教材P148,超星读秀、书生之家是专门的电子图书数据库;知网、万方以期刊为主)4.信息检索效果的评价指标包括()。A.查全率B.查准率C.响应时间D.收录范围答案:ABCD(教材P120-121,除查全率、查准率外,系统响应时间、收录范围也是重要指标)5.专利的类型包括()。A.发明专利B.实用新型专利C.外观设计专利D.技术专利答案:ABC(教材P208,我国专利法规定的专利类型为发明、实用新型、外观设计)6.以下属于文献计量学指标的是()。A.影响因子B.h指数C.被引次数D.关键词密度答案:ABC(教材P230,影响因子、h指数、被引次数是常用文献计量指标;关键词密度属于文本特征)7.元数据的类型包括()。A.描述型元数据B.管理型元数据C.技术型元数据D.保存型元数据答案:ABCD(教材P188,元数据按功能分为描述型、管理型、技术型、保存型等)8.信息检索的基本步骤包括()。A.分析检索需求B.选择检索系统C.构建检索策略D.评价检索结果答案:ABCD(教材P75,标准步骤为需求分析→系统选择→策略构建→结果检索→结果评价)9.以下属于开放获取(OA)资源的是()。A.PLoSONEB.SSRNC.中国知网D.arXiv答案:ABD(教材P178,PLoSONE、SSRN、arXiv是开放获取平台;知网需订阅)10.知识图谱的构建技术包括()。A.实体识别B.关系抽取C.知识融合D.知识推理答案:ABCD(教材P297,构建流程涉及实体识别、关系抽取、知识融合与推理)三、判断题(每题2分,共20分,正确打√,错误打×)1.信息检索的本质是匹配用户需求与信息资源。()答案:√(教材P6,信息检索的核心是“需求-资源”的匹配过程)2.二次文献是对一次文献的加工整理,如目录、索引、文摘。()答案:√(教材P12,二次文献的定义)3.布尔逻辑中,“AND”的优先级高于“OR”。()答案:√(教材P86,布尔算符优先级通常为:括号>NOT>AND>OR)4.查准率高意味着检索结果中不相关文献少。()答案:√(教材P120,查准率=(检出相关文献数/检出文献总数)×100%,高查准率表示结果相关性高)5.学位论文属于一次文献。()答案:√(教材P11,学位论文是作者首次发表的研究成果,属于一次文献)6.截词检索只能用于右截断,不能左截断。()答案:×(教材P92,截词检索包括右截断、左截断和中间截断,如“graph”是左截断)7.标准文献的时效性较弱,一旦发布长期有效。()答案:×(教材P215,标准文献具有时效性,需定期修订或废止)8.元数据的格式必须统一,不能自定义。()答案:×(教材P189,元数据可根据需求自定义,如DublinCore是通用标准,也可扩展)9.WebofScience的“被引频次”仅统计期刊论文的引用。()答案:×(教材P167,WebofScience的被引频次统计包括期刊、会议论文等多种文献类型)10.信息可视化的主要目的是让数据更美观,无需关注准确性。()答案:×(教材P242,信息可视化需在准确性基础上提升可读性,美观是辅助)四、简答题(每题6分,共30分)1.简述信息检索的基本原理。(教材P6-7)答案:信息检索的基本原理是将用户的检索需求转化为检索提问式,与信息检索系统中存储的信息特征标识进行匹配,通过比较两者的一致性,输出匹配度高的信息资源。核心是“需求-标识”的匹配过程,包括信息的存储(标引)与检索(匹配)两个阶段。2.列举5种常用的中文数据库,并说明其特色。(教材P145-160)答案:(1)中国知网(CNKI):覆盖期刊、博硕士论文、会议、报纸等,综合性强;(2)万方数据:侧重科技文献,专利、标准资源丰富;(3)维普网:期刊资源量大,侧重自然科学;(4)超星读秀:电子图书为主,支持文献传递;(5)国家哲学社会科学学术期刊数据库(NSSD):专注社科领域,OA资源。3.简述布尔逻辑检索中“AND”“OR”“NOT”的作用,并举例说明。(教材P85-86)答案:(1)AND(与):缩小检索范围,要求同时包含两个检索词,如“人工智能AND教育”检索同时涉及人工智能和教育的文献;(2)OR(或):扩大检索范围,检索包含任一检索词的文献,如“计算机OR电脑”;(3)NOT(非):排除不相关文献,如“糖尿病NOT并发症”检索讨论糖尿病但不涉及并发症的文献。4.如何优化检索策略以提高查准率?(教材P110-112)答案:(1)使用精确检索(如短语检索、字段限制);(2)增加检索词的专指度(使用下位词、具体术语);(3)使用逻辑“AND”或“NOT”缩小范围;(4)限制文献类型、时间、语种等;(5)利用二次检索功能,在已有结果中进一步筛选。5.简述专利文献的特点及其检索意义。(教材P208-212)答案:特点:(1)法律性(记载权利范围);(2)技术性(公开技术细节);(3)时效性(专利保护期通常20年);(4)规范性(格式统一)。检索意义:(1)跟踪技术发展动态;(2)避免重复研发;(3)分析竞争对手专利布局;(4)为专利申请提供参考。五、论述题(每题10分,共20分)1.结合实例论述如何利用信息检索解决“大学生就业质量影响因素”的研究需求。(教材P75-80)答案:研究需求分析:需获取就业质量的定义、影响因素(如个人能力、学校声誉、区域经济等)的相关文献。步骤:(1)需求分解:确定“就业质量”的核心指标(如薪资、满意度、职业发展),“影响因素”的维度(个人、学校、社会)。(2)选择数据库:中文选CNKI、万方(期刊、学位论文),英文选WebofScience(国际研究)。(3)构建检索式:主题=(“就业质量”OR“毕业生就业质量”)AND(“影响因素”OR“影响机制”OR“驱动因素”),时间限定近5年(2019-2023),文献类型选期刊论文、硕博论文。(4)筛选结果:通过被引频次、发表期刊级别(如CSSCI、北大核心)筛选高质量文献;阅读摘要和结论,提取关键因素(如实习经历、专业匹配度、政策支持)。(5)评价与扩展:若结果不足,扩展检索词(如“就业水平”“职业成功”),或调整字段(从“主题”扩展至“全文”);若冗余,增加限制(如“本科毕业生”“东部地区”)。实例:通过CNKI检索“就业质量AND影响因素”,获得2000+篇文献,筛选出被引50次以上的核心论文15篇,归纳出个人能力(占比60%)、区域经济(45%)、学校就业服务(30%)为主要影响因素。2.比较学术搜索引擎(如GoogleScholar)与专业数据库(如WebofScience)的差异,并分析各自的适用场景。(教材P135-137、165-168)答案:差异:(1)收录范围:GoogleScholar覆盖更广泛(期刊、预印本、会议、学位论文等),WebofScience侧重高质量期刊(SCI、SSCI来源刊);(2)数据深度:WebofScience提供引文网络、文献计量工具(如JCR分区),GoogleScholar引文数据不全且更新滞后;(3)检索功能:WebofScience支持高级字段限定(如文献类型、出版年)、分析工具(如引文报告),GoogleScholar侧重简单关键词检索;(4)访问权限:GoogleScholar部分文献需链接到OA资源或机构库,WebofScience需机构订阅。适用场景:GoogleScholar适合前期探索性检索(获取全面文献线索)、查找OA资源;WebofScience适合精准检索(核心期刊论文)、文献计量分析(如期刊评价、作者影响力分析)、追踪学科前沿(通过ESI热点论文)。例如,撰写综述时,先用GoogleScholar快速获取研究领域的概览,再用WebofScience筛选高影响力文献并分析引用关系;评估期刊质量时,依赖WebofScience的JCR分区数据更可靠。六、应用题(每题15分,共30分)1.假设需检索“2020-2023年人工智能在医疗影像诊断中的应用”相关文献,请设计具体的检索策略(包括数据库选择、检索词扩展、字段限定、时间范围、检索式构建),并说明预期结果。(教材P75-90)答案:(1)数据库选择:中文选CNKI(期刊、学位论文)、万方(会议、专利);英文选PubMed(生物医学)、WebofScience(多学科)。(2)检索词扩展:主概念1(人工智能):人工智能(AI)、机器学习(MachineLearning)、深度学习(DeepLearning)、神经网络(NeuralNetwork);主概念2(医疗影像诊断):医疗影像(MedicalImaging)、医学影像(MedicalImage)、影像诊断(ImagingDiagnosis)、CT、MRI、X光(X-ray)。(3)字段限定:中文数据库选“主题”或“关键词”(覆盖范围广),英文数据库选“Title/Abstract”(确保相关性)。(4)时间范围:2020-01-01至2023-12-31。(5)检索式构建:中文(CNKI):(主题=人工智能OR主题=机器学习OR主题=深度学习)AND(主题=医疗影像诊断OR主题=医学影像OR主题=CT诊断)AND发表时间=2020-2023;英文(PubMed):(“ArtificialIntelligence”[Title/Abstract]OR“MachineLearning”[Title/Abstract]OR“DeepLearning”[Title/Abstract])AND(“MedicalImaging”[Title/Abstract]OR“ImagingDiagnosis”[Title/Abstract]OR“CT”[Title/Abstract])AND(“2020/01/01”[PDAT]:“2023/12/31”[PDAT])。(6)预期结果:中文数据库获得约500-800篇文献,包含综述、应用案例、技术改进论文;英文数据库获得200-400篇文献,侧重算法创新(如CNN在MRI分析中的应用)、临床验证研究。2.利用WebofScience数据库,分析某领域(如“碳中和”)的研究热点与趋势,需说明具体操作步骤及关键指标。(教材P165-170)答案:操作步骤:(1)登录WebofSc

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论