




已阅读5页,还剩6页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
信 息 检 索 综 合 作 业姓名:_专业:_学号:_ 1、 理论知识1. 答:(1)按照信息资源的开发程度,信息源可分为潜在信息源和现实信息源(2) 按照存在的物质形态或者说信息所依附的载体,信息源分为文献信息源和非文献信息源(3) 依据对信息源的加工层次和集约程度,信息源可分四种层次:一次信息源,二次信息源,三次信息源和四次信息源2. 答:中国科学院文献情报中心、工程技术图书馆(中国科学技术信息研究所、机械工业信息研究院、冶金工业信息标准研究院、中国化工信息中心)、中国农业科学院图书馆、中国医学科学院图书馆3. 答:(1)分析检索课题,明确检索需求 (2)选择检索资源 (3)确定检索词和检索途径 (4)构建检索提问式 (5)实施检索 (6)调整检索策略输出检索结果 (7)获取原始文献4.答:由于信息检索的特性,决定了在系统完成后需要不断地对它进行科学评价,使其不断完善,提高检索效率。对信息检索开展有计划的评价研究始于20世纪50年代初期,当时主要是对检索语言和标引的失误进行评价。60年代中后期,随着计算机检索系统问世,评价研究开始集中于实用的机检系统。70年代中期以来,随着联机检索系统(如DIALOG、ORBIT、ESA等)的运行正常,评价研究开始集中于联机检索系统。一般来说,对信息检索的评价应从信息检索系统评价和检索效率评价两方面入手。检索系统评价对于信息检索系统的评价可从信息源、信息组织管理、系统功能、输出结果、用户接口、及系统技术支持等方面进行。(1) 信息源评价对于信息源的评价,数据库规模、收录范围、信息源质量控制等指标可反映信息源的质量。数据库规模以数据库中信息数量为统计单位,一般可以认为收录的信息数量越多,其数据库涵盖的信息也越丰富;数据库收录范围包括收录的主题范围、时间范围和信息种类,目前越来越多的数据库除在时间、主题范围控制外,在提供的信息种类方面也逐渐向提供一次文献的全文数据库的方向发展;信息源质量控制将对所收录的信息进行质量、价值、水平、权威性的评判,这样,才能提高系统中信息源的可信度。可以说,量大、面广、信息全、信息质量高、提供一站式服务应是理想的信息源。(2) 信息组织管理对于信息组织管理主要指信息标引的方法、组织方式、及更新周期。进入数据库的信息是否经过标引,标引的准确性、标引的方式等都取决于用户检索的质量;数据库的更新频率表明了信息的新颖性和时效性;系统中所用的信息检索语言的好坏将决定信息组织是否科学、合理和实用。(3) 系统功能评价信息检索系统功能评价取决于系统所能提供的检索途径、检索方式、和检索方法。提供较多的检索途径可使用户从多渠道入口进行检索,提供简单检索和高级检索、浏览等多种检索方式可满足不同层次、不同目的用户的需求。系统所能提供的检索方法的多少很大程度上也影响到检索结果,一般的信息检索系统都提供布尔逻辑组配、截词检索等,也有一些系统提供位置检索、二次检索、超文本检。随着检索技术的发展,智能检索、自然语言检索、多语言检索也应成为今后信息检索系统所能提供的检索功能的一部分。(4) 输出结果评价这部分主要包括信息检索系统对用户提问的响应时间、命中记录的排序功能和输出显示形式。当然,响应时间越短、提供的排序功能越多、及输出显示格式越合理甚至可进行个性化定制,应是一个好的信息检索系统的建设目标。(5) 用户接口用户接口往往非常重要,它取决于用户是否喜欢使用系统。“用户友好”历来是信息检索系统用户接口的建设宗旨,随着网络技术的发展,信息检索系统的用户层次也变得多样化。早期的中间用户将逐渐退出,而最终用户(end user)会直接使用信息检索系统。因此,“方便使用”也是为适应这一发展而提出的对用户接口设计的方针。另外,在用户接口中是否有帮助提示信息、是否有相关反馈机制也反映了该信息检索系统设计的质量。(6) 系统技术支持系统技术支持主要指系统及其软、硬件平台的通用性、兼容性、先进性、可靠性和稳定性。系统的性能价格比也是评价系统技术经济性能的指标。检索效果评价根据F. W. Lancaster的阐述,判定一个检索系统的优劣,主要从质量、费用和时间三方面来衡量。因此,对信息检索的效果评价也应该从这三个方面进行。质量标准主要通过查全率与查准率进行评价。费用标准即检索费用是指用户为检索课题所投入的费用。时间标准是指花费时间,包括检索准备时间、检索过程时间、获取文献时间等。查全率和查准率是判定检索效果的主要标准,而后两者相对来说次要些。对于检索效果的评价,我们首先必须考虑的是对检索结果进行评价。具体标准有两个:用户是否得到了他所需要找的信息;他得到的信息是否全面而准确。对于第一个问题的评判方法简单而且比较明确。而第二个问题在实际评判中往往显得比较困难,因为它指的是人工价值判定与使用中反映成功程度的等级尺度。尽管困难,但是在信息检索效果的评价中却必不可少。“查全”和“查准”是用于判定信息检索效果的两个常用标准。(1) 查全率(Recall Ratio)当用户要全面检索某一信息库时,检出的成功度可用检出的所有相关信息在信息库所有相关信息中所占的比例来表示。这种对信息库检索全面性的测量指标即为查全率。查全率与系统能够检索出的相关文献能力有关。可定义为:检出的相关信息数查全率 = 100%信息库中相关信息总数(2) 查准率(Precision Ratio)当用户要对检索到的结果进行分析时,检出的相关信息数在所有检出信息中所占的比例往往成了较重要的评判指标。这种对检索结果中的相关信息的测量指标即为查准率。也有称为信号噪声比(signal-to-noise ratio)。查准率与检索出的相关信息数有关。可定义为:检出的相关信息数查准率 = 100%检出的信息总数查全率和查准率必须结合使用,单独使用两者中的任何一个都不能全面说明检索效果的好坏。若检出 1 篇相关信息,必能达到 100% 的查准率,但查全率却会非常低;同样,若检出的信息数等于库中信息的总量 a + b + c + d ,则必能获得 100% 的查全率,但很显然查准率必定也低得可怜。查全率和查准率是评价检索效果好坏的指标,而漏检率和误检率则是测量检索误差的指标。(3) 误检率 (Noise Ratio)误检率为检出的结果中,不相关信息占检出信息的比例。这种对检索结果中不相关信息数的测定即为误检率。可定义为:检出的非相关信息数误检率 = 100%检出的信息总数(4) 漏检率 (Omission Ratio)漏检率为系统未检索出的相关信息占库中相关信息总数的比例。这种对检索结果中不包含系统中存在的相关信息数的测定即为误检率。可定义为:未检出的相关信息数误检率 = 100%信息库中相关信息总数其实,查全率和漏检率是互补的;而查准率和误检率也是互补关系。即:查全率 + 漏检率 = 1 ;查准率 + 误检率 = 1 。检索效益评价对于检索效益的评价取决于社会效益和经济效益,往往需要从以下几个方面考虑:信息和知识的传播速度和广度;信息资源的有效利用率;避免重复研究;提高科研效率。对于效益的评价并不是直接就可以显现的,因为它由一些不可比较的因素组成,有些方面需要通过间接的方法才能获得。另外,检索效益还具有潜在性和不确定性。因此在对检索效益评价时,需要考虑各个方面的问题。5.Scopus文摘索引数据库(Scopus) 美国Scopus文摘索引数据库 学科分类: 综合 评价: 全球规模最大的文摘和引文数据库 对象类型: 期刊、 图书、 会议论文、专利、 百科、参考工具 所提供的服务: 文摘、引文、参考文献及引文分析 适用学院: 各学院 资源简介 Scopus涵盖了由4000多家出版商出版发行的科技、医学和社会科学方面的15,100多种期刊。相对于其他单一的文摘索引数据库而言,Scopus的内容更加全面,学科更加广泛,特别是在获取欧洲及亚太地区的文献方面,用户可检索出更多的文献数量,通过Scopus,用户可以检索到1966年以来的4000多万条摘要和题录信息,以及1996年以来所引用的参考文献。数据每日更新。 二、模拟检索题目:高速缓存对计算机速度的影响研究1. 中文检索词:计算机 存储器 高速缓存工作原理 地址映射 置换算法 中央处理器处理速度 英文检索词:Cache SRAM CPU address mapping replacement algorithm为了提高程序的运行速度,在现代微机系统中,采用了调整缓冲存储器(Cache)技术,它的用途是把程序中正在使用的部分(活跃块)存放在速度快,容量小的Cache中,使CPU的访问操作大多数对Cache进行,从而大大提高CPU的访问速度,Cache采用存取速度快的SRAM器件构成,通常分为两级:集成在CPU芯片中的Cache称为一级(L1 Cache),其速度与CPU相匹配,但容量较小,一般为几KB到几十KB,安装在主板上的Cache称为二级(L2 Cache),容量较大,从几百千字到几兆千字不等。Pentinum以后的CPU将L2 Cache与CPU内核一起封装在一只金属盒内,或者直接把L2 Cache也集成到CPU芯片内,进一步提高了速度,发送了性能。2.3. (1)检索的数据库名称:维普中文科技期刊数据库 检索式:(题名或关键词高速缓存)*19892010 检中文献:337条,耗时1.271233秒 参考文献: 张旭,发挥晓岛,谢学军,透过专利看微处理器的技术发展(七)Intel早期多级Cache专利技术分析(J)。中国集成电路,2009(18)(2) 会议论文 检索的数据库名称:万方数字化期刊数据库学术会议 检索式:关键词高速缓存(Cache)检中文献:18参考文献:雷广玉,使用超高速缓存Cache提高并行速度(C)第七节全国并行计算学术交流会会议论文集,2007(3) 学位论文 检索的数据库名称:万方数字化期刊数据库学位论文检索式:关键词(调整缓存工作原理)检中文献:30参考文献:孙瑛晖,32位嵌入式微处理器的调整缓存的设计与实现(D),上海,同济大学,2004(4) 搜索引擎搜索引擎:谷
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年电子行业5G技术应用前景研究报告
- 2025年智能农业技术在农产品运营管理中的应用前景研究报告
- 2025年养老行业智能养老服务市场前景研究报告
- 2025年区块链技术在智能合约行业的应用与发展前景研究报告
- 2025年金属行业新材料应用前景研究报告
- 2025年电子竞技行业电子竞技市场规模与发展前景分析研究报告
- 安定区2025年甘肃定西市安定区融媒体中心选调工作人员笔试历年参考题库附带答案详解
- 宁夏2025年宁夏回族自治区生态环境厅事业单位自主公开招聘急需紧缺高层次人才公笔试历年参考题库附带答案详解
- 商洛市2025陕西商洛学院工程训练中心人员招聘考试2人笔试历年参考题库附带答案详解
- 华池县2025年甘肃庆阳华池县事业单位引进急需紧缺人才11人(第一批第三次)笔试历年参考题库附带答案详解
- 导行教育:劳动教育与思政课实践教学融合育人 论文
- 子宫内膜异位症合并不孕的手术治疗
- 八个有趣模型搞定外接球内切球问题(学生版)
- 分期贷款利息计算表
- 两篇古典英文版成语故事塞翁失马
- 名著阅读《朝花夕拾 狗猫鼠》课件-部编版语文七年级上册
- 燃气轮机介绍课件
- 2022年国家公务员考试申论真题及答案解析(地市级)
- 名师成长的路径与修炼(教师版)课件
- 西方经济学导论全套课件
- “基础教育精品课”PPT课件模板
评论
0/150
提交评论