项目五 信息检索_第1页
项目五 信息检索_第2页
项目五 信息检索_第3页
项目五 信息检索_第4页
项目五 信息检索_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

项目五

信息检索项目导读信息检索是人们获取信息的重要方法和手段,也是人们查找信息的主要方式。掌握网络信息的高效检索方法,是现代信息社会对高素质技术技能人才的基本要求。本项目就来学习信息检索基础知识、搜索引擎使用技巧、专用平台信息检索等内容。知识目标了解信息检索的基本概念和基本流程,熟悉常用的搜索引擎、通用信息检索平台和期刊、论文、专利、商标等专用信息检索平台,理解信息检索给人们带来的便利。能力目标掌握布尔逻辑检索、截词检索、位置检索、限制检索等常用的信息检索方法,能够根据特定的信息需求选择合适的信息检索工具和方式,并能以有效的方法和手段判断信息的可靠性、真实性、准确性和目的性。增强信息意识,自觉并充分利用信息解决生活、学习和工作中的实际问题,发扬团队协作精神,善于与他人合作、共享信息,发挥信息的更大价值。素养目标任务一了解信息检索基础知识目录|contents任务二使用搜索引擎检索信息任务三使用专用平台检索信息任务一|了解信息检索基础知识体验探究——体验信息检索互联网是当今世界上最大的信息宝库,要想从互联网中快速、准确地获取所需的信息资源,就必须借助信息检索工具。而百度搜索引擎(以下简称“百度”)就是时下人们工作和生活中最流行、使用最广泛的信息检索工具。下面介绍使用百度在互联网上检索信息的方法,体验信息检索给人们获取信息带来的便利。扫码详细了解体验信息检索具体步骤图5-4浏览信息资源(1)信息存储(2)信息搜索信息检索有广义和狭义之分。广义的信息检索包括信息存储和信息搜索两个过程,而狭义的信息检索则只包括信息搜索这一个过程。也称信息存贮、信息标引,其过程就是先按一定的标准对信息进行收集和整理,然后根据信息的内容或特征对其进行标记、分类和索引,最后将所有信息构建成一个检索系统,并建立检索系统的检索语言。又称信息搜寻、信息检出,其过程是用户根据所需信息的内容或特征选取检索提问词(简称“检索词”),并将检索词构建成符合检索语言的检索提问式(简称“检索式”),然后利用检索工具将检索式与检索系统中的信息资源进行比较和匹配,最后根据一定标准对命中的信息进行排序后,将匹配程度较高的信息作为检索结果输出。一、信息检索是什么二、信息检索的基本流程该步骤的主要工作是通过分析检索内容的主题、类型、用途、时间范围和自身对检索的评价要求等,明确自身对信息的要求。1分析检索内容,明确信息需求基本操作图5-5信息检索的基本流程(1)检索工具2选择检索工具,了解检索系统检索工具是帮助用户快速、准确地检索所需信息的工具和设备的总称。

根据检索范围的不同,检索工具可大致分为综合性检索工具和专业性检索工具两类。其中,综合性检索工具包括搜索引擎、门户网站、图书馆、百科全书等,而专业性检索工具则包括各类垂直网站、专业数据库、专题工具书等。在选择检索工具时,应遵循以下原则:②灵活原则①高效原则检索系统是指用户检索信息时用到的检索工具、数据库、检索语言等组成的系统。例如,图书馆就是一个检索系统,其中的检索工具就是图书查询系统,数据库就是图书馆的所有图书,检索语言就是图书分类法。检索系统通常较为庞大,不同检索系统中包含的信息种类、数量、类型和检索语言等不尽相同。(2)检索系统3实施检索策略,浏览初步结果(1)选取检索词①提炼的检索词需能全面描述要检索的信息。②抽象的检索词要具体化。③删除意义不大的虚词、低频词等。④对检索词进行适当替换和补充。进行信息检索后,用户还需对检索结果进行评价,分析检索结果是否与检索式相匹配,是否能够满足信息需求或解决面临的问题。如果满足,则从检索结果中挑选匹配程度最高的作为最终获取的信息即可;如果不满足,就需要对信息检索的基本流程进行复盘,查看是哪个步骤出了问题,及时调整检索策略,再次进行信息检索,直到结果满意为止。4评价检索结果,获取所需信息实践探索——检索毕业论文所需信息某职业学院数字媒体技术专业的一名学生,要撰写一篇名为“从奥运会开幕式设计看数字媒体的创新与发展”的毕业论文。根据本任务介绍的信息检索的基本流程,他对论文所需信息进行了检索,步骤如下。步骤一分析检索内容,明确信息需求。步骤四评价检索结果,获取所需信息。步骤二选择检索工具,了解检索系统。步骤三实施检索策略,浏览初步结果。图5-6“2008年北京奥运会开幕式”信息检索结果实践探索——检索毕业论文所需信息任务二|使用搜索引擎检索信息一、常用的信息检索方法布尔逻辑检索(Booleansearch)是一种基于布尔逻辑算符的信息精准检索方法。图5-11逻辑“与”

图5-12逻辑“或”

图5-13逻辑“非”

1布尔逻辑检索(1)逻辑“与”(AND)表示各检索词之间的交集。(1)逻辑“与”(AND)(1)逻辑“与”(AND)检索词之间的交集。表示必须包含NOT算符前的检索词,排除NOT算符后的检索词。截词检索(truncationsearch)是利用检索词的词干或不完整的词形进行检索的技术,它是一种预防漏检、提高查全率的信息检索方法。截词是指利用“?”“*”“$”等截词符号替换检索词的某处,使截断后的检索词具有多种可能的词义,这样既可节省输入的检索词数目,又可扩大信息检索范围2截词检索(1)前截断若用户要检索的多个内容存在相同词缀的情况,则可使用前截断的截词检索。(2)后截断(3)中截断若用户要检索的多个内容仅单词单复数、年份、作者等元素不同,则可使用后截断的截词检索。若用户要检索信息的检索词存在特殊单复数、英美拼写差异等情况,为提高信息查全率,可使用中截断的截词检索。

位置算符“(nN)”表示两个检索词之间允许间隔n个单词,但不对两者的前后位置进行限制。3位置检索(1)词级位置检索①位置算符“(W)”表示两个检索词之间只允许有空格或一个标点符号,且前后位置必须保持一致。②位置算符“(nW)”表示两个检索词之间允许间隔n个单词,但两者的前后位置必须保持一致。③④位置算符“(N)”表示两个检索词之间只允许有空格或一个标点符号,但不对位置进行限制。(2)句级位置检索(3)同字段位置检索位置算符为“(S)”,它表示两个检索词必须出现在同一个句子中,但不限制两者的前后位置和间隔的单词数。位置算符为“(F)”,它表示两个检索词必须出现在检索系统数据库中记录的同一个字段,但不限制两者的前后位置和间隔的单词数。(1)限制算符“intitle:”(2)限制算符“filetype:”该限制算符表示搜索结果的标题中必须包含“intitle:”后的检索词。该限制算符表示搜索结果只能是“filetype:”后规定的文件格式。4限制检索(3)限制算符“site:”该限制算符表示搜索结果只能来自“site:”后的站点。图5-19使用限制算符“site:”后的搜索结果二、搜索引擎概述也称关键词搜索引擎,这种搜索引擎从互联网上提取各个网站的信息(以网页文字为主)建成数据库,用户通过简单的操作(一般为输入关键词)即可快速检索想要获取的内容。即“搜索引擎的搜索引擎”,它可通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的搜索引擎来实现检索操作,是对分布于网络的多种检索工具的全局控制机制。是针对某一个行业的专业搜索引擎,是一种更加细分的搜索引擎。(1)全文搜索引擎(2)元搜索引擎(3)垂直搜索引擎1搜索引擎的分类(4)目录搜索引擎是网站内部常用的检索方式。它会将网站内的信息整合处理并以目录形式呈现给用户,其缺点是用户需预先了解本网站的内容,并熟悉其主要版块构成。二、搜索引擎概述22常用的搜索引擎目前国内外较为知名的搜索引擎包括百度()、360搜索()、搜狗搜索()、Google()、MicrosoftBing()等,如图所示。三、通用信息检索平台1综合资讯检索(1)新浪微博

新浪微博中不仅网罗了众多明星名人,还入驻了大量政府官媒、专家学者、社会机构,凭借庞大的用户体量、大量入驻的名人“大V”和出色的内容生态,新浪微博一枝独秀,成为了解我国社会、民生、商业、娱乐等领域最新资讯的重要窗口,其热点趋势榜单“热搜”常常成为查看国内外热点趋势变化的风向标。

新浪微博提供了站内的垂直搜索功能,使用方法与搜索引擎基本无异。当用户对要检索的信息的时效性和完整性要求较高,且需要了解相关事件的舆论导向时,新浪微博是不二之选。微信(WeChat)是腾讯公司推出的一款为智能终端提供即时通信服务的应用程序,也是目前我国市场占有率最高的国民级即时通信软件。除为用户提供通信功能外,微信的微信公众号、视频号等都是广大网民日常接触的功能,其中网罗了大量信息,是一个庞大的信息资讯平台。此外,微信还内嵌了搜狗搜索,使自身的信息检索范围更加广泛。用户通过微信发现页的“搜一搜”功能即可搜索整个微信平台的信息,在得到搜索结果后,用户可根据需要切换“全部”“小程序”“公众号”“文章”“百科”“问答”“新闻”“视频号”“音乐”“商品”等版块查看搜索结果,如图5-22所示。(2)微信图5-22微信“搜一搜”功能(1)央视网22视频资料检索央视网由中央广播电视总台主办,是以视频为特色的中央重点新闻网站。(2)哔哩哔哩弹幕网(俗称“B站”)是国内知名的视频弹幕网站,其用户群体以年轻人居多。B站的特色在于趣味性较高的弹幕互动机制和开放自由的创作环境,其中的视频大多为用户自行制作和上传,视频内容生动、主题丰富、种类齐全、质量较高。因此,若用户需要搜索趣味性高、制作精良的视频(如趣味科普视频),可在B站中进行浏览和检索。3知识百科检索国内外常用的知识百科检索平台包括百度百科()、360百科()、搜狗百科()、维基百科()等。图5-24百度百科的“信息检索”词条界面4文件资料检索当前国内较为知名的文件资料搜索和下载网站包括百度文库()、道客巴巴()、爱问共享资料()、360doc个人图书馆()、豆丁网()等。其中,以百度文库(其搜索界面见图5-25)中收录的文件资料最多最全,在日常学习中,可将百度文库作为文件资料的主要搜索网站,其余网站作为补充。图5-25百度文库搜索界面5网络课程检索当前国内较为知名的网络课程检索平台包括中国大学MOOC()、爱课程(/home)、学堂在线()、智慧职教MOOC学院()等。学生可在这些网站中检索并参与自身感兴趣的课程,从而不断提升自身水平。实践探索——使用搜狗搜索检索全国计算机等级考试信息全国计算机等级考试(nationalcomputerrankexamination,NCRE)是我国教育部于1994年推出的全国性计算机能力考试,共分四级,主要考察应试人员(多为非计算机专业学生及从业人员)的计算机应用知识与技能。对于在校学生而言,参加全国计算机等级考试不仅能检验自身的计算机技术水平,还能在日后的求职简历中增添更多亮点。然而,很多学生对全国计算机等级考试的要求、时间、考察范围等缺乏了解,不知该如何准备应试。下面以搜狗搜索为例,介绍检索全国计算机等级考试信息的方法。使用搜狗搜索检索全国计算机等级考试信息任务三|使用专用平台检索信息体验探索——在中国知网上检索期刊论文下面以在中国知网上检索以“传统设计元素在现代建筑中的应用”为主题的期刊论文为例,介绍在专用平台上检索学术信息资源的方法。图5-34论文详情页扫一扫在中国知网上检索期刊论文一、常用的信息检索专用平台中国知网()即中国国家知识基础设施(Chinanationalknowledgeinfrastructure,CNKI)工程。CNKI工程是由清华大学、清华同方发起,始建于1999年6月,以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目。

中国知网已经发展成为全球最大的中文学术资源数据库,收录了95%以上正式出版的中文学术资源,包括期刊、学位论文、会议论文、报纸、工具书、年鉴、专利、标准、国学、法律、海外文献资料等多种文献类型。1中国知网万方数据知识服务平台(以下简称“万方”)是由万方数据公司开发的,涵盖期刊、学位论文、会议论文、科技报告、专利、成果、标准、法规、地方志、视频等多种文献类型的大型数据库。其文献来源主要包括中国科技信息研究所、国家各部委、中科院、国家各级信息机构、国家科技图书文献中心、外文文献数据库、著名学术出版机构等知名信息开放获取平台。2万方数据知识服务平台维普网()原名“维普资讯网”,是重庆维普资讯有限公司建立的综合性期刊文献服务网站。该网站累计收录期刊15000余种,现刊9000余种,文献总量7000余万篇,是中国最大的数字期刊数据库,也是我国网络数字图书馆建设的核心资源之一。除期刊检索服务外,维普网还对外提供论文检测、论文选题、优先出版、考试服务、知识资源大数据整合等服务。3维普网4其他学术信息检索平台(1)电子图书检索平台。包括超星数字图书馆、读秀、全国图书馆参考咨询联盟等。(2)专利检索平台。包括国家知识产权局专利检索及分析系统、SooPat专利检索系统等。(4)标准检索平台。包括国家标准化管理委员会官方网站、国家标准全文公开系统等。(3)商标检索平台。包括中国商标网、中华商标协会官方网站等。(5)外文文献检索平台。包括谷歌学术、WebofScience、美国工程索引、SDOL等。各专用平台为方便用户检索文献,会根据文献的内在内容(如分类、主题、关键词、摘要等)和外在成分(如作者、机构、刊名、标题等)对文献进行标签化处理,这些标签就统称为检索字段。检索字段可作为用户在数据库中检索信息时的限定条件,可使检索结果更加准确。二、使用专用平台检索信息的方法1检索字段图5-35以“题名”为检索字段的检索结果二次检索即在第一次检索结果的基础上,通过再次输入关键词、添加筛选条件等方式再次检索。二次检索可类比于布尔逻辑检索中的逻辑“与”,即二次检索后的检索结果同时满足两次检索条件。这样,通过二次检索,用户就实现了缩小检索范围,精准检索文献的目的。2二次检索图5-36二次检索结果三、高级检索高级检索是指各大专用平台基于前面讲到的布尔逻辑检索、截词检索、位置检索和限制检索等信息检索方法提供的精准化检索工具,可使用户无须在检索界面上输入逻辑算符、截词算符等符号,而只需在其提供的高级检索界面中选择或填入检索限制条件,即可执行检

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论