信息技术 第一册(五年制高职)教案 任务 2.6 检索专业信息_第1页
信息技术 第一册(五年制高职)教案 任务 2.6 检索专业信息_第2页
信息技术 第一册(五年制高职)教案 任务 2.6 检索专业信息_第3页
信息技术 第一册(五年制高职)教案 任务 2.6 检索专业信息_第4页
信息技术 第一册(五年制高职)教案 任务 2.6 检索专业信息_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

③非正式出版的信息非正式出版的信息是指那些随意性强、流动性较大、质量和可信度难以保证的动态信息,不受任何的知识产权保护,如BBS、新闻组、网络论坛、电子邮件等上的信息。(3)依据信息源的信息内容则可将网络信息资源分为:联机数据库、联机馆藏目录、电子图书、电子期刊、电子报纸、软件与娱乐游戏类、教育培训类、动态性信息。另外还有其他的一些分类,大家可以上网查阅相关资料。2.6.2认识信息检索1.信息检索的含义信息检索是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。信息检索就是用户根据需要,采用一定的方法和策略,借助检索工具,从信息集合中找出所需信息的过程。信息检索具有以下特点:(1)有确定的目标;(2)有一个可能的信息解的集合;(3)有一定的线索可依;(4)检索过程是针对一定的目标,遵循一定的线索,不断缩小搜索范围的求解过程。信息检索的分类根据检索对象不同,信息检索可分为文献检索、数据检索、事实检索。其主要区别在于:数据检索和事实检索是要检索出包含在文献中的信息本身,而文献检索则检索出包含所需要信息的文献即可。根据技术手段不同,信息检索可分为:手工检索、计算机检索。手工检索是指以手工翻检的方式,利用图书、期刊、目录卡片等来检索信息的一种检索手段。计算机检索则是指利用计算机检索数据的过程。在计算机检索中,网络信息检索发展最为迅速,逐渐成为信息检索的主流。网络信息检索是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。根据检索途径不同,信息检索可分为直接检索、间接检索。直接检索即用户通过直接阅读,浏览一次文献或三次文献从而获得所需资料的过程。间接检索则是借助检索工具或利用二次文献查找文献资料的过程。信息检索的一般过程(1)确定需求选择检索系统(2)确定检索词(关键词)(3)组建与修正检索表达式(4)获得文献线索或原文2.6.3认识搜索引擎1.搜索引擎的定义所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出指定信息,反馈给用户的一种检索服务系统。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎的分类灵活选用搜索方式是提高搜索引擎性能的重要途径。元搜索引擎是基于多个搜索引擎结果并对之整合处理的二次搜索方式,垂直搜索引擎是对某一特定行业内数据进行快速检索的一种专业搜索方式,目录搜索引擎是依赖人工收集处理数据并置于分类目录链接下的搜索方式。(1)全文搜索引擎全文搜索引擎是利用爬虫程序抓取互联网上所有相关文章予以索引的搜索方式,适用于大多数用户。使用这种搜索方式方便、简捷,用户容易获得所有相关信息。但搜索到的信息过于庞杂,需要用户逐一浏览并甄别出所需信息。典型代表有百度、360搜索、Bing等。(2)元搜索引擎元搜索引擎是将多个独立搜索引擎集合在一起,提供一个统一的检索界面,当用户提出检索要求时,将其发送给多个搜索引擎,同时检索多个数据库。(3)垂直搜索引擎垂直搜索引擎适用于有明确搜索意图的检索。例如,用户购买机票、火车票、汽车票时,或想要浏览网络视频资源时,可以直接选用行业内专用搜索引擎,以准确、迅速获得相关信息。(4)目录搜索引擎目录搜索引擎是网站内部常用的检索方式。它对网站内的信息进行整合处理并将结果以目录的形式呈现给用户,用户通过分类目录即可查找到信息。典型代表有新浪、网易、搜狐等。搜索技巧(1)选择合适的检索系统不同的检索系统在检索范围和功能等方面各具特色,根据不同的检索目的应选择不同的检索系统。一般的信息检索,使用百度、搜狗、360搜索等搜索引擎即可;如果是专业性较强的信息检索,应使用专业数据库的专用检索系统。(2)选取准确的检索词检索词应选取具有实际意义的词,删除虚词、使用频率低的词、过于宽泛的词、限定词、禁用词、不能表达实质的高频词、存在蕴含关系的词等;考虑同义词、近义词、相关词、缩写与全称、专业术语与通俗称谓等,避免漏检。也就是说,在确定检索词时,先切分、删除,再进行替补、组合和增加。比如,查找“近5年国内有关担保法方面的文献”,经切分、删除、增补得到检索词:担保、抵押、质押、占有、善意取得、法律法规。(3)构造恰当的检索表达式检索式一般由检索词和各种逻辑运算符组成。信息检索受诸多因素影响,一次检索的结果往往不能满足检索要求,产生检索结果过多或过少的情况,这种情况下,根据具体情况对检索表达式进行修正,调整检索词、词间关系、检索范围、精确与模糊匹配等。2.6.4常用的信息检索技术要想快速、准确地从信息集合中找到所需信息,需要掌握一些基本的检索技巧和方法,不同的检索系统会略有差别,应以检索系统说明为准。布尔逻辑检索布尔逻辑检索是信息检索使用频率最高的基本技术,是指用布尔逻辑运算符连接各个检索词,然后由计算机进行相应的逻辑运算,以找出所需信息的方法。常用的逻辑运算符有三种:逻辑与、逻辑或、逻辑非。逻辑与逻辑与是用来表示其所连接的两个检索项的交叉部分,即交集部分。用“AND”(AND不区分大小写)或“*”表示。如果用AND连接检索词A和检索词B,则检索表达式为:AANDB(或者A*B),表示让系统检索同时包含检索词A和检索词B的信息集合C。例如,查找“培养大学生的价值观”的检索式为:大学生and价值观。该方式可缩小检索范围,提高检准率。逻辑或逻辑或是用于连接并列关系的检索词。用“OR”(OR不区分大小写)或“+”表示。如果用OR连接检索词A和检索词B,则检索表达式为:AORB(或者A+B),表示让系统查找含有检索词A、B之一,或同时包括检索词A和检索词B的信息。例如,素质OR素养,表示检索含有“素养”和“素质”其中之一或者同时含有这两个检索词的信息。该方式放大检索范围,提高检全率。逻辑非逻辑非是用于连接排除关系的检索词,即排除不需要的和影响检索结果的概念。用“NOT”(NOT不区分大小写)或“-”表示。用NOT连接检索词A和检索词B,检索表达式为:ANOTB(或者A-B),表示检索含有检索词A而不含检索词B的信息,即将包含检索词B的信息集合排除掉。例如,动物-宠物,表示检索包含“动物”但不包含“宠物”的文献。该方式在检出的文献集合中排除无用的文献,缩小检索范围。为了检索更精确,在一个检索式中,可以同时使用多个逻辑运算符,构成一个复合逻辑检索式。比如,(AorB)andC,先运算(AorB),再运算andC。布尔逻辑运算符的优先级一般为:not>and>or,()中的部分优先运算。截词检索截词检索是预防漏检、提高检全率的一种常用检索方法,是指在检索词中保留相同的部分,用截词符代替可变化的部分。截词检索有时也称为通配符检索。截词符主要有两种:“*”和“?”。*代替任意一个或多个字符,?代表一个字符。截词检索截断的形式主要有以下几种:(1)前截断前截断是将截词符号放在一个字符串左方,是后方一致检索。例如,检索词“*啤酒”可检索出包含青岛啤酒、崂山啤酒、百威啤酒等的信息。后截断前截断是将截词符号放在一个字符串右方,是前方一致检索。例如,检索词“信息*”可检索出包含信息技术、信息素养等的信息。中间截断中间截断是将截词符号放在两个字符串中间,在外文检索中使用较多。例如,检索词“wom?n”可检索出包含woman和women的信息;检索词“中国?山”可检索出包含中国泰山、中国黄山的信息。位置检索位置检索是用一些特定的运算符(位置算符)来表达检索词与检索词之间的位置关系。检索系统不同,规定的位置算符也不尽相同。(1)“(W)”算符“W”即为“With”,表示该运算符两侧的检索词相邻,两检索词之间,除空格和标点符号外,不得插入其他词或字母,词序不可以颠倒。“(W)”算符还可以使用其简略形式“()”。例如,检索式为“communication(W)satellite”时,系统只检索含有“communicationsatellite”词组的记录。(2)“(nW)”算符“(nW)”即为“nWords”,表示该算符两侧的检索词之间最多间隔n个其他词,且检索词的词序不可颠倒。例如,laser(1W)printer可检索出包含“laserprinter”、“lasercolorprinter”和“laserandprinter”的记录。(3)“(N)”算符“(N)”即“Near”,表示该算符两侧的检索词必须紧密相连,除空格和标点符号外,不得插入其他词或字母,两词的词序可以颠倒。例如,“computer(n)network”可以检索出含有“computernetwork、networkcomputer”的记录。(4)“(nN)”算符“(nN)”即“nNear”,表示该算符两侧的检索词之间允许插入最多n个其他词,且两词的词序可以颠倒。限制检索限制检索是通过限制检索范围,达到优化检索结果的方法。限制检索的方式有多种,有进行字段检索、使用限制符、采用限制检索命令等。2.6.5检索专业信息一般情况下,在使用搜索引擎检索所需信息,比如使用百度、搜狗、360搜索、Bing等,可以借助一些适当的技巧,搜索的结果基本能满足要求。但对于一些专业性较强的信息,使用搜索引擎检索的结果往往无法满足要求,这就需要到提供此类信息的专业数据库去查询,比如EI检索、SCI检索、中国知网、万方数据等,这样获得的检索结果权威性高,可信度强。百度搜索搜索“大数据技术专业毕业生就业前景”为主题的PPT文件。(1)打开百度搜索引擎。(2)输入检索表达式“大数据技术专业毕业生就业前景filetype:ppt”,如图1所示。图1百度搜索中国知网检索搜索标题中包含“神经网络与自然语言”的相关文献。(1)打开中国知网首页/,如图2所示。(2)快速检索。单击【文献检索】,打开【检索框】左边的下拉选择检索项,选择【篇名】(平台提供的检索项有主题、篇关摘、关键词、篇名等),在【检索框】中输入“神经网络*自然语言”,点击右边的【搜索】图标,便可检索出题目中同时含有“神经网络”和“自然语言”的文献。如图2所示。图2快速搜索(3)高级检索在首页点击【高级检索】进入高级检索页,高级检索页点击标签可切换至高级检索、专业检索、作者发文检索、句子检索,如图3所示。图3高级检索高级检索支持多字段逻辑组合,并可通过选择精确或模糊的匹配方式、检索控制等方法完成较复杂的检索,得到符合需求的检索结果。多字段组合检索的运算优先级,按从上到下的顺序依次进行。高级检索条件包括检索条件和检索控制。检索条件默认显示主题、作者、文献来源三个检索框,可自由选择检索项、检索项间的逻辑关系(AND、OR、NOT)、检索词匹配方式(精确、模糊)等,点击检索框后的+、-按钮可添加或删除检索项,最多支持10个检索项的组合检索;检索控制区的主要作用是通过条件筛选、时间选择等,对检索结果进行范围控制。控制条件包括:出版模式、基金文献、时间范围、检索扩展。网络信息资源评价为更好满足用户对信息的需求,有必要对信息资源进行评价和选择,从浩如烟海的信息海洋中筛选出真正有价值的信息。目前,网络信息资源评价并没有统一的标准,不同的机构或个人的评价标准各不相同。一般而言,可以从正确性、可信度、安全性等方面进行评价。正确性信息的正确性是评价网络信息资源的一个重要指标,我们可以通过以下方式进行评价:信息是否提供来源和出处,以备用户进行一步核查;信息语言是否准确、严谨,无拼写和语法错误;是否明确信息的编辑和提供者;证据是客观性还是广告性;有无政治或者意识形态因素的影响;是否有前后矛盾之处;是否来自于权威机构或公开、合法文献;是否经得起推敲和验证等。另外,个人经验也是评价网络信息正确性的重要因素,经常浏览使用网络信息的人,对一些网络信息资源会形成自己的经验评价。可信度可信度是指网络信息的可信赖程度,也就是信息的真实性有多少。确定信息的可信度,主要是明确信息的来源。信息来源很大程度上决定了信息的准确性和可靠性。不同的网络信息资源有不同的可信程度,正规网站的可信度要高于非正规网站。一般来说,来自于公开、合法的出版物、新闻媒介或政府机关、高等院校、科研院所及其他专业信息服务机构提供的信息比较准确、可靠、权威。在获取信息的时候,要学会分辨信息的真伪,以免为虚假信息所骗。安全性安全性

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论