搜索引擎使用技巧_第1页
搜索引擎使用技巧_第2页
搜索引擎使用技巧_第3页
搜索引擎使用技巧_第4页
搜索引擎使用技巧_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、搜索引擎使用技巧现代信息检索和科技信息检索的结晶搜索之前先思考 在你使用搜索引擎搜索之前,应该先花几秒种想一下,我要找的东西网上可能有吗?如果有,可能在哪里,是什么样子的?网页上会含有哪些关键字?这次搜索,你应该使用新浪还是搜狐?Google还是百度?分析你的需求,比较不同搜索引擎的强项和弱点,然后为这次搜索选择最适合的搜索工具。 选择搜索引擎 1、搜索引擎的收录范围。使用搜索引擎首先应该了解它收录的范围是什么,这样才能知道在这里是否能找到自己所需的资料。全球性网站虽然收录的范围很广,但针对某一范围而言,往往不如本要范围的搜索引擎更为丰富。搜索引擎的收录范围包括:(1)地域范围:一般大型网站均

2、面向全球(如:YAHOO!),一些中小型网站一般收录某一区域的信息(如:亚洲网路主要收录亚洲地区网站)。(2)语言范围:常见有简体中文(GB码)、繁体中文(Big5码)、英文。(3)网站类型范围:大多数搜索引擎提供WEB页搜索,但也有一些搜索引擎提供FTP、BBS、新闻组等检索内容。(4)专业范围:有些网站专门收录某一主题、某一行业方面和信息。选择搜索引擎2、明确它的设计目的和发展走向,有的专用于检索WEB信息,有的专用于检索Usenet信息,有的针对商业需要设计,使用时确认所选引擎是否能够满足检索需要。 3、其他相关说明。在帮助信息中查找本引擎的操作方法,使用规则及算符说明和它的特色服务。这

3、些信息是用户进行网络信息资源查询所必须具备的知识。国外搜索引擎:搜索目标(英文)搜索引擎/目录索引一般资料Google资料涉及非常冷僻的领域AllTheWeb特殊资料InfoSeek/WebCRawler等产品或服务Yahoo/Overture国内搜索引擎搜索目标(中文)搜索引擎/目录索引一般资料Google古汉语(诗词)资料百度(有独到之处)产品或服务搜狐、新浪(质量高)、网易(较全)检索提问式的构造 一是检索词的选择 二是检索词的组配连接一、关键词的选择搜索引擎检索的灵魂要有足够多的检索词,借鉴方法:5W1H(what who where when why how) 检索策略信息检索策略

4、-联机检索策略积木型:把用户的检索请求剖析成若干个不同的概念面,先分别对这几个概念面进行检索,并在每个概念面中尽可能全和多的列举相关词、同义词、近义词,并用布尔算符“OR”连接成子检索式;然后再用适当的布尔算符把所有子检索提问式连接起来,构成一个总检索式。引文珠形增长:从已知的关于检索问题的少数几个专指词开始检索,以便至少检出一篇命中文献或一条相关信息,然后审阅这批文献或信息条目,从中选出一些新的相关检索词,补充到检索提问式中去。 逐次分馏:先确定一个相当大的范围广的检索初始对象集合,然后一步步提高检索提问式的专指度,缩小命中结果集合,得到数量适宜满意的结果。最专指面优先:用户在检索时,首先选

5、择从检索课题中最专指的概念面入手,浏览结果后如发现检出的文献相当少,通常就不再把其他概念面加入。选择检索词注意事项:同义词(缩写、全称、简称、学名、俗名、简繁体、不同语言说法、不同地区说法、不同时代说法、别称、大小写、通假字)注意选择检索课题的核心概念,排除无关概念,合并重复概念,以简化检索式。避免使用冷僻词汇注意阅读搜索引擎的规则,了解引擎的停用词和常用词,等。二、检索词的连接组配1、使用布尔检索 布尔算符主要有 “AND”:连接的两个关键词都必须出现在检索结果中。某些检索工具用符号“+”代替AND。例如,输入“computer and book”,它要求查询结果中必须同时包含compute

6、r和book。 “OR”:连接的两个关键词必须有一个出现在检索结果中,百度用“”代替。例如,输入“computer or book”,就要求查询结果中可以只有computer,或只有book,或同时包含computer和book。 “NOT”:紧跟在“NOT”后的关键词不出现在结果中。某些检索工具用“AND NOT”或者“”代替。例如输入“automobile not car”,就要求查询的结果中包含automobile(汽车),但同时不能包含car(小汽车)。 在实际的使用过程中,你可以将各种逻辑关系综合运用,灵活搭配,以便进行更加复杂的查询。当两个关键词用另外一种操作符连在一起,而你又想把

7、它们列为一组时,就可以对这两个词加上圆括号(),以改变或调整各项检索项的运算优先次序。2、使用双引号用( )给要查询的关键词加上双引号(英文状态),可以实现精确的查询。例如在搜索引擎的文字框中输入“电传”,它就会返回网页中有“电传”这个关键字的网址,而不会返回诸如“电话传真”之类网页。 3、使用截词符 截词符的作用是对单元检索词进行加工修饰,使其功能更完善。例如,使用截词符可以解决一个检索词的单复数问题,词干相同而词尾不同的问题,以及英美单词拼写差异的问题等。截词符在不同系统中有不同的规定符号。也并不是所有的搜索引擎都支持截词检索。 4、位置算符 表示连接的各个单元检索词词间位置关系的符号,例

8、如,使用位置算符可以限制两个检索词在文献中出现的先后顺序、间隔的距离等。如“W/N/S/F/L/C” 5、使用元词检索(高级检索中的一些特殊功能)大多数搜索引擎都支持“元词”(metawords)功能,依据这类功能用户把元词放在关键词的前面,这样就可以告诉搜索引擎你想要检索的内容具有哪些明确的特征。例如,你在搜索引擎中输入“title:清华大学”,就可以查到网页标题中带有清华大学的网页。在键入的关键词后加上“domain:org”,就可以查到所有以org为后缀的网站。其他元词还包括:image:用于检索图片,link:用于检索链接到某个选定网站的页面,URL:用于检索地址中带有某个关键词的网页

9、,filetype:文件格式。 6、区分大小写这是检索英文信息时要注意的一个问题,许多英文搜索引擎可以让用户选择是否要求区分关键词的大小写,这一功能对查询专有名词有很大的帮助,例如:Web专指万维网或环球网,而web则表示蜘蛛网。检索过程中遇到的问题1:错别字 经常发生的一种错误是,你输入的关键词含有错别字。笔者所做的统计表明,常有大量的错误搜索,光一个谢霆锋就有“谢霆锋”、“谢庭锋”、“谢霆峰”、“谢廷锋”、“谢庭峰”、“谢廷峰”6种查法,还有什么“星际争吧”、“以德制国”之类的,这样的关键词能搜索到什么有用资料吗?所以每当你觉得某种内容网上应该有不少、却搜索不到结果时,你应该先查一下是否有

10、错别字2:关键词太常见 搜索引擎对常见词的搜索存在缺陷,因为这些词曝光率太高了,以至于出现在成百万网页中,使得它们事实上不能被用来帮你找到什么有用的内容。比如,搜索“电话”,有无数网站提供跟“电话”相关的信息,从网上黄页到电话零售商到个人电话号码都有。所以当搜索结果太多太乱的时候,你应该尝试使用更多的关键词或者减号来搜索,不使用过于通用的词汇来搜索,设计一个类似“上海常用电话”这样特殊的搜索关键词,会给你真正有用的结果。当然,如果你想找的是一串汽车网站或一串MP3网站,那么用“汽车”、“MP3”搜索就是正确的 3:多义词 要小心使用多义词,比如搜索“Java”,你要找的信息究竟是太平洋上的一个

11、岛、一种著名的咖啡、还是一种计算机语言?搜索引擎是不能理解辨别多义词的。最好的解决办法是,在搜索之前先问自己这个问题,然后用短语、用多个关键词或者用其他的词语来代替多义词作为搜索关键词。比如用“爪哇印尼”、“爪哇咖啡”、“Java语言”分别搜索可以满足不同的需求 4:不会输关键词,想要什么输什么 搜索失败的另一个常见原因是类似这样的搜索:“现代爱情故事歌词”、“信息早报在济南发行情况”、“铃羊车的各种图案”、“上海到成都列车时刻表”。网友错把搜索引擎当成是听话的服务员了,其实搜索引擎是很机械的,当你用关键词搜索的时候,它只会把含有这个关键词的网页找出来,根本不管网页上的内容是什么。而问题在于,

12、没有一个网页上会含有“现代爱情故事歌词”和“上海到成都列车时刻表”这样的关键词,所以搜索引擎也找不到这样的网页。但是真正含有你想找的内容的网页,应该含有的关键词是“现代爱情故事”、“歌词”,“上海”、“成都”、“列车”、“时刻表”,所以你应该这样搜索:“现代爱情故事歌词”、“信息早报济南发行”、“铃羊车图案”“上海成都列车时刻表”。5:在错误的地方搜索搜索引擎从抓取网页、解析、索引到提供检索是有一个周期的,各搜索引擎的信息滞后周期从一周到一月不等,所以找最新内容应该去看新闻,用搜索引擎是找不到最新内容,只能找到一个星期或一个月以前的内容。另外,搜索引擎对动态内容,如:论坛、数据库内容,以及带f

13、rame结构的网页检索能力较弱,所以这类信息也不适合用搜索引擎搜索,而是应该去相关的网站寻找,当然,寻找相关网站的任务搜索引擎是当仁不让的。 当用户对检索结果不满意时,可以适当调节检索式中的泛指词、专指词、和相关词之间的数量比例及逻辑组配关系来改善检索效果。例如,对需要较高查全率的检索项目,可从扩检入手。方法如下:1、降低检索词的专指度,词的上位概念和下位概念要充分应用,词的近义词及相关词补充到检索式中,用“OR”连接。2、减少逻辑“与”的运算,丢掉一些次要的或者太专指的词。3、去掉某些条件限制,如文献格式,语言,时间等。4、调整位置算符,(W)(F)5、进行截词检索,具体采用后截断、前截断等

14、不同方式。对于需要较高查准率的检索项目,一般在查全率的基础上在进行缩检。方法如下:1、减少同义词和同族相关词的使用。2、提高词的专指度,增加或换用下位词或专指度高的自由词或直接使用短语进行检索。3、增加限制概念,采用逻辑“与”连接检索词。4、增加条件限制,将检索词限定在某个或某些字段,或运用位置算符限定词间顺序。或规定文献格式、语言等。5、使用逻辑“非”算符,排除无关概念。6、进行第二次检索,或对检索结果进行后处理,例如聚类、挖掘。 另外,还需要对检索项目和引擎进行综合分析,才能灵活运用。在搜索引擎的使用过程中,需要注意和强调的问题: 1、由于网络资源的动态增长和海量规模,当前任何一个搜索引擎的数据库收录的范围都非常有限。为此,进行信息查询时,一个搜索引擎不能得到很满意的结果,应换用其他的搜索引擎,或考虑使用元搜索引擎,以扩大查询范围,提高

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论