网络信息查找使用技巧介绍_第1页
网络信息查找使用技巧介绍_第2页
网络信息查找使用技巧介绍_第3页
网络信息查找使用技巧介绍_第4页
网络信息查找使用技巧介绍_第5页
已阅读5页,还剩35页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络信息查找使用技巧介绍网络信息检索过程搜索引擎含义 所谓搜索引擎,是基于 WWW的信息处理系统,是对网络资源进行标引和检索的工具。它通过一定的机制和方法对网络信息进行搜索,将搜索的信息进行理解、提取、组织和处理,由索引器建立索引,并储存于可供检索的大型数据库中。当用户输入检索提问时,搜索引擎会告知包含这个检索提问的所有网址,并提供通向该网址的链接点。 搜索引擎是用来对网络信息资源管理和检索的一系列软件 ,是一种在 INTERNET上查找信息的工具搜索引擎 分类第一类第一类第三类第三类第二类第二类目录式搜索引擎(网站)全文式搜索引擎(网页)元搜索引擎目录式搜索引擎 这种搜索引擎是以 人工方式或半自动方式 搜集信息,由编辑人员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务 目录的用户界面基本上都是 分级结构, 首页提供了最基本的几个大类的入口,用户可以一级一级地向下访问,直至找到自己感兴趣的类别,另外,用户也可以利用目录提供的搜索功能直接查找关键词 该类搜索引擎因为加入了人的智能,所以 信息准确、导航质量高 ,缺点是需要人工介入、维护量大、 信息量少、信息更新不及时 。 这类搜索引擎的代表是: yahoo!、 Galaxy、 Open DirectoryShou(搜狐)、 Sina(新浪) .全文搜索引擎 它们都是通过从互联网上提取的各个网站的信息 ,以 网页文字为主 ,搜索出与用户查询条件相匹配的记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。 该类搜索引擎的优点是 信息量大、更新及时、毋需人工干预 ,缺点是返回 信息过多,有很多无关信息,用户必须从结果中进行筛选。 这类搜索引擎的代表是: AltaVista、 Northern Light、 Excite、 Infoseek、Inktomi、 FAST、 Lycos、 Google;国内代表为: “天网 “、悠游、 OpenFind等。 元搜索引擎 Meta搜索引擎也叫做 Multiple Search Engine,它的特点是本身并没有存放网页信息的数据库,当用户查询一个关键词时,它把用户的查询 请求转换成其它搜索引擎 能够接受的命令格式,并行地访问数个搜索引擎来查询这个关键词,并把这些搜索引擎返回的结果经过处理后再返回给用户 对于返回的结果系统会进行 重复排除、重新排序 等处理后,作为自己的结果返回给用户,服务方式为面向网页的全文检索。严格意义上来讲, Meta搜索引擎只能算是一种用户代理,而不是真正的搜索引擎 这类搜索引擎的优点是返回结果的 信息量更大、更全 ,缺点是 不能够充分使用所使用搜索引擎的功能,用户需要做更多的筛选 。 这类搜索引擎的代表是 WebCrawler、 InfoMarket、万维搜索等。垂直搜索引擎 垂直搜索引擎是 2006年逐步兴起的一类搜索引擎。 垂直搜索是相对 通用搜索引擎 的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。 其特点就是 “ 专、精、深 ” ,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。(例如:机票搜索,旅游搜索、生活搜索、小说搜索、视频搜索等等)包括供求信息、产品信息、公司信息、行业新闻等近 10亿商业信息; 258的商业搜索服务包括:商情搜索、公司搜索、新闻搜索、商业目录、商情 ” 找到 ” 、个性化服务等集合式搜索引擎 集合式搜索引擎类似 META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的多个引擎当中选择,搜索用户需要的内容 ,因此叫它 “ 集合式 ” 搜索引擎更确切些。 合式搜索引擎的特点是可以集合众多搜索引擎的特点 ,对比搜索 ,更能准确的找到目标内容。检索式的确认 分析提问 内容 ,从提问内容中提取最能表达提问主题的若干个关键词,再将这些提问关键词组合成最适合表达提问内容的提问 表达式 。如何编制正确的表达式?检索式的构成。 AND称为逻辑 “ 与 ” ,用 and进行连接,表示它所连接的两个词必须同时出现在查询结果中,例如,输入 “computerandbook” ,它要求查询结果中必须同时包含computer和 book(使用 “ +” 代替,如四川 +电动汽车)OR称为逻辑 “ 或 ” ,它表示所连接的两个关键词中任意一个出现在查询结果中就可以,例如,输入 “computerorbook” ,就要求查询结果中可以只有 computer,或只有 book,或同时包含 computer和 book。NOT称为逻辑 “ 非 ” ,它表示所连接的两个关键词中应从第一个关键词概念中排除第二个关键词,例如输入 “automobilenotcar” ,就要求查询的结果中包含automobile(汽车 ),但同时不能包含 car(小汽车 )(使用 “ -” 代替 电动汽车 -混动汽车)1、基本检索运算符 双引号、连字号、斜线、问号、等号、省略号都可以作为短语的连接符号查找名言或专有名词 指定网域:利用 site:可以在某个特定的网站或域中进行搜索 指定文件类型: filetype:文件类型,可以在一类文件中进行搜索,比如, filetype:pdf, filetype:ppt等 搜索的关键词包含在 URL链接中: inurl: 搜索的关键词包含在网页标题中: intitle: 搜索的关键词包含在网页的 “ 锚 ” 中: inanchor: 或allinanchor: 搜索所有链接到某个 URL的网页: link:检索式的构成2、高级检索运算符搜索引擎高级语法1. 要求搜索结果中不含特定查询词 如果您发现搜索结果中,有某一类网页是您不希望看见的,而且,这些网页都包含特定的关键词,那么用减号语法,就可以去除所有这些含有特定关键词的网页。 例如,搜 神雕侠侣,希望是关于武侠小说方面的内容,却发现很多关于电视剧方面的网页。那么就可以这样查询:神雕侠侣 -电视剧 注意, 前一个关键词,和减号之间必须有空格,否则,减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间,有无空格均可。搜索引擎高级语法2.精确匹配 双引号和书名号 如果输入的查询 词很长 ,百度在经过分析后,给出的搜索结果中的查询词,可能是 拆分的 。如果您对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果 。 例如,搜索四级英语试题,如果不加双引号,搜索结果被拆分,效果不是很好,但加上双引号后, “ 四级英语试题 ” ,获得的结果就全是符合要求的了。 书名号是百度独有的一个特殊查询语法。在其他搜索引擎中,书名号会被忽略,而在百度,中文书名号是可被查询的。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。搜索引擎高级语法3. 把搜索范围限定在网页标题中 intitle 网页标题通常是对网页内容提纲挈领式的归纳。把查询内容范围限定在网页标题中,有时能获得良好的效果。使用的方式,是把查询内容中,特别关键的部分,用 “ intitle:” 领起来。 例如,找四级英语的真题,就可以这样查询:真题 intitle:四级英语注意, intitle:和后面的关键词之间,不要有空格 。搜索引擎高级语法4. 把搜索范围限定在特定站点中 site 有时候,您如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上 “ site:站点域名 ” 。 例如,天空网下载软件不错,就可以这样查询: msn site: 注意, “ site:” 后面跟的站点域名,不要带 “ http:/” ;另外, site:和站点名之间,不要带空格 。 Site可将搜索定位于某一个域名上,有利于缩小搜索范围,提高搜索效率 。如 keywords site:edu,效果很好!可以方便地搜索到各大学内有用的资源。 搜索引擎高级语法5. 专业文档搜索 很多有价值的资料,在互联网上并非是普通的网页,而是以 Word、PowerPoint、 PDF等格式存在。百度支持对 Office文档(包括 Word、 Excel、Powerpoint)、 Adobe PDF文档、 RTF文档进行了全文搜索。要搜索这类文档,很简单,在普通的查询词后面,加一个 “ filetype: ” 文档类型限定。 “ Filetype:” 后可以跟以下文件格式: DOC、 XLS、 PPT、 PDF、 RTF、 ALL。其中, ALL表示搜索所有这些文件类型。例如,查找关于高等数学方面的试卷Word文档。 “ 高等数学试卷 filetype:doc” ,点击结果标题,直接下载该文档,也可以点击标题后的 “ HTML版 ” 快速查看该文档的网页格式内容。搜索引擎高级语法6. 把搜索范围限定在 url链接中 inurl 网页 url中的某些信息,常常有某种有价值的含义。于是,您如果对搜索结果的 url做某种限定,就可以获得良好的效果。实现的方式,是用“ inurl:” ,后跟需要在 url中出现的关键词。 例如,找关于 Excel的使用技巧,可以这样查询: Excel inurl:使用技巧 上面这个查询串中的 “ Excel” ,是可以出现在网页的任何位置,而 “ 使用技巧 ” 则必须出现在网页 url中。 注意, inurl:语法和后面所跟的关键词,不要有空格。搜索引擎高级语法 inurl代替 filetype filetype可以搜索 pdf、 doc、 ppt等格式的专业文档。同一样格式的文档自然有同样的后缀名。因此,可以用 inurl来代替。例: 信息检索 filetype:pdf 信息检索 inurl:pdf 搜索引擎高级语法7、限定关键词只在标题中 例如 “ allintitle:中国 苹果 ” 表示 “ 中国 ” 和 “ 苹果 ” 都必须出现在标题中 “ intitle:中国 苹果 ” 表示 “ 中国 ” 必须出现在标题中, “ 苹果 ”可以出现在网页的任意位置,可以是标题也可以不是。 “title:” 用于针对标题进行搜索 (百度、 Yahoo) 例: title:电路分析题搜索引擎高级语法8. Related用来搜索结构内容方面相似的网页 例 :搜索所有与中文新浪网主页相似的页面 (如网易首页,搜狐首页,中华网首页等 ),“ related:” 。搜索引擎高级语法9、在指定 网 站 内 搜索 如果想知道某个站点中是否有自己需要找的东西,可以把搜索范围限定在这个站点中,提高查询效率。在想要搜索指定网站时,使用site语法,其格式为: 查询词 +空格 +site:网址。例如,只想看搜狐网站上的世界杯内容,就可以这样查询: 世界杯 site: 。搜狗也支持多站点查询,多个站点用 |隔开,如: 世界杯 site: | ( site:和站点名之间,不要带空格。 ) filetype语法也可以与 sit

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论