走近搜索引擎_第1页
走近搜索引擎_第2页
走近搜索引擎_第3页
走近搜索引擎_第4页
走近搜索引擎_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、走近搜索引擎走近搜索引擎搜索引擎的发展史搜索引擎的祖先,是搜索引擎的祖先,是1990年由蒙特利尔大学年由蒙特利尔大学学生学生Alan Emtage发明的发明的Archie。最早现代意义上的搜索引擎最早现代意义上的搜索引擎Lycos出现于出现于1994年年7月月同年同年4月,斯坦福大学的两名博士生和美籍月,斯坦福大学的两名博士生和美籍华人杨致远共同创办了超级目录索引华人杨致远共同创办了超级目录索引Yahoo 从此搜索引擎进入了高速发展时期,从此搜索引擎进入了高速发展时期,在在1998年著名搜索引擎年著名搜索引擎Google 诞生了。诞生了。搜索引擎搜索引擎是用户查找网站的第一途径是用户查找网站的

2、第一途径数据来源自CNNIC发布的中国互联网络发展状况统计报 告84.60%70.20%56.80%37.40%32.80%0%20%40%60%80%100%搜索引擎其他网站链接朋友介绍报刊杂志电子信箱您通常通过什么方式查找新网站?您通常通过什么方式查找新网站?搜索引擎的现状搜索引擎的现状全球每天约有近4亿次搜索请求,其中中国超过5000万次68.3%网民使用搜索引擎,仅次于电子邮件 84.6% 网民是通过搜索引擎发现新的网站,排名第一41%网民是通过搜索引擎进入在线购物平台搜索引擎的分类目目录录型搜索引擎型搜索引擎关关键词键词型搜索引擎型搜索引擎混合型搜索引擎混合型搜索引擎中外搜索引擎简介

3、 国外英文目录索引国外英文目录索引 Yahoo 最著名的目录索引,搜索引擎开山鼻祖之一。最著名的目录索引,搜索引擎开山鼻祖之一。D 由义务编辑维护的目录索引。由义务编辑维护的目录索引。Ask Jeeves 著名的自然语言搜索引擎著名的自然语言搜索引擎A 有其自身特色的目录索引。有其自身特色的目录索引。 国外英文搜索引擎国外英文搜索引擎 Google 是目前搜索界的领军人物。是目前搜索界的领军人物。Fast/AllTheWeb 总部位于挪威的搜索引擎后起之秀总部位于挪威的搜索引擎后起之秀AltaVista 曾经的搜索引擎巨人,目前仍是最好的搜索引擎之一。曾经的搜索引擎巨人,目前仍是最好的搜索引擎

4、之一。Overture 最著名的搜索引擎广告商最著名的搜索引擎广告商Lycos 发源于西班牙的搜索引擎发源于西班牙的搜索引擎国内三大门户网站国内三大门户网站Google简介 Google 是从第一代搜索引擎中脱颖而出的第二代搜索引擎的代表。1998 年,两位斯坦福大学的博士生创立了Google,它的使命就是要为用户提供网上最好的查询服务,促进全球信息的交流。Google 开发出了世界上最大的搜索引擎, Google的页面随着节庆而改变的图标Google高级技巧第一次搜索实践为为了方便了方便讲讲解,我解,我们们假定你是个搜索新手,假定你是个搜索新手,想要了解一下搜索引擎的来想要了解一下搜索引擎的

5、来龙龙去脉和搜索去脉和搜索技巧技巧。在搜索框内。在搜索框内输输入一个关入一个关键键字字“ “搜索引搜索引擎擎” ”, , 选选中中“ “搜索中文搜索中文(简简体体)网网页页” ”选项选项,然,然后点后点击击下面的下面的“ “Google搜索搜索” ”按按钮钮(或者直(或者直接回接回车车),),结结果就出来了果就出来了。 “搜索引擎”一词的检索结果Google高级技巧第二步:增加关第二步:增加关键词键词, ,缩缩小范小范围围示例:搜索所有包含关键词“搜索引擎”和“历史”的中文网页搜索:输入:搜索引擎 历史Google高级技巧第三步、排除某些特定信息Google用减号“-”表示逻辑“非”操作。“A

6、 B”表示搜索包含A但没有B的网页。示例:搜索所有包含“搜索引擎”和“历史”但不含“文化”、“中国历史”和“世界历史”的中文网页搜索:“搜索引擎 历史 -文化 -中国历史 -世界历史” Google高级技巧第四步:从搜索结果中更新检索策略点开点开se-的的这这个名个名为为“ “搜索引擎搜索引擎发发展展历历史史” ”的网的网页页,我,我们发现们发现,搜索引擎的,搜索引擎的历历史,是与互史,是与互联联网早期的文件网早期的文件检检索工具索工具“ “Archie”息息相关的。此外,搜索引擎似乎有个核心息息相关的。此外,搜索引擎似乎有个核心程序,叫程序,叫“ “蜘蛛蜘蛛” ”,使搜索引擎深入人心的是,使

7、搜索引擎深入人心的是“ “Yahoo”。了解。了解了了这这些信息,我些信息,我们们就可以就可以进进一步的一步的让让搜索搜索结结果符合要求了。果符合要求了。示例:搜索如下网示例:搜索如下网页页,要求必,要求必须须含有含有“ “搜索引擎搜索引擎” ”和和“ “历历史史” ”, ,没有没有“ “文化文化” ”,可以含有以下关,可以含有以下关键键字中的任何一个或者多个:字中的任何一个或者多个:“ “Archie”、 、“ “蜘蛛蜘蛛” ”、 、“ “Yahoo”。、。、检检索式:索式:“ “搜索引擎搜索引擎 历历史史 archie OR 蜘蛛蜘蛛 OR yahoo -文化文化”Google的语法搜索引

8、擎最基本的搜索引擎最基本的语语法法“ “与与”“”“非非” ”和和“ “或或” ”, ,这这三种搜索三种搜索语语法法Google分分别别用用“ “ ” ”(空格)、(空格)、“ “-”和和“ “OR”表示。表示。顺顺着上例的思路,你也可着上例的思路,你也可以了解到如何以了解到如何缩缩小搜索范小搜索范围围,迅速找到目,迅速找到目的的资讯资讯的一般方法,即:的一般方法,即:目目标标信息一定含有的关信息一定含有的关键键字(用字(用“ “ ” ”连连起来),起来),目目标标信息不能含有的关信息不能含有的关键键字(用字(用“ “-”去掉),去掉),目目标标信息可能含有的关信息可能含有的关键键字(用字(用

9、“ “OR”连连起来)。起来)。 通配符通配符问题问题GoogleGoogle对通配符支持有限。它目前只支持对通配符支持有限。它目前只支持“* *”,不支持?号。,不支持?号。比如,比如,“以以* *治国治国”,表示搜索第一个为,表示搜索第一个为“以以”,末两个为,末两个为“治国治国”的四的四字或四字以上的短语,中间的字或四字以上的短语,中间的“* *”可以为任何字符。可以为任何字符。关键字的字母大小写关键字的字母大小写GoogleGoogle对英文字符大小写不敏感,对英文字符大小写不敏感,“GOD”GOD”和和“god”god”搜索的结果是一样搜索的结果是一样的。的。搜索整个短语或者句子搜索

10、整个短语或者句子GoogleGoogle的关键字可以是单词(中间没有空格),也可以是短语(中间有的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作用短语做关键字,必须加英文引号,否则空格会被当作“与与”操作符操作符。搜索引擎忽略的字符Google对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。示例:搜索关于www起源的一些历史资料。如果我们用检索式 “www的历史 internet”进行搜索,则得到的结果冠盖实际上只是搜索了“历史”和“inter

11、net” 两个关键词的结果,而“www的”却被忽略了。强制搜索如果要如果要对对忽略的关忽略的关键键字字进进行行强强制搜索,制搜索,则则需要在需要在该该关关键键字前加上明文字前加上明文的的“ “+”号。号。比如:搜索关于比如:搜索关于www起源的一些起源的一些历历史史资资料搜索:料搜索:则则我我们们可以用下面的可以用下面的检检索式索式进进行搜索:行搜索:+www +的的历历史史 internet另一个另一个强强制搜索的方法是把上述的关制搜索的方法是把上述的关键键字用英文双引号引起来。字用英文双引号引起来。例如上面的例子可以构造成如下的例如上面的例子可以构造成如下的检检索式:索式:www的的历历史

12、史 internet注意:大部分常用英文符号(如注意:大部分常用英文符号(如问问号,句号,逗号等)无法成号,句号,逗号等)无法成为为搜索关搜索关键键字,加字,加强强制也不行。制也不行。对搜索的网站进行限制“site”表示搜索表示搜索结结果局限于某个具体网站或者网站果局限于某个具体网站或者网站频频道,如道,如site:表示只搜索新浪网、表示只搜索新浪网、site:.com表示只搜索商表示只搜索商业业机构网站,机构网站,site:表示只搜索中国的商表示只搜索中国的商业业机构网站。机构网站。如果是要排除某网站或者域名范如果是要排除某网站或者域名范围围内的内的页页面,只需用面,只需用“ “-网站网站/

13、域名域名” ”。 。示例一:搜索中文教育科研网站(示例一:搜索中文教育科研网站()上关于搜索引擎技巧的)上关于搜索引擎技巧的页页面。面。检检索式:索式:“ “搜索引擎搜索引擎 技巧技巧 site:”注意:注意:site后的冒号后的冒号为为英文字符,而且,冒号后不能有空格,否英文字符,而且,冒号后不能有空格,否则则, ,“ “site:”将被将被作作为为一个搜索的关一个搜索的关键键字。此外,网站域名不能有字。此外,网站域名不能有“ “http:/”前前缀缀,也不,也不能有任何能有任何“ “/”的目的目录录后后缀缀;网站;网站频频道道则则只局限于只局限于“ “频频道名道名.域名域名” ”方式,方式

14、,而不能是而不能是“ “域名域名/频频道名道名” ”方式。方式。在某一在某一类类文件中文件中查查找信息找信息- filetype:语语法法“filetype:”filetype:”是个非常强大实用的一个是个非常强大实用的一个搜索语法。它能实现对某些二进制文档的搜索语法。它能实现对某些二进制文档的搜索。搜索。如:如:.xls.xls、.ppt.ppt、.doc.doc, .swf.swf、.pdf.pdf文文档等共档等共1313种类型。种类型。例如:关键词例如:关键词 filetype:pdffiletype:pdfGoogle的其他杰出功能的其他杰出功能网页快照网页快照集成化的工具条集成化的工具条 单词英文解释单词英文解释 网页翻译网页翻译 单词纠错与错别字更正单词纠错与错别字更正繁简转换繁简转换 搜索结果过滤搜索结果过滤 计算器计算器 实例:搜索小功能天气查询天气查询股票查询股票查询邮编区号邮编区号人名号码人名号码百度 国内最大商业

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论