4.3搜索引擎的高级使用.ppt_第1页
4.3搜索引擎的高级使用.ppt_第2页
4.3搜索引擎的高级使用.ppt_第3页
4.3搜索引擎的高级使用.ppt_第4页
4.3搜索引擎的高级使用.ppt_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

4.3搜索引擎的高级使用,网页的组成,搜索引擎的原理,搜索引擎的高级使用,网页的组成,(1)IP地址和域名地址,是搜索引擎和我们进入网站的唯一途径,如百度有一个IP地址为。由于IP地址不方便记忆,我们通常使用域名地址(如)。由DNS服务器将域名地址翻译为该域名所对应的IP地址。(2)网页地址,俗称网址。Internet上的每一个网页都具有一个唯一的名称标识,通常称之为URL(统一资源定位符)地址,这种地址可以是本地磁盘,也可以是局域网上的某一台计算机,更多的是Internet上的站点。,(3)网页标题,在网页的源文件中,以将其标识出来。如:欢迎访问云南农业大学主页!;当然,有时候网站为了提高其搜索引擎的蜘蛛爬虫的命中率,会在中加入足够多的内容,如一个名为“中国论文发表网”的网站,其标题的内容包括:论文发表、发表论文、发表文章、期刊合作、教育论文发表、科技论文发表、经济论文发表、职称论文发表、学术论文发表、论文协(4)网页正文。,网页的组成,搜索引擎的原理可以看做三步:从互联网上抓取网页建立索引数据库在索引数据库中搜索排序。它并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。它也不能真正理解网页上的内容,它只能机械的匹配网页上的文字。,搜索引擎,一、高级检索二、逻辑检索三、精确检索四、限定文件类型检索五、限定域名地址检索,六、限定网页特征检索七、网页快照八、其他九、Google学术搜索十、百度新闻,大纲,一、高级检索,一、高级检索,一、高级检索,一、高级检索,二、逻辑检索,二、逻辑检索,二、逻辑检索,二、逻辑检索,二、逻辑检索,二、逻辑检索,二、逻辑检索,二、逻辑检索,二、逻辑检索,二、逻辑检索,二、逻辑检索,如:查找贺雪峰先生的谁来养活中国一文。百度:谁来养活中国百度:谁来养活中国+贺雪峰,二、逻辑检索,三、信息检索工具搜索引擎,不分割引号之内的检索词,也不改变前后顺序。这对检索歌词或文学作品中的一段文字时最为实用。检索人名时亦非常有必要。用英文状态下的双引号(”)表示。如某篇文章引用了一句话:“物种的遗传与变异的多样性”,即可以用精确检索的方式,找到其准确出处。,三、精确检索,四、限定文件类型检索,可限定仅仅检索某一类类型的文献。【百度】filetype:支持:pdf、doc、xls、ppt、rtf【谷歌】filetype:支持:pdf、ps、dwf、kml、kmz、xls、ppt、doc、rtf、swf,八、按文件类型搜索,八、按文件类型搜索,八、按文件类型搜索,八、按文件类型搜索,八、按文件类型搜索,五、限定域名地址检索,限定搜索某个特定网站或某类网站中的信息。【百度】site:(“”)【谷歌】site:【例如】奥林匹克site:奥林匹克site:.gov,六、限定网页特征检索,五、限定网页特征,五、限定网页特征,五、限定网页特征,五、限定网页特征,五、限定网页特征,五、限定网页特征,七、网页快照,网页快照,英文名叫WebCache,又称网页缓存。搜索引擎在收录网页时,对网页进行备份,存在自己的服务器缓存里,当用户在搜索引擎中点击“网页快照”链接时,搜索引擎将Spider系统当时所抓取并保存的网页内容展现出来,称为“网页快照”。,七、网页快照,七、网页快照,七、网页快照,八、其他,(1)类似词检索。搜索引擎可能会使用同义词代替原始查询中的某些字词。在字词前添加腭化符号()可同时搜索该字词及其同义词。如:搜索食品成分会同时得到“营养成分”的搜索结果。,八、其他,(2)占位符(截词检索)。对于任何未知字词或“通配符”字词,都可在查询时加上占位符。【百度】不支持;【谷歌】*【例如】省*就是赚*,八、其他,(3)搜索数字范围。用两个半角句号(不加空格)隔开两个数字可查看日期、价格和尺寸等指定数字范围的搜索结果。如果仅使用一个数字和两个句号可表示上限或下限.【百度】不支持【谷歌】.【例如】相机500元.1000元世界杯冠军.2000,八、其他,八、其他,八、其他,(4)时间、语言和地区限定,九、其他,九、其他,九、其他,不通过Google搜索引擎的结果,直接进入Google认为最相关的网页。,九、其他,九、其他,九、Google学术搜索,九、Google学术搜索,九、Google学术搜索,九、Google学术搜索,十、百度新闻,十、百度新闻

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论