Google从入门到精通_第1页
Google从入门到精通_第2页
Google从入门到精通_第3页
Google从入门到精通_第4页
Google从入门到精通_第5页
已阅读5页,还剩65页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Google从入门到精通主要内容温故而知新搜索引擎概述Google从入门到精通百度的特色搜索本次课的重点、难点、要求本次课的重点与难点:搜索引擎基本原理、Goolge搜索。本次课的要求:掌握Google搜索技术。一、温故而知新网站设计与实现问题1:简述网站设计的基本过程;答案:定位网站主题、名称与网站CI形象,确定网站的栏目和板块、目录结构和链接结构、网站的整体风格和创意设计、设计首页温故而知新(续1)问题2:网站实现时用到的技术有哪些?答案:HTML、ASP、Flash、Java Applet、XML一、温故而知新二、搜索引擎概述搜索引擎的产生与发展搜索引擎的分类搜索引擎的原理搜索引擎的未来

2、2.1 搜索引擎的产生与发展Internet迅猛发展网络信息资源急剧增长搜索引擎(Search Engine)技术 以一定的策略在互联网上搜索、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而起到了信息导航的目的。二、搜索引擎概述搜索引擎的产生与发展(续1)1990年以前,没有任何人能搜索互联网;1990年,archie,第一个自动索引互联网上匿名ftp网站文件的程序,不是真正的搜索引擎;1994年,Yahoo,手工输入数据,不能真正被归为搜索引擎;1994年,WebCrawler,互联网上第一个支持搜索文件全部文字的全文搜索引擎。二、搜索引擎概述搜索引擎的产生与发展(续

3、2)Lycos,相关性排序、前缀匹配、字符相近限制和网页自动摘要;Infoseek,非常友善的用户界面和大量附加服务,与Netscape建立了战略合作关系;1995年,一种新的搜索引擎形式:元搜索引擎;二、搜索引擎概述搜索引擎的产生与发展(续3)1995年底,AltaVista,大量的创新功能,最突出的优势是速度极快,第一个支持自然语言搜索,第一个实现高级搜索语法,还可以搜索新闻组,搜索图片名称中的文字;二、搜索引擎概述搜索引擎的产生与发展(续4)1998年9月27日,Google,页面排序、动态摘要、网页快照、每日更新、多文档格式支持、地图股票词典寻人等集成搜索、多语言支持、用户界面等功能上

4、的革新,再一次改变了搜索引擎的定义;二、搜索引擎概述搜索引擎的产生与发展(续5)1998年1月,Openfind,早期中文搜索引擎,在台湾中正大学吴升教授的GAIS实验室诞生;1997年10月,北大天网利用教育网资源,有强大的ftp搜索功能;二、搜索引擎概述搜索引擎的产生与发展(续6)2000年1月,百度baidu,超链分析专利发明人李彦宏,目前拥有最大的中文数据库;二、搜索引擎概述2.2 搜索引擎的分类按照信息搜集方法和服务提供方式的不同,搜索引擎系统可以分为三大类: 1、目录式:以人工或半自动方式搜集信息,然后人工形成信息摘要; 信息大多面向网站,提供目录浏览服务和直接检索服务;由于加入人

5、的智能,所以信息准确、搜索质量高,但需要人工介入、维护量大、信息量少、更新不及时; 代表是Yahoo、新浪;二、搜索引擎概述搜索引擎的分类(续1) 2、机器人:、机器人:由一个称为蜘蛛(spider)的机器人程序以某种策略自动地在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户; 服务方式是面向网页的全文搜索,优点是信息量大、更新及时、不需要人工干预,缺点是返回信息过多,用户必须从结果中进行筛选; 代表是:AltaVista、Excite、Infoseek、Google、天网;二、搜索引擎概述搜索引擎的分类(续2) 3、元搜索

6、引擎:、元搜索引擎:没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户; 服务方式为面向网页的全文搜索,优点是返回的信息量更大、更全,缺点是不能充分使用所使用搜索引擎的功能,用户需要做更多的筛选; 代表是WebCrawler、InfoMarket等;二、搜索引擎概述2.3 搜索引擎的原理从互联网上抓取网页(爬行器、蜘蛛人搜集) 建立索引数据库(索引器整理) 在索引数据库中搜索排序(检索器服务) 将结果返回用户;二、搜索引擎概述2.4 搜索引擎的未来发展是硬道理:1、拥有大量用户,有很高的经济价值;2、涉及信息检索、人

7、工智能、计算机网络、分布式处理、数据库、数据挖掘、数字图书馆、自然语言处理等多领域的理论和技术,所以具有综合性和挑战性。二、搜索引擎概述搜索引擎的未来(续1)发展的方向:1、重心放在如何提高查询结果的精度,提高检索的有效性上;2、基于智能代理的信息过滤和个性化服务;3、采用分布式体系结构提高系统规模和性能;4、重视交叉语言检索的研究和开发;http:/ Google简介Google(www.G),Larry Page与Sergey Brin,1998年9月。http:/www.G Google搜索入门进入google主页 搜索一下“搜索引擎”:一个意外的发现!三、Google从入门到精通3.3

8、 Google初阶搜索(1)要求包含两个及两个以上的关键词:空格“ ”三、Google从入门到精通Google初阶搜索(2)要求不包含某些特定信息:“-”这里的“ ”和“-”号,是英文字符,而不是中文字符的“”和“”。此外,操作符与作用的关键字之间,不能有空格。三、Google从入门到精通Google初阶搜索(3)要求至少包含多个关键字中的任意一个:ORGoogle用大写的用大写的“OR”表示逻辑表示逻辑“或或”操作。操作。例题:搜索如下网页,要求必须含有例题:搜索如下网页,要求必须含有“搜索引擎搜索引擎”和和“历史历史”,没有没有“文化文化”,可以含有以下关键字中人任何一个或者多个:,可以含

9、有以下关键字中人任何一个或者多个:“Archie”、“蜘蛛蜘蛛”、“Lycos”、“Yahoo”。答案:答案:搜索引擎搜索引擎 历史历史 archie OR 蜘蛛蜘蛛 OR lycos OR yahoo -文化文化三、Google从入门到精通Google初阶搜索(4)小结:如何缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字(用“ ”连起来),目标信息不能含有的关键字(用“-”去掉),目标信息可能含有的关键字(用“OR”连起来)。三、Google从入门到精通Google初阶搜索(5)一些杂项语法问题:1、通配符:google目前只可以用“*”来代替单个字符,而且包含“*”必须

10、用“”引起来:2、关键字的大小写:google对英文字符大小写不敏感;3、搜索整个短语或者句子:用短语做关键词,必须加英文引号,否则空格会被当作“与”来处理;三、Google从入门到精通Google初阶搜索(6) 4、搜索引擎忽略的字符以及强制搜索:一些出现频率极高的英文单词,如“i”、”com”、”www”以及一些符号如“*”、“.”作忽略处理; 三、Google从入门到精通3.4 Google进阶搜索(1)对搜索的网站进行限制:“site:”表示搜索结果局限于某个具体网站,如果要排除某网站或者某域名范围内的页面,只需用“-网站/域名”; site后的冒号为英文字符,而且,冒号后不能有空格;

11、网站域名不能有“http:/”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。三、Google从入门到精通例题1:查找斯坦福大学(Stanford University) 网站上的入学 (admission) 信息。搜索:搜索:admission site:Google进阶搜索(2)三、Google从入门到精通admission site:Google进阶搜索(2)例题2:搜索中文教育科研网站()上关于搜索引擎技巧的页面,搜索:搜索引擎 技巧 site:例题3:上著名IT门

12、户网站ZDNET和CNET搜索一下关于搜索引擎技巧方面的资讯,搜索: search engine tips site: OR site:三、Google从入门到精通Google进阶搜索(2)例题4:搜索教育部科技发展中心网站()上关于统计资料的页面。:三、Google从入门到精通搜索:统计统计 site:得到 8910 条查询结果Google进阶搜索(3)在某一类文件中查找信息:“filetype:”是google开发的非常强大实用的一个搜索语法; Google已经能检索Office的.xls、.ppt、.doc,.rtf,WordPerfect文档,Lotus1-2-3文档,Adobe的.p

13、df文档,ShockWave的.swf文档(Flash动画)等。三、Google从入门到精通Google进阶搜索(4)例题1:搜索几个资产负债表的Office文档;搜索:资产负债表 filetype:doc OR filetype:xls OR filetype:ppt例题2:搜索一些关于搜索引擎知识和技巧方面的PDF文档搜索:search engine tips OR tutorial filetype:pdf三、Google从入门到精通Google进阶搜索(5)搜索的关键字包含在搜索的关键字包含在URL(Uniform Resource Locator,即统一资源定位系统,也就是我们通常所

14、说的网址)链接即统一资源定位系统,也就是我们通常所说的网址)链接中中:“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“VEDIO”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。“allinurl”语法返回的网页的链接中包含所有作用关键字。三、Google从入门到精通Google进阶搜索(6)例题1:查找MIDI曲“沧海一声笑”。搜索:

15、inurl:midi 沧海一声笑例题2:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。搜索:allinurl:cgi-bin phf +com三、Google从入门到精通Google进阶搜索(7)搜索的关键字包含在网页标题中:使用“intitle”和“allintitle”表示对网页的标题栏进行查询;网页标题,就是HTML标记语言title中的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。大家可

16、比较一下:例题:搜索教育部科技发展中心网站()上标题中含“统计”资料的页面。 搜索:intitle:统计 site:三、Google从入门到精通搜索intitle:”统计统计” site:得到 95 条查询结果,与前例得到的 8910 条查询结果相比,大大提高了检索结果的相关性。Google进阶搜索(8)一些罕用语法:1、搜索所有链接到某个URL地址的网页,如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。使用“link”语法就能让你迅速达到这个目的。例题:搜索所有含指向华军软件园“”链接的网页。搜索:link:三、Google从入门到精通Google进阶搜索(9)2、查找与某个

17、页面结构内容相似的页面,使用“related”来搜索结构内容方面相似的网页;3、从google服务器上缓存页面中查询信息,使用“cache”语法,通常用于查找某些已经被删除的死链接网页;4、其它罕用语法如info、stock等不一一介绍,有兴趣的读者可以参阅Google大全。三、Google从入门到精通Google进阶搜索(10)图片搜索: ,Google图像搜索目前支持的语法包括基本的搜索语法如“ ”、“-”、“OR”、“site”和 “filetype:”。其中“filetype:”的后缀只能是几种限定的图片类似,如JPG,GIF等。三、Google从入门到精通Google进阶搜索(11)

18、目录检索,访问 ;目前Google使用的分类目录采用了ODP的内容。“Open Directory Project”是网景公司所主持的一项大型公共网页目录。由全世界各地的义务编辑人员来审核挑选网页,并依照网页的性质及内容来分门别类。因此,在某一目录门类中进行搜索往往能有更高的命中率。三、Google从入门到精通3.5 Google的其它杰出功能(1)网页快照,是Google抓下来缓存在服务器上的网页。它有三个作用 (可使用google快照助手)1、如果原地址打开很慢,那么可以直接查看Google缓存页面,因为Google服务器速度极快。2、如果原链接已经死掉或者因为网络的原因暂时链接不通,那么

19、可以通过Google快照看到该页面信息。当然,快照内容不是该页最新页面。3、如果打开的页面信息量巨大,一下子找不到关键词所在位置,那么可以通过Google快照,因为快照中Google用黄色表明关键字位置。三、Google从入门到精通Google的其它杰出功能(2)每日要点参考工具选择关键字本地搜索旅行策划查询优化按数字搜索股票查询三、Google从入门到精通天气天气 用Google 查询中国城市地区的天气和天气预报,只需输入一个关键词(“天气天气”、“tq” 或或“TQ” 任选其一)。股票报价股票报价 用 Google 查询股票价格和股市行情,非常简洁方便。您只需输入想查询的股票证券名称股票证

20、券名称或是其六位其六位数代码数代码,Google就会返回其他链接让您只要一次点击便能得到有关股票证券的详尽资料。每日要点例一:例一:利用利用google查找本地未来两天的天气情况。查找本地未来两天的天气情况。搜索:搜索:tq例二:例二:利用利用google查找查找“中国电信中国电信”的股市行情。的股市行情。搜索:搜索:中国电信中国电信计算器计算器 要使用内置计算器功能,只需在搜索框中输入想要想要完成的算式完成的算式即可。单位换算 可进行诸如高度、重量等众多计量单位间的换算。只需在搜索框中输入想要进行的换算想要进行的换算即可。 参考工具同义词搜索同义词搜索 如果您并不仅仅想搜索单个字词,而是想一

21、并搜索其同义词,则在搜索字词前加上一个代字符在搜索字词前加上一个代字符 () 。 字典定义 查看某个字词或词组的定义,在此字词或词组前加上“define:”即可。 选择关键字例三:例三:利用利用google查找查找“信息检索信息检索”的定义的定义搜索:搜索:define:信息检索信息检索本地搜索本地搜索 查找商店、餐馆或其他本地商户,键入商户类别商户类别和位置位置,Google 会将搜索结果连同地图地图、评论评论及其联系方式联系方式一并返回。 电影放映时间 查找上演的电影的评论和放映时间,键入“电影电影”、“影讯影讯”、影院名称或近期电影的名称、影院名称或近期电影的名称即可。房地产和住房 查看房源信息,键入“房地产房地产”以及城市城市的名字。 本地搜索货币换算货币换算 使用使用Google内置的货币换算器,键入所要完成的内置的货币换算器,键入所要完成的换算,换算,Google 会在结果页中直接提供换算结果。会在结果页中直接提供换算结果。 地图 键入键入位置名称位置名称以及以及“map”或或“地图地图”,就会返回,就会返回相关地图。点击此地图可将其放大查看。相关

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论