版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3.1Internet信息资源检索
Internet是20世纪重大的科技发明,是仅次于电话的第二大通信网络。Internet蕴涵着海量的信息,提供了一种全新的交流信息和查找信息的渠道,获得了“第四媒体”的美誊,但丰富的信息资源只有通过检索并开发利用才能充分体现其价值。而要进行有效的网络信息资源检索,首先就必须掌握Internet信息所具有的特点、了解影响信息检索的因素,通过实践提高获取信息的能力。下一页返回3.1Internet信息资源检索一、Internet信息资源特点Internet上的信息资源具有以下特点。1.信息源丰富
Internet是个开放的信息传播平台,任何机构、任何人都可以将自己拥有的且愿意让他人共享的信息发布上网。在这个庞大的信息供应源中,起主导作用的主要有:公共图书馆、网络信息服务商、传统媒体、传统联机服务商、高等院校、科研机构、各类商业公司等。2.信息内容多样性网络是信息的载体,信息是网络的灵魂。没有信息,网络就没有使用价值。Internet是信息的海洋,信息内容几乎无所不包。有科学技术领域的各种信息,也有与大众日常生活息息相关的信息;有严肃主题信息,也有体育、娱乐、旅游、消遣和奇闻趣事;有历史档案信息,也有显示现实世界的信息;有知识性和教育性的信息,也有消息和新闻的传媒信息;有学术、教育、产业和文化方面的信息,也有经济、金融和商业信息。上一页下一页返回3.1Internet信息资源检索3.信息表现形式多样化
Internet是一个集声音、图像、文字、照片、图形、动画、电影、音乐为一体的包罗万象的综合性信息系统。可以伴着优雅的音乐,循着链路随意在网上漫游,看看精美的网页、阅读精彩的文件,使学习成为一种浪漫、愉快的旅程。4.信息时效性利用Internet信息制作技术,能很快地将信息传播到世界各地。由于几乎在事件发生的同一时间,就能将信息快速制作、上网,因此,网上信息的更新周期短、内容新颖。上一页下一页返回3.1Internet信息资源检索5.信息交互性
Internet是交互性的,不仅可以从中获取信息,也可以向网上发布信息。Internet提供讨论、交流的渠道。在Internet上可以找到提供各种信息的人:科学家、工程技术专家、医生、律师、教育家、明星以及具备各种专长和爱好的人们;也可以找到一些专题讨论小组,通过交流、咨询获得专家和其他用户的帮助,同时也可发表个人的见解。6.信息关联性
Internet的信息组织是基于超文本的,因此,有关联的信息之间通过链接形成一个相互联系的信息渠道,人们可以由此及彼、由远而近、顺藤摸瓜找到想要的信息。上一页下一页返回3.1Internet信息资源检索7.信息的开放性由于Internet是一个全球性分布的结构,大量信息分别存储在世界各地的服务器与主机上,随着时间的推移和知识的更新,在不断补充新的信息的同时也不断淘汰旧的信息,以保证其信息的整体数量和使用价值及网络灵活性。8.免费信息资源丰富
Internet大部分是免费的,只要有时间、有一定的检索经验,肯定可以从网上找到大量的所需要的免费信息。9.信息组织的局部有序性与整体无序性各搜索引擎和站点目录都收集了大量的Internet站点,并按照专业和文献信息类型分类,实现了信息组织的局部有序化。但是,由于Internet急剧膨胀,仍有大量信息被淹没在信息的海洋里,这种无序性必将影响信息检索的系统性、完整性和准确性。上一页下一页返回3.1Internet信息资源检索
二、Internet信息资源种类
Internet信息资源可按照信息来源、信息时效性或网络传输协议来分类。
1.按信息来源划分
Internet信息资源按信息来源可划分为政府、公众、商用等信息资源。上一页下一页返回3.1Internet信息资源检索(1)政府信息资源。各国政府纷纷在Internet上发布有关该国家与政府的各种公开信息,进行国家与政府的形象展示。政府信息主要包括各种新闻、统计信息、政策法规文件、政府档案、政府部门介绍、政府取得成就等。
(2)公众信息资源。公众信息资源,即为社会公众服务的机构所拥有信息资源,包括公共图书资源、科技信息资源、新闻出版资源、广播电视信息资源等。
(3)商用信息资源。商用信息资源,即商情咨询机构或商业性公司为生产经营者或消费者提供的有偿或无偿的商用信息,包括产品、商情、咨询等类型的信息。上一页下一页返回3.1Internet信息资源检索2.按信息时效划分
Internet信息资源按信息时效可划分为电子邮件型、图书馆目录、书目与索引、全文资料及电子出版物、数据库等信息资源。
(1)电子邮件型信息资源。凡是通过电子邮件方式进行交流的信息都属于E-mail型的信息资源。它并不局限于个人之间的通信,还包括报告、论文、文献目录,甚至整本书、整本期刊。
(2)图书馆目录资源。网络上的图书馆目录不再受时空限制,用户可以在家里或办公室查阅。上一页下一页返回3.1Internet信息资源检索(3)书目与索引资源。Internet上有大量历史、政治、经济、物理、化学、矿业、化工、建筑等许多学科的书目与期刊索引资源。
(4)全文资料及电子出版物资源。全文资料及电子出版物已越来越多地通过Internet提供有偿或无偿使用。
(5)数据库信息资源。数据库信息资源是Internet中最为庞大的部分,可分为科学技术数据库、商业广告数据库、教育娱乐数据库等。上一页下一页返回3.1Internet信息资源检索3.按网络传输协议划分
Internet信息资源按网络传输协议可划分为www,Telnet,FTP、用户服务组、Gopher等信息资源。(1)www信息资源。www(WorldWideWeb,www/Web)信息资源是建立在超文本、超媒体技术以及超文本传输协议(HyperTextTransferProtocol,HTTP)的基础上,集文本、图形、图像、声音为一体,并以直观的图形用户界面展现和提供信息的网络资源形式。www其实是Internet中一个特殊的网络区域,这个区域是由网上所有超文本格式的文档(网页)集合而成的。超文本文档里既有数据又有包含指向其他文档的链(Links)。链使得不同文档里的相关信息连接在一起,这些相互链接的文档可以在一个www服务器里,也可以分布在网络上的不同地点。通过这些链,用户在www上查找信息时可以从一个文档跳到另一个文档,而不必考虑这些文档在网络上的具体地点。上一页下一页返回3.1Internet信息资源检索(2)Telnet信息资源。Telnet信息资源是指借助远程登录,在网络通信协议(Telecom-municationNetworkProtocol)的支持下,可以访问共享的远程计算机中的资源。Telnet使用户可以在本地计算机上注册到远程计算机中的资源。使用Telnet,用户可以与全世界许多信息中心、图书馆及其他信息资源联系。Telnet远程登录的使用主要有两种情况:第一种是用户在远程主机上有自己的账号,即用户拥有注册的用户名和口令;第二种是许多Internet主机为用户提供了某种形式的公共Telnet信息资源,这种资源对于每一个Internet用户都是开放的。上一页下一页返回3.1Internet信息资源检索(3)FTP信息资源。FTP信息资源是指利用文件传输协议(FileTransferProtocol,FTP)可以获取的信息资源。FTP使用户可以在本地计算机和远程计算机之间发送和接收文件,FTP不仅允许从远程计算机上获取、下载文件(Download,也可以将文件从本地计算机复制传输到远程计算机(Upload)。FTP是目前Internet上获取免费软件和共享软件资源不可缺少的工具。
(4)用户服务组信息资源。Internet上各种各样的用户通信或服务组是最受欢迎的信息交流形式,包括新闻组(UsenetNewsGroup),邮件列表(MailingList)、专题讨论组(DiscussionGroup)、兴趣组(InterestGroup)等。这些讨论组都是由一组对某一特定主题有共同兴趣的网络用户组成的电子论坛,在电子论坛中所传递与交流的信息就构成了Internet上最流行的一种信息资源。上一页下一页返回3.1Internet信息资源检索(5)Gopher信息资源。Gopher是一种基于菜单的网络服务,它为用户提供了丰富的信息,并允许用户以一种简单的、一致的方法快速找到并访问所需的网络资源。全部操作是在一级级菜单的指引下,用户只需在菜单中选择项目和浏览相关内容,就可完成对Internet上远程联机信息系统的访问,无须知道信息的存放位置和掌握有关的操作命令。上一页下一页返回3.1Internet信息资源检索三、Internet信息检索方法要想在Internet上获得自己所需要的信息,就必须知道这些信息存储在哪里,也就是说要知道提供这些信息的服务器在Internet上的地址,然后通过该地址去访问服务器提供的信息。在Internet上,www信息资源的一般查询方法有:基于超文本的信息查询、基于目录的信息查询和基于搜索引擎的信息查询。
1.基于超文本的信息查询通过超文本链接逐步遍历庞大的Internet,从一个www服务器到另一个www服务器,从一个目录到另一个目录,从一篇文章到另一篇文章,浏览查找所需信息的方法称为浏览,也称基于超文本的信息查询方法。上一页下一页返回3.1Internet信息资源检索
基于超文本的浏览模式是一种有别于传统信息检索技术的新型检索方式,它已成为Internet上最基本的查询模式。利用浏览模式进行检索时,用户只需以一个节点作为入口,根据节点中文本的内容了解嵌入其中的热链指向的主题,然后选择自己感兴趣的节点进一步搜索。在搜索过程中,用户会发现许多相关的节点内容根本没被自己所预想到,而是在浏览过程中不断蹦出来,提醒用户注意它。随着www服务器的急剧增加,通过一步步浏览来查找所需信息已非常困难。为帮助用户快速方便地搜寻所需信息,各种www信息查询工具便应运而生,其中最有代表性的是基于目录和基于搜索引擎的信息查询工具,而利用这些工具来查找信息的方法就被称为基于目录和基于搜索引擎的信息查询方法。上一页下一页返回3.1Internet信息资源检索2.基于目录的信息查询为了帮助Internet上用户方便地查询到所需要的信息,人们按照图书馆管理书目的方法设置了目录。网上目录一般以主题方式来组织,大主题下又包括若干小主题,这样一层一层地查下去,直到比较具体的信息标题。目录存放在www服务器里,各个主题通过超文本的方式组织在一起,用户通过目录最终可得到所需信息的网址,即可到相应的地方查找信息,这种通过目录帮助的方法获得所需信息的网址继而查找信息的方法称为基于目录的信息查询方法。有许多机构专门收集Internet上的信息地址,并编制成目录提供给网上用户。Yahoo就是一个非常著名的基于目录帮助的网址,其目录按照一般主题组织,顶层按经济、计算机、教育、政治、新闻、科学等分成14大类目录,每一大类又分成若干子类,层层递进。上一页下一页返回3.1Internet信息资源检索3.基于搜索引擎的信息查询搜索引擎又称www检索工具,是www上的一种信息检索软件。www检索工具的工作原理与传统的信息检索系统类似,都是对信息集合和用户信息需求集合的匹配和选择。基于搜索工具的检索方法接近于人们通常所熟悉的检索方式,即输入检索词以及各检索词之间的逻辑关系,然后检索软件根据输入信息在索引库中搜索,获得检索结果(在Internet上是一系列节点地址)并输出给用户。搜索引擎实际上是Internet的服务站点,有免费为公众提供服务的,也有进行收费服务的。不同的检索服务可能会有不同界面、不同的侧重内容,但有一点是共同的,就是都有一个庞大的索引数据库。这个索引库是向用户提供检索结果的依据,其中收集了Internet上数百万甚至数千万主页信息,包括该主页的主题、地址,包含于其中的被链接文档主题,以及每个文档中出现的单词的频率、位置等。上一页返回3.2搜索引擎及其使用Internet是一个广阔的信息海洋,漫游其间而不迷失方向有时是相当困难的。如何快速准确地在网上找到需要的信息已变得越来越重要。搜索引擎(SearchEngine,SE)是一种Internet信息检索工具,在浩瀚的网络资源中,它能帮助用户迅速而全面地找到所需要的信息。下一页返回3.2搜索引擎及其使用一、搜索引擎的基本概念搜索引擎是一种能够通过Internet接受用户的查询指令,并向用户提供符合其查询要求的信息资源网址的系统。它是一些在Web中主动搜索信息(网页上的单词和特定的描述内容)并将其自动索引的Web网站,其索引内容存储在可供检索的大型数据库中,建立索引和目录服务。一些搜索引擎搜索网页的每一个单词,而另一些搜索引擎则只搜索网页的前200-500个单词。当用户输入关键词(Keyword)查询时,该搜索引擎会告诉用户包含该关键词信息的所有网址,并提供通向该网络的链接。搜索引擎既是用于检索的软件,又是提供查询、检索的网站。所以,搜索引擎也可称为Internet上具有检索功能的网页。上一页下一页返回3.2搜索引擎及其使用
搜索引擎源于1990年由蒙特利尔大学学生AlanEmtage发明的Archie。Archie是依靠脚本程序自动搜索网上的文件,然后对有关信息进行索引,供使用者以一定的表达式查询。而最早现代意义上的搜索引擎出现于1994年7月,MichaelMauldin创建了著名的Lycos。同年4月,斯坦福(Stanford)大学的两名博士生,DavidFilo和美籍华人杨致远(GerryYang)共同创办了超级目录索引Yahoo。此后搜索引擎进入了高速发展时期。目前,互联网的搜索引擎已达数百家,其检索的信息量也是相当庞大的,如Google,其数据库中存放的网页已达24亿之多。上一页下一页返回3.2搜索引擎及其使用二、搜索引擎主要任务各种搜索引擎的主要任务都包括以下3个方面。1.信息搜集各个搜索引擎都派出绰号为网络蜘蛛(Spides)或自动采集器(Robots)的“网页搜索软件”,在各网页中爬行,访问网络中公开区域的每一个站点并记录其网址,将它们带回搜索引擎,从而创建出一个详尽的网络目录。由于网络文档的不断变化,机器人也不断地把以前已经分类组织的目录更新。上一页下一页返回3.2搜索引擎及其使用2.信息处理将“网页搜索软件”带回的信息进行分类整理,建立搜索引擎数据库,并定时更新数据库内容。在进行信息分类整理阶段,不同的搜索引擎会在搜索结果的数量和质量上产生明显的差异。有的搜索引擎把“网页搜索软件”发往每一个站点,记录下每一页的所有文本内容,并收入到数据库中从而形成全文搜索引擎;而另一些搜索引擎只记录网页的地址、篇名、特定的段落和重要的词。故有的搜索引擎数据库很大,而有的则较小。当然,最重要的是数据库的内容必须经常更新、重建,以保持与信息世界的同步发展。上一页下一页返回3.2搜索引擎及其使用3.信息查询每个搜索引擎都必须向用户提供一个良好的信息查询界面,一般包括分类目录及关键词两种信息查询途径。分类目录查询是以资源结构为线索,将网上的信息资源按内容进行层次分类,使用户能依线性结构逐层逐类检索信息。关键词查询是利用建立的网络资源索引数据库向网上用户提供查询“引擎”。用户只要把想要查找的关键词或短语输入查询文本框中,并单击Search按钮,搜索引擎就会根据输入的提问,在索引数据库中查找相应的词语,并进行必要的逻辑运算,最后给出查询的命中结果(均为超文本链接形式)。用户只要通过搜索引擎提供的链接,就可以立刻访问到相关信息。上一页下一页返回3.2搜索引擎及其使用三、搜索引擎的种类划分随着搜索引擎的数量剧增,其种类也越来越多。它们可以按照工作语种、内容组织方式及搜索范围等方式加以划分。1.按搜索工作语种划分搜索引擎按工作语种可以划分为下列类型。
(1)单语种搜索引擎。单语种搜索引擎是指搜索时只能用一种语言查询的搜索引擎。
(2)多语种搜索引擎。多语种搜索引擎是指那些可以用多种语言查询的搜索引擎。如Altavista,该网站可以用25种语言进行查询。上一页下一页返回3.2搜索引擎及其使用2.按搜索工作范围划分搜索引擎按搜索范围可以划分为下列类型。
(1)独立搜索引擎。这类搜索引擎检索时只在自己的数据库内进行,由其反馈出相应的查询信息,或者是相链接的站点指向。每个独立的搜索引擎都会有自己的查询特色,如目录查询、全文查询、简单查询、高级查询等。
(2)多元搜索引擎。多元搜索引擎又称集成搜索引擎。它是将多个独立搜索引擎集合在一起,提供一个统一的检索界面,当用户提出检索提问后,它会将其发送给多个搜索引擎,同时检索多个数据库,并进行相关度排序后,将结果显示给用户。利用这类搜索引擎能够获得更大范围的信息源,检索的综合性、全面性也有所提高。不过这样的搜索引擎的缺点是查询时间相对较长。上一页下一页返回3.2搜索引擎及其使用3.按搜索工作方式划分搜索引擎按其工作方式可以划分为下列类型。
1)全文搜索引擎全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google,Fast/AllTheWeb,AltaVista,Inktomi,Teoma,WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此它们是真正的搜索引擎。从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“网络蜘蛛”(Spider)程序或“自动采集器”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7种搜索引擎;另一种则是租用其他搜索引擎的数据库,并按自定的格式排列搜索结果,如Lycos。上一页下一页返回3.2搜索引擎及其使用2)目录索引目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎,其他著名的还有OpenDirectoryProject(DMOZ)、LookSmart、About等,国内的搜狐、新浪、网易搜索也都属于这一类。
3)元搜索引擎元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace,Dogpile,Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。上一页下一页返回3.2搜索引擎及其使用四、搜索引擎的一般原理搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。真正意义上的搜索引擎,通常指的是收集了因特网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。在经过复杂的算法进行排序后,这些结果将按照与搜索关键词的相关度高低,依次排列。搜索引擎的原理,可以看作3步:从互联网上抓取网页-->建立索引数据库-->在索引数据库中搜索排序。上一页下一页返回3.2搜索引擎及其使用1.从互联网上抓取网页利用能够从互联网上自动收集网页的spider系统程序,自动访问互联网,并沿着任何网页中的所有URL爬到其他网页,重复这个过程,并把爬过的所有网页收集回来。2.建立索引数据库由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其他网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。上一页下一页返回3.2搜索引擎及其使用3.在索引数据库中搜索排序当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。最后,由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户。上一页下一页返回3.2搜索引擎及其使用五、搜索引擎评价指标在传统信息检索中,衡量系统的基本指标为:查全率(Recall)和查准率(Pricision)。查全率是检索出的相关文档数和文档库中所有的相关文档数的比率;查准率是检索出的相关文档数与检索出的文档总数的比率。对于一个检索系统来讲,召回率和精度不可能两全其美:召回率高时,精度低;精度高时,召回率低。对于搜索引擎系统来讲,因为没有一个搜索引擎系统能够搜集到所有的Web网页,所以召回率很难计算。由于互联网海量信息的特征,查询返回的结果大都非常多,因此目前的搜索引擎系统都非常关心精度。同时,互联网的信息是动态变化的,搜索引擎必须反映这种变化。上一页下一页返回3.2搜索引擎及其使用
简单来讲,搜索引擎要满足用户对信息查询的需求,提高用户的搜索体验。以下是几个比较重要的指标。
(1)网页覆盖率。提高查全率,是保证查准率的基础。
(2)返回结果的准确性,主要是第一页结果的准确性。大部分用户仅仅察看搜索结果的第一页。
(3)重复信息返回的过滤。返回结果应该尽可能不出现重复、类似的结果。
(4)网页更新速度。取决于新网页的发现和死链(指无法访问的网页)的及时删除。结果中大量的死链和过时信息的链接,将会降低用户体验。
(5)搜索服务的相应时间,也就是用户提交检索后得到结果返回的等待时间,一般要低于1秒即可。
(6)搜索服务的系统稳定性。上一页下一页返回3.2搜索引擎及其使用六、搜索引擎的一般规则利用搜索引擎既可以检索出Internet上的文献信息,还可以查找到公司和个人的信息;既可以通过输入单词、词组或短语进行检索,还可以使用逻辑算符及位置算符等对多个词进行组合检索;既可以以词语查询有关主题的页面信息,也可以以特定的域名、主机名、URL等查找有关的网站信息。搜索引擎是基于一些基本的查询规则来实现这些查询条件的,但下面介绍的是常用的一般查询规则。上一页下一页返回3.2搜索引擎及其使用1.空格、逗号、括号、引号的作用
1)空格空格的作用与逻辑“与”(and)相同。例如:检索式aircraftengine,表示可查出含有aircraft及engine的页面。在汉字作为关键词输入时,切记不要在构成关键词的两个字之间插入空格,否则,就会发生两个字之间进行逻辑“与”的检索错误。例如:用户要查找“飞机”这个关键词,但却输入了“飞机”,由于“飞”和“机”两字之间插入了空格,而被处理为“与”的关系,查出所有同时含有“飞”和“机”两个字的页面。这个检索结果的范围要比“飞机”作关键词的结果扩大了很多,许多结果中已不含有与“飞机”相关的信息。上一页下一页返回3.2搜索引擎及其使用2)逗号逗号(,)的作用类似于逻辑“或”(or),也是查找那些至少含有一个指定关键词的页面。区别是检索结果输出时,包含指定关键词越多的页面,其排列的位置越靠前。例如,检索式“计算机,网络,多媒体”,可查出包含3个关键词中的任何一个或几个的页面,而同时含有“计算机”、“网络”和“多媒体”的页面输出时排在前面。
3)括号括号“()”的作用是使括在其中的运算符优先执行,用于改变复杂检索式中固有逻辑运算符优先级的次序。例如,检索式“多媒体and(计算机or网络)”,表示要求先执行括号中的“or”运算,再执行括号外的“and”运算。上一页下一页返回3.2搜索引擎及其使用4)引号引号(“”)的作用是,括在其中的多个词被当作一个短语来检索。绝大部分主要搜索引擎都支持短语检索,找到含有与短语词序和意义完全相同的页面。例如,检索式“electronicmagazine",表示把electronicmagazine当作一个短语来搜索。如果不加引号,搜索引擎就会把两词之间的空格按“与”处理,查出包含electronic和magazine的页面,结果应与用户要求的主题内容相去甚远。上一页下一页返回3.2搜索引擎及其使用2.限定字段检索限定字段检索,即限定检索词在搜索引擎数据库中某个字段范围进行查找,如网页标题、站点、网址、链接等。
1)标题检索标题检索就是在网页的标题中查找输入的检索词,使用的命令一般是“title",其格式如下。
title:检索式例如,title:marstitle:marslandingstitle:“marslandings"上一页下一页返回3.2搜索引擎及其使用2)站点检索站点检索就是在网站地址域名中检索输入的词,以查找用户指定站点上的所有页面。使用的命令一般是“host",其格式如下。
host:域名中的词例如,检索式“host:",表示可以检索出www服务器中主机名为"”的网页。假如想要查找关于火星着陆方面的资料,并且只想在教育网站(后缀为.edu)中查找,可以输入检索式“marslandings“+host:edu。上一页下一页返回3.2搜索引擎及其使用
3)URL检索有些搜索引擎提供在URL的文本中进行检索的功能,这和站点检索非常相似。使用的命令一般是“url",其格式如下。
url:URL中的词例如,检索式“url:home.html”可以检索出在网页地址中含有“home.html"的页面。
4)链接检索链接检索就是在与特定网页或域有链接的所有网页中进行检索。使用的命令一般是“link",其格式如下。
link:特定网页或域中的词例如,检索式“link:thomas.gov”可以检索出与“thomas.gov”至少有一次链接的页面。搜索引擎除遵循上述查询规则外,还应遵循布尔逻辑检索、位置检索、截词检索等技术规则(详见第二章)。上一页下一页返回3.2搜索引擎及其使用
七、搜索引擎不等于信息检索搜索引擎使用自动索引软件来发现、收集、标引网页并建立数据库,以Web形式提供给用户一个检索界面,搜集的信息资源丰富,更新速度快,方便易用,但准确性较差,检索噪音大,另外一个不同在于搜索引擎有不同的检索策略,给用户造成不便。搜索引擎不等于信息检索,将信息检索等同于使用搜索引擎就陷入了误区。上一页返回3.3常用中文搜索引擎
随着Internet在中国的普及和发展,网上中文信息资源和以中文为母语的网上用户也在急剧增加,已有的外文搜索引擎已不能适应我国上网的大部分用户的需求,迫切需要以中文为基础的搜索引擎来满足网上用户查询中文信息资源的要求。于是许多以中文为母语的国家和地区都相继开发出了各种各样的中文搜索引擎,据统计,目前已有中文搜索引擎200多个。由于网上的中文信息迅速膨胀,因此,世界级的网站都纷纷涉足中文信息市场。美国一些著名的搜索引擎公司,如Yahoo,Altavista,Lycos,Excite等先后推出中文版的搜索引擎,全面进军中国的搜索引擎市场。下面介绍几个主要的中文搜索引擎。下一页返回3.3常用中文搜索引擎
一、百度搜索引擎目前,百度()是世界上规模最大的中文搜索引擎,于1999年底由李彦宏及徐勇创建于美国硅谷。2000年1月,百度公司在中国成立了它的全资子公司百度网络技术(北京)有限公司,随后于同年10月成立了深圳分公司,2001年6月又在上海成立了上海办事处。2005年8月5日晚11点40分,百度公司正式在美国NASDAQ挂牌上市,目前市值约30多亿美元。上一页下一页返回3.3常用中文搜索引擎
百度搜索引擎使用了高性能的“网络蜘蛛”程序自动地在互联网中搜索信息,可定制、高扩展性的调度算法使得搜索器能在极短的时间内收集到最大数量的互联网信息。百度在中国各地和美国均设有服务器,搜索范围涵盖了中国大陆、香港、台湾、澳门,新加坡等华语地区以及北美、欧洲的部分站点。百度搜索引擎拥有目前世界上最大的中文信息库,总量超过8亿页以上,并且还在以每天几十万页的速度快速增长。上一页下一页返回3.3常用中文搜索引擎1.基本搜索百度搜索引擎简单方便,仅需输入查询内容并按回车键(Enter),即可得到相关资料。或者输入查询内容后,单击“百度搜索”按钮,也可得到相关资料。百度搜索引擎基本搜索页面如图3-1所示。输入的查询内容可以是一个词语、多个词语、一句话。例如:可以输入李白;mp3下载;蓦然回首,那人却在,灯火阑珊处。百度搜索引擎严谨认真,要求“一字不差”。例如:分别搜索舒淇和舒琪,会得到不同的结果。因此在搜索时,可以试用不同的词语。上一页下一页返回3.3常用中文搜索引擎2.使用两个以上搜索词的检索逻辑
1)逻辑“与”百度的逻辑“与”使用词间空格,即检索词之间留一个空格,其含义为使空格前后的两个检索词在同一个网页中出现。输入以空格分割的多个检索词搜索,可以获得更丰富的搜索结果。例如,搜索数字图像处理,可以找到数十万篇网页,而搜索数字图像处理,则只有严格含有“数字图像处理”连续6个字的网页才能被找出来。因此,要查的检索词较为冗长时,应将它拆成几个检索词来搜索,词与词之间用空格隔开。不过,多数情况下,输入两个检索词搜索,就已经有很好的搜索结果。上一页下一页返回3.3常用中文搜索引擎2)逻辑“或”逻辑“或”用于扩展检索范围。百度的逻辑“或”使用“|”。例如:要查询“图片”或“写真”相关资料,无须分两次查询,只要输入图片|写真搜索即可。百度会提供跟“|”前后任何检索词相关的网站和资料。
3)逻辑“非”逻辑“非”用于排除含有某些词语的资料,以缩小查询范围。百度的逻辑“非”使用“-”,但减号之前必须留一空格,语法是“A-B;。例如,要搜寻关于“武侠小说”,但不含“古龙”的资料,可搜索武侠小说-古龙(注意,前一个关键词,和减号之间必须有空格,否则,减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间有无空格均可)。上一页下一页返回3.3常用中文搜索引擎3.限定字段搜索
1)在指定网站内搜索有时候,如果知道某个站点中有自己需要找的东西,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式是在查询内容的后面加上“Site:站点域名”。例如,天空网下载软件不错,就可以查询site:skycn.com。注意,"Site后面跟的其站点域名,不要带“http://”和“/”符号;另外,"site"”和站点名之间不要带空格。上一页下一页返回3.3常用中文搜索引擎2)在标题中搜索网页标题通常是对网页内容提纲掣领式的归纳。把查询内容范围限定在网页标题中,有时能获得良好的效果。使用的方式是把查询内容中特别关键的部分用"intitle:"领起来。例如,找林青霞的写真,就可以查询写真intitle:林青霞。注意,"intitle:"和后面的关键词之间不要有空格。上一页下一页返回3.3常用中文搜索引擎
3)在网址中搜索网页url中的某些信息,常常有某种有价值的含义。于是,如果对搜索结果的url作某种限定,就可以获得良好的效果。实现的方式是用“inurl:",后跟需要在url中出现的关键词。例如,找关于Photoshop的使用技巧,可以查询photoshopinurl:jiqiao。上面这个查询串中的“photoshop”可以出现在网页的任何位置,而“jiqiao"则必须出现在网页url中。注意,“inurl:”和后面所跟的关键词(拼音、汉字、英文等)之间不要有空格。上一页下一页返回3.3常用中文搜索引擎4)精确匹配—双引号、书名号如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果。例如,搜索上海科技大学,如果不加双引号,搜索结果被拆分,效果不是很好,但加上双引号后,“上海科技大学”,获得的结果就全是符合要求的了。书名号是百度独有的一个特殊查询语法。在其他搜索引擎中,书名号会被忽略,而在百度,中文书名号是可被查询的。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。书名号在某些情况下特别有效果,例如,查名字很通俗和常用的那些电影或者小说。比如,查电影“手机”,如果不加书名号,很多情况下出来的是通信工具—手机,而加上书名号后,《手机》结果就都是电影方面的了。上一页下一页返回3.3常用中文搜索引擎5)利用后缀名来搜索电子书网络资源丰富,有极多电子书。人们在提供电子书时,往往带上书的后缀名。因此,可以利用后缀名来搜索电子书。例如:存在与虚无chm,菜根谭exe,水煮三国chm。上一页下一页返回3.3常用中文搜索引擎4.高级搜索、地区搜索和个性设置如果对百度各种查询语法不熟悉,可以使用百度集成的高级搜索界面,方便地作各种搜索查询。百度还支持对某个地区的网页进行搜索。进人高级搜索,进入地区搜索,选中希望查询的地区,就可以在该地区搜索了。还可以根据自己的习惯,改变百度默认的搜索设定,如每页搜索结果数量,搜索结果的页面打开方式等。先进入个性设置(如图3-2所示),然后单击下方的“保存设置”按钮,就可以进行设定了。上一页下一页返回3.3常用中文搜索引擎5.百度的特色功能
1)天气查询百度支持全国多达400多个城市和近百个国外著名城市的天气查询。在百度搜索文本框中输入要查询的城市名称加上天气这个词,就能获得该城市当天的天气情况。例如,搜索北京天气,就可以在搜索结果中看到北京今天的天气情况。上一页下一页返回3.3常用中文搜索引擎2)专业文档搜索很多有价值的资料,在互联网上并非是普通的网页,而是以Word,PowerPoint,PDF等格式存在的。百度支持对Office文档(包括Word,Excel,PowerPoint),AdobePDF文档、RTF文档进行全文搜索。要搜索这类文档,很简单,在普通的查询词后面,加一个“filetype;”文档类型限定。"filetype;”后可以跟以下文件格式:DOC,XLS,PPT,PDF,RTF,ALL。其中,ALL表示搜索所有这些文件类型。例如,查找计算机网络方面的论文,可以输入检索式“计算机网络filetype:doc",点击结果标题,直接下载该文档,也可以点击标题后的“HTML版”快速查看该文档的网页格式内容。也可以通过百度文档搜索界面(http://file.baidu.com,直接使用专业文档搜索功能。上一页下一页返回3.3常用中文搜索引擎6.百度其他搜索服务
1)百度地图搜索百度联合国内知名的电子地图服务提供商MAPBAR.COM推出的本地化地图搜索服务。通过百度地图搜索(http://map.baidu.com/),可以找到指定的城市、城区、街道、建筑物等所在的地理位置,也可以找到最近的所有餐馆、学校、银行、公园等。百度地图搜索还提供了路线查询功能,如果要去某个地点,百度地图搜索会提示用户如何换乘公交车,如果想自己驾车去,百度地图搜索同样会为用户推荐最佳路线。上一页下一页返回3.3常用中文搜索引擎2)百度手机百度手机(http://mobile.baidu.com/)汇集了国内多家移动增值服务提供商提供的移动增值产品资源,面向所有手机移动终端用户提供检索服务。热门铃声、亲情点歌、缤纷彩铃、热辣彩图、传情动画、时尚资讯,为手机娱乐、手机生活增添更加精彩的一笔。
3)百度影视百度影视(http://movie.baidu.com/)是百度汇集了国内多家著名宽频影视服务提供商的影视片资源,面向互联网所有用户提供宽带视频检索服务。网民注册后可以通过百度影视搜索到上万部影片、专题片及电视剧,并可在线观看或下载观看。上一页下一页返回3.3常用中文搜索引擎二、Google搜索引擎
Google(谷歌)(.hk)是从第一代搜索引擎中脱颖而出的第二代搜索引擎的代表。1998年,两位斯坦福大学的博士生LarryPage和SergeyBrin创立了Google,它的使命就是要为用户提供网上最好的查询服务,促进全球信息的交流。Google开发出r世界上最大的搜索引擎,提供了最便捷的网上信息查询方法。通过对20多亿网页进行整理,可为世界各地的用户提供适合需要的搜索结果,而且搜索时间通常不到半秒。现在,Google每天需要提供1.5亿次查询服务。Google因其富于创新的搜索技术和典雅的用户界面设计而获得多项殊荣,目前被公认为万维网上最大的搜索引擎,它提供了简单易用的免费服务,使用户能够访问一个包含超过80亿个网址的索引。上一页下一页返回3.3常用中文搜索引擎
中文谷歌搜索界面如图3-3所示。
1.Google搜索常用方法
1)分类搜索在Google首页左上方点击“更多”,在弹出的下拉菜单中选择“更多”选项,进入“更多谷歌产品”页面,选择“网页目录”,即可进入Google分类目录检索界面(.hk/dirhp?hl=zh-CN,如图3-4所示)。Google网页目录是依网页主题归类,分为休闲、体育、健康、参考、商业、地区、家庭、新闻、游戏、社会、科学、艺术、计算机、购物等大类,每个大类又细分为若干小类。该目录里目前收录了来自150万个以上网站的网页,用户可按相关类目进行检索。例如,在Google目录的科学>天文学类别中搜索“土星”,可以找到只与土星有关的信息。上一页下一页返回3.3常用中文搜索引擎2)关键词搜索
Google关键词检索分为基本搜索和高级搜索,其高级搜索如图3-5所示。
(1)基本搜索:Google基本搜索界面(如图3-3所示)查询简洁方便,仅需输入查询内容并按回车键(Enter),或单击“Google搜索”按钮即可得到相关资料。Google查询严谨细致,能帮助用户找到最重要、最相关的内容。其中“手气不错”功能,提供可能最符合要求的网站。例如,当Google对网页进行分析时,它也会考虑与该网页链接的其他网页上的相关内容。Google还会先列出那些搜索关键词相距较近的网页。上一页下一页返回3.3常用中文搜索引擎(2)高级搜索:Google高级搜索(.hk/advancedsearch?hl=zh-CN)界面(如图3-5所示)为用户提供多种搜索限定选项,用户根据需要实现将搜索范围限制在某个特定的网站中,排除某个特定网站的网页,搜索限制于某种指定的语言,查找链接到某个指定网页的所有网页,查找与指定网页相关的网页,限定关键词位置、搜索结果更新时间、文档类型等功能。上一页下一页返回3.3常用中文搜索引擎2.Google搜索常用规则
(1)Google对多关键字搜索时,自动使用“and”进行查询,不需要在关键词之间加上“and”或“+”。如果想缩小搜索范围,只需输入更多的关键词,只要在关键词中间留空格就行了。
(2)Google会忽略最常用的词和字符,如“http"、“.com”和“的”等字符以及数字和单字,这类字词不仅无助于缩小查询范围,而且会极大地降低搜索速度。使用英文双引号可将这些忽略词强加于搜索项,例如:输入“柳堡的故事”时,加上英文双引号会使“的”强加于搜索项中。上一页下一页返回3.3常用中文搜索引擎(3)Google运用智能型汉字简繁自动转换系统,为用户找到更多相关信息。这个系统不是简单的字符变换,而是简体和繁体文本之间的“翻译”转换。例如简体的“计算机”会对应于繁体的“电脑”。当用户搜索所有中文网页时,Google对搜索项进行简繁转换后,会同时检索简体和繁体网页,并将搜索结果的标题和摘要转换成和搜索项的同一文本,便于阅读。
(4)Google不支持“通配符”(*)搜索。也就是说,Google只搜索与输入的关键词完全一样的字词。例如:搜索“googl”或“googl*",不会得到类似"googler”或“googlin”的结果。如需查找单复数、不同拼写或不同词形的概念,应分别输入进行检索。
(5)Google搜索不区分英文字母大小写。所有的字母均当作小写处理。例如:搜索“google","GOOGLE”或“GoOgLe",得到的结果都一样。上一页下一页返回3.3常用中文搜索引擎
3.Google搜索特殊功能
(1)查找特定文件。除一般网页外,Google现在还可以查找某些特定的文件,如DOC,XLS,PPT,PDF,RTF,PS,SWF,DWF,DMZ,DML文件,使用时只需在关键字后加“+filelype:文档类型”就可以,如查找关键字为“计算机”的Word文档类型,输入“计算机+filetype:DOC",搜索结果为关键字为“计算机”的Word文档。如果只想查找一般网页,不想查找某特定文件,则把“+filetype:”中的“+”改为“-”即可。
(2)按链接搜索。有一些词后面加上冒号对Google具有特殊的含义。其中的一个词是“link。查询“link:"显示所有指向该网址的网页。例如“link:”将找出所有指向Google主页的网页。不能将“link:”搜索与普通关键词搜索结合使用。上一页下一页返回3.3常用中文搜索引擎(3)指定网域。有一些词后面加上冒号对Google有特殊的含义。其中的一个词是“site:"。要在某个特定的域或站点中进行搜索,可以在Google搜索文本框中输入“site:xxxxx.com"。
(4)手气不错。单击“手气不错”按钮将自动进人Google查询到的第一个网页,用户将完全看不到其他的搜索结果。使用“手气不错”进行搜索表示用于搜索网页的时间较少而用于检查网页的时间较多。例如,要查找东华理工大学的主页,只需在搜索字段中输入“东华理工大学”,然后单击“手气不错”按钮,Google将直接进入东华理工大学的官方主页http://www./。上一页下一页返回3.3常用中文搜索引擎4.学术搜索
Google学术搜索(Googlescholar)(.hk/schhp?hl=zh-CN)提供可广泛搜索学术文献的简便方法。可以从一个位置搜索众多学科和资料来源:来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的经同行评论的文章、论文、图书、摘要和文章。Google学术搜索可帮助用户在整个学术领域中确定相关性最强的研究。如今,可以通过Googlescholar直接搜索维普、万方数据库的资源,对于有权使用全文的用户可以直接下载全文。
Google学术搜索可以从一个位置方便地搜索各种资源,查找报告、摘要及引用内容,通过用户的图书馆或在Web上查找完整的论文,了解任何科研领域的重要论文。上一页下一页返回3.3常用中文搜索引擎5.地图搜索
Google地图搜索(Googlemap)(/?hl=zh-CN)为使用者提供强大、友善的地图技术以及本地公司资讯,包括公司位置、联络资讯以及行车路线指示。使用Google地图,可以享受下列独特功能。
(1)整合的商家搜寻结果。在同一个地方寻找商家位置与联络资讯,全部整合在地图中。例如,如果寻找“三联书店,北京”,相关商家资讯的位置与电话号码会显示在地图中。同时可以看到额外的资讯,例如营业时间、接受的付款方式以及评论。
(2)可拖动的地图。拖动地图可以立刻看到相邻的区域(不再需要等待下载新区域)。上一页下一页返回3.3常用中文搜索引擎(3)详细的路线指示。输入地址,然后让Google地图绘制位置和行车路线指示。可以将多个目的地新增到路线中,拖动路线以便加以自定来计划旅程,了解更多有关Google地图的行车路线指示。
(4)快捷键。用方向键可以向左、向右、向上与向下移位,用PageUp,PageDown,Home与End键可以用更大范围的距离移位,利用加号(+)与减号(一)按键可以放大或缩小。
(5)双击使用缩放功能,左键双击可以放大,右键双击可以缩小(Mac的使用者请使用Ctrl+双击)。
(6)滚轮缩放,使用鼠标的滚轮可以放大与缩小地图。上一页下一页返回3.3常用中文搜索引擎三、中国雅虎搜索引擎中国雅虎()是美国"Yahoo!”公司于1998年5月推出的中文搜索引擎,提供中文简体与中文繁体两种版本。中国内地的站点一般使用简体中文,而中国香港与中国台湾地区的站点一般使用繁体中文。中国雅虎搜索采用雅虎全球性搜索技术,拥有涵盖了30多亿中文网页的搜索数据库,并且有效结合了多种搜索平台,为用户提供了更多有特色的搜索服务:拼音搜索、专业文档搜索、天气查询、IP和手机号码归属地查询、日历查询、学校搜索、政府搜索、股票查询、官网查询等。中国雅虎主页(如图3-6所示)提供和英文版相同的检索方法:网页搜索与全能搜索。上一页下一页返回3.3常用中文搜索引擎1.网页搜索网页搜索(如图3-6所示)是基于文本信息的全网搜索形式,如果用户已知要查找内容的主题概念,就可以利用关键词检索方式。在检索文本框中输入要找的关键词,然后单击“搜索”按钮,中国雅虎就会在数据中查找与关键词匹配的记录,并将符合检索条件的结果显示出来。使用关键词检索还有简单方法与复杂方法之分。简单方法就是将关键词直接输入检索文本框中,可以输入一个词也可以输入几个词,并对检索要求不加限制,系统在处理时会按照自身的规则将用户的查询字符串分为几个部分,这样返回的结果可能与用户想要的相差甚远。上一页下一页返回3.3常用中文搜索引擎复杂方法就是利用字段限定符号和限制选项构建复杂的检索表达式来进行检索,这样会获得比较准确的查询结果。中国雅虎支持以下几种限定检索操作符。
(1)用引号(“”)来查询完全符合关键词字符串的网站。
(2)在关键词前加“t:”,搜索引擎仅限在网站名称中查找。
(3)在关键词前加“u:”,搜索引擎仅限在URL中查找。
(4)在关键词前加“+”,查询结果中一定要出现“+”号后面的字符串。
(5)在关键词前加“-”,查询结果中一定不能出现“-”号后面的字符串。上一页下一页返回3.3常用中文搜索引擎2.全能搜索用户在中国雅虎首页,不输入任何搜索词,单击“搜索”按钮进人雅虎全能搜索首页(/?loop=true),雅虎全能搜索(如图3-7所示)是基于Omni-Search技术架构对搜索体验的创新实践,通过对用户查询意图的智能分析,利用通用排序技术,在一个结果页中整合网页、图片、音频、视频、新闻等各种搜索产品,从而最大简化用户的搜索过程。雅虎全能搜索的Omni-Search技术架构,旨在打造跨平台(PC、手机和电视等)的智能型通用搜索引擎。雅虎全能搜索不仅包括了网页搜索功能,而且可以在多种信息形式(如图片、音频等)中进行搜索。上一页下一页返回3.3常用中文搜索引擎
雅虎全能搜索采用了雅虎独有的Omni一Search技术架构。用户无须了解各种垂直搜索产品,只要输入查询词,雅虎全能搜索就可以通过智能分析,返回各种相关结果(网页、图片、音频、博客等),并进行综合排序。目前,雅虎全能搜索还在起步阶段,未来将会有更多贴心的搜索功能陆续加入。上一页下一页返回3.3常用中文搜索引擎3.高级搜索语法
如果用户对雅虎各种查询语法熟悉,可以使用高级搜索语法实现各种搜索查询。
(1)"title:"——用于针对页面标题进行搜索。例如:搜索“title:张学友”,搜索引擎会搜索到所有网页标题中包含“张学友”的网页。由于网页的标题通常会准确的描述网页的内容,所以使用“title:”进行搜索的效果可能更精确。
title的释义:超文本窗口标题的开始和结束,它被显示在浏览器顶端的标题栏中。上一页下一页返回3.3常用中文搜索引擎(2)“link:'——用于查找所有链接到某个网址的网页。例如:①搜索“link:/",会搜索到所有链接到"”的网页。②搜索“姚明link:/”或者“link:/姚明”,会搜索到所有链接到“”的网页中,包含“姚明”一词的网页。注意:搜索时不能缺少“http://"。上一页下一页返回3.3常用中文搜索引擎(3)"site:"——用于限定搜索结果的来源。如果知道某个站点中有自己需要找的内容,就可以把搜索范围限定在这个站点中,提高查询效率。使用的方式,是在查询内容的后面,加上“site:站点域名”。例如:想查询雅虎网站中报道的姚明信息,可以有以下两种方法。①在搜索文本框中输入“姚明site:"(注意中间使用空格隔开)。搜索引擎会搜索到在域名“”及其子域名中的所有包含“姚明”一词的网页。②在搜索文本框中输入“site:姚明",也可以得到相同的搜索结果。注意:"site:”后面跟的站点域名,不要带“http://”;另外,"site:”和站点名之间,不要加空格。上一页下一页返回3.3常用中文搜索引擎(4)"hostname:"——用法与“site:”相同,只不过使用“hostname:”时搜索到的结果是在当前域名下的网页,而不包括其子域名中的网页。
(5)"url:——用于精确搜索url。例如:搜索“url:http://",搜索引擎只会搜索到一个结果——雅虎中国。上一页下一页返回3.3常用中文搜索引擎4.中国雅虎的特色搜索
1)使用拼音搜索如果不清楚某个词语的写法,可以直接输入拼音进行查询,中国雅虎网页搜索会自动提示相应的查询字。例如:想搜索“李宇春”可以输入“liyuchun”进行搜索。
2)日历搜索中国雅虎网页搜索提供的日历查询功能,可以查询到各种节日及年份的详细情况。例如:输入“国庆节”,搜索引擎返回节日详细名称、时间、星期、农历、干支及生肖等信息。当用户选择的查询词里面不包含年份的时候,搜索引擎就会自动将其默认为是本年度的公农历转换。上一页下一页返回3.3常用中文搜索引擎3)天气搜索中国雅虎网页搜索可以随时查询天气情况。在搜索文本框中输入要查询的城市名,然后空格,再加上天气这个词(可以将城市名和天气调换位置),就能获得该城市三天的天气情况。例如:搜索“北京天气”或者“天气北京”,搜索引擎就会返回北京当天的天气情况。
4)列车时刻搜索中国雅虎网页搜索提供的列车时刻查询功能,可以快速地查询到两个城市间的直达或换乘列车信息,以及具体车次的详细信息,让用户的出行更加方便。例如:查询北京到上海的车次信息。可以选择查询词为“北京到上海”或者是“北京到上海列车时刻表”,即可搜索到关于北京到上海的所有列车情况,点击车次名称可以查看到更详细的车次信息。上一页下一页返回3.3常用中文搜索引擎5)股票搜索中国雅虎网页搜索提供给用户的股票查询功能,很大程度提高了用户查询股票信息的效率。当选择的查询词为“股市行情”、“股票名称+走势”或“股票代码”等相关内容时,结果页最上方就是想查看的相关信息。点击标题或者是摘要中的某条链接,可以进入到雅虎财经频道查看更详细的内容。上一页下一页返回3.3常用中文搜索引擎四、天网搜索引擎天网搜索()的前身是北大天网()。北大天网由北京大学网络实验室研究开发,是国家重点科技攻关项目“中文编码和分布式中英文信息发现”的研究成果。北大天网于1997年10月29日正式在CERNET上向广大互联网用户提供Web信息搜索及导航服务,是国内第一个基于网页索引搜索的搜索引擎。北大天网见证了中国互联网和中文搜索引擎发展的历史并参与其中,它是国内中文搜索领域的一面旗帜。天网搜索引擎提供一种检索Web资源(主要是中国教育和科研计算机网上的Web资源)及FTP的手段。用户只需输入要检索的一个或多个关键词,系统就会把与这些关键词相匹配的网站或新闻组中的文章查找出来。上一页下一页返回3.3常用中文搜索引擎1.www搜索
1)简单查询在天网主页(如图3-8所示)上,用户在文本框中输入想要查询的关键词,然后选中“网页”单选按钮即可。
2)复杂查询用户可以对多个查询词进行逻辑操作实现复杂查询,www查询支持下面3种逻辑操作。
(1)“&”,用“A&B”进行查询的结果是既包含查询词A又包含查询词B的文章。
(2)“一-”,用“A-B”进行查询的结果是包含查询词A而不包含查询词B的文章。
(3)“|”,用“A|B”进行查询的结果是至少包含A和B中一个查询词的文章。上一页下一页返回3.3常用中文搜索引擎2.FTP搜索在天网主页选中“FTP资源”单选按钮进入FTP检索页面(如图3-9所示)1)从首页访问天网FTP搜索引擎在图3-9所示页面的文本框中输入要查询的文件名,可以包含“*”(通配所有字符)、“?”号(通配一个字符)、空格(表示几个查询的“与”号)。单击“天网搜索”按钮即可得到查询结果。上一页下一页返回3.3常用中文搜索引擎2)常用功能的FTP搜索天网文件搜索既搜索FTP文件也搜索www文件。天网文件搜索引擎已经是国内最为大型的FTP搜索引擎,也是国际上名列前茅的FTP搜索引擎,目前搜集了2万多个FTP站点,为2000万文件条目建立索引,目前天网搜索引擎维护的文档数量达到6亿之多,并正在以平均每月1000万页文档的数量扩大着规模。天网搜索的中文文档数量超过4亿,其中包括html,txt,pdf,doc,ps,ppt等多种类型的文档和资源。上一页下一页返回3.3常用中文搜索引擎(1)简单搜索。使用方法与上相同。
(2)按类别搜索文件。在文本框里输入如上说明的匹配串,在“全部”下拉列表框中选择各种类型,如“图像”、“声音”、“视频”、“压缩”、“文档”、“程序”、“目录”、“源代码”,则搜索引擎在指定的类型里搜索文件。比如选择“图像”选项,则在所有的图像文件里查找与匹配串相符的文件。
(3)使用快捷方式。天网搜索引擎为用户常用的搜索提供户快捷方式,使用起来极为简单,直接选择快捷方式下的内容即可。目前快捷方式有“电影”、"MTV&动画片”、"MP3音乐”、"GIF动画”、"FLASH电影”。上一页下一页返回3.3常用中文搜索引擎五、其他中文搜索引擎简介1.中搜引擎中搜(原慧聪搜索)(http://www.zhongsou.corn)是国内领先的搜索引擎公司。2004年,桌面搜索引擎网络猪发布。提供桌面搜索、个性化定制新闻专题、行业资讯、对接即时通(IMU)、自写短信功能、智能搜索。中搜搜索界面如图3-10所示。上一页下一页返回3.3常用中文搜索引擎2.搜狗搜索引擎
2004年8月3日,搜狐正式推出全新独立域名专业搜索网站“搜狗”(),成为全球首家第三代中文互动式搜索引擎服务提供商。提供查找网站、网页、新闻、网址、软件、黄页等信息。搜狗搜索界面如图3-11所示。上一页下一页返回3.3常用中文搜索引擎
3.新浪搜索引擎新浪网搜索引擎()是面向全球华人的网上资源查询系统。提供网站、网页、新闻、软件、游戏等查询服务。网站收录资源丰富,分类目录规范细致,遵循中文用户习惯。目前共有16大类目录,一万多个细目和数十万个网站,是互联网上最大规模的中文搜索引擎之一。新浪搜索界面如图3-12所示。上一页下一页返回3.3常用中文搜索引擎4.有道搜索引擎有道搜索引擎(/)原为网易搜索引擎,是网易在国内首创的“网易开放式目录管理系统(ODP)”。提供网页搜索、分类网站、图片搜索、时尚搜索,其网页搜索结果由Google提供。有道搜索界面如图3一13所示。上一页下一页返回3.3常用中文搜索引擎5.读秀学术搜索读秀()既是一个知识库,又是一个面向全球的学术搜索引擎,合法用户可以通过读秀对图书、期刊、报纸、学位论文、会议论文等文献的题录信息、目录、全文内容进行搜索,尤其提供图书封面页、目录页、正文17页的试读,并且提供原文传送服务,是一个真正意义上的知识性搜索引擎。读秀搜索界面如图3-14所示。上一页返回3.4常用外国搜索引擎一、Altavista搜索引擎
Altavista()由前DEC公司于1995年开发,是Internet上最大的搜索引擎,在它的搜索数据中包含了2200万个主页、3000万个URL和13000个新闻组的全文信息。Altavista的搜索范围非常大,就连一些鲜为人知的偏僻站点也能找到,因此它的搜索结果十分丰富。所以,使用Altavista时,用户需要花更多的时间在搜索结果中寻找自己想要的信息。Altavista搜索主页如图3-15所示。
Altavista主页提供两种检索模式:分类目录检索和关键词检索。关键词检索模式又分为简单检索与高级检索两种方式。下一页返回3.4常用外国搜索引擎1.分类目录搜索
Altavista支持分类目录检索,用户可以根据要查找内容在分类目录中选择相应的类目,点击后出现该类目所包含的子类,这样只要逐级点击相应的类目便可检索到所需的信息。例如,要检索有关Intranetl技术的站点,可依次选择Directory->Computer&Internet->Network&Communication->Intranet->Technology,点击最后一级目录中的Technology链接,就会列出一系列有关Intranet技术的站点链接。上一页下一页返回3.4常用外国搜索引擎2.简单搜索使用简单检索方式,只需直接在检索
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 山东工程职业技术大学招聘考试真题2025
- 1.语法分析-自底向上的语法分析概述、简单优先方法
- 2029年工业烘房改造升级合同三篇
- 幼儿园大班数学教案40篇
- 解读《灵魂摆渡十年》完结口碑两极分化乱象
- (2026版)大学英语四级考试试题试卷及答案解析
- 学校结核病防治工作制度2篇
- 2026壁山事业编面试题及答案
- 2025年中国瓷盆单把双联水咀市场调查研究报告
- 2025年中国片式电容器全自动高速编带机市场调查研究报告
- 2026年辽宁锦州海通实业有限公司计划招录28人笔试模拟试题及答案详解
- 2026年高职老年人能力评估师(评估实操)试题及答案
- GB/T 35319-2025物联网系统接口要求
- 第十章食品添加剂
- GB/T 41906-2022超氧化物歧化酶活性检测方法
- 毕业设计-贯通测量方案设计
- 转录和转录组学课件
- 建设项目安全文明施工优秀做法展示(图文并茂)
- 投资心理学(第4版)
- 《生产设备日常点检表》
- 杀鼠剂中毒专题知识讲座
评论
0/150
提交评论