信息技术检索中科大第7章_第1页
信息技术检索中科大第7章_第2页
信息技术检索中科大第7章_第3页
信息技术检索中科大第7章_第4页
信息技术检索中科大第7章_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 因特网信息资源的检索1.因特网信息资源1.1概述对网络信息资源的不同认识:- 积极的;- 消极的。网上较丰富的信息内容:- 政府信息- 教育信息- 科研信息-文化信息- 商务信息-消闲娱乐信息1.1概述(2)特点:丰富,覆盖面广,涵盖各学科领域;超文本、超媒体、集成式地提供信息;信息来源分散、无序;没有统一的管理机构,没有统一的发布标准;变化、更迭、消亡等都时有发生;无限、无序、优劣混杂。更具优越性之处:- 新颖、深入;- 广泛、直接交流;- 非正式、自由;- 价廉。1.2因特网信息资源种类WWWTelnetFTPUsenet/NewsgroupLISTSERV/Mailing Lis

2、tGopherWAISWorld Wide Web简称WWW或Web,中文称万维网,它是世界范围的信息网络。WWW采用超文本(Hypertext)、超媒体(Hypermedia)技术,集网上文字、图像、声音、动画等多媒体信息为一体,以直观的图形界面向用户提供网络信息。利用Web浏览器,通过超链接(hyperlink)和统一资源定位器(Uniform Resource LocatorURL)可以简单、快速地浏览、查找并获取遍布全球的WWW信息资源。而且利用Web浏览器还可以轻松地访问Usenet、FTP、Gopher、WAIS等许多其他类型的网络资源。因此,WWW信息资源是互联网上最主要、最常见

3、的信息资源。 Telnet远程Telnet是Internet上较早使用的一种基本工具。它将用户注册到网上某一台主机上,使用户成为该主机的虚拟终端,共享该主机的资源和服务。例如进入BBS 经常也用Telnet工具,如Term2000, 图书馆的信息资料检索,如联机公共检索目录也可通过Telnet来实现。应用Telnet还可再连接到另一台主机上去访问其资源。Telnet的登录一般需要输入用户名和口令,最通用的是guest, public等,有时系统会给提示,有时不输入也可执行。 FTPFTP(File Transfer Protocol)是文件传输服务,通过FTP不仅可以从远程计算机上获取、下载文

4、件,也可以将文件从本地机上传到远程计算机上。通过FTP可获得电子图书、电子杂志、免费软件等许多类型的信息资源。FTP资源分记名和匿名两种,最常用的是匿名FTP,即以anonymous作用户名,用E-mail地址或guest作登录口令,登录到远程计算机上,再利用那里的资源。这种匿名访问,一般被限制在公共目录下(Public或Pub),且不能上传文件,只能浏览、下载那里的资源。BT资源Usenet/Newsgroup新闻组(Usenet Newsgroups)是一个巨大的信息集合,它按类别细分成许多小组,每个小组集中了对某类信息感兴趣的人们,大家在一起互相交流、讨论共同关心的话题,在此既可以向人请

5、教,也可以解答他人的问题。当遇到困难要寻求帮助时,只要在相关的小组中发布求援信息,就会有热心的高手为你排忧解难。LISTSERV/Mailing List电子论坛(Mailing List)是一组成员的E-mail地址,又称电子邮件列表或电子邮件群。利用电子论坛,许多兴趣相同的人可以进行互相交流。一旦加入了某个电子论坛,就可以收到邮件群其他成员发送的信息,也可以向该论坛发送信息,再由Listservs将邮件转发给组内的其他成员。新闻组与电子论坛的区别:新闻组的用户是主动地从新闻服务器上读取信息,参与讨论;而电子论坛的用户是被动地从邮箱中接收电子邮件。另外,新闻组要使用新闻阅读器来读取新闻邮件和

6、发布新闻;电子论坛可用任何一种电子邮件程序来阅读新闻邮件和发送邮件。 Gopher信息鼠(Gopher)是由美国明尼苏达大学在90年代初研究开发的,是一种基于菜单的网络信息系统。利用Gopher服务器,通过选择菜单项,在一级级菜单的指引下,逐级进入子菜单或某一个文件进行浏览。这些文件是以树型结构进行管理的,用户可以穿梭于文件树间寻找所需信息,而不必知道它们的具体IP地址、域名等,像只灵活的信息鼠似的在网上搜寻、漫游,查询所需信息。 随着WWW的发展与普及,以及Gopher不能传送多媒体信息的缺点,使其处于面临淘汰的境地,有些Gopher服务器已经关闭。 WAISWide AreaInfomat

7、ion Server,Wais是一种可以迅速、全面检索大量信息的工具。当然,这一工具仅仅针对信息的数量和类型,以及检索程序的功能而言的。Wais能检索数百个信息资源中的任何一个资源,这些资源涉及大量的各种各样的主题。用户只要用光标选取菜单中所希望查询的数据库并键入查询关键字,系统就能自动进行远程查询,帮助读出相应的数据库中含有该查询词的所有记录,用户可进一步选择是否读取感兴趣的记录内。1.3因特网信息资源评价评价的必要性:网络资源的无限、无序、优劣混杂,数字化知识数据单元DLO(类文献的电子文件document-like-object)的随时产生,信息过载(information overlo

8、aded),缺乏质量监控导致的信息污染、检索噪音加大,用户对获取高质量信息的需求迫切。评价的对象:一般是网页(web page)或网站(website)。1.3因特网信息资源评价(2)评价标准:目的(purpose)范围(scope)内容(content):准确性(accuracy)、权威性(authority)、新颖性(currency)、独特性(uniqueness)、可靠性(reliability)、链接(links)图形和多媒体设计(graphic and multimedia design)信息的展示与设计(information presentation and design)可操

9、作性(workability): 用户友好性、检索性能、交互性、连通性等费用(cost)评论(review)1.3因特网信息资源评价(3)评价方法:定性评价:问卷调查、专家评议定量调查:数量分析(访问、登录次数,链接数量等)以掌握用户兴趣、网站影响力等。一般评价:查看首页描述和更新时间;阅读帮助文件,了解查找、使用方法;查看FAQ;发现有无空链、错链等;关注各门户或相关网站的推荐站点(站点精选、热门站点、“Cool links” 等)和调查统计结果:如“中国互联网信息中心(CNNIC)”定期发布的调查统计报告。1.3因特网信息资源评价(4)书目控制方法在网络信息资源组织中的应用:在广泛收集网络

10、信息资源、并进行整理、筛选、比较、评价的基础上,开发出对用户使用网络资源有指导意义的书目控制工具。名称各异,如:Webliography、Web of webs、Meta index、subject guide 、subject index等。1.3因特网信息资源评价(5)重要的网络信息书目控制工具站点:The Argus Clearinghouse, the Clearinghouse for Subject-oriented Internet Resources. Michigan 大学图情学院师生开发。是各学科主题领域网络资源指南的指南,相当于网络资源的“书目之书目”。The WWW V

11、irtual Library, 集中组织、罗列了280多个由各学科专家开发的专科、专题性网络资源指南,均题名为“. WWW Virtual Library”。OCLC之NetFirst:是经过OCLC工作人员评价、筛选后编制的因特网资源目录,有分类、还著录内容提要。2.因特网信息检索( Networked IR, Web-based IR, Net searching) 2.1简述:开始于20世纪90年代中期Web迅速成为查找网络信息的主要平台较低的查准率是网络信息检索方面的突出问题 网络信息检索的特点信息检索空间的拓宽交互式作业方式用户界面友好且操作方便2.2网络信息检索的一般方法 浏览偶然

12、发现顺“链”而行;(Bookmark、Hotlink,、Hotlist)利用网络资源指南(Resource Guide)利用搜索引擎等网络检索工具2.3网络信息检索工具(1) 网络检索工具一般构成:信息采集机制(Harvesting mechanism)自动程序 Robot(又名为:Spider,Crawler,Worms,Wanders)人工选择、采集网络用户递交标引机制(Indexing mechanism):自动、人工组织机制:数据库检索机制(Searching facility):检索代理软件、用户界面(Interface)(2)网络检索工具的工作原理搜集网络信息资源数据:通过自动索引

13、程序Robot(或人工)信息加工建立索引:经过一系列的判断、选择、标引、加工、分类、组织等处理后形成供检索用的数据库,创建目录索引,并大多以Web页面的形式向用户提供有关的资源导航、目录索引及检索界面;检索界面:用户可根据自己的信息查找要求,按照该检索工具的句法要求等来通过检索界面输入想要查找的检索项、提问式。执行检索和输出结果:系统检索软件接受用户提交的检索提问后,按照本系统的句法规定对用户输入的字符串、运算符、标识符、空格等进行识别和判定后,代理用户在数据库中检索,并对检索结果进行评估比较,按与检索结果的相关程度排序后提供给用户。(3)各类型网络信息检索工具按检索对象分:Web资源检索工具

14、:主流非Web资源检索工具:FTP:Archie等Usenet: Deja News等Lists:Liszt等Gopher:Veronica等全文信息: WAIS等 按包含检索工具数量分:单一型(Singular search tools)集合型(Collective search tools):元搜索引擎(Metasearch Engine或Megasearch Engine)按检索机制分:目录型(Subject directory, catalogue)索引型:搜索引擎(Search Engine)混合型(Hybrid tools) 目录型检索工具和搜索引擎之间的界限越来越模糊,大多数流行

15、的网络检索工具均同时提供两种方式的检索,担负网络资源主题指南和索引双重责任。目前这种混合型(hybrid)检索工具代表了网络检索工具的发展趋势,多被混称为搜索引擎。按检索内容分:综合型专题型特殊型3.目录型检索工具(Subject directory, catalogue)人工设计和编制的、供检索的等级结构式目录(指南、导航系统)所收录资源经过鉴选和组织减少了检索中的噪音,提高了检索的准确性数据库的规模相对较小新颖性不强,(会有“死链接”dead link)用户要熟悉其分类体系目录型检索工具比较适合于查找综合性、概括性的主题概念,或对检索准确度要求较高的课题。有代表性的目录型检索工具:Yaho

16、o! Galaxy WWW Virtual Library 搜狐、新浪4.搜索引擎(Search Engine)4.1定义实际是个专用的WWW服务器, 存有庞大的索引数据库,收集了全世界上百万甚至上千万个www主页的文字信息。为了收集这些信息,有个自动搜索程序(如:robot spider harvest 或persuit等)沿着www的超链,经常搜索整个www上的主页,然后为这些主页上的每个文字建立索引并送回集中管理的索引数据库,索引信息包括文档的www,每个文档中单字出现的频率、位置等。用户可以按照这个目录逐层深入,直至找到所需信息;也可以在他们的各个程序中键入要查找的的关键词,引擎就会在

17、自己的数据库中找出与该词相匹配的URL,并将结果显示给用户,用户可根据显示的结果选择并访问相关站点。主要部分:搜集(Robot或Spider的作用)、索引、查询及结果处理。从核心技术上,现代搜索引擎也离不开传统的索引、分词等技术。4.2搜索引擎的功能 提供网络的导航与检索服务。专家从茫茫网海中挑选质量较高的网页,以某种分类法进行组织,帮助用户快速地浏览查找所需的站点。搜索引擎的主题检索途径,将用户需求与索引数据库匹配,显示结果及网页索引信息,进而由URL链接出原始信息,从而是用户能够从网上纷繁复杂的信息中迅速筛选出符合用户需求的信息 。4.3搜索引擎的发展史(1)第一代搜索引擎成为门户网站1)

18、Altavista( )2)Infoseek( )3)Excite( )4)Lycos( )Altavista( )Altavista是搜索引擎的元老,诞生于DEC研发中心。它也是Yahoo!最早的搜索引擎技术的提供者。Altavista的特点是速度快,Altavista还可以提供许多不同格式内容,像音频、视频与多国语言的检索,有不少国内搜索引擎找不到网页都可以通过它找到。但 Altavista在更新频率上不是很快,其中文搜索的技术已经有两三年没有改进过,检索内容更新频率大约是一个月一次。音频、视频与图像占用空间很大,要做好这方面的服务,需要占用相当大的存储空间,而Altavista在这方面做

19、得相当不错,可以说处于世界领先的地位。Infoseek( )Infoseek不是以数据库大而见长的,而是以检索的相关程度高而知名。Infoseek购买了马萨诸塞大学的搜索软件产品,而马萨诸塞大学的信息检索是全美高校数一数二的,所以Infoseek一开始的起点就很高。但他们很快就发现,互联网数据量太大了,当初设计的规模太小,只好重新编写程序。于是Infoseek请了一位华人工程师William Chang设计了第一代Infoseek搜索引擎Ultraseek,其特点也是速度快,同时检索结果的相关程度也很高。产品一推出在搜索引擎领域与华尔街都引起了很大的震动,Infoseek刚上市时是Yahoo!

20、市值的6070,大大领先于另外几家搜索引擎,而其后台的领先的搜索引擎技术功不可没。1999年,Infoseek被Disney所购买,发展方向与定位都做了调整。Disney将其做为入门网站 的搜索引擎,在技术上的革新比较少,处于维持现状的水平,主要是做娱乐方面的索引。Excite( )Excite是斯坦福大学的六位计算机系的本科生创办的。“免费让人搜索,用广告收入来补贴,这是Excite率先提出来的,也是当时比较新的概念。Excite搜索技术研发人员的计算机功底扎实,但对信息检索的认识不是很深,所以一开始提出的概念搜索(Concept Search),即用同义词推断来增加搜索的结果很快就宣告失败

21、。因为互联网的信息不是太少了而是太多了,搜索的目的是在茫茫的信息海洋中找到所需要的精确的信息。后来Excite与home 合并,开始主攻宽带市场,也就没有更新的技术出现。Lycos( )Lycos是早期搜索引擎中唯一诞生于美国东部的,其余的搜索引擎都在硅谷。它脱胎于卡耐基梅隆大学的一位博士生的一套互联网搜索程序,此后被风险投资集团CMGI看中,并且在波士顿成立了公司。其搜索技术一直比较落后,但在商业上比较成功,Lycos很早就投资做社区网站,网络广告也卖得不错,在商业操作上的成功掩饰了其技术的落后。Lycos后来购买了一家广受好评的搜索网站Hotbot,但实际Hotbot 在后台用的是Inkt

22、omi的技术。所以Lycos在很长的一段时间里同时维持着两个搜索平台,但在2001年初他们全面改用了Inktomi的搜索引擎。(2)第二代搜索引擎只做后台技术提供者与大量应用人工智能是第二代搜索引擎的标志。第一代的搜索引擎公司后来演变成了门户网站,而第二代的搜索引擎厂商则成为像Inktomi、Google那样给网站提供技术与服务的ASP,或是在技术上采用了人工智能技术的厂商,如Askjeeves、Direct hit等。第二代搜索引擎厂商的特点是只做后台技术的提供者 。 1)Inktomi( ) 2)Askjeeves( ) 3)Goto( ) 4)Google( )Inktomi( )Ink

23、tomi是加州大学伯克利分校Eric Brewer的教授最先开始研究的,这位教授是并行处理研究的专家。Eric Brewer希望用这个搜索引擎产品来证明他的并行算法是十分出色的,后来他将自己的技术卖给了Hotbot,作为后台技术的提供商。 Eric Brewer完成Inktomi的时候,这个市场竞争已经相当激烈,再想做门户已经不可能了。所以他决定只做背后技术的提供商,而这却正中 Yahoo!的下怀,Yahoo!以前使用的是Altavista的技术,但Altavista本身也是门户,与 Yahoo!处于竞争关系,而Inktomi与Yahoo!没有利益冲突关系,便很快成了其后台技术的提供商。Ask

24、jeeves( )从技术上讲,Askjeeves是一个比较简单的系统,但从创意来说是相当出色的,它维护了问题与答案相联系的数据库。从结构上说它比较简单,因为提问后并不是立即返回问题的答案,而是用逼近式的方法让你选择他知道的所有问题,再由用户分类来选择答案。这一点从技术上讲非常容易解决,但从实践来说需要大量的人力来干预,即问题与结果的数据库规则基本是靠人工来建立的。但由于它建立了一套可以让人以自然语言提问的系统,很多网民喜欢这样的形式。但由于其规则库太小,真正使用的人不是很多。Goto( )从本身技术来说, 使用了超链分析与根据用户的点击行为来分析与重排序,搜索得到的结果相关性程度较高,而且比较

25、符合用户的点击习惯。Google( )Google由Larry Page和Sergey Brin设计, 于 1998年9月发布测试版,一年后正式开始商业运营。Google由于对搜索引擎技术的创新而获奖无数,如美国时代杂志评选的“1999年度十大网络技术”之一、个人电脑杂志授予的“最佳技术奖”、The Net授予的“最佳搜索引擎奖”等。Google现为全球80多家门户和终点网站提供支持,客户遍及20多个国家。Google所擅长的是易用性和高相关性。 Google提供一系列革命性的新技术,包括完善的文本对应技术和先进的PageRank排序技术,后者可以保证重要的搜索结果排列在结果列表的前面。Goo

26、gle还提供一项很有用的服务 “网页快照”功能,即当搜索内容站点或网页不存在时,用户可以调 用Google事先为用户储存的大量应急网页,经Google处理后,搜索项均用不同颜色标明,另外还有标题信息说明其存档时间日期,并提醒用户这只是存档资料。实际上Google将检索的网页都做了一番“快照”然后放在自己的服务器上,这样做的好处是不仅下载速度极快,而且可以获得互联网上已经删除的网页。(3)第三代搜索引擎技术从搜集过程来看,超链分析是一个核心技术,面对无限宽广的互联网,如何获得所需链接、索引链接 都需要很多的考虑,而链接背后的“价值”分析更是充满了智慧,这种分析就是海量数据中的挖掘技术。相对于广泛

27、的静态网页,动态网页所包含的信息更有价值,但是种类繁多且不断发展的动态网页技术(如ASP、JSP、CGI等)再加上复杂的网络环境,使搜集过程变得繁重异常。从索引过程来看,网络搜索引擎不仅要用到传统搜索引擎技术,而且还要用到数据库技术、网页缓存技术、多媒体技术、分布式存储与计算技术,除了索引网页,还要索引各种媒体,包括文字、动画、音频、视频及其他特殊文件(PDF、XML等)。查询在技术上是索引的逆过程,索引就是为了查询。但是查询还要用到用户输入技术、代理技术、分词技术、自然语言处理技术等。这些技术的运用使得索引的价值得以体现,也使得搜索引擎在用户面前显得更简单、更有用。将最好的查询结果呈现给用户

28、是搜索引擎的最终目标。结果排序总的来说是相关度排序技术,还要用到去除重复网页、用户行为分析等技术,也可能用缓存技术为用户提供过期的网页。4.4搜索引擎的分类 收集信息建立索引数据库,并自动跟踪信息源的变动,不断更新索引纪录,定期维护数据库。 根据信息覆盖范围及适用用户群分类综合性搜索引擎综合性搜索引擎主要以Web网页和新闻组为搜索对象,信息覆盖范围广,适用用户广泛。如:GOOGLE、Yahoo、AltaVista、Infoseek等均属于综合性搜索引擎。专用性搜索引擎针对特定用户群推出专用性搜索引擎,可供查找某一特定领域的信息。如:Deja News、Iiszt、Softseek等均属于专用性

29、搜索引擎根据组织信息方式分类目录式分类搜索引擎(网站级)目录式分类搜索引擎(Directory)将信息系统地加以归类,利用传统的信息分类方式来组织信息,用户按类查找信息。这种搜索引擎特别适合那些希望了解某一方面或范围内信息但又没有明确搜索目的的用户使用。最具代表性的目录式分类搜索引擎是YAHOO目录式分类搜索引擎由于网络目录中的网页是专家人工精选得来,故网页内容丰富,有较高的查准率,但其查全率低,搜索范围较窄全文搜索引擎(网页级)全文搜索(FullText Search)引擎是指能够对网站的每个网页中的每个单字进行搜索的引擎。最典型的全文搜索引擎是AltaVista 全文搜索引擎的特点是查全率

30、高,查准率低,搜索范围较广,提供的信息多而全,缺乏清晰的层次结构,查询结果中重复链接较多。根据搜索范围分类独立搜索引擎独立搜索引擎建有自己的数据库,搜索时通常只检索自己的数据库,并根据数据库的内容反馈出相应的查询信息或链接站点。目前常见的搜索引擎如Yahoo、Lycos、 Infoseek、AltaVista等均属于独立搜索引擎。独立搜索引擎又称为常规搜索引擎。元搜索引擎元搜索引擎(或者称为集搜索引擎)是一种调用其他独立搜索引擎的引擎。搜索时,它用用户的查询词同时去查询若干其他搜索引擎,作出相关度排序后,将查询结果显示给用户。它的注意力放在改进用户界面及用不同的方法过滤它从其他搜索引擎接收到的

31、相关文档,包括消除重复信息。用户利用这种引擎能够获得更多、更全面的网址。但缺点是查询时间长。4.5搜索引擎的查询规则支持逻辑检索支持符号化检索标识(如截词、引号等)支持限制检索其他4.6搜索引擎的检索功能一般检索功能1布尔逻辑检索(Boolean) (1)布尔逻辑算符AND,OR,NOT ; (2) “+”和“-”的使用:在一般的搜索中可用“+”来指定检索结果必须包括某个词,用“-”来指定检索结果中必须排除某个词。 (3)菜单驱动方式 菜单项“All the word” 代表AND运算 “Any of the words” 代表OR运算2词组检索(PHRASE) 词组检索是将一个词组通常用双引

32、号“ ”括起,当作一个独立运算单元,进行严格匹配,以提高检索的精度和准确度,它也是一般数据库检索中常用的方法。3截词检索(TRUNCATION) 截词检索也是一般数据库检索中常用的方法。通常采用“ * ”。4限制检索 字段检索和限制检索常常结合使用,字段检索就是限制检索的一种,因为限制往往是对字段的限制。主题字段限制有:Title,Subject,Keywords,Summary等。属于非主题字段限制的有“Image,Text、url、link”等。 限定方式一般为二种:如: site: 查找名为 的WWW服务器。 image:mao.jpg查找名为mao.jpg的图像文件。 url:data

33、mining.html 查找含有 datamining.html的URL5位置检索 在搜索引擎中,能提供位置检索的并不多。如ALTA VISTA,也只提供一种临近位置运算(NEAR运算)。特殊检索功能1自然语言检索 即直接采用自然语言中的字、词或句子作提问式进行检索,同一般口语一样,如可用“What is search engin?”或“Who is Clinton?”这样的自然语句表达式充当检索提问式。 2多语种检索 即提供多语种的检索环境供检索者选择,系统按指定的语种进行检索并输出检索结果。特种搜索引擎查找电子邮件、电话号码和人物查找地图查找图像其他(如查找工作、查找文件、查找新闻组等)查

34、找电子邮件、电话号码和人物 (电话号码) (Yahoo人物) (查找全球华人) 查找地图 (图行天下) (城市交通旅游地图) (北美和世界地图)Google、Baidu查找图像及其他视频 (声像信息检索)网上视频报告厅(本馆资源)Google、Baidu常用搜索引擎简介GOOGLESCIRUS新浪网搜索引擎GOOGLEGoogle是由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年

35、至今,Google已经获得30多项业界大奖。Google检索网页数量达24亿,搜索引擎中排名第一; Google支持多达132种语言,包括简体中文和繁体中文; Google网站只提供搜索引擎功能,没有花里胡哨的累赘; Google速度极快,搜索准确率极高。 GOOGLE的独特功能:(如网页翻译、单词纠错、繁简转化、网页快照等)Google表示逻辑“与”操作,只要空格就可以了。Google用减号“-”表示逻辑“非”操作。“A B”表示搜索包含A但没有B的网页,操作符与作用的关键字之间,不能有空格Google用大写的“OR”表示逻辑“或”操作,必须用大写的“OR”,而不是小写的“or”。Googl

36、e对通配符支持有限。它目前只可以用“*”来替代字符,而且包含“*”必须用引起来。比如,“以*治国”,表示搜索第一个为“以”,末两个为“治国”的短语,中间的“*”可以为任何字符。 Google不区分英文字符大小写用短语做关键字,必须加英文引号,否则空格会被当作“与”操作符。 大部分常用英文符号(如问号,句号,逗号)无法成为搜索关键字,一些出现频率极高的英文单词,如“i”、“com”、“www”等,也忽略处理网站限制:“site”表示搜索结果局限于某个具体网站或者网站频道,如“搜索引擎 ”,site后的冒号为英文字符,而且,冒号后不能有空格文档类型限制:“filetype”表示搜索结果是某特定类型的文档,如:“资产负债表 filetype:xls”搜索的关键字包含在URL链接中 :“inurl”语法返回的网页链接中包含第一个关键字, “allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。“intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。科技搜索引擎:SCIRUS网址: Scirus 是专门用于科技信息检索的世界上最全面的科技搜

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论