搜索引擎及网络信息检索.ppt_第1页
搜索引擎及网络信息检索.ppt_第2页
搜索引擎及网络信息检索.ppt_第3页
搜索引擎及网络信息检索.ppt_第4页
搜索引擎及网络信息检索.ppt_第5页
已阅读5页,还剩76页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、基于搜索引擎的网络信息检索,主要知识点 1.搜索引擎技术原理 2.搜索引擎的检索方法 3.万维网搜索引擎(web search engines) 4.元搜索引擎(meat-search engines) 5.专用搜索引擎 6.搜索引擎技术的未来趋势 7.部分免费学术资源介绍,搜索引擎技术原理-搜索引擎概述,搜索引擎(search engine)是互联网上专门用于检索的网站的统称,目前已多达数百上千种,包括通用万维网搜索引擎、通用元搜索引擎和各种专用搜索引擎三大类型。 起源 可追溯至1990年,加拿大蒙特利尔大学学生Alan Emtage开发的Archie.Archie用于检索分散在各FTP服务

2、器上的文件,工作原理与现在的搜索引擎很接近。 基本原理 1993年底,人们认识到既然所有网页都可能有连向其他网站的链接,那么从跟踪一个网站的链接开始,就有可能检索整个互联网。 发展 1994年,yahoo!和Lycos问世,成功地使搜索引擎的概念深入人心。1995年后,搜索引擎进入了高速发展时期,被誉为仅次于门户网站的互联网第二大核心技术。,(1)搜索器(searcher) 20世纪90年代,“机器人”(robot)在计算机编程者中用于特指某种能以人类无法达到的速度不间断地执行某项任务的软件程序。 由于专门用于检索web信息的“机器人”程序像蜘蛛一样在网络间爬来爬去,因此,作为web搜索器的“

3、机器人”就被称为“网络蜘蛛”。 网络蜘蛛的功能就是在互联网中不断漫游,发现和搜集信息。作为一个计算机程序,搜索器日夜不停地运行,尽可能多,尽可能快地搜集各种类型的新信息,并定期更新已经搜集过的旧信息,以避免出现死链接和无效链接。,搜索引擎技术原理-搜索引擎组成,(2)索引器(indexer) 索引器的功能是理解搜索器所搜索的信息,从中抽取出索引项,并生成文档库的索引表。索引项有客观索引项和内容索引项两种:客观索引项与文档的语意内容无关,如作者名,url,更新时间等等;内容索引项则是用来反应文档内容的,如关键词及其权重、短语、单字等等。 (3)用户检索界面(interface) 用户检索界面是搜

4、索引擎呈现在用户面前的形象,其作用是接受用户输入的查询、显示查询结果、提供用户相关性反馈。为使用户方便、高效的使用搜索引擎,从搜索引擎中检索到有效、及时的信息,用户检索界面的设计和实现采用人机交互的理论和方法,以充分适应人类的思维习惯。 用户检索界面包括简单界面和高级界面两类。简单界面只提供用户输入查询串的文本框;高级界面提供用户按照检索模型查询的机制。,搜索引擎技术原理-搜索引擎组成,搜索引擎技术原理搜索引擎的运作,(1)发现并搜集网页信息 搜索引擎通过高性能的“网络蜘蛛”程序(spider)自动地在互联网中搜索信息。 一个典型的网络蜘蛛的工作方式是通过查看一个页面,从中找到与检索内容相关的

5、信息,然后再从该页面的所有链接中继续寻找相关的信息,以此类推,直至穷尽。 “网络蜘蛛”为实现快速浏览整个互联网,通常在技术上采用抢先式多线程技术实现在网上聚集信息。,(2)对信息进行提取并建立索引库 索引库的建立关系到用户能否最迅速的找到最准确、最广泛的信息。索引器对“网络蜘蛛”抓来的网页信息极快的建立索引,以保证信息的及时性。 建索引时对网页采用基于网页内容分析和基于超链分析相结合的方法进行相关度评价,能够客观地对网页进行排序,从而最大限度地保证搜索出的结果与用户的检索提问相一致。,搜索引擎技术原理搜索引擎的运作,(3)用户检索利用 搜索引擎根据用户输入的检索词,在索引库中快速检出文档,进行

6、文档与检索的相关度评价,对将要输出的结果进行排序,并将检索结果返回给用户。 当用户以关键词查找信息时,搜索引擎会在数据库中进行搜索,如果找到与用户要求内容相符的网站,并采用特殊的算法通常根据网页中关键词的匹配程度,出现的位置/频次,链接质量等计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。 这是对前两个过程的检验,检验该搜索引擎能够给出最准确、最广泛的信息,检验该搜索引擎能否迅速地给出用户最想得到的信息。,搜索引擎技术原理搜索引擎的运作,(1)简单搜索(simple search)指输入一个单词(关键词)进行搜索,也叫单词搜索。 (2)词组搜索(Phrase

7、 Search):指输入两个单词以上的词组(短语),提交搜索引擎检索并反馈结果,也叫短语搜索。现有搜索引擎一般都约定把词组或短语放在引号“”内。如果查找的是一个词组或多个汉字,最好的办法就是将它们用双引号括起来,这样得到的结果最精确,这就叫使用双引号进行精确查找。一般说来在网页搜索引擎中,用词组搜索来缩小范围从而找到搜索结果是最好的办法。,搜索引擎技术原理搜索引擎常用检索方法,搜索引擎的检索方法搜索引擎其它检索方法,(1)语句搜索(Sentence Search):指输入任意自然语言问句,提交搜索引擎检索并反馈结果,这种方式也叫任意检索,实际上就是自然语言检索。并非所有的搜索引擎都支持这样的检

8、索,而且不同搜索引擎对语句中词与词之间的关系的处理方式也不同。 (2)目录搜索(Catalog Search):指按搜索引擎提供的分类目录逐级检索,用户一般不需要输入检索词,而是按照检索系统所给的几种分类项目,选择类别进行搜索,也叫分类搜索(Classified Search)。,(3)高级搜索(Advanced Search):指用布尔逻辑组配方式检索,也叫定制搜索。 常用的逻辑运算为AND(和)、OR(或)、NOT(非)。 对A、B两词而言, A AND B是指取A和B的公共部分(交集) A OR B是指取A和B的全部(并集), A NOT B是指取A中排除B后的部分 A、B本身为多词时,

9、可以用括号()分别括起来作为一个逻辑单位。,搜索引擎技术原理搜索引擎常用检索方法,搜索引擎的检索方法搜索引擎使用技巧,(1)有针对性地选择搜索引擎:用不同的搜索引擎进行检索得到的结果常常有很大的差异,这是因为它们的设计目的和发展走向存在着许多不同,有的专用于检索Web信息,有的专用于检索Usenet信息,而有的则针对商业需要设计,使用时要根据自己的需要选择合适的搜索引擎。,Usenet是世界范围的新闻组网络系统,由成千上万个新闻组组成,囊括了整个互联网上几乎所有的电子论坛信息。通过Usenet,人们可以张贴个人信息,回答其他人的问题等等。由于参加Usenet新闻组讨论的用户人数众多,而且每个新

10、闻组都按照其内容划分成科技,娱乐,新闻,体育等等不同的类别,所以如果用户有什么问题的或是希望了解什么信息的话,通过Usenet新闻组一定可以找到最全面,最满意的答案。,搜索引擎的检索方法搜索引擎使用技巧,(2)根据要求选择检索方法并细化检索:如果需要快速找到一些相关性比较大的信息,可以使用目录索引式搜索引擎检索;如果想得到某一方面比较系统的资源信息或比较冷门的信息,则应该选用全文搜索引擎查找。许多搜索引擎都提供了对搜索结果进行细化与再检索的功能,如有的搜索引擎在结果中有“检索类似网页”的按钮,还有一些则可以对得到的结果进行新一轮的检索。 没有一种技术是万能的,但将几种技术巧妙地结合起来使用则会

11、大大提高检索效率。,万维网搜索引擎(Web Search Engines),万维网搜索引擎的主体是全文搜索引擎(Full Text Search Engine),最具代表性的全文搜索引擎是Google、AlltheWeb、百度等,它们都是从互联网上提取各个网站的信息(以网页文字为主),建立索引数据库,并在用户检索时予以匹配响应,再按一定的排列顺序将结果返回给用户,因此是所谓真正意义上的搜索引擎。,万维网搜索引擎Google(),(1)Google简介:Google是由美国斯坦福大学的两位博士生 Larry Page 和 Sergey Brin 在 1998 年创建的。1999 年 6 月,Go

12、ogle 通过自己的网站 推出 ,很快以其特有的技术优势和极佳性能扬名世界。 Google 开发出了世界上最大的搜索引擎,提供了最便捷的网上信息检索方法,通过对 30 多亿网页进行整理,Google 可为世界各地的用户提供所需的搜索结果,而且搜索响应时间通常不到半秒。 Google 将网页级别与完善的文本匹配技术结合在一起,可找到最重要、最有用的网页。Google 所关注的远不只是关键词在网页上出现的次数,它还对该网页的内容(以及该网页所链接的内容)进行全面检查,从而确定该网页是否满足检索要求。,万维网搜索引擎Google(),(2)Google检索方法 Google支持简单搜索、词组搜索和高

13、级搜索(页面右上角设置选项),而且以多语种、多媒体兼容为特色,用户键入搜索框中的任何符号均可得到反馈。如果用户键入了明显的错别字词,Google会给出提示,显示了一定的智能。 简单搜索:也称为基本搜索,仅需输入检索内容并敲一下回车键 (Enter),或单击“Google 搜索”按钮,即可得到相关资料。如果想缩小搜索范围,可输入更多的关键词,只要在关键词中间留空格就行,此时,会自动使用“and”进行逻辑组配检索。,万维网搜索引擎Google(),词组搜索: Google词组搜索使用英文双引号。 在 Google 中,可以通过添加英文双引号来搜索短语。双引号中的词语(比如“world econom

14、y” )在检索到的文档中将作为一个整体出现。这一方法在查找名言警句或专有名词时显得格外有用。 Google检索时会自动忽略最常用的词和字符,这些词和字符称为忽略词。Google 忽略词包括“http”、“.com”和“的”等字符以及数字和单字,因为这类字词不仅无助于缩小检索范围,而且会大大降低搜索速度。 高级搜索:可以将检索策略输入Google主页面的检索框中进行检索,也可以进入高级检索界面后将检索策略输入检索框中检索。,万维网搜索引擎Google(),(3)Google特殊功能 图像搜索:Google 的“图像搜索”是网络上现今最好的图像搜索工具,收录有超过 3.3 亿张图像供查看。要进行图

15、像搜索,选择主页上方的图像键或直接用URL 即可进入,在图像搜索框中输入要查找的图像主题或相关关键词,然后单击“搜索”按钮。在检索结果页上单击缩略图即可看到原始大小的图像,同时还可看到该图像所在的网页。 信息挖掘:如果要查找网络上的 PDF格式、DOC 格式、GIF格式等专门格式的文件,只需在检索词后加上.PDF、.DOC、.GIF等信息即可,Google会自动到服务器甚至数据库中去搜寻这些文件,体现了新颖的信息挖掘功能。 手气不错:按下“手气不错”按钮将自动进入 Google 检索到的第一个网页,而完全看不到其它搜索结果。使用“手气不错”进行搜索表示用于搜索网页的时间较少而用于检查网页的时间

16、较多。,万维网搜索引擎Google(),网页快照:Google 在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击“网页快照”时,您将看到 Google 将该网页编入索引时的页面。在显示网页快照时,其顶部有一个标题,用来提醒用户这不是实际的网页。符合搜索条件的词语在网页快照上突出显示,便于快速找到所需的相关资料。 类似网页:单击“类似网页”时,Google 侦察兵便开始寻找与这一网页相关的网页。Google 侦察兵可以“一兵多用”。如果用户对某一网站的内容很感兴趣,但又嫌资料不够,Google 侦察兵会帮助找到其他有类似资料的网站。,万维网搜索引擎Google()

17、,按链接搜索:有一些词后面加上冒号对 Google 具有特殊的含义。其中的一个词是“link:”。检索 link: 显示所有指向该网址的网页。 指定网域:又一个后面加冒号而有特殊含义的词是“site:”。要在某个特定的网域或网站中进行搜索,可以在 Google 搜索框中输入“site:”。 语句搜索Google是最早支持自然语言检索的少数搜索引擎之一,目前这一功能仍在不断改善之中。 可以将Google工具箱安装到 Internet Explorer的工具列内,使用户在任何网页上随时可以使用 Google的强力搜索,而不需要每次造访 Google 的首页。,万维网搜索引擎Yahoo!(),(1)

18、Yahoo简介:Yahoo!是世界上最早的搜索引擎之一,它是1994年4月由Standord大学的两名博士生David Filo 和Jerry Yang(杨致远)研制的。Yahoo!拥有第一流的Web目录和最佳的新闻链接以及许多附加服务,因而也有人将其专门独立为目录索引类搜索引擎(Search Index/Directory)。Yahoo!支持简单搜索,性能良好;支持词组搜索,性能优秀;支持高级搜索,但性能一般。Yahoo!提供的简单搜索和高级搜索具有匹配关系:前者主要检索其分类结构中的一级目录,后者可使用关键词构成布尔逻辑式进行检索,并可以使用*作为通配符。支持+、-词操作。 (2)Yaho

19、o!常用检索:Yahoo!的魅力,就在于它的可浏览式分类主题目录。按照主题建立分类索引,提供全面的分类体系结构,并结合高质量的检索软件,Yahoo!成功地建立起了一套独特的信息管理和组织机制,使得对网络信息的全面检索变成现实。,万维网搜索引擎Yahoo!(),(3)Yahoo!特色搜索 目录搜索:Yahoo!的目录搜索使用很简单,只要进入其网站,选定所查主题,逐级进入即可。这些目录由于是人工参与建立的,故标引较准确,因而查准率较高。 专门搜索:Yahoo!针对各国用户和专门用户设计开发了相应的功能检索界面,例如中文Yahoo!()、德文Yahoo!()、法文Yahoo!()、以及专门为儿童设计

20、的搜索引擎Yahooligans!()等等,形成全方位的Yahoo!搜索网站系列。 Yahoo!对大小写字母不敏感,即对输入的检索词大小写字母一视同仁。Yahoo!也支持任意词检索。 虽然目录索引在技术意义上不算严格的搜索引擎,只是按目录分类的网站链接列表,但目录索引在搜索引擎中却具有不可替代性,从总体上看,Yahoo!仍然是Web上独具特色的搜索引擎。,万维网搜索引擎Ask(),Ask原名AskJeeves,初出道时只是一个元搜索引擎,后以目录搜索为主,而在2002年初收购Teoma全文搜索引擎后,很快便成为以实现自然语言检索为特色的全文搜索引擎,并跻身著名搜索引擎之林,在国际互联网上赢得一

21、席之地。 Ask主页中栏有检索选择及输入框,输入检索词后点击Ask按钮可查。Ask的搜索功能包括:(1)支持简单搜索;(2)支持词组搜索;(3) 支持高级搜索。其特色是支持自然语言搜索。,万维网搜索引擎Ask(),Ask支持自然语言搜索的实现方式是支持自然语言提问,它的数据库里已经储存了1000多万个问题的答案,只要用英文输入一个问题,它就会给出问题的答案。如果问题答案不在它的数据库中,那么它会列出一串与问题类似的问题和含有答案的链接,供选择。 用自然语言具体检索Ask时,可以用特殊疑问句或一般疑问句提问,通常用用特殊疑问句提问效果较好。也就是说,当遇到一些属于事实型、原理型的问题时,使用As

22、k是很方便的。,万维网搜索引擎其它著名搜索引擎,(1)AlltheWeb():其技术起源于挪威科技大学,现为Overture公司所拥有。支持简单搜索、词组搜索和高级搜索,性能和名气都直逼Google。 (2)AltaVista():老牌搜索引擎,是DEC公司1995年12月推出的万维网搜索引擎。支持简单搜索、词组搜索和高级搜索,目前仍是富有活力的重要搜索引擎。 (3)Excite():是基于斯坦福大学1993年8月创建的Architext扩展而成的万维网搜索引擎,它能为简单搜索返回很好的结果,并能提供一系列附加内容,尤其适合经验不多的用户使用,也支持词组搜索和高级搜索。 (4)Hotbot()

23、:具有一流的高级搜索功能和新闻论坛搜索功能、图形化的搜索工具以及一系列的过滤选项,尤其是有优良的Usenet搜索功能,其对应的NewsBot数据库每天都及时地更新。支持简单搜索、词组搜索和高级搜索。,万维网搜索引擎其它著名搜索引擎,(5)Lycos():它曾是最早的搜索引擎之一,具有多种搜索选项和内容丰富的目录,执行简单搜索时能返回较好的结果。最大特色是专门整理了一份占前5%的热门网址。支持简单搜索、词组搜索和高级搜索。 (6)WebCrawler():是最早的万维网搜索引擎之一,支持简单搜索、词组搜索和高级搜索。 (7)百度():百度搜索引擎不仅是最大的中文搜索引擎,而且是搜狐、新浪、Chi

24、naren、21CN、263、TOM等许多门户网站和中央电视台等的后台搜索引擎,成为中文搜索引擎中的佼佼者。 每个搜索引擎都有独特的优点,不同的需要就应该使用不同的搜索引擎,例如:通常检索可用Google和Yahoo!,有问题可问Ask,要做特定的主题搜索可用Search。互联网是一个宝库,搜索引擎是打开宝库的一把钥匙。,元搜索引擎(Meta-search Engines),元搜索引擎(Meta Search Engine)在接受用户查询请求时,同时调用多个已有引擎进行搜索,并将结果统一返回给用户。 1、Search():原名SavvySearch,是一个新兴的高性能元搜索引擎,以功能齐全、选

25、择众多而成为元搜索引擎的后起之秀。 它广泛收集了800多种专业搜索引擎和数据库,分为商业金融、娱乐、健康医药、新闻媒体等共15个大主题,每个大主题又分许多小主题。 Search元搜索引擎支持简单搜索、词组搜索和高级搜索,可以选择调用8个搜索引擎之中的1-8个: About, AltaVista, Ask, Britannica, Open Directory, Surfpoint, Thunderstone, Wisenut;方法是通过顾客化(Customize)链接进入后选择。 也可以专门选择调用4个目录搜索引擎:LookSmart, mySimon, Open Directory, Yah

26、oo!。此外还可以通过左下方的频道选择专门调用搜索新闻媒体(News & Media)、个人信息(People)、商务信息(Yellow pages)、旅游信息(Travel)等的相关主题搜索引擎。,元搜索引擎(Meta-search Engines),2、ProFusion(): ProFusion是由美国堪萨斯大学研发的并行式元搜索引擎。ProFusion拥有智能化的搜索技术、对检索的实用提示和非常宝贵的个性化搜索服务,曾是最优秀的元搜索引擎,但几经商界易手和技术改造后,优势已不明显。 其特色和优势是:(1) 可选择调用5个最快的引擎或全部搜索引擎,或手工自选引擎进行检索。(2) 自动对检

27、索结果进行整理,删除冗余的结果,并按相关性进行排序。(3) 高级搜索健全,可使用*作为通配符,支持+、-词操作。,元搜索引擎(Meta-search Engines),3、Mamma():Mamma是并行式元搜索引擎,自称是所有搜索引擎之母(The Mother of all Search Engines),它可以同时调用AltaVista、Excite、Infoseek、Lycos、WebCrawler、Yahoo!等独立引擎,并且可以查新闻组、声像信息等。其特色和优势是:具有多媒体查询功能;会自动对检索结果进行整理,使结果看上去就像是从一个数据库中查出来的;自动将搜索策略转化为符合各搜索引

28、擎的语法,使之能返回正确的结果。缺点是搜索结果无可信度排名。,专用搜索引擎,1、专业领域搜索引擎:专业领域搜索引擎是指专门用于检索某特定专业领域信息的搜索引擎,是目前搜索引擎发展的一大方向。 2、网络应用搜索引擎:网络应用搜索引擎是指除Web外与Internet上的其他功能应用相适应的搜索引擎,主要有Email搜索引擎、FTP搜索引擎、Usenet(网络新闻)搜索引擎等等。 1)Email搜索引擎:BigFoot()。 主要功能是可以检索个人电子邮件地址、住址和电话号码等信息。由于传统电话号码薄的个人信息内容是白页,故搜索引擎中有关检索住址和电话号码的部分也称白页搜索引擎(White Page

29、s Search Engine)。 BigFoot的数据库不是集成的,所以查电子邮件地址与查住址和电话号码的分别形成了独立的功能,查电子邮件地址用Find People功能项,查住址和电话号码则用White Pages功能项。,专用搜索引擎,(2)FTP搜索引擎 FTP搜索引擎的代表首推Philes()。Philes号称全球最大的FTP搜索引擎,其主页如图6.20所示。在搜索框中输入待查的软件名称,即可获得相应软件所在服务器一览,并提供链接供下载。 (3)Usenet搜索引擎 最好的Usenet搜索引擎是DejaNews,URL为,现已并入Google,URL 为。 特色:提供许多过滤选项和丰

30、富的内容,拥有20000多个新闻组的存档。通过DejaNews简洁的界面能连续而方便地访问所有功能,包括向新闻组张贴文章和浏览新闻组。选项中包括增强搜索(Power Search),它允许设置关键词匹配和数据库(新的或旧的)编号;利用搜索过滤器(Search Filter)可以指定组、作者、主题、和日期。,专用搜索引擎,3、商用搜索引擎:(Business Search Engines)是检索商务信息为主的搜索引擎,由于传统电话号码薄的商务内容是黄页,故商用搜索引擎以黄页搜索引擎(Yellow Page Search Engines)为主体,其代表是SuperPages ()。SuperPag

31、es是由著名的商用搜索引擎BigBook和BigYellow合并而成的迄今为止最好的黄页搜索引擎,它具有智能化的功能、丰富的帮助以及准确的信息,这使SuperPages成为搜索黄页信息的最佳选择。,搜索引擎技术的未来趋势,未来的搜索引擎技术的发展趋势呈现个性化、智能化、专业化、多媒体化、综合集成化等特点。 (1)个性化:核心是通过跟踪分析用户的搜索行为,充分地利用这些信息来提高用户的搜索效率。这种搜索行为分析技术是一种正在发展中的很有前途的搜索引擎人机界面技术。 (2)智能化:智能化体现在两方面,一是对搜索请求的理解,二是对网页内容的分析。自然语言搜索能力也是智能化的一个体现,是目前相对易于开

32、发的技术。应用了智能技术的搜索引擎与传统搜索引擎相比不仅搜索的易用性更好、使得检索变得更为简单、易于操作,而且搜索结果的范围定位更加准确,减少了对无用信息的搜索。 (3)专业化:专业化是为了专门收录某一行业、某一主题和某一地区的信息而建立,非常实用。这种专业化的搜索引擎是将来的方向。,搜索引擎技术的未来趋势,(4)多媒体化:多媒体搜索引擎是随着宽带技术而发展,未来的互联网是多媒体数据的时代。开发出可同时查寻文字、图像、声音和电影等的搜索引擎是一个新的方向。 (5)综合集成化:综合集成化的典型表现是与门户网站技术相结合和研发交叉语言检索技术。作为互联网第一核心技术的门户网站与作为互联网第二核心技

33、术的搜索引擎相结合,可以在技术上和经济上互利互助,现在正在成为一种流行趋势。 交叉语言检索是指用户用母语提交查询,搜索引擎在多种语言的数据库中进行信息检索,返回能够回答用户问题的所有语言的文档信息。如果再加上机器翻译,返回的结果就可以全部用母语显示。在经济全球化、互联网跨越国界的今天,研发交叉语言检索技术具有非常重要的意义。,国内常用的搜索引擎,百度(Baidu) 创建者:李彦宏(超链分析专利的唯一持有人)、徐勇 1999年底,百度成立于美国硅谷,2000年百度公司回国发展。百度在中国各地和美国均设有服务器,搜索范围涵盖了中国大陆、香港、台湾、澳门和新加坡等华语地区以及北美、欧洲的部分站点。

34、百度搜索引擎是目前世界上数据更新最快、中文信息量最大的中文搜索引擎。Baidu 目前的数据总量超过6亿页,并且以每天数十万页的速度增长。,Baidu检索窗口简单检索,新闻检索,贴吧检索,音乐检索,图片检索,知道检索,更多检索,高级检索,Baidu检索技巧,支持布尔检索: 在简单检索中使用“+”、“”、“”分别代表逻辑与、逻辑非、逻辑或运算。 在高级检索中的“包含以下全部关键词”、“包含以下任意关键词”和“不包含以下关键词”分别代表逻辑与、或、非运算。,逻辑与,逻辑或,逻辑非,小技巧:输入多个词语搜索(不同字词之间用一个空格隔开),可以获得更精确的搜索结果。相当于逻辑与运算,支持字段检索 简单检

35、索的默认状态和高级检索的关键词位置选项“网页的任何地方”表示关键词在网页的全文内匹配 简单检索在关键词前加上“intitle:”和高级检索的关键词位置的选项“仅在网页的标题中”表示关键词仅在网页标题中匹配 简单检索在关键词前加“inurl:”和高级检索的关键词位置选项“仅在网页的URL中”表示关键词仅在网页地址中匹配,关键词在网页全文内匹配,初级检索,高级检索,关键词在网页标题中匹配,初级检索,高级检索,关键词在网页地址中匹配,初级检索,高级检索,支持限定检索 高级检索提供了时间限定选择、地域限定选择、文档格式限定、简体和繁体的限定、网站和网域的限定。 时间限定:最近一天、一周、一月、一年和全

36、部时间; 地域限定:台湾、香港和澳门及内地的各个省、市、自治区 文件格式限定:“pdf”、“doc”、“xls”、“ppt”、“rtf”、所 有格式、所有网页和文件7种 网站和网域的限定是在限定框内输入限定的网站域名或网域域名。,支持二次检索 在一词检索的结果页上方提供检索框,可以选择重新检索和二次检索 相关检索词智能推荐技术 在第一次检索后,在检索结果页的下方会提示相关的检索词,帮助用户查找更相关的结果。 支持多语言混合检索 Baidu支持主流的中文编码标准,并且能够在不同的编码间转换。关键词还可以是任何中文、英文、数字或中英文数字的混合词;如果关键词为繁简混合体,则统一为简体进行搜索;在英

37、文关键词方面,不区分大小写均做小写处理。,支持容错检索 主要体现在对同音别字的识别功能,如输入“查花”,系统户提示“您要找得是不是:插画、插花、茶花”;也可以用同音字或汉语拼音代替,如输入“nan 京”,系统会提示“您要找得是不是:南京”;可以直接用汉语拼音检索,从检索结果页面同样可也到提示 支持链接查询 用于搜索链接到某个URL地址的网页,了解有哪些网页把链接指向该网页。输入:“link:”和要查询的网站或网页地址。 例如:“link:”搜索有链接指向羊城晚报的网页,支持内容类聚、网站类聚、内容类聚+网站类聚等多种方式 对同一网站和检索内容相同的检索结果系统自动做类聚,再作了类聚的检索结果后

38、附上“*上有更多的结果”的链接。 百度快照 点击百度快照即可查看该网页的快照内容。百度预先对网页站点进行浏览,拍下其尽其所有网站的大部分页面保存在专用服务器上,在进行网络浏览时,如不能正常链接到所需的页面,就可以用百度快照调用暂存的网页来救急。,Baidu高级检索: 1.intitle 在标题中搜索 格式:intitle+:+关键字1+空格+关键字2intitle:南瓜表示搜索标题中含有关键词南瓜的网页; intitle:百度互联网表示搜索标题中含有关键词“百度”和“互联网”的网页。 2.site在站点中搜索 格式:关键词+空格+site+:+站点域名 论坛搜索引擎 site: 表示在这个网站

39、内搜索“论坛搜索引擎”的网页,3.filetype限定文件类型 ( pdf、doc、xls、ppt、rtf”) 格式:关键词+空格+filetype+:+文件格式后缀名 个人年终总结 fitype:doc 检索到全部是word文档的个人年终总结 4. inurl限定域名 格式:关键词1+空格+inurl+:+英文字符串B 找关于photoshop的使用技巧: photoshop inrul:jiqiao photoshop是可以出现在网页的任何位置,而“jiqiao”则必须出现在网页url中。,精确匹配双引号和书名号双引号:英文状态下 例如:检索西南大学,如果不加双引号,系统可能将检索词拆分,

40、结果中会出现“西南交通大学”等。 书名号百度特有的查询符号 关键词A:一书名号会出现在搜索结果中;二是被书名号扩起来的内容即关键词A,不会被拆分 例如:比如,查电影“手机”,如果不加书名号,很多情况下出来的是通讯工具手机,而加上书名号后,手机结果就都是关于电影方面的了。,Internet 免费学术资源检索与利用,1.利用搜索引擎搜索 第一选择Google Google Scholar Google 学术搜索()寻找学术资料如专家评审文献、论文、书籍、预印本、摘要以及技术报告的。文摘是公开的,全文则经过授权才可获得。 Google Book Search Google 图书搜索,2.利用Open

41、 Access资源 Open Access(开放存取,OA),公开存取,是在网络环境下发展起来的一种新的重要学术交流模式。 中国科学信息开放存取链接点 中国科技论文在线() 奇迹文库() 中国预印本服务系统( 香港科技大学科研成果全文仓储(http:/repository.ust.hk/dspace/) 开放阅读期刊联盟() 国外科学信息开放存取链接(需付国际流量费) DOAJ开放存取期刊列表() Blackwell电子期刊(www.balckwell-) Open J-Gate电子期刊(www.openj-),3.科学专业搜索引擎Scirus(

42、) 由荷兰Elsevier Science数据公司开发,号称最全面的科技信息搜索引擎,专门搜索普通引擎找不到的免费的或者访问受限的科技网页,以及1920年以来发表的期刊论文。 网页内容来源于:大学网站、科学家主业、会议信息、专利信息(美国专利、日本专利、欧洲专利等)、公司主页、产品信息;期刊来源包括ScienceDirect提供的5000多种学术期刊,还包括一些一年以后才正式出版的预印本。,Scirus的优势是提供免费索引服务,商业目的提供在线订购ScienceDirect期刊服务,提供专利信息的全文免费,其他则需要付费获取。 特色:提供的在线词表可以识别50000以正式出现的科技词汇,涉及所

43、有学科领域,因此能够对非科学方面的信息进行过滤,确保检索结果的精确性。不能反映同义词、近义词、多义词等词间关系,影响查全率,可能导致漏检。,免费学术资源之,http:,免费学术资源之,预印本服务系统简介,由中国科学技术信息研究所与国家科技图书文献中心联合建设的以提供预印本文献资源服务为主要目的的实时学术交流系统,由国内预印本服务子系统和国外预印本门户(SINDAP)子系统构成。 国内预印本服务子系统主要收藏的是国内科技工作者自由提交的预印本文章,可以实现二次文献检索、浏览全文、发表评论等功能。 国外预印本门户(SINDAP)子系统是由中国科学技术信息研究所与丹麦技术知识中心合作开发完成的,它实

44、现了全球预印本文献资源的一站式检索。通过SINDAP子系统,用户只需输入检索式一次即可对全球知名的16个预印本系统进行检索,并可获得相应系统提供的预印本全文。目前,SINDAP子系统含有预印本二次文献记录约80万条。,预印本(Preprint)是指科研工作者的研究成果还未在正式出版物上发表,而出于和同行交流目的自愿先在学术会议上或通过互联网发布的科研论文、科技报告等文章。与刊物发表的文章以及网页发布的文章比,预印本具有交流速度快、利于学术争鸣、可靠性高的特点。,系统可提供用户自由提交、检索、浏览预印本文章全文、发表评论等功能 。 系统收录的预印本内容主要是国内科研工作者自由提交的科技文章,一般

45、只限于学术性文章。 服务系统只对上传文章进行粗略的审核 ,不进行学术审核,文章仅仅代表作者个人的观点。 系统不拥有文章的任何版权或承担任何责任,在系统中存储的文章,作者可以自行以任何方式在其他载体上发表。,国外预印本检索-SINDAP,免费学术资源之,奇迹文库预印本 ,奇迹文库,HKUST Institutional Repository 香港科技大学科研成果全文仓储,HKUST Institutional Repository是由香港科技大学图书馆用Dspace软件开发的一个数字化学术成果存储与交流知识库,收有由该校教学科研人员和博士生提交的论文(包括已发表和待发表)、会议论文、预印本、博士

46、学位论文、研究与技术报告、工作论文和演示稿全文共1754条。 浏览方式有按院、系、机构(Communities&Collections)、按题名(Titles)按作者(Authors)和提交时间(By Date) 检索途径有任意字段、作者、题名、关键词、文摘、标识符等。 http:/repository.ust.hk/dspace/,免费学术资源之,麻省理工学院开放式课件中国镜像 ,麻省理工学院的开放式课件(MIT OpenCourseWare)是全世界的教师、学生和自学者不可多得的一个免费、开放的教育资源。它秉承了麻省理工学院推进知识和教育,在二十一世纪服务于全人类的使命,也符合了麻省理工学院追求卓越、创新和领先的价值理念。 麻省理工学院开放式课件: * 是麻省理工学院公开发布的课程资料 * 不需要任何注册登记 * 不授予学位和证书 * 不提供麻省理工学院教师信息,免费学术资源之,快速检索 高级检索 浏览,开放阅读期刊联盟/,免费学术资源之,期刊出版后,网站上提供全文免费供读者阅读,或者应读者要求,在3个工作日之内免费提供各

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论