搜索引擎使用及常见搜索引擎.ppt_第1页
搜索引擎使用及常见搜索引擎.ppt_第2页
搜索引擎使用及常见搜索引擎.ppt_第3页
搜索引擎使用及常见搜索引擎.ppt_第4页
搜索引擎使用及常见搜索引擎.ppt_第5页
已阅读5页,还剩29页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、搜 索 引 擎( Search Engine ),“搜索改变生活”,主要内容,搜索引擎的概况(概念、发展历史、构成、工作原理、类型) 搜索引擎的选择 通用搜索引擎google 学术搜索引擎google scholar 医学专业搜索引擎 科技搜索引擎scirus 其它,搜索引擎 Internet上具有查询功能的网页的统称,即允许用户递交查询,检索出与查询相关的网页结果列表,并且排序输出。,发展历史 迈出开始以某种程度组织Internet内容第一步的是基于菜单检索的gopher。第一个成功的搜索引擎是WebCrawler,由华盛顿大学研制,1994年4月亮相。随后,Lycos,Infosseek,

2、Open Text,Alta Vista,Excite,HotBot,Northen Light,google,Fast Search相继出现。,构成 自动索引程序(搜集、索引) 数据库 检索代理软件 工作原理 定期运行搜索软件,收集信息。 利用索引软件进行自动标引,建立数据库。 以Web页面形式向用户提供检索界面,由用户输入检索式。 通过检索软件进行检索,匹配,按相关度排序输出。,从互联网抓取网页,建立索引数据库,检索排序,类 型 根据检索内容分类 综合性搜索引擎和专业性搜索引擎; 根据检索功能分类 目录式搜索引擎、全文式搜索引擎、智能式搜索引擎; 根据检索范围分类 独立搜索引擎和元搜索引擎

3、。,搜索引擎的选择,考虑因素: 稳定性、索引规模、采集的文献类型、是否进行全文标引、更新频率、检索功能是否完备、检索响应速度、检出结果完整性与相关性、重复链接和死链接的比例、界面是否友好、检索讲究数量还是追求质量等。,可借助评价网络检索工具的专门网站,了解特点、掌握技巧及最新进展。如: 中文搜索引擎指南网 ( http:/www.search- 搜索引擎直通车(http:/www.se- 搜索研究院() Search Engine Watch Search Engine Showdown,Google -综合性搜索引擎,是由两个斯坦福大学博士生Larry Page与Sergey Brin于19

4、98 年9 月组建的。公司提供的唯一服务就是搜索引擎。2000 年7月, Google 替代Inktomi 成为Yahoo 公司的搜索引擎, 同年9 月份, Google成为中国网易公司的搜索引擎。Google 因其具有界面简洁、易用、快速、相关性强等优点, 深受用户的喜爱。,作为目前互联网上功能最强大的搜索引擎, Google 的索引目录中已经储存有81 亿个网页。用户可以使用100 多种语言文字进行搜索。现在, Google 平均每天接受的搜索次数达2 亿人次, 几乎占全球所有搜索量的1/3, 而且这一数字还在不断上升。,1. Google的特色:,1)将中、英文搜索整合于同一界面,是收集

5、亚洲网站最多的搜索引擎之一。 2)可检索可移植文档(PDF)和PowerPoint格式(PPT)等10多种文件类型。 3)独特的“网页快照”将用户浏览过的网页贮存在服务器上,并用不同颜色突出显示检索词。 4)检索响应速度极快,搜索时间通常不超过0.5秒,5)特有的网页级别技术(PageRank)。 6)收集了10亿多幅图像,使其成为目前因特网上的最好用的图象搜索工具 7)Preference(使用偏好)可将Interface Language(界面语言)设置为中文简体,跨越了语种障碍。 8)自动进行汉字简繁体转换,可将结果中繁体字网页翻译为简体字显示,2.检索途径,(1)简单检索 网页检索 直

6、接输入检索词或检索式 检索规则: 1)默认检索:输入多个检索词以空格分隔,默认为AND匹配。最多可输入10个检索词。 2)逻辑“或”检索:用大写的OR连接多个检索词。,3)逻辑“非”检索:检索词前加上减号(减号前必须留一空格),搜索不包含该检索词的网页。如:leukemia child 4) 短语检索:用半角的双引号括起词组或短语,进行精确短语匹配。 5)文件类型限定:输入filetype:加文件名缩写。如: filetype:ppt,6)检索词位置限定:检索词前用位置代码加冒号(冒号后不能空格),可限定检索词出现在网页的标题、正文等指定位置。 7)网站或域名限定:site:网址或域名 。 8

7、)链接限定:link:网址 (或超级链接名称,效果差许多). 9)禁用词:如“的”、 “of”等这类词。自动忽略,强制检索时可用+(前面必须空一格)或“”。,习 题 1:用简单检索途径查找“型糖尿病国外病人眼部并发症研究”的相关网页。 diabetes 2 OR type 2 diabetes eye complications -china -chinese 2:检索有关偏瘫病人的护理的全文文献(即pdf格式)。,图片检索(注意:中外文补充检索) eg:类风湿性关节炎的病理图片 资讯检索 论坛检索:包括usenet新闻组,(2)高级检索 1)网页高级检索: 包括“搜索结果”、“查询设置”和“

8、搜索特定网页”3个区域。搜索结果区内的4种匹配方式依此表示and 、精确检索、or、not。 习题: 检索IEEE Computer Society发布的计算机国际会议公告。 2)图片高级检索 3)高级论坛检索,3.结果显示4.网页目录,用网页目录结合关键词检索查找有关防火墙的网页。,Google特色搜索引擎 Google Scholar( 学术搜索) Google Book Search (图书搜索,以前称Google Print) Google News( 新闻或资讯搜索) Google Answers( 专家解答),Google Scholar,http: / Google Schola

9、r 不仅仅从Google 收集的上百亿个网页中筛选出具有学术价值的内容, 而且最主要的方式是与许多科学和学术出版商进行了合作, 这种合作使用户能够检索特定的学术文献, 通过Google Scholar 从学术出版者、专业团体、预印本库、大学范围内以及从网络上获得学术文献, 包括来自所有研究领域的同级评审论文、学位论文、图书、预印本、摘要和技术报告, 内容从医学、物理学到经济学、计算机科学等等。,医学专业搜索引擎,外 文: (一)Medical Matrix(/Index.asp) (二) CliniWeb International (http:/

10、/cliniweb/) (三)HON(http:/www.hon.ch) (四) Medical world Search(,Medical Matrix 1994年由美国医学信息学会(AMIA)主办并维护的世界著名医学专业搜索引擎。以搜集因特网上临床医学信息为主,收录6000多个医学网站、1500多万个链接。所收录的网站全部经过AMIA资深专家的认真筛选和审定,以确保质量。,HON (http:/www.hon.ch) 由在瑞士日内瓦的非盈利性组织“网络健康基金会”(The Health on the Net Foundation)1996年建立的一个医学信息站点,该

11、站点专门诊断因特网所提供的信息的正确性和可靠性,并提倡网络伦理。这个组织发展了一套用以检测网站信息的正确性和可靠性的系统,运用此系统,上网者可随时确知自己浏览的资料的可信度。,HON 医学搜索引擎 HON建立的医学搜索引擎,包括MedHunt和HONselect。 HON还根据使用信息对象的不同,提供三种不同对象的登陆入口,包括个人、医学专业人员和网络出版者,针对不同的用户群体提供一些他们感兴趣的信息。,MedHunt 是HON搜索引擎的主要服务,通过MedHunt搜索出来的是与检索提问相关的所有网页。使用比较简单,只要在检索输入框中输入欲检索主题的关键词,点击“Submit”按钮即可。 显示

12、的结果按照相关度排序。 检索页面可以直接进入HONselect、Web resources、Medical image(s)、Medical News 、Medical Conferences等方面与检索的主题相关的信息。,HONselect 是将来源于不同数据库同类信息资源进行整和后,再提供给用户。这是HON提供的特色服务。 从HONselect作为入口检索,要求输入的检索词应是医学主题词(MeSH)。,科学搜索引擎Scirus, 由荷兰爱思唯尔Elsevier Science于2001年4月1日推出。Scirus是专为搜索高度相关的科学信息而设计的搜索引擎。 Scirus的技术支持是Fas

13、t Search & Transfer 。对用户提供了超过2亿个科技网页的检索,涵盖了18,000,000篇全文文献及文摘,收录范围广泛,文献种类齐全。它为用户提供了强大的检索功能,具体表现在:查找网页上最大的科技及医学(STM)数据库,能够发现更多的科技信息。能发现其他搜索引擎未收录的最新的报告、专利、同行评议文章、作者主页、大学网址和期刊。,资源链接:,14.6 million MEDLINE citations 5.5 million ScienceDirect full-text articles 2 million patents from the USPTO 261,000 e-p

14、rints on ArX 5,352 BioMed Central full-text articles 10,600 NASA technical reports 14,878 full text articles from Project Euclid 还有巨量教育、学术团体、政府、企业等站点。(注:数据动态变化),检索规则: 支持:AND 、 OR 、 ANDNOT 关键词前可用 + 、- 几个关键词可用“”引起来 可用一些限定符来缩小范围,如:au、ti、jo、ke、url、dom、af等。,用户可以通过简单检索(basic search)和高级检索(advanced search)两种方式来进行检索专业信息资源。 它还使用一个特殊的叙词表来收录相关的科学词汇。在与慕尼黑大学(University of Munich)的计算语言学系(Computational Linguistics Department)的合作

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论