




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第二章网络资源检索1计算机检索baidu搜索引擎2Google2.1计算机检索数据库3用户提问匹配运算数据库命中信息一、计算机检索的特点检索速度快检索范围广更新快资源共享检索更方便灵活检索结果可以直接输出4二、数据库5通俗地说,数据库就是由多张表构成的。数据库是按照数据结构来组织、存储和管理数据的仓库。文档1(file):一张表就是一个文档字段(field)记录(record)文档2文档n数据库(database)数据库结构图6三、数据库的类型数值(数据)数据库
是专门提供数值性数据的一种数据库。有的数据库,除了提供数值性数据外,还包括有说明、解释之类的文字,这类数据库称之为文本-数值型数据库,在此一并归入数值型数据库。如:中国资讯行检索(/)7事实型数据库
该类数据库中存贮的数据一般用来描述人物、机构、事物等事实性信息。如名人录、机构指南、产品目录、科研成果目录等均可编成事实型数据库。如:万方中国科研机构数据库。书目型数据库
主要指二次文献数据库,包括各种机读版的文摘、索引、目录等形式的数据库,它给用户提供原始文献的线索。8全文型数据库它是一种存贮文献全文的原始文献数据库。人们可直接获得文献全文,如《中国期刊全文数据库》、《中文科技期刊数据库》(维普)的授权用户都可直接获取原文。三、数据库的类型92.2全球最大的中文搜索引擎、最大的中文网站。2000年1月创立于北京中关村。1999年底,身在美国硅谷的李彦宏看到了中国互联网及中文搜索引擎服务的巨大发展潜力,抱着技术改变世界的梦想,他毅然辞掉硅谷的高薪工作,携搜索引擎专利技术(超文本文档检索系统和方法,简称超链分析),于2000年1月1日在中关村创建了百度公司。从最初的不足10人发展至今,员工人数超过17000人。如今的百度,已成为中国最受欢迎、影响力最大的中文网站,百度在中国的搜索份额超过80%。创新性地推出了基于搜索的营销推广服务2005年,百度在美国纳斯达克上市2009年,百度更是推出全新的框计算(BoxComputing)技术概念(/)简单可依赖10一、核心技术:超链分析
超链分析技术,是新一代搜索引擎的关键技术,已为世界各大搜索引擎普遍采用。在学术界,一篇论文被引用得越多就说明其越好,学术价值就越高(影响因子)。超链分析就是通过分析链接网站的多少来评价被链接的网站质量,这保证了用户在百度搜索时,越受用户欢迎的内容排名越靠前。112.2专利检索练习:在http://(国家知识产权局)网站上检索李彦宏的专利:hypertextdocumentretrievalsystemandmethod,说明申请号及申请日期。12中国国家专利局专利检索与查询——专利检索与服务系统(公众部分)——专利检索——表格检索(中外专联合检索)132.214二、主要搜索功能152.2三、搜索设置四、高级搜索162.2新闻、网页、图片、视频等搜索分类有相应的高级设置。新闻的高级搜索:网页的高级搜索:五、搜索语法172.2关键词组配方法检索运算符/标识符检索表达式备注与空格北京城市学院法学缩小范围查准或|北京城市学院|法学扩大范围查全非-北京城市学院-法学排除缩小范围在网页标题中titletitle:北京城市学院限定范围在指定网站搜索site2013招生
site:限定范围在网页URL中inurl北京城市学院inurl:zhaosheng限定范围文档类型filetype会计葛家澍filetype:pdf限定类型精确匹配“”“北京城市”精确匹配《》(中文标点符号)《手机》检索式是用以表达检索主题的检索词间的合理组合六、网页搜索特色功能介绍182.2七、搜索技巧192.2201.2001年北京地区获国家自然科学基金面上项目有多少项?项目总金额是多少?搜索练习:2.左边的图片是什么?并对其进行简单介绍。3.查找我校区附近2公里左右的餐馆。214.下面是李小龙墓的图片,在李小龙墓的旁边还有另外一座墓,请问这另外一座墓的主人是谁?去世的时候年龄是多少?A.35B.30C.28D.255.“浓须大面好英雄,壮气高冠何落落”此诗句形容了一种花,每年有一天被定为该花的日子,叫“**花日”。历史上某一年的这一天,美国占领了一个亚洲国家,该国家的别称是()
A.香蕉之国B.椰子之国
C.咖啡之国D.柚子之国搜索引擎(SearchEngines)就是对Web页面进行搜集、标引并供用户查询的信息检索工具。22一、搜索引擎的概念2.3搜索引擎搜索引擎并不真正搜索互联网,它搜索的实际上是预先整理好的网页索引数据库。真正意义上的搜索引擎,通常指的是收集了Internet上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎。当用户查找某个关键词的时候,所有在页面内容中包含了该关键词的网页都将作为搜索结果被搜出来。
232.3搜索引擎二、搜索引擎的发展史搜索引擎已经成为人们最常用的互联网工具之一。它的身影无处不在,为人们提供各种便利服务。目前互联网上的搜索引擎有上千种,每一种搜索引擎的覆盖率份额不等,每一种搜索引擎都有各自的优缺点,有不同的查询语言。242.3搜索引擎二、搜索引擎的发展史2000年1月,李彦宏与好友徐勇在北京中关村创立了百度(Baidu)公司。2001年10月22日正式发布Baidu搜索引擎,专注于中文搜索。1997年10月北大天网正式在CERNet上提供服务,由北大计算机系网络与分布式系统研究室开发。博士生LarryPage于1997年9月15日注册了的域名,1999年2月,Google完成了从Alpha版到Beta版的蜕变。1995年12月DEC的AltaVista登场亮相,是第一个支持自然语言搜索的搜索引擎1995年2月Infoseek公司推出Infoseek引擎,由于检索精度高,使得它由一个检索工具变成一个强大的信息服务中心。1994年1月,StanfordUniversity的两名博士生,美籍华人JerryYang(杨致远)和DavidFilo共同创办了Yahoo!。1994年1月,第一个既可搜索又可浏览的分类目录EINetGalaxy上线全球每天约有近4亿次搜索请求,其中中国超过5000万次68.3%网民使用搜索引擎,仅次于电子邮件84.6%网民是通过搜索引擎发现新的网站41%网民是通过搜索引擎进入在线购物平台252.3搜索引擎三、搜索引擎的现状及分类26(货币计算单位为:10亿美元)2.3搜索引擎三、搜索引擎的现状及分类搜索引擎按其工作方式主要可分为3种:全文搜索引擎(FullTextSearchEngine)目录索引类搜索引擎(SearchIndex/Directory)元搜索引擎(MetaSearchEngine)272.3搜索引擎三、搜索引擎的现状及分类通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户。目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。
与全文搜索引擎的区别在于它是由人工建立的,通过“人工方式”将站点进行了分类,不像全文搜索引擎那样,将网站上的所有文章和信息都收录进去,而是首先将该网站划分到某个分类下,再记录一些摘要信息。元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有“聚搜”。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。282.3搜索引擎四、国内主要搜索引擎292.3搜索引擎五、国外主要搜索引擎美国政府网站搜索引擎美国著名的目录导航式搜索引擎HotBot能够检索WEB页面,还提供域名检索、新闻搜索、新闻讨论组等检索服务Ask在美国是继Google、雅虎和微软之后的第四大搜索引擎UKKey是英国本地搜索引擎,提供各种各样的内容搜索SearchWho集成了世界著名的搜索引擎,一次点击,可以快速地搜索到各种网站Dogpile是一个著名的元搜索引擎,每一条搜索结果都综合自数个搜索引擎302.4Google创始人拉里·佩奇和塞吉·布林于1995年相识于斯坦福大学。到1996
年,他们已经开发了使用链接来确定各网页重要性的搜索引擎(最初名为BackRub)。拉里和塞吉将他们所开发的搜索引擎命名为“Google”,这个名称源于数学术语“googol”,即数字1后跟100个零。GoogleInc.创立于1998
年,当时Sun的联合创始人安迪·贝托尔斯海姆为尚未成立的Google开出了10万美元的支票。一、Google简介312.4Google二、Google特色GOOGLE支持多达132种语言,包括简体中文和繁体中文;GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘;GOOGLE速度极快,有8000多台服务器,200多条T3级宽带;
GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果;GOOGLE的搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介;
GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站;GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。32搜索完全匹配的字词或词组
“搜索查询”使用引号来搜索一个完全匹配的字词或一组字词。在搜索歌词或文学作品中的一段文字时,此选项很实用。
[“想象一下所有的人”]提示:建议只在查找非常确切的字词或词组时使用该功能,否则可能会无意中排除掉有用的搜索结果。排除字词
-查询在某个字词前添加短横(-)可排除所有包含该字词的搜索结果。在搜索像汽车品牌美洲虎和动物美洲虎这类同义词时,此功能特别实用.[美洲虎速度-汽车]或[大熊猫-site:]提示:也可以根据其他运算符排除搜索结果,例如排除来自某一特定网站的所有搜索结果。在特定网站或域中搜索
site:查询在搜索中加入“site:”可搜索某个特定网站中的信息,例如《纽约时报》网站上所有提及“奥林匹克”的内容。
[奥林匹克site:]提示:还可在特定顶级域名(如.org或.edu)或国家顶级域名(如.de或.jp)中进行搜索。
[奥林匹克site:.gov]加入类似字词
~查询通常,Google可能会使用同义词代替原始查询中的某些字词。在字词前添加波浪符号(~)可同时搜索该字词及其同义词。
搜索[~食品成分]会同时得到“营养成分”的搜索结果
2.4Google三、Google搜索语法33加入“占位符”
查询*查询对于任何未知字词或“通配符”字词,都可在查询中使用星号(*)作为占位符。使用引号可查找该准确词组的变体或记住词组中间的字词。
[“省*就是赚*”]注:不支持英文选择性字词搜索
查询OR
查询如果您想搜索只包含多个搜索字词中的某一个的网页,则可在这些字词之间加上OR(大写)。如果没有OR,搜索结果中通常只会显示与两个字词都匹配的网页。
[奥
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 矿产资源空间分析-洞察与解读
- 2025年蚌埠爱尔眼科医院招聘若干人模拟试卷(含答案详解)
- 2025年河北沧州南皮县中医医院公开招聘工作人员16名考前自测高频考点模拟试题附答案详解(完整版)
- 2025年金华磐安县卫健事业单位公开招聘工作人员29人考前自测高频考点模拟试题含答案详解
- 2025北京顺义区教委所属事业单位招聘131人模拟试卷及答案详解(网校专用)
- 2025年合肥市引江济淮投资有限公司招聘10人考前自测高频考点模拟试题附答案详解(完整版)
- 2025安顺市参加“第十三届贵州人才博览会”引才1453人模拟试卷及参考答案详解一套
- 班组安全培训讲话材料课件
- 2025广西能源集团有限公司社会招聘15人模拟试卷完整答案详解
- 2025年合肥滨投文化创意发展有限公司招聘3人考前自测高频考点模拟试题及答案详解(全优)
- 网络交友新时代课件
- 2025年乡村医生公共卫生服务专业知识题库及答案解析
- 2024年江南大学公开招聘辅导员笔试题含答案
- 议论文写作入门基础任务式课件2025-2026学年统编版高中语文必修上册
- 佛州驾照考试试题题库及答案
- 《人工神经网络理论及应用》课件-第8章 深度神经网络-卷积神经网络(下)
- 索佳全站仪SET230RK3使用说明书
- 甘草中药课件
- 2025贵州贵阳机场安检站安检员岗位实习人员招聘笔试历年参考题库附带答案详解
- 建设工地试验室日常质量监督计划
- 基本生活能力评估表BADL使用指南
评论
0/150
提交评论