网络信息资源的检索_第1页
网络信息资源的检索_第2页
网络信息资源的检索_第3页
网络信息资源的检索_第4页
网络信息资源的检索_第5页
已阅读5页,还剩77页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

网络信息资源的检索定义u是指通过 网络存储 的数字化图、文、声、像等多媒体信息的 集合 。u与传统信息资源相比较,其主要特征是 数字化和网络 存取。百度QQ网络信息资源的特点u信息量大,传播广泛u信息层次多,品种多样u自由发布,交流直接u信息传播速度快,变化频繁u分散无序,缺乏管理u检索方便u内容质量不一网络信息资源文本图像图形表格超文本网络信息检索方法 u直接如: u网络资源指南u搜索引擎网络信息检索工具定义:是指在因特网上提供信息检索服务的计算机系统。原理:网络资源搜集资源提供资源搜索引擎u定义:搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上 搜集信息 ,在对信息进行 组织和处理 后,为用户 提供检索服务 的系统。搜索引擎u原理搜索程序 处理程序(索引)检索程序蜘蛛或机器人搜索引擎分类u按 工作方式 划分:全文搜索引擎目录索引类搜索引擎元搜索引擎搜索引擎分类全文搜索引擎通过从互联网上提取的各个网站的信息 (以网页文字为主 )而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,是名副其实的搜索引擎。在国外具有代表性的搜索引擎有 Google等,国内著名的有百度等。内容全,更新快,功能强,命中率低,结构不清晰搜索引擎分类目录索引类搜索引擎虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。在国外代表 DMOZ - the Open Directory Project等结构清晰,内容少,更新慢,搜索引擎分类元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有 InfoSpace、 Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有 360搜索。搜索引擎分类元搜索引擎搜索引擎 一般 查询规则u连接符逻辑 “与 ”一般用 “and”表示,提高查准率逻辑 “或 ”一般用 “or”表示,提高查全率逻辑 “非 ”一般用 “not”表示,缩小范围搜索引擎 一般 查询规则u截词符一般按截断的位置可以分为前方截词,中间截词,后方截词。一般用 “? ”和 “*”等表示截词符。前方截词(后方一致): “? ology”可检出:methodology, biology, radiology中间截词: “wom? n”, woman和 women后方截词(前方一致): “comput?”可检索出compute、 computer、 computing等搜索引擎 一般 查询规则u空格、逗号、括号和引号空格 的作用与逻辑 “与 ”和 “and”是相同的如 计算机 维护逗号 相当于逻辑 “或 ”和 “or”括号 用于改变复杂检索式中逻辑运算符的优先顺序,在括号中的优先执行。如:多媒体 and (计算机 or 网络)引号括 中其中的多个词被当作一个短语。如: “ electronic magazine” electronic magazine搜索引擎 一般 查询规则u限定字段检索限定在标题,正文,网址等。中国搜索分布情况数据来源: /数据来源: /数据来源: /国内外著名搜索引擎u主要国内搜索引擎百度( )百度,全球 最大 的 中文 搜索引擎、最大的中文网站。 2000年 1月创立于北京中关村。以 网络搜索 为主的 功能性搜索 ,以 贴吧 为主的社区搜索 ,针对各区域、行业所需的 垂直搜索 ,Mp3搜索,以及门户频道、 IM等,全面覆盖了中文网络世界所有的搜索需求,根据第三方权威数据,百度在中国的搜索份额超过 80%。国内外著名搜索引擎u主要国内搜索引擎百度( )高级搜索:把搜索范围限定在网页标题中 intitle例如,找云南省风景相关信息,就可以这样查询:风景 intitle:云南注意, intitle:和后面的关键词之间,不要有空格。国内外著名搜索引擎u主要国内搜索引擎百度( )高级搜索:把搜索范围限定在特定站点中 site例如,天空网下载软件不错,就可以这样查询:msn site:注意, “site:”后面跟的站点域名,不要带 “http:/”;另外, site:和站点名之间,不要带空格。国内外著名搜索引擎u主要国内搜索引擎百度( )高级搜索:把搜索范围限定在 url链接中 inurl例如,找关于 photoshop的使用技巧,可以这样查询: photoshop inurl:jiqiao。上面这个查询串中的 “photoshop”,是可以出现在网页的任何位置,而 “jiqiao”则必须出现在网页 url中。注意 , inurl:语法和后面所跟的关键词,不要有空格。国内外著名搜索引擎u主要国内搜索引擎百度( )高级搜索:精确匹配 双引号和书名号如果输入的查询词很长,百度在经过分析后,给出的搜索结果中的查询词,可能是拆分的。如果您对这种情况不满意,可以尝试让百度不拆分查询词。给查询词加上双引号,就可以达到这种效果。例如,搜索 上海科技大学 ,如果不加双引号,搜索结果被拆分,效果不是很好,但加上双引号后, “上海科技大学 ”,获得的结果就全是符合要求的了。国内外著名搜索引擎u主要国内搜索引擎百度( )高级搜索:精确匹配 双引号和书名号 书名号是百度独有的一个特殊查询语法。加上书名号的查询词,有两层特殊功能,一是书名号会出现在搜索结果中;二是被书名号扩起来的内容,不会被拆分。书名号在某些情况下特别有效果,例如,查名字很通俗和常用的那些电影或者小说。比如,查电影 “手机 ”。国内外著名搜索引擎u主要国内搜索引擎百度( )高级搜索:要求搜索结果中不含特定查询词 例如,搜 神雕侠侣 ,希望是关于武侠小说方面的内容,却发现很多关于电视剧方面的网页。那么就可以这样查询: 神雕侠侣 -电视剧 。注意, 前一个关键词,和减号之间必须有空格 ,否则,减号会被当成连字符处理,而失去减号语法功能。减号和后一个关键词之间,有无空格均可。 国内外著名搜索引擎u主要国内搜索引擎百度( )高级搜索:特定文件搜索( filetype)其搜索语法为:查询词 +空格 +Filetype:格式,格式可以是 DOC、 PDF、 PPT、 XLS、 RTF、 ALL(全部文档)。例如: 市场分析 filetype:doc,其中的冒号是中英文符号皆可,并且不区分大小写。国内外著名搜索引擎u主

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论