




已阅读5页,还剩68页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三章搜索引擎、Outline、搜索引擎概念(定义、工作原理、特征)搜索引擎的分类搜索引擎选择和评估常用的统一搜索引擎使用通用学术搜索引擎使用搜索引擎应注意的问题跟踪搜索引擎的更改、1搜索引擎概述、最常用的搜索引擎是什么?你觉得搜索引擎怎么样?1.1概念,应用于web的软件系统固定策略,在web上收集、搜索和组织信息用户的观点:提供用户输入单词或短语的web界面,可能与用户输入相关的信息列表Source: Li Xiaoming,Yan hongfei,Wang jimin。搜索引擎原理、技术和系统。北京:科学出版社,2005: 2,1.2工作方式,1.2工作方式,网页收集网站所有者积极向搜索引擎提交网站蜘蛛扫描网站的所有网页,将相关信息存储在数据库中,预处理关键字提取重复网页或转载网页的删除链接分析网页的重要性计算,用户输入搜索提交搜索要求, 提供搜索引擎接受查询根据用户提交的查询请求要求,提供通过索引数据库搜索相关记录搜索链接指向用户所需的网页作为网页链接2搜索引擎分类按信息内容组织,手动参与WebDirectory,限制主题目录数据,特别是强大的Yahoo! Directoryyopendirectory、keyword search engine无手动控制、系统完成的数据量、更新时间Google Baidu、2搜索引擎分类包含范围、包含联合搜索引擎的生活相关领域GoogleYahoo!Baidu Bing,按专业搜索引擎功能领域的用户特定信息类型的区域law crawler,sciseekaskjeevesforkidsipsearch,按2搜索引擎的分类功能,独立搜索引擎有单独的数据库GoogleYahoo!Baidu Bing、元搜索引擎一次搜索多个数据库的功能消除结果一般没有单独的数据库提供多个搜索引擎的联合搜索界面Metacrawler独立搜索引擎与元搜索引擎的集成(例如worm搜索、worm搜索基本搜索界面:独立搜索引擎支持关键字搜索,worm搜索高级搜索界面:元搜索引擎支持多个独立搜索引擎结果)怎么了?搜索引擎优化网站(SEOMOZ)通过SEO领域的多位世界专家的调查,发表了两年进行一次的搜索引擎排名影响因素调查结果。3搜索引擎选择和评估,SEOMOZ(2009)的调查结果,最重要的5个影响因素是关键字锚文本中外部链接(73%,非常重要)链接所在页面的受欢迎程度(71%,非常重要)链接资源的多样性(67%,非常重要) 非常重要)从链接中介购买链接(56%,非常重要)搜索引擎欺骗的站点或网页的链接(51%,更重要)基于UserAgent的伪装(51%,更重要)频繁的服务器故障或无法访问站点(51%,更重要) (7.8%)百度(7.0%),4联合搜索引擎选择,国内搜索引擎首选份额排名(2009.6)百度(77.2%)谷歌(12.7%)搜索(3.1%)搜索狗2009年中国搜索引擎用户行为研究报告(2009年9月).中关村世界最大规模的中文搜索引擎成立。2005年8月5日,百度支持Nasdaq,4.1百度()的主页,百度的高级搜索页面,百度的帮助中心,百度的搜索技术,百度快照拼音提示功能支持中文查询相关搜索支持:-,|,百度的搜索功能和特性、百度的结果处理、搜索结果排序规则将超链接分析技术、词频统计和投标排名相结合,以评估网页的相关性。每个搜索结果都显示Baidu快照和相关搜索的关键字搜索提示,例如网页标题、摘要、网站、Baidu快照,以及4.2Google().hk/1998年9月,斯坦福大学博士生LarryPage,SergeyBrin创立,作为全球使用最广泛的搜索引擎,获得了30多个奖项,如OutstandingSearchService,BestNewsSearchEngine,Google具有多种服务和功能,Google的搜索技术,通常区分英语大小写的默认值AND(and)包括site、inurl、allinurl、intitle、allintitle和filetype相关性判断基于网页评级综合审查搜索词频率、位置、web内容(以及该页面链接的内容),评估该网页与用户需求的匹配程度并确定排序优先级。主页评级系统包括标题、摘要、网址、网页大小、cached(web快照)、similarpages(相关网页)、notethis(显示相应网页)、web翻译和(),雅虎中国:1994年4月由杨致远和大卫菲洛创建,最早的基于目录的搜索引擎之一,以两种搜索方式提供分类目录搜索和分类目录搜索(,搜索结果处理:相关度为实现网页、图片、博客、视频等资源的统一搜索显示角色关系,以关键词搜索”分别使用百度、谷歌、雅虎中国进行搜索,分析其异同。选择五种外语学术搜索引擎,Google学术搜索百度guoxue搜索Scirus,5.1 Google学术搜索(Googlescholar),网站:中文网站:来源:学术出版商,专业学会,高等院校,图书馆和可靠的信息来源、学术功能、特点:显示引用的信息:文件之间的引用和引用的关系显示库链接,搜索用户参与该计划的图书馆收集资料的列表,查看可访问的资源链接,国家图书馆等多个图书馆参与了计划使用偏好。用户自定义搜索结果,包括界面语言、搜索语言、图书馆链接、结果显示的数量和方式、文档管理软件等项目,并根据相关程度对搜索结果进行排序,Google学术搜索的更多功能,查看其中一本书:查看简介,版权信息,目的,在章节的示例书中搜索信息(Searchwithinthisbook) 精确搜索和字段搜索路径限制:高级搜索,如文章名称、作者、日志名称:可以设置多个选项,如信息发布时间、信息类型、文件格式、信息源、主题领域;搜索结果:相关排序相关性主要与搜索词位置和发生频率两个基本因素相关。 一个页面被另一个网页引用或链接的越多,排序就越靠前,问:还有什么学术搜索引擎吗?例如,Search4Science,6在使用搜索引擎时需要注意的问题,每个搜索引擎的功能在不同的搜索引擎中使用的符号不同的引擎结果优先级计算方法不同的优先级选择优秀的搜索引擎选择对象特定的搜索引擎选择搜索引擎,搜索引擎应该注意变化,而不是万能竞争,7搜索引擎的最新动态跟踪,讨论:如何更好地了解搜索引擎的最新发展情况?搜索引擎主页简介和帮助页面搜索引擎集合和评估网站中文搜索引擎指南搜索引擎跟踪搜索引擎列表、考试问题、搜索引擎是什么?请告诉我它的工作原理。什么类型的搜索引擎?每个都有什么特性?搜索引擎选择和评估主要考虑哪些因素?谈论搜索引擎发展
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 宿舍说话检讨书
- 四川省宜宾市2024-2025学年七年级下学期期末考试数学试卷(含答案)
- 江苏省常州市钟楼区小学英语五年级下册期末检测卷(含答案)
- 《大数据审计基础》全套教学课件
- 安徽省阜阳市2024-2025学年八年级下学期期末教学质量检测数学试卷(含答案)
- 3D打印:从原理到创新应用知到智慧树答案
- 电商平台消费者隐私数据保护策略研究
- 餐饮行业外卖模式创新案例分析
- “四史”概论知到智慧树答案
- 水银泄露处理课件
- FIDIC国际合同条款中英文对照
- 托盘车充电安全操作规程
- 第五版-FMEA-新版FMEA【第五版】
- 中经堂经络养生运营策划书
- 城轨车辆车门电气原理分析及故障排除
- GB/T 17478-2004低压直流电源设备的性能特性
- GB 18447.1-2008拖拉机安全要求第1部分:轮式拖拉机
- 职业健康培训材料
- 新版食品安全法前后对比-讲义课件
- 《政治经济学》(全套课件)
- 武汉理工大学计算机科学与技术学院课程教学大纲
评论
0/150
提交评论