




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
互联网应用模式 常用搜索引擎市场营销41341 搜索引擎发展历史 所有搜索引擎的祖先 是1990年由Montreal的McGillUniversity三名学生 AlanEmtage PeterDeutsch BillWheelan 发明的Archie ArchieFAQ AlanEmtage等想到了开发一个可以用文件名查找文件的系统 于是便有了Archie Archie是第一个自动索引互联网上匿名FTP网站文件的程序 但它还不是真正的搜索引擎 Archie是一个可搜索的FTP文件名列表 用户必须输入精确的文件名搜索 然后Archie会告诉用户哪一个FTP地址可以下载该文件 由于Archie深受欢迎 受其启发 NevadaSystemComputingServices大学于1993年开一个Gopher GopherFAQ 搜索工具Veronica VeronicaFAQ Jughead是后来另一个Gopher搜索工具 第一代 分类目录时代 人工时代 不知道大家时候在自己的搜索引擎首页是否有设置过导航网站这个网址作为自己的首页呢 其实这个网址就是搜索引擎第一代的代表 我们可以从这个导航网站这个网站里面看到 里面几乎都是一些分类网址 几乎在互联网上的 这个网站里面都一应俱全 从这里我们可以看出 这个网站是一个导航网站 也可以说分类目录网站 用户可以从这个分类目录里找到自己想要的东西 这就是搜索引擎第一代 第二代 文本检索时代 海量自动获取与排序清单 到了这一代 搜索引擎查询信息的方法则是通过用户所输入的查询信息提交给服务器 服务器通过查阅 返回给用户一些相关程度高的信息 这代的搜索引擎的信息检索模型主要包括例如布尔模型 概率模型或者向量空间模型 通过这些模型来计算用户输入的查询信息是否与网页内容相关程度高低 将相关度高的则返回给用户 采取这种模式的搜索引擎主要是一些早期的搜索引擎 例如像AltaVista Excite等等 这就是搜索引擎第二代 第三代 整合分析时代 立体搜索与结果整合 这一代的搜索引擎所使用的方法大概是和我们今天的网站的外部链接形式基本相同 在当时 外部链接代表的是一种推荐的含义 通过每个网站的推荐链接的数量来判断一个网站的流行性和重要性 然后搜索引擎再结合网页内容的重要性来和相似程度来改善用户搜索的信息质量 第四代 用户中心时代 以移动互联网为标志的个人需求精准搜索 第四代 也就是我们所用的搜索引擎技术也是互联网上面用的最普遍的 主要是以用户为中心 当客户输入查询的请求时候 同一个查询的请求关键词在用户的背后可能是不同查询要求 这一代搜索引擎主要是以用户为中心 这就是第四代搜索引擎 网络信息资源检索方法 1 直接浏览用户使用最为广泛 最原始的获取信息的方法 2 利用导航网站 门户网站基于专业人员对网络信息资源分布的了解 对网络信息进行评价 组织 分类等工作 再按一定的专业或学科形成具有良好分类体系的网络资源指南 搜索引擎的概念及工作原理 概念 SearchEngine 从广义上讲是用来对网络信息资源管理和检索的一系列软件 在Internet网上查找信息的工具或系统 组成 WWW服务器 搜索程序 如spider crawler robot 索引数据库 包括成千上万甚至上亿个网页 检索程序 用来处理用户的检索请求 研究目的与意义 常用搜索引擎介绍及示例 Google 中文 网址 Google 概述Google是由美国斯坦福大学的两位博士生拉里 佩吉和谢尔盖 布林于1998年创建的其优势在于掌握的信息量以及检索模型和检索速度 它可为世界各地的用户提供适需的搜索结果 而且搜索时间通常不到半秒Google采用全文标引方式 提供每日更新 Google的查询界面 设置搜索偏好 包括每个网页上默认的搜索结果数量 界面语言 以及查询语言 直接进入最符合搜索条件的网页 Google 特点支持多达一百多种语言提供1万多亿个搜索网页 涵盖内容齐全搜索速度快结果命中率高搜索结果摘录查询网页的部分具体内容 而不仅仅是网站简介智能化的 手气不错 功能 提供可能最符合要求的网页 网页快照 功能 能从Google服务器里直接取出缓存的网页 检索功能 基本检索其它检索语法搜索的关键词包含在URL链接中 inurl 搜索的关键词包含在网页标题中 intitle 搜索的关键词包含在网页的 锚 中 inanchor 或allinanchor 搜索所有链接到某个URL的网页 link Google 检索功能 基本检索 高级检索功能 可以排除某个特定站点的网页 限定网域 可以对检索结果页面的语言类型进行限制 限定语种 可以限定检索结果的时间范围 更新日期 可以限定关键词出现的位置 字词位置 可以检索链向某一个网页的所有页面 键连功能 可以检索与某一个网页相关的所有网页 相似网页检索 搜索引擎优点 网络的资源非常丰富 对于一个普通网民来说在这浩如烟海的信息流中寻找对自己有用的信息成为一件十分困难的事 搜索引擎的作用就在于整合网络资源 为用户提供贴心的搜索服务 提高效率 搜索引擎缺点 搜索结果里的排名很大程度上与广告费用有关 这就局限了我们的视野 有些搜索引擎的搜索结果中广告 垃圾网站和死链比较多 网页快照 经常打不开等等问题 世间万物都有缺点 关键是合理使用并找到自己想要的信息 搜索引擎缺点 搜索引擎对常见词的搜索存在缺陷 因为这些词曝光率
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 事业单位联考题库【有一套】附答案详解
- 一年级班级文化建设活动策划
- 医院继续教育培训考核管理办法
- 2025年心脏内科冠心病急性期护理模拟测试答案及解析
- 2025年中考数学总复习《锐角三角函数》能力提升B卷题库及答案详解【名师系列】
- 2025年儿科发热常见病因分析模拟考卷答案及解析
- 2025年精神科学精神疾病常见症状评估考试答案及解析
- 物流车辆管理制度与流程
- 2025年急诊医学重症监护护理技能考核模拟考试卷答案及解析
- 家电维修技术学习手册
- 人教版(新教材)高中生物选择性必修1课件3:4 3 免疫失调
- 《SLT 582-2025水工金属结构制造安装质量检验检测规程》知识培训
- “燕园元培杯”2023-2024学年全国中学生地球科学奥林匹克竞赛决赛试题详解
- 中国血脂管理指南(基层版+2024年)解读
- 分子诊断技术在感染性疾病中的应用-深度研究
- 《智能AI分析深度解读报告》课件
- 气道异物护理教学
- 2024年版机电产品国际招标标准招标文件
- 企业合规经营规范手册
- 企业员工心理健康与欺凌防范政策
- 四川省兴文县建设煤矿2021年矿山储量年报
评论
0/150
提交评论