2.2.1搜索引擎.ppt_第1页
2.2.1搜索引擎.ppt_第2页
2.2.1搜索引擎.ppt_第3页
2.2.1搜索引擎.ppt_第4页
2.2.1搜索引擎.ppt_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2 2因特网信息的查找 2 Copyright 2012AndyGuo Allrightsreserved 知识回顾 信息获取的一般过程 定位信息需求 3 Copyright 2012AndyGuo Allrightsreserved 你知道四大信息来源吗 文献型信息源 报纸 杂志 书籍 口头型信息源 个人型信息源 电子型信息源 广播 电视 因特网等 实物型信息源 现场信息源 4 Copyright 2012AndyGuo Allrightsreserved 实例引入 同学们知道世界七大奇观是什么吗 上网查 5 Copyright 2012AndyGuo Allrightsreserved 搜索引擎到底是什么呢 那么 究竟怎样上网搜索信息呢 搜索因特网上的信息时 必须要满足三个条件 一 你的计算机必须是能够上网的 二 要有搜索引擎 三 有效的关键词 所谓搜索引擎 就是用于在因特网上进行信息查找的网络工具 例 搜索引擎是帮助用户查找存储在个人电脑 计算机网络 如互联网 上的信息的软件程序 搜索引擎的工作原理是 抓取 索引 排序 7 Copyright 2012AndyGuo Allrightsreserved 搜索引擎的历史 在因特网发展初期 网站相对较少 查找信息比较容易 然后伴随着网络上信息资源的不断扩充 网络用户想找到所需的资料真如大海捞针 这时 搜索引擎便应运而生 1994年4月 斯坦福 Stanford 大学的两名博士生 美籍华人杨致远和美国人DavidFilo共同创办了超级目录索引擎Yahoo 并成功地使搜索引擎的概念深入人心 从此搜索引擎进入了高速发展时期 全文搜索引擎的工作原理 索引生成器 网页数据库 爬行器 蜘蛛 查询检索器 用户查询 因特网 搜索引擎至少由三部分组成 爬行器 即机器人 蜘蛛等搜索程序 索引生成器 即网页索引数据库 查询检索器 即用户检索界面 随着搜索引擎的发展 许多搜索引擎在此基础上增加特色功能 如百度增加了监控程序 网络信息检索第2章张胜光制作 10 利用能够从互联网上自动收集网页的Spider系统程序 自动访问互联网 并沿着任何网页中的所有URL爬到其它网页 重复这过程 并把爬过的所有网页收集回来 第一步 从互联网上抓取网页 因特网 第二步 建立索引数据库 由分析索引系统程序对收集回来的网页进行分析 提取相关网页信息 包括网页所在URL 编码类型 页面内容包含的关键词 关键词位置 生成时间 大小 与其它网页的链接关系等 根据一定的相关度算法进行大量复杂计算 得到每一个网页针对页面内容中及超链中每一个关键词的相关度 或重要性 然后用这些相关信息建立网页索引数据库 搜索引擎的Spider一般要定期重新访问所有网页 各搜索引擎的周期不同 可能是几天 几周或几月 也可能对不同重要性的网页有不同的更新频率 更新网页索引数据库 以反映出网页内容的更新情况 增加新的网页信息 去除死链接 并根据网页内容和链接关系的变化重新排序 这样 网页的具体内容和变化情况就会反映到用户查询的结果中 第三步 检索界面的建立 当用户输入关键词搜索后 由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页 因为所有相关网页针对该关键词的相关度早已算好 所以只需按照现成的相关度数值排序 相关度越高 排名越靠前 最后 由页面生成系统将搜索结果的链接地址和页面内容摘要等内容组织起来返回给用户 每个搜索引擎都必须向用户提供一个良好的信息查询界面 百度简介 百度 全球最大的中文搜索引擎 最大的中文网站 2000年1月由李彦宏和徐勇创立于北京中关村 每天收入约2千多万元人民币 CEO李彦宏以94亿美元资产位居201 年中国内地首富榜 谷歌简介 于1998年9月创立 全球规模最大的搜索引擎 每天收入5亿元人民币 创始人拉里 佩奇雅虎简介 雅虎 Yahoo 是美国著名的互联网门户网站 20世纪末互联网奇迹的创造者之一 创始人杨致远 美籍华人 四 三大搜索引擎简介 17 Copyright 2012AndyGuo Allrightsreserved 自主学习 搜索引擎有哪些分类 18 Copyright 2012AndyGuo Allrightsreserved 关键词查询 分类搜索 19 Copyright 2012AndyGuo Allrightsreserved 搜索引擎的分类 1 全文搜索引擎全文搜索引擎也称为 关键词查询 指用代表所需信息主题的关键词进行信息查询 代表性的有Google 百度等 20 Copyright 2012AndyGuo Allrightsreserved 2 目录索引类搜索引擎目录索引是将收取到的各个网站 网页 的信息按照目录分类 建立索引数据库供人们分类查找 因此这种搜索方式也被称为分类搜索 目录索引类搜索引擎包括搜狐 新浪 网易 雅虎等 搜索引擎的分类 全文搜索引擎与目录索引类搜索引擎比较 22 Copyright 2012AndyGuo Allrightsreserved 搜索引擎的分类 3 元搜索引擎 就是通过一个统一的用户界面帮助用户在多个搜索引擎中选择和利用合适的 甚至是同时利用若干个 搜索引擎来实现检索和操作 是对分布于网络的多种检索工具的全局控制机制 例如 百google度 搜魅网等 23 Copyright 2012AndyGuo Allrightsreserved 人肉搜索 人肉搜索就是利用现代信息科技 变传统的网络信息搜索为人找人 人问人 人碰人 人挤人 人挨人的关系型网络社区活动 变枯燥乏味的查询过程为一人提问 八方回应 一石激起千层浪 一声呼唤惊醒万颗真心的人性化搜索体验 猫扑网我爱找人网 25 Copyright 2012AndyGuo Allrightsreserved 关键词 什么是关键词就是您输入搜索框中的文字 也就是您命令搜索引擎寻找的东西 关键词 震级造成破坏 例如 多少级以上的地震会造成破坏 a 4 5级b 5级c 6级 26 Copyright 2012AndyGuo Allrightsreserved 搜索常用技巧 1 不要局限于一个搜索引擎 当搜索不到理想的结果时 试着用另外一个搜索引擎 2 强制搜索的方法 加英文双引号 或者加书名号 例如 搜索 明月几时有 把酒问青天 出自哪首词 3 使用加号 例如 输入 电脑 电话 传真 就表示要查找的内容必须要同时包含 电脑 电话 传真 这三个关键词 4 使用减号 例如 在搜索引擎中输入 爱情公寓3 电视剧 它就表示最后的查询结果中一定不包含 电视剧 5 每个搜索引擎都有自己的帮助系统 遇到困难 首先求助于帮助系统 27 Copyright 2012AndyGuo Allrightsreserved 课堂小结 一 搜索引擎1 搜索引擎的发展史 1994年雅虎 yahoo 2 搜索引擎的种类 全文搜索引擎 按关键词检索目录索引类搜索引擎 按目录检索元搜索引擎 同时在几个搜索引擎上进行搜索二 搜索技巧技巧1 不要局限于一个搜索引擎 技巧2 关键词的选择很重要 技巧3 强制搜索的方法 加英文双引号 技巧4 每个搜索引擎都有自己的帮助系统 遇到困难 首先求助于帮助系统 技巧5 将目录检索与关键词检索相结合使用效果会更好 效率会更高 28 Copyright 2012AndyGuo Allrightsreserved 世界七大奇观及其图片目前人类已知的最软的石头是什么 哪个海位于欧 亚 非三大洲之间 任务一 29 Copyright 2012AndyGuo Allrightsreserved 任务二 推理题 一个人在朋友家吃饭 问朋友这餐吃的是什么肉 朋友说是企鹅肉 他就号啕大哭自杀了 为什么呢 关键词 朋友吃饭企鹅肉朋友吃饭企鹅肉号啕大哭企鹅肉自杀答案 30 Copyright 2012AndyGuo Allrightsreserved 微软招聘 曾有一个著名的题目 下水道的盖子为什么是圆的 任务三 关键词 下水道的盖子为什么是圆的下水道盖子圆的原因下水道盖子圆的回答 31 Copyright 2012AndyGuo Allrightsreserved 任务四 同学们都知道 再别康桥 是高中语文课本中一首非常美的诗

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论