市场调查与预测论文及调查报告--中文搜索引擎特色优势比较分析.doc_第1页
市场调查与预测论文及调查报告--中文搜索引擎特色优势比较分析.doc_第2页
市场调查与预测论文及调查报告--中文搜索引擎特色优势比较分析.doc_第3页
市场调查与预测论文及调查报告--中文搜索引擎特色优势比较分析.doc_第4页
市场调查与预测论文及调查报告--中文搜索引擎特色优势比较分析.doc_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中文搜索引擎特色优势比较分析及应用推荐摘要:谷歌、百度、雅虎、搜狗、必应、搜搜和有道是7大中文搜索引擎,他们在信息的提供数量以及各类特色搜索功能和服务方面存在差异。本文将从一般搜索需求和特殊搜索需求对七大全文搜索引擎进行比较,以利大家在信息搜索中充分利用这些搜索引擎的特色功能与服务;并对搜索引擎的使用提出建议。关键词:中文搜索引擎 一般搜索需求 特殊搜索需求 应用推荐1 背景研究当今世界是一个“信息大爆炸”的互联网时代,据英国卫报称,目前全球的数据总量已经达到4870亿GB,人们的困惑已经从“如何获取信息”变成“如何选择信息”。随着Internet的进一步普及, 在浩如烟海的信息高速公路上, 根据自己的需求快速准确地寻找所需要的信息越来越依赖于借助多种多样的 Internet 信息检索工具, 而搜索引擎是我们平时使用最多的一种。据中国互联网信息中心 2011年发布的第28次中国互联网络发展状况统计报告,截至2011年6月底,中国网民人口达到4.85亿人,较2010年底增加2770万人。其中搜索引擎是受众最广的网络应用,用户规模达到3.86亿,半年增长率3.1%,使用率79.6%。(如图1)中文搜索引擎用户规模的增长,首先是由于互联网信息量庞大且保持高速增长,网民需要一种有效的工具获取信息;第二,音乐搜索、视频搜索、位置搜索等服务在搜索引擎的引入,极大提升了网民搜索引擎的使用率和使用黏性;最后,搜索引擎不仅是信息搜集工具,其对于新闻、博客、SNS等服务引入以及平台的开放,已经使其成为一种与传统门户网站类似的互联网入口应用。图1 2010.12-2011.6搜索引擎用户数及使用率2 搜索引擎概述2.1 搜索引擎的定义搜索引擎指自动从因特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。广义上是指一种基于 Internet 的信息查询工具, 包括信息的存储、整理和检索三个过程。2.2 搜索引擎的工作原理2.2.1搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛的自动搜索机器人程序来连上每一个网页上的超链接。2.2.2整理信息:搜索引擎整理信息的过程称为“创建索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。2.2.3接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。目前,搜索引擎返回主要是以网页链接的形式提供的,通常会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。2.3 搜索引擎的分类特点目前互联网上常用的搜索引擎分以下三类,其各自的性能特点如下:2.3.1 全文搜索引擎全文搜索引擎由一个计算机程序自动在互联网中搜集和发现信息,由索引器为搜集到的信息建立索引,由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。该类搜索引擎信息量大、更新及时、不需人工干预。2.3.2 目录索引类搜索引擎目录搜索引擎是以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。其特点是因为加入了人的智能,信息准确、导航质量高,用户可以不用进行关键词查询,仅依靠分类目录就可找到需要的信息。2.3.3 元搜索引擎元搜索引擎没有自己的数据库,它将用户的查询请求同时向多个搜索引擎递交,将返回的结果进行重复排列、去重等处理后,提供给用户。2.4 主要中文搜索引擎2.4.1 Google中文(.hk)Google由两位斯坦福大学的博士在1998年创立,是目前世界上最大的搜索引擎。数据库中收录约10亿多个中文网页,采用高级的网页级别技术, 用户界面出色, 有新闻组、图像、新闻等搜索, 以搜索相关性高闻名,检索方式为关键词检索。2.4.2 百度()百度由百度网络技术有限公司于1999年底在美国硅谷创建, 是目前全球最大的中文搜索引擎。数据库中收录约3亿个中文网页,平均2周更新一次,对部分网页每天更新。搜索方式以关键词检索为主,同时可结合分类目录限定检索范围。2.4.3 必应()微软公司2009年5月29日正式宣布推出全新中文搜索品牌“必应”,致力于打造全新的快乐搜索体验。检索方式为关键字检索,用户界面也别具特色,并且与微软的MSN、Hotmail相互关联。2.4.4 雅虎中文()雅虎是世界上最著名的目录搜索引擎,雅虎中国于1999年 9 月正式开通。雅虎目录分为 14 个大类,每个大类下又分成若干子类。提供目录浏览和关键词查询两种搜索方式。2.4.5 搜狗()搜狗是搜狐公司的旗下子公司,于2004年8月3日推出,2010年8月9日成立独立公司。提供关键词和分类检索相结合的搜索方式,并可在指定分类中进行搜索。搜狗的产品线包括了网页应用和桌面应用两大部分。2.4.6 有道()有道搜索是网易公司推出的搜索服务,2006年12月推出了网页搜索,图片搜索,有道博客搜索和海量词典四项产品,其中博客搜索和具有“网络释义”功能的海量词典是其两大特色。2.4.7 SOSO搜搜()搜搜是腾讯旗下的搜索网站,于2006年3月正式开始运营。搜搜基于庞大的腾讯用户群,主要提供实用便捷的搜索服务,致力打造一个精准化、个性化、社区化的创新搜索平台。图2 2008年全国范围内搜索用户的搜索引擎首选2008 年,全国搜索用户的首选搜索引擎集中度再度加大,百度遥遥领先于其他搜索,调查显示全国搜索用户中有 76.9%的用户首选使用百度;首选谷歌的用户达 16.6%,搜狗的首选率为 2.9%,雅虎首选率为 1.6%。3 中文搜索引擎比较我们通常使用的是全文搜索引擎,指的是搜集互联网上几千万到几十亿个网页, 并对网页中包含的每一个关键词进行索引, 建立索引数据库的交互式全文查询工具。常见的全文搜索引擎都具有信息容量大、检索界面简洁、检索功能齐全、检索速度快等特点。但是,不同的搜索引擎在信息的提供数量以及各类特色搜索功能和服务方面瓣在差异。本部分将对七大全文搜索引擎进行比较,以利大家在信息搜索中充分利用这些搜索引擎的特色功能与服务。 3.1 一般搜索需求随着互联网飞速发展,网络中的内容和资源日益丰富,而博客、微博、SNS等新型的自媒体网络应用更是让互联网内容呈几何式增长。面对这样的信息过载,网民只能通过搜索引擎这种过滤方式更高效地找到需要的内容和资源。其中网民对生活信息、休闲娱乐、专业工具等服务的需求基本上形成用户极大提升了网民搜索的一般需求。图3 2008年网民在网络上搜索内容在日常生活信息、休闲娱乐和专业工具的搜索中,各大搜索引擎各有千秋,由于缺乏专业研究数据的支持,以下就根据笔者的用户体验和经验对其进行粗略的比较分析。总的来说,百度提供了最为全面的功能与服务,而雅虎全能搜则提供的特色功能最少,其他处于一般水平,各有特色。百度的产品大全包括常规搜索服务、导航服务、社区服务、游戏娱乐、移动服务、站长服务、软件工具、其他服务、百度旗下等9大分类近70种服务,几乎涵盖了用户日常所有搜索需要。特别需要说明的是百度的社区服务产品版块(如图 )。通过百度知道、百度百科、百度文库、百度贴吧等C2C交流分享平台,使百度搜索更能贴近个体用户需求,并使此成为其一大竞争力。图4 百度产品大全的社区服务部分谷歌在文化水平较高、购买力较大的白领用户群和企业用户群占用绝对领先位置,体现了谷歌搜索专业性强、准确性高的特点。通过下面两图输入词下拉菜单提示内容的比较,百度和谷歌分别呈现出生活化的工作化的倾向,从侧面说明了谷歌搜索专业化的特点。通过下表 说明了谷歌搜索准确性的特点。谷歌的翻译和地图功能也处于领先地位,是很多网民的首先。图5 百度输入词下拉菜单提示 图6 谷歌输入词下拉菜单提示表1 用户搜索的体验指标和行为指标雅虎和搜狗都提供了全文和目录双重检索。相比之下,雅虎的界面分类导航能力较弱,但为各个分类提供了更多的详细信息;而搜狗导航就定位是网址大全,缺乏各分类的详细信息。同时,搜狗的全文搜索能力要强于雅虎,并拥有搜狗拼音输入法和搜狗高速浏览器的支持,用户体验更加良好。必应和搜搜都是基于庞大已有用户群上的搜索引擎。必应的界面清新简约,具有网页即时翻译功能,与MSN、Hotmail的微软产品关联性强;而搜搜更依赖和服务于腾讯用户群,尤其是其“搜搜问问”,是其用户之间的交流互助平台。有道的最大特点就是其“网络释义”的功能及其海量词典,将新词、术语一网打尽,更快直达结果。还有就是其博客搜索功能,是其另一大特色。3.2 特殊搜索需求3.2.1 文献搜索 一般文献表2 搜索引擎的特色功能比较从表 的比较可见,不同搜索引擎的可搜索的文献类型略有差异,其中谷歌可以支持对PDF、DOC、PPT、XLS、RTF、SWF、PS、DWF、KML、KMZ等10种二进制文档的内容进行限定搜索,而百度、搜狗、搜搜、有道等只可以对DOC、XIS、PPT、PDF、RTF 等5种文献类型进行限定搜索。 学术文献Google Scholar 是谷歌公司于2004年推出的免费学术搜索引擎工具,面向中文信息的学术搜索引擎涵盖了维普资讯和万方数据。Google Scholar 可以从一个位置搜索众多学科和资料来源:来自学术著作出版商、专业性社团、预印本、各大学及其他学术组织的经同行评论的文章、论文、图书、摘要和文章。同时Google Scholar 也提供了学术高级搜索功能,在高级搜索页面进行设置,能够更确切地了解某一学术领域的重要学术资源。国学百度频道2006年开始为用户提供免费的国学典籍在线阅读以及搜索服务。该频道目前有10多万网页,14亿字,收录上起先秦、下至清末两千多年间以汉字为载体的历代典籍。雅虎奇摩学术搜索是与台湾大学图书馆合作建立的学术搜索引擎,纳入了万方数据,并新增机器判读(Machine Learning)功能,能更快速地累积网络上具学术价值的一般资料进入学术搜索数据库中。再加上原有的4 大数据库,雅虎奇摩是目前支持繁体中文学术搜索的最大的搜索引擎。3.2.2 图书搜索表3 图书搜索结果显示信息比较表4 提供图书详细信息比较谷歌的检索功能丰富、灵活,搜索结果提供相关信息链接丰富,对于搜索书本类型的选择包括所有图-有限预览-全书浏览-国学图书,通过这个书籍类型的筛选, 很容易找到可免费阅读的整本图书,也可以选择中国特有书籍即国学图书,可查到本地销售所需图书书店的地图分布的详细位置及联系方式。百度收录的图书覆盖面广、数量大,更新快,拥有了全球最大的中文图书可检索数量。但是百度图书搜索不提供图书内容显示,因此读者无法直接获得图书的相关内容,只可查找相关书目的信息及书店、馆藏、试读、邮件借阅等链接。3.2.3 专利搜索百度专利搜索服务由百度与中国专利信息中心合作于2007年12月推出,首次整合270多万条专利信息。目前,百度专利搜索囊括了在中国专利信息中心登记备案的所有的专利信息,并与中国专利信息中心随时保持更新,极大地保证了数据的权威性和全面性,目前为广大用户免费使用。4 中文搜索引擎应用推荐4.1 基于不同引擎特色优势4.1.1 百度特色功能最多,几乎可满足一般搜索全部需求;强大的社区服务,解决用户个人化的搜索需求;提供专业的国学文献检索服务和最大的中文图书检索服务;提供中文专利免费搜索服务。4.1.2 谷歌专业性强,准确性高,适于高知识层次的白领和企业用户使用;具有领先的翻译和地图技术;提供最大而全面的中文文献检索服务;提供信息详尽的中文图书检索服务。4.1.3 雅虎最强大的网站目录检索服务,突出商业和生活搜索功能;提供最大的繁体中文搜索服务。4.1.4 搜狗支持关键词和分类检索相结合,网址导航上网站众多,并可在指定分类中搜索;提供搜狗拼音输入法和搜狗高速浏览器等相关产品和服务,提高用户整体体验。4.1.5 必应界面优美,提供网页及时翻译功能;提供与MSN、Hotmail等的关联使用,提高Windows Live产品整体的使用体验,适于微软MSN、Hotmail用户使用。4.1.6 搜搜属于腾讯系列产品之一,突出针对QQ用户的应用;提供“搜搜问问”用户互动平台服务,解决QQ用户的个性化搜索需求,适于QQ用户使用。4.1.7 有道突出“网络释义”功能,提供海量词典,解决新词、术语搜索问题;提供特色博客搜索功能。4.2 基于用户使用行为4.2.1 同时使用多种搜索引擎由于搜索引擎网页抓取程序覆盖范围和更新频率的不同以及搜索结果排序算法的不同,对于同一个查询提问,不同的搜索引擎会有不同的搜索结果。每个引擎按照自己的相关性排序规则将搜索结果呈现给用户,网络用户在使用不同的搜索引擎时将会得到不同的结果。中国科学院研究生院管理学院吕本富教授在2006年主持的一项关于搜索引擎相关性改进的研究中发现,三大中文搜索引擎(百度、谷歌、中国雅虎)的搜索结果重合率只有7左右,而第一页搜索结果重合率只有2.54%(如图)。图7 三大搜索引擎第一页搜索结果的重合率根据上述调查结果我们可以推断,不同中文搜索引擎之间存在很低的重合率;并且据调查,搜索引擎用户只浏览第一页搜索结果的比例高达62,而浏览3页以上搜索结果的用户仅有10。因此,用户在进行搜索,应该使用多种搜索引擎以提高覆盖范围。4.2.2 输入多个关键词图8 2008年搜索引擎用户输入关键词类型近40%的搜索引擎用户只输入一个关键词,这样会降低搜索效果的相关性和准确性;而且用户应该多输入几个相关关键词以增强搜索效果。5 结束语近几年,中文搜索引擎取得了巨大的进步,市场竞争也日

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论