




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、超音速搜索索引擎产品手册2009/08/30站内检索的的重要性性站内搜索是是提供网网站内部部内容的的检索和和搜索功功能。随随着网站站内容的的增长,站站内结构构也越来来越复杂杂,用户户很难准准确浏览览全部内内容,查查找所需需信息也也越来越越难。站站内检索索的需求求也逐渐渐显露出出来。站内搜索的的特点站内搜索有有几方面面的特点点:增强用户体体验信息量总在在不断增增长,而而访问者者的耐心心却逐渐渐下降。据据统计,每每需要多多点击一一次鼠标标,就有有三分之之一的用用户选择择放弃。 如果提供站站内搜索索,用户户仅仅根根据查询询词就可可以尽快快找到所所需内容容。 通过站内搜搜索提供供用户最最想要的的结果,
2、成成为提升升用户体体验的重重要工具具之一。了解访问者者的意图图通过站内搜搜索技术术,除了了能够满满足尽快快提供用用户所需需内容,还还能通过过查询日日志分析析出用户户的意图图和需求求。 客户的需求求永远都都是最重重要的,分分析用户户的需求求对于每每个网站站改善自自身都是是非常重重要的。 通过分析用用户需求求,改善善网站结结构,能能够有效效的提升升网站价价值。适应网民习习惯根据调查表表明,668.33的上上网者经经常使用用搜索引引擎。大大部分人人已经习习惯通过过检索来来找到他他们想要要的东西西,而不不是按照照某个栏栏目一级级一级往往下找。 在网站内访访问者要要是没看看见那熟熟悉的按按钮会多多少有些
3、些不习惯惯。在心心理学角角度讲,人人们如果果对某个个事物不不习惯很很容易产产生厌烦烦情绪。方便用户查查找网站站信息我们经常会会发生这这样的事事情:只只记得某某个网站站上说了了关于某某一事件件的新闻闻,但不不知道具具体的链链接在哪哪里。 另外,要是是隐藏在在目录很很深的hhtmll文档可可能自从从网站建建立到整整个网站站关闭也也没有一一个人看看过。 同时,按照照一个主主题把所所有相关关文档提提供给访访问者,可可以让访访问者更更全面的的了解他他所想要要的东西西,这增增加了网网站信息息间的组组织性和和逻辑性性,方便便了访问问者的使使用,提提升用户户体验度度。提升网站身身份有没有站内内检索其其实已经经
4、不只是是用户体体验度的的问题了了,还是是一个网网站专业业身份的的象征。 浏览国内外外知名公公司的网网站,会会发现几几乎所有有网站都都在首页页最明显显的区域域放置了了一个搜搜索框,这这传达的的信息是是:专业业的网站站都有站站内检索索。 网民的心态态是:我我用不用用,你管管不着,你你要是没没有就说说明你不不够专业业。为了了树立专专业的形形象,也也需要使使用站内内检索。提供编辑使使用网站上一定定规模后后,内部部编辑管管理庞杂杂的数据据,迫切切需要站站内搜索索来帮出出他们从从容应对对,更好好的编辑辑网站信信息内容容,避免免重复等等。一组数据当用户访问问一个新新的网站站时,如如果在一一开始不不能很快快地
5、寻找找到他所所想要的的信息,那那么500%的用用户将会会很快离离开网站站。 其中60%将不再再光顾这这个网站站。 这意味着网网站将因因为站内内检索的的缺陷而而彻底流流失300%的潜潜在客户户。新闻搜索引引擎与主主流搜索索引擎的的区别以关键字“上上海世博博会”为为例GOOGLLE提供供的是世世博会官官方网站站等最相相关的资资料信息息,而不不是最新新的新闻闻内容。新闻搜索引引擎,提提供给用用户的是是最新与与“上海海世博会会”有关关的新闻闻,并且且按照出出处和时时间排序序,让用用户最直直观最快快速的了了解事件件情况。搜索结果,精精确与精精准以关键字“上上海世博博会”为为例Googlle精准出现“上海
6、海世博会会官方网网站”,但但随着时时间推移移并不会会改变,需需要体现现的是最最精准的的结果内内容。新闻搜索精确确以最新为原原则,始始终出现现最新的的新闻内内容,每每次搜索索都找到到更新的的新闻内内容。结果数量,巨巨大与无无穷大以关键字“上上”为例例Googlle海量获得大约11,2990,0000,0000条查询询结果,但但实际上上能查阅阅的只有有不到110000条(Goooglle为所所有查询询的结果果数都不不会超过过10000个),因因为GOOOGLLE不区区分内容容的时间间,所以以一般用用户看不不完(也也不需要要)10000条条以上的的内容。新闻搜索无穷穷可以获得全全部结果果,能查查阅的
7、可可以达到到无穷多多,因为为新闻内内容可以以有时间间标签,可可能需要要查阅不不同年份份的新闻闻,比如如30年前前的新闻闻内容。预搜索库,漫漫长与实实时Googlle漫长由于包含海海量互联联网数据据,所以以需要大大约1个月才才能整体体更新一一次数据据,每次更更新需要要大量服服务器同同时处理理6到8天。新闻搜索实时时在没有预处处理的情情况下,第第一次查查询大约约需要花花费1秒左右右时间,此后查查询相同同关键字字,只需需要0.01秒秒,在服务务器空闲闲时候进进行对高高频关键键字的预预处理。报业内容资资源搜索索面临的的问题由于报业数数据量庞庞大,同同时多业业务部门门使用各各不相同同的业务务系统,形形成
8、了多多数据库库,多种种业务数数据系统统,多种种格式内内容的格格局,由由此产生生了种种种问题,例例如: 多个各类数数据库并并存,无无法实现现资源内内部共享享 按照目前报报业集团团的情况况,一般般报社集集团均存存在多个个数据库库。报社社编辑如如果查阅阅资料,则则需在多多个数据据库中多多次搜索索,直接接导致时时间和人人力的浪浪费。 检索系统无无法整合合,重复复投资 一般报社集集团都拥拥有多套套系统,且且系统的的资源分分布于不不同的数数据库中中,对每每种数据据库,如如SQLLserrverr、Oraaclee、TRSS等均有有检索要要求,造造成检索索系统无无法整合合,重复复投资。报社网站资资源优质质,
9、网上上用户无无法获取取 报社网站上上沉淀了了大量极极其丰富富的优质质信息资资源,包包括了用用户论坛坛,博客客,数字字报纸,网网站新闻闻等等,用用户无法法统一搜搜出需要要了解的的信息。 新增系统,检检索无法法整合,扩扩张性差差 报业集团与与时俱进进,不断断新增系系统。新新增系统统势必导导致新数数据库的的增加,于于是又为为报业集集团内部部的数据据整合增增加了难难度。 新一代搜索索需要解解决的问问题整合多个数数据库搜搜索一般报社都都拥有多多个系统统,例如如采编、新新媒体、网网站等,每每个系统统都拥有有其独立立数据库库。如何何一次性性将这些些数据搜搜索出来来,减少少人员的的重复操操作? 新一代搜索索引
10、擎支支持跨数数据库搜搜索,可可一次性性将所需需的各库库的内容容均搜索索齐全。充充分有效效的利用用报社资资源。搜索引擎对对互联网网的帮助助报社网站拥拥有海量量新闻内内容,却却没有优优秀的搜搜索引擎擎,用户户无法获获取需要要信息。 通过新一代代搜索引引擎,可可以挖掘掘报社网网站深层层的信息息,随时时向用户户提供GGOOGGLE和和百度也也搜索不不到的内内容。内容搜索精精确报社拥有极极其丰富富的优质质信息资资源,如如何准确确的找到到需要的的内容? 通过新一代代搜索引引擎的多多种检索索技术,能能够快速速准确的的找到需需要的内内容。呈现方式符符合需求求搜索到的内内容,如如何将其其以最符符合报社社人员的的
11、需求呈呈现出来来,满足足报社人人员的需需要? 新一代搜索索引擎的的界面设设计完全全按照报报社的需需求。搜索引擎简简介超音速搜素素是专为为报业新新媒体定定制的整整合搜索索引擎: 可以做到整整合报业业所有数数据库供供报社编编辑记者者使用; 同时整合网网站的各各种应用用数据,包包括论坛坛,博客客等等提提供服务务给互联联网用户户; 并且提供联联想功能能、智能能纠错、搜搜索结果果分类呈呈现、时时光隧道道、联合合搜索、相相关搜索索等各种种搜索功功能。 超音速搜索索引擎的的特色海量数据支支持支持数据量量达到11亿条,相当于于十份报报纸五十十年的数数据量(按照每版版10篇新新闻,每天300版来计算算,每份报报
12、纸每年年大约 10303655 = 10995000)强劲处理性性能一台专有检检索设备备可满足足大部分分需求,支持100万在线线用户,10000个并并发搜索索请求,服务器器可简单单叠加,扩扩展更多多用户和和并发数数。个性化功能能拼音搜索:输入“shanghai”,可以搜索“上海”。联想功能:输入“上上海”,可可以联想想“上海海世博会会”、“上上海国际际电影节节”等等等智能纠错:输入“姚姚敏”或或者“yyaommingg”,会会提示你你是否想想要搜索索“姚明明”? 分词功能:若搜索索一句较较长的话话分,无无搜索结结果,系系统将自自动成若若干个词词组来搜搜索。 相关搜索:将关键键字内容容有关联联的
13、一些些搜索关关键字罗罗列出来来,给予予用户搜搜索参考考。例如如,搜索索关键字字“上海海”,获获得如下下相关搜搜索。 无缝式嵌入入 简便,与原原数据库库无关不管你原来来数据使使用的是是什么类类型的数数据库,都都可以方方便的安安装超音音速搜索索引擎,并并且不需需要改变变原来的的数据库库和程序序。只需需要把原原内容导导出为普普通的文文本文件件,超音音速搜索索会自动动接入。 安全,与原原服务器器无关不管你原来来网站服服务器使使用什么么操作系系统,超超音速搜搜索引擎擎只需要要1台我们们专有的的独立检检索设备备,完全全不影响响原来的的网站架架构系统统。通过过标准的的XMLL规范,可可以兼容容任何系系统。搜
14、索结果分分类呈现现不同结果根根据其归归属分别别呈现。 新闻:方便便用户阅阅读 数字报报:提供供版面供供选 博客:提供供用户评评论 论坛:促进用用户讨论论时光隧道可以快速了了解并检检索不同同年代的的新闻内内容。整合多个数数据库搜搜索报社的资源源分部在在不同的的数据库库中,超超音速搜搜索能够够一次性性在各数数据库中中将需要要的资料料准确快快速的搜搜索到,并并且根据据资料出出处归类类显示,更更利于报报社内部部资料查查阅。 公司主要成成就2008年年,烟台台日报报报业全媒媒体数字字复合出出版系统统工程2008年年,上海海阿耳法法信息技技术有限限公司开开发的“烟烟台日报报报业全全媒体数数字复合合出版系系统工程程”, 顺利通通过新闻闻出版总总署和数数字出版版司的验验收。 做到了了新闻素素材的整整合(待待编稿库库) 获奖情况此系统已经经获得220099年“中中国新闻闻技术工工作者联联合会【第
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年PM10自动采样器及测定仪项目合作计划书
- 中国溴化铯项目投资计划书
- 2025年中国石英项目投资计划书
- 2025年低压电工操作证理论全国考试题库(含答案)
- 朔州市中医院泌尿系统超声诊断考核
- 重庆市人民医院科室医疗质量分管考核
- 交叠影响域理论视角下家校社协同应对青少年非自杀性自伤的策略建议
- 2025年医院卫生院医疗纠纷处理管理制度
- 2025年江西省公务员录用考试《行政职业能力测验》试题及答案
- 2025第三人民医院心脏B超医师资格认证
- 结核筛查委托协议书
- 《细胞培养技术》课件
- 广西《甘薯小象甲性信息素诱集测报技术规程》编制说明
- 老年人中医保健知识健康讲座
- 行政事业单位内部控制范本-行政事业单位内控手册
- 六上快乐读书吧《爱的教育》阅读题!考试必考(附答案)
- 医疗器械临床试验管理制度
- 超星尔雅学习通《舌尖上的植物学(北京大学)》2025章节测试附答案
- 强直性脊柱炎的护理要点
- TCATIS 029-2024 数据中心与算力中心信息技术基础设施关键备件分类分级规范
- 治安保卫管理计划
评论
0/150
提交评论