土巴兔平台的内部搜索优化途径研究_第1页
土巴兔平台的内部搜索优化途径研究_第2页
土巴兔平台的内部搜索优化途径研究_第3页
土巴兔平台的内部搜索优化途径研究_第4页
土巴兔平台的内部搜索优化途径研究_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

PAGEPAGE13台的内部搜索优化途径研究要随着经济和科技的发展,计算机、互联网的应用日益普及,互联网成为规模巨大的信息库,成为信息传播、共,80%的用户把搜索引擎作为在互联网上获取信息的主要方式,但是要从浩如烟海的数据中,找到需要的信息,有时不是很容易。在电子商务高速发展的今天,互联网上海量的商品供求等信息对传统的搜索引擎提出了更高的要求。用户如何能够快速准确的找到自己所需的商品供求信息,并且能避免一般搜索引擎检索信息覆盖面过广、不能针对电子商务领域和用户等问题,获得更多的流量和用户访问量从而达到网站宣传和营销的目的。使得面向电子商务搜索引擎逐渐进入人们的视野。阐述当下研究背景和分析相关领域的国内外现状。第二部分会对搜索引擎进行理论上的概出该平台的内部搜索的不足。第五部分会对该平台分析出来的问题进行内部搜索关键技术的优化。关键词:电子商务;搜索引擎;搜索引擎优化一、引言随着经济和科技的发展,计算机、互联网的应用日益普及,互联网成为规模巨大的信息库,成为信息传播、共,80%的用户把搜索引擎作为在互联网上获取信息的主要方式,但是要从浩如烟海的数据中,找到需要的信息,有时不是很容易。在电子商务高速发展的今天,互联网上海量的商品供求等信息对传统的搜索引擎提出了更高的要求。用户如何能够快速准确的找到自己所需的商品供求信息,并且能避免一般搜索引擎检索信息覆盖面过广等问题,让企业获得更多的流量和用户访问量从而达到网站宣传和营销的目的呢?为此企业要不断的去进行搜索引擎的优化。1.2相关领域的国内外现状1.2.1电商平台网站发展现状创新的产品也层出不穷。互联网+时代,电。而借助于大数据的强大功能,电商平台是一个为企业或个人提供网上交易洽谈的平台。是建立在Internet网上进行商务活动的虚拟网络空间和保障商务顺利运营的管理环境;是协调、整合信息流、货物流、资金流有序、关联、高效流动的重要场所。企业、商家可充分利用电子商务平台提供的网络基础设。电子商务网站平台也可根1+1不再等于2,而是可以得到无限大人们不受时间的限制,不受空间的限制,不受传统购物的诸多限制,可以随费。电商平台在发展,其网站内部也要不断的进行优化才能更好的服务于用户。1.2.2搜索引擎发展现状说明:(1)社会化搜索值得信任的搜索结果。(2)实时搜索对搜索引擎的实时性要求日益增高,这也是搜索引擎未来的一个发展方向。实时搜索最突出的特点是时效性Google的实时搜索是被重置的,百度也没有明显的实时搜索入口。(3)个性化搜索E-mail信息、收藏夹信息、用户发布过的信息、息,可能无法反映用户的兴趣变化。(4)地理位置感知搜索GPS的应用了,这是基于地理位置感知的搜索,而且可以通过陀螺仪等设备感知用户的朝向,基于这种信息,可以为用户提供准确的地理位置服务以及相关搜索服务。目前,此类应用已经大行其道,比如手机地图APP。(5)多媒体搜索目前,搜索引擎的查询还是基于文字的,即使是图片和视频搜索也是基于文本方式。那么未来的多媒体搜索技术则会弥补查询这一缺失。多媒体形式除了文字,主要包括图片、音频、视频。多媒体搜索比纯文本搜索要复杂许4个主要步骤:多媒体特征提取、多媒体数据流分割、多媒体数据分类和多媒体数据搜索引擎。1.3选题的意义具有理论和实践的意义。二、搜索引擎概述键词的网页都将被作为搜索结果展现出来。2.2搜索引擎的发展史人们普遍使用FTP共享信息,大量的文件散布在FTP主机中,使用户查询非常麻烦,为了1990年,加拿大麦吉尔大学计算机学院的艾伦·埃塔奇研发了一种搜索服务工具Archie。Archie可以定期搜索并分析FTP服务器上的文件名信息,为用户提供查找分散保存在各个FTP主机中的文件的服务。虽然搜集的信息资源不是网页,但和搜索引擎的基本工作原理是一样的:自动搜集信息资源、建立索引、提供检,Archie被公认为搜索引擎的雏形。后来,随着互联网的出现,为了方便查询互联网中的网页信息,真正的搜索引擎也应运而生,并随着互联网的发展不断地发展和进步。总体来说,搜索引擎分为4代。(1)第一代搜索引擎1994年第一代真正基于互联网的搜索引擎Lycos诞生,它以人工分类目录为主,代表厂商是Yahoo,特点是人工分类存放网站的各种目录,用户通过多种方式寻找网站,现在也还有这种方式存在。(2)第二代搜索引擎文本检索时代。随着网络应用技术的发展,用户开始希望对内容进行查找,出现了第二代搜索引擎,也就是利Google,它建立在网页链接分析技术的基础上,使用关键字对网页搜索,能够覆盖互联网的大量网页内容,该技术可以分析网页的重要性后.将重要的结果呈现给用户。(3)第三代搜索引擎三代搜索引擎的代表是Google,它以宽广的信息覆盖率和优秀的搜索性能为发展搜索引擎的技术开创了崭新的局面。(4)第四代搜索引擎提取和文本智能化等策略,相比前三代搜索引擎更准确有效,被称为第四代搜索引擎。2.3搜索引擎的分类目前搜索引擎主要分为全文搜索引擎、目录搜索引擎、元搜索引擎和垂直搜索引擎。起网页数据库,并检索与用户搜索条件相匹配的记录,按一定的排列顺序返回结果。人性质将其归纳到不同层次的类目之下,形成一定的人工信息摘要,最终形成像图书馆目录一样的树状分类结构索引。多个搜索引擎搜索的结果。元搜索引擎在接受用户的搜索请求后,会同时在多个搜索引擎中选择和利用相对合适的搜索引擎来实现搜索操作,并且将搜索结果返回给用户。搜索等,它是对通用搜索内容的细分。2.4搜索引擎的工作原理就必须了解搜索引擎的工作原理,知道它使如何工作的,这样才能更好的完成网用户输入的关键词,快速找到相关文档,并对找到的结果进行排序,并将查询结果返回给用户。以下对其工作原理做进一步分析:(1)网页抓取每遇到一个新文档,都要搜索其页面的链接网页。搜索引擎蜘蛛访问web页面的过程类似普通用户使用浏B/S模式。引擎蜘蛛先向页面提出访问请求,服务器接受其访问请求并返回HTML代码后,把获取的HTML代码存入原始页面数据库。搜索引擎使用多个蜘蛛分布爬行以提高爬行速度。搜索引擎的服务器遍布世界各地,每一台服务器都会派出多只蜘蛛同时去抓取网页。如何做到一个页面只访问一次,从而提高搜索引擎的工作效率。在抓取网页时,搜索引擎会建立两张不同的表,一张表记录已经访问过的网站,一张表记录没有访问过的网URL的时候,需把该网站的URL下载回来分析,当蜘蛛全部分析完这个URL后,将这个URL存入相应的表中,这时当另外的蜘蛛从其他的网站或页面又发现了这个URL时,它会对比看看已访问列表有没有,如果有,蜘蛛会自动丢弃该URL,不再访问。(2)预处理,建立索引为了便于用户在数万亿级别以上的原始网页数据库中快速便捷地找到搜索结果,搜索引擎必须将spider抓取的(也。Web页面分析有以下步骤:判断网页类型,衡量其重要程度,丰富程度,对超链接进行分析,分词,,web网页已经不再是原始的网页页面,而是浓缩成能反映页面主题内容的、以词为单位的文档。数据索引中结构最复杂的是建立索引库,索引又分为文档索引和关键词索引。每个网页唯一的docID号是有文档索引分配的,每个wordID出现的次数、位置、大小格式都可以根据docID号在网页中检索出来。最终形成wordID的数据列表。倒排索引形成过程是这样的:搜索引擎用分词系统将文档自动切分成单词序列-对息。在单词对应的倒排列表除了记录文档编号之外,单词频率信息也被记录进去,便于以后计算查询和文档的相似度。(3)查询服务查询服务最核心的部分是搜索结果排序,其决定了搜索引擎的量好坏及用户满意度。2.5搜索引擎的关键技术爬虫、中文分词、大数据处理、数据挖掘等技术。(1)网络爬虫技术网络爬虫也被称为蜘蛛或者网络机器人,它是搜索引擎抓取系统的重要组成部分。网络爬虫根据相应的规则,URL引用根据广度优先遍历策略从一个html文档爬行到另一个html文档来抓取信息。(2)中文分词技术是文本挖掘的基础,对于输入的一段中文,成功的进行中文分词,可以达到电脑自动识别语句含义的效果。(3)大数据处理技术等数据计算。(4)数据挖掘技术未知的、可能有用的信息。三、搜索引擎优化的相关技术键词优化、网页技术优化、外部链接优化、网站内容优化、提高用户体验度几个方面。3.1关键词优化相关性比较高的网页内容展示给用户,这时便需要提高页面与某些关键词的相关性。(1)关键词的选取了解用户的搜索习惯以及在搜索中常用的关键词,搜集大量与服务或产品相关的关键字。形成初期的关键词列表。百度上搜索结果页面中的相关搜索关键词,进一步丰富关键词列表。出搜索量大,相关性大,竞争力低的词。标签优化1)<title>标签标签是一个网站非常重要的部分,网站标题中的内容会作为搜索结果摘要信息的标题进行展示。通过阅<title>标签优化是网站优化中的重点内容。关键字在标题中的分布,即关键字出现的位置,为了更好地优化标题,在标题内容的一开始就字,产生更多的长尾关键字组合。2)<description>标签网站描述标签中的内容会作为搜索结果摘要信息的描述部分进行展示,用户通过阅读描述部分内技巧等。3)<keywords>标签关键字标签定义页面要优化的核心关键字内容,整个页面关键字优化要围绕<keywords>标签展开进行,优化核2—3个比较合适。(3)关键词与网站页面相关性影响相关性的主要因素包括如下五个方面:关键词密度用于衡量某个关键词在网页上出现的频繁程度,其值为某个关键词的总字符数与网。关键词密度并不是越大越好,对于大部分的搜索引擎来说,关键词密度在2%~8%是一个比较合适的范围,这样既有利于关键词的优化,也不会被搜索引擎判定为关键词堆砌。的意义贡献越小,越不常用的词对搜索词的意义贡献越大。常用词发展到一定极限就是停止词,对页面不产生任何影响。所以搜索引擎用的词加权系数高,常用词加权系数低,排名算法更多关注的是不常用的词。H1等,说明页面与关键词越相关。在索引库的建立中提到的,页面关键词出现的格式和位置都被记录在索引库中。上连续完整的出现或者“搜索”和“引擎”出现的时候距离比较近,都被认为其与搜索词相关.越多以搜索词为锚文字的导入链接,说明页面的相关性越强。链接分析还包括了链接源页面本身的主题、锚文字周围的文字等。3.2页面技术优化1)网站导航优化不到,用户也找不到。好的网站导航,便于搜索引擎的抓取,网站导航还有权重传递的功能,首页权重传递给内。这里可以提到面包屑导航优化,一些大型CMS系统生成的网站,基本上都采用的是面包屑导航方式,通过这种导航结构形式,能够将最清晰的网站内部结构呈现在用户面前,时刻提醒用户目前所处的位置。而用户也可以随时根据导航返回上一层或顶层页面,所以优化人员在超过两层结构的网站中都可以使用面包屑导航方式。2)网站地图链接站地图搭建,并提交至搜索引擎,只有这样才能确保网站中的每一个页面都能被搜索引擎收录。1)相关页面的链接优化的产品或服务,从而提升网站的转化率。(2)优化URL结构让用户从URL判断网页内容,这样既方便蜘蛛解析,也方便用户传播。URL不应该太长,蜘蛛会喜欢较短的URL。不要添加蜘蛛难以解析的字符。此外,动态参数的设置不应过于复杂。(3)优化网站代码,CSS文件、js文件与网页文件分开存放,在网页代码中调用。代码优化有几个好处:一是能减小文件的体积,加快访问速度;二是对搜索引擎更加友好,避免让它爬行无用的代码;三是可以让代码的维护更加方便。3.3页面内容优化注重网站的内容质量就一定要更新高质量的内容,当然,高质量的容。4.1网站优化目标土巴兔装修网是深圳市彬讯科技有限公司于2008年7月上线的一个装修网站,是一家互联网装修行业知名平台,装潢平台。该网站聚焦用户,向用户提供一站式家装解决方案,为有装修需求的用户,提供尽可能多样化的连接和服务。进行内部搜索优化的目标是为了能提高网站点击率和转化率,给网站带来经济效益,提高网站的知名度和品牌效益,得到更多用户的认可。图4-1为土巴兔首页。4.2网站问题分析4.2.1网站整体状况首先对网站进行一个整体状况的了解,下面通过站长工具(/)对土巴兔网站进行查询。查询网站基本信息如图4-2所示。图4-2土巴兔网站基本信息(1)网站基本信息域名年龄为14年4月28天,注册机构是AlibabaCloudComputing,所属公司为深圳市彬讯科技有限公司,网站服务器主机位于福建省三明市,百度权重为6,在移动权重、360权重、搜狗权重中均为4,在神马和头条中权重为273,在家居建材类中排名第五。竞争网站为1054个,行业网站竞争激烈。(2)网站关键词排名4-3所示,看到“装修公司”在关键词中排名第28名,这种结果并不理想。4.2.2内容优化存在的问题(1)搜索出来的内容少用户想要进行装修的话往往可能会想在土巴兔找家靠谱的装修公司来寻求更专业的装修指导,除了很少部分用户是带着明确的目的就想要搜索某家公司去进行信息查找,绝大部分的用户一开始搜索的时候基本都是模糊搜索,比如在哪个地区,就搜索哪个地区的装修公司,下面我搜索“广州装修公司”来进行测试,输入“广州装修公司”之后,出现了171个搜索结果,如图4-4所示,每家公司名字下面都会带有一些标签和简单图片广告信息。比如排名是多少,近期签约了多少公司,装修的均价位是多少都有些简单的介绍。便于用户去进行选择浏览。但是相对于广171条,十页的浏览页面。这对于广州的庞大用户群体来说这搜索结果相对少了。而且耗费装修的金额多,用户会比较慎重的选择装修公司,自然要浏览更多的装修公司内容。网站搜索出来的装修公司结果少,网页和关键词相关性还有待提高,而是合作的供应商少导致网站内容少,网站的内容还要继续优化。4.2.3关键词优化存在的问题“keyword”,关键词是方便用户通过搜索引擎搜索到本网站内相关内容的词汇。关键词可以是一个词语、一个短语或者是一句话。在内部搜索优化中,关键词的选取是至关重要的,这决定着用户是否能通过这些词语来找到自己想要浏览的内容。关键词的优化涉及到关键词的选取与关键词的密度以及关键词的分布。每个网页的关键词不要选取太多,两三个就合适了;确定的关键词应当契合你页面主题,否则读者点进去发现的密度不能太大,通常认为6%左右较为适宜,切忌关键词堆砌;关键词要合理分布在网页标题、meta标签、以及页面内容中。(1)关键词密度4-5所示,“装修”这个关键词密度结果为17%,关键词密度偏高,关键词密度不是越大越好,密度分布高的话会被搜索引擎判定为关键词堆砌。图4-5查询关键词的分布密度(1)代码优化存在问题1)垃圾代码:页面存在垃圾代码,多余的默认属性、空语句等,大大增加了页面体积,延长了页面访问速度。Alt属性,没有进行关键词布局,不利于蜘蛛抓取。4.2.5用户体验存在的问题(1)搜索专题需用户自行选择我用“客厅”这个关键词进行了两次搜索。4-6所示。这对用户的体验是不好的,搜索“客厅”这个关键词才抓取到一个网页内容,这是不能满足用户的需求的,而且这个内容丰富度少,内容价值偏低,用户难以搜索到自己想要的推荐内容界面,体验不佳。第二次的搜索情况:一个装修平台居然搜索客厅出现那么少内容,我对此感到不可思议于是又重新回到搜索框4-7所示,你要先选择自己想要搜索的对应专题,才能搜索到自己想要的内容展示。我第一次搜索时搜索默认我选的第一个专题是“装修公司”,在“装修公司”的专题里搜索“客厅”这个关键词,内容自然就少甚至会没有对应内容。我在第二次搜索时选择了“效果图”这个专题搜索“客4-8所示,对于这点我觉得是需要改进的,有些用户他可能一开始就出现我第一次搜索的情况,那用户会以为是不是该网站就没有他想要的内容呢?当他如果没有进行再次搜索就有可能停止浏览,直接关闭网站。又或者是他在进行第二次搜索时还是没有留意到需要选择对应专题才能出现对应的搜索内容,也还没有选择专题后搜索,那么也是会出现第一次的搜索结果,那他也是会判定该网站没有他想要的内容。最后也是会直接关闭网站。而且要先选择专题的提示不明显,在搜索时没有自动弹出下拉专题进行选择,而是自动默认专题,需要用户自行点击下拉选择后选择对应专题后才能搜索到对应内容。图4-6为第一次搜索“客厅”的页面展示图4-7搜索左侧下拉时发现的专题选择图4-8为第二次的搜索情况(2)广告窗口弹出多,阻碍浏览界面。在进行搜索后浏览网页结果时,在底部会有广告弹出或者固定在同个位置阻挡了浏览界面,广告是下载土巴兔底部和右侧的位置,对于用户要进行往下浏览和往右拖动看效果图可能会带来不舒适感。如图4-9所示图4-9广告占浏览页面占比5.1网站定位及内容优化(1)网站定位和用户分析设计更好的搜索引擎来满足用户的需求。我们可以先进行用户需求分析。1)漫无目的型此类访问者可能通过推荐或者搜索引擎等途径来到网站,没有目的性,意在随便看看,自己都不知道需要什,我们可以在页面的显著位置增加一些推荐产品、信息内容、热门搜索或者快速导航等链接,吸引访问者点击。2)有某种倾向型没有“瓷砖”的具体需求,比如他知道买什么品牌、图案的等。类似这种情况,我们可以在页面中设置“模糊搜索”功能,当搜索“瓷砖”的时候,可以展示出不同“瓷砖”的产品信息,有推荐、热门、瓷砖的不同装修风格等,还可以增加一些产品的对比功能。浏览“好看的装修图”,那么我们可以做一些有关装修不同风格的分类来吸引访问者去点击。3)信息明确型类似这种情况,我们可以做明确搜索功能,此时信息或者产品等内容页也要有相应的名称,例如访问者搜索“某某装修公司”,“某某牌餐桌”,那么我们在做内容页的时候,题目可以为“某某公司最新装修风格展示”这样不仅利于站SEO,当然最好也做好“各公司装修风格”的专题栏目。(2)内容优化在对网站定位和用户分析之后,我们就可以开始优化网站内容,我们写什么样的内容用户是比较感兴趣的呢,5-1和5-100条”,我格的装修效果图专题来吸引用户等等。图5-1站长工具中的“相关词挖掘”搜索结果图5-2站长工具中的“相关词挖掘”搜索结果并做好有利于不同访问者的引导,可以很大程度,站内搜索将不仅仅是网站访问者的一个有用工具,它还将成为你的一种营销利器。既然注重网站的内容质量就一定要更新高质量的内容,当的内容是否能满足用户的需求,对用户来说是否是高质量的内容。5.2关键词优化有关这个词语的全部结果,网站是否进行了关键词的一个优化手段。5.2.1选取网站关键词关键词,最后得出核心关键词及长尾关键词作为土巴兔网站关键词。选取关键词的流程如图5-3所示。5-3选取网站关键词流程1)用户搜索习惯通过与SEO人员的沟通,了解到装修网站的核心关键词是:““设计师装修”、“室内装修”、“欧式家装”、“装修报价”。2)分析竞争对手(title)、关键词(keyword)、描述(description)的内容来了解这个网站的关键词。可以看到网站的标题是“上海装修公司、上海装修设计师、上海装修案例、齐家装修PK,避免装修陷阱,提供免费量房、免费设计、免费报价预算等15项特权服务,同时有适合各种群,是上海地区专业的装修咨询信息服务平台”。通过分析竞争对手我们可以收集到的关键词分别是“装修公司”、“装修设计师”、“装修案例”。搜索引擎工具5-5为站长工具搜索结果,图5-6为爱站网搜索结果,设计”,这几个词是排名两个搜索结果中相同率高和排名较高的几个关键词。5.2.2优化关键词(1)筛选、评估网站关键词综合以上3个方面搜集来的关键词,筛选出“装修预算”、“装修公司”、“装修效果图”、“装修设计”、5-7所示。这8个关键词指数都较高且收录量很高。(2)确定网站关键词进行布局、组合从而达到一个合理的关键词密度值。5.3页面技术优化5.3.1网站代码优化(1)代码精简所以需要精简命令清楚代码中的空格,并手动删除代码中出现的空行,利用Dreaweaver的“清理HTML/XHTML”Ctrl+F命令将代码中出现的默认属性代码如align=“left”替换成空白,进行默认属性的清理,减小页面体积,整理代码格式和条理性,方便蜘蛛程序爬行。(2)图片优化Alt属性,没有进行关键词布局,不利于蜘蛛抓取。图片的命名要包含关键词,同时要给图片添加alt属性,通过修改图片名称和alt属性,将关键词加进去,同时围绕图片周边对产品图片进行文字性的介绍,增加图片周围关键词weldedwiremeshchuxian出现的频率,提高蜘蛛识别图片的能力。5.4用户体验优化高用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论