SEO实践.doc_第1页
SEO实践.doc_第2页
SEO实践.doc_第3页
SEO实践.doc_第4页
SEO实践.doc_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SEO实践(1):开展SEO前的数据准备2012-02-28 14:49 小 大 来源: Semwatch 评论: 1 分享至: 百度权重查询 站长交易 友情链接交换 网站建设,网站设计,企业建站就找313当我们开始开展一项SEO工作时,第一件要做的事情是要保证我们做的任何事情都可以有数据的支撑而不是自己的直觉。SEO的主要数据来源来自两块:网站的服务器日志、第三方流量分析工具。网站服务器日志Apache,Nginx等常用服务器的内置日志配置格式Combine已经可以满足大多数SEO分析需求。它看上去类似是这样的:11 - 20/Feb/2012:18:09:25 +0800GET / HTTP/1.1 200 3121http:/*.org/Mozilla/5.0 (compatible; Googlebot/2.1; +/bot.html)必须记录的信息诸如:访问来源IP、访问时间、访问页面、HTTP响应状态码、访问来源及客户端标识等,这些在Combine日志格式里面都有。在确保服务器日志可以满足其他部门的分析需求下,至少要确保上面提到的几项被记录在服务器日志里面。但也不要将任何可以记录的数据都记录下来,只选择实际需要的部分,不然会使得网站日志体积非常大,不利于分析起来的效率。这些内容可能需要和运维进行沟通解决。然后关于日志的分析,我认为没太多固定的准备工作可做,因为它的数据来源是原始的(raw似乎听上去会更有感觉?),所以可选择的数据维度几乎是无限的。因此尤其要按实际需求进行相应的处理与分析。对于一些要求并不是特别高的日志分析需求,可以尝试使用光年日志分析系统。虽然我个人对所有图形界面的实用类程序都不带好感,但它提供了一些很不错的数据维度的思路。听说有一家大型的旅游网站是采用MongoDB结合Map/Reduce进行日志分析的,我个人也用过MongoDB实现过前面提到的光年日志分析的一部分重要功能。所以感觉MongoDB是个可以考虑的选择。第三方流量分析工具Google Analytics的安装对于免费流量分析工具,Google Analytics绝对是其中的佼佼者(以下简称GA)。不过如果网站的月浏览量大于500W的话,只有Google Adwords的用户,才能继续免费使用GA进行流量的记录与分析。下面都以它为例。在GA添加需要追踪流量的网站以后,它会提示你添加一段JavaScript代码,到每一个你需要追踪页面的标记之前。代码的添加可能是一件很轻松的工作,但也可能非常麻烦,主要取决于网站的模板层。先提下常见开源博客程序WordPress的方法,它采用了包含的模板处理方式,比如网站首页、列表页、文章页等自身的模板,都是只有当中一部分的。而包含网页LOGO等的网页头部,都使用WordPress的get_header方法来加载另一个独立的模板文件(get_header方法本质上是PHP里面的include函数)。简言之,只要在header.php那个文件上面添加代码,包含它的所有网页都会跟着改,很快就可以把GA代码添加好。但情况并不总是理想的,尤其对于使用网站框架自己进行开发的网站,有时并没有将包含这样的方式很好的运用。这可能是网站的建设规范不完善的关系,也可能是网站需求导致了确实无法使用和WordPress类似的包含方式。那么,至少要在每个网页的头部,额外包含一小段加载全局JavaScript的区块,以方便的添加全局性的JavaScript代码。虽然未必在添加GA代码时,对可能糟糕的网站模板结构去进行更改,最多到几十个不同的模板文件里面去分别加下代码就是了(当然也要花些时间去保证没有漏过哪些页面)。但一次性搞定一些本质性的问题会带来很多日后的便利性比如又要换一套统计代码。相对最麻烦的事情或许是如何说服程序员为了一些看似小的需求而修改模板结构,这边就略过了。一些基础的Google Analytics设置对于SEO而言,一项最基础的设置,就是要把网站上对SEO有价值的页面进行归类。对页面进行区分,并以此掌握了它们的流量现状及趋势以后,才能把握SEO的侧重点,及更好的分析网站上每次SEO修改的成效等等。如最简单的例子,对于一个网站,如果手头有1000条外链,应该给网站的栏目页还是产品页?这主要取决于哪类页面有更高的转化率与更大的SEO流量提升空间。对于每个网站而言,都存在不同的情况。比如一个书籍类的电商网站,它列表页不会有太多流量,没多少人搜索什么“计算机书籍”,但会更多人搜索乔布什自传之类,因为用户有很明确的需求。而对于一个服饰电商,相应更多人会搜索“衬衫”之类,而非“2012年春季新款白色衬衫”等,因为用户只是想到网站上挑衣服,他们只有需求的意向,但具体需求是模糊的。以上两个是比较典型的例子,但有更多情况我们无法用自己的直觉做出准确的判断,那就需要用流量数据来收集事实。尽管博客的流量数据分析起来没太大价值,出色的文章是博客的一切,但这里还是以SEMWATCH为例来简单介绍下方法。假设我们需要把网站的栏目页和文章页流量进行区分,它们的URL分别是类似这样的:/category/seo/,/2012/02/post/首先要到GA的数据页面内,找到高级细分一项,点击右侧新自定义细分。然后进行类似下图的设置:通常情况下,将页面的URL匹配相应的正则以后,就可以把它们区分开来。注意,如果网站的初期URL规划不完善,可能会导致无法用URL来区分页面类型的非常非常糟糕的情况,务必保证每一类页面拥有其独立的URL标识。在该例中,SEMWATCH的栏目页匹配正则表达式是:/category/.*?/$,文章页是:/20-93/0-92/.*?/$尽量用最严格的正则表达式写法,这样可能可以在无形中规避很多不必要的错乱。还需要注意的是,老版本的GA默认情况下筛选器的“包含”即使用正则表达式,新版GA一定要选择“匹配正则表达式”这项。关于正则表达式,篇幅所限不可能进行解释,如果你不懂的话,可以考虑去寻找程序员求助。但我的个人建议是尽可能的要自己掌握它,这是一个比较基础的技术要求,SEO不应该被它所难倒。正则表达式虽然看上去很恶心至少我从来看不懂自己写出来的正则,但其实挺容易学的。总之通过上面的步骤,我们就简单的把页面类型区分开来了。回到最初的例子,如果有1000外链给SEMWATCH随便分配,现在应该把外链给予哪些页面呢?可以发现的是栏目页几乎没流量、而文章页天生流量就很高。多数情况下这证明了文章页具有更大的流量发展空间,此时把外链分配给文章页就是最明智的做法。(但也不能武断的说,不能排除栏目页的SEO有巨大问题的可能性,这问题一点都不罕见。所以还要结合我们的常识及其他方面的分析来综合判断。)最后的总结实际可能要面临的问题还有很多很多,当然不可能是一篇文章所能涵盖的。前面提到的只是两个主要数据,实际SEO过程中,还或许需要用到的数据如网站级的Google Webmaster Tool,估算流量的爱站、SEMRush、Google Adplanner、HitWise,关键词的Google Keyword Tool、百度司南,链接类的MajesticSEO、Ahrefs等等。最近我在看麦肯锡方法,提到:“以事实为基础,严格的结构化,以假设为导向”,类似的稍总结下SEO的话:“以数据为基础,严格的逻辑化,以效果为目标、技术为手段”。本文是为了作为根基的数据垫下基础而已,它本身是没任何价值的光看数据的话,它只不过是死板的数字罢了。如何借由数据的辅助,在最需要的地方进行SEO的更改,使得流量获得大的突破并给网站产生价值,这是我们要真正关注的部分,之后再慢慢分解。SEO实践(2):让网站对搜索引擎友好2012-02-29 16:08 小 大 来源: 评论: 0 分享至: 百度权重查询 站长交易 友情链接交换 网站建设,网站设计,企业建站就找313在该系列文章的第一篇中,提到SEO应该是以数据为基础的,并略为展开写了一些数据方面的准备工作。数据虽然是非常重要的,但它扮演的角色只能是辅助:发现问题、总结改进、作为决策的参考因素等,但都无法脱离既有的SEO方法而独立存在。而SEO的方法,应该分为两种或四种:使网站对搜索引擎友好、使网站对搜索引擎的用户友好。如果再考虑黑帽SEO手段的话,可以额外加上两项:使搜索引擎误以为网站对搜索引擎友好、使搜索引擎误以为网站对搜索引擎的用户友好。稍有经验的SEO,都可以总结下,看是否有任何SEO方法可以脱离这四点的范畴之外。至少我从没看到。当然黑帽不在这系列文章的讨论范畴之内,所以就以两篇文章来分别简述如何对搜索引擎及其用户友好。本文的主题是如何让网站对搜索引擎友好,这是一个非常大的话题,文章经过几次删改,最终还是决定只举一例。毕竟搜索引擎的技术涉及面实在太广,相应需要的网站技术也很多,一篇文章无论如何也最多提及冰山一角,那不如只找个比较有代表性的例子,剩下的大家自行扩展。如何使搜索引擎能够更准确的理解网页?搜索引擎无论如何只是程序,不可能非常完美判断互联网上那么多不同网页的不同情况。搜索引擎对网页分析中的主要过程之一,是将网页分成一个个明确的功能区块。如正文区块、相关链接区块、联系电话区块、无关广告区块等等。而它判断的方式诸如:看字数多少、看HTML代码的形式、将文字内容以自然语言处理来理解等等。分块化一般在HTML代码里,最好以标签来标明网页上的每一个重要区块,且每个重要的里面又有一个或标签明确指明该区块的主题。这样的做法可以让页面上每一块内容所表达的更清晰。尤其对于搜索引擎而言,它可以通过这样的来明确它如何去给网页分块,并通过小标题去了解这分块属于什么样的性质,从而判断应该如何计算处理。一个最典型的实例是Amazon的产品信息页面:可以看到上图中被明确归为了三块,且清晰指出了它们分别是关联购买、技术细节与商品细节。相比之下,不少电商网站最上方是产品图片与价格,然后第二块区块开始,就把产品参数、产品描述及大量未必有用的产品图片依次堆在一起,无疑就差得多了。(上图中Product Details一块多数内容都是自动生成,而同时对用户和SEO有价值的内容,这块是被多数电商网站所忽略的。)Amazon产品页的SEO,在电商领域是最顶尖的,远远强出eBay等网站。分块化便是其中主要原因之一。语义化这里语义化指的是用户所不可见的HTML代码也要具有含义,尽管这对于用户没有意义,但能让搜索引擎等程序更容易理解。(当然也方便代码维护,这是技术层面的事情了)微数据、微格式等是已经日渐被重视起来的概念,它无疑可以很明确的标识网页上面元素的含义。这里不详细展开,可见:/webmasters/bin/answer.py?hl=zh-Hans&answer=99170(微数据更重要的意义可能在于提升网页在SERP里面的点击率。对于电商网站,仅以此提升几倍SEO流量完全不是不可能的)。但微数据等方式总有一定的局限性,例如它不能指定大区块的含义,比如告诉搜索引擎,网页上哪里是头部、哪里是底部等。HTML5规范很好的解决了这个问题,它推荐使用的等标签可以非常好的展示网页区块。不过很多网站目前基于很多原因还不会选用HTML5(但站在SEO的角度,应该尽力去推动下),所以不可以用等标签,还是需要用。在这样的情况下,需要注意的ID命名。例如对于搜索引擎而言,要比容易理解得多。而且,一般来说可以用ID的地方不应该用CLASS,如不少设计人员喜欢不管三七二十一写。但W3C规范明确指出过,具有唯一性的元素应该使用ID而非CLASS。对于搜索引擎而言,具有唯一性的元素是可以确定其出现位置的,它就更容易确定那个区块到底在网页上起到什么样的角色。举个实例如,以前公司里面有一个PPC的着陆页,明明网页上出现过相关的关键词,但那些词的质量分依然极低。分析后发现那些关键词都是被写在区块的,这些文字就因此被当作页面底部的和主题无关的内容,使得搜索引擎错误的分析了网页,对质量分造成了负面的影响。通俗化通俗化在这里指的是不要在网页上用一些难以理解的指示性文字,比如在搜索框旁边使用“找找看”,而非常见的“搜索”。这会给用户带去一定程度的困扰,也会给搜索引擎带去更大的困扰。搜索引擎会通过自然语言处理等方式来理解这样的文字。大致的思路如先随机抽取1000个网页样本,先人工找出网页上面的搜索区块,再通过机器分析这些区块一般出现什么样的字眼最多。那么相应的在分析日后其它网页的时候,出现这样字眼的区块也就更可能是搜索区块。前面提到命名的时候也差不多,等,因为都是比较常见的,搜索引擎肯定可以因此判断它为头部区块。而或更糟糕的(但不罕见的)等,搜索引擎就迷茫了。最终可能搜索引擎分析出来的结果不是自己想要的。最后前面以辅助搜索引擎理解网页为例,简单介绍了让网站对搜索引擎友好的思路。但搜索引擎不仅只是分析网页、就以分析网页而言,也远远不止上面这点内容。只能当作是思路的拓展。如果可以的话,自己从服务器环境架设开始,从配置数据库、从框架构建程序、书写前端CSS与JavaScript等代码、尝试下Ajax、最好还自己搞定站内搜索,这样完完整整的做一个网站(在虚拟空间上用WordPress选一个模板就算搭建完的明显不算),就会发现不仅对于网页设计,在网站的各个角落都有SEO可以优化的空间。也只有自己实际做过,才能知道如何给具体技术人员写切实可行的文档。关于前面提及的一些搜索引擎方面的知识,我在看过几本搜索引擎书后,相对而言入门级搜索引擎原理还是比较推荐走进搜索引擎一书。虽然从技术角度它没有什么独特的观念

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论