搜索引擎优化高级进阶二.doc_第1页
搜索引擎优化高级进阶二.doc_第2页
搜索引擎优化高级进阶二.doc_第3页
搜索引擎优化高级进阶二.doc_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、内容重定向和HTTP状态代码 1、HTTP状态代码1xx 消息这一类型的状态码,代表请求已被接受,需要继续处理。这类响应是临时响应,只包含状态行和某些可选的响应头信息,并以空行结束。由于 HTTP/1.0 协议中没有定义任何 1xx 状态码,所以除非在某些试验条件下,服务器禁止向此类客户端发送 1xx 响应。100 101 1022xx 成功这一类型的状态码,代表请求已成功被服务器接收、理解、并接受。200 201 202 203 204 205 206 2073xx 重定向这类状态码代表需要客户端采取进一步的操作才能完成请求。通常,这些状态码用来重定向,后续的请求地址(重定向目标)在本次响应的 Location 域中指明。当且仅当后续的请求所使用的方法是 GET 或者 HEAD 时,用户浏览器才可以在没有用户介入的情况下自动提交所需要的后续请求。客户端应当自动监测无限循环重定向(例如:A-A,或者A-B-C-A),因为这会导致服务器和客户端大量不必要的资源消耗。按照 HTTP/1.0 版规范的建议,浏览器不应自动访问超过5次的重定向。300 301 302 303 304 305 306 3074xx 请求错误这类的状态码代表了客户端看起来可能发生了错误,妨碍了服务器的处理。除非响应的是一个 HEAD 请求,否则服务器就应该返回一个解释当前错误状况的实体,以及这是临时的还是永久性的状况。这些状态码适用于任何请求方法。浏览器应当向用户显示任何包含在此类错误响应中的实体内容。如果错误发生时客户端正在传送数据,那么使用TCP的服务器实现应当仔细确保在关闭客户端与服务器之间的连接之前,客户端已经收到了包含错误信息的数据包。如果客户端在收到错误信息后继续向服务器发送数据,服务器的TCP栈将向客户端发送一个重置数据包,以清除该客户端所有还未识别的输入缓冲,以免这些数据被服务器上的应用程序读取并干扰后者。400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 421 422 424 425426 4495xx 服务器错误这类状态码代表了服务器在处理请求的过程中有错误或者异常状态发生,也有可能是服务器意识到以当前的软硬件资源无法完成对请求的处理。除非这是一个HEAD 请求,否则服务器应当包含一个解释当前错误状态以及这个状况是临时的还是永久的解释信息实体。浏览器应当向用户展示任何在当前响应中被包含的实体。这些状态码适用于任何响应方法。500 501 502 503 504 505 506 507 509 5102、使用301和302重定向3、使用404清楚已删除页面4、使用500避免索引错误的页面5、其他类型的重定向二、重复内容1、重复内容的起因和影响网站结构导致的重复内容一些网站结构本身会引起重复内容,如下所示:(一)打印友好的页面(二)具有大体上类似的内容,且能通过不同的URL地址访问的页面(三)上有非常类似的单元的页面,比如在一个电子商务目录中,一连串不同颜色的衬衫,它们有相似的描述(四)页面是一个追踪应用程序的会员程序的一部分,且这个程序配置不正确(五)有重复的标题或重复的meta标签值的页面(六)使用基于URL地址的会话ID(七)标准化问题内容盗窃导致的重复内容内容盗窃产生的是一个完全不同的问题。正如盗贼能偷真实的财产一样,他们也能偷内容。毫无疑问,这是为什么它被称为内容盗窃的原因。它对搜索引擎产生了相似的问题,因为搜索引擎努力从搜索结果之中过滤重复内容,并且有时会对哪些是原创权威内容做出一些错误假定。在某些情况下,这是个隐蔽的问题,并且可能给排名带来灾难性的影响。CopyScape是一种能帮助找到内容盗窃的服务,它在其他网页上扫描,查看和给定页面所包含的内容是否相似。站点地图也能提供帮助,它可以更快地索引新的内容,所以能有助于确定谁是原创作者。站点地图将在以后深入讨论。如果您是内容盗窃的牺牲品,并且想要有所行为,那么首先要给那个使用非法内容的人发送一封要求暂停并中止的信。可以使用该网站提供的联系信息,或者该域名在WHOIS记录中的联系信息。如果这个方式失败,那么可以找主流搜索引擎来警告他们的内容盗窃行为。下面是主流搜索引擎负责此事的URL地址:(一)Google:/dmca.html(二)YaHoo!:/info/copyright/copyright.html(三)MSN:/docs/siteo . _CONC_AboutDMCA.htm不幸的是,如果与内容盗窃展开竞争,将令人可笑地成为费时又费钱的行为特别是如果律师也加入进来的话。对所有的情况都这么做可能并不现实;而且搜索引擎通常能够精确地评定谁是原创作者并将优先显示他的页面。GOOGLE,通常将非常复制品转移到补充索引中。但是,在一些不太可能发生的情况下,比如含有偷盗内容的URL地址的实际排名居然比原创本身的还要高,那么就应该采取行动。2、排除重复内容3、常见重复页面的解决方案、robots.txt、根据不同的排列修改内容、URL规范化301、404等、三、网站PR值1、什么叫PR值和GOOGLE对网页级别的描述专利人是Google创始人之一拉里佩奇(Larry Page)因此,PageRank里的page不是指网页,而是指佩奇,即这个等级方法是以佩奇来命名的。它是Google排名运算法则(排名公式)的一部分,是Google用于用来标识网页的等级、重要性的一种方法,是Google用来衡量一个网站的好坏的重要标准之一2、GooglePR值的算法和PR值的应用如果网页T存在一个指向网页A的连接,则表明T的所有者认为A比较重要,从而把T的一部分重要性得分赋予A。这个重要性得分值为:PR(T)/C(T)其中PR(T)为T的PageRank值,C(T)为T的出链数,则A的PageRank值为一系列类似于T的页面重要性得分值的累加。PR(A)=(1-d)+d(PR(t1)/C(t1)+PR(tn)/C(tn)A代表页面APR(A)则代表页面A的PR值d为阻尼指数。通常认为d=0.85t1tn 代表链接向页面A的页面t1到tnC代表页面上的外链接数目。C(t1)即为页面t1上的外链接数目从计算公式可以看到,计算PR值必须使用迭代计算才能得到。优点:是一个与查询无关的静态算法,所有网页的PageRank值通过离线计算获得;有效减少在线查询时的计算量,极大降低了查询响应时间。不足:人们的查询具有主题特征,PageRank忽略了主题相关性,导致结果的相关性和主题性降低;另外,PageRank有很严重的对新网页的歧视。3、如何提高我们站点的PR值、登录搜索引擎和分类目录;友情链接别忘了,如果能获得来自PR值不低于4并与你的主题相关或互补的网站的友情链接,且很少导出链接,那样效果更好.、写一些高质量的软文,发布到大型网站,如果得到大家的认可,你的网址会被无数的网站转载.这种方法对于提高PR值效果最好.、搜索引擎收录一个网站的页面数量,如果收录的比例越高,对提高PR值越有利.、提供有价值的网站内容,并进行SEO优化.对提高PR值也非常的重要.、最好使网站被三大知名网络目录DMOZ,Yahoo和Looksmart收录,如果能被收录,对PR值的提高非常的迅速.、产生网络营销、社会化媒体营销、或者去QQ、去群、去论坛等人气旺的地方宣传4、影响PR值的因素和PR值的作用、与PR高的网站

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论