第十章 搜索引擎优化误区_第1页
第十章 搜索引擎优化误区_第2页
第十章 搜索引擎优化误区_第3页
第十章 搜索引擎优化误区_第4页
第十章 搜索引擎优化误区_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十章搜索引擎优化误区广州大学华软软件学院-网络技术系-搜索引擎优化-NB3004-王春芹第1页,共36页,2023年,2月20日,星期三搜索引擎优化作弊针对搜索引擎算法的不完善而采取相应欺骗性的手段,以提高页面权重及相关性的行为。(也称为黑帽SEO)按照作弊的操作范围分为内部作弊:通过操控网站内部因素影响页面权重及相关性的行为外部作弊:通过操控网站外部因素影响页面权重及相关性的行为物联网实验室2第2页,共36页,2023年,2月20日,星期三常见搜索引擎优化作弊方式关键字堆砌隐藏文本镜像网站门页302重定向伪装链接欺骗3第3页,共36页,2023年,2月20日,星期三1.

关键字堆砌指在页面上堆放大量与页面主题相关或无关的关键字,这样做是为了增加某些关键字的词频以提高页面相关性。在页面中常用于堆砌关键字的区域:正文内容(即<body>…</body>标签间)<noframe>标签注释4第4页,共36页,2023年,2月20日,星期三2.

隐藏文本“隐藏”页面中堆砌的关键字,达到既增加关键字词频、提高页面相关性,又不影响页面美观及用户体验的目的。

“隐藏文本”通常通过CSS控制文本的“字号”及“颜色”属性值来实现。因此,这些“隐藏文本”对于普通用户来说是不可见的,但搜索引擎却可以识别。“隐藏文本”也是“关键字堆砌”的一种方式。5第5页,共36页,2023年,2月20日,星期三CSS控制隐藏文本方法一:CSS的display:none设置<styletype="text/css">#n{display:none;}</style></head><body><div><ahref="网站的网址">网站的名字</a></div><divid="n">网站的网站</div>display:none的设置把最后“网站的网站”这段文字给隐藏掉了,前面没有定义过的div则正常显示。这个代码不仅可以控制隐藏文本,其实也可以控制隐藏链接,在黑帽SEO中最为经常见到。

6第6页,共36页,2023年,2月20日,星期三方法二:visibility:hidden设置<styletype="text/css">#n{visibility:hidden;}</style></head><body><div><ahref="网站的网址">网站的名字</a></div><divid="n">网站的网站</div>visibility::hidden设置,将“网站的网站”这段文字的可见性设置为隐藏。7第7页,共36页,2023年,2月20日,星期三方法三:overflow:hidden设置<styletype="text/css">

#n{overflow:hidden;width:0px;height:0px;}</style></head><body><div><ahref="网站的网址">网站的名字</a></div><divid="n">网站的网站</div>overflow:hidden设置,可以隐藏溢出。overflow是检索或设置当对象的内容超过其指定高度及宽度时如何管理内容,这也是黑帽SEO较为常用的一种方式。

8第8页,共36页,2023年,2月20日,星期三3.镜像网站将一个完全相同的网站源程序放到几个服务器,分别有自己独立的URL,在这些服务器上互为镜像网站。好处是:如果不能对主站作正常访问(如某个服务器死掉或出了意外),但仍能通过其它服务器正常浏览。镜象站点通过复制网站或网页的内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引。现在大多数搜索引擎都有能够检测镜象站点的过滤系统,一旦发觉镜象站点,则源站点和镜象站点都会被从索引数据库中删除。9第9页,共36页,2023年,2月20日,星期三常见的镜像网站有三种:第一种是克隆网站,指在内容完全相同的网站上绑定多个域名例如:“/”与“/”。搜索引擎在计算网站外部链接得分时,将分数分散到2个网站,没有获得统一的得分。第二种是为内容完全相同的网站制定多套不同风格的页面模版,再绑定多个域名。第三种是数据采集网站,指网站中所有的内容都是通过采集程序采集的。10第10页,共36页,2023年,2月20日,星期三4.门页“门页”即“DoorwayPages”,也称为桥页、跳转页或入口页,是指针对搜索引擎而进行特别优化的页面,当用户访问门页时,会自动(或引导用户手动)跳转至另外一个内容完全不同的页面上。11第11页,共36页,2023年,2月20日,星期三“页面1”、“页面2”都是“网站A”的页面.普通用户在搜索结果中点击“页面1”的链接时,会自动(或引导用户手动)进入“页面2”。这时,我们称“页面1”为门页。

<metahttp-equiv=“refresh”content=“0.5;url=”>12第12页,共36页,2023年,2月20日,星期三门页可能是针对一个搜索引擎,也可能是针对多个不同的搜索引擎。例如:如果程序监测到前来访问的是Googlebot,则返回针对Google而进行过特别优化的页面;如果是百度的BaiduSpider,则返回针对百度进行过特别优化的页面。搜索引擎轻易就能识别门页。对于使用门页的网站,搜索引擎的处罚是非常严厉的,轻者降低网站权重,重者直接从索引中清除。13第13页,共36页,2023年,2月20日,星期三5.

伪装“伪装”即Cloaking,是指根据用户身份返回不同页面的行为,是门页最常用的跳转方式之一。例如:面对搜索引擎及普通用户返回不同的页面,向搜索引擎返回经过特别优化的页面,而对普通用户则返回正常的页面。不管在什么情况下,“伪装”都是欺骗搜索引擎的违规行为,因此会受到搜索引擎的惩罚。

14第14页,共36页,2023年,2月20日,星期三PHP伪装代码<?php

$trouve=strpos($_SERVER["HTTP_USER_AGENT"],"Googlebot");

if($trouve==true){?>

<html>

...

为Google准备的页面...

</html><?php

}

else{?>

<html>

...

为普通用户准备的页面...

</html><?php

}?>15第15页,共36页,2023年,2月20日,星期三“伪装”原理:首先对前来访问的用户的头部代理信息进行判断,如果是搜索引擎蛛蜘程序则返回为搜索引擎而准备的页面,否则返回正常的页面。在进行“伪装”时必须知道搜索引擎蜘蛛程序的头部代理信息,这些信息我们可以在服务器日志上查看到。16第16页,共36页,2023年,2月20日,星期三6.

302重定向重定向指把对一个目录或者文件的访问请求转发至另外一个目录或文件。重定向包括301重定向及302重定向。其中,302重定向又称为暂时性转移(Temporarily

Moved

),适用于临时更换域名或目录名称等情况。常见的302重定向方式包括“meta重定向”及“JS重定向”。在使用302暂时性重定向时必须十分谨慎,否则很容易会陷入门页的误区而遭到搜索引擎的惩罚。

17第17页,共36页,2023年,2月20日,星期三Meta重定向指通过设置Meta标签的http-equiv属性值及内容来实现的重定向。例如:在页面头部加上代码“<Meta

http-equiv=”refresh“

content=”3;url=“>”,则打开当前页面3秒钟后自动跳转至网站“”。如果设定的停留时间过短(如:停留时间少于一秒),则会被搜索引擎认为是“门页”。为了避免“门页”嫌疑,我们在使用Meta进行跳转时,通常会把停留时间设定在3秒以上。

18第18页,共36页,2023年,2月20日,星期三JS重定向指使用Javascript语言实现的重定向。<SCRIPT

LANGUAGE="JavaScript">

<!--

window.location.href=;

//--></SCRIPT>19第19页,共36页,2023年,2月20日,星期三7.链接欺骗手段指利用搜索引擎对外部链接关系的重视,围绕建立外部链接而开展的一系列欺骗搜索引擎的行为。20第20页,共36页,2023年,2月20日,星期三(1)垃圾链接指通过非正当手段获得大量高质量或者低质量外部导入链接的行为。严格地说,垃圾链接是一种行为,而不在于导入链接所在页面质量的高低。导入链接所在页面质量高质量垃圾链接(Wiki/百度百科)低质量垃圾链接(论坛、留言板、博客、自助链接系统等)从源页面与目标页面链接关系单向垃圾链接(在论坛、留言板、博客等群发链接信息)双向垃圾链接(自助链接系统)21第21页,共36页,2023年,2月20日,星期三垃圾链接识别垃圾链接严重影响搜索结果的质量。因而,搜索引擎对垃圾链接的打击是非常严厉的,轻者降低权重,重者直接从搜索引擎索引中清除。搜索引擎识别垃圾链接常用的方法:

a.人工检查,各大搜索引擎都会有Anti

spam部门,即反垃圾网站部门;

b.用户举报,如:你的竞争对手或者普通用户都可能是举报的发起者;

c.程序跟踪,大部分搜索引擎已经建立较为智能算法,根据各种垃圾链接的特征进行监控。22第22页,共36页,2023年,2月20日,星期三(2)外部链接作弊方式1.Wiki

Wiki是一种网上共同协作完成某一个共同任务的超文本系统,可由多人共同对网站内容进行维护及更新。在Wiki里,垃圾链接信息有两种特征:第一:同一网站的链接信息在N个页面上重复出现,或者同一网站的链接信息在同一页面重复出现N次第二:链接以一个或者多个关键字作为锚文本。23第23页,共36页,2023年,2月20日,星期三2.博客

博客垃圾链接是指通过建立博客,并在博客页面中发布链接信息的行为。由于博客提供商的网站一般都具有较高的权重,很多人为了提高网站的外部链接数,而在一些博客提供商里注册成百上千的帐号,再在这些博客的页面上肆无忌惮的发布垃圾链接信息。24第24页,共36页,2023年,2月20日,星期三3.论坛

指在论坛上发布链接信息的行为,论坛垃圾链接几个特征:

发布内容这来源于同一个帐号或者IP;一般有群发软件完成,数据量巨大、发贴时间接近;帖子或这恢复内容也是以发布链接信息为主,通常是一个或多个关键词作为锚文本;垃圾链接很少会出现在高质量的论坛里,因为高质量论坛管理比较完善,就算出现垃圾链接信息,一般也不会超过一天。25第25页,共36页,2023年,2月20日,星期三4.留言板

留言板垃圾链接是指在留言本类页面上不乏链接信息的行文,常见的留言本类系统包括评论系统、留言板系统。由于留言本系统发布信息一般不需要特定的权限,因此最容易产生大量的垃圾信息。也是目前最常见的链接作弊手段。26第26页,共36页,2023年,2月20日,星期三5.自助链接

如果在低质量页面中不加分类的添加数量巨大的外部导出链接,则会被认为是垃圾链接页面。如果垃圾链接页面间存在链接关系,则构成自助链接行为。例如,在A和B两个垃圾链接页面中,页面A中存在链接指向页面B,页面B中也有链接指向A,则页面A和B就构成自助链接行为。27第27页,共36页,2023年,2月20日,星期三自助链接与分类目录的区别1:自助链接不存在分类管理,所有的外部链接都存在同一页面上;

2:缺少严格的质量管理,一般提交就通过,且页面中存放的是一些没有实质内容的网站;

3:双向性,既得到导入链接的一方,同时又得为其他网站提供链接入口;

4:外部导出链接数量庞大,通常一个页面中存在数百个导出链接;28第28页,共36页,2023年,2月20日,星期三6.购买链接

指向一些高质量的网站购买导入链接的行为,购买链接行为有四大特征:

1:链接单向性,即单方面得到高质量网站的导入链接;

2:出售导入链接网站与购买链接网站在主题上毫无相关,即购买链接的网站指在乎对方网站的质量,而往往忽略了网站间主题相关性。

3:导入链接数量巨大,在出售链接的网站上,几乎每个页面都存在该链接信息;

4:链接对象是文本,且以目标网站的主题名称作为锚文本。29第29页,共36页,2023年,2月20日,星期三根据以上特征,思考如何识别链接作弊网站?30第30页,共36页,2023年,2月20日,星期三8.作弊处罚一、网站的权重降低

网站被

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论