手册优视搜索引擎优化_第1页
手册优视搜索引擎优化_第2页
手册优视搜索引擎优化_第3页
手册优视搜索引擎优化_第4页
手册优视搜索引擎优化_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、ucweb SEO 规范UC 优视搜索引擎优化规范IBD-SEOTEAM第 1 页 共57 页ucweb SEO 规范目录 . 什么 SEO4二. SEO 细则42.1 1 服务器空间42.1.1 . 1 什么是服务器空间?42 . 1 . 2 服务器空间的哪些因素影响的排名?52 . 2导航结构62 . 2 . 设计结构要注意哪些因素?62 . 32 . 3 . 1和文件名7和文件名的介绍:72 . 3 . 2 什么样的有利于排名?72 . 3 . 3 目录路径和文件名的因素:72 . 4 网页标题 TITLE 和 META . 92.4.1 . 1 网页 t i t le 和 meta2.

2、4.2 . 2 网页标题 t i t le 和meta介绍9如何设计有利于排名?92 . 5 优秀的网页内容112 . 62 . 6 . 1密度和位置12 密度的重要性12 2 . 6 . 2 什么是2 . 6 . 32 . 6 . 4密度?12 密度在那个区间比较合理呢?13 如何在网页中那些位置突出?13 2 . 7 反向. 15 2.7.1 . 1 什么是反向2.7.2 . 2 如何查看反向? . 15 ? . 15 2 . 7 . 3 反向的哪些因素影响的排名?15 2 . 8 Page Rank 值16 2 . 9 Robots. txt 和 Robots meta. 19 2.9.

3、1 . 1 什么是 robots. txt?19 2.9.2 . 2 robots. txt 的语法20 2.9.3 . 3 robots. txt 基本的用法20 2.9.4 . 4 robots. txt 举例22 2.9.5 . 5 常见 robots. txt 错误22 2 . 9 . 6 Robots META. 24 三. SEO 注意事项26 3.1 1 框架网页26 3.2 2 Flash 网页32 3.3 3 不可见的导航34 3 . 4 代码3 . 5. 38 页41 3.6 6 在 URL 中使用 SESSIONID44 3.7 7 检查基于 COOKIE 的导航46 3

4、.8 8 其它注意事项48 第 2 页 共57 页ucweb SEO 规范四. 关键字选择50 4 . 14.2 2 选择4.3 3 选择4.4 4 页游的重要性50 的原则52 有哪些系统的方法52 的选择策略56 4 . 5 内容与创作56 第 3 页 共57 页ucweb SEO 规范一.什么 SEOSEO 是 Search Engine Optimization 的缩写, 翻译成中文就是“ 搜索引擎优化 ”, 一般可简称为搜索优化。 SEO 的主要工作是通过了解各类搜索引擎如何抓取互联网页面、 如何进行索引以及如何确定其对某一特定的搜索结果排名等技术, 来对网页进行相关的优化, 使其提

5、高搜索引擎排名, 从而提高量, 最终提升的销售能力或宣传能力的技术。二. SEO 细则2.1 服务器空间2.1.1 什么是服务器空间?服务器空间就是存放文件的地方,一般而言,大型 都用的是独立的服务器, 或者是服务器集群。 小型大部分都是租用虚拟空间, 也就第 4 页 共57 页ucweb SEO 规范是一台服务器上的一部份空间。2.1.2 服务器空间的哪些因素影响的排名?(l)服务器所在区域影响你的的排名:对于 Goog 1 e 和 yahoo 等知名搜索引擎而言,不同的区域,搜索结果的就不同。 例如, 一些英文, 你在中国用 Goog 1 e 搜索, 发现你的排名非常靠前, 但是如果你在国

6、外用, 你可能翻十页都找不到你的.看的, 而是让我们的潜我们做搜索引擎排名的排名效果不是让我们在客户看的. 所以服务器的区域选择非常关键。目前我们主要国内主流搜索引擎进行优化 ,如 Baidu 、360 搜索 、S oso、Sogou。服务器放置国内甚至是主要目标用户群所在地,从用户体验的角度来看会提高转化率。(2)检查服务器的 IP 是否被搜索引擎处罚过:当租用一个新的 web 空间放 的的时候, 请一定要检查这台服务 器的 IP 是否被搜索引擎处罚过. 不然就算你的做的再好, 都有可能被牵连受害。 如何检查呢?首先 ,你 要查一下这台服务器上放了多少呢? 如何查呢? 这里我们给大家推荐一些

7、工具, 可以很轻松的查出来有多少共同指向一个 IP:以上这些工具都可以看到有多少指向了这个 IP, 然后找其中一个,比如:然后你在 baidu 中输入:site: 然后看一看 Baidu 收录了这个多少页面。 如果发现 baidu 还没有收录它, 就多查几个, 如果大部分都是没有被 baidu 收录的话, 那么很有可能这台服务器是被 baidu 处罚过的 。为 了保险起见 ,最 好别用 。如 果这台服务器上的大部分都被 Baidu收录了许多页面的话, 说明这台服务器没有被 Baidu 处罚, 可以使用。第 5 页 共57 页ucweb SEO 规范 般而言, 被搜索引擎处罚的比较多, 被搜索引

8、擎处罚的服务器 IP 相对比较少!(3)、服务器的稳定性影响的排名:想 获 得 较 好 的 排 名 , 服 务 器 一 定 要 稳 定 . 如 果 服 务 器 不 稳 定 , 很 有 可 能Baidu 更新你的时候, 你的暂时因为服务器不稳定而打不开, 那么你 的排名就了. 这条因素特别重要.举个例子, 在年前输 入“ 广州” 一词, 一直都稳排第一. 但是春节期间,公司技术回家过年了 。这 时候刚好服务器出问题了, 导致长时间不能 , 期间正好赶上了 Baidu 更新, 该的排名迅速下降到了第五位.如果想获得较好的排名,服务器要要做到以下几方面: 1 、要租用潜在客户最多的地区的相应 IDC

9、 服务商的服务器或者空间2 、服务器的 IP 一定要没有被处罚过3 、服务器运营要稳定、 速度要快!2.2导航结构导航结构主要就是一个 的栏目菜单,是网页中很重要的一部分内容, 主要对网页的导航、 布局起到很重要的作用。 它一方面在帮助用户更方便的浏览, 同时它也是用户和搜索引擎 个专业度的重要因 。2.2.设计结构要注意哪些因素?(l)、导航要清晰明了一般 的导航主要是 的一级目录,通过它们用户和搜索引擎蜘蛛程序都可以层层深入到所有重要内容。(2)、导航用要文本做第 6 页 共57 页ucweb SEO 规范许多, 为了漂亮和美观, 都采用 flash 按钮或者图片来做, 这是非常不合理的,

10、 因为这些按钮中的, 很难被搜索引擎蜘蛛程序发现,所以导航一定要用文本做。2.3和文件名2.3.1和文件名的介绍:选择,路径设计, 文件名设计 ,对的排名影响有一定的影响,特别是中文搜索引擎如 Baidu 的选择和, 尤为重要。 选择一个好的 , 把的路径、 文件设计的合理一些, 对在各个搜索引擎中的排名有一定的帮助。2.3.2 什么样的有利于排名?n:, 比如要排“ 网页” 这个关就是以作为前缀的键词的时候, 你选择 wangyeyouxi. com 这样的, 将非常有利于搜索引擎排名。n包含的:有限,好的 大部分已经都被抢注了,如果所属行业出现这类情况, 我们就建议采用包含的。 如要排“游

11、戏” 这个, 可以选择 49 shouyou. com 这样的。2.3.3 目录路径和文件名的因素:目录路径和文件名的路径的设计因素主要要考虑以下几个因素:n文件路径和文件名最好要包含比不包含的具备优势根据关键字无所不在的原则,可以在目录名称和文件名称中使用到关键第 7 页 共57 页ucweb SEO 规范词。但如果是组,则需要用分隔符。我们常用连字符“ -” 和下划线“ _” 进行分隔, 中还经常出现空格码“ % 20 ” 。因 此 ,如 果以“ 中国旅游”作文件名, 就可能出现以下三种分隔形式:Chinatour. htmChina_tour. htmChina- tour. htmCh

12、ina% 20 tour. htm这几种写法哪种正确, 哪种不正确呢?目前、等搜索引擎并不认同“ _” 为分隔符。 对来说,China- tour 和 China% 20 tour, 都等于 China tour,但 China_tour 就被读成了 Chinatour, 连在一起之后,就失去了意义.China- tour. htm 是正确的写法, 这一点要千万的注意。 因此, 目录和文件名称如果有组, 要用连字符“ -” 而不是下划线“ _” 进行分隔n比栏目页具备优势:A 比有排名优势n栏目页比内页具备优势:比这样的路径有排名优势.n静态路径比动态路径具备优势:比这样的路径具备优势。动态路

13、径: 目前很多都有数据库驱动生成的 URL,即动态 URL,往 往表现为在 URL 中出现“ ?” 、“ =” 、“ %” 、以及“ &” “ $” 等字符。动态URL 极不利于搜索引擎抓取网页, 严重影响排名, 通常是通过技术解决方案将动态 URL 转化成静态的 URL 形式, 如:第 8 页 共57 页ucweb SEO 规范这样的路径, 可以通过技术成这样的路径:关于动态路径的优化策略, 将会在后面专门来讲。2.4 网页标题 TITLE 和 META2.4.1 网页 title 和 meta介绍标题了 TITLE 和 META主要都放在网页源代码中<head>与<

14、;/ head>中间. 这些内容主要是为了方面搜索引擎蜘蛛对网页内容的识别. 其中, title在网页浏览的时候会显示在浏览器上放 meta在网页浏览的时候是看不到的。 只有察看网页源代码的时候才能看到。 这里举一个例子:<TITLE>傲剑_傲剑 OL 官网_攻略_傲剑 OL_九游</TITLE><META name=keywords content= 傲剑 OL, 傲剑官网, 傲剑攻略, 傲剑礼包,安卓版,ios 版, 傲剑>< META name=description content= 傲剑 OL 是一款火爆的 ARPG武侠无端网游 。傲

15、剑官网提供最新傲剑 ios 版和安卓版、最 好玩的傲剑攻略, 欢迎到九游傲剑与玩家交流。 ><META http- equiv=Content- Type content=" text/ html; charset=gb 2312 " >< META http- equiv=Content- Language" content=" zh- cn"> 2.4.2 网页标题 title 和 meta如何设计有利于排名?( 1 )、 网页标题该如何设计?前面例子中的网页标题 title 如下: <TITLE>

16、傲剑_傲剑 OL 官网_攻略_傲剑 OL _九游</ TITLE>这部分表示网页标题, 网页标题对网页在各大搜索引擎中的排名有着很大的第 9 页 共57 页ucweb SEO 规范影响, 而且对该网页在其他搜索引擎中的排名也同样有着很大的影响 . 所以,标题的设计是非常关键的.设计网页标题有以下几点原则:每个网页的标题都要不同, 并且要与自身网页的内容像符合;网页标题设计简洁明了, 每个页面的标题最好只终点突出 1 - 3 个, 不要 太多;标题设计不要太长, 最好不要超过 30 个汉字。( 2 ) META 该如何设计: 前面例子中的网页 META 如下: <META na

17、me=keywords content= 傲剑 OL, 傲剑官网, 傲剑攻略, 傲剑礼包,安卓版,ios 版, 傲剑>< META name=description content= 傲剑 OL 是一款火爆的 ARPG武侠无端网游 。傲 剑官网提供最新傲剑 ios 版和安卓版、最 好玩的傲剑攻略, 欢迎到九游傲剑与玩家交流。 ><META http- equiv=Content- Type content=" text/ html; charset=gb 2312 " >< META http- equiv=Content- Langua

18、ge" content=" zh- cn"> 以上部分内容是网页 meta ,另外还有许多种网页,不过以上这些是最重要的。< META name=description content= 傲剑 OL 是一款火爆的 ARPG武侠无端网游 。傲 剑官网提供最新傲剑 ios 版和安卓版、最 好玩的傲剑攻略, 欢迎到九游傲剑与玩家交流。 >其中这部分是网页描述 ,它主要是给搜索引擎看的,这个 设计追求简单明了, 与该网页内容相符合。 为了提高排名, 可以适当在里面提高的密度。<META name=keywords content= 傲剑 OL, 傲

19、剑官网, 傲剑攻略, 傲剑礼包,第 10 页 共57 页ucweb SEO 规范安卓版,ios 版, 傲剑>这句是,目前对 Goo 1 e、Baidu 已经没有什么作用了,不过对其他搜索引擎的排名还有一定的作用, 这个的设计原则和是简洁明了,如果是多个, 可以用逗号格开, 无关的最好写, 容易被一些搜索引擎当作来处理。<META http- equiv=Content- Type content=" text/ html; charset=gb 2312 " >< META http- equiv=Content- Language" co

20、ntent=" zh- cn"> 这两句是网页编码和语言注释 ,主要是给浏览器看的。不同语言的编码都不同, 最好用潜在客户使用的超作系统的编码, 要不然潜在客户看到 的网页将是乱码。 如果是英文, 潜在客户是西欧的, 可以用以下代码: <metahttp- equiv=” Content- Type”content=” text/ html; charset=iso - 8859 - 1 ” >或者用通用的编码:<meta http- equiv=” Content- Type”content=” text/ html; charset=utf 8

21、” >大部分中文简体的制作软件模式的编码都是 gb 2312 .2.5 优秀的网页内容网络,内容为王,优秀的内容永远是吸引搜索引擎的最重要的因素。什么样的网页内容才算优秀的网页内容呢?主要有以下特点: 的内容, 容易被众多,的过程中一般都会给这个页面加有, 所以这个页面可以获得较好的评分, 排名自然会好;内容丰富: 丰富的内容会让搜索引擎收录许多内容,各个页面之间的互相 有利于其提高各个页面的在 搜索引擎中的评 第 11 页 共57 页ucweb SEO 规范分; 用文本来表现内容 :内 容要用合理的文本描述出来 ,不 要用图片和 flash描述网页内容。2.6密度和位置2.6.1密度的

22、重要性关键字密度是许多搜索引擎,包括占 baidu、yahoo 和 msn 搜索 算法之一。 每个搜索引擎都有一套关于关键字密度的不同的数学公式, 关键字密度可使你获得较高的排名位置,千万记住,并不是密度越大越好,不同的搜索引擎之间也存在不同的容许级别。 般密度标准: 2% 密度 8% 检测工具:2.6.2 什么是密度?关键字密度就是你所强调的关键字或 在网页中出现的次数与网页中其它文本内容的比例。举例说明:<html><head><title>Keyword 1 , keyword 2 . keyword 3 </ title><meta

23、 name=” keywork” contend=” Keyword 1 , keyword 2 . keyword 3 ” ><meta name=” description” contend=” Keyword 1 and keyword 2 ”</ head>第 12 页 共57 页ucweb SEO 规范<body>Keyword 1 and keyword 2 , keyword 3 and so on!</ body></ html>在这个页面中, 除去 html 代码, 文本内容为:“ Keyword 1 , keywo

24、rd 2 , keyword 3 ”“ Keyword 1 , keyword 2 , keyword 3 ”“ Keyword 1 and keyword 2 ”“ Keyword 1 and keyword 2 , keyword 3 and so on” 共是 16 个单词, Keyword 1 出现的次数是 4 次 ,那么 Keyword1 在该 网页中的关键密度为: 4/16=25% 2.6.3密度在那个区间比较合理呢? 般认为,密度在 2 % 8 % 左右为适宜, 不要刻意追求关键字的堆积, 否则触发关键字堆砌过滤器( keyword stuffing filter ), 会被处罚

25、的后果。2.6.4如何在网页中那些位置突出?出现的位置也是非常重要的因素,哪些位置出现 有利于排名呢?l )、 网页标题 title 中这是最重要的因 一、如果你要用某个网页排某一个 ,一定要在网页标题 title 中出现这个。2) 、 meta 第 13 页 共57 页ucweb SEO 规范meta合理的突出, 不过要注意不要过密。3 )、 网页内容的大标题中网页内容的大标题一般都和网页的 tit 1 e 标题差不多, 这里面也要合理的突出关键 。4 )、 网页文本 网页文本内容出现的时候,要合理的突出,一般都用加重<B>来突 出。 5 )、 图片注释网页中出现的图片, 都可以

26、加上文本注释, 具体语法如下: 般网页中 张图片在 html 的代码<IMG height= 70 width 187 src="images/web136_1ogo.gif"> 可以将图片加上注释, 如下:<IMG height= 70 width= 187 src=" images/ web 136 _ 1 ogo. gif" a 1 t= “ 关键词”> Alt 注释一定简洁明了, 千万不要写的太过冗长, 这样会被一些搜索引擎 当作来对待的.6 )、 超注释tit 1 e=" 注释文本"不加注释的代码:&

27、lt;a href "" >文本</ a>加注释后的代码:<a href "" tit 1 e=" 包含有的描述”> 文本</a> 第 14 页 共57 页ucweb SEO 规范2.7 反向2.7.1 什么是反向?反向是指 A 网页上有一个指向 B 页 ,那 么 A 页就是 B 页的反向。查看一个的反向可以用站长工具查看, 也可以直接用搜索引擎语法进行查看。 2.7.2 如何查看反向?: 查看 的反向, 只需要在 Goog 1 e 种输入以下语句搜索就可以看到结果:Link:Baidu: 查看方法do

28、main:但 baidu 的 domain 语法查看结果目前还确 ,国 内查看反链的工具可以查看出一部分反链。 如2.7.3 反向的哪些因素影响的排名?反向 的数量 个网页反向的数量越多, 说明这个网页的内容被的越多, 被关注的越多。 所以反向的数量越多越高.反向 的质量 如果一个网页被一个权威指向了一个, 那么这个权威的一个的第 15 页 共57 页ucweb SEO 规范就是一个高质量的。 这条因素非常的人性化, 和现实生活中的一些是对应的。 比如:比如你有一个。 对于这个而言, 如果有一个权威说它好。 可能胜过 10 个普通人说它好。你的网页就如, 权威犹如权威。反向 的文本 反向的文本

29、中,一定要包含,比如这个你想提高在搜 索“ 搜索引擎排名” 结果中的排名, 那么你在做反向的时候最好用“ 搜索引擎排名“ 这个词作为超文本, 即:<a href= "" > 搜索引擎排名</a> 2.8PageRank 值pagerank 简称 pr 值 , 是基于【从许多优质的网页 过来的网页, 必定还是优质网页】 的回归关系, 来判定所有网页的重要性。pagerank, 有效地利用了 Web 所拥有的庞大构造的特性。 从网页 A 向网 页 B 的被看作是对页面 A 对页面 B 的支持投票,根据这个投票数来页面的重要性。不单单只看投票数( 即数),

30、对投票的页面也进行分析 。【 重要性】高的页面所投的票的评价会更高,因为接受这个投票页面会被理解为【 重要的物品 】。根据这样的分析, 得到了高评价的重要页面会被给予较高的 page rank ( 网页 等级), 在检索结果内的名次也会提高。 page rank 是中表示网页重要性的综合性指标, 而且受到各种检索( 引擎) 的影响。 倒不如说, pagerank 就是基于对" 使用复杂的算法而得到的构造" 的分析 ,从 而得出的各网页本身的特性。当然, 重要性高的页面如果和检索词句没有关联同样也没有任何意义。 为此使用了精练后的文本匹配技术 ,使 得能够检索出重要而且正确的

31、页面。第 16 页 共57 页ucweb SEO 规范通过下面的图我们来具体地看一下刚才所阐述的算法。 具体的算法是, 将某个页面的 Page Rank 除以存在于这个页面的 正向 , 由此得到的值分别和正向所指向的页面的Page Rank 相加, 即得到了被的页面的Page Rank。图让我们详细地看一下。 提高Page Rank 的要点, 大致有3 个.反向 数 ( 单纯的意义上的受欢迎度指标)反向 是否来自推荐度高的页面( 有根据的受欢迎指标)反向 源页面的数( 被选中的几率指标)首先最基本的是, 被许多页面会使得推荐度提高。 也就是说( 被许多页 面的) 受欢迎的页面, 必定是优质的页

32、面。 所以以 反向数作为受欢迎度的一个指标是很自然的想法。 这是因为, “” 是一种被看作的推荐第 17 页 共57 页ucweb SEO 规范行为。 但是, 值得骄傲的是 Page Rank 的思考方法并没有停留在这个地方。也就是说, 不仅仅是通过 反向数的多少, 还给推荐度较高页面的反向链接以较高的评价。 同时, 对来自总数少页面的给予较高的评价, 而来自总数多的页面的给予较低的评价。 换句话说( 汇集着许多推荐的) 好的页面所推荐的页面, 必定也是同样好的页面和 与感觉在被胡乱的相比,被少数挑选出的 肯定是优质的 这两种 同时进行着。 一方面, 来自他人高水平网页的正规将会被明确重视,

33、另一方面,来自张贴有完全没有关联性的类似于书签的网页的会 几乎没有什么价值( 虽然比起不被来说好一些) 被轻视。因此, 如果从类似于 yahoo! 那样的 Page Rank 非常高的站点被的话, 仅此网页的 Page Rank 也会一下子上升;相反地,无论有多少反向数,如果全都是从那些没有多大意义的页面过来的话 ,PageRank 也轻易上升。不仅是 yahoo!, 在某个领域中可以被称为是威的( 或者说固定的) 页面来 的反向是非常有益的。 但是, 只是一个劲地在 些同伴之间制作的,比如像 单纯的内部照顾 这样的做法很难看出有什么价值。也就是说,从注目于全世界所有网页的视点来( 你的网页)

34、 是否真正具有价值。综合性地分析这些指标, 最终形成了将评价较高的页面显示在检索结果的相对靠前处的搜索结构。以往的做法只是单纯地使用反向数来评价页面的重要性 ,但 Page Rank 所采用方式的优点是能够不受机械生成的的影响。 也就是说, 为了提高Page Rank 需要有优质页面的反向。 譬如如果委托 yahoo 登陆的网站,就会使得 Page Rank 骤然上升。但是为此必须致力于制作( 网页的) 充实的 内容。这样一来,就使得基本上没有提高 Page Rank 的近路( 或后门)。不只限于 Page Rank ( Clever 和 HITS 等也同样), 在利用构造的排序系统中, 以前

35、单纯的 SPAM 手法将不再通用。 这是最大的一个优点, 也是 Goog 1 e 方便于 使用的最大理由。( 虽然是最大的理由, 但并不是唯一的理由。)在这里请注意, Page Rank 自身是由 Goog1e 定量, 而与用户检索内容的表达式完全无关。就像后边即将阐述的一样,检索语句呈现在 Page Rank第 18 页 共57 页ucweb SEO 规范的计算式上。 不管得到多少的检索语句, Page Rank 也是一定的、 文件固有的评分量。Page Rank 的定性说明大致就是这样一些。 但是, 为了实际计算排列次序、 比较等级, 需要更定量性的讨论。 以下一章将做详细的说明。搜索引擎

36、都有的“ 搜索 人” ( robots ), 并通过这些 RB0TS 在网络 上沿着网页上的( 一般是 http 和 src)不断抓取资料建立的数据库。 对于管理者和内容提供者来说,有时候会有一些站点内容,不希望被 RB0TS 抓取而公开 。为 了解决这个问题, RB 0 TS 开发界提供了两个办法: 个是 robots. txt, 另一个是 Robots META。2.9Robots.txt 和 Robots meta2.9.1 什么是 robots.txt?robots. txt 是一个纯文本文件, 通过在这个文件中该中不想被robots 的部分, 这样, 该的部分或全部内容就可以不被搜索

37、引擎收录了, 或者指定搜索引擎只收录指定的内容。当一个搜索 人一个站点时,它会首先检查该站点根目录下是否存在 robots. txt, 如果找到, 搜索人就会按照该文件中的内容来确定访问的范围, 如果该文件不存在, 那么搜索人就沿着抓取。robots. txt 必须放置在一个站点的根目录下 ,而 且文件名必须全部小写。第 19 页 共57 页URL 相应的 robot. txt 的 URL W 3 . org/W 3 . org/ robot. txtucweb SEO 规范2.9.2robots.txt 的语法" robots. txt" 文件包含一条或的, 这些通过空行

38、( 以CR, CR/ NL, or NL 作为结束符 ), 每一条的格式如下所示:“ <field>: <optionalspace><value><optionalspace>”在该文件中可以使用# 进行注解, 具体使用方法和 UNIX 中的惯例一样。该 文 件 中 的通 常 以 一 行 或 者 多 行 user agent 开 始 , 后 面 加 上 若 干disallow 行, 详细情况如下:User- agent:该项的值用于描述搜索引擎 robot 的名字, 在" robots. txt" 文件中, 如果有多条 Us

39、er- agent说明有多个 robot 会受到该协议的限制 ,对 该文件来说, 至少要有一条 User- agent。 如果该项的值设为*, 则该协议对任何人均有效, 在" robots. txt" 文件中, "User- agent: *" 这样的只能有一条。Disallow:该项的值用于描述不希望被到的一个 URL, 这个 URL 可以是一条完整的路径 ,也 可以是部分的 ,任 何以 Disa 11 ow 开头的均被 robot到。 例如"Disa 11 ow :/ He 1 p. html" 对/ he 1 p. htm 1

40、和/ he 1 p/ index. htm 1 都不搜索引擎, 而" Disa 11 ow: / he 1 p/" 则robot/ he 1 p. htm 1 , 而不能/he1p/index.htm1 。任何一条 Disa 11 ow为空,说明该的所有部分都被,在" robots. txt" 文件中, 至少要有一条 Disa 11 ow。 如果"/ robots. txt" 是 个空文件, 则对于所有的搜索引擎 robot, 该都是开放的。2.9.3robots.txt 基本的用法下面是一些 robots. txt 基本的用法第 2

41、0 页 共57 页ucweb SEO 规范所有搜索引擎的:User agent: *Disallow: 所有的 robot User agent: *Disallow:或者也可以建一个空文件” robots. txt” file所有搜索引擎的几个部 分( 下例中的 cgi- bin 、t mp 、p rivate目录)User- agent: *Disallow: / cgi- bin/ Disallow:/ tmp/Disallow:/ private/某个搜索引擎的( 下例中的 Bad Bot)User- agent: Bad BotDisallow:/只某个搜索引擎的( 下例中的 Web

42、 Crawler)User- agent: Web CrawlerDisallow:User- agent:* Disallow:/第 21 页 共57 页ucweb SEO 规范常见搜索引擎人Robots 名字 2.9.4robots.txt 举例下面是一些著名站点的robots. txt:2.9.5 常见 robots.txt 错误颠倒了顺序:错误写成第 22 页 共57 页名称 搜索引擎BaiduspiderScooterIa_archiverbotFAST- Web CrawlerSlurpMSNBOTSearch. msn. comucweb SEO 规范User- agent:*

43、Disallow:Bot正确的应该是:User- agent:BotDisallow: *把多个命令放在一行中:例如, 错误地写成Disa 11 ow: / css/ / cgi- bin/ images/正确的应该是Disallow:/ css/Disallow:/ cgi- bin/ Disallow:/ images/行前有大量空格例如写成Disallow:/cgi- bin/ 尽管在标准没有谈到这个, 但是这种方式很容易出问题。404 重定向到另外一- 个页面:当 Robot 很多没有设置 robots. txt 文件的站点时 ,会 被自动404 重定向到另外一个 Htm1 页面。 这

44、时 Robot 常常会以处理 robots.txt 文件的方式处理这个 Htm1 页面文件。虽然一般这样没有什么问题,但是最好能放一个空白的 robots. txt 文件在站点根目录下。采用大写。 例如USER- AGENT: EXCITE第 23 页 共57 页ucweb SEO 规范DISALLOW:虽然标准是没有大小写的, 但是目录和文件名应该小写:User- agent:botDisallow:语法中只有 Disallow, 没有 Allow!错误的写法是:User- agent: BaiduspiderDisallow:/ john/Allow:/ jane/忘记了斜杠/错误的写做:

45、User- agent: BaiduspiderDisallow: css正确的应该是User- agent: BaiduspiderDisallow:/ css/Baidu 方面有介绍 robots. txt 文件的准确性的说明:2.9.6Robots METARobots. txt 文件主要是限制整个站点或者目录的搜索引擎情况, 而Robots META则主要是 个个具体的页面。 和其他的 META (如 使用的语言、页面的描述、 等)一样, Robots META也是放在页 第 24 页 共57 页ucweb SEO 规范面的<head></ head>中,专门用

46、来告诉搜索引擎 RB 0 TS 如何抓取该页的内容。Robots META中没有大小写之分, name=” Robots” 表示所有的搜索引擎, 可以某个具体搜索引擎写为 name=” Baidu Spider” 。 content 部分有四个指令选项: index、noindex、fo 11 ow、nofo 11 ow, 指令间以” ,” 分隔。 INDEX 指令告诉搜索人抓取该页面;FOLLOW 指令表示搜索人可以沿着该页面上的继续抓取下去;Robots Mete的缺省值是 INDEX 和 FOLLOW,只有 inktomi 除外,对于它, 缺省值是 INDEX, NOFOLLOW这样,

47、一共有四种组合:<METENAME=” ROBOTS”CONTENT=” INDEX, FOLLOW” ><METENAME=” ROBOTS”CONTENT=” NOINDEX, FOLLOW” ><METENAME=” ROBOTS”CONTENT=” INDEX, NOFOLLOW” ><METENAME=” ROBOTS”CONTENT=” NOINDEX, NOFOLLOW” >其中 <METENAME=” ROBOTS”CONTENT=” INDEX, FOLLOW” > 可以写成 <METENAME=” ROBOT

48、S”CONTENT=” ALL” ><METENAME=” ROBOTS”CONTENT=” INDEX, NOFOLLOW” > 可以写成<METENAME=” ROBOTS”CONTENT=” NONE” >需要注意的是: 上述的 robots.txt 和 Robots META限制搜索引擎机器人( ROBOTS)抓取站点内容的办法只是一种规则,需要搜索引擎人的配合才行, 并不是每个 ROBOTS 都遵守的。目前看来,绝大多数的搜索引擎人都遵守 robots. txt 的规则,而对第 25 页共57 页ucweb SEO 规范于 Robots META, 目前

49、支持的并不多, 但是正在逐渐增加, 如著名搜索引擎 就完全支持, 而且还增加了一个指令“ achive” ,可以 限制 是否保留网页快照。 例如:<METANAME=”bot” CONTENT=index, fo 11 ow, noarchive" >表示抓取该站点中页面并沿着页面中抓取, 但是不在上保 留该页面的网页快照。三.SEO 注意事项3.1 框架网页1 、 什么是框架网页? 框架曾经一度很受欢迎,现在是大不如前了。一个基于框架的 , 从览器窗口看是被分为两个或者的框架,每个框架是一个web 页面。如图:使用框架会导致许多麻烦。有许多浏览器并不能很好的处理框架,

50、事实上, 许多能兼容框架的浏览器并不能真正兼容, 往往在载入框架的时候力不从心了。 另外, 许多设计者使用框架并没有进行充分的测试。 他们设计第 26 页 共57 页ucweb SEO 规范是在高分辨率下进行的, 没有, 这样的结果是导致低分辨率的用户是无法使用的。2 、 站在搜索引擎的角度看,框架会引起下面的问题: 一些搜索引擎在理解框架定义的时候会犯迷糊和难以分辨框架定义的页面和当前实际页。即使搜索引擎索引了页面,它也不是按照框架的定义那样,在框架中定义的页面属于框架, 而是将框架中定义的页面是的页面加以索引。在下面的情况下你可能会遇到麻烦,你发现不能指向具有细节内容的页面: 1 、有活动

51、的时候,别的只能进入到你的前台页面,而不能进入你具有细节内容的页面。2 、如果你了点击的,那实在是不幸,你的客户不能直接进入你有详细介绍的页面。3 、 如果你的加入了购物类的地址目录列表, 在这种情况下,会遇到同样的问题。4 、 按照 web 标准, 一个网页唯一对应一个 URL 地址, 而框架应用中,往往是一个 URL 地址对应多个框架。 这种情况下, 搜索引擎就无所适从了。5 、 Goog 1 e 等搜索引擎在处理框架时,是把请求返回的页面从框架中剥离出来。3 框架 下面是框架定义举例:<html><head>第 27 页 共57 页ucweb SEO 规范<

52、/ head><frameset rows=” 110 ,* ><frame src=” nacbar. htm” ></ frame src=” main. htm” ></ frameset></ html>这段代码描述了怎样创建框架。它告诉浏览器创建两行,即两个框架,其中位于顶端的框架行高为 110 象素; 另外, 处于下方的框架行高为浏览器所能定义的余下的象素, 用 *" 表示。 并且定义将" navbar. htm" 放在位于上面的框架中; main. htm 在位于下方的框架中。许多大型

53、的搜索引擎能够通过这个框架找到通往 navbar. htm 和main. htm 文件的路径, 比如 Goog 1 e。 但是, 一些比较老一点的系统就不能正常显示了。但是,即使页面被 的索引,被用来指向内部框架的页面是被作为独立的页面显示的, 这并不是设计者所希望显示的那样, 但是, 我们可以作些 如下的改进:在框架定义的时候提供必要的信息供搜索引擎索引。确保所有的搜索引擎能够找到路径通向主站点。确保页面以正确的框架设置显示。为搜索引擎提供必要的索引信息 我们首先要做到的事情是,在定义框架的页面代码中加入供搜索引擎索引的信息。首先, 加一个 tit1e 和 meta , 像这样:<Html>第 28

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论