版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、讲师:郝文荣,一、SEO是个什么鬼?,汉译为搜索引擎优化。 SEO是一种利用搜索引擎的搜索规则来提高目标网站在搜索引擎内的自然排名的技术。 简单理解: SEO是对网站的优化,使网站符合搜索引擎的喜好,从而给网站一个好的排名的技术。,SEO,认识搜索引擎,国内搜索引擎市场份额,本套教程以百度为研究对象,认识百度搜索结果页,万事不决问百度,网站建设,认识搜索结果页,认识搜索结果页,一、SEO是个什么鬼?,简而言之: SEO是一种通过搜索引擎给网站免费带来客户的技术。,SEO,为什么做SEO,搜索引擎客户转化率高,1,性价比高,2,长期有效,3,搜索引擎的用户是主动寻找网站上的产品,目的比较明确,转
2、化率高。,当站长掌握SEO技术时,SEO可以说是免费的。,SEO只要不作弊,排名一旦上去,可以维持相当长的时间,流量源源不断。,“58同城”收购“赶集”竟然是因为他!,陈晓华“SEO骨灰级高手”。2007年6月,陈晓华入职赶集网,负责SEO。用半年时间让赶集网的流量从10万提升到40万,远远超过58同城。这件事引起了姚劲波的注意,并下定决心要把陈晓华挖到58同城。 陈晓华到了58同城后采用人海战术,投入之前三四倍的人力,用8个月的时间将58同城的流量从20万突破到100万,这不仅拉大了58同城和赶集网的差距,还改变了58同城的地位58同城在此之前只能算是小网站,经过用SEO导入流量后,奠定了行
3、业领先地位。 如今,58同城成为国内生活分类网站的代表,用户每天上传的信息达数百万条,月独立用户数突破4亿。SEO给58同城带来了持续的业务和流量增长。 陈晓华(58同城CSO首席战略官),“58同城”和“赶集”不为人知的恩怨情仇,学SEO能做什么,个人站长,1,SEO培训,2,SEO服务,3,企业上班,4,SEO培训非常火,潭州学院、达内、北大青鸟,都有专门的seo培训课程,成立个人工作室,为企业提供SEO服务,网络营销策划,从SEO专员做起,以陈晓华为偶像,以CSO为目标,如何做SEO,SEO,站内优化,站外优化,怎么做SEO站内优化,站内优化,七、404页面,怎么做SEO站外优化,站外优
4、化,外,链,质量,数量,SEOER常用工具-百度指数,探索关键词背后的秘密,网民的搜索意图,关键词的搜索指数,百度指数,太阳的后裔、宋仲基是什么时候火的,宋仲基、太阳的后裔到底有多火,宋仲基的需求图谱,如何利用宋仲基赚钱-推广化妆品,Seoer必备技能-了解网络热点事件,SEOER具备的技能-做一个标题党,利用诱惑式标题来做软文推广的人们,我们称其为“标题党”。因为其标题有很强的诱惑力,让人看了就忍不住的想点击看看里面的内容,因此这类文章的点击率很高,传播效果也很好。 如果用户看了标题,根本没有点击的欲望,那内容写的再好也是徒劳。,那些年我们曾被忽悠的标题,沙滩美女走光图,1,美女真的走光了,
5、好好工作吧,别乱想了,那些年我们曾被忽悠的标题,实情:有对白头鹎(bi,一种鸟)在一居民楼阳台筑巢、生子、哺养,市民看到后,用相机拍下来了。,那对情侣在阳台做了什么?全程被房东偷拍,白头鹎居民家中筑巢,那些年我们曾被忽悠的标题,实情:韩国女团最新的mv,韩女团禁播mv,韩女团最新mv,那些年我们曾被忽悠的标题,拿什么来唤醒你啊,我的爱人 沉睡的少女啊!痴心等待终遇有情郎! 一根纺针引发悲剧,痴情哥哥披荆斩棘唤醒妹妹 安然入睡的容顔,是百年不变的等待 百年不变的守候,只为你那淡定的一吻!,小结,看一个人漂不漂亮,要看她的脸,而看一个人的脸,最重要的是看她的眼睛。一篇软文好看不好看,首先我们看的就
6、是标题,标题有没有吸引力,能不能抓住读者的眼球至关重要,标题没有吸引力,就没有点击率。所以标题的撰写是软文写作至关重要的一个环节,也是seoer必须具备的能力。,SEO的发展史,SEO的发展史:,SEO 1.0 大约是1995-1998年,内容为王的时代; SEO 2.0 大约是1999-2010年,外链为皇的时代; SEO 3.0 大约是2011-?年,用户是上帝的时代; SEO 3.0S刚开始? ,SEO 1.0,1995-1998年,排名依据是网站的内容匹配,搜索引擎蜘蛛识别能力较弱,是否有内容成了排名的主要因素之一。 排名的规则更加注重于页面关键词密度、title、keyword、de
7、scription等因素。 这个时候无数站长都在疯狂大量的在页面里堆积关键词,光是meta keyword标签都要写上好几百关键词。 在SEO1.0时代更加注重的是网站的内容,认为内容相关度越高的页面就越应该靠前展示给用户。简而言之就是SEO1.0时代,内容为王。 出现的弊端,网站站长在页面大量重复堆积关键词,很多网站没有实际内容排名也不错,导致用户体验不好。,SEO 2.0,是1999-2010年,排名依据是站内优化,站外优化。 同时搜素结果的地区性差异,以及多媒体结果的出现(搜索结果中出现图片等结果)。 网站是否有高的权重,是否有高质量的内容成了排名的主要因素。 搜索引擎算法改进,页面的想
8、要排名靠前更加注重内链结构以及高质量外部链接的导入。 所以这个时候的站长每天都忙碌着发外链、发外链、发外链,甚至有些公司在招聘SEO人员的时候,都只是叫做外链专员,他们认为只要外链做好了,SEO也就成功了。 虽然这种观点是错误的,可是也在某种程度反映出SEO2.0时代的特点 从搜索引擎的角度出发,在SEO2.0时代,以链接投票的方式,通过获得票数的多少来决定页面排名顺序。 SEO2.0时代,外链为皇。,SEO 3.0,是2011-至今, 是否满足用户的需求, 是否有高的权重, 是否有好的内容 成了排名的主要因素。 产品设计优化、用户满意度优化、资源整合优化在此阶段显得尤为重要。 SEO的英文定
9、义也可从Search Engine Optimization演变为Searcher Experience 【ksprins】 Optimization,中文翻译为搜索体验优化。搜索引擎越来越人性化,搜索引擎考虑的是为搜索者提供高质量的用户体验。,什么是搜索引擎?,官方定义: 搜索引擎是指:根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。 我的理解是: 可以帮助用户从互联网繁杂的信息中找到他需要的信息的工具。,搜索引擎的工作原理,百度在很短的时间0.04秒内找到了49,100,000个结果 我们复制一下关
10、键词重新搜索发现这回只用了0.001秒。 它是怎么做到的?,它是怎么做到的?,1、是百度在0.04秒的时间内从互联网中抓去了所有的内容? 2、是百度提前就已经抓好了内容,然后从自己的数据库中调去的? 答案: 搜索引擎平时就已经开始在互联网中抓取网页信息并建立自己的网页数据库。当网民搜索的时候,百度会直接从数据库中调去数据经过处理后呈现在网民面前。 注意:为什么第二次用的时间只有0.001秒比第一次还快? 答:百度在处理网民搜索信息时,先从本地浏览器缓存中寻找网民以前是否搜索过相关信息,如果有就从缓存中调取,如果没有再从百度数据库中调去。,搜索引擎的工作三阶段,搜索引擎的工作过程分三个阶段: 第
11、一阶段: 爬行和抓取 第二阶段: 预处理 第三阶段: 排名,阶段一:爬行和抓取,爬行和抓取是搜索引擎工作的第一步,完成数据收集任务。 1、蜘蛛 搜索引擎用来爬行和访问页面的承训被称为蜘蛛(spider)或机器人(bot) 搜索引擎蜘蛛访问网站页面时类似于普通用户使用的浏览器。蜘蛛发出页面访问请求后,服务器返回HTML代码,蜘蛛程序把收到的代码存入原始页面数据库。搜索引擎为了提高爬行和抓取的速度,都使用多个蜘蛛并发分布爬行。,阶段二:预处理,搜索引擎蜘蛛抓取的原始页面,并不能直接用户查询排名处理,因为搜索引擎数据库中的页面数都是数万亿级别以上的,用户输入搜索词后,靠排名程序立即对这么多页面进行分
12、析排序工作量太大,不可能在一两秒内返回排名结果。因此抓取过来的页面必须经过预处理,为最后查询排名做准备。 在索引之前有五个工作需要做 (1)提取文字;(2)中文分词;(3)去停止词; (4)去除噪声;(5)去重(读chong),(1)提取文字: 蜘蛛抓取的是全部HTML代码,这里面其实包含:文字,HTML格式标签,javascript程序! 但是HTML格式标签、javascript程序是无法参与到排名内容中来的,提取文字的过程就是从HTML代码中取出标签和程序提取出可以用于排名处理的页面文字内容! 注意:搜索引擎除了提取出可见的文字外,还可以提出以下不可见的文字内容;比如:METa标签中的文
13、字内容,图片 ALT属性文字,链接锚文字等!,(2)中文分词 英文:单词之间有空格作为天然分隔,因此不需要进行切词。 中文:字和字没有之间没有分隔符,一个句子中的词都是连在一起的!所以,这时候搜索引擎就必须先分辨一下哪几个字组成一个词,哪几个字本身就是一个词! 比如:“波司登羽绒服”就将其分为“波司登”和“羽绒服”两个词;,(3)去停止词 什么是停止词?就是在页面中出现次数比较多的,对内容没有实质性影响的那些词;比如:“的”,“得”“地”这些助词,“啊”“哈”“呀”等感叹词,“从而”“以”“却”等副词或者介词,这些词就被称之为停止词!英文里有:the,a,an,to,of等等 搜索引擎去停止词
14、主要有两个目的: 一个是:使索引数据主题更为突出,减少无谓的计算量; 另一个是:检测你的网站内容是否和数据库中其他的内容大量的重复。 在这里需要提醒各位的是:以后不要随便在网上复制一篇文章加上几个停止词就粘到自己的网站上去了,学完上边的,你应该懂什么意思了!,(4)去除噪声: 绝大部分页面上有一部分内容对页面主题没有任何贡献,比如版权声明文字、导航条、广告等。这些区块都属于噪声,对于页面主题只能起到分散作用。 搜索引擎需要识别并消除这些噪声,排名是不使用噪声内容。消噪的方法是根据HTML标签对页面分块,区分出页头、导航、正文、页脚、广告等区域,在网站上大量重复出现的区块往往属于噪声。对页面进行
15、消噪后,剩下的才是页面的主体内容。,(5)去重(chong) 一篇同样的文章出现在不同的网站上,搜索引擎就会认为它是一个文件,它并不喜欢这样的重复内容,在进行索引之前就需要对这些内容进行识别和删除重复的内容,就叫“去重”! 搜索引擎如何去重!技术我们不需要掌握,但是我们得注意几个关键点: A:简单的增加“的”“地”“得”,是很容易的被识别的,一定要慎重使用! B:复制别人的文章,简单的交换一下段落结构!这种伪原创也一定要慎重使用! 这是因为:这样的操作无法改变文章的特定关键词,上面的那些做法始终逃不过搜索引擎的去重算法。,经过上面的五个步骤后,搜索引擎就能得到独特的,能反映页面主要内容的,以词
16、为单位的内容。 把每一个网站页面都转化为一个关键词组成的集合!同时记录下每一个关键词在该页面上出现的频率、次数、格式(比如:标题标签、黑体、H标签、锚文本等)位置(第几段),这些都已权重的形式记录在下来!然后放到一个地方,这个地方就是专门放置这些组合词的词表结构索引库! (6)正向索引: 每一个文件夹都对应一个ID,文件内容被表示为一串关键词的集合!这样的数据结构叫正向索引!,倒排索引,(7)倒排索引 在倒排索引中关键词变成了主键,每个关键词对应一系列文件,每一个文件都出现了要搜索的关键词,这样用户在搜索某一个关键词的的时候,排序程序就能在倒排列表中找到这个关键词对应的文件! 详细请看图: 关
17、键词,排名,初始子集确定后需要对子集中的页面内容进行相关性计算,链接权重计算、用户点击行为计算,从而确定页面的排名。 影响排名的因素主要有以下几个方面 一、页面内容相关性 二、链接权重 三、用户行为,一、页面相关性 是指页面内容与用户所查询的关键词在意义上的接近程度,主要由关键词匹配度、关键词密度、关键词分布及关键词的权重标签等决定。 (1)关键词匹配度 关键词匹配度是指页面中的内容与用户所查询的关键词之间的匹配程度,主要由两个因素决定: 页面内容中是否包含关键词。 关键词在页面中出现了多少次,即页面中有多少个关键词。,(2)关键词密度 为了有效防止网站所有者恶意操控搜索结果,搜索引擎根据关键
18、词词频与网页总词汇量的比例(即关键词密度值)来衡量页面中某关键词的词频是否合理。 (3)关键词分布 关键词分布即关键词在页面中出现的位置。关键词在页面中不同位置上出现会对页面的相关性带来一定的影响。 左上-右上-左-右-左下-右下 关键词从左向右相关性一次递减,(4)关键词的权重标签 在网页,网页制作者利用不同的HTML标签使页面中相关的内容实现不同的视觉效果(如字体的样式、字号、颜色等),灵活地运用各种HTML标签还有助于提高页面相关性。 在页面权重分配里,按照标签在作用,可以把HTML标签分为“权重标签”与“非权重标签”两大类。权重标签是指会影响页面权重的标签,常见的权重标签包括、等;而非
19、权重标签常见的有、等。 假设下表中是搜索引擎对某些标签权重值的定义,则对于一个内容是“搜索引擎优化”的页面,针对“搜索引擎优化”这个关键词,标签权重值= 标签权重值+标签权重值,即60。,页面相关性总结: 页面相关性=关键词匹配值+关键词密度值+关键词分布值+标签权重值,二、链接权重 链接主要分为内部链接和外部链接两种 某一页面得到的链接越多,从一定程度上反映了该页面越重要,链接权重值就越高。 绝大部分网页都会有一个“入度”与“出度”,根据网页的入度数量及提供入度的页面权重值来计算页面链接的权重(导入链接的数量和导入链接的质量) 导入链接的质量:取决于源页面(链接所在的页面)的权重,假设图是页面之间的关系图,其中V1、V2、V3为网页,箭头方向代表页面贡献链接或从其他页面中得到的链接。以网页V2为例,V2对V1、V3各贡献了一个链接,而得到了V1的链接。,三、用户行为 搜索引擎在完
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 尊重劳动人工智能助力产业升级
- 健康宣教执行方案
- 乐动AI智能平台
- 电动化电工就业新机遇
- 特殊场所消防安全规范
- 未来职业发展规划方案
- 2026年省考资料分析模拟题集
- AI在音乐表演中的应用
- AI在动物药学中的应用
- 高考复习知识点基础题-城市与城市化
- 2026-2030中国城市规划建设行业市场深度调研及发展趋势与投资前景研究报告
- 第13课 每个人都有梦想 课件(内嵌视频)2025-2026学年道德与法治二年级下册统编版
- 2025年国企合同管理岗笔试题及答案
- 中小学内部控制轮岗制度
- 智能经济驱动经济新态
- 2025年辽宁朝阳市以八年级地生会考题库及答案
- L13J12 无障碍设施参考图集
- 2026广西南宁市青少年活动中心招聘12355青少年服务台工作人员4人考试备考试题及答案解析
- 青岛市市南区2025-2026学年第二学期五年级语文期末考试卷(部编版含答案)
- 水利水电工程单元工程施工质量检验表与验收表(SLT631.5-2025)
- 社区商业中心招商策划书
评论
0/150
提交评论