网站点击次数的正态分析方法介绍_第1页
网站点击次数的正态分析方法介绍_第2页
网站点击次数的正态分析方法介绍_第3页
网站点击次数的正态分析方法介绍_第4页
网站点击次数的正态分析方法介绍_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、论网站点点击次数数的正态态分析方方法奚回 (单位位略 陕西 西安 71100668)李兴波 (保保定金融融高等专专科学校校 河河北 保保定 07110000)(特别说说明:本本文是作作者为了了学习实实证分析析方法而而刻意研研究的一一个问题题,实用用意义可可能不大大,练笔笔而已,敬请各各位专家家批评指指正。)摘要:现现行的网网站点击击次数分分析方法法有明显显的缺陷陷,其根根源在于于没有对对点击次次数作随随机变量量考察。本文作作了这种种考察,并验证证了它服服从正态态分布。正态分分布的参参数可以以帮助网网站分析析其发展展状况、与同业业比较、制定科科学的管管理目标标、考核核员工等等多种分分析目的的。这

2、种种以正态态分布为为基础的的分析方方法,本本文暂称称为网站站点击次次数的正正态分析析方法。关键词:点击次次数;分分析方法法;正态态分布;参数一、网站站点击次次数现行行分析指指标的缺缺陷和本本文问题题的提出出随着我国国经济社社会的发发展,计计算机网网络的应应用已越越来越普普及,并并发挥着着越来越越重要的的媒介作作用,因因此,如如何管理理网络也也变得越越来越重重要。对一个网网站来讲讲,点击击次数(本文的的分析方方法,也也适用于于其他类类似于点点击次数数的现象象,如“某论坛坛某天发发表的文文章数”)的高高低直接接影响着着其经营营目标的的实现程程度,所所以各网网站总是是极尽所所能地提提高其点点击次数数

3、,并引引入了一一些与点点击次数数有关的的分析指指标,如如最高点点击次数数、点击击次数的的不同期期比较、点击次次数的时时间序列列变化、一定期期间点击击次数的的平均值值等11。同时,对于点点击次数数及其他他网络流流量信息息重要性性的关注注也催生生了商业业性分析析软件的的应用,如ITTSUNN网站流流量统计计分析系系统22。虽然这这些指标标(含分分析软件件所用指指标)能能够在一一定程度度上反映映网站的的管理状状况,但但是就对对于点击击次数的的分析程程度来讲讲,仍存存在着明明显的缺缺陷。主主要表现现在:1、网站站的访问问者主要要是网站站无法控控制的客客户,所所以点击击次数是是随机变变量,上上下变动动频

4、繁,这使现现行分析析指标的的直接根根据点击击次数绘绘制的时时间序列列图波动动剧烈、趋势弱弱。虽然然我们可可以作回回归分析析来反映映总体趋趋势,但但回归直直线和曲曲线的代代表性都都很差,如图11所示回回归直线线的R22仅为00.07713,回归曲曲线的RR2仅为00.1。而且回回归线也也不能提提供更为为详细的的变动信信息。图1是根根据“晋城在在线”网站220055年7月月1日至至12月月31日日的点击击次数绘绘制的时时间序列列图和回回归线图图,它说说明了此此缺陷的的存在:2、最高高点击次次数是极极端值,价值有有限。3、各网网站客观观上需要要能够在在同业间间相互比比较的标标准指标标。4、考察察点击

5、次次数出现现在某个个区间的的概率(或频率率)有助助于网站站制定科科学的管管理目标标和考核核标准。但现行行的分析析方法没没有涉及及此分析析角度。5、点击击次数存存在“周周期期性”,即点点击次数数以一周周为一个个周期上上下波动动。图2是晋晋城在线线两周的的点击次次数时间间序列图图,它直直观地说说明了其其点击次次数存在在周周期期性:点击次数数存在周周周期性性的原因因,可能能是因为为大部分分用户访访问网站站的时间间受其工工作时间间的周周周期性的的影响。这种周周周期性性会影响响现行考考核分析析指标结结果的正正确性或或正确程程度。下下面以晋晋城在线线20005年111月和和10月月的点击击次数对对比分析析

6、为例,来说明明这种影影响的显显著及剔剔除这种种影响的的方法:该网站111、110月的的点击次次数分别别为95558115099和98802445577次,则则: 1、不考考虑周周周期性的的影响。则111月的日日均点击击次数为为318860550次,10月月为311620082次次。比较较可知,11月月的业绩绩高于110月,因为111月的的日均点点击次数数上升了了239968次次。但这这只是假假象。2、考虑虑周周期期性的影影响。注注意到,除4个个整周外外,100月余周周一、六六、日33天,111月余余周二、三2天天。我们们已知晋晋城在线线的点击击次数明明显地存存在周周周期性,周六、日在低低点,周

7、周二、三三在高点点,所以以10月月的点击击次数合合计明显显受低点点影响,而111月则受受高点影影响。要要剔除这这种影响响,方法法是:忽忽略非整整周数据据中的周周周期性性数据,而保留留其中的的非周周周期性数数据(避避免将非非整周数数据中的的非周周周期性数数据也一一同忽略略掉了),然后后将保留留的数据据并入44周数据据中按44周计算算日均点点击次数数。其中中,某天天(例如如周六)的点击击次数周周周期性性数据,就是各各周该天天点击次次数的期期望值(平均值值)。这这时,111月的的日均点点击次数数为311681104次次,100月为3316225299次。比比较可知知,111月的业业绩比110月仅仅微

8、弱上上升,因因为111月的日日均点击击次数比比10月月仅上升升了55575次次。比较而言言,本文文认为第第二种方方法是科科学的方方法。 上述方法法的对比比,说明明了点击击次数周周周期性性对于分分析结果果正确性性或正确确程度影影响的显显著,而而要理解解并剔除除这种影影响,则则需要对对点击次次数作随随机变量量考察。鉴于以上上对网站站点击次次数现行行分析指指标缺陷陷的分析析,注意意到:网网站“某一天天的点击击次数”是随机机变量,它服从从正态分分布(后后有实证证检验),这使使得利用用正态分分布的参参数(,2)对它它进行科科学考察察成为可可能。所所以,本本文就拟拟从正态态分布的的角度,对网站站点击次次数

9、分析析方法进进行研究究,以期期能改善善现行指指标的分分析效果果,或提提出更有有效的指指标。本文研究究所用网网站点击击次数数数据是“晋城在在线”网站提提供的公公开的“晋城在在线网站站全频道道点击次次数月报报表”(20005.7-112)3。在此,对该网网站支持持科学研研究的实实际行动动表示感感谢。另外,在在本文写写作过程程中,笔笔者曾查查阅了相相当数量量的文献献资料,但未发发现一个个与本文文研究思思路和内内容类似似或有关关的文章章,这使使笔者的的参考与与借鉴无无从进行行,所以以文内的的不足可可能在所所难免,谨期能能抛砖引引玉。二、对“晋城在在线”点击次次数服从从正态分分布的实实证检验验表面上看看

10、,点击击次数是是离散型型数据,但因为为它取值值范围广广泛(00至几百百万),所以应应该把它它看作连连续型变变量进行行考察。经笔者者检验分分析,证证明晋城城在线的的点击次次数服从从正态分分布。表表一是根根据晋城城在线220055年7-12月月每天的的点击次次数样本本数据计计算的正正态分布布的分布布函数(注意不不是密度度函数)频率概概率对比比表(其其中为实际际点击次次数除以以10万万后的四四舍五入入): 表1:晋城在在线点击击次数分分布函数数频率概概率对比比表k频率pk%概率pk%k频率pk%概率pk%200.5443477826610.0112611348813359.778266087756.

11、99003344114211.0886955652220.0444677931153470.1108669566567.44644462335241.6330433478830.8118466753383577.1173991300477.00211113667252.1773911304431.2773833005543687.5584.77441156442263.8004344782263.0887899573353790.7760886955790.11133329448276.522173391336.199739919333896.1195665211793.88297726778

12、289.78826008699610.337822912283997.228266087796.007022562272911.9956552177415.115466916624097.8826008699697.112388894423020.6652117399124.441444741184198.9913004344898.882555008833130.4434778266134.224299609994299.4456552177499.339300410093247.8826008699645.559299579924310099.77948851227根据该表表可绘制制分布函

13、函数(注注意不是是密度函函数)的的频率概概率对比比图(图图3)如如下:从图3直直观可知知,晋城城在线点点击次数数的分布布与参数数为(332.99,3.5522)的正正态分布布有较好好的拟合合。另外,还还可以用用2检验对对这一问问题(HH0:晋城城在线点点击次数数服从参参数为(32.9,33.5222)的正正态分布布)进行行更准确确的检验验。检验验结果为为:根据据样本数数据计算算,得2=400.03343。查2表,得得显著性性水平为为0.0005、自由度度为211的临界界值为441.4401。因为2=400.0334341.4011,所以以H0通过了了检验,即晋城城在线的的点击次次数服从从参数为

14、为(322.9,3.5522)的正正态分布布。44三、利用用正态分分布参数数对晋城城在线发发展状况况和内部部考核的的分析(一)、对网站站发展趋趋势的分分析网站管理理者首先先应正确确理解其其网站的的整体发发展趋势势,但如如前所述述,图11的分析析不能很很好地提提供这方方面的信信息。所所以,客客观上需需要一种种更好的的指标来来反映点点击次数数的发展展趋势。正态分分布的参参数是其随随机变量量的期望望值,其其含义为为均值,可以作作为点击击次数的的代表。在本例例中,=322.9;而标准准差为3.52,远小于于,所以以,的变化化可以很很好地反反映点击击次数的的发展趋趋势。下下图(图图4)是是晋城在在线点击

15、击次数的的变化曲曲线图:从该图可可以得到到以下信信息:1、整体体上,晋晋城在线线点击次次数呈稳稳定下降降趋势,但最近近有回升升的迹象象。2、在约约第255至655日间,点击次次数快速速上升,并维持持在较高高的水平平。此后后,点击击次数却却一再稳稳定下降降。在约约85日日附近情情况有所所改善,但没能能逆转。最后110日左左右,点点击次数数有回升升的迹象象,但幅幅度不大大。上述趋势势至少给给网站提提出了两两个研究究命题:1、判断断点击次次数下降降的性质质,分析析原因。从性质质上,可可以初步步推断下下降是系系统性的的。这说说明晋城城在线整整体服务务质量与与市场需需求有一一定的距距离。2、对系系统性下

16、下降之外外的变动动进行分分析,即即对点击击次数的的3个上上涨期作作细致的的调查分分析,为为采取逆逆转措施施提供思思路。需要说明明的是:查看图图5时应应忽略起起初的几几个值或或部分值值,因为为此时数数据量太太少;图图五反映映的变化化有迟滞滞现象,实际情情况的发发生要比比图5反反映的早早几日;根据多多个需要要,制作作多个数数据量的的图五更更有利于于分析。(二)对对同业间间相互比比较的分分析由于能能够作为为点击次次数的代代表,可以反反映这种种代表性性的强弱弱,所以以它们可可以用作作同业间间相互比比较的标标准指标标(数据据时期要要相同)。同样样,可以以计算多多个进行比比较,也也可以使使用连续续的变化曲

17、曲线图(图5)进行更更详细的的比较。由于没没有其他他网站的的数据,所以本本文不作作同业比比较的实实例分析析。(三)对对网站制制定科学学管理目目标的分分析管理目标标分长远远目标和和近期目目标。1、对晋晋城在线线长远目目标的分分析从图5可可以判断断其点击击次数的的下降是是系统性性的,在在外部环环境和内内部管理理没有发发生显著著改善以以前这种种趋势不不会改变变。外部部环境是是客观存存在,所所以应从从内部管管理着手手来延缓缓或逆转转这种趋趋势。这这就是该该网站在在可预见见的未来来的长远远目标。为了达达此目标标,晋城城在线应应对其网网站服务务质量进进行细致致的考察察,因为为其点击击次数的的稳步下下降与网

18、网络发展展的总趋趋势(按按几何级级数增长长5)相反反。2、对晋晋城在线线近期目目标的分分析。从近期(如一个个月)来来讲,则则应以近近几期(如近33个月)的数据据计算的的为依据据。具体体目标应应确定为为比略大的的某个区区域,如如+/100,+/5,表述述为(+1)。具体体略大指指大多少少,视管管理力度度的大小小决定。(四)对对网站内内部考核核指标的的改善科学剔除除点击次次数周周周期性影影响,可可以使剩剩余的点点击次数数数据与与员工的的工作努努力程度度的相关关性进一一步提高高,使日日均点击击次数能能更好地地反映员员工的业业绩。这这个举例例前面有有,不再再重复。另外,一一个经营营期结束束后,实实际的点点击次数数往往与与目标不不一致,这时就就要分析析其差异异性质(有利差差异还是是不利差差异)、大小、原因。服从正正态分布

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论