




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
统计学基本概念和方法数据的描述第1页/共134页
R语言简介
第2页/共134页数字,字符与向量
向量的赋值X<-c(10.4,5.6,3.1,6.4,21.7)Assign(“x”,c(10.4,5.6,3.1,6.4,21.7))c(10.4,5.6,3.1,6.4,21.7)->xY<-c(x,0,x)
第3页/共134页数字,字符与向量
向量的运算
X<-c(-1,0,2);y<-c(3,8,2)V<-2*x+y+1X*yx/yX^2Y^x第4页/共134页数字,字符与向量求向量最小,最大和范围min,max,rangeWhich.min,which.max求和,乘积等Sum,prod,length中位数,均值,方差,标准差和顺序统计量Median,mean,var,sort第5页/共134页数字,字符和向量产生有规律的序列等差数列X<-1:6等间隔函数Seq(from=v1,to=v2,by=v3)重复序列X<-Rep(x,times=3)第6页/共134页数字,字符和向量字符向量Labs<-Paste(“X”,1:6,sep=“”)复数向量X<-seq(-pi,pi,by=pi/10)y<-sin(x)Z<-complex(re=x,im=y)Plot(z)第7页/共134页数字,字符和向量将向量定义成数组z<-1:12,Dim(z)<-c(3,4)用array构造数组X<-array(1:20,dim=c(4,5))用matrix构造矩阵A<-matrix(1:15,nrow=3,ncol=5,byrow=TRUE)
第8页/共134页数字,字符和向量数组下标A<-1:24,dim(A)<c(2,3,4)A[1,2:3,2:3];A[1,,];取矩阵维数Dim(A),nrow(A),ncol(A)第9页/共134页读写数据文件Read.table函数Rt<-read.table(“house.data”,head=T)Scan函数W<-scan(“wight.data”);Write函数Write.table,write.csv第10页/共134页数据的图形描述在对数据进行深入加工之前,总应该对数据有所印象。可以借助于图形和简单的运算,来了解数据的一些特征。由于数据是从总体中产生的,其特征也反映了总体的特征。对数据的描述也是对其总体的一个近似的描述。第11页/共134页图的种类第12页/共134页基本绘图函数函数名功能Plot(x)以x的元素作为纵坐标,以序号为横坐标作图Plot(x,y)以x,y二元作图Pie(x)饼图Boxplot(x)盒形图HistX的频率直方图Barplot(x)X值的条形图Paris(x)如果x是矩阵或是数据框,作x的各列之间的二元图coplot(x~y|z)关于z的每个数值(或数值区间)绘制x与y的二元图matplot(x,y)二元图,其中x的第一列对应y的第一列,依次类推qqnorm(x)正态分位数-分位数图image(x,y,z)x,y,z三元图heatmap(x)热图第13页/共134页
二元函数图形第14页/共134页饼图定性变量(或属性变量,分类变量)不能点出直方图、散点图或茎叶图,但可以描绘出它们各类的比例。易于显示每一组的相对大小用于显示每一组有多少个观测数时不是很好第15页/共134页最早的饼图第16页/共134页第17页/共134页直方图对于一个定量变量,比如某个地区测量了163个高三男生的身高。用图形来表示这个数据,使人们能够看出这个数据的大体分布或“形状”的一个办法是画直方图(histogram)第18页/共134页第19页/共134页图像直方图第20页/共134页图像的直方图第21页/共134页图像的直方图第22页/共134页直方图分割第23页/共134页经验分布经验分布函数第24页/共134页第25页/共134页第26页/共134页第27页/共134页第28页/共134页第29页/共134页核密度估计核密度函数第30页/共134页用density()函数可以绘制与直方图配套的核密度估计。density的一般用法为:
density(x,bw="nrd0",adjust=1,kernel=c("gaussian","…"),window=kernel,width…)bw是带宽,默认值R画出光滑图形;kernel是核函数;adjust表示实际带宽是adjust*bw。其他参数详见帮助文档。第31页/共134页>w<-c(75,64,47.4,66.9,62.2,62.2,58.7,63.5,66.6,64,57,69,56.9,50,72)>hist(w,freq=F);>w.density<-density(w);w.densityCall:density.default(x=w)Data:w(15obs.);Bandwidth'bw'=3.478xyMin.:36.97Min.:9.044e-051stQu.:49.081stQu.:4.402e-03Median:61.20Median:1.603e-02Mean:61.20Mean:2.061e-023rdQu.:73.323rdQu.:3.409e-02Max.:85.43Max.:5.518e-02第32页/共134页>lines(w.density,col="blue");>x<-44:76;>lines(x,dnorm(x,mean(w),sd(w)),col="red");第33页/共134页盒型图简单一些的是盒形图(boxplot,又称箱图、箱线图、盒子图)。图左边一个是根据地区1高三男生的身高数据所绘的盒形图;其右边的图代表另一个地区(地区2)的高三学生的身高盒子的中间横线是数据的中位数(median),封闭盒子的上下两横线(边)为上下四分位数(点)
第34页/共134页>A<-c(79.98,80.04,80.02,80.04,80.03,80.03,80.04,79.97,80.05,80.03,80.02,80.00,80.02);>B<-c(80.02,79.94,79.98,79.97,80.03,79.95,79.97)>boxplot(A,B,names=c("A","B"),col=c("red","blue"));>boxplot(A,B,notch=T,outline=T,names=c("A","B"),col=c(3,5));第35页/共134页>InsectSprays;>boxplot(count~spray,data=InsectSprays,col="lightgray")>boxplot(count~spray,data=InsectSprays,notch=T,col=2:7,add=T)第36页/共134页QQ图(Quantile)假定总体服从正态分布,对于样本其顺序统计量为正态分布的QQ图是由以下点构成的散点图若样本数据近似正态分布在QQ图上这些点近似在直线附近。
第37页/共134页第38页/共134页茎叶图
在直方图和盒形图中,很难恢复数据的原貌。而另一种图:茎叶图(stem-and-leafplots)可以恢复数据以地区1高三男生身高为例,茎叶图既展示了分布形状又有原始数据。它象一片带有茎的叶子。茎为较大位数的数字,叶为较小位数的数字。第39页/共134页茎叶图其中茎叶图中茎的单位为10cm,而叶子单位为1cm。比如,由于第一行茎为150cm,因此叶子中的九个数字001223344代表九个数目150、150、151、152、152、153、153、154、154cm等。每行左边有一个频数(比如第一行有9个数目,第二行有17个等等);可以看出最长的一行为从165cm到169cm的一段(有35个数)。第40页/共134页茎叶图画法茎叶图stem()可以细致地看出数据分布的结构。stem()的一般用法为:
>stem(x,scale=1,width=80)scale控制了茎叶图的长度,默认值是1,如果scale=2,则表示将0-9这10个个位数分成两段,0~4为一段,5~9为一段;width是绘图的宽度;第41页/共134页>x<-c(25,45,50,54,55,61,64,68,72,75,75,78,79,81,83,84,84,84,85,86,86,87,89,89,89,90,91,91,92,100)>stem(x);Thedecimalpointis1digit(s)
totherightofthe|2|53|4|55|0456|1487|255898|1344456679999|011210|0>stem(x,scale=2)
Thedecimalpointis1digit(s)totherightofthe|2|53|3|4|4|55|045|56|146|87|27|55898|134448|56679999|01129|10|0第42页/共134页>stem(x,scale=0.5);#scale也可以是小数,等于0.5时,表示将0-9这10个个位数分成1/2段,即20个数为一段
Thedecimalpointis1digit(s)totherightofthe|2|54|50456|148255898|134445667999011210|0第43页/共134页散点图该数据描述了自1900年到1998年男女第一次婚姻延续的时间。第44页/共134页散点的相对疏离程度主要反映在相关系数上,其趋势状况是由回归系数,或斜率来反映。散点分布信息如线性,非线性,提供了统计模型的多项式信息;而分布的长短对应数据或统计信息的大小。图中显示了线性、且第一组提供的信息更丰富一点(方差大)。第45页/共134页条形图从每一条可以看出各个区域,性别的死亡率,条形图显示比例不如饼图直观。第46页/共134页热图(Heatmap)第47页/共134页
多元数据的图形表示方法第48页/共134页等高线在某山区内,测得一些地点的高度,试作该山区的地貌图和等值线图
04008001200160020002400280024001180132014501420140013007009002001230139015001500140090011001060160012701500120011001350145012001150120013701500120011001550160015501380800146015001550160015501600160016004001450148015001550151014301300120001430145014701320128012001080940第49页/共134页第50页/共134页一个例子Iris数据集Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。第51页/共134页轮廓图library(lattice);data(iris);parallel(~iris[1:4],iris,groups=Species,horizontal.axis=FALSE,scales=list(x=list(rot=90)))同一品种的鸢尾花的轮廓图粗略地聚集在一起第52页/共134页调和曲线图调和曲线图的思想和傅立叶变换十分相似,是根据三角变换方法将p维空间的点映射到二维平面上的曲线上。假设Xr是p维数据的第r个观测值,即,对应的调和曲线是同一品种鸢尾花数据的调和曲线图基本上扭在一起第53页/共134页星图第54页/共134页如何用少量数字来概括数据?第55页/共134页如何用少量数字来概括数据?可用少量所谓汇总统计量或概括统计量(summarystatistic)来描述定量变量的数据。这些数字是从样本数据得来的,因而也是样本的函数,任何样本的函数,只要不包含总体的未知参数,都称为统计量(statistic)。样本的随机性决定统计量的随机性(统计量也是随机变量)第56页/共134页如何用少量数字来概括数据?概括统计量经常对应于总体的无法观测到的某些参数。这时,统计量可作为这些参数的估计。一些统计量还可以用来检验样本和假设的总体是否一致。第57页/共134页数据的“位置”数据有位置吗?这里三个数据的位置一样吗?第58页/共134页均值的特点集中趋势的测度值之一最常用的测度值一组数据的均衡点所在易受极端值的影响
用于数值型数据,不能用于分类数据和顺序数据第59页/共134页一、算术平均数计算公式:变量值之和/变量值个数计算方法
简单算术平均数:
加权算术平均数:
如果
都相等,那么加权平均和简单平均相同第60页/共134页几何平均数集中趋势的测度值之一
N
个变量值乘积的N
次方根适用于特殊的数据:变量值本身是比率的形式主要用于计算平均发展速度第61页/共134页几何平均数简单几何平均数:加权几何平均数:两边取对数:第62页/共134页几何平均收益率几何平均收益率是将各个单个期间的收益率乘积,然后开n次方第63页/共134页数据的位置:众数一个变量的众数就是指出现次数最多的那个值一个变量有两个值经常出现,这就叫做二众数分布优点:很容易从图表中获得缺点:信息量过少第64页/共134页众数集中趋势的测度值之一出现次数最多的变量值不受极端值的影响可能没有众数或有几个众数主要用于分类数据,也可用于顺序数据和数值型数据第65页/共134页众数(众数的不唯一性)无众数
原始数据:10591268一个众数
原始数据:65
985
5多于一个众数
原始数据:2528
28
364242第66页/共134页(一)分类数据的众数
(算例)某城市居民关注广告类型的频数分布
广告类型人数(人)比例频率(%)
商品广告服务广告金融广告房地产广告招生招聘广告其他广告112519161020.5600.2550.0450.0800.0500.01056.025.54.58.05.01.0合计2001100【例】根据下表数据,计算众数解:这里的变量为“广告类型”,这是个分类变量,不同类型的广告就是变量值。我们看到,在所调查的200人当中,关注商品广告的人数最多,为112人,占总被调查人数的56%,因此众数为“商品广告”这一类别,即
Mo=商品广告第67页/共134页(二)顺序数据的众数
(算例)根据下表的数据,计算众数解:这里的数据为定序数据。变量为“回答类别”。甲城市中对住房表示不满意的户数最多,为108户,因此众数为“不满意”这一类别,即
Mo=不满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)百分比(%)
非常不满意
不满意
一般
满意
非常满意24108934530836311510合计300100.0第68页/共134页(样本)中位数(median)是数据按照大小排列之后位于中间的那个数(如果样本量为奇数),或者中间两个数目的平均(如果样本量为偶数)。优点:由于中位数不易被极端值影响,所以中位数比均值稳健(robust)。主要用于顺序数据,也可用数值型数据,但不能用于分类数据未利用数据的所有信息数据的“位置”:中位数第69页/共134页1.未分组数据的中位数
(计算公式)第70页/共134页2.顺序数据的中位数
(算例)根据下表中的数据,计算甲城市家庭对住房满意状况评价的中位数解:中位数的位置为:
(300+1)/2=150.5从累计频数看,中位数的在“一般”这一组别中。因此
Me=一般甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数
非常不满意
不满意
一般
满意
非常满意2410893453024132225270300合计300—第71页/共134页3.数值型未分组数据的中位数
(5个数据的算例)原始数据:
2422212620排序: 2021222426位置: 123
45中位数22第72页/共134页a数值型未分组数据的中位数
(6个数据的算例)原始数据:
105 91268排序: 56891012位置: 123 4
56位置N+126+123.5中位数8+928.5第73页/共134页1.根据位置公式确定中位数所在的组
2.采用下列近似公式计算:3.该公式假定中位数组的频数在该组内均匀分布b数值型分组数据的中位数
(要点及计算公式)NifSLMmme*-+=-12第74页/共134页数值型分组数据的中位数
(算例)表3-5某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—计算50名工人日加工零件数的中位数1450)(21.1235162120个=*-+=eM第75页/共134页上下四分位数(或分别称为第一四分位数和第三四分位数,firstquantile,thirdquantile)则分别位于(按大小排列的)数据的上下四分之一的地方如果令a=k%,则k百分位数也称为a分位数(a-quantile)。数据的“位置”:分位数第76页/共134页(二)四分位数
(概念要点)1. 集中趋势的测度值之一2. 排序后处于25%和75%位置上的值3.不受极端值的影响4.主要用于顺序数据,也可用于数值型数据,但不能用于分类数据QLQMQU25%25%25%25%第77页/共134页四分位数
(位置的确定)未分组数据:组距分组数据:下四分位数(QL)位置=N+14上四分位数(QU)位置=3(N+1)4下四分位数(QL)位置=N4上四分位数(Qu)位置=3N4第78页/共134页1.顺序数据的四分位数
(算例)根据下表数据,计算甲城市家庭对住房满意状况评价的四分位数解:下四分位数(QL)的位置为:
QL位置=(300+1)/4=75.25
上四分位数(QL)的位置为:
QU位置=(3×(300+1))/4=225.75从累计频数看,QL在“不满意”这一组别中;QU在“一般”这一组别中。因此
QL=不满意
QU=满意甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数
非常不满意
不满意
一般
满意
非常满意2410893453024132225270300合计300—第79页/共134页2.数值型未分组数据的四分位数
(7个数据的算例)原始数据:
2321 3032 282526排序:2123
2526283032位置:1 23 4567N+1QL=237+1QL位置=4=4=2QU位置=3(N+1)43(7+1)4==6QU=30第80页/共134页数值型未分组数据的四分位数
(6个数据的算例)原始数据:
2321 30 282526排序:212325262830位置:1 2 3 4 56QL=21+0.75(23-21)=22.5QL位置=N+14=6+14=1.75QU位置=3(N+1)43(6+1)4==5.25QU=28+0.25(30-28)
=28.5第81页/共134页3.数值型分组数据的四分位数
(计算公式)上四分位数:
UUU-1UUifS3NLQ*-+=4LLL-1LLifSNLQ*-+=4下四分位数:
第82页/共134页数值型分组数据的四分位数
(计算示例)QL位置=50/4=12.5某车间50名工人日加工零件数分组表按零件数分组频数(人)累积频数105~110110~115115~120120~125125~130130~135135~140358141064381630404650合计50—,计算50名工人日加工零件数的四分位数QU位置=3×50/4=37.5)(81.117588450115个=*-+=LQ)(75.128510304503125个=*-*+=UQ第83页/共134页数据的特征和测度
数据的特征和测度分布的形状离散程度集中趋势众数中位数均值离散系数方差和标准差峰度四分位差异众比率偏态第84页/共134页顺序数据:四分位差第85页/共134页四分位差
1. 离散程度的测度值之一2. 也称为内距或四分间距3. 上四分位数与下四分位数之差
QD
=QU-QL4. 反映了中间50%数据的离散程度5.不受极端值的影响6.用于衡量中位数的代表性第86页/共134页四分位差
(定序数据的算例)【例】根据下表数据,计算甲城市家庭对住房满意状况评价的四分位差解:设非常不满意为1,不满意为2,一般为3,满意为4,非常满意为5已知QL=不满意=2,
QU=
满意=
4四分位差:
QD=QU=
QL
=4–2
=2甲城市家庭对住房状况评价的频数分布回答类别甲城市户数(户)累计频数
非常不满意
不满意
一般
满意
非常满意2410893453024132225270300合计300—第87页/共134页一个例子最小值(minimum)=5下四分位数(Q1)=7中位数(Med)=8.5上四分位数(Q3)=9最大值(maximum)=10平均值=8四分位间距(interquartilerange)=Q3-Q1=2(即ΔQ)在区间Q3+2(或3?)ΔQ,Q1-2(或3?)ΔQ之外的值被视为应忽略(farout)。farout:在图上不予显示,仅标注一个符号∇。最大值区间:Q3+1.5ΔQ最小值区间:Q1-1.5ΔQ最大值与最小值产生于这个区间。区间外的值被视为outlier显示在图上.第88页/共134页数值型数据:方差和标准差第89页/共134页(一)极差
(概念要点及计算公式)1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布7891078910未分组数据
R
=max(Xi)-min(Xi).=组距分组数据
R
最高组上限-最低组下限5.计算公式为第90页/共134页(二)平均差
(概念要点及计算公式)1.离散程度的测度值之一2.各变量值与其均值离差绝对值的平均数3.能全面反映一组数据的离散程度4.数学性质较差,实际中应用较少5.计算公式为未分组数据组距分组数据第91页/共134页平均差(计算过程及结果)某车间50名工人日加工零件标准差计算表按零件数分组组中值(Xi)频数(Fi)|Xi-X||Xi-X|Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.535814106415.710.75.70.74.39.314.347.153.545.69.843.055.857.2合计—50—312【例】根据下表数据,计算工人日加工零件数的平均差第92页/共134页第93页/共134页(三)方差和标准差
(概念要点)1.离散程度的测度值之一2.最常用的测度值3.反映了各变量值与均值的平均差异4.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4681012X=8.3第94页/共134页1.总体方差和标准差
(计算公式)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式第95页/共134页总体标准差
(计算过程及结果)表
某车间50名工人日加工零件标准差计算表按零件数分组组中值(Xi)频数(Fi)(Xi-X)2(Xi-X)2Fi105~110110~115115~120120~125125~130130~135135~140107.5112.5117.5122.5127.5132.5137.5358141064246.49114.4932.490.4918.4986.49204.49739.47572.45259.926.86184.90518.94817.96合计—50—3100.5根据下表数据,计算工人日加工零件数的标准差第96页/共134页第97页/共134页2.样本方差和标准差
(计算公式)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!第98页/共134页样本方差
3.自由度(degreeoffreedom)1.
一组数据中可以自由取值的数据的个数
2.当样本数据的个数为
n
时,若样本均值x
确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值
3.例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x
=5
确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值
4.样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量第99页/共134页样本方差
(算例)原始数据:10 591368第100页/共134页样本标准差
(算例)样本标准差原始数据: 10591368第101页/共134页方差
(简化计算公式)样本方差总体方差第102页/共134页四、众数、中位数和均值的比较第103页/共134页众数、中位数和均值的关系对称分布
均值=
中位数=
众数左偏分布均值
中位数
众数右偏分布众数
中位数
均值第104页/共134页数据类型与集中趋势测度值数据类型和所适用的集中趋势测度值数据类型分类数据顺序数据数值型数据适用的测度值※众数※中位数※简单均值—四分位数众数※
※加权均值—众数中位数调和平均数——四分位数几何平均数第105页/共134页众数,中位数,还是均值当分布有大量小的观察值仅有少数大观察值,均值比中位数大(家庭年收入)一个社区的平均家庭年收入可能是令人舒服的每年15万元,如果这个均值是从20户极穷和20户极富的人家计算出来,就不能代表他们中的任何一个第106页/共134页数据的“尺度”两个均值一样,但右边的要“胖”些,方差为左边的一倍第107页/共134页方差和标准差
(概念要点)1.离散程度的测度值之一2.最常用的测度值3.反映了各变量值与均值的平均差异4.根据总体数据计算的,称为总体方差或标准差;根据样本数据计算的,称为样本方差或标准差4681012X=8.3第108页/共134页样本方差和标准差
(计算公式)未分组数据:组距分组数据:未分组数据:组距分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!第109页/共134页样本方差
自由度(degreeoffreedom)1.
一组数据中可以自由取值的数据的个数
2.当样本数据的个数为
n
时,若样本均值x
确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值
3.例如,样本有3个数值,即x1=2,x2=4,x3=9,则x=5。当x
=5
确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值
4.样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量第110页/共134页四、相对离散程度:离散系数第111页/共134页
离散系数
(coefficientofvariation)1.标准差与其相应的均值之比2.消除了数据水平高低和计量单位的影响3.测度了数据的相对离散程度4.用于对不同组别数据离散程度的比较5.计算公式为:第112页/共134页离散系数
(实例和计算过程)表
某管理局所属8家企业的产品销售数据企业编号产品销售额(万元)X1销售利润(万元)X21234567817022039043048065095010008.112.518.022.026.540.064.069.0【例】某管理局抽查了所属的8家企业,其产品销售数据如表。试比较产品销售额与销售利润的离散程度第113页/共134页X1=536.25(万元)S1=309.19(万元)V1=536.25309.19=0.577S2=23.09(万元)V2=32.521523.09=0.710X2=32.5215(万元)结论:计算结果表明,V1<V2,说明产品销售额的离散程度小于销售利润的离散程度第114页/共134页数据类型与离散程度测度值数据类型和所适用的离散程度测度值数据类型分类数据顺序数据数值型数据适用的测度值※异众比率※四分位差※方差或标准差—
异众比率※离散系数(比较时用)——
平均差——
极差——
四分位差——
异众比率第115页/共134页第三节偏态与峰度的测度一.偏态及其测度二.峰度及其测度第116页/共134页数据的特征和测度
(本节位置)数据的特征和测度分布的形状离散程度众数中位数均值离散系数方差和标准差峰度四分位差异众比率偏态集中趋势第117页/共134页一、偏态第118页/共134页偏态与峰度分布的形状扁平分布尖峰分布偏态峰度左偏分布右偏分布与标准正态分布比较!第119页/共134页偏态1.数据分布的不对称性2.偏态系数=0为对称分布3.偏态系数>0为右偏分布4.偏态系数<0为左偏分布5.计算公式为()313sSkNFXXKiiiå=-=第120页/共134页偏态【例】已知1997年我国农村居民家庭按纯收入分组的有关数据如表。试计算偏态系数2.2812.4520.3519.5214.9310.356.564.132.681.814.94500以下500~10001000~15001500~20002000~25002500~30003000~35003500~40004000~45004500~50005000以上户数比重(%)按纯收入分组(元)表1997年农村居民家庭纯收入数据第121页/共134页户数比重(%)252015105农村居民家庭村收入数据的直方图偏态与峰度
(从直方图上观察)按纯收入分组(元)1000500←150020002500300035004000
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度汽车维修居间合同协议下载
- 二零二五年度高新技术产业经营土地租赁协议
- 二零二五年度跨境电商平台商品分销合作协议
- 2025版开工典礼活动礼品赞助合作合同范本
- 二零二五年度教育机构土地租赁使用协议
- 二零二五版个人抵押房产维修基金缴纳合同
- 2025版广告发布合同变更协议书范本
- 2025湖南师范大学附属小学第三轮非事业编制教师招聘8人考试模拟试题及答案解析
- 2025云南昆明市盘龙区教育发展投资有限公司就业见习岗位招录3人考试备考试题及答案解析
- 2025福建兵工装备有限公司校园招聘8人考试备考试题及答案解析
- T/CSIQ 8014.1-2018组串式光伏逆变器技术规范第1部分:总则
- 固体废物的处理与处置-固体废物的最终处置技术
- 先天性甲状腺功能减退症诊治指南(2025)解读
- 学会真学习拒绝假努力!课件-2026届高三下学期三模阶段性班会
- 2025-2030年中国保暖内衣品牌市场动态及发展竞争力研究报告
- 职业技术学院《农业物联网》课程标准
- 湘豫名校联考2025届高三下学期第二次模拟考试英语试题(解析版)
- 称量操作培训课件
- 《中药鉴定学》考试题库大全-上(单选、多选题)
- 2025眉山辅警考试题库
- 脚手架工程监理实施细则
评论
0/150
提交评论