第4章_定量数据描述性统计分析_第1页
第4章_定量数据描述性统计分析_第2页
第4章_定量数据描述性统计分析_第3页
第4章_定量数据描述性统计分析_第4页
第4章_定量数据描述性统计分析_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第4 4章章 定量数据描述性统计分析定量数据描述性统计分析主要内容主要内容u描述性统计分析指标MEANS/UNIVARIATE过程u常见统计图GPLOT/GCHART过程描述性统计分析指标描述性统计分析指标(1 1)基本统计分析指标)基本统计分析指标基本概念:基本概念:总体总体:研究对象的全体。样本样本:从总体中抽取的个体。随机抽样随机抽样:从总体中抽取样本,且每个样本被抽到的机会均等。 MEAN(均值):计算公式为 (n为样本量N)。 MODE(众数):样本中出现次数最多的数据。 MEDIAN(中位数):指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的数据。若总数为奇数,取中间

2、值;若总数为偶数,取中间两个值的平均值。 PX(分位数):它将全部观察值分成两个部分,其中有X%个观察值小于PX,(100X)%个观察值大于PX。 MAX(最大值):样本中的最大观察值。1()/niimeanxn描述性统计分析指标描述性统计分析指标 MIN(最小值):样本中的最小观察值。 SUM(和):样本观察值的总和。 RANGE(极差):最大与最小观测值之差。 STD DEV(标准差):计算公式为 (n为样本量)。 VAR(方差):为标准差的平方,用来衡量相对于均值的分散性和变异性。数据的集中程度高则方差小,反之则大。 STDERR(标准误):计算公式为 CV(变异系数):计算公式为 US

3、S(加权平方和):计算公式为其中 代表权重2()1xxStdDevnSTDERRSTD/N100%sCVx21niiiUSSw xiw描述性统计分析指标描述性统计分析指标 CSS(加权离差平方和):计算公式为 SKEWNESS(偏度系数):计算公式为 主要衡量数据的对称性,若其值大于0则表示位于均值右边数据较分散,若小于0则表示均值左边数据较分散。 KURTOSIS(峰度系数):计算公式为 峰值反映分布的尖锐度或平坦度,正峰值表示相对尖锐的分布,负峰值表示相对平坦的分布。 PROB|T|:在总体均值是0的假设条件下,学生T统计量大于临界T的绝对值的概率。21()niiiCSSw xx3()(1

4、)(2)ixxnSKEWnns42(1)3(1)()(1)(2)(3)(2)(3)ixxn nnKURTnnnsnn描述性统计分析指标描述性统计分析指标(2 2)MEANSMEANS过程过程一般使用格式一般使用格式PROC MEANS DATA=SAS数据集 ;VAR 变量列表;CLASS 变量列表;BY 变量列表;FREQ 变量;WEIGHT 变量;ID 变量列表;OUTPUT ;RUN;描述性统计分析指标描述性统计分析指标(3 3)UNIVARIATEUNIVARIATE过程过程一般使用格式一般使用格式PROC UNIVARIATE DATA=SAS数据集 ;VAR 变量列表;BY 变量列

5、表;FREQ 变量;WEIGHT 变量;ID 变量列表;OUTPUT ;RUN;描述性统计分析指标描述性统计分析指标(3)SAS实例实例描述小麦单穗粒数分布描述小麦单穗粒数分布 在某农业试验基地进行试验,从某块农田中随机抽取50株小麦,并且测出其单穗粒数(count)(相应的SAS数据集在光盘中的存储路径为data/chap4/wheat),请据此计算其描述性统计指标,以得到小麦单穗粒数的分布状况。292634253631322243292930332829222733322925253631273226292125272730262718292830273224282834252726253

6、2描述性统计分析指标描述性统计分析指标编程法:编程法:proc means data=chap4.wheat MAXDEC=2;/*调用调用means过程,输出结果保留两位小数过程,输出结果保留两位小数*/var count; /*指定分析变量为指定分析变量为count*/run;proc univariate data=chap4.wheat plot ; /*调用调用univariate过程,输出图形过程,输出图形*/var count; run;菜单法菜单法描述性统计图形描述性统计图形(1 1)常见统计图形介绍常见统计图形介绍图形类图形类型型主要特征主要特征举例举例条形图表示相互独立的统

7、计指标的数量大小。通常纵轴表示数量,横轴为分组标志。绝对数或相对数均可表示数量,图中各长条的高度反映了数值大小。绘制不同城市的年度GDP情况。圆饼图表示事物内部的构成情况。图中每个扇形面积的大小表示百分比数量大小,将360圆心角看成是100%,把每一部分所占的百分比数折算成圆心角的度数,画出对应的扇形。绘制某种食物的不同营养成分所占的百分比。直方图表示计量资料(测定每个观察单位某项指标值的大小)各组段上的频数的分布情况。图中各长条的面积表示各组数量的大小。如绘制某班学生中考平均得分的分布情况。折线图用于资料中包含两个数量指标,放在横轴上的数量指标通常是时间。适用于表示一个或多个事物随着时间的推

8、移,在数量上的增减幅度。如绘制某城市某年12个月的CPI情况。散点图用于资料中包含两个数量指标,且两个变量之间有自变量和因变量之分。通常把自变量放在横轴上,因变量放在纵轴上。将成对的数据点(X,Y)在X和Y直角坐标系中用点表示出来,所以称为散布图或散点图。如绘制某一组随机样本的身高和体重的散点图。描述性统计图形描述性统计图形(2)GPLOT过程过程一般使用格式:一般使用格式:PORC GPLOT DATA=数据集 ;PLOT 纵坐标变量Y*横坐标变量X;SYMBOLN ;AXISN ;RUN;描述性统计图形描述性统计图形(3)GCHART过程过程一般使用格式:一般使用格式:PROC GCHAR

9、T DATA=数据集 ;VBAR 变量列表 /;HBAR 变量列表 /;BLOCK 变量列表 /;PIE 变量列表 /;STAR 变量列表 /;BY 变量列表 ;RUN;描述性统计图形描述性统计图形(4)SAS实例实例绘制年龄和血压的散点图绘制年龄和血压的散点图根据例3-10中的数据绘制年龄和血压的散点图程序:程序:proc gplot data=chap3.example3_10; /*调用gplot绘图过程*/plot SBP*age/VAXIS=AXIS2 HAXIS=AXIS1; /*定义绘图变量,指定坐标轴设置*/SYMBOL v=star i=none c=black; /*指定用

10、黑色星形表示数据、数据间不连接*/AXIS1 LABEL=(age) ORDER=(20 TO 64 BY 4); /*定义坐标轴1的标签、刻度*/AXIS2 LABEL=(Systolic blood pressure) ORDER=(100 TO 160 BY 10) ;RUN;描述性统计图形描述性统计图形(5)SAS实例实例绘制某班学生成绩分布的直方图绘制某班学生成绩分布的直方图 在一次高考前的英语摸底考试后,某理科实验班40个学生的得分情况,请据此画出学生得分的直方图,以探索其分布特征。程序:程序:proc univariate data=chap4.histogram; /*调用un

11、ivariate过程*/var score; /*指定分析变量为score*/Histogram; /*指定绘制分析变量的直方图*/run;描述性统计图形描述性统计图形(6)SAS实例实例绘制国内生产总值的折线图绘制国内生产总值的折线图 已知我国自1978年改革开放以来至2010年的国内生产总值(GDP),请据此绘制折线图。程序:程序:Proc gplot data=chap4.line; /*调用gplot过程作图*/Plot GDP*year /haxis=axis1 vaxis=axis2;/*设定纵轴和横轴变量分别为GDP、year,且纵轴和横轴的设定参数分别见axis1、axis2*

12、/Symbol i=join v=dot l=2 h=0.5;/*设定数据用直径为1cm的点表示,用虚线将数据点连接成折线*/Axis1 label=(年份) order=(1978 to 2010 by 4 );/*定义Axis1的标签为“年份”,且取值从1978至2010每隔4年取一个刻度*/Axis2 label=(GDP) ; /*定义Axis2的标签为GDP*/Title 改革开放以来我国GDP走势图; /*定义标题*/Run;描述性统计图形描述性统计图形(7)SAS实例实例绘制绘制09年年GDP构成的饼图构成的饼图 已知09年的国内生产总值的构成,请绘制呈现不同产业生产总值占国内生

13、产总值的百分比的饼图程序:程序:Proc gchart data=chap4.pie; Pie type/discrete /*根据离散型变量Type分组绘制饼图*/ Sumvar=GDP /*定义计算变量为GDP*/ Type=mean/*饼图的每一个扇形代表的是不同产业生产总值均值,此选项为绘制饼图必选项*/ Slice=arrow /*定义用线将扇形和它的标签连接起来*/ Percent=arrow /*定义用线将扇形和它所代表的百分比形连接起来*/ Value=arrow /*定义用线将扇形和它所代表的值连接起来*/ Ctext=black /*设置图中所有文字为黑色*/ Cfill=

14、black; /*设置扇形的轮廓为黑色*/ title 09年GDP构成状况”; Run;描述性统计图形描述性统计图形(8)SAS实例实例绘制某种玉米株高的条形图绘制某种玉米株高的条形图 三类条形图简介:简单条形图用若干平行、等宽的条状来表示数量对比关系,组间有间隙。分组条形图指由每两条或多条组成一组的条形图,组间间隔大,组内条形无间隔或间隔小。分段条形图以条形的全长代表某个变量的整体,条形内部的各分段长短代表各组部分在整体中所占比例,每段用不同颜色或线条表示、之间无间隙,各条之间有间隙。从不同地区(A,B,C)抽取不同品种(m,n)的玉米分别20株,测量得出玉米的株高。1)请绘制不同地区的玉米平均株高的简单条形图;2)请分地区绘制不同品种玉米平均株高的分组条形图;3)请分品种绘制不同地区的玉米平均株高的分段条形图。描述性统计图形描述性统计图形程序:程序:Proc gchart data=chap4.bar; /*调用gchart过程*/Vbar area/discrete sumvar=height type=mean;/*绘制简单条形图:绘制不同地

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论