SAS基础与金融计算4_第1页
SAS基础与金融计算4_第2页
SAS基础与金融计算4_第3页
SAS基础与金融计算4_第4页
SAS基础与金融计算4_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1SAS基础与金融计算游家兴厦门大学经济学院计统系2本节讲授内容SAS图表过程Procchart过程Procgchart过程3统计图对统计资料图形化处理就形成统计图,运用统计图形能直观地描述统计分布的特征和变量之间的关系。统计图有多种表现形式:1、直方图2、饼图3、折线图4、曲线图4回顾Procunivariatedata=studentplot;varheight;Run;获得三个图:1、茎叶图2、箱线图3、正态概率图5统计分组的相关概念根据统计研究的目的和客观现象的内在特点,按某个标志或几个标志把被研究的总体划分为若干个不同性质的组,称为统计分组。分组的性质来看:兼有分和合双重含义。6统计分组的步骤1.确定数据的全距(R):R=xmax-xmin(即最大变量值与最小变量值之差)2.确定组限、组距和组数(1)组限分为上限和下限,上限是各组的最大变量值,下限是各组的最小变量值。(2)各组上限与下限之差称为该组的组距。(3)组数是指某个变量数列划分为多少个组。说明:组数的多少与组距的大小成反比关系,组距越大,则可分的组就越少。7分组,应注意如下两个问题:首先,分组时各组数量界限的确定必须能反映事物质的差别——体现量变到质变的转化。其次,应根据被研究的现象总体的数量特征,采用适当的分组形式,确定相宜的组距、组限——主要解决分多少组的问题。8组数的确定:与组距大小成反比以下是美国学者斯特杰斯经验公式:

n=1+3.322lgN

(n:组数;N:总体单位数)

d=R/n=(Xmax-Xmin)/n(n为组数,d为组距,R为全距)9根据上述公式,可以得出如下的组数参考标准:分组组数参考表N15-2425-4445-8990-179180-359n56789上述数据仅供参考,不能生搬硬套,实际分组时要依所研究资料的性质而定。10SAS制图过程SAS统计制图过程均可以实现对样本分布特征的图形表示,一般情况下可以使用的有chart过程、plot过程、gchart过程和gplot过程。前两个和后两个只有一个字母“g”(代表graph)的差别,其实它们之间(只差一个字母g的过程之间)的统计描述功能是相同的,区别仅在于绘制出的图形的复杂和美观程度。11此外外,,还还有有一一些些较较为为复复杂杂的的制制图图命命令令,,如如运运用用G3D过程程绘绘制制曲曲面面图图,,运运用用GCONTOUR过程程绘绘制制曲曲面面对对应应的的等等高高线线图图。。例如如,,我我们们想想绘绘制制一一个个二二维维正正态态分分布布曲曲面面的的图图形形,,假假设设(X,Y)服从从联联合合正正态态分分布布,,其其均均值值都都是是0,方方差差分分别别为为1和a,相相关关系系数数为为r。12chart(或或plot)与与gchart(或或gplot)chart过程程和和plot过程程绘绘制制的的图图形形类类似似于于我我们们用用文文本本字字符符堆堆积积起起来来的的图图形形,,只只能能概概括括地地反反映映出出资资料料分分布布的的大大体体形形状状,,实实际际上上这这两两个个过过程程绘绘制制的的图图形形并并不不能能称称之之为为图图形形,,因因为为它它没没有有涉涉及及一一般般意意义义上上图图形形的的任任何何一一种种元元素素((如如颜颜色色、、分分辨辨率率等等))。。而gchart过程程和和gplot过程程给给出出的的是是真真正正意意义义上上的的图图形形,,可可以以用用很很多多的的语语句句和和选选项项来来控控制制图图形形的的各各方方面面的的性性质质和和特特征征。。13Chart(或gchart)与plot(或gplot)chart和gchart过程可以以绘制出出的图形形主要有有条形图图(包括括横条和和竖条))、圆图图、环形形图和星星形图等等;plot和gplot过程通常常用一个个记录中中的两个个变量值值表示点点的坐标标来绘制制图形,,如散点点图和线线图等。。14gchart过程的一一般格式式Procgchart选项列表表;图形关键键词变变量名称称/选项列表表;Run;此过程格格式简单单,复杂杂的地方方在于图图形关键键字(每每个图形形关键字字对应一一种图形形类型))所引导导的语句句,它是是控制图图形类型型及图形形要素的的地方,,涉及到到众多的的关键字字和选项项。15gchart过程可以以使用的的图形关关键字及及其所绘绘制的图图形类型型见下表表:16图形关键键字后的的变量名名用以指指定进行行图形描描述时的的分组变变量,可可以是数数值型的的(此时时以各组组的组中中值为分分组的标标志),,也可以以是字符符型的。。选项列表表中比较较重要的的有:(1)type=统计量关关键字,,表示图图形对变变量(sumvar所指定的的变量))的哪一一种统计计量进行行描述,,比如频频数(freq)、均数数(mean)、总计计(sum)、频数数百分比比(percentage)等;17(2)subgroup=变量名((分组变变量),,指定要要进行分分组(各各组内再再分组))的变量量;(3)sumvar=变量名((数值变变量),,指定要要进行统统计计算算的变量量,也就就是“type=统计量关关键字””选项中中统计量量的计算算所依据据的变量量。18下表为长长沙市某某大学160名正常成成年女子子2006年体检资资料中的的血清甘甘油三酯酯的测量量结果((mmol/L)试以直方方图来表表示上述述资料的的分布特特征。19例1:单变量量数据第一步::建立数数据集;;datatest;inputx@@;cards;0.910.88 1.410.961.48 1.460.911.101.261.69 8 0.680.831.77………………1.491.02 1.170.990.61 1.330.790.951.051.65 4 1.400.721.06;Run;双尾符,,它表示示为了执执行下一一个input语句,保保持指针针在这个个输入的的记录行行上。比较有加加双尾符符和没加加双尾符符的区别别。20第二步,,进行初初步的统统计分析析,确定定分组的的个数。。Procunivariatedata=test;varx;Run;21所有160个观测值值中,最最大的为为1.77,最小的的为0.51,如果以以0.1为组距,,将所有有观测值值归入13个组。如果根据据前面的的斯特杰杰斯经验验公式,,则应将将所有观观测值归归入8组。TheMEANSProcedureAnalysisVariable:xNMeanStdDevMinimumMaximum1601.13120.29450.51001.770022第三步,,画图。。procgchartdata=test;vbarx/type=freqlevels=13inside=freqspace=0width=6;run;Vbar语句表示示我们要要做的是是竖立的的条形图图,其后后跟的是是作图所所要依据据的分类类变量,,这里我我们以变变量x来做直方方图。斜斜杠后的的内容是是对所做做条形图图进行控控制的选选项,本本段程序序所涉及及的各选选项的含含义和功功能见下下表。23各选项的的含义和和功能24Procgchartdata=test;vbarx/type=freqlevels=13sumvar=xinside=freqspace=0width=6;Run;25Procgchartdata=test;vbarx/type=freqlevels=8sumvar=xinside=freqspace=0width=6;Run;26Procgchartdata=test;vbarx/type=freqlevels=13sumvar=xinside=meanspace=0width=6;Run;27Procgchartdata=test;vbarx/type=freqlevels=13sumvar=xinside=meanspace=5width=6;Run;28Procgchartdata=test;vbarx/type=freqlevels=13sumvar=xinside=meanspace=0width=9;Run;29比较Procgchart与Procchart;比较vbar和hbar;Vbar用来列出出用户想想要画的的垂直条条形图的的那些变变量,每每个图表表变量对对应一张张垂直条条形图;;Hbar对列出的的每个图图变量生生成水平平的条形形图。比较直方方图与饼饼图。30Procgchartdata=test;hbarx/type=freqlevels=13;Run;31Procgchartdata=test;piex/type=freqlevels=13;Run;32Procgchartdata=test;piex/type=meansumvar=xlevels=13;Run;33Procgchartdata=test;piex/type=meansumvar=xlevels=5;Run;34例2:

分组数据据下表是财政系系问卷设计资资料汇总35第一步,建立立数据集;Datascore;inputsubject$sex$num1num2;Cards;………;Run;Datascore;setscore;labelsubject='专业'sex='性别'num1='人数'num2='题量';Run;36Group语句Procgchart;vbarsubject/group=sexsumvar=num2type=mean;run;Num2表示题量。上述语句意思思是:先按性性别分两组,,接着在每组组中按专业进进一步分三组组,最后再将将每组设计的的题量的平均均数列示出来来。37Procgchart;vbarsubject/group=sextype=freq;run;Num2表示题量。上述语句意思思是:先按性性别分组,接接着在每组中中按专业进一一步分组,最最后再将每组组包含的单位位数列示出来来。38Procgchart;vbarsex/group=subjectsumvar=num2type=mean;run;Num2表示题量。。上述语句意意思是:先先按专业分分三组,接接着在每组组中按性别别分别分两两组,最后后再将每组组设计的题题量的平均均数列示出出来。39By语句Procgchart;vbarsubject/sumvar=num2type=mean;bysex;run;上述语句将将得到由by变量定义的的几个观测测组分别画画出的图表表。40Subgroup语句Procgchart;vbarsex/subgroup=subjecttype=freq;run;上述语句意意思是:先先按性别分分两组,接接着在每组组中按专业业进一步分分三组,最最后再将每每组包含的的单位数列列示出来。。41

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论