SAS_统计图表Chap6_SAS_统计图表ppt课件_第1页
SAS_统计图表Chap6_SAS_统计图表ppt课件_第2页
SAS_统计图表Chap6_SAS_统计图表ppt课件_第3页
SAS_统计图表Chap6_SAS_统计图表ppt课件_第4页
SAS_统计图表Chap6_SAS_统计图表ppt课件_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第6章 统计图表第6章 统计图表6.1 统计表的概念和种类6.2 统计图的根本概念6.3 TABULATE过程6.4 GPLOT过程的6.5 GCHART过程6.6 图形界面的图形制造6.1 统计表的概念和种类表8.1 标题何时、何地 横 行 总标目纵行总标目子纵标目1 子纵标目n子横标目1子横标目k 数字区域o从构成要素看,统计表由标题、横行栏目(分组标志)、纵行栏目(统计目的)和统计数据四部分组成。o从内容上看,分为主词和宾词两部分。主词是被研讨对象的总体及其分组,宾词是指阐明总体特征的统计目的。主词栏 宾词栏 统计表的种类按用途分:调查表整理表分析表按主词的分组情况:简单表:主词未经任何

2、分组简单分组表:表的主词仅按一个标志分组的统计表复合表:表的主词按两个或两个以上标志进展分组的统计表6.2 统计图的根本概念统计图是用点、线、面等图形来直观的反映变量分布特征、内部构造、变量间关系及其开展变化的一种常用方式,常见的统计图:直方图:表示经同级分组后各组的频数分布情况,其条形的高度代表各组的频数或频率。饼图:反映事物的内部构造,必需用相对数,饼图的每个扇面代表某一部分占总体的比重,各部分之和为1。柱状图:表示不同总体某一目的的数量特征,普通用于不同时间、地点的某一目的间的对比。散点图:调查两变量间关系,反映两个延续的变量之间有无关系,是直线关系还是曲线关系等。6.3 TABULAT

3、E过程TABULATE过程的功能可以对总体进展简单分组汇总可以对总体按两个或两个以上标志进展复合分组汇总以比较灵敏的方式对每组进展合计,还可以计算每个分组单元的百分比。TABULATE过程的普通格式PROC TABULATE ; CLASS class-variable-list; VAR analysis-variable-list; TABLErow-expression, col-xpression ; BY variable-list; FREQ variable; WEIGHT variable; FORMAT variable-list-1 format-1;1.PROC TABU

4、LATE语句其普通格式为:PROC TABULATE ;该语句中的选择项常用的有:DATA=SAS-data-set:指定所运用的输入数据集,缺省时运用最新创建的数据集。FORMAT=format-name格式名:对每个报表单元规定输出格式,默许值为BEST12.2。此选项对减少报表中输出数值的域宽非常有用。NOSEPS:要求表中不出现程度分隔线。2.CLASS语句普通格式为:CLASS class-variable-list;该语句规定输出报表中的分组标志。在以后的TABLE语句中出现的任一分组标志必需事先在CLASS语句中定义。这些分组变量普通为字符型的,假设是数值型的,其值要求有限,否那

5、么应事先经过FORMAT语句处置成几个离散值。3. VAR语句普通格式为:VAR analysis-variable-list;该语句规定报表中的分析变量。一切在TABLE语句中出现的分析变量必需事先在该语句中予以定义。作为分析变量,要求其为数值型。4. FORMAT语句普通格式为:FORMAT variable-list-1 format-1 ;该语句用于对分类变量规定离散程度,特别是当需求按延续变量进展分类时,该语句对数值的离散化尤其有用。5. TABLE语句普通格式为:TABLE row-expression,column-expression ;语句中的三个维表达式分别表示输出表格的页

6、、行和列的有关规定当短少一个表达式时,定义了一个二维表格短少两个表达式时,定义一个一维表格,假设只需行表达式部分,可写成:TABLE 行表达式, 。维表达式的主要元素包括:变量类型操作符TABLE语句的变量类型o分类变量: 来自CLASS语句或ALL,ALL是系统提供的仅有一个值的特殊分类变量,不思索分类变量的程度,用ALL生成子集和及总和。o分析变量:来自VAR语句o统计量:用统计量关键字表示,有N、MIN、MAX、SUM、MEAN和百分数等。当规定了分析变量而没有规定统计量时,默许的统计量为SUM;假设既没有规定分析变量也没有规定统计量,默许的统计量为N,即分类变量值的交叉频数。TABLE

7、语句的操作符o星号* :在维内对操作元素进展交叉衔接,即复合分组,表示制表项嵌套。o空格:对操作元素进展并排衔接,在列表达式,空格表示横向并排衔接,在行表达式,空格表示纵向并排衔接。o圆括号:对操作元素或分组规定先后顺序。o逗号,:用于区分表达式部分o尖括号:规定分母的定义百分数在表格中的输出o子组的观测数与总观测数之比,叫频数百分比,或叫频数的比率,用PCTN表示o分析变量各子组的组内数值之和与总数值之和相比,叫和数百分比,或叫和数比例,用PCTSUM表示o上述两种百分比率不限于子组与总和数之比,还可以思索子组再分组情况。o百分比制表的格式:PCTN或PCTSUM=标签。 标签由用户书写,替

8、代关键字PCTN和PCTSUM输出到表格当中。百分比定义1. 行总和百分数:假设列维中的一切分类变量,而且也只需列维中的分类变量出如今百分比定义中,其分母为每行的总和。 例如,Table a,b*(n pctn);2. 列总和百分数:假设行维中的一切分类变量,而且也只需行维中的分类变量出如今百分比定义中,其分母为每列的总和。 例如,Table a,b*(n pctn);3. 其他总和的百分比:假设在页维中的一切分类变量,而且也只需页维中的分类变量出如今百分比定义中,那么对每个页维交叉计算行、列总和的百分比。 例如,Table a,b*(n pctn);B12NPCTNNPCTNA1025307

9、51220334067B12NPCTNNPCTNA101030301220204040B12NPCTNNPCTNA103330431220674057TABULATE过程实例1oData student;oinput NAME$ AGE SEX$ HEIGHT WEIGHT SCORE;oCARDS;oLiPing 23 F 171 57 620oWangHua 18 F 162 56 578oZhangP 24 M 156 45 599oGaoKe 19 F 170 55 603oLiuLiu 21 F 155 48 579oPingPing 18 M 186 65 594oHuYi 16

10、F 156 48 615oQueHong 19 M 178 77 580oQinYin 20 F 167 69 578oShiLei 22 F 154 42 588o;oproc tabulate FORMAT=6.2;oclass sex age;ovar height;otable (sex age)*height*(mean N*F=6.0);orun;TABULATE过程实例2odata sales;oinput region$ citisize$ pop product$ saletype$ quantity income;ocards;oes s 25000 a100 r 150

11、3750 ne s 37000 a100 r 200 5000oso s 48000 a100 r 410 10250 we s 32000 a100 r 180 4500oes m 125000 a100 r 350 8750 ne m 237000 a100 r 600 15000oso m 348000 a100 r 710 17750 we m 432000 a100 r 780 19500oes l 62500 a100 r 750 18750 ne l 837000 a100 r 800 20000oso l 748000 a100 r 760 19000 we l 93200 a

12、100 r 880 22000oes s 25000 a100 w 150 3000 ne s 37000 a100 w 200 4000oso s 48000 a100 w 410 8200 we s 32000 a100 w 180 3600oes m 125000 a100 w 350 7000 ne m 237000 a100 w 600 12000oso m 348000 a100 w 710 14200 we m 432000 a100 w 780 15600oes l 62500 a100 w 750 15000 ne l 837000 a100 w 800 16000oso l

13、 748000 a100 w 760 15200 we l 932000 a100 w 880 17600oes s 25000 a200 r 165 4125 ne s 37000 a200 r 215 5375oso s 48000 a200 r 425 10425 we s 32000 a200 r 195 4875oes m 125000 a200 r 365 9125 ne m 237000 a200 r 615 15375o;oproc tabulate noseps;oclass region citisize product saletype;ovar pop quantity

14、 income;otable product,region*citisize,saletype*(quantity income);otable region all,pop quantity income;otable region citisize,product*saletype quantity income;otable region*product all,(saletype all)*(quantity income);orun; TABULATE过程实例3data sales;input region$ citysize$ pop product$ saletype$ quan

15、tity amount;cards;es s 25000 a100 r 150 3750 ne s 37000 a100 r 200 5000so s 48000 a100 r 410 10250 we s 32000 a100 r 180 4500es m 125000 a100 r 350 8750 ne m 237000 a100 r 600 15000so m 348000 a100 r 710 17750 we m 432000 a100 r 780 19500es l 62500 a100 r 750 18750 ne l 837000 a100 r 800 20000so l 7

16、48000 a100 r 760 19000 we l 93200 a100 r 880 22000es s 25000 a100 w 150 3000 ne s 37000 a100 w 200 4000so s 48000 a100 w 410 8200 we s 32000 a100 w 180 3600es m 125000 a100 w 350 7000 ne m 237000 a100 w 600 12000so m 348000 a100 w 710 14200 we m 432000 a100 w 780 15600es l 62500 a100 w 750 15000 ne

17、l 837000 a100 w 800 16000so l 748000 a100 w 760 15200 we l 932000 a100 w 880 17600es s 25000 a200 r 165 4125 ne s 37000 a200 r 215 5375so s 48000 a200 r 425 10425 we s 32000 a200 r 195 4875es m 125000 a200 r 365 9125 ne m 237000 a200 r 615 15375;TABULATE过程实例3(续)proc format; value $ regfmt nc=NORTH c

18、entral ne=NORTH EAST so=SOUTH we=WEST; value $ sizefmt s=UNDER 50000 m=50000 TO 500000 l=OVER 500000; value $ salefmt r=RETAIL w=WHOLESALE;proc format; picture pct low-0=000.00%(prefix=-) 0-high=0000.00%;proc tabulate;class region saletype;var amount;format region $regfmt.;format citysize $sizefmt.;

19、format saletype $salefmt.;table all*f=dollar11. region*f=comma11., saletype=REGIONAL SALES ANALYSIS*amount= *(sum pctsum*f=pct. n*f=6. pctn *f=pct.) /rtspace=12;table all region,saletype*amount*(sum pctsum n pctn )/rtspace=12;keylabel sum=REVENUE n=LOCATIONS pctsum=PERCENT OF SALES pctn=PERCENT OF L

20、OCNS all=TOTAL;run; TABULATE过程实例3(续)proc tabulate;class region saletype;var amount;table all region,saletype*amount*(sum pctsum n pctn );run;6.4 GPLOT过程GPLOT过程可以画出散点图、折线图以及曲线图,对于这些图形,可以做到:符号可以根据要求进展选择,在图上可以用变量值加标签。坐标轴的刻度间隔及标志可以选择。图的大小可以选择,在一张纸上可以画两个以上的图,一张图也可以画在两页以上的纸上。两个以上的图可以重叠在一张纸上。GPLOT过程的普通格式PR

21、OC GPLOT ; PLOT request-list; BY variable; SYMBOL ;1.PROC GPLOT语句该语句的普通格式为:PROC GPLOT ;该语句的常用选项有以下几类:DATA=SAS-DATA-SET,指明所运用的数据集,缺省为当前数据集。UNIFORM:当运用BY语句时,要求对这些BY组运用一致的刻度,以便比较。NOMISS:将变量是缺失值的观测值排除在轴的计算之外,假设无此选项,含有丧失之的观测虽然不能作点图,但是没有丧失的另一变量值在坐标轴中仍起作用。VPERCENT|VPCT=percent-list:指定图形长度占一页长的纵向百分比。HPERCEN

22、T|HPCT=percent-list:指定图形长度占一页长宽的横向百分比。2. PLOT语句普通格式:PLOT request-list;。request-list规定作图变量以及在散点图用于画点的作图字符垂直变量*程度变量:作图符号缺省方式垂直变量*程度变量=字符:规定一个字符作为作图符号。垂直变量*程度变量=变量:作图字符由变量给出。垂直变量*程度变量=n:第n个SYMBOL语句定义的符号option-listVAIXSHAXIS=tick-value-list(标志值列表)|BY n:定义沿垂直或程度方向坐标轴相等间隔的刻度标志值,这些值可以是均匀上升或下降的,也可以不是,可以用BY

23、n规定刻度的增量。VREF(HREF)=value-list:要求在纵轴横轴的一些规定的数上作程度垂直参考线。3 By语句普通格式为:BY variable;根据BY变量定义的观测组分别画出散点图。要求输入数据已按By变量排序的次序陈列。4. SYMBOL语句普通格式为:SYMBOL ;Value|V=symbol:定义数据点的符号,有PLUS(+),是默许值;SQARE(方块);STAR(*)等I=interpolation:定义数据点的连结方式,有JOIN(直线);SPLINE(光滑曲线)等WIDTH|W=value:定义连线的宽度COLOR|C=color:定义颜色SYMBOL具有记忆性

24、,一旦运用了Symbol语句,系统就不断坚持有效直到重新定义或定义一个空Symbol为止。GPLOT实例1odata student;oinput NAME$ AGE SEX$ HEIGHT WEIGHT SCORE;oCARDS;oLiPing 23 F 171 57 620oWangHua 18 F 162 56 578oZhangP 24 M 156 45 599oGaoKe 19 F 170 55 603oLiuLiu 21 F 155 48 579oPingPing 18 M 186 65 594oHuYi 16 F 156 48 615oQueHong 19 M 178 77 58

25、0oQinYin 20 F 167 69 578oShiLei 22 F 154 42 588o;oproc gplot;oplot height*weight/vaxis=150 to 180 by 10 haxis=40 to 70 by 10;osymbol1 v=b;orun;GPLOT实例2odata cos;odo x=0 to 360 by 30;o y=cos(x*3.14/180);o output;oend;orun;oproc gplot;oplot y*x=1/HMINOR=0 VMINOR=0;osymbol1 I=SPLINE;orun;GPLOT实例3odata

26、ad;oinput sales knowrate adexpend;ocards;o82 50 1.8 o80 40 1.8o80 40 1.8o46 45 1.2 o17 15 0.4o21 15 0.5o112 70 2.5 o105 75 2.5o65 60 1.5o55 40 1.2o80 60 1.6o43 25 1.0o79 50 1.5o24 20 0.7o30 30 1.0o11 5 0.8o;oproc gplot;o symbol;o plot sales*knowrate/haxis=0 to 80 by 20 vaxis=0 to 120 by 20;o symbol

27、v=star;orun;oproc sort;o by adexpend;orun;oproc gplot;o plot sales*adexpend/haxis=0 to 3 by 0.5 vaxis=0 to 120 by 20;o symbol v=star i=spline c=red width=2;orun;6.5 GCHART过程GCHART产生的图形由三个要素决议:图形表示方法的选择:垂直条形图(VBAR)、程度条形图(HBAR)、 块形图(BLOCK)、饼形图(PIE)、星图(STAR)汇总统计量的选择:频数(TYPE=FREQ)、百分数(TYPE=PCT)、累计频数(TYP

28、E=CFREQ)、累计百分数(TYPE=CPCT)、总和(TYPE=SUM)、平均值(TYPE=MEAN)分组特性的选择:用于分组的变量选项DISCRETE、用于并排分组的选项GROUP=、用于分子组的选项SUBGROUP=、对延续变量用区间中点定位的选项MIDPOINTS=、选项SUMVAR=规定搜集对均值、总和、或频数的汇总变量GCHART过程的普通格式PROC GCHART; 必选的语句 BY variable-list; 可选的语句 VBAR variable-list以下至少选其一 HBAR variable-list BLOCK variable-list PIE variable

29、-list STAR variable-list GCHART过程的语句阐明1. PROC GCHART;其后的选项主要是指定作图所用的数据集,默以为最新的数据集。2. VBAR、HBAR、 BLOCK、 PIE和STAR语句:这几个语句的格式、选项和用法根本一样,仅以VBAR为例阐明。 VBAR variable-list 该语句表示根据给定的变量作垂直条形图,在垂直轴上可描画频数、累计频数、百分数、累计百分数、均值。在每不断条的下面是指定的变量的值。对于字符或离散型变量,该值为实践值,对于延续数值变量,该值表示间隔的中间值。规范选项oVAXIS(HAXIS)=tick-value-list

30、|BY n:定义沿垂直或程度方向坐标轴相等间隔的刻度标志值,BY n规定刻度的增量。oDISCRETE:用来指明数值图表变量是离散的而不是延续的,默以为一切数值都是延续的。假设没有规定MIDPOINTS或LEVELS,过程自动选择图表的间隔。oLEVELS=number:规定延续变量所作图形的个数。oMIDPOINTS=value :经过规定每个图表或线段表示的区间中点来定义图表变量的变化范围。当没有规定该选项时,系统将自动选择图形的间隔。oSUMVAR=variable:按指定的变量分组求和、均值或频数。当与TYPE连用时,假设TYPE规定的不是MEAN、SUM时,将对SUMVAR指定的变量

31、求和,TYPE的规定将无效。oTYPE=statistic: 规定图形代表的统计量的值。缺省时为FREQ,当规定了选项SUMVAR,缺省时为SUM。用于VBAR、HBAR和BLOCK的选项 GROUP=variable:产生并排的图表,每个图表代表GROUP变量含有的知值的一组观测。SUBGROUP=variable:用不同字符对每个条图按SUBGROUP变量对该条图奉献大小细分为几部分。GCHART实例1odata student;oinput NAME$ AGE SEX$ HEIGHT WEIGHT SCORE;oCARDS;oLiPing 23 F 171 57 620oWangHua

32、18 F 162 56 578oZhangP 24 M 156 45 599oGaoKe 19 F 170 55 603oLiuLiu 21 F 155 48 579oPingPing 18 M 186 65 594oHuYi 16 F 156 48 615oQueHong 19 M 178 77 580oQinYin 20 F 167 69 578oShiLei 22 F 154 42 588o;oproc GCHART;ovbar sex;ovbar sex/group=age;ovbar sex/sumvar=age;orun;GCHART实例2odata gdp;oinput year

33、$ property$ gdp;ocards;o2000 first 14628.2o2000 second 44935.3o2000 third 29878.7o2001 first 14609.9o2001 second 49069.1o2001 third 32254.3o2002 first 14883.0o2002 second 52982.4o2002 third 34533.2o;oproc gchart;oblock year/subgroup=property sumvar=gdp;orun;GCHART实例3ooptions ls=78 ps=60;odata sales;oinput dept$

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论