SAS软件应用之统计图ppt课件_第1页
SAS软件应用之统计图ppt课件_第2页
SAS软件应用之统计图ppt课件_第3页
SAS软件应用之统计图ppt课件_第4页
SAS软件应用之统计图ppt课件_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第25章章 统计图统计图学习目的 了解统计图的特点; 熟习统计图绘制的普通原那么; 掌握根据数据特征选择统计图的方法; 掌握各种统计图的意义以及绘制统计图的SAS程序。概述 统计图是用点、线、面、体来笼统地表达数量资料的1种方式,常用的统计图有条图(棒图)、圆图(饼图)、统计地图、线图、直方图、散点图等。 统计图的种类很多,应根据资料的类型和目的选用适宜的统计图。定性资料可选用的统计图有条图、圆图、统计地图等;定量资料可选用的统计图有直方图(或多边图)、普通线图、半对数线图、散点图等。不同的统计图,以不同的方式或姿态来笼统化地表达资料。因此,掌握各种统计图的特征,有助于正确选用统计图。统计图

2、制造的普通原那么 根据资料性质和分析目的正确选用适当的统计图。例如分析比较独立的、不延续的、无数量关系的多个组或多个类别的统计量宜选用直条图,分析某目的随时间或其它延续变量变化而变化的趋势宜选用线图,描画某变量的频数分别宜选用直方图,描画或比较不同事物内部构成时用圆图或百分条图等。统计图制造的普通原那么统计图必需有标题、概括统计图资料的时间、地点和主要内容。统计图的标题在图的下方。统计图普通有横轴和纵轴,并分别用横标目阐明横轴和纵轴代表的目的和单位。普通将两轴的相交点即原点处定为0。统计图用不同线条和颜色表达不同事物和对象的统计量,需求附图加以阐明。直条图 直条图用来表示各相互独立的统计目的的

3、数量大小。通常,纵轴表达数量,横轴表达分组标志。用绝对数或相对数均可表达数量,其数量大小用图中各长条的高度来反映。直条图用一样宽度的直条长短表示相互独立的某统计目的值的大小。直条图按照是横放还是竖放分卧式和立式两种,按对象的分组是单层次和两层次分单式和复式两种。直条图 直条图的直条尺度必需从0开场,各直条的宽度相等,间隔普通与直条等宽或为其一半。直条陈列的顺序可按目的值大小陈列,也可按分组的自然顺序陈列。GCHART过程步 SAS系统中采用GCHART过程步绘制直条图。 GCHART过程步的语法格式如下: PROC GCHART DATA= 选项 ; HBAR / 选项 ; VBAR / 选项

4、; BLOCK / 选项; PIE / 选项; STAR / 选项; AXISn 选项; BY ; RUN;GCHART过程步 HBAR选择项指令系统绘制立式直条图。 VBAR选择项指令系统绘制程度直条图。 BLOCK选择项指令系统绘制三维直方图。 PIE选择项指令系统绘制饼图。 STAR选择项指令系统绘制星状图。 AXISn选择项控制坐标轴的外形和颜色。 BY选择项指令系统按该变量取值分层绘制,要求数据集已按该变量排序。GCHART过程步 MISSING指定绘图时要将变量的缺失值也包括在内。 TYPE=做图类型关键字,指定要做图的类型,即图中条块代表的含义:缺省值是频数FREQ;假设指定了选

5、择项SUMVAR,那么缺省值为总和SUM。可选的关键字有: FREQ要求按指定变量的频数做图。 PERCENT要求按在横轴刻度表示范围内出现的频数占总数的百分比做图。 CFREQ,按累计频数做图。 CPERCENT,按累计百分比做图。 GCHART过程步 SUM只能与SUMVAR选项同时运用,要求图中的每一条代表:变量在横轴表示的取值范围内时,SUMVAR指定变量的总和。 MEAN只能与SUMVAR选项同时运用,要求图中的每一条代表:变量在横轴表示的取值范围内时,SUMVAR指定变量的均数。 SUMVAR=求和变量,指定运用TYPE=SUM或MEAN时,用于求总和、均值的变量。 GCHART过

6、程步 LEVAL=n,假设绘图变量是延续变量,用该选项产生有N个组段的图形。 GROUP=分组变量,要求产生以分组变量的值分组的并排图。 SUBGROUP=亚组变量,要求每个图形内部再按亚组变量的值分块。 CAXIS=颜色,指定坐标轴的颜色。 CTEXT=颜色,指定坐标轴文本的颜色。百分条图和圆图 圆图用来表示事物内部的构成情况。必需用相对数,且各项之和为100,图中各扇形面积表示数量的大小,将360度圆心角看成100,把每一部分所占的百分数折算成圆心角的度数,根据圆心角的度数就可画出代表各部分数量大小的扇形来。百分条图是以矩形总长度作为100,将其分割成不同长度的段来表示各构成的比例。圆图和

7、百分条图适宜描画分类变量的各类别所占的构成比。线图 线图也称折线图,是用线段的升降来表示数值的变化,适宜于描画某统计量随另一延续性数值变量变化而变化的趋势。它分为普通线图和半对数线图。普通线图,资料中包含着2个计量目的,放在横轴上的计量目的通常是时间,放在纵轴上的计量目的通常是某种率。画图时,纵、横轴上的尺度一概用算术尺度。它适宜于表达1个或多个事物或景象随着时间的推移,数量的增减幅度。GPLOT过程步 SAS系统中采用GPLOT过程步绘制线图。 GPLOT过程步的语法格式如下: PROC GPLOT DATA= 选项 ; PLOT / 选项; PLOT2 / 选项; SYMBOLn 选项;

8、BY ; RUN;GPLOT过程步 PLOT2选择项指令系统在原图根底上重叠绘制第二幅散点图。 SYMBOLn选择项定义符号、添加趋势线、定义点和线的颜色。 BY选择项指令系统按该变量取值分层绘制,要求数据集已按该变量排序 UNIFORM要求用BY语句分组打印的散点图的坐标刻度一样,便于比较。 VTOH=数值,指定纵横坐标的比例。 OVERLAY,同一语句做的图重叠在同一个坐标系中显示。 GPLOT过程步 HAXIS=数值,定义横坐标的刻度。 VAXIS=数值,定义纵坐标的刻度。 CAXIS=颜色,定义坐标轴的颜色。 CTEXT=颜色,定义坐标轴文本的颜色。 I=连线方式:JOIN用直线衔接;

9、SPLINE用光滑的曲线衔接;NEEDLE向横坐标画垂线;RL添加回归直线。 WIDTH=宽度,定义数据点和连线的宽度。 COLOR=颜色,定义数据点和连线的颜色。半对数线图半对数线图 半对数线图是一种根本的统计图形,特别适宜作不同目的变化速度的比较,它与普通线图习惯简称线图一样均可经过线段的上升或下降来表示一个目的随另一目的常为时间变化而变化的情况。两者的区别在于普通线图的横、纵坐标均为算术尺度,在某两个不同的时间段上,假设终点相对于起点的“绝对改动量一样,将在图形上表现为一样的增幅或减幅,直观呈现的是数量变化的态势; 半对数线图半对数线图 半对数线图的横坐标仍为算术尺度如时间,纵坐标指示的

10、察看目的常为研讨的目的,如发病率、病死率等那么实施了对数转换即对数尺度,在某两个不同时间段上,假设终点相对于起点的“相对改动量一样,将在半对数线图上表现为一样的增幅或减幅,所以半对数线图适用于呈现事物开展变化的速度。 半对数线图半对数线图 故两种图形从不同的角度反映被察看目的的变化情况,但二者的意义和适用场所区别甚大,运用时要根据详细情况正确选用。假设研讨者一概运用普通线图来反映动态数据的变化情况,那么能够导致无法正确呈现资料所蕴涵的信息。半对数线图半对数线图 当研讨两组或多组数据的变化情况时,普通线图用来阐明研讨目的的动摇态势,半对数线图用来阐明研讨目的的变化速度。以两个察看目的和变化速度的

11、比较为例,在某一时间段当目的发生10100的变化、目的发生1001000的变化时,“绝对增长量分别是90和900,相差较远;“相对增长量却都是10倍于起点程度。 半对数线图半对数线图 显然,变化速度的比较所注重的正是“相对增长量,因此,普通线图不能对目的、的变化速度相等均为10倍这一现实给予正确呈现。正确的做法应该是纵坐标采用对数尺度与线性尺度的横坐标构成所谓的“半对数线图,那么前述设定的时间段上的目的变化量lg100lg10,目的变化量lg1000lg100,提示目的与的开展变化速度相等。箱图 箱线图是由一组数据的5个特征值绘制而成的,它由一个箱子和两条线段组成。5个特征值依次是最大值、上四

12、分位数、中位数、下四分位数和最小值。经过箱线图,可以反映出数据分布的特征。 箱线图普通有单批数据箱线图和多批数据箱线图两种。 在SAS系统中经过UNIVARAITE过程步就可以绘制箱线图。散点图 散点图表示两种事物变量的相关性和趋势。医学上常用于察看两种生理目的之间的动态变化关系,或临床上两项检测结果之间的量变关系。资料中包含着2个计量目的,假设2变量之间有自变量与因变量之分时,通常把自变量放在横轴上,把因变量放在纵轴上。将成对的数据(X, Y)在直角坐标系中用圆点表示出来,就称为散点图。它可以笼统地反映出在专业上有一定联络的2个延续变量之间的变化趋势,可借助它协助判别能否值得进展直线相关和回

13、归分析或拟合何种类型的曲线方程。直方图 数值型数据表现为数字,在整理时通常进展数据分组。分组是根据统计研讨的需求,将数据按照某种规范分成不同的组别。直方图是用矩形的宽度和高度来表示频数分布的图形。用横轴表示数据分组,纵轴表示频数或频率。直方图 直方图是以直方面积描画各组频数的多少,面积的总和相当于各组频数之和,适宜表示数值变量的频数分布。直方图的横轴尺度是数值变量值,纵轴是频数。留意如各组组距不等时,要折合成等距后再绘图。即将频数除以组距得到单位组距的频数作为直方的高度,组距为直方的宽度。 SAS系统中经过CAPABILITY过程步绘制直方图。统计地图 统计地图用来表示事物的数量在地域上的情况

14、。如反映疾病的地域分布情况。统计地图用不同的颜色和花纹表示统计量的值在地理分布上的变化,适宜描画研讨目的的地理分布。统计地图先绘制按行政区域或地理特征分区的地图,然后按各区域统计目的值分别标志不同颜色或花纹,并加以图例阐明不同颜色或花纹的意义。留意颜色或花纹的选择最好与统计量数值增减的趋势一致。 利用SAS的GMAP可以在地图上制造二维或三维的统计图,直观地显示地域性的差别。本章小节 统计图的种类很多,应根据资料的类型和目的选用适宜的统计图。定性资料可选用的统计图有条图、圆图、统计地图等;定量资料可选用的统计图有直方图(或多边图)、普通线图、半对数线图、散点图等。不同的统计图,以不同的方式或姿

15、态来笼统化地表达资料。因此,掌握各种统计图的特征,有助于正确选用统计图。本章小节 直条图用来表示各相互独立的统计目的的数量大小。通常,纵轴表达数量,横轴表达分组标志。用绝对数或相对数均可表达数量,其数量大小用图中各长条的高度来反映。SAS系统中采用GCHART过程步绘制直条图。 圆图用来表示事物内部的构成情况。必需用相对数,且各项之和为100,图中各扇形面积表示数量的大小,将360度圆心角看成100,把每一部分所占的百分数折算成圆心角的度数,根据圆心角的度数就可画出代表各部分数量大小的扇形来。SAS系统中采用GCHART过程步绘制圆图。本章小节 线图也称折线图,是用线段的升降来表示数值的变化,

16、适宜于描画某统计量随另一延续性数值变量变化而变化的趋势。它分为普通线图和半对数线图。普通线图适宜于表达1个或多个事物或景象随着时间的推移,数量的增减幅度。SAS系统中采用GPLOT过程步绘制线图。 半对数线图是一种根本的统计图形,特别适宜作不同目的变化速度的比较,适用于呈现事物开展变化的速度。SAS系统中也是采用GPLOT过程步绘制半对数线图。本章小节 箱线图是由一组数据的5个特征值绘制而成的,它由一个箱子和两条线段组成。5个特征值依次是最大值、上四分位数、中位数、下四分位数和最小值。经过箱线图,可以反映出数据分布的特征。在SAS系统中经过UNIVARAITE过程步就可以绘制箱线图。SAS系统

17、中需求经过BOXPLOT过程步完成多项选择数据箱线图比较。本章小节 散点图表示两种事物变量的相关性和趋势。医学上常用于察看两种生理目的之间的动态变化关系,或临床上两项检测结果之间的量变关系。在SAS系统中利用GPLOT过程绘制散点图。 直方图是以直方面积描画各组频数的多少,面积的总和相当于各组频数之和,适宜表示数值变量的频数分布。直方图的横轴尺度是数值变量值,纵轴是频数。SAS系统中经过CAPABILITY过程步绘制直方图。本章小节 统计地图用来表示事物的数量在地域上的情况。如反映疾病的地域分布情况。统计地图用不同的颜色和花纹表示统计量的值在地理分布上的变化,适宜描画研讨目的的地理分布。利用S

18、AS的GMAP可以在地图上制造二维或三维的统计图,直观地显示地域性的差别。第第3章章 SAS宏编程宏编程学习目的 掌握宏变量的定义以及援用; 熟习宏变量的特殊用法; 掌握宏的定义; 掌握宏的调用;SAS宏功能 将一个变量,一段程序或者一个文本命名,供以后调用,是用于扩展和制做用户化SAS系统的工具;利用宏功能用户可以减少在完成一些共同义务时必需输入的文本量。当用户在某个SAS程序中运用宏功能时,这个宏功能产生所需求的SAS语句和命名,SAS系统的其他部份接受这些语句和命令。 SAS宏的主要功能 获取SAS的系统信息。SAS在启动时就创建了一些自动宏变量,用以存储当前SAS进程启动的日期,时间,

19、版本号及其它信息,用户可以在任何情况下运用这些宏变量。有条件的执行数据步和过程步。例如每天提交一份消费情况的详细报告,每周五添加一份汇总报告。运用宏功能每天运转同一个程序就可以实现上述义务。开发交互式系统。运用SAS宏言语的%WINDOW语句及一些根本的编程语句可开发交互式用户界面。SAS宏的主要功能 产生与数据无关的SAS程序,但可展现与数据相关的结果。宏功能可坚持SAS程序的独立性和移植性。一段程序在多种情况下均可运转,得到期望的结果。 在不同的SAS数据步和过程步之间传送数据。SAS宏变量可在SAS的任何地方被援用,具有全局性,所以成为不同过程间传送数据最方便的手段。 反复执行SAS程序

20、码。凡用到SAS宏言语的变量和言语成分,都以符号%或&开场。当SAS程序提交后,在编译阶段,系统对程序逐词扫描过程中,凡遇到%或&开场的词,就启动宏言语处置器对此进展处置。宏变量 宏变量属于SAS宏言语,但不同于DATA步变量。可以在SAS程序除数据行之外的任何地方定义并运用宏变量。一个DATA步变量仅与一个SAS数据集有联络,而宏变量不依赖于SAS数据集。宏变量与数据步中变量的主要区别是,数据步中变量的值往往与被处置观测有关,而宏变量有独一确定的值,一个宏变量存放的值坚持不变直到被修正。宏变量 宏变量具有独一确定的值,可以存储字符串,是全局变量。可以在数据步中被援用,但不能在

21、数据步中用赋值语句定义。援用时,在变量名前加“&号,援用效果是变量值替代变量名。宏变量在援用时放在单引号之间不会被解读,只能在双引号之间。宏变量的产生 SAS系统包含两种类型的宏变量: 自动宏变量,由SAS系统提供; 用户定义的宏变量,由用户在程序中定义。自动宏变量 在SAS进程开场时,或程序运转过程中由系统自动创建,在SAS退出前不断坚持有效,是全局宏变量,能在SAS任何地方被援用。以下是一些主要的自动宏变量: SYSDATE SAS进程开场的日期; SYSDATE9 以Date9.格式显示SAS进程开场的日期; SYSTIME SAS进程开场的时间; SYSSCP 运用的操作系统;

22、 SYSDAY SAS进程开场是为星期几; SYSVER SAS的版本; SYSLAST 最新创建的SAS数据集的名字; 定义宏变量 有两种方式定义宏变量:%LET和call symput。定义宏变量并分配一个值给宏变量的最简一方法是运用宏程序语句%LET。格式如下: %LET 变量名=变量值; 另一个语句就是call symput,其格式如下: call symput(变量名,变量值);宏变量的援用 为了援用一个宏变量的值,放一个&号在宏变量名字的前面 方式&name成为宏变量的援用。用户创建宏变量之后,可以在SAS程序中援用它。 %let exa=score; title

23、“display of student &exa; 宏处置器用宏变量EXA的值替代&exa,SAS系统看到的是下面的TITLE语句: title “display of student score; 多次援用宏变量 用户根据SAS程序中的需求可以多次援用宏变量。宏变量的值坚持不变直到其被修正。 每次出现援用&exa,宏处置器用score替代它。 改动宏变量的值 在上例中,假设用户想要改动SAS数据集名字,可以在它出现的这段程序中经过改动宏变量的值来实现 嵌套宏变量援用 可以运用嵌套的宏变量援用来改动一个长的宏变量值而不用重新定义这个变量。例如,为了改动在PROC PLO

24、T步中的两个画图变量,在PLOT的这个值中运用宏变量援用。 宏的定义 宏是一个被存贮的文本,用一个名字识别它。最简单的宏就像一个宏变量一样任务,但复杂的宏可以完成许多宏变量不能做的事。定义宏的语句格式为: %MACRO 宏称号; 宏文本 %MEND ;(默许存放在work.sasmacr中); %MACRO语句是每一个宏的开场,同时必需给出这个宏的名字。宏名字的命名准那么与SAS名字一样。宏的文本也就是宏的内容,宏内的字符串称为固定文本或模型文本,该文本将变为用户SAS程序的一部分。%MEND语句必需围住每个宏并表示宏的引见。%MEND语句也可以放上宏名字来阐明该宏已终了。 宏的调用 为了调用

25、一个宏,放一个百分数符号%在宏名字前面就可以了,比如:%study 方式“%宏称号称为宏的调用。当用户定义一个宏之后,可以在SAS程序中调用它,如: Title “Display of school %study; 宏处置器执行宏STUDY,把宏里面的固定文本替代到TITLE语句中。TITLE语句变为: Title “Display of school Student score;宏的调用 SAS程序可以包括恣意多个宏,且在一个程序中可以多次调用一个宏。对于简单文本的阐明,运用宏变量比定义一个宏更有效。然而,当义务比较复杂时,宏比宏变量更有优势。 把宏变量和宏结合在一同,将给出一种用宏工具编程

26、的强有力的方法。下面我们将引见在宏中运用宏变量的多种方法。宏参数 可以定义宏变量作为%macro语句的一部分,如: %macro printClass(class); proc print data=&class; run; %mend printClass; 被定义在一个%macro语句括号内的宏变量称为宏参数。当调用这个宏时只需给出这些参数的值, %printClass(sashelp.class) 宏处置器把第一个值给第一个宏变量名字,第二个值给第二个宏变量名字,以此类推因此这些参数也称为位置参数。以上这个宏执行后生成下面语句: proc print data=sashelp.c

27、lass; run;宏参数 对参数分配的值只在这个宏执行过程中有效。因此第二次调用宏时,还是要给出参数的值。宏参数是部分宏变量的一个例子。而宏变量是从用户创建它们直到SAS作业或SAS会话终了都存在;故前面引见的宏变量为全局宏变量。 运用参数有以下几个优点: 用户可以少写几个%LET语句; 调用宏时不需求知道这些参数的名字,只需求提供这些值的类型; 运用参数可以保证该变量在宏之外的程序部份不会被援用。宏的循环构造 宏的循环语句有三种类型,分别是 宏中DO循环语句的格式为: %do 目的变量=始点 %to 终点BY 增量; 文本或宏程序语句; %end; %do %while(表达式); /*先

28、判别再执行*/ 文本; %end; %do %until(表达式); /*先执行再判别*/ 文本; %end;宏的循环构造 以生成反复的文本段为例阐明如何运用宏的循环构造。假定用户想生成一系列名字用于某个SAS语句。可以写一个宏来产生具有一样前缀的一系列名字。 用例如阐明宏CREATE用反复%DO循环开生成名字:本章小节 SAS宏功能将一个变量,一段程序或者一个文本命名,供以后调用,是用于扩展和制做用户化SAS系统的工具;利用宏功能用户可以减少在完成一些共同义务时必需输入的文本量。引见了SAS宏的主要功能,包括:获取SAS的系统信息、有条件的执行数据步和过程步、开发交互式系统、产生与数据无关的

29、SAS程序但可展现与数据相关的结果、在不同的SAS数据步和过程步之间传送数据和反复执行SAS程序码。我们对SAS宏功能作略微了解。本章小节 宏变量属于SAS宏言语,但不同于DATA步变量。宏变量具有独一确定的值,可以存储字符串,是全局变量。SAS系统包含两种类型的宏变量:自动宏变量,由SAS系统提供;用户定义的宏变量,由用户在程序中定义。有两种方式供用户定义宏变量。为了援用一个宏变量的值,放一个&号在宏变量名字的前面。经过对本节对宏变量的引见,我们需求留意宏变量与数据步变量的区别,了解两种类型的宏变量,掌握如何定义宏变量。本章小节 本章论述了援用宏变量的四种方式:多次援用宏变量、改动宏

30、变量的值、创建包含SAS语句的宏变量值和嵌套宏变量援用。同时,引见了宏变量的一些特殊用法,包括%STR宏函数、%eval宏函数、%sysfunc宏函数、字符串中援用宏变量、在数据步执行中生成宏变量和%symget宏函数。我们需求掌握援用宏变量的方法,并了解其特殊用法。 本章小节 详细讲解了宏的定义和调用问题,尤其是在宏中运用宏变量的方法,包括宏参数、宏调用宏、宏的分支构造、宏的循环构造。文章用实例阐明了各种运用方法以及留意要点,在学习过程中,我们需求深化理睬这些实例的含义。经过本章的学习需求掌握定义宏的语句格式以及如何调用定义的宏。并在学习中留意宏与数据步中条件表达式的区别。SAS输出传送系统

31、ODS 学习目的 熟习ODS的功能以及传送目的; 掌握几类常见的ODS语句格式; 掌握常见的ODS语句的作用、运用以及本卷须知;ODS功能 在以前各章提到的数据及其加工结果的输出中,最常用的方式是在OUTPUT窗口以文本的方式显示分析结果,而图形那么在GRAPH窗口显示图形。这些显示方法都有一定的局限性: 在OUTPUT窗口的结果不便于转换成SAS数据集作进一步的分析处置; 在OUTPUT窗口是等宽的字体列表方式显示的,它的表格无法在其它字体的环境下运用; 每个过程提交后其输出是一个整体,难于进展挑选。ODS功能 SAS系统中仅有部份过程可以将输出的结果存为SAS数据集,而且存入SAS数据集的数据也不全面。此外,为了便于利用INTERNET进展交流沟通,迫切需求将数据加工输出的各种信息存为HTML超文本文件格式。基于以上思索,SAS系统开场提供了ODSOutput Delivery System输出传用系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论