同济医学院-《SAS》-求基本统计量过程课件_第1页
同济医学院-《SAS》-求基本统计量过程课件_第2页
同济医学院-《SAS》-求基本统计量过程课件_第3页
同济医学院-《SAS》-求基本统计量过程课件_第4页
同济医学院-《SAS》-求基本统计量过程课件_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、求基本统计量过程Procedure of descriptive statisticsSAS应用蒋红卫Email: JHWCCC21CN.COM程序选择计量资料描述性研究 集中趋势:mean median 离散程度:std variance CV range 分布检验(正态性检验)计数资料描述性研究 率(rate) 构成比(propotion) 比(ratio)MEANS过程UNIVARIATE过程过程名FREQ过程三个求基本统计量过程Means过程Univariate过程Freq过程一MEANS过程 用于计量资料(numerical data)描述性分析。求均数(mean)、标准差(stan

2、dard deviation)、最大值(maximum)、最小值(minimum)等基本统计量,产生包含统计结果的数据集以便作为其他过程的输入数据集。 1功能2格式 PROC MEANS ; VAR 变量; FREQ 变量; ID变量; BY 变量; OUTPUT 选择项; PROC MEANS ; N 无缺省值的观察数 MEAN 均值 STD 标准差 MIN 最小值 MAX 最大值 RANGE 极差 SUM 所有不缺省项变量值的和 VAR 方差 USS 未修正的平方和 CSS 修正的平方和 CV 变异系数2)统计关键字选择项STDERR 标准误 T 总体均值为0的学生t值 PRT t值的最大

3、绝对值的概率 SKEWNESS 偏度 KURTOSIS 峰度 CLM 上下可信限值 LCLM 可信限下限值 UCLM 可信限上限值 2) 统计关键字选择项3) 缺省时,自动地为每个数值型变量输出五个统计量:N、MIN、MAX、MEAN、STD。OUTPUT语句 OUTPUT OUTSAS数据集 统计关键字=变量名清单;功能:将MEANS过程产生的统计值输出到一个新的SAS数据集。OUTSAS数据集 指定计算结果放入新的数据集里。统计关键变量名清单 指明新数据集中想要的统计项,并给包含这些统计项的变量起名,这些名字将作为统计值在新数据集中使用。统计关键字为的任意统计量,变量名清单为VAR语句中的

4、变量名,可以取一个,也可以取多个。需要注意的是,LCLM,UCLM(同时指定输出为双侧;如只选一个,输出单侧可信区间)可以重新对统计量命名,也可用原名; 格式 n=n mean=mean prt=p 例1:PROC SORT DATA=CLASS1;BY SEX; PROC MEANS DATA=CLASS1; VAR HEIGHT; BY SEX;RUN; PROC MEANS DATA=CLASS1; VAR HEIGHT; OUTPUT OUT=NEW MEAN=MEANHEIGHT;RUN;Data gmean; Input x;Y=log10(x);Cards;25 30 32 34

5、 28Proc means noprint;Var y;Output out=gmean1 mean=y1;Data gmean2; Set gmean1;X1=10*y1;Proc print;Var x1;Run;例2例16-2 某地区1953至1957年人口的自然增长率为25、30、32、34、28,求平均增长率。 2功能: 求数据集中某(些)变量均数(mean)百分位数(percentiles)、极值(extremes)等基本统计量。与MEANS过程的区别在于它可以计算更多的反应数据分布的统计量。 Normal:用于正态性检验。 Plot:给出干叶图、箱式图及正态概率图,检验数据是否服

6、从正态分布。例2:测定30名正常男子血浆中性脂肪含量(mg/lw ml)的结果如下: 163 219 313 169 281 264 124 94 224 145 285 107 269 416 662 249 136 100 199 407 94 235 120 128 560 80 217 252 165 1075.12 5.13 4.58 4.31 4.09 4.41 4.33 4.58 4.24 5.45 4.32 4.844.91 5.14 5.25 4.89 4.79 4.90 5.09 4.04 5.14 5.46 4.66 4.204.21 3.73 5.17 5.79 5.4

7、6 4.49 4.85 5.28 4.78 4.32 4.94 5.214.68 5.09 4.68 4.91 5.13 5.26 3.84 4.17 4.56 3.52 6.00 4.054.92 4.87 4.28 4.46 5.03 5.69 5.25 4.56 5.53 4.58 4.86 4.974.70 4.28 4.37 5.33 4.78 4.75 5.39 5.27 4.89 6.18 4.13 5.224.44 4.13 4.43 4.02 5.86 5.12 5.36 3.86 4.68 5.48 5.31 4.534.83 4.11 3.29 4.18 4.13 4.0

8、6 3.42 4.68 4.52 5.19 3.70 5.514.64 4.92 4.93 4.90 3.92 5.04 4.70 4.54 3.95 4.40 4.31 3.774.16 4.58 5.35 3.71 5.27 4.52 5.21 4.37 4.80 4.75 3.86 5.69例3 某地随机抽取正常成年男子120名,其红细胞数如下,试作该批样本的频数表。三FREQ过程1格式: PROC FREQ data=SAS数据集; TABLES 变量*变量*变量; 2.功能:求一维或多维频数表(frequency table)。 3说明:(1)PROC FREQ :调用FREQ过程;

9、(2)data=SAS数据集:指明需处理的数据集;(3)TABLES语句:指明需要计算频数的变量以及频数表的列表方法。 如果求一维频数表,则将求频数的变量列于TABLES之后即可; 如果求多个变量的的联合频数(多维频数表或称列联表),将需要计算频数的变量用星号“*”分开,其中最后一个变量将用于列变量(纵标目),倒数第二个变量为行变量(横标目),其余变量为分层变量,每一层列一个频数表; 一个FREQ过程可以有多个TABLES语句,即可以同时列出多个频数表。TABLES语句请求式请求式由一个或多个“*”号与变量连接组成。如: TABLES A; 输出一维频数表。 TABLES A*B; 输出以A变

10、量为行、B变量为列的二 维表列联表。 TABLES A*B*C; 输出以A变量为页、B变量为行、 C变量为列的三维表列联表。 TABLES A*(BC); 等同于TABLES A*B A*C。 TABLES AB*(CD);等同于TABLES A*C A*D B*C B*D。 TABLES (A-C); 等同于TABLES A B C。TABLES 变量*变量/选择项1、选择项 请求统计假设检验选择项:CHISQ/CMH 请求附加的表格信息的选择项 : EXPECTED 打印在独立性(或齐性)假设下格子的理论频数。 MISSPRINT 带缺省值的频数列出来,但不参加统计量计算。 禁止打印选择项

11、 NOCOL 禁止打印列联表中各格的列百分数。 NOFREQ 禁止打印列联表中各格的频数。 NOPERCENT 禁止打印列联表中各格的百分数。 NOPRINT 禁止打印表格,但允许打印由CHISQ、 MEASURES、CMH和ALL所指定的统计值。 NOROW 禁止打印列联表中各格的行百分数。例3:产生一个频数表产生多个频数表产生两个变量的列联表产生三个变量的列联表按LIST格式打印列联表建立输出数据集Proc freq; Table sex*age*height; Run;Proc freq; Table height*weight/list; Run;Proc freq; Tables sex*age/out=new noprint; Proc print data

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论