




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、定量资料的统计描述定量资料的统计描述 SAS中的中的univariate过程、过程、means过过程、程、summary过程过程tabulate过程可用于过程可用于定量资料的统计描述。定量资料的统计描述。 相同点相同点 不同点不同点一、一、UNIVARIATE过程基本格式过程基本格式 proc univariate 选项选项; by 变量名称(分组变量);变量名称(分组变量); class 变量名称(分组变量);变量名称(分组变量); freq 变量名称(数值变量,用以表示相应记录出现的频数)变量名称(数值变量,用以表示相应记录出现的频数) weight 变量名称(数值变量,用以表示相应记录的
2、权重系数)变量名称(数值变量,用以表示相应记录的权重系数) histogram 变量名称变量名称/绘图选项绘图选项 output var 变量名称(待分析的数值变量);变量名称(待分析的数值变量); run;选择项选择项DATA= 指定要分析的数据集名指定要分析的数据集名NOPRINT 禁止统计结果在禁止统计结果在OUTPUT视窗中输出视窗中输出 NORMAL 对变量进行正态性检验对变量进行正态性检验PLOT 生成统计图生成统计图 注:在注:在proc语句中的选项直接跟在语句中的选项直接跟在proc名名后,以空格分隔,中间不加后,以空格分隔,中间不加“/” ,其他命令语,其他命令语句的选项需以
3、句的选项需以“/” 分隔。分隔。二、二、MEANS过程过程的基本格式的基本格式 proc means 选项列表;选项列表; by 变量名称(分组变量);变量名称(分组变量); class 变量名称(分组变量);变量名称(分组变量); freq 变量名称(数值变量)变量名称(数值变量) weight 变量名称(数值变量)变量名称(数值变量) var 变量名称(待分析的数值变量);变量名称(待分析的数值变量); run;选择项选择项data= 指定要分析的数据集名指定要分析的数据集名maxdec= 指定输出结果的小数位数指定输出结果的小数位数,默认为默认为7位位noprint 禁止统计结果在禁止统
4、计结果在output窗输出窗输出alpha= 设定计算可信区间的设定计算可信区间的水平,默认为水平,默认为0.05 当无选择项时,当无选择项时,MEANS过程默认为每个变过程默认为每个变量输出五个统计值:量输出五个统计值:N、MIN、MAX、MEAN、STD。 OUTPUT 关键字关键字= /*将分析结果输出到将分析结果输出到SAS 数据集数据集*/OUT= 数据集名数据集名 /*指定指定SAS数据集名称数据集名称*/关键字关键字= /*指定要输出的统计量指定要输出的统计量*/ 可输出的有可输出的有N, MEAN, STD, MIN,MAX,RANGE, SUM, VAR,USS(平方和平方和
5、), CSS(离均差平离均差平方和方和),CV,STDERR, T, PRT, SKEWNESS, KURTOSIS, LCLM,UCLM(同时指定输出为双侧;同时指定输出为双侧;如只选一个,输出单侧可信区间)。如只选一个,输出单侧可信区间)。 可以重新对统计量命名,也可用原名:可以重新对统计量命名,也可用原名: 格式格式 n=n mean=mean prt=p三、三、SUMMARY过程的基本格式过程的基本格式 proc summary 选项列表;选项列表; by 变量名称(分组变量);变量名称(分组变量); class 变量名称(分组变量);变量名称(分组变量); freq 变量名称(数值变
6、量)变量名称(数值变量) weight 变量名称(数值变量)变量名称(数值变量) output var 变量名称(待分析的数值变量);变量名称(待分析的数值变量); run;四、四、TABULATE过程的基本格式过程的基本格式 proc tabulate 选项列表;选项列表; by 变量名称(分组变量);变量名称(分组变量); class 变量名称(分组变量);变量名称(分组变量); freq 变量名称(数值变量)变量名称(数值变量) weight 变量名称(数值变量)变量名称(数值变量) table , var 变量名称(待分析的数值变量,统计量列入变量名称(待分析的数值变量,统计量列入相应
7、的表单元格);相应的表单元格); run; VAR语句语句 如果只想分析某一个或几个特如果只想分析某一个或几个特定的变量,则可用定的变量,则可用VAR语句指定它们。例如只语句指定它们。例如只想显示变量想显示变量x的列表,则的列表,则PRINT过程如下:过程如下: proc print ; var x; run; 如果想显示如果想显示x和和y两个变量,则将两个变量,则将VAR语句语句改为如下形式即可:改为如下形式即可: var x y; Where语句语句 如果你想处理的不是整个数据如果你想处理的不是整个数据集而只是其中符合某种条件的子集,可以应用集而只是其中符合某种条件的子集,可以应用WHER
8、E语句,如上例中我们只想显示大于语句,如上例中我们只想显示大于50的的x变量的值,则在变量的值,则在PRINT过程中加入过程中加入where语句如语句如下:下: where x50; 如果条件变为如果条件变为x、y两个变量的值都要大于两个变量的值都要大于50,则则where语句改为:语句改为:where x50 and y50; By语句语句 如果你需要分组处理数据,例如要按如果你需要分组处理数据,例如要按性别分组输出统计结果,可以采用性别分组输出统计结果,可以采用by语句。如上例语句。如上例我们想按不同的我们想按不同的y值输出值输出x值,则加入值,则加入by语句如下:语句如下: by y;
9、使用使用BY语句要求数据集已经按语句要求数据集已经按BY语句中指定语句中指定的变量排序。如果没有排序,则程序无法正确运行。的变量排序。如果没有排序,则程序无法正确运行。可以用可以用SORT过程来排序,语法结构如下:过程来排序,语法结构如下: PROC SORT DATA=数据集名;数据集名; BY 变量名列;变量名列; RUN; 相同点:相同点:他们均可计算出均数、标准差、他们均可计算出均数、标准差、方差、标准误、总和、加权值的总和、最大方差、标准误、总和、加权值的总和、最大值、最小值、全距、校正的和未校正的离差值、最小值、全距、校正的和未校正的离差平方和、变异系数、样本分布位置的平方和、变异
10、系数、样本分布位置的t检验统检验统计量、遗漏数据和有效数据个数等,均可应计量、遗漏数据和有效数据个数等,均可应用用by语句将样本分割为若干个更小的样本,语句将样本分割为若干个更小的样本,以便分别进行分析。以便分别进行分析。不同点:不同点: means、summary、univariate过程可以计算样过程可以计算样本的偏度(本的偏度(skewness)和峰度(和峰度(kurtosis),),而而tabulate过程不计算;过程不计算; univariate过程可以计算出样本的众数(过程可以计算出样本的众数(mode); summary过程执行后不会自动给出分析的结果,过程执行后不会自动给出分析
11、的结果,须引用须引用output语句和语句和print过程来显示分析结果;过程来显示分析结果; univariate过程具有统计制图的功能。过程具有统计制图的功能。ndata ex2;ninput x f;ny=log(x);ncards;n1 12 2.5 14 10 18 40 22 160 12 640 6n;nproc means;nvar y;nfreq f;noutput out=ex2g mean=;ndata ex2a;nset ex2g;ng=exp(y);nproc print data=ex2a;nvar g;nrun;P20例2-3ndata hu1;ninput x;
12、ncards;n119.3 121.2 116.6 126.4 120.0 115.5 119.9 116.5 121.6 116.9 122.1 123.4n119.2 117.3 114.4 119.9 118.7 123.2 119.8 122.3 122.6 127.6 110.4 115.9n129.4 115.2 115.9 113.0 126.3 125.3 114.6 122.4 125.7 124.0 130.4 118.9n122.1 118.6 117.2 116.7 121.3 115.6 120.5 125.2 122.2 112.8 117.3 125.3n116.
13、7 132.2 119.3 116.4 118.2 121.7 118.6 115.2 118.0 109.7 120.5 110.3 n117.2 113.7 120.0 117.0 121.3 112.9 110.2 116.1 118.5 120.0 120.7 121.4n119.6 114.2 121.7 123.6 120.6 112.7 119.8 123.4 122.3 113.2 120.1 124.3n120.5 127.8 123.7 125.9 108.9 119.7 114.3 127.8 120.3 114.5 130.6 120.8n120.5 114.6 119.1 114.5 121.9n;nproc means maxdec=2 mean std min max;nvar x;nrun;P20例2-3ndata hu1;ninput x;ncards;n119.3 121.2 116.6 126.4 120.0 115.5 119.9 116.5 121.6 116.9 122.1 123.4n;nproc univariate ;noutput out=ab n=n mean=xbar median=m;nvar x;nhistogram x;nproc print
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 交通噪声屏障工程可行性研究报告(范文参考)
- 工业机器人升级项目可行性研究报告(范文模板)
- 新疆维吾尔自治区塔城地区塔城市2022-2023学年高二上学期期中英语 含解析
- 重庆市黔江中学2023-2024学年高一上学期10月月考语文卷 含解析
- 幼儿园乘公交车安全教育
- 郑州黄河护理职业学院《地下水水力学》2023-2024学年第二学期期末试卷
- 北京交通职业技术学院《黑白木刻版画基础》2023-2024学年第二学期期末试卷
- 绵阳飞行职业学院《商务大数据分析》2023-2024学年第二学期期末试卷
- 黎明职业大学《材料分析与测试技术实验》2023-2024学年第二学期期末试卷
- 大连航运职业技术学院《社会经济统计学》2023-2024学年第二学期期末试卷
- 自愿离婚协议书电子版
- 2025年广东省汕头市澄海区中考一模数学试题(含答案)
- 高考英语必背688个高频词汇清单
- 浙江开放大学2025年《社会保障学》形考任务1答案
- 统编版二年级语文下册第五单元自测卷(含答案)
- 北京市矢量地图-可改颜色
- 阶梯型独立基础(承台)配筋率验算
- 2010年某市人行天桥钢结构制作安装合同
- 新概念课堂笔记 第一册 Lesson 127-128
- 《汽车板材料物流配送服务技术规范》团体标准
- 四季酒店[Four Seasons]酒店培训手册(英)P48
评论
0/150
提交评论