已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
几种描述性统计分析的SAS过程简介,PROC MEANS过程 计算SAS数据集中各变量值的位置、分散性、分布形状等数字特征。 基本语句: PROC MEANS options; VAR variables; OUTPUT OUT=dataset name keyword=name ; RUN; 说明: (a) “options”一般选项为: (i)以DATA=SAS dataset name指定所分析的SAS数据集名称; (ii) 指定欲计算的特征数字名称(关键词,由SAS系统规定), 包括 N, MEAN, STD, VAR, MIN, MAX, RANGE, SUM, USS, CSS, SKEWNESS, KURTOSIS等。,(b): “variables”指定要计算前面所列数字特征的SAS数据集中的变 量名称(须是数值型变量)。 (c): 第三句建立一个包含指定分析结果的SAS数据集,其中“dataset name”为用户指定数据集名称;“keyword”可以是前面关键词的 任一个,等号后的“name”为用户赋予的相应关键词的新名称(若 省略,则系统以原变量的名称作为相应结果的名称)。 例如:若“variables”部分为: X1 X2 X3, 若用 OUTPUT OUT=results MEAN= VAR=; 则这三个变量的均值和方差仍用X1, X2, X3命名。 若用 OUTPUT OUT=results MEAN=MX1 MX2 MX3 VAR=VX1 VX2 VX3; 则这三个变量的均值以此命名为:MX1 MX2 MX3; 方差依次命 名为:VX1 VX2 VX3。,2. PROC UNIVARIATE过程 此过程除可完成PROC MEANS过程类似的一些分析外,还具有计 算数据的分位数、绘制茎叶图和QQ图、对数据进行正态性检验等功能。 基本语句: PROC UNIVARIATE options; VAR variables; OUTPUT OUT=dataset name keyword=name ; RUN; 说明: (a) “options”部分的选项包括: (i) DATA=SAS dataset name: 指定欲分析的SAS数据集名称; (ii) PLOT: 要求对所分析的各变量的观测值产生一个茎叶图和一 个正态QQ图; (iii) NORMAL: 要求对各变量的观测值作做正态性检验并输出检 验统计量的观测值及检验p-值(n2000, Kolmogorov-Smirnov检验)。,(b) 该过程第二句和第三句的用法与PROC MEANS过程基本相同,只 是在“keyword=name”中的“name”不可省略,必须由用户给相应关 键词赋予具体名称。 (c) PROC UNIVARIATE过程的默认输出结果除包括PROC MEANS 中全部关键词所对应的特征数字以及中位数等外,还有如下关键 词选项: Q1: 下四分位数; Q3: 上四分位数; QRANG: 四分位极差; P1: 1%分位数; P5: 5%分位数; P10: 10%分位数; P90: 90%分位数; P95: 95%分位数; P99: 99%分位数。,3. PROC CAPABILITY过程 该过程除具有PROC UNIVARIATE过程同样的分析功能外,还可以 画QQ图、直方图、经验分布函数曲线、拟合参数分布函数以及概率密度 函数并进行相应的假设检验等。 (1)画直方图 基本语句为: PROC CAPABILITY options; HISTOGRAM variables/options; RUN; 说明: (a) 第一句中的“options”可包括下列选项: (i) 以DATA=SAS dataset name指出欲分析的数据集名称; (ii) GRAPHICS: 要求作高分辨率图(只适用低版本); (iii) NOPRINT: 阻止输出有关变量的描述性分析结果。,(b) 第二句中的“variables”用以指定作直方图的变量(一个或多个) 名称,“options”部分可以包括下列选项: (i) MIDPOINT=variables: 设置分组区间的中点值(等间隔,其 值依次列出)。或用 MIDPOINT=a TO b BY c 指定区组。省略时系统自动分组; (ii) VSCALE=COUNT(或PERNT或PROPOTION):指定纵轴为 频数(或分数或频率); (iiI) NORMAL (或LOGNORMAL, GAMMA, WEIBULL, BETA, EXPONETIAL): 要求在相应直方图上拟合制定分布的概率 密度函数,其中的参数系统直接用极大似然估计代替,也可 在其后加括弧有用户指定(具体见教材P266)。 此外,还对所拟合的分布输出分布拟合检验(包括:卡 方,Kolmogonov-Smirnov, Anderson-Darling, Cramer-von Mises)统计量的值及其检验p-值。,(2)作经验分布函数曲线及拟合的分布函数曲线 基本语句为: PROC CAPABILITY options; CDFPLOT variables/options; RUN; (3)作QQ图 基本语句为: PROC CAPABILITY options; QQPLOT variables/options; RUN; 说明:上述两个过程中的选项与作直方图的过程的用法基本相同。 更详细的解释见教材P266。,4. PROC CORR过程 该过程主要用于计算SAS数据集中各数值变量间的协方差矩阵和 相关系数(包括Pearson相关系数阵和Spearman相关系数阵)矩阵, 并且在各对变量的相关系数下的括号中给出检验响应相关系数是否为零 的检验p-值。此外,此过程还自动输出一些描述性统计量(如各变量的 均值、标准差等等)。 基本语句为: PROC CORR options; VAR variables; WITH varibles; RUN; 说明: (a) 第一句中“options”可包括如下选项: (i) DATA=SAS dataset name 指定所分析的SAS数据集; (ii) PEARSON: 要求输出Pearson相关系数矩阵;,(iii) SPEARMAN: 要求输出Spearman相关系数矩阵; (iv) COV: 要求输出协方差矩阵; (v) NOSIMPL
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年砖瓦工技能考试题及答案
- DB1309T 316-2025 地理标志产品 黄骅梭子蟹生产管理技术规程
- 肋骨间隙的定位课件
- 2025年仓库管理员岗位招聘面试参考题库及参考答案
- 2025年情报分析师岗位招聘面试参考题库及参考答案
- 2025年影视制作岗位招聘面试参考试题及参考答案
- 2025年旅游销售专员招聘面试参考题库及答案
- 双碳目标路径规划-洞察与解读
- 2025年行政助理招聘面试题库及参考答案
- 2025年广告策划专员岗位招聘面试参考试题及参考答案
- T∕CECS 21-2024 超声法检测混凝土缺陷技术规程
- 【MOOC】市场调查与研究-南京邮电大学 中国大学慕课MOOC答案
- 2024年全国网络安全行业职业技能大赛(网络安全管理员)考试题库-下(多选、判断题)
- (正式版)SHT 3551-2024 石油化工仪表工程施工及验收规范
- 浅谈国企差异化培训模式建立与实践
- 工匠精神读本第三讲职业技术培训职业教育教育专区
- 驾驶员满意度调查表
- 乙肝两对半的意义课件
- 城市轨道交通企业班组管理PPT完整全套教学课件
- 儿内科消化系统疾病诊疗规范2023版
- 1例高脂血症性急性胰腺炎护理查房
评论
0/150
提交评论