版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、SAS 分析常用的过程 过程步大全为区分过程名称的拼写,故意部分小写,以便识别和记忆。 基本SAS程序代码结构:-PROC MODE data=Arndata.moddat; /* 命令的解释 */ var y x1-x6; /*
2、 命令的解释 */ model y = x1-x6;run;- 正态性检验PROC UNIvariate-PROC UNIvariate data=Arndata.unidat; var x1;run; - 相关分析和回归分析PROC REG 回归-PROC REG data=A
3、rndata.regdat; var y x1-x6; model y = x1-x6 / selection=stepwise; /* 加入逐步回归选项 */ print cli; &
4、#160; /* 加入输出预测结果部分,还可以输出acov,all,cli,clm,collin,collinoint,cookd,corrb,
5、160; covb,dw(时序检验统计量),i,influence,p,partial,pcorr1,pcorr2,r,
6、0; scorr1,scorr2,seqb,spec,ss1,ss2,stb,tol,vif(异方差检验统计量),xpx*/ pl
7、ot y*x2 / conf95; /* 做散点图 */run; -DATA Arndata.regdat;x2x2 = x2*x2;x1x2 = x1*x2;PROC REG data=Arndata.regdat; var y x1 x2 x2x2 x1x2 ;
8、 /* 多项式回归,非线性回归 */ model y = x1 x2 x2x2 x1x2 / selection=stepwise; /* 加入逐步回归选项 */
9、160; print cli; plot y*x2 / conf95; /* 做散点图 */run; -PROC RSreg 二次响应面回归PROC ORTHOreg 病态数据回归PROC NLIN 非线性回归PROC
10、 TRANSreg 变换回归PROC CALIS 线性结构方程和路径分析PROC GLM 一般线性模型PROC GENmod 广义线性模型 方差分析PROC ANOVA 单因素均衡数据和非均衡数据-PROC ANOVA data=Arndata.anovadat; /* 命令的解释 */ class typ;
11、160; /* 命令的解释 */ model y = typ; /* 可以看出此处是 单因素方差分析(分类型自变量对数值型自变量的影响) */ru
12、n;-PROC GLM 多因素非均衡数据:- PROC GLM data=Arndata.glmdat; /* 命令的解释 */ class typea typeb; /* 命令的解释 */
13、model y = typea typeb; /* 可以看出此处是 不考虑交互作用的多因素方差分析(分类型自变量对数值型自变量的影响) */run;- PROC GLM data=Arndata.glmdat; /* 命令的解释 */ class typea typeb;
14、0; /* 命令的解释 */ model y = typea typeb typea*typeb; /* 可以看出此处是 考虑交互作用的多因素方差分析(分类型自变量对数值型自变量的影响) */run;- 主成分分析PROC PRINcomp-PROC PRINcomp data=Arndata.pmdat
15、 n=4 out=w1 outstat=w2 ; var x1-x6; PROC print data=w1;PROC plot data=w1 vpct=80;
16、; /* 一句话,其实print就是plot输出图形的文字形式而已 */ plot prin1*prin2 $ districts='*'/ haxis=-3.5 to 3 by 0.5 HREF=
17、-2,0,2 vaxis=-3 to 4.5 by 1.5 HREF=-2,0,2; /* 主成分的散点图,也就是载荷图 */run;- 因子分析PROC FACTOR-PROC FACTOR data=Arndata.factordat simple corr ;
18、0; var y x1-x6; title'18个财务指标的分析' title2'主成分解'run;PROC F
19、ACTOR data=Arndata.factordat n=4 ; /* 选择4个公共因子 */ var y x1-x6; run;PROC FACTOR data=Arndata.factordat n=4
20、60; rotate=VARImax REorder; /* 因子旋转:方差最大因子法 */ var y x1-x6; run;-PROC SCORE -PROC FACTOR data=Arn
21、data.factordat n=4 rotate=VARImax REorder score out=score_Out; /* 输出因子得分矩阵 */run;PROC print data=score_Out; var districts factor1 factor2 factor3 factor4;run; PROC plot data=score_Out;
22、0; plot factor1*factor2 $ districts='*' / href=0 Vref=0; /* 因子的散点图,也就是载荷图 */run;- 典型相关分析PROC CANcorr基本SAS程序代码结构:-DATA jt(TYPE=CORR);
23、160; /* TYPE=CORR 表明数据类型为相关矩阵,而不是原始数据, type还可以是cov,ucov,factor,sscp,ucorr等*/ input names$ 1-2(x1 x2 y1-y3)(6.); /* name $ 表示读取左侧的变量名,1-2表示变量名的字符落在第1,2列上 */ cards;x1 1 0.8 x2 y1 y2 y3 ;PROC CANcorr data=
24、Arndata.cancorrdat edf=70 redundancy; /* 误差自由度的参考值,默认值是n=1000; redundancy表示输出冗余度分析的结果 */ var x1 x2;
25、; with y1 y2 y3;run;-对应分析 /* 交叉表分析的拓展,寻找行和列的关系,一般行指代各种cases,而列代表各种visions */ PROC CORResp -PROC CORResp data=Arndata.correspdat out=result;
26、160; var x1-x6; id Type;run;options ps=40;proc plot data=result; plot dim2*dim1="*" $ Type
27、 / box haxis=-0.2 to 0.3 by 0.1 Vaxis=-0.1 to 0.3 by 0.1 Href=0 Vref=0;run;- 聚类分析PROC CLUSTER-PROC CLUSTER data=Arndata.clusdat
28、 method=ave outtree=clusdat_Out; var x1-x6; id datid;run;proc tree horizont
29、al; /* 做聚类树 */run;-PROC FASTclus-PROC FASTclus data=Arndata.clusdat maxclusters=3 list out=clusdat_Out;
30、 var x1-x6; id datid;run;- PROC ACEclusPROC VARCLUS-PROC VARclus data=Arndata.clusdat; /* 系统默认使用主成分法聚类 */
31、 var x1-x6; run; -PROC VARclus hierarchy data=Arndata.clusdat; /* 保证分析过程中不同水平的谱系结构 */ var x1-x6; run; -PROC VARclus centroid data=Arndata.clusdat outtree=clusdat_out; /* 使用重心法聚类
32、*/var x1-x6; run; -PROC TREE-PROC TREE data=Arndata.clusdat horizontal; /* 使用TREE过程绘制聚类谱系图 */var x1-x6; run; - 判别分析PROC DISCRIM-PROC DISCRIM data=Arndata.discrimdat list out=discrimdat_Out dist
33、ance pool=yes; class Typ; /* 指定分类变量 */ var x1-x6; /* 用于建立判别识别函数的变量 */
34、; id iddiscrim; /* 标注样本的变量 */run;-第二种方法,将需要判别的新样本放在testdata里:-PROC DISCRIM data=Arndata.discrimdat1 testdata=Arndata.discrimdat2 testlist testout=discrimdat_Out; /* 将原来的几个选项加注test标示 */ class Typ
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年中级注册安全工程师之安全实务化工安全基础试题库及参考答案详解【轻巧夺冠】
- 2026年施工生产知识综合提升练习题必考附答案详解
- 目的地营销中的跨文化沟通
- 2026年生命科学综合练习【夺冠】附答案详解
- 移动端产品经理工作手册
- 2025云南省滇中引水工程有限公司选调人员(第二批)6人笔试历年典型考点题库附带答案详解
- 2025云南南华兴福村镇银行工作人员招聘7人笔试历年典型考题及考点剖析附带答案详解
- 2025中盐榆林盐化有限公司招聘(2人)笔试历年备考题库附带答案详解
- 旅行社服务流程与安全管理手册
- 2025中建交通建设(雄安)有限公司招聘8人笔试历年典型考点题库附带答案详解
- 2025届上海市徐汇区、金山区、松江区高一物理第二学期期末统考模拟试题含解析
- 教学楼加固工程施工方案
- 项目部处罚管理制度
- 富血小板血浆治疗膝关节
- 人工智能AI创业计划书
- 志愿服务孵化基地评估标准与流程
- 2025年电解铝项目可行性研究报告
- 高中语文文言文阅读典籍分类专训:散文类 先秦诸子散文(全国甲卷、乙卷适用)
- 《浙江省建筑垃圾资源化利用技术导则》
- 学生心理健康一生一策档案模板
- 《青春梦想责任担当》班会课件
评论
0/150
提交评论