统计学(sas复习总结.ppt_第1页
统计学(sas复习总结.ppt_第2页
统计学(sas复习总结.ppt_第3页
统计学(sas复习总结.ppt_第4页
统计学(sas复习总结.ppt_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

sas,程序步分为两种: 数据步(data step) data:数据步的开始、命名要创立的数据集。 Input:确定输入的数据所对应的变量。 cards:输入数据。 过程步(proc step) proc:过程步的开始。 Output:输出过程步运行结果,Set语句:1、引用数据集 2、纵向合并数据集(合并时不会根据id进行匹配) merge语句:横向合并数据集(合并时会根据id变量匹配),常用统计描述过程,proc freq:调用freq过程列频数分布表。 proc means:调用means语句对变量进行简单的统计描述。 proc univariate:调用univariate过程对变量进行详细统计描述。 table:指出列表变量,并生成包 含频数表数据的数据集。 var:指出分析变量。,histogram:指明对绘制直方图所用的数据变量并绘图。 proc gchart:调用ghart过程绘图。 pie:绘制圆饼图 gplot:绘制散点图 plot:指出绘图的纵坐标和横坐标,二项分布 Poisson分布 正态分布,PDF函数:求概率密度,二项分布 P(X)=PDF(“Binomial”,X,Prob,N) Poisson分布 P(X)= PDF(“Poisson”,X,Lamda),计算累计概率密度的常用函数,二项分布 Poisson分布,如求X服从二项分布,则 P(Xk)probbnml(p,n,k)-probbnml(p,n,k-1) =PDF(“Binomial”,k,p,n) 如X服从泊松分布,则 P(X=k)=Poisson(p,k)-Poisson(p,k-1)=PDF(“poisson”,k,p)。,求概率密度函数的两种方法,CDF函数:求正态分布累积概率密度的函数 cdf(NORMAL,k,mean,std):用于计算均数为mean,标准差为std的正态分布的随机变量xk的累积概率。 probnorm函数:标准正态分布函数 probnorm(u):求出从-到u位置的面积大小 Probit函数:求标准正态分布的Z值的函数 probit(prob):求出从-到Z的位置面积为prob时的Z值,SAS中常用的正态分布相关函数,CDF函数:求正态分布累积概率密度的函数 cdf(NORMAL,k,mean,std):用于计算均数为mean,标准差为std的正态分布的随机变量xk的累积概率。 probnorm函数:标准正态分布函数 probnorm(u):求出从-到u位置的面积大小 Probit函数:求标准正态分布的Z值的函数 probit(prob):求出从-到Z的位置面积为prob时的Z值,常用的正态分布相关函数,置信区间,总体均数的可信区间 t 分布法 SAS函数:TINV t=TINV(p,df) 可求t分位数的函数,p是从-到当前t分位数位置的面积。 df=n-1(自由度),T检验,(均数、标准差、标准误、t检验),proc means mean std stderr t prt ; var x ; run ;,proc univariate normal; var x; run;,proc ttest H0=40.4; var a; run;,方法1 方法2 方法3,Proc univariate normal *进行正态性检验 proc ttest:调用ttest过程进行t检验 paired:指出t检验重要比较的变量对 class:指出分类变量,方差分析,PROC ANOVA的过程格式,PROC ANOVA; CLASS 变量表; MODEL 因变量表效应; MEANS 效应/选择项;,PROC GLM的过程格式,PROC GLM; CLASS 变量表; MODEL 因变量表效应; MEANS 效应/选择项;,五、方差分析所用的过程,ANOVA过程(Analysis Of Variance) GLM过程(General Linear Model) Hovtest 使用levene检验 选项bartlett: 使用bartlett方法 选项snk:使用snk方法 选项bon:使用bonferroni方法 选项dunnett:使用dunnett方法(要注明对照组) Treat:处理组 block :区组,卡方检验,proc freq; tables r*c/chisq expected exact; weight f; run;,注:1.tables语句中的chisq选项指定进行卡方检验, expected选项指定输出理论频数 2.exact 输出确切概率/四格表资料不加此选项也可以输出确切概率 3.weight语句指定权重变量为f,注:agree选项进行mcnemar检验与一致性检验; exact mcnem语句进行mcnemar检验同时输出确切概率, 适用于b+c40的情况。,proc freq ; tables r*c/agree; exact mcnem; weight f; run;,非参数检验,PROC NPAR1WAY过程格式,PROC NPAR1WAY Wilcoxon ; CLASS 变量; VAR 变量表; Freq 频数变量; RUN; *调用npar1way进行非参数检验(秩和检验),相关分析,线性相关 proc corr 秩相关 proc corr spearman 分类变量的关联性分析(属两种属性独立性的2检验定性变量之间的联系:查看Chi-Square 和Contingency Coefficient ),线性回归,proc reg; model y=x/clm cli clb; plot y*x/conf pred; run;,注:model语句,建立自变量对因变量的回归 方程,等号的左边表示因变量y,等号的右边 表示自变量x;选项clm指定输出预测值95% 的置信区间;选项cli指定输出95%的预测个体 所在的范围;选项clb指定输出回归系数的95% 置信区间。 plot语句,指定输出以y变量为纵坐标x变量 为横坐标的散点图,并拟合回归线,选项conf和 pred指定输出95%的置信区间和95%的预测个体 所在的范围的曲线。,线性相关: proc corr ; var x y; run; 秩相关: proc corr spearman; var

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论