研究生SAS教程_第1页
研究生SAS教程_第2页
研究生SAS教程_第3页
研究生SAS教程_第4页
研究生SAS教程_第5页
已阅读5页,还剩60页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第一次实验,1.了解sas系统功能 2.熟悉sas的页面操作 3.熟悉sas/base一些常用的语句 要求: (1)掌握数据的输入输出(data input put output cards等语句的配合使用); (2)掌握常用的基础统计计算(二项、正态等分布的概率函数值和分位数的计算); (3)熟悉数据的图形显示功能,第一讲 sas系统概述,一、什么是 sas系统,二、 sas/base简介,一、什么是 sas系统,sas系统是一个模块化的集成软件系统,提供数据访问、数据管理、数据分析、数据呈现。包括:,1. 基本部分(也是核心部分): base sas;,2. 统计分析: sas/stat;

2、,3. 高级绘图: sas/graph;,4. 矩阵运算: sas/iml;,5. 运筹学和线性规划: sas/or;,6. 经济预测和时间序列分析: sas/ets;,7.面向任务的菜单驱动界面:sas/assist,二、sas系统的特点,2. sas语言是编程能力强且简洁易学的非过程语言,3. sas系统把数据处理与统计分析融为一体,4. 适用性强、应用面广,二、sas系统的特点,1. 使用灵活方便、功能齐全,三、 sas/base简介,主要功能是:,可以单独使用,也可以同其它软件产品一起组成一个用户化的sas系统。,3.报表生成和图形显示功能,1.数据管理,2.基础统计计算功能,1.数据

3、管理功能:,(1)信息存贮和检索:,可用任何格式读入数据值,然后组成sas数据集。具有很强的与外部文件交换信息的功能,可以用文件操作管理方法把不同数据集的数据组合在一起,供sas过程分析处理,生成报表.,(2) 数据修改与程序设计:,(3) 文件操作:,用于对数据进行编辑、整理、连接、合并及更新的功能,还能同时处理多个输入文件,或者对一次输入的数据能够生成几种报表。,3.报表生成和图形显示功能,2.基础统计计算功能,.计算简单的描述性统计量,.sas函数可用于计算概率分布函数、分位数、产生随机数等,一、sas显示管理系统(display manager system,dms),第二讲 sas使

4、用概述,()编辑窗口(program editor): 编辑程序和数据文件; ()日志窗口(log): 记录运行情况,显示信息; ()输出窗口(output):输出运行的结果;()图形窗口(graph):输出图形。,点击 globals 菜单中的 program editor、log、output、graph 命令可以进入编辑、日志、输出及图形窗口。 按功能键f5、f6、f7也可以进入编辑、日志及输出窗口。,是用户和sas系统交互式会话环境;点击图标后,即可进入的显示管理系统在中有四个主要的窗口:,二、的功能键 用功能键可以代替对菜单的点击,有时比较方便。 最常用的功能键有f1 :显示帮助信息

5、(); 4 :显示已经运行的程序(); 5 :进入编辑窗口(); 6 :进入日志窗口(); 7 :进入输出窗口(); 8 :程式提交运行(); 9 :显示功能键(); 以上功能键的用法熟悉之后,还可以定义或修改功能键。例如,可以定义ctrl+e为功能键,用来清屏。,三、sas语句,一个sas语句是由sas关键词,sas名字,特殊字符和运算符组成的字符串,并以分号(;)结尾。,sas关键词: 如data语句,proc语句,infile语句等,sas名字:最多由1-8个字符组成,首字符必须是字母或下 下划线(字符包括:字母、数字或下划线) 如:变量名、sas数据集名、过程名等,sas语句 一般形式

6、:,keyword parameteroption;,注:sas规定,每个语句以“;”作为该语句结束的标志。,四、sas程序,1.data语句:产生sas数据集,2.proc语句:对sas数据集内数据进行分析处理,输出结果,sas程序:三明治,以data语句开始(面包),告诉程序有关的数据集,最后是proc语句,中间是数据(肉),一序列语句组成一个sas程序,完成一定的功能.,sas程序中语句分为两种:,sas程序构成:,一个或多个data语句、一个或多个proc语句,一个或多个proc语句,一个或多个data语句,程序示例: data ex; input no$ sex$ age h w;

7、cards; 10 f 47 156.3 47.1 24 m 38 172.4 61.5 53 m 41 169.2 64.5 46 f 52 158.2 53.6 38 f 39 160.1 48 ; proc sort; by sex; proc means;by sex;var h w;run;,第四讲 data步入门,一、什么是,二、创建sas数据集,三、 data步语句及其类型,一、什么是data步,1.检索:把输入数据转化为sas数据集;,2.编辑:检查数据中的错误并修改它们,计算新变量;,3.按照用户设计的规格输出报告并存为磁盘文件;,4.从已经存在的数据集中通过取子集、合并和

8、更新原数据的方法来产生新的数据集。,data步是用data语句开始的一组或几组sas语句。其目的:,1.数据在作业流中:从作业流中输入数据产生sas数据集,二、创建sas数据集,ex.1 data d1; input x1 x2 x3; y=x1+x2+x3; cards; 1 2 3 4 5 6 ;,一般形式为:,注:数据之间以空格隔开;数据行与行之间不用分号。,2.数据在磁盘上:从磁盘上读入数据文件产生sas数据集,二、创建sas数据集,ex.2 data d2; infile e:da1.dat; input x1 x2 x3; y=x1+x2+x3; run;,一般形式为:,3.数据来

9、自其它sas数据集:从一个或几个已经存在的sas数据集产生新的sas数据集,二、创建sas数据集,ex.3 data d3; set da2; if x10; run;,一般形式为:,ex.4 data d3; merge da1 da2; run;,4.把sas数据集转换为外部数据或输出报表,二、创建sas数据集,一般形式为:,三、 data步语句及其类型,只用于 data步的sas语句共有56个,分为四类:文件操作语句、运行语句、控制语句、信息语句。,常用的data步语句: 文件操作语句:data、input、cards、 file、 infile、by、set、merge等 运行语句:赋

10、值语句、累加语句等 控制语句:循环语句、条件语句等 信息语句:(略),(1) 语句 语句的作用是表明数据步的开始并给出数据集的名称。 语句的格式为: 数据集的名称; 注:1)数据集的名称必须以英文字母开始,最长不超过个字符。 2)数据集的名称都是由符号“”分隔的两个部分所组成。第一部分标记数据集所存储的位置,称作一级名或库逻辑名。第二部分标记一个特定的数据集,称作二级名。如果不想把数据集永久储存在指定的磁盘上,可以只使用二级名。,例: ; 系统会自动地把作为数据集的二级名,并添加作为数据集的一级名,因此在日志窗口显示的信息中记该数据集为。但是这个数据集是临时的,它仅仅在程式运行期间有效,过后它

11、就被复盖,不能重新调用。,(2) 语句 语句的作用是与“;”呼应,标志数据行的开始与结束。 语句的格式为: ; 数据行 ; 注:如果使用语句,在的后面必须紧跟数据行,并且在一个数据步中最多只能有一个语句。,(3)语句 语句的作用是描述输入记录中的数据,并把输入值赋给相应的变量。 语句的格式为: 数据的变量名、顺序及类型; 注1:用语句是为了读外部文件的数据或跟在语句后面的数据。除非在语句中的变量名后有串符号或用字符的输入格式表示、或该变量事先已被定义为字符型,否则认定用语句读入的是数值型变量的值。,注2.用语句时,外部文件中的数据和语句后面的数据都采取列表输入的方法,各个变量的值由它们之间的空

12、格来分隔。为从一行读入多个观测值,应使用行保持符限制读数指针,使其保持在这一行上读数,直到数据读完为止。,ex.1 data ex1; input x1 x2 x3; y=x1+x2+x3; cards; 1 2 3 4 5 6 ;,ex.1 data ex1; input x1 x2 x3; y=x1+x2+x3; cards; 1 2 3 4 5 6 ;,(4)语句 语句的作用是指明外部数据文件的名称,并从这个外部数据文件中读取数据。 语句的格式为: 外部数据文件名; 例如,在驱动器上有一个名称为ex2的数据文件,其中数据排列为: 3.12 2.23 3.4 4.12 4.2 .5 用语句

13、读取数据的程式为: ; :ex2.; $ ; 用语句读取数据时,要求外部数据文件必须是可以在操作系统中用命令打印出全部内容的码文本文件。,(5) 语句 语句的作用是按照指定的条件从指定的数据集中读取数据建立新的数据集或将两个数据集中的观测值纵向连接建立新的数据集。 语句的格式为: 数据集名表; 例如,从数据集中读取数据建立新的数据集,可编辑语句: ; ; 将两个数据集和中的观测值纵向连接建立新的数据集,可编辑语句: ; ;,data d1;input g$ a b ; cards; 1 5 7 1 7 9 1 3 4 ; data d2;input g$ a c ; cards; 2 4 8

14、2 6 6 2 8 10 ; data d3;set d1 d2; proc print; run;,运行结果 obs g a b c 1 1 5 7 . 2 1 7 9 . 3 1 3 4 . 4 2 4 . 8 5 2 6 . 6 6 2 8 . 10,(6) 语句 语句的作用是将两个数据集中的各个观测值横向合并建立新的数据集。语句的格式为: 数据集名表; 例如,将数据集与中的观测值横向合并建立新的数据集,可编辑语句: ; ;,data d1;input a b c ; cards; 1 5 7 1 7 9 1 3 4 1 2 6 ; data d2;input x y z ; cards

15、; 2 4 8 2 6 6 ; data d3;merge d1 d2; proc print;run; 本程式运行的结果如下: obs a b c x y z 1 1 5 7 2 4 8 2 1 7 9 2 6 6 3 1 3 4 . . . 4 1 2 6 . . .,(7) do语句 简单do语句 循环do语句 do while 语句 do until 语句,简单do语句:常常用在if-then/else语句里来指定一个语句组根据if条件成立或不成立时被执行,格式为: do; 一些sas语句 end;,例: data a; input x; if x5 then do; y=x*10;

16、put x= y= ; end; cards; 12 4 11 5 ;,输出结果: x=12 y=120 x=11 y=110,例: data ex; do x=1.645, 1.96, 2.576; p=probnorm(x); put x= p= ; end; run;,在log窗口输出结果: x=1.645 p=0.9500150945 x=1.96 p=0.9750021049 x=2.576 p=0.9950024677,循环do语句: 格式为: do; 一些sas语句 end;,例: data a; do x=-3 to 3 by 0.25; do y=-3 to 3 by 0.2

17、5; p=x*x+y*y; put x= y= p= ; end; end; run;,第五讲 proc步入门,一、什么是proc 步?,二、 proc语句,一、什么是proc 步?,proc 步是用proc语句开始的一组或几组sas语句。,一般形式为:,ex.4 proc print data=d1; run;,注: 1.不同的sas过程可以使用的 也是不同的。,2. proc步中常出现的sas控制语句: (1)var 变量名; (2)by 变量名;(要求排序) (3)class 变量名; (4) id 变量名;,二、 sas基本输出过程,proc print; 或 proc print d

18、ata=文件名;,2.proc plot; 语法:proc plot 选项; by 变量列表; plot 选项;,选项:如vpect=33(规定产生的散布图在垂直方向占一页的比例 hpct=50 formchar =字符串,plot 选项;plot vertical*horizontal 或plot vertical*horizontal=字符或变量,3.proc sort ; by variables; run;,1.proc means ; var variables; by variables; freq variables; output out=新文件名 变量名列表(统计关键词=)

19、run;,三、 sas基础统计过程,options: mean std clm alpha t prt,注1:proc means 可以计算的统计量由21种,分别用下述关键词表示: n,nmiss,mean, std,max,min, range,sum,var,uss,css,cv,stderr,t,prt, skewness,kurtosis,clm,lclm,uclm,注2:output out=新文件名 变量名列表 (统计关键词=),ex:proc means data=ex; var weight height; class sex; output out=result mean=m

20、eanweight meanheight std(weight)=stdweight std(height)=stdheight run; proc print data=result; run;,偏态与峰度分布的形状,偏态(概念要点),1、数据分布偏斜程度的测度 2.偏态系数=0为对称分布 3.偏态系数 0为右偏分布 4.偏态系数 0为左偏分布 5. 计算公式为,偏态(实例),【例】已知1997年我国农村居民家庭按纯收入分组的有关数据。试计算偏态系数,农村居民家庭村收入数据的直方图,偏态与峰度(从直方图上观察),按纯收入分组(元),结论:1. 为右偏分布 2. 峰度适中,偏态系数(计算结果)

21、,将计算结果代入公式得,结论:偏态系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数,而且偏斜的程度较大,峰度(概念要点),1.数据分布扁平程度的测度 2.峰度系数=3扁平程度适中 3.偏态系数3为尖峰分布 5. 计算公式为,峰度系数系数(实例计算结果),代入公式得,【例】根据表4-10中的计算结果,计算农村居民家庭纯收入分布的峰度系数,结论:由于=3.43,说明我国农村居民家庭纯收入的分布为尖峰分布,说明低收入家庭占有较大的比重,2.proc univariate var variables; by variables; fr

22、eq variables; output run;,options:normal,注:计算分位数、频率表、数据的正态性检验等,options: 1.normal 2.plot (生成一个茎叶图或水平直方图、 一个盒形图、一个正态概率图),3.proc ttest class variables; var variables; run;,4.proc corr var variables; with variables; by variables; freq variables; run;,注:计算pearson相关系数和显著性概率以及 单变量统计量,第六讲 全程语句,一、什么是全程语句?,二、

23、 常用的全程语句,一、什么是全程语句?,全程语句: 既可以用在data步,也可以用在proc步; 既可以用在data步和proc步的外部, 也可以用在data步和proc步的内部。 这些语句可以用在sas程序的任何地方,称为全程语句.,二、 常用的全程语句,1.注释语句: * messages; 或 /* messages*/ (无需分号),2.title语句:规定同sas输出一起被打印的标题行 title (n=110),e.g. title2 annual costs,3.run ;,4.endsas;,应用sas计算二项分布的分位数,probbnml(p,n,k)=,而px=k= pro

24、bbnml(p,n,k)probbnml(p,n,k1),data ex; do k=1 to 10 by 1 ; p=probbnml(0.5,10,k)-probbnml(0.5,10,k-1); put p; end;,data ex; do k=1 to 10 by 1 ; do p=0.5;n=10; value=probbnml(p,n,k)-probbnml(p,n,k-1); output; end; end; proc print data=ex;run;,应用sas计算标准正态分布的分位数 在sas中有probit(p)函数,用此函数可以求p分位数。sas程序为 data

25、ex; do p=0.025,0.05,0.1,0.9,0.95,0.975; u=probit(p);put u p ; end;run;,输出的结果如下: -1.959963985 0.025 -1.644853627 0.05 -1.281551566 0.1 1.2815515655 0.9 1.644853627 0.95 1.9599639845 0.975,当=0.10,0.05,0.01时,应用sas计算双侧分位数的程序为: data ex;do x=0.1,0.05,0.01; p=1-x/2;u=probit(p);put x p u; end;run;,输出的结果如下:

26、0.1 0.95 1.644853627 0.05 0.975 1.9599639845 0.01 0.995 2.5758293035,应用sas计算卡方分布的分位数 在sas中有cinv(p,df)函数,用此函数可以求p分位数。sas程序为 data ex; do df=4;do p=0.025,0.05,0.1,0.9,0.95,0.975; c=cinv(p,df);put p df c; end;end;run;,输出的结果如下: 0.025 4 0.4844185571 0.05 4 0.7107230214 0.1 4 1.0636232168 0.9 4 7.7794403397 0.95 4 9.4877290368 0.975 4 11.143286782,应用sas计算t分布的分位数 在sas中有tinv(p,df)函数,用此函数可以求

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论