已阅读5页,还剩2页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第六章 SAS过程中常用语句要对数据进行分析和处理,需在过程中使用一些过程步语句和有关的选择项。本章介绍SAS过程步中通用语句,对有些过程步的专用语句和选择项将在后面各过程中介绍。第一节 PROC语句 语句格式: PROC 选择项;功能:指定所需调用的过程以及该过程的若干选择项。PROC语句中有三种类型的选择项用于各过程步: (1)关键字 规定反映本过程特征的关键字。 (2)关键字值 规定初值,该值可是数字或字符串。 (3)关键字SAS数据集 规定输入或输出的数据集。最常用的是DATA一数据集,指出本过程所要处理的数据集名,如缺省则处理最新建立的数据集。 例PRINT过程,打印数据集AA的内容。PROC PRINT DATA=A;第二节 BY 语句 语句格式: BY DESCENDING 变量 NOTSORTED; 功能:以指定的变量值来分组处理某数据集。 BY语句总是首先与S0RT(分类)过程一起使用,以便定义数据排列次序。当BY语句在其它大多数对SAS数据集作分析的过程中使用时,能分别处理每一个分组(BY)的观测值。这里的变量是数据集中的用作分组的变量,以这个变量按指定要求排序(分类)。 选择项DESCENDING要求紧接的变量按降序排列数据集中各观测值,NOTSORTED要求进行分组时,各组不需按字母或数字顺序排序。例如: BY DESCENDING AGE;本语句按变量AGE(年龄)值对数据集进行降序排序。 假设有一数据集CLASS包含有变量DAY的观测值,DAY值是一周内某天的三个字符缩写形式(如,MON,TUE)将数据集中具有相同DAY值的观测值分为一组,DAY的值是按日历顺序而不是字母顺序排列的。下面的语句可以和一个PROC语句一起使用,按DAY分组处理数据集。 BY DAY NOTSORTED; (不排序,但按指定变量值将同类放一起)如DESCENDING和NOTSORTED都没指定,那么数据集中的观测值一定会按BY变量值的升序安排。例下面程序对AA数据集按SEX变量值升序排列,并在同一SEX组内对AGE值进行降序排列,并按SEX变量分组打印。 PROC SORT DATA=AA; (yp52.sas) BY SEX DESCENDING AGE; PROC PRINT; BY SEX;第三节 CLASS 语句 语句格式: CLASS 变量表; 功能:定义分类变量。 分类变量只有少数的几个离散值或者不连续值,可以是字符型或数值型。在CLASS语句中,按指定变量的值进行分组。CLASS语句对计算统计的作用类似于BY语句。它们之间的不同是打印输出的格式,并且BY语句要求先排序。第四节 VAR 语句 语句格式: VAR 变量表; 功能:用于定义分析变量。 语句中变量为要作分析的数据集中的变量,任何有效的变量清单形式均可被使用。当该语句省略时,对所有变量做统计计算。 例下面语句按SEX值的分组对VAR所标识的H变量进行分析产生两个单独的描述性统计报告。 PROC MEANS DATA=AA; BY SEX; VAR H;第五节 WEIGHT 语句 语句格式: WEIGHT 变量; 功能:在过程中规定一个数值变量,并以它的值作为观测值的权重。 例:假设一个数据集包括了变量GROP(X,Y两组)、SEX(F为女,M为男)和HRSWORK。下面程序产生一个表格,显示各组不同性别人所工作的时间数等等。 DATA GSH; (yp53.sas) INPUT GROP $ SEX $ HRSWORK; CARDS; X F 5.8 Y F 6.4 X M 7.2Y M 7.0;PROC FREQ; TABLES GROP*SEX; WEIGHT HRSWORK;第六节 FREQ 语句 语句格式: FREQ 变量; 功能:规定一个数值变量,它的值表示工作数据集中观测值出现的频数。 假定某观测值的FREQ变量值为n,则在分析时,数据集中的该观测值被视作出现的频数为n。当nl时,观测值不加以计算;若n不是整数,则自动取整。观测值数被认为等于FREQ变量的和。例如: DATA A; (yp54.sas) INPUT SEX $ AGE NUMBER;CARDS;F 20 10 F 22 23 M 21 19 M 22 16 PROC MEANS; VAR AGE; 这个结果是A数据集中4个观测值对AGE求的平均;如果对MEANS过程加入FREQ语句。 PROC MEANS; FREQ NUMBER; VAR AGE; 该结果按10个20岁(女)、23个22岁(女)、19个21岁(男)、16个22岁(男),总计68个观测值对AGE求平均。根据观测值的情况,利用FREQ语句可减少输入数据,加快计算。第七节 ID 语句 语句格式 ID 变量表; 功能:用来规定一个或几个变量,以便在输出或由该过程产生的SAS数据集中用这些变量值来识别观测值。例如: PROC PRINT DATA=AA; ID NAME;输出结果的第一列打印出ID语句中规定的NAME值所取代的观察序号(OBS)。第八节 FORMAT 语句 语句格式: FORMAT 变量 格式; 功能:用于在过程中设置变量输出格式。 利用FORMAT语句使PROC步中的变量与输出格式联系起来。格式可以是SAS的输出格式,或是已用PROC FORMAT自定义的格式。可用一个FORMAT语句给几个变量以相同的格式或不同的格式。当SAS系统打印变量值时,它用与其联系的格式来打印。 格式有两种表示方法:一种是格式名以小数点结束(如SEXFMT.),另一种是使用宽度值和小数位数之间有一个小数点的格式表示。 FORMAT语句的使用说明: (1)若一个变量在几个FORMAT语句中出现,则它使用最后一个FORMAT语句给定的格式。例如在DATA步中用FORMAT语句对某些变量定义格式之后,在PROC步又使用了FORMAT语句对一些变量重新定义格式,则在此过程中定义的格式有效。 (2)如要取消在DATA步中已定义的输出格式,可在FORMAT语句中仅使用变量名而不使用输出格式。 下面举例说明FORMAT语句的使用: 例1:在PRINT过程中用FORMAT语句对AA数据集中H,W变量规定输出格式为保留两位小数。 PROC PRINT DATA=AA; FORMAT H 6.2 W 5.2; 如果你已使用FORMAT过程定义了一个格式,就需要用一个FORMAT语句来使该格式与一个或多个变量发生联系。 例2:利用FORMAT语句将AA数据集中变量SEX用MALE、FEMALE表示。PROC FORMAT; (yp55.sas) VALUE $ SEXFMT 1=MALE 2=FEMALE; PROC PRINT DATA=AA; FORMAT SEX $SEXFMT.; 在程序中用FORMAT过程定义了SEXFMT格式,在PRINT过程中用FORMAT语句将数据集AA中的变量SEX与输出格式SEXFMT联系起来,当SEX的值被打印时,变量SEX的值1和2被MALE和FEMALE取代。 遇有日期时间值,为了以可理解的形式打印这些值,必须用FORMAT语句为这一变量赋以相应的日期、时间输出格式,否则将会被打印成自1960年1月1日以来的天数或自零点以来的秒数。例如:DATA EMPLO; INPUT NAME BEGING DATE7.; FORMAT BEGING DDMMYY8.; CARDS; ZHONGLI 15JAN84 LIUWEl 03MAR85 ;PROC PRINT;第九节 LABEL 语句 语句格式: LABEL 变量=标记 ; 功能:给变量赋以标记,以便把变量名的含义更明确地在输出中表示出来。 在DATA步中可以用LABEL语句,PROC步中也可用LABEL语句给变量指定标记。当在一个PROC步中用LABEL语句时,仅在该过程步期间该标记与该变量相联系。这一点与DATA步中的LABEL语句的作用不同。 例:绘制一个表示H与W变量关系的散点图,H、W用相应标记代换。 PROC PLOT DATA=AA; (yp57.sas) PLOT H*W=*; LABEL H=HEIGHT W=WEIGHT;第十节 OUTPUT 语句 语句格式: OUTPUT OUT=数据集名统计关键字=变量名; 功能:将过程结果输出到一个新的SAS数据集。 如果想建立一个永久性SAS数据集,必须指定一个二级名。 统计关键字指明在新的数据集中想要的统计项,且给包含这些统计项的变量起名字。这些名字将作为统计值在新数据集中。输出数据集可做为下步处理的输入。 例:对AA数据集中变量H、W计算统计量N、MEAN、SUM,并产生输出数据集PPP。 PROC MEANS DATA=AA N MEAN SUM; (yp58.sas) VAR H W; OUTPUT OUT=PPP mean=mh mw std=sh; PROC PRINT DATA=PPP;MH和MW分别是H和W的均值,SH是H的标准差,W的标准差没有指定。第十一节 TITLE 语句 语句格式: TITLEn 标题内容; 功能:规定打印到SAS输出文件上的标题。 规定最多十个标题行。n紧跟在TITLE后,不留空格,用来规定标题所在行。n的范围从1到10,如未指定,缺省值是1。例如: TITLE3 THIS IS THE THIRD TITLE LINE;为输出页的第3行规定了一个标题。 标题内容为想要打印的具体标题,字符数不超过132个。如果所规定的标题比当前规定的行长,则该标题被分成多行。标题要括在引号内。 一旦为一行规定了一个标题,那么在后继的输出中都使用该标题,直至取消这一标题或为该行定义其它的标题为止。如想取消所有现存的标题,使用下面语句: TITLE;如想取消第n行和它后面行的标题,使用: TITLEn;如果需给某个PROC步的输出加上标题,遵照标题设置的规定,语句放在: (1)前一步的RUN语句之后。 (2)在PROC语句之后和在下一个DATA、PROC或RUN语句之前的任何地方。 例1: PROC PRINT; TITTLE TITLE FOR FIRST PROC; PROC MEANS; 则为PRINT和MEANS两过程的输出打印标题。 例2 PROC PRINT DATA=AA; RUN; TITLE TITLE FOR SECOND PROC; PROC MEANS; 因TITLE语句在前一步(PRINT过程步)的RUN语句之后,所以只在MEANS步输出中打印标题。 例3 PROC PRINT DATA=AA; PROC MEANS; TITLE TITLE FOR SECOND PROC;因TITLE语句在第二个PROC语句之后,所以仅在MEANS输出页上打印标题。第十二节 FOOTNOTE 语句 语句格式: FOOTNOTEn 脚注内容; 功能:在输出页的底部打印一些脚注信息 FOOTNOTE语句最多可以给出10行脚注。n是脚注中的相对行,行是从底部“压入”的,也就是说:带有最高行号的脚注将出现在最底部。n的范围从1到10,如未指定,缺省值是1。 一旦你使用了一个FOOTNOTE语句,则其脚注内容被打印在所有页上。为了取消已给出的脚注,可用语句:FOOTNOTE; 例:给一个输出结果加标题和脚注: PROC PRINT DATA=AA; (yp59.sas) TITLE3 THIS IS THE AA DATABASE; FOOTNOTE -END-; RUN;第十三节 OPTIONS 语句 OPTIONS语句的格式是: OPTIONS option; OPTIONS语句将改变装置所设置的缺省。 由OPTIONS语句所做的改变在SAS会话期间一直起作用,或是直至被另一个OPTIONS语句改变为止。比如,假设你想删掉在SAS输出页上正常打印的日期,并且使输出在页上左对齐。你可以使用语句:OPTIONS NODATE NOCENTER; OPTIONS语句可以放在SAS程序中的任何位置上。位于DATA步或PROC步中的OPTIONS语句在整个DATA步或PROC步的执行期间,以及SAS作业期间都起作用。option可以是如下选择项: 1数据集选择项 F
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年设备维修知识试题及答案
- 2026年全国质量月质量知识竞赛考试题库及答案
- 2026年幕墙工程技术规范考核试题及答案
- 慢性支气管炎诊疗与护理考核试题与答案
- 2025年陕西省韩城市高三历史上册期末考试模拟卷及一套答案
- 临床腕管综合征病因、病理生理学、诊断、分型及治疗要点
- 2025年湖南省洪江市高一历史下册期末考试检测卷(必刷)附答案
- 2026年湖南省临湘市高三历史下册期末考试自测卷附完整答案【有一套】
- 2025年河南省项城市高考历史试卷附参考答案(模拟题)
- 2025年山东省青州市高二历史下册期末考试模拟卷及参考答案(巩固)
- 中国硬皮病诊疗指南(2025版)
- 学校网评员工作实施方案
- 甘肃省兰州市事业单位考试《综合基础知识》试卷及答案【11套】
- 农业转基因生物安全培训课件
- 生命伦理课件
- 2026年银行精准营销客户获取方案
- GB/T 28726-2025气体分析氦离子化气相色谱法
- 公民信息素养(人工智能安全)知识试题及答案
- 2025浙江省农村发展集团有限公司招聘笔试考试备考题库及答案解析
- 驾驶员安全生产责任书范文
- 温通刮痧教学课件
评论
0/150
提交评论