




已阅读5页,还剩41页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SAS过程步(procedurestep),SAS应用,复习数据步(datastep)相关内容,1、主要功能2、生成SAS数据集的方法3、SAS数据集的要素4、基本语句5、临时数据集和永久数据集的区别(Temporarydataset/Permanentdataset),例1:,DATACLASS1;INPUTNAME$1-8AGE10SEX$12HEIGHT14-17WEIGHT19-23BUST25-28;CARDS;Lumin3B0.9413.5950.4caihang3B0.9114.2050.0limin4G1.3916.1551.6liyou4B1.0215.4451.9liuyin4B1.0615.3051.0liuyang5G1.0115.0451.9huye5G1.0215.0752.7chengbin6G1.0717.0453.7yangbin6B1.1218.0954.1liuhong6B1.1418.8053.5yanjin7G1.1619.9355.5zhangge7G1.1518.2051.4;RUN;,授课内容:1.SAS过程步和常用统计方法2.求基本统计量过程授课学时:8个学时(理论4学时,实习4学时)目的:1.掌握SAS过程步的通用语句和三个常用的过程步的格式和功能,并能够根据要求编写相应程序。2.正确应用means过程,univariate过程和freq过程来计算常见的基本统计量。难点:1.“过程”与“语句”的区别2.format语句与format过程的区别3.Univariate过程的输出结果的阅读,本次课主要内容,过程步的通用语句procvarbyformatfreq(ClassIdOutputTitle)三个过程步1.Print过程2.Sort过程3.Format过程,概念,过程步(procedurestep)是以关键字PROC开始的一个或多个语句,它的任务是分析和处理数据集中的数据。,过程步的格式,PROC过程名过程选择项;语句/语句选择项;语句/语句选择项;语句;RUN;,PROCPRINTDATA=CLASS;VARNAMEAGE;BYSEX;RUN;,在PROC步里,有一些最基本的信息要告诉SAS系统,1、选择的过程是什么?(proc)2、要分析的数据集是什么?(data)(永久数据集,临时数据集,当前数据集和非SAS数据集)3、要处理的变量是什么?(variable)4、是否要分组进行处理分析?(grouping),第一句是proc语句。表明要进行一项数据分析。proc后面是SAS系统定义的过程名,然后是SAS数据集名,然后是过程选择项。(指明过程)第二句开始是系统指定的必选SAS语句以及语句选择项。(指明分析变量)然后是与该过程名配合使用的一些其它SAS语句。(分组及其它)最后一句是结束语句。,例2:,PROCPRINTDATA=CLASS;VARNAMEAGE;BYSEX;RUN;,过程名(Procedureprogram),SAS过程步是用来完成某个实际任务的SAS程序。这种程序和SAS数据步程序不同,它仅需要告诉计算机做什么,而不需要象SAS数据步那样告诉计算机怎么做。这是因为SAS系统的过程库里已经存储了各种现成的用来完成不同任务的程序,并且SAS系统给每一个程序定义了一个相应的名字,称为过程名。过程名不超过8个字符,代表一种数据分析或实用过程的名字。例如,ttest,anova,reg,corr,tabulate,plot,print等,它们分别是t-检验,方差分析,回归分析,相关分析,制表,绘图和输出打印的过程名。,三、用于SAS过程步中的通用语句,能够在SAS过程步中使用的语句。而非各个过程步的专用语句。1、PROC语句:表示过程步的开始及调用某一要使用的过程2、VAR语句:定义被分析的变量3、BY语句:按指定的变量值来分组处理数据集4、CLASS语句:在分析中定义分类变量5、SUM语句:对指定的变量求和,当然该变量必须是数值型变量。格式:sumSAS变量名;,PROC语句,格式:PROCSAS过程名选择项;功能:调用SAS过程并完成该过程处理数据的任务。PROC语句选择项:1关键字(keyword)指定反应本过程特征的关键字。2关键字=值指定关键字的初值,该值可能是数值或字符串。3关键字=SAS数据集指定输入或输出的数据集。,PROCSORTDATA=AOUT=B;语句中SORT是过程名,DATA、OUT是关键字,A和B是关键字的值。Procmeansdata=classnmeanstdmaxminmaxdec=2;varheightweight;Bysex;Run;,举例:,5、ID语句:定义一个或多个变量识别观察值6、FORMAT语句:用于在过程步中调用变量的格式7、OUTPUT语句:将过程产生的结果输出到一个新的SAS数据集中。8、FREQ语句:指定一个数值变量,它的值表示数据集中观测值出现的频数。,例3:,PROCPRINTDATA=CLASS1;PROCPRINT;IDNAMEAGE;RUN;,format语句,format语句是用在过程步中调用变量输出格式的语句。format语句是非必选语句,必须写在过程步里面。结构:formatSAS变量名输出格式或格式名;这里,输出格式是当时赋予的格式,而输出格式名是由format过程步定义的格式名字。一个format语句可以给多个SAS变量赋予相同的或分别赋予不同的格式。例如。formatsexsex.ageagegrp.birthdayyymmdd8.;这里sex和age用的是事先定义好的格式名,birthday是当时赋予的格式。,例4:,PROCPRINTDATA=CLASS1;FORMATHEIGHT6.1;RUN;DATACLASS2;INPUTDATEYYMMDD10.(X1-X5)(3.);CARDS;1995-05-2020503025101996-07-032140502081996-12-0319202510151997-01-151851423020RUN;PROCPRINT;FORMATDATEYYMMDD10.;RUN;,例5:OUTPUT语句:,PROCMEANSDATA=CLASS1;VARBUST;OUTPUTOUT=NEWMEAN=MEANBUST;RUN;,格式:OUTPUTOUT=数据集名统计关键字名字“统计关键字”指在新的数据集中需要保留的统计量“名字”则是给这些统计量命的名字。功能:将过程产生的结果输出到一个新的SAS数据集中。,例6:FREQ语句,dataa;inputsex$agenumber;cards;f2010f2223m2119m2216procmeans;freqnumber;varage;run;,现有一批人,其中20岁女性10人,22岁女性23人,21岁男性19人,21岁男性16人,求平均年龄。,9、TITLE语句:为SAS输出规定标题行,a.上一过程步或数据步的RUN语句之后b.如果上一步无RUN语句,则放在本过程的PROC语句之后以及下一个DATA步或PROC步或RUN语句之前。,例7:,Procprintdata=class1;Title“titlefortwoprocedure”;Procmeansdata=class1;Varweight;Run;Procprintdata=class1;run;Title“titlefortwoprocedure”;Procmeansdata=class1;Varweight;Run;,10.LABEL语句,格式:label变量“标识”功能:给变量赋以标记,输出时代替变量名。例labelH=“HEIGHT”W=“WEIGHT”;LABELSEX=“性别”;,四、几个服务过程,1.Print过程2.Sort过程3.Rank过程4.Format过程,格式:PROCPRINTdata=SAS数据集;VAR变量;WHERE条件表达式;FORMAT变量变量输出格式;功能:将数据集输出到OUTPUT窗口。,1.PRINT过程,例8:,PROCPRINT;DATA=CLASS1;VARNAMESEXAGE;RUN;PROCPRINTDATA=CLASS1;WHERESEX=“B”;RUN;PROCPRINTDATA=CLASS3;PROCPRINTDATA=CLASS3;FORMATDATEDATE7;RUN;,2.SORT过程,格式:PROCSORTdata=SAS数据集out=SAS数据集;BYdescending变量;功能:将数据集按某(些)变量排序。,例9:,PROCSORTDATA=CLASS1OUT=SORT1;BYSEXDESCENDINGHEIGHT;PROCPRINTDATA=SORT1;RUN;,3.rank过程步,将SAS数据集中指定的变量的值按从小到大的顺序附给一个序数,也称为秩次。产生的新变量称为是原变量对应的秩次变量。结构:procrankdata=SAS数据集名;varSAS变量名;ranks新变量名;其它SAS语句;run;,3.rank过程步,procrank语句,表明要建立SAS变量的秩次变量。第二句是var语句,指明数据集中要被秩次转换的变量。第三句是ranks语句,给出秩次转换后新的变量名。若该句缺省,则新变量名覆盖原变量名。第四句是其它SAS语句,仅允许使用by语句。最后是过程结束语句。rank过程步和sort过程步一样,不产生任何输出信息,必须借助于print过程步,才能看到新数据集的结果。,rank过程步和sort过程步的区别,rank过程步不改变所有变量的观察值的顺序,而sort过程步改变变量的观察值的顺序rank过程步产生新变量,不产生新的SAS数据集,而sort过程步不产生新变量,产生新的SAS数据集。,4.FORMAT过程,功能:对字符或数值变量定义一个所需的输出格式。格式:PROCFORMAT;VALUE$格式名原值1=输出值1原值2=输出值2;run;,例10:,PROCFORMAT;VALUE$SFB=BOYG=GIRL;VALUEHFLOW-1.0=LOW1.0-0(大于0的样本数)12M(Sign)(符号检验)6Pr=|M|(符号检验的p值)0.0005SgnRank(符号秩和检验)39Pr=|S|(符号秩和检验的p值).0005W:Normal(正态性检验W检验)0.9327
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 防骗安全测试题及答案解析
- 2025年新能源行业国际合作与“一带一路”倡议研究报告
- 2025年节水知识竞赛试题及答案
- 淄博市安全教育培训试题及答案解析
- 2025年农业绿色发展政策支持下的农业面源污染治理技术市场趋势报告
- 2025闵行七宝镇村(合作社)、镇属公司公开招聘20人模拟试卷及答案详解(考点梳理)
- 2025贵州三都水族自治县人民医院(医共体)总院第二次招聘合同制工作人员51人考前自测高频考点模拟试题及1套参考答案详解
- 2025年新能源行业品牌建设与市场品牌忠诚度研究报告
- 2025福建省高速集团有限公司权属企业招聘若干人考前自测高频考点模拟试题及答案详解(新)
- 2025-2030工业软件云化转型过程中的客户付费意愿迁移报告
- 水库水坝施工方案范本
- 肺康复个案护理
- 人美版美术六年级上册全册教案
- GB/T 21499-2024粮油检验稻谷和糙米潜在出米率测定方法
- (版)科学道德与学风建设题库
- GB/Z 44314-2024生物技术生物样本保藏动物生物样本保藏要求
- 2023年全国职业院校技能大赛-融媒体内容策划与制作赛项规程
- 《电力建设施工企业安全生产标准化实施规范》
- 糖尿病周围神经病变知多少课件
- 儿童肺炎支原体肺炎诊疗指南(2023年版)解读
- 个人履职考核情况表
评论
0/150
提交评论