




已阅读5页,还剩1页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
8c523f0462ba31b37e24a4d37cf4f47d.pdf SAS 系统和数据分析系统和数据分析 电子商务系列 上海财经大学经济信息管理系IS/SHUFE Created by Page 1 of 6 第十六课 用在 PROC 步中的通用语句 当我们用 DATA 步创建好 SAS 数据集后,可以用 SAS 的一些 PROC 过程步来进一步的 分析和处理它们。在 DATA 步中用户可以使用 SAS 的语句来编写自己的程序,以便能通过 读入、处理和描述数据,创建符合自己特殊要求的 SAS 数据集。而后由一组组 PROC 步组 成的程序进行后续分析和处理。 一一. PROC 程程序序的的主主要要作作用用 读出已创建好的读出已创建好的 SAS 数据集数据集 用数据集中的数据计算统计量用数据集中的数据计算统计量 将统计的结果按一定形式输出将统计的结果按一定形式输出 在 SAS 系统中,计算统计量时,对于许多常用的和标准的统计计算方法,并不需要用 户自己编写这些复杂的程序,而是通过过程的名字来调用一个已经为用户编写好的程序。用 户通常只要编写调用统计过程前的准备处理程序和输出统计结果后的分析和管理程序。只有 用户自己非常特殊的统计计算方法才需要用户自己编写相应的计算程序。 二二. PROC 过过程程语语句句 PROC 语句用在 PROC 步的开始,并通过过程名来规定我们所要使用的 SAS 过程,对 于更进一步的分析,用户还可以在 PROC 语句中使用一些任选项,或者附加其它语句及它们 的任选项(如 BY 语句)来对 PROC 步规定用户所需要分析的更多细节。PROC 语句的格式 为: PROC 过程名 ; 过程名规定用户想使用的 SAS 过程的名字。例如,我们在前面常使用的打印过程名 PRINT,对数值变量计算简单描述统计量的过程名 MEANS。 选项规定这个过程的一个或几个选项。不同的过程规定的选项是不同的,因此,只有知 道具体的过程才能确定具体的选项是什么。但是,在各个不同过程中使用选项时,下面三种 选项的使用格式是共同的: Keyword Keyword=数值数值 Keyword=数据集数据集 Keyword 是关键字,第一种选项格式是某个具体过程进一步要求某个关键字;第二种选 项格式是某个具体过程要求某个关键字的值,值可能是数值或字符串;第三种选项格式是某 个具体过程要求输入或输出数据集。例如: PROC Print Data=class ; 过程 Print,作用为打印输出数据集中的数据。选项为 Data=class,关键字是 Data,进一 步说明要打印输出的数据集名为 class。如果省略这个选项,将用最近产生的 SAS 数据集。 8c523f0462ba31b37e24a4d37cf4f47d.pdf SAS 系统和数据分析系统和数据分析 电子商务系列 上海财经大学经济信息管理系IS/SHUFE Created by Page 2 of 6 PROC Plot Hpct=50 Vpct=33 ; 过程 Plot,作用为描绘变量的散布图。现有两个表示图形大小的选项为 Hpct=50 、Vpct=33,关键字 Hpct 和 Vpct 的值分别表示在水平和垂直方向上占一页中的比例。数值 50 表示占一页的 50%,即全页的一半。 PROC Means Data=class Maxdec=3 CSS ; 过程 Means,作用为对数值变量计算简单描述统计量。现有三个选项为 Data=class 、 Maxdec=3 、CSS 。选项 Maxdec=3 表示该过程输出结果中,小数部分的最大位数为 3。选 项 CSS,是单个关键字,指出 MEANS 过程选用的计算统计量的方法,在 MEANS 过程中共 有几十种计算统计量方法,CSS 表示计算均值偏差的加权平方和。 三三. 用用在在 PROC 步步的的通通用用语语句句 能够出现在 PROC 步的 SAS 语句主要分成: 过程信息语句、过程信息语句、 变量属性语句变量属性语句 可用在任何地方的全局语句可用在任何地方的全局语句 下面我们列出语句是 PROC 过程中最常用的一些通用语句,还有很多其它语句对不同的 过程是专用的。 1 VAR 语句(变量语句)语句(变量语句) VAR 语句可用在不同的 SAS 过程中,被用来给出要分析的变量。该语句的格式为: VAR 变量列表 ; 变量列表给出过程将要分析的数据集中的一些变量。变量列表的任意有效形式都是可以 使用的。通常 VAR 语句是放在过程的开始处。另外,VAR 语句中的变量顺序,也是将来输 出结果时的变量顺序。 2 MODEL 语句(模型语句)语句(模型语句) MODEL 语句可用在不同的 SAS 统计过程中,被用来规定分析的模型。尽管 MODEL 语 句的具体语句形式依赖于使用的具体过程,但 MODEL 语句的一般使用格式为: MODEL 因变量列表=自变量列表 ; MODEL 语句在使用时,要说明哪些变量是因变量,哪些变量是自变量。另外,不要把 8c523f0462ba31b37e24a4d37cf4f47d.pdf SAS 系统和数据分析系统和数据分析 电子商务系列 上海财经大学经济信息管理系IS/SHUFE Created by Page 3 of 6 “=”号看作是等号或赋值号的作用。例如: Model y=x1-x5 ; 自变量 x1、x2、x3、x4、x5,因变量 y。 Model y1 y2= a b c d 自变量 a、b、c、d,因变量有两个 y1 和 y2。 3 WEIGHT 语句(权数语句)语句(权数语句) WEIGHT 语句可用在不同的 SAS 过程中,用来规定一个变量,它的值是这些观测相应 的权数。该语句的格式为: WEIGHT 变量 ; WEIGHT 语句常常用在这样一些分析中,比如与每个观测有联系的方差不等时,那么可 引入一个权数变量,其值和方差的倒数成比例。 4 FREQ 语句(频数语句)语句(频数语句) FREQ 语句可用在不同的 SAS 过程中,用来规定一个变量,它的值表示这个观测出现的 频数。该语句的格式为: FREQ 变量 ; 如果在某个观测中,FREQ 变量的值小于 1,这个观测在分析中不使用;如果 FREQ 变 量的值不是整数,仅取整数部分使用。注意 FREQ 语句和 WEIGHT 语句的区别。FREQ 变 量表示观测出现的次数;WEIGHT 变量给出观测相应的权数。当每个观测的权数都是整数时, WEIGHT 语句也可用 FREQ 语句代替。 5 ID 语句语句 ID 语句可用在不同的 SAS 过程中,用来规定一个或几个变量,它们的值在打印输出或 这个过程产生的 SAS 数据集中用来识别观测。该语句的格式为: ID 变量列表 ; 使用了 ID 语句后,最左边的 OBS 列被取消了,且 ID 语句所指定的变量被排列在输出 结果报告的最左边。例如,当一个 ID 语句同 PRINT 过程一起使用时,输出的观测用 ID 变 量的值来识别,而观测本来的序号没有被打印输出。 8c523f0462ba31b37e24a4d37cf4f47d.pdf SAS 系统和数据分析系统和数据分析 电子商务系列 上海财经大学经济信息管理系IS/SHUFE Created by Page 4 of 6 6 CLASS 语句语句 CLASS 语句可用在不同的 SAS 过程中,用来指定一些分类变量,SAS 过程按分类变量 的不同值分别进行分析处理。该语句的格式为: CLASS 变量列表 ; 例如,我们要按男女分类统计 SURVEY 数据集中收入 INCOME 的平均值。程序如下: Libname Study “d:sasdatamydir“ ; Proc Means Data=Study.Survey ; Class Sex ; Var Income ; Title “How to use CLASS statement” Run ; 程序运行结果见图 161 所示。 7 BY 语句语句 当用户要求 SAS 系统对数据集进行分组处理时,可在 PROC 步中使用 BY 语句。但处 理过程要求数据集事先已经按 BY 变量排序好了。该语句的一般格式为: BY 变量 1 ; 图 161 在 PROC 过程中使用 CLASS 语句分类计算分析 SEX 8c523f0462ba31b37e24a4d37cf4f47d.pdf SAS 系统和数据分析系统和数据分析 电子商务系列 上海财经大学经济信息管理系IS/SHUFE Created by Page 5 of 6 DESCENDING 选项表示它后面的一个变量按降序排列。要特别注意 BY 后面的变量排 列的先后次序,表示分组的的先后次序。例如有一个关于通讯录的数据集,我们要按居住的 城市(City)降序排列,同一城市中按邮编(Zipcode)的升序排列。BY 语句的使用格式为: BY DESCENDING City Zipcode NOTSORTED 选项并不是说数据不要求排序,而是要求数据按组整理,并且这些组不必 按字母顺序或数值的顺序排序。 但如果要处理的数据集事先没有按 BY 变量的升序排序,可使用如下几种方法先处理一 下数据集: 在在 SORT 过程中用相同的过程中用相同的 BY 语句对观测进行排序。语句对观测进行排序。 用用 Base SAS 软件中软件中 DATASETS 过程对过程对 BY 变量生成一个索引。变量生成一个索引。 在在 PROC 调用过程的调用过程的 BY 语句中使用语句中使用 NOTSORTED。 例如,我们有一个没有按任何变量排序过的 SURVEY03 数据集,现在要想按男女分组 显示观测的 NAME 和 INCOME 变量的内容。程序如下: Libname Study “d:sasdatamydir“ ; Proc Sort Data=Study.Survey03 ; By Sex ; Proc Print DATA=Study.Survey03 ; Proc Print DATA=Study.Survey03 ; By Sex ; Var Name Income ; Id Sex ; Run ; 程序运行结果见图 162 所示。 8c523f0462ba31b37e24a4d37cf4f47d.pdf SAS 系统和数据分析系统和数据分析 电子商务系列 上海财经大学经济信息管理
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度房屋租赁合同(含租赁房屋的法律法规遵守)
- 二零二五年度体育场馆装修委托合同模板
- 2025茶具历史文化研究与应用合同
- 二零二五年度沥青材料研发、生产、销售与培训合同
- 2025餐饮加盟店加盟合同范本
- 2025版网红餐饮品牌门店租赁合作框架协议
- 二零二五年度架工班组承包合同风险预警与处理协议
- 2025版墙纸装修材料供应与施工质量保证合同
- 2025版特色主题婚礼专用礼堂场地租赁合同
- 二零二五版企业品牌策划与营销管理合同
- 旅游景区反恐管理制度
- 2025-2030年中国外墙外保温系统行业市场现状供需分析及投资评估规划分析研究报告
- 文印员考试题库及答案
- 安全总监考试试题及答案
- 2025-2030潜伏性结核感染(LTBI)测试行业市场现状供需分析及投资评估规划分析研究报告
- 县级医院运营管理制度
- XX学校(幼儿园)食堂管理各岗位廉政(廉洁)风险点及防控措施一览表
- 钢结构钢爬梯包工包料合同范本
- 2025届高考数学二轮复习专题21排列组合与概率必刷小题100题教师版
- 家庭房屋财产协议书
- 陶行知生活即教育教师读书分享
评论
0/150
提交评论