第3讲 SAS软件使用简介(2)_第1页
第3讲 SAS软件使用简介(2)_第2页
第3讲 SAS软件使用简介(2)_第3页
第3讲 SAS软件使用简介(2)_第4页
第3讲 SAS软件使用简介(2)_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2020 4 6 西南科技大学生命科学与工程学院周海廷制作 1 SAS软件使用简介 2 第三讲 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 2 SAS语言与数据管理 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 3 一 SAS语言构成 一 SAS语句SAS语言程序由数据步和过程步组成 数据步用来生成数据集 计算 整理数据 过程步用来对数据进行分析 报告 SAS语言的基本单位是语句 每个SAS语句一般由一个关键字 如DATA PROC INPUT CARDS BY 开头 包含SAS名字 特殊字符 运算符等 以分号结束 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 4 SAS关键字是用于SAS语句开头的特殊单词 SAS语句除了赋值 累加 注释 空语句以外都必须以关键字开头 SAS名字在SAS程序中标识各种SAS成分 如变量 数据集 数据库 等等 SAS名字由1到8个字母 数字 下划线组成 第一个字符必须是字母或下划线 SAS关键字和SAS名字都不分大小写 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 5 二 SAS表达式SAS数据步程序中的计算用表达式完成 表达式把常量 变量 函数调用用运算符 括号连接起来得到一个计算结果 SAS常量主要有数值型 字符型两种 并且还提供了用于表达日期 时间的数据类型 例如 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 6 因为SAS是一种数据处理语言 而实际数据中经常会遇到缺失值 比如没有观测到的数值 被访问人不肯回答 等等 SAS中用一个单独的小数点来表示缺失值常量 SAS变量的基本类型有两种 数值型与字符型 日期 时间等变量存为数值型 SAS的数值型变量可以存储任意整数 定点实数 浮点实数 一般不关心其区别 数值型变量在数据集中的存贮一般使用8个字符 但可以用LENGTH语句直接指定变量长度 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 7 LENGTH语句一般应出现在变量定义之前 格式为 例如 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 8 三 SAS程序规则SAS程序由语句构成 每个语句以分号结尾 最常见的SAS编程错误就是丢失分号 因为分号作为语句结束标志 所以SAS语句不需要单独占一行 一个语句可以写到多行 不需要任何续行标志 也可以在一行连续写几个语句 SAS语言中只要允许用一个空格的地方就可以加入任意多个空白 空格 制表符 回车 允许用空格的地方是名字周围 运算符周围 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 9 在SAS程序中可以加入注释 注释使用C语言语法 用 和 在两端定注释 这种注释可以出现在任何允许加入空格的位置 可以占多行 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 10 SAS程序包括数据步和过程步两种结构 每一个步是一段相对完整的可以单独运行的程序 数据步用来生成 整理数据和自编程计算 过程步调用SAS己编好的处理过程对数据进行处理 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 11 SAS数据步以DATA语句开头 以RUN语句结尾 DATA步中可以使用INPUT CARDS INFILE SET MERGE等语句指定数据来源输入数据 也可以用赋值 分支 循环等编程结构直接生成数据或对输入的数据进行修改 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 12 二 SAS语言的数据管理能力 一 SAS数据步的运行机制 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 13 1 DATA语句标志了数据步开始 并指定了数据步结束时要生成的数据集名字为A 实际是WORK A 2 第一个PUT语句要输出变量X Y Z的值但它们还没有定义 所以LOG窗口的结果显示为三个缺失值 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 14 3 正面是INPUT语句 它从CARDS语句后面的数据行中读取变量X的值10 变量Y的值20 4 下一个赋值语句计算变量Z的值得到30 因此 LOG中的第二行输出显示三个变量的值分别为10 20 30 5 从CARDS语句开始到空分号的各行是非执行的 程序运行到RUN语句 发现这是本数据步的最后一个语句 按一般程序语言规则 程序到此结束 程序中的第二行数据 100 200 就无法读入 SAS语言的不同之处就在于 程序运行到RUN后 把读入的观测 第一行的值 写入数据集 然后 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 15 6 又返回到DATA语句后的第一个可执行语句开始 并把所有的变量置初值为缺失值 于是 每一个PUT语句的结果显示三个变量均为缺失值 而不是上一步的10 20 30 7 下一个INPUT语句从数据行中读入下一个观测 把变量X Y赋值100 200 然后计算变量Z的值得300 于是PUT语句输出的X Y Z值分别为100 200 300 8 然后 运行控制跳过CARDS语句到空语句 到数据步结尾 把第二号观测输出到数据集 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 16 9 重复上述过程 直到数据指针发现已经读完了所有数据 数据步结束 将两个观测写入数据集WORK A中 SAS数据步与一般程序的区别 SAS数据步如果有数据输入 如用INPUT SET MERGE UPDATE MODIFY等语句读入数据 则数据步中隐含了一个循环 即数据步执行到最后一个语句后 会返回到数据步的第一个可执行语句开始继续执行 直到读入数据语句 INPUT SET MERGE UPDATE MODIFY 读入了数据的结束标志为止才停止执行数据步 并把读入的各个观测写入在DATA语句中指定的数据集 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 17 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 18 在数据步中输入数据可以从原始数据输入 也可以从已有数据输入 从原始数据输入要使用INPUT语句来指定输入的变量名和格式 数据行写在CARDS语句和一个只有一个顶头的分号的行之间 最简单的INPUT语句使用自由格式 按顺序列出每个观测的各个变量名 中间用空格分开 变量如果字符型的需要在变量名后面加一个 符号 符号与变量名可以直接相连也可以隔一个空格 例如 二 用INPUT语句输入数据 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 19 限制条件 1 数据每行为一个观测 各数据值之间用空格分开 2 缺失数据必须用小数点占位 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 20 3 字符型数据长度不能超过8个字符 不允许完全是空白 中间不允许有空白 开头和结尾如果有空白将被忽略 4 在INPUT语句中必须列出观测中的每一项数据对应的变量名而不能省略中间的某一个 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 21 1 字符型还是数值型 2 变量标签 LABEL 可以给变量加一个长度不超过40个字符的标签 3 变量存储长度 LENGTH 数值型数据一般长度为8字节 字符型变量长度为其能存储的字符个数 缺省为8个字符 4 变量的输出格式 FORMAT 指定如何显示变量的值 5 变量的输入格式 INFORMAT 指定如何把外部数据转换为SAS数据 三 变量属性 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 22 用ATTRIB语句指定变量的属性 格式为 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 23 SAS过程初步 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 24 一 SAS过程用法 SAS过程步的一般形式 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 25 1 VAR语句VAR语句在很多过程中用来指定分析变量 在VAR后面给出变量列表 VAR变量名1变量名2 变量名n 变量名列表可以使用省略的形式 如X1 X3 二 SAS过程步常用语句 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 26 2 MODEL语句MODEL语句在一些统计建模过程中用来指定模型的形式 其一般形式为 例如 即用语文成绩预测数学成绩 也就是建立语文为自变量 数学为依变量的回归方程 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 27 3 By语句和Class语句By语句在过程中一般用来指定一个或几个分组变量 根据这些分组变量值把观测分组 然后对每组观测进行本过程指定的分析 在使用带有BY语句的过程步之前一般先用SORT过程对数据集排序 比如 假设我们已经把stud数据集按性别排序 则下列PRINT过程可以把男 女生分别列出 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 28 在一些过程 如方差分析 中 使用CLASS语句指定一个或几个分类变量 而在另一些过程 如MEANS 中 CLASS语句作用与BY语句类似 可以指定分类变量 把观测按分类变量分类后分别进行分析 使用CLASS时不需要先按分类变量排序 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 29 4 OUTPUT语句在过程步中经常用OUTPUT语句指定输出结果存放的数据集 不同过程中把输出结果存入数据集的方法各有不同 OUTPUT语句是用得最多的一种 其一般格式为 其中用OUT 给出了要生成的结果数据集的名字 用 关键 变量名 的方式指定了输出哪些结果 比如MEANS过程中的MEAN VAR STD等等 等号后面的变量名指定了这些结果在输出数据集中叫什么名字 例如 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 30 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 31 1 Means过程功用 计算基本统计量必要的语句 procmeans varx run 三 常用的SAS过程步 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 32 2 chart过程功用 制作次数分布表次数分布图必要的语句 procchart hbarx run 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 33 3 univariateplot过程功用 正态分布检验必要的语句 procunivariateplot varx run 4 PRINT过程功用 数据输出必要的语句 PROCPRINT RUN 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 34 5 SORT过程功用 数据排序必要的语句 PROCSORT BYage PROCPRINT RUN 6 anova过程功用 单方面分类的方差分析必要的语句 procanova classesa modelx a 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 35 7 anova过程功用 双方面分类的方差分析必要的语句 procanova classesblocka modelx blocka 8 anova过程功用 三方面分类的方差分析必要的语句 procanova classesABT modelX1 ABT 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 36 9 anova过程功用 2 2复因子试验的统计分析方法必要的语句 procanova classesblockpinximidu modelx blockpinximidupinxi midu 10 anova过程功用 2 2 2复因子试验的统计分析方法必要的语句 procanova classesblockkpn modelx blockkpnk pk np nk p n 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 37 11 anova过程功用 多元方差分析必要的语句 procanova classblocktre modelx1x2x3 blocktre manovah blocktre summary run 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 38 12 anova过程功用 正交设计的分差分析必要的语句 procanova classesblockabcd modelx blockabcd meansblockabcd lsdduncantukey run 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 39 13 nested过程功用 嵌套设计的方差分析必要的语句 procnested classesplantleaf varcalcium run 14 glm过程功用 协方差分析必要的语句 procglm classt modely tx 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 40 15 glm过程功用 带有交叉项的双向不均衡设计的方差分析必要的语句 procglm classdrugdisease modely drugdiseasedrug disease ss1ss2ss3ss4 run 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 41 16 corr过程功用 简单相关系数必要的语句 proccorr vary withx1 run 17 corr过程功用 一个变量与多个变量的简单相关系数必要的语句 proccorr vary withabcdef run 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 42 18 corr过程功用 多个变量间的简单相关系数的计算必要的语句 proccorr run 19 corr partial过程功用 一级净相关必要的语句 proccorr vary witha partialf run 2020 4 6 西南科技大学生命科学与工程学院周海廷制作 43 20 corr partial过程功用 二级净相关必要的语句 proccorr vary withf partialab run 21 corr partial过程功用 三级净相关必要的语句 proccorr vary withf partialabd run 2020 4

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论