




已阅读5页,还剩60页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一次实验 1 了解SAS系统功能2 熟悉SAS的页面操作3 熟悉SAS BASE一些常用的语句要求 1 掌握数据的输入输出 datainputputoutputcards等语句的配合使用 2 掌握常用的基础统计计算 二项 正态等分布的概率函数值和分位数的计算 3 熟悉数据的图形显示功能 1 第一讲SAS系统概述 一 什么是SAS系统 二 SAS BASE简介 2 一 什么是SAS系统 SAS系统是一个模块化的集成软件系统 提供数据访问 数据管理 数据分析 数据呈现 包括 1 基本部分 也是核心部分 BASESAS 2 统计分析 SAS STAT 3 高级绘图 SAS GRAPH 4 矩阵运算 SAS IML 5 运筹学和线性规划 SAS OR 6 经济预测和时间序列分析 SAS ETS 7 面向任务的菜单驱动界面 SAS ASSIST 3 二 SAS系统的特点 2 SAS语言是编程能力强且简洁易学的非过程语言 3 SAS系统把数据处理与统计分析融为一体 4 适用性强 应用面广 二 SAS系统的特点 1 使用灵活方便 功能齐全 4 三 SAS BASE简介 主要功能是 可以单独使用 也可以同其它软件产品一起组成一个用户化的SAS系统 3 报表生成和图形显示功能 1 数据管理 2 基础统计计算功能 5 1 数据管理功能 1 信息存贮和检索 可用任何格式读入数据值 然后组成SAS数据集 具有很强的与外部文件交换信息的功能 可以用文件操作管理方法把不同数据集的数据组合在一起 供SAS过程分析处理 生成报表 2 数据修改与程序设计 3 文件操作 用于对数据进行编辑 整理 连接 合并及更新的功能 还能同时处理多个输入文件 或者对一次输入的数据能够生成几种报表 6 3 报表生成和图形显示功能 2 基础统计计算功能 计算简单的描述性统计量 SAS函数可用于计算概率分布函数 分位数 产生随机数等 7 一 SAS显示管理系统 DisplayManagerSystem DMS 第二讲SAS使用概述 编辑窗口 PROGRAMEDITOR 编辑程序和数据文件 日志窗口 LOG 记录运行情况 显示 信息 输出窗口 OUTPUT 输出运行的结果 图形窗口 GRAPH 输出图形 点击Globals菜单中的Programeditor Log Output Graph命令可以进入编辑 日志 输出及图形窗口 按功能键F5 F6 F7也可以进入编辑 日志及输出窗口 是用户和SAS系统交互式会话环境 点击 图标后 即可进入 的显示管理系统 在 中有四个主要的窗口 8 二 的功能键用功能键可以代替对菜单的点击 有时比较方便 最常用的功能键有F1 显示帮助信息 4 显示已经运行的程序 5 进入编辑窗口 6 进入日志窗口 7 进入输出窗口 8 程式提交运行 9 显示功能键 以上功能键的用法熟悉之后 还可以定义或修改功能键 例如 可以定义Ctrl E为功能键 用来清屏 9 三 SAS语句 一个SAS语句是由SAS关键词 SAS名字 特殊字符和运算符组成的字符串 并以分号 结尾 SAS关键词 如data语句 proc语句 infile语句等 SAS名字 最多由1 8个字符组成 首字符必须是字母或下下划线 字符包括 字母 数字或下划线 如 变量名 SAS数据集名 过程名等 SAS语句一般形式 KEYWORDparameter option 注 SAS规定 每个语句以 作为该语句结束的标志 10 四 SAS程序 1 DATA语句 产生SAS数据集 2 PROC语句 对SAS数据集内数据进行分析处理 输出结果 SAS程序 三明治 以DATA语句开始 面包 告诉程序有关的数据集 最后是PROC语句 中间是数据 肉 一序列语句组成一个SAS程序 完成一定的功能 SAS程序中语句分为两种 SAS程序构成 一个或多个data语句 一个或多个proc语句 一个或多个proc语句 一个或多个data语句 11 程序示例 dataex inputno sex agehw cards 10f47156 347 124m38172 461 553m41169 264 546f52158 253 638f39160 148 procsort bysex procmeans bysex varhw run 12 第四讲DATA步入门 一 什么是 二 创建SAS数据集 三 DATA步语句及其类型 13 一 什么是DATA步 1 检索 把输入数据转化为SAS数据集 2 编辑 检查数据中的错误并修改它们 计算新变量 3 按照用户设计的规格输出报告并存为磁盘文件 4 从已经存在的数据集中通过取子集 合并和更新原数据的方法来产生新的数据集 DATA步是用DATA语句开始的一组或几组SAS语句 其目的 14 1 数据在作业流中 从作业流中输入数据产生SAS数据集 二 创建SAS数据集 Ex 1datad1 inputx1x2x3 y x1 x2 x3 cards 123456 一般形式为 注 数据之间以空格隔开 数据行与行之间不用分号 15 2 数据在磁盘上 从磁盘上读入数据文件产生SAS数据集 二 创建SAS数据集 Ex 2datad2 infile e da1 dat inputx1x2x3 y x1 x2 x3 run 一般形式为 16 3 数据来自其它SAS数据集 从一个或几个已经存在的SAS数据集产生新的SAS数据集 二 创建SAS数据集 Ex 3datad3 setda2 ifx1 0 run 一般形式为 Ex 4datad3 mergeda1da2 run 17 4 把SAS数据集转换为外部数据或输出报表 二 创建SAS数据集 一般形式为 18 三 DATA步语句及其类型 只用于DATA步的SAS语句共有56个 分为四类 文件操作语句 运行语句 控制语句 信息语句 常用的data步语句 文件操作语句 data input cards file infile by set merge等运行语句 赋值语句 累加语句等控制语句 循环语句 条件语句等信息语句 略 19 1 语句 语句的作用是表明数据步的开始并给出数据集的名称 语句的格式为 数据集的名称 注 1 数据集的名称必须以英文字母开始 最长不超过 个字符 2 数据集的名称都是由符号 分隔的两个部分所组成 第一部分标记数据集所存储的位置 称作一级名或库逻辑名 第二部分标记一个特定的数据集 称作二级名 如果不想把数据集永久储存在指定的磁盘上 可以只使用二级名 20 例 系统会自动地把 作为数据集的二级名 并添加 作为数据集的一级名 因此在日志窗口显示的信息中记该数据集为 但是这个数据集是临时的 它仅仅在程式运行期间有效 过后它就被复盖 不能重新调用 21 2 语句 语句的作用是与 呼应 标志数据行的开始与结束 语句的格式为 数据行 注 如果使用 语句 在 的后面必须紧跟数据行 并且在一个数据步中最多只能有一个 语句 22 3 语句 语句的作用是描述输入记录中的数据 并把输入值赋给相应的变量 语句的格式为 数据的变量名 顺序及类型 注1 用 语句是为了读外部文件的数据或跟在 语句后面的数据 除非在 语句中的变量名后有串符号或用字符的输入格式表示 或该变量事先已被定义为字符型 否则 认定用 语句读入的是数值型变量的值 23 注2 用 语句时 外部文件中的数据和 语句后面的数据都采取列表输入的方法 各个变量的值由它们之间的空格来分隔 为从一行读入多个观测值 应使用行保持符 限制读数指针 使其保持在这一行上读数 直到数据读完为止 Ex 1dataex1 inputx1x2x3 y x1 x2 x3 cards 123456 Ex 1dataex1 inputx1x2x3 y x1 x2 x3 cards 123456 24 4 语句 语句的作用是指明外部数据文件的名称 并从这个外部数据文件中读取数据 语句的格式为 外部数据文件名 例如 在 驱动器上有一个名称为ex2 的数据文件 其中数据排列为 3 12 2 23 3 4 4 12 4 2 5用 语句读取数据的程式为 ex2 用 语句读取数据时 要求外部数据文件必须是可以在操作系统中用 命令打印出全部内容的 码文本文件 25 5 语句 语句的作用是按照指定的条件从指定的数据集中读取数据建立新的数据集或将两个数据集中的观测值纵向连接建立新的数据集 语句的格式为 数据集名表 例如 从数据集 中读取数据建立新的数据集 可编辑语句 将两个数据集 和 中的观测值纵向连接建立新的数据集 可编辑语句 26 datad1 inputg ab cards 157179134 datad2 inputg ac cards 2482662810 datad3 setd1d2 procprint run 运行结果Obsgabc1157 2179 3134 424 8526 6628 10 27 6 语句 语句的作用是将两个数据集中的各个观测值横向合并建立新的数据集 语句的格式为 数据集名表 例如 将数据集 与 中的观测值横向合并建立新的数据集 可编辑语句 28 datad1 inputabc cards 157179134126 datad2 inputxyz cards 248266 datad3 merged1d2 procprint run 本程式运行的结果如下 OBSABCXYZ115724821792663134 4126 29 7 do语句简单do语句循环do语句dowhile语句dountil语句 30 简单do语句 常常用在if then else语句里来指定一个语句组根据if条件成立或不成立时被执行 格式为 do 一些sas语句 end 例 dataa inputx ifx 5thendo y x 10 putx y end cards 124115 输出结果 x 12y 120 x 11y 110 31 例 dataex dox 1 645 1 96 2 576 p probnorm x putx p end run 在log窗口输出结果 x 1 645p 0 9500150945x 1 96p 0 9750021049x 2 576p 0 9950024677 32 循环do语句 格式为 do 一些sas语句 end 例 dataa dox 3to3by0 25 doy 3to3by0 25 p x x y y putx y p end end run 33 第五讲PROC步入门 一 什么是PROC步 二 PROC语句 34 一 什么是PROC步 PROC步是用PROC语句开始的一组或几组SAS语句 一般形式为 Ex 4procprintdata d1 run 注 1 不同的SAS过程可以使用的也是不同的 2 Proc步中常出现的SAS控制语句 1 var变量名 2 by变量名 要求排序 3 class变量名 4 ID变量名 35 二 SAS基本输出过程 procprint 或procprintdata 文件名 36 2 procplot 语法 procplot选项 by变量列表 plot选项 选项 如vpect 33 规定产生的散布图在垂直方向占一页的比例hpct 50formchar 字符串 plot选项 plotvertical horizontal或plotvertical horizontal 字符或变量 37 3 procsort byvariables run 38 1 procmeans varvariables byvariables freqvariables outputout 新文件名变量名列表 统计关键词 run 三 SAS基础统计过程 Options meanstdclmalphatprt 39 注1 procmeans可以计算的统计量由21种 分别用下述关键词表示 n nmiss mean std max min range sum var uss css cv stderr t prt skewness kurtosis clm lclm uclm 注2 outputout 新文件名变量名列表 统计关键词 40 Ex procmeansdata ex varweightheight classsex outputout resultmean meanweightmeanheightstd weight stdweightstd height stdheightrun procprintdata result run 41 偏态与峰度分布的形状 42 偏态 概念要点 1 数据分布偏斜程度的测度2 偏态系数 0为对称分布3 偏态系数 0为右偏分布4 偏态系数 0为左偏分布5 计算公式为 43 偏态 实例 例 已知1997年我国农村居民家庭按纯收入分组的有关数据 试计算偏态系数 44 农村居民家庭村收入数据的直方图 偏态与峰度 从直方图上观察 按纯收入分组 元 结论 1 为右偏分布2 峰度适中 45 偏态系数 计算结果 将计算结果代入公式得 结论 偏态系数为正值 而且数值较大 说明农村居民家庭纯收入的分布为右偏分布 即收入较少的家庭占据多数 而收入较高的家庭则占少数 而且偏斜的程度较大 46 峰度 概念要点 1 数据分布扁平程度的测度2 峰度系数 3扁平程度适中3 偏态系数3为尖峰分布5 计算公式为 47 峰度系数系数 实例计算结果 代入公式得 例 根据表4 10中的计算结果 计算农村居民家庭纯收入分布的峰度系数 结论 由于 3 4 3 说明我国农村居民家庭纯收入的分布为尖峰分布 说明低收入家庭占有较大的比重 48 2 procunivariatevarvariables byvariables freqvariables outputrun Options normal 注 计算分位数 频率表 数据的正态性检验等 49 Options 1 Normal2 Plot 生成一个茎叶图或水平直方图 一个盒形图 一个正态概率图 50 3 procttestclassvariables varvariables run 51 4 proccorrvarvariables withvariables byvariables freqvariables run 注 计算Pearson相关系数和显著性概率以及单变量统计量 52 第六讲全程语句 一 什么是全程语句 二 常用的全程语句 53 一 什么是全程语句 全程语句 既可以用在data步 也可以用在proc步 既可以用在data步和proc步的外部 也可以用在data步和proc步的内部 这些语句可以用在SAS程序的任何地方 称为全程语句 54 二 常用的全程语句 1 注释语句 messages 或 messages 无需分号 2 Title语句 规定同SAS输出一起被打印的标题行Title n 1 10 e g Title2 Annualcosts 3 run 4 endsas 55 应用SAS计算二项分布的分位数 probbnml p n k 而P X k probbnml p n k probbnml p n k 1 dataex dok 1to10by1 p probbnml 0 5 10 k probbnml 0 5 10 k 1 putp end 56 dataex dok 1to10by1 dop 0 5 n 10 value probbnml p n k probbnml p n k 1 output end end procprintdata ex run 57 应用SAS计算标准正态分布的分位数在SAS中有probit p 函数 用此函数可以求p分位数 SAS程序为dataex dop 0 025 0 05 0 1 0 9 0 95 0 975 u probit p putup end run 输出的结果如下 1 9599639850 025 1 6448536270 05 1 2815515660 11 28155156550 91 6448536270 951 95996398450 975 58 当 0 10 0 05 0 01时 应用SAS计算双侧分位数的程序为 dataex dox 0 1 0 05 0 01 p 1 x 2 u probit p putxpu end run 输出的结果如下 0 10 951 6448536270 050 9751 95996398450 010 9952 5758293035 59 应用SAS计算卡方分布的分位数在SAS中有cinv p df 函数 用此函数可以求p分位数 SAS程序为dataex dodf 4 dop 0 025 0 05 0 1 0 9 0 95 0 975 c cinv p df putpdfc end end run 输出的结果如下 0 02540 48441855710 0540 71072302140 141 06362321680 947 77944033970 9549 48772903680 975411 143286782 6
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 工业设计中的人机工程学应用
- 工业自动化技术智能制造与生产效率提升
- 工业设计与人类健康的关系探讨
- 工业设计与产品造型创新
- 工作中的沟通协调技巧培训
- 工业风格建筑的设计与实践
- 工作场所的多元沟通方式
- 工程填方区的防护性绿化技术探索与实践
- 工程机械设计中的材料选择与仿真
- 工程劳务费用合理计算与评估
- FZ/T 93056-1999变形丝用筒管技术条件
- 跨区域就读证明
- 国开期末考试《建筑制图基础》机考试题及答案(第D-1套)
- SA8000-2014社会责任绩效委员会SPT组织架构、职责和定期检讨及评审会议记录
- 学术论文写作规范与技巧课件
- 生物高中-基于大数据分析的精准教学课件
- 焊接热处理工艺卡
- 公共政策学(第三版)-课件
- 齐鲁医学Lisfranc-损伤
- 大型钢网架整体提升施工工法
- 干熄焦炉内固_气流动与传热数值模拟毕业论文
评论
0/150
提交评论