《SAS软件入门教程》PPT课件.ppt_第1页
《SAS软件入门教程》PPT课件.ppt_第2页
《SAS软件入门教程》PPT课件.ppt_第3页
《SAS软件入门教程》PPT课件.ppt_第4页
《SAS软件入门教程》PPT课件.ppt_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第1章SAS软件入门 清华大学经管学院朱世武 本章内容提要 SAS软件介绍SAS安装与启动SAS工作界面SAS窗口操作SAS帮助文档 本章重点 SAS安装 SAS技术水平层次分类 SAS工作界面 重要功能键 F5 F6 F7 CTL E命令行 资源管理器窗口 结果窗口 F7增强型编辑器窗口 F5日志窗口 F6文件浏览及操作 删除resdat新建逻辑库 创建resdat程序编辑窗口操作 数据集导入和导出 SAS系统简介 全称为StatisticsAnalysisSystem 最早由北卡罗来纳大学的两位生物统计学研究生编制1972研制出第一版 1976年成立了SAS软件研究所 正式推出了SAS软件 现在是8 2版是用于数据分析与决策支持的大型集成信息系统 统计分析功能是它的重要组成部分和核心功能国际上的标准软件系统 SAS功能模块 BASESAS模块SAS STAT 统计分析模块SAS ETS 经济计量学和时间序列分析模块SAS OR 运筹学模块SAS QC 质量控制模块SAS IML 交互式矩阵程序设计语言模块SAS GRAPH 绘图模块SAS FSP 快速数据交互式菜单系统模块SAS AF 交互式应用开发模块 SAS功能模块 SAS ASSIT 菜单驱动界面模块SAS ACCESS 访问外部数据模块SAS EIS 企业信息系统模块SAS INSIGHT 可视化探索工具模块SAS CALC 电子表格模块SAS CONNECT 分布式数据处理模块SAS WA 企业级数据仓库管理模块SAS EM 企业级数据挖掘模块 SAS模块分类 SAS系统特点 由大型机系统发展而来针对专业用户进行设计程序驱动 功能强大高级编程语言具有工业用途的分析软件 SAS技术水平层次分类 第一层次 会使用SAS菜单以及一些菜单界面的SAS模块 如INSIGHT ANALYST等 了解初步的SASBASE语句 能用SAS系统作简单的数据加工处理和分析 具有一定的数理统计知识 掌握一定的SASSTAT过程 第二层次 精通SASBASE 能用SAS语言编写复杂的SAS程序 能用SASBASE进行大型的 复杂的数据加工整理和展现 掌握SAS和外部数据文件的接口 会进行复杂的统计建模和分析等 初步掌握一种基于SAS的开发工具 第三层次 在一 二层面基础上 进一步掌握SAS AF SAS IML等 能开发基于SAS的数据管理和分析模块 本章目的 让初学者能够快速地熟悉SAS系统的应用 完成一些简单的数据处理和分析 即快速达到SAS技术第一层面水平 让读者能充分利用SAS的强大功能进行金融数据加工处理 数据整合 数据展现及简单的金融建模和计算 即第二层面水平 介绍SAS系统的菜单操作 配合命令和功能键的使用 有些地方也会附带介绍SAS系统中的一些基本概念 使初学者能够边练习边了解SAS系统 SAS运行方式 SAS系统有多种运行方式 窗口模式 WindowingEnvironment 行交互模式 LineInteractive 非交互模式 Nointeractive 批处理模式 Batch SAS工作界面 重要功能键 F5 F6 F7 CTL E 两类菜单栏 菜单栏的下拉菜单操作 点菜单栏中的按钮 弹出菜单操作 相应窗口点鼠标右键 工具栏 工具 定制 定制 资源管理器窗口工具栏 编辑器窗口工具栏 命令行 在命令行中输入SAS命令可以快速完成一些SAS任务 主要功能窗口 以 只显示内容 视图显示的 SAS资源管理器 窗口 没有树视图 结果 窗口程序编辑器 增强型编辑器 日志 窗口 输出 窗口 SAS资源管理器 窗口 资源管理器窗口 SAS资源管理器窗口下 可以执行基本的SAS任务 创建新的逻辑库和文件快捷方式 创建新的逻辑库成员和目录条目 打开和编辑SAS文件 树状结构 的资源管理器窗口 SAS默认的是 只显示内容 的SAS资源管理器窗口 根据操作环境 可以使用以下方法打开 SAS资源管理器 窗口 打开树视图和列表视图 菜单 查看 SAS资源管理器命令 EXPLORER工具栏 SAS资源管理器 结果窗口 可以通过结果窗口对程序的输出结果进行浏览和管理 SAS可以用一种或多种格式 或类型 产生输出 默认类型是 列表 输出 如右图的 查询结果 其他输出类型包括HTML 输出数据集 和PostScript 要设置输出类型 可使用菜单栏 工具 选项 参数选择 结果 标签 进入参数选择窗口进行设置如下图所示 点选创建HTML时 输出结果同时展现在HTML文件中 增强型编辑器窗口 SAS9 1版本的默认编辑窗口为增强型 它比普通编辑窗口增加了如下功能 使用特定颜色对SAS程序 SCL程序以及HTML和XML文件的元素进行显示 同时进行相关语法检查 创建和格式化自定义的关键词 每个过程步 数据步或者宏的程序段都可以实现展开和收缩的功能 以便对SAS程序的宏观结构有更好的了解 通过定义缩写来快速输入一段文字 通过显示行号使得程序代码更具可读性 设定增强型编辑器的快捷功能键 同时打开一个文件的多个视图 将光标停留在语言元素上 按F1就可以直接进入到SAS帮助文档中该语言元素的说明部分 当然有时候该语言元素有多个主题 可以根据需要进行选择 日志窗口 日志 窗口用来查看程序运行信息 提交的程序语句 系统消息和错误 程序运行速度和时间 日志 窗口中的元素根据以下类型呈现不同的颜色 程序行黑色 以语句标号开始 提示蓝色 以NOTE开始 警告绿色 以WARNING开始 错误红色 以ERROR开始 输出窗口 按F8提交程序 SAS界面如下所示 输出窗口用来查看SAS程序的输出结果 SAS窗口操作 窗口切换 点选该功能窗口区域 或是点选该功能窗口的窗口条标签 通过菜单栏中的 窗口 或 查看 菜单点选所需要的窗口 通过在命令行输入命令或点选功能键的方式打开窗口 视图停放 SAS默认启动了停放视图 并在工作界面的左边停放一些常用的窗口 如 结果 和 资源管理器 窗口 停放窗口选择窗口以使其成为当前窗口 选择窗口 停放 取消停放窗口在停放区域的底部 点击要取消停放的窗口的选项 选择窗口 停放 完全关闭停放选择工具 选项 参数选择 在参数选择对话框中 点击视图选项卡 选中停放视图复选框并点击确定 所有窗口都被取消停放了 文件浏览及操作 增加目录 数据表点选目标逻辑库 除sashelp和maps外 选择新建 就可以按照提示增加目录或SAS数据表 复制粘贴数据表要复制粘贴逻辑库中的数据表和其它文件 只需在资源管理器窗口中进入源逻辑库选择数据表 按ctrl c 然后进入到目标逻辑库中 ctrl v就可以把这些表复制过来 新建逻辑库 在逻辑库级别 在空白处按右键 选择新建 出现如下界面 在名称中输入新的逻辑库名称 在引擎中根据数据来源选择不同的引擎 如果只是想建立本机地址上的一个普通的SAS数据集数据库 可以选择默认 然后点选启动时启用 在逻辑库信息中 点选路径后面的浏览按钮 选择与这个逻辑库相对应的物理地址 选项窗口可以不填 点击确定产生一个新的逻辑库 程序编辑窗口操作 提交程序可以用增强型编辑器编写程序 也可以将用其它文本编写的程序拷贝到编辑器 程序完成后 直接按F3或者F8提交程序 或点选工具条中的提交按钮 或者在命令框中输入Submit命令 储存程序程序可以保存为其它格式的文本 也可以直接以编辑器的方式来储存 直接点选文件 保存 选择路径就可以保存这些程序 功能键窗口 在SAS软件中 一些键或组合已经被赋予特定功能 这就是功能键 可以通过下列方式打开功能键窗口工具 选项 功能键或者在命令行中输入KEYS的命令 或者按F9 系统默认设置 参数选择窗口 可以通过参数选择窗口对SAS进行许多个性化的设计以下是SAS的默认设置 数据集导入和导出 数据集的导出 第一步 点选文件 导出数据 出现如下界面 要求输入要导出文件的逻辑库名称和数据文件名称 比如要导出sashelp逻辑库的class数据文件 通过下拉菜单选择逻辑库和数据文件 第二步 点选next 进入到选择输出格式界面 通过下拉菜单选择给定的格式 MicrosoftExcel97 2000or2002workbook 然后点选next 第三步 进入到设定输出文件位置和名称界面 通过浏览按钮选择输出位置 并键入输出文件的名称 如E test xls 第四步 点选ok 进入到SASExportWizard画面 SASExportWizard和后面要介绍的ImportWizard是SAS转换数据文件的工具 在这个画面中 ExportWizard要求对这个输出过程的table命名 这时可以直接选finish完成输出 或者命名为 1 第五步 如果上一步选择命名 SAS会建立一段与上述窗口操作相同的程序 并提示是否要保存这段程序 第2章SAS编程基础 清华大学经管学院朱世武Zhushw Resdat样本数据 SAS论坛 SAS语言组件 SAS文件 由SAS创建 储存 管理的文件就是SAS文件 所有的SAS文件都保存在SAS逻辑库中 最常用的SAS文件 SAS数据集SAS目录册 SAS外部文件 SAS不能直接识别的数据文件称为外部文件 外部文件一般用于储存数据 外部文件一般用来储存 要读入SAS数据文件的原始数据SAS程序语句过程步输出 DBMS文件SAS软件可以和其它数据库产品进行数据文件转换 SAS语言元素SAS语言由语句 表达式 选项 格式 以及和其它编程语言名称类似的函数组成 SAS有两种语句数据步过程步 SAS文件系统 SAS逻辑库由一组SAS文件组成 SAS软件系统的信息组织有两层 第一层是SAS逻辑库 第二层是SAS文件 SAS逻辑库是一个逻辑概念 本身不是物理实体 它对应的实体是操作系统下一个文件夹或几个文件夹中的一组SAS文件 逻辑库 逻辑库名与引用SAS文件 逻辑库名是SAS名 长度不能超过8个字节 如SAS逻辑库 ResDat SASHELP SASUSER WORK等 建立SAS逻辑库的方法 用菜单操作 用LIBNAME语句 语句格式 LIBNAMElibref SAS data library 语法说明 Libref逻辑库名SAS data library逻辑库对应的物理地址Engine引擎名称 缺失时为默认引擎 例2 1用LIBNAME语句创建SAS逻辑库 LibnameResDat d ResDat 多个个文件夹创建一个SAS逻辑库 Libnamea d resbd d resfin 例2 2引用非临时库的SAS文件时必须使用两级命名方式 而引用临时库的SAS文件时 可以直接使用文件名 效果等同于work 文件名 data ResDat Idx000001 临时库和永久库临时逻辑库是指它的内容只在启动SAS时存在 退出SAS时内容完全被删除 系统缺省的临时逻辑库为WORK 永久逻辑库是指它的内容在SAS关闭对话之后仍旧保留 直到再次修改或者删除 SAS系统中除了WORK以外的逻辑库都是永久库 库引擎库引擎是一组规定格式向逻辑库读写文件的内部指令 利用库引擎SAS系统可以直接访问其它SAS版本创建的SAS文件和外部数据库格式的数据文件 每个SAS逻辑库都对应一个库引擎 库引擎功能包括 读取和写入数据 列出库中的文件 删除和重命名文件 SAS通过不同库引擎读写不同格式的文件 每个SAS引擎都有着自身的运行特性 比如运行由旧版本SAS软件生成的文件 读取由其它软件生成的数据库文件 存储和访问硬盘或者tape上的文件 决定文件中的变量和观测如何放置 将文件从物理位置地址读取放入到内存 在不同的操作系统之间传输SAS文件 数据集 SAS数据集有两类 SAS数据文件SAS数据视图 SAS数据文件同时描述信息和存储数据值 SAS数据视图并不实际存储数据 而只是一个查询语句 class是数据视图class1是数据文件 SAS数据集组成部分包括 描述信息 数据值 数据文件SAS数据文件是包含描述信息和数据值的SAS数据集 一般来说 SAS数据文件又分为 普通的SAS数据文件 SAS格式的数据文件 接口数据文件 以其它数据软件格式储存数据的数据文件 SAS提供对应的引擎来对这些文件中的数据进行读取和编写 如ORACLEDB2 SYBASE ODBC BMDP SPSS和OSIRIS 虽然数据文件与视图文件在应用时没有任何区别 但这两者之间也有一定的差异 前面已经提到二者最大的不同就是数据文件实际储存数值 视图只是包含表的描述信息以及一组用来读取数据的查询语句 并不实际存储数据 数据文件是静态的 而视图则是动态的 SAS数据文件可以被索引 索引可以使SAS在搜索数据的时候变得更快 而SAS视图不能被索引 数据视图 SAS数据视图就是用来从其它文件中读取数据的一种SAS文件 它只包括数据集的描述信息 如数据类型 变量长度等 再加上如何从其它文件中提取数据所要求的信息 SAS视图一般分为两种 NativeView 由数据步或者SQL过程创建 InterfaceView 由SAS ACCESS软件创建 InterfaceView可以读写其它数据库管理系统 DBMS 中的数据库 如DB2或ORACLE数据库等 数据视图的使用优势可以使用连接多个表的视图来合并数据集 数据视图可以节省大量的空间 数据视图可以保证读取的数据集永远都是最新的 更改一个数据视图只需要改变这个视图的查询语句 使用SAS CONNET软件 视图可以将多个不同主机电脑上的数据文件整合 以整体的形式呈现 数据步视图数据步视图包含用于从多个数据源中读取数据的数据步程序 这些数据源包括 原始数据文件 SAS数据文件 PROCSQL视图 SAS ACCESS视图 DB2 ORACLE 或者其它DBMS数据 语法格式 Data数据集名称 view 数据集名称 SAS语句 Run 例2 3创建数据步视图 DataResdat class1 view Resdat class1 setResdat class run 日志中信息 PROCSQL视图PROCSQL视图为一个带有名称的PROCSQL查询 它可以读写的数据源同数据步视图 procsql createviewresdat easselect fromresdat class quit 日志中信息 存储编译的DATA步程序 语句格式DATAdata set name s PGM stored program name 语法说明 目录册文件SAS目录册文件是特殊的SAS文件 用来存放多种不同种类的信息文件 这些信息文件都很小 每个信息文件都被称为一个条目 entry 条目有多种不同的类型 一些目录条件包含一些系统信息如功能键定义信息 SAS语言元素 数据集选项数据集选项用在SAS数据集名称后的括号中 多个选项之间用空格隔开 括号中的数据集选项可以对数据集进行如下操作 重新命名变量 选择需要的观测 输出数据集中保留或删除的变量 数据集加密 语句格式 Data set name Data set options option 1 value 1 例2 4数据集选项举例 datascores keep teamgame1game2game3 scores中只保留team game1game2game3这4个变量 procprintdata new drop year 去掉变量year setold rename date Start Date 将date改名 输入和输出格式 输出格式format是SAS用来确定如何输出或写出数据值的指令 用FORMAT控制数据值在输出时所使用的格式 输入格式informat是SAS用来确定如何将数据读入变量的指令 如果在输入或输出数据集的过程中没有设定变量的输入和输出格式 系统会自动使用原数据集中的这个变量原有的输入输出格式 语句格式 format informat 格式说明 函数和CALL子程序 SAS函数对数据参数进行计算处理并返回一个值 大多数函数所使用的参数是由用户提供的 一小部分函数使用系统提供的参数 CALL子程序用来改变变量值 或执行一些系统功能 CALL子程序类似于函数 但是不能在赋值语句中使用 所有的SASCALL子程序都只能被CALL语句使用 语句SAS语句就是一系列关键词 SAS名称 算符以及特殊字符的组合 所有的SAS语句以分号结尾 SAS语句一般分为数据步语句与过程步语句 以及可以用在SAS程序任何地方的全局通用语句 KEYWORDparameter options 关键词参数 选项 其中 粗体 必须按显示形式书写的关键词 白正体 用户提供的信息 括号内的信息可选 任选 参数PARAMETER不是任选项 不用括号 OPTIONS是选项关键词 例2 5有效的SAS语句 datadata1 data为关键词 data1为SAS名 data null null 为SAS名 putname 8 put为关键词 name为SAS名 8 为输出格式 formatdateyymmdd10 procmeansdata ResDat class proc为关键词 means为过程名 infile d ResDat class txt doI 1to100 x y 1 sumx x run SAS系统选项 系统选项用来控制SAS的运行方式 如SAS系统启动 硬件软件的连接 SAS程序的运行等 语句格式 OPTIONSoption s option设定一个或多个系统选项 任何系统选项都有一个默认设置 例2 6设定选项OPTIONSobs 5 取数据集前五个观测 Dataone SetResDat class Run 表达式 表达式由一系列操作符和操作对象构成 产生一个目标值 使用表达式可以对变量作变换和赋值 创建新变量 计算新数值以及控制条件语句的运行等 操作对象有 变量 常数 操作符包括 算术算符 比较算符 逻辑算符 SAS函数 括号 SAS常数 SAS常数是SAS系统可以识别的一些固定值 数值常数 例2 7数值常数 1 5 1 23 1 2E23 2E4 20000数值常数可以有多种格式展示 标准格式 1 01 1 1 1 1 科学计数法 1 1e11 1 2e 12 十六进制格式 1cx 12x 9x 字符常数 例2 8引用带引号的字符常数 name TOM S name TOM S 例中 两语句等价 要注意的是 字符常数是由引号括起来的 但是字符变量的名称则没有引号 也就是说字符常数不能作为字符变量的名称 日期时间常数 例2 9引用日期时间常数 1jan2000 d 01jan00 d 9 25 t 18jan00 9 27 25 dtifbegin 01JAN2000 dthenend 31DEC2000 d SAS算符SAS算符是一些符号 其作用是进行计算 比较等 算术算符 例2 10算术算符应用 data X 3 5 2 5 putX Y 9 1 3 putY X Y 1 X putY Y也是缺失值 run 输出结果 比较算符 例2 11比较算符应用 ifx ythenc 5 elsec 12 比较算符经常出现在IF语句里 比较准则 数值和字符都可以比 结果为真赋值1 假赋值0 字符值从左到右逐个按ASCII码排列序列进行比较 缺失值参加比较时 它比任何有效值都小 逻辑算符 其它算符 连接字符算符 例2 12连接多个变量和常数 data setResDat lstkinfo result a stkcd stknm putresult run SAS变量 SAS变量分为数值变量和字符变量 数值变量数值变量是SAS系统以浮点 floating point 方式存储的数据变量 数值变量包括日期和时间 数值变量的值只能是数值 字符变量字符变量可以由阿拉伯字母 数字0 9以及其它一些特殊字符组成 字符变量的值可以是字符 字母 特殊字符和数值 字符变量名后跟一个美元号 表示该变量是字符型而不是数值型 变量属性 SAS变量的属性包括 长度 输人输出格式和标签 未设定属性的变量在它们第一次出现时由系统给出 变量的长度是指存贮变量值的字节数 缺省长度为8个字节 变量的输人格式是指SAS系统读人变量值的方式 变量的输出格式是指SAS系统展现变量值的方式 变量的标签是指变量名的描述性标识 它至多可用256个字符 创建变量 使用赋值语句Dataa x 1 run 数据集a中有个变量x 值为1 使用INPUT语句Datab Inputx Datalines Aaa Run 使用FORMAT或INFORMAT语句Datab Setb Informaty 9 Run 以类似的方式创建变量的还有LENGTH语句 ATTIRB语句 变量类型转换 字符自动转换为数值 例2 15字符自动转换为数值 data X 1 X为数值变量 Y 10 Y为字符变量 X Y 将字符变量赋值给一个数值变量时 自动将字符变量Y转换为数值变量 run data X 1 X为数值变量 Y 10 Y为字符变量 Z X Y 算术表达式中有字符变量时 自动将字符变量Y转换为数值变量 run data X 1 X为数值变量 Y 10 Y为字符变量 ifX Y 字符与数值变量进行比较时 自动将字符变量Y转换为数值变量 run data Y 10 Y为字符变量 Z log Y 需要数值变量的函数中引用字符变量时 自动将字符变量Y转换为数值变量 run 函数INPUT将字符转换为数值 INPUT函数的形式 INPUT 数据源 输入格式 其中 数据源为要转换为数值的变量 常数或表达式 数据源既可以是数值型 也可以是字符型 输入格式规定对数据源进行转换的输入格式 例2 16转换字符变量为数值变量 dataa keep code setResDat lstkinfo code input stkcd 6 run 数据集Acode1245 200011200012 数值自动转换为字符 例2 19数值自动转换为字符 data X 10 X为字符变量 Y 10 Y为数值变量 X Y 自动将数值变量Y转换为字符变量 run 日志信息 10data 11X 10 X为字符变量 12Y 10 Y为数值变量 13X Y 自动将数值变量Y转换为字符变量 14run NOTE 数字值已转换为字符值 位置 行 列 13 3NOTE 数据集WORK DATA2有1个观测和2个变量 NOTE DATA语句 所用时间 总处理时间 实际时间0 03秒CPU时间0 00秒 data Y 10 Y为数值变量 Z ROOM Y 自动将数值变量Y转换为字符变量 putZ run data Y 10600001 Y为数值变量 Z SUBSTR Y 7 6 自动将数值变量Y转换为字符变量 putZ run Z ROOM10 Z 600001 系统自动地将数值转换为字符时 使用BEST12 的输出格式 字符值右对齐 函数PUT将数值转换为字符 PUT函数的形式 P

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论