SAS 基础培训课程.ppt_第1页
SAS 基础培训课程.ppt_第2页
SAS 基础培训课程.ppt_第3页
SAS 基础培训课程.ppt_第4页
SAS 基础培训课程.ppt_第5页
已阅读5页,还剩101页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1,SAS基础培训课程,SASInstitute(Shanghai)Co.,Ltd.,2,SAS系统,SAS系统是用于数据分析与决策支持的大型集成式模块化软件包。(其早期的名称为StatisticalAnalysisSystem),3,SAS系统是用于决策支持的大型集成信息系统,SAS系统主要完成以数据为中心的四大任务:数据访问数据管理数据呈现数据分析,4,SAS系统介绍,DATA,数据访问,BaseSASACCESSMDDBServerODBC,数据管理,BaseSASFSPSHARECONNECTASSISTWarehouseAdmin.MDDBServer,数据分析,BaseSAS,STAT,ETS,OR,QC,IML,INSIGHT,NNA,LAB,SPECTRAVIEW,数据呈现,BaseSASGRAPH,GIS,CALC,INSIGHT,SPECTRAVIEW,ASSIST,开发工具,AFEISFSP,分布式计算环境,CONNECTSHAREIntrNET,TheSASSystem,5,SAS系统的构成,SAS系统是一个可由几个到二、三十个工具模块及面向行业的子系统组成的可伸缩系统。其模块按功能大体有四类:数据库及其管理面向对象的4GL开发平台各类堪称行业标准的分析工具方便用户的外层技术(多平台支持,开放环境,网络计算及分布处理),6,SAS系统软件由模块构成,数据库部分:BASESAS,FSP,ACCESS,.分析核心:STAT,ETS,QC,OR,IML,.开发呈现工具:AF,EIS,GRAPH,.分布处理与数据仓库:CONNECT,WA,.,管理,提交信息(InformationDelivery):SAS的核心业务,信息知识输出,8,SAS系统简介,要求进入SAS系统发常用命令,切换窗口进Assist和Desktop窗口,9,启动SAS:在Windows桌面系统下双击SAS图标,SAS系统简介1SAS提供的基本运行环境,或运行SAS系统目录下(例C:SAS)的可执行程序sas.exe,常用的是交互运行方式。也可用提交批作业方式运行的,10,工作界面介绍,SAS系统简介1SAS提供的基本运行环境,SAS为交互方式运行提供的环境显示管理系统下拉菜单(弹出菜单)命令框、工具栏三个基本窗口PROGRAMEDITOR窗口LOG窗口,OUTPUT窗口,11,SAS系统简介1SAS提供的基本运行环境-三个基本窗口,访问和编辑已有的SAS程序编写新的SAS程序递交SAS程序将SAS程序存为文件,是一个基本的窗口,缺省地打开依次记录SAS进程中各程序运行的信息可用命令清空,是一个基本的敞口,缺省地打开依次记录程序输出的结果有结果输出时自动转到前台,12,SAS系统简介1SAS提供的基本运行环境,SAS常用的交互式运行方式:,用SAS编程实现各种任务,用SAS提供的菜单系统实现各种任务用SAS/ASSIST,用SAS桌面系统,13,发命令,SAS系统简介1SAS提供的基本运行环境,在交互式操作中用命令指挥显示管理系统、切换窗口和完成各种特定的功能发布命令有四种方式:在命令框直接键入命令;使用下拉菜单;使用工具栏。按功能键;,14,SAS系统简介1SAS提供的基本运行环境,常用的其它窗口:KEYS查看及改变功能键的设置LIBNAME查看已存在的SAS数据库DIR查看某个SAS数据库的内容VAR查看SAS数据集的有关信息OPTIONS查看及改变SAS的系统设置,15,进菜单系统,SAS系统简介1SAS提供的基本运行环境,进入SAS/ASSIST使用工具栏图标发命令ASSIST下拉菜单选GlobalsASSIST,进入SAS桌面系统发命令DESKTOP下拉菜单选GlobalsDesktop,16,P005,SAS系统简介2运行一个简单的SAS程序,运行一个简单的SAS程序:在PROGRAMEDITOR窗口中键入程序:提交程序(SUBMIT)查看LOG窗口的信息调出提交的程序(RECALL)并修改,再次提交在OUTPUT窗口查看运行结果存储程序,17,SAS系统对数据的管理,要求设定、浏览SAS数据库打开SAS数据集及其变量窗口,18,SAS系统对数据的管理,SAS对数据的分析与呈现都是面对SAS数据集进行的SAS数据集是一种SAS文件SAS文件是由SAS系统创建和管理的有特殊结构的文件。包括SAS数据集和SAS目录册(CATALOG)等,19,SAS系统对数据的管理,数据直接输入,流行的数据库,其它文件格式,SAS数据集,SAS应用程序,20,SAS系统对数据的管理1SAS数据库,SAS数据集存储在SAS数据库中SAS数据库还存储其它SAS专用文件SAS数据库文件用两级命名方式定名:libname.SAS-filename(库标记.文件名),SAS数据集,SAS数据库,21,SAS系统对数据的管理1SAS数据库,SAS数据库有永久库和临时库两种临时库:名为WORK,系统自动指定永久库:系统自动指定名为SASUSER,(SASHELP等).其它可由用户指定,22,操作:看库,SAS系统对数据的管理1SAS数据库,用工具栏中的图标进入库管理对话窗或键入命令Dlglib或GlobalAccessDisplayLiberary可进入库管理窗口浏览库内容和库文件或用LIBNAME命令进入Libname窗口用DIR命令进入Dir窗口用VAR命令进入Var窗口,23,SAS系统对数据的管理1SAS数据库,不同的主操作系统下SAS数据库文件以不同方式与主操作系统下的文件组织相联系在Windows下每个SAS数据库置于某个子目录之中例:SASUSER:C:SASSASUSERWORK:C:SASSASWORKCOURSE:C:USERSZDW,24,连库Libname库名(目录1目录2),SAS系统对数据的管理1SAS数据库设定,用工具栏中的图标进入库管理对话窗,按下NewLibrary按键使用LIBNAME语句可以指定SAS库标:LIBNAME库名SAS数据库挘在Windows环境下:LIBNAME库名目录名挘LIBNAMEcoursec:course;,25,SAS系统对数据的管理2SAS数据集,两种类型的数据对象:SAS数据集(Datasets):包含描述部分和数据部分SAS数据视窗(DataView):只含描述部分(变量名,属性,长度,标题格式,创建与修改日期),26,SAS系统对数据的管理2SAS数据集:描述部分,27,SAS系统对数据的管理2SAS数据集:描述部分,GlobalAccessDisplayLiberary.DesktopSASExploreFilePopmenuContentsAssD.Manag.UtilitiesContents.Brun;,28,SAS系统对数据的管理2SAS数据集:数据部分,变量(字段、列),记录或行,SAS数据集的数据部分是由数据构成的矩形表,缺失值(MissingValue)。字符型变量的缺失值用空格符表示数值型变量的缺失值用句号“.”表示,29,SAS系统对数据的管理2SAS数据集看数据集,用工具栏中的图标进入库管理对话窗选中数据集在弹出菜单选Opentableview发命令:VT(或FSV)数据集名提交程序:,procprintdata=数据集名;run;,30,浏览和编辑SAS数据集,要求使用ViewTable浏览、编辑和新建SAS数据集使用ProcPrint输出SAS数据集,在SAS系统中浏览和编辑SAS数据集必须先设定SAS数据库,将要浏览和编辑的数据集存放在已设定的SAS数据库中,31,浏览和编辑SAS数据集1使用Viewtable浏览与编辑,Viewtable提供一个显示数据集的窗口。它具有对数据集的浏览、编辑和创建的功能Viewtable提供两种显示数据集的方式:TableView以矩阵表格形式显示数据,一次可显示多条记录FormView一次只显示一条记录,32,浏览和编辑SAS数据集1使用Viewtable浏览与编辑,如何进入Viewtable窗:在SAS浏览器或数据库对话窗中双击数据集图标键入命令:VT数据集名,33,浏览和编辑SAS数据集1使用Viewtable浏览与编辑,ViewFormviewTableviewViewColumnLabelColumnNameEditEditModeBrowseModeEditRowLevelEditTableLevelEdit,列:(Data)改边宽度,移动次序HideSortHoldColumnAttr.颜色行:EditFind(例D1F)DataWhere加行,34,浏览和编辑SAS数据集1使用Viewtable浏览与编辑,除了Viewtable窗口外,FSV等也提供了字符型界面的数据集的浏览和编辑的窗口,它打开数据集的速度更快。Insight和AnalystApplication也提供了对数据集浏览和编辑的窗口,他们在生成新变量方面有更强的功能,35,操作:看生成的数据集和sasuser.class,浏览和编辑SAS数据集1使用Viewtable浏览与编辑,逐条浏览:命令:FSE数据集名,PROCFSEDITDATA=SAS-data-set;RUN;,36,浏览和编辑SAS数据集2用Viewtable新建数据集,建立SAS数据集的各种途径,数据存于纸上需直接键入,数据存于文本文件,数据存于流行数据库文件中,37,先输入数据举例.另法:File=AddItem=Table,浏览和编辑SAS数据集2用Viewtable新建数据集设定变量属性,为了新建一个SAS数据集,一般应该先规定输入变量的属性(变量名,标题名,类型,长度,输入输出格式)。对格式和其它属性无特殊要求的也可先输入数据,而后设定各个变量的属性。命令:VT。选中变量名在弹出菜单选ColumnAttributes,38,浏览和编辑SAS数据集2用Viewtable新建数据集设定变量属性,数据集变量的属性描述:变量名(Name):字母或下划线开始且不超过8个字符或数字构成类型(Type):数值型、字符型长度(Length):缺省8字节(200)标题名(Label):缺省40字节输入格式(Informat):$输入格式名w.d输出格式(Format):$输出格式名w.d,必须,可选,39,浏览和编辑SAS数据集2用Viewtable新建数据集设定变量属性,在数据集的一条记录的某个变量无数据时,称为缺失值(MissingValue)。字符型变量的缺失值用空格符表示数值型变量的缺失值用句号“.”表示,40,浏览和编辑SAS数据集2用Viewtable新建数据集设定变量属性,输入、输出格式例:,12234.123412,234.1234$12,234.1234,8.2comma8.2dollar8.2,输入数据,输入格式,实际存储数据值12234.12,输出格式,8.2comma8.2dollar8.2,输出数据,12234.1212,234.12$12,234.12,41,转换:data_null_;x=put(today(),date7.);putx;run;datetry,浏览和编辑SAS数据集2用Viewtable新建数据集设定变量属性,日期输入、输出格式例:,20OCT9720/10/971997/10/20,DATE7.DDMMYY8.yymmdd10.,输入数据,输入格式,实际存储数据值13807,1960,1,101960,1,211960,2,1311961,1,1366,42,浏览和编辑SAS数据集2用Viewtable新建数据集设定变量属性,几种常用的输入、输出格式:,w.d$w.COMMAw.dDOLLARw.dDATEw.MMDDYYw.,标准的数字型格式标准的字符型格式数字中嵌入逗号数字中嵌入逗号,前加$日期格式日期格式,43,浏览和编辑SAS数据集2用Viewtable新建数据集设定变量属性,利用HELP查找SAS系统提供的输入、出格式,Help下拉菜单,SASSystem,目录:SASLanguage,索引:SASInformatsandFormats-Contents,SASFormatsandInformats,从分类功能找,从函数名找,44,SAS编程基本概念,用户提交的SAS程序由许多程序步构成。,数据步DataStep,过程步ProcStep,原始数据,SAS表,SAS表,报告,数据步常用于创建数据集,过程步常用于处理数据集(生成报表、图形和实现数据分析功能),45,SAS编程基本概念,SAS的程序由两种程序步(Step)构成:数据步(DATASTEP):以(DATA)语句开始,创建和处理SAS数据集过程步(PROCSTEP):以(PROC)语句开始,用于处理SAS数据,46,看例e029,e029_2,SAS编程基本概念,SAS的每个程序步都由语句构成。每个语句常以开始的关键词称呼,用分号表示语句的结束。SAS语句书写的格式较为任意语句可以在任一列开始和结束词间可任意加入空格和换行一个语句可跨多行,多个语句可写在一行良好的书写格式便于程序的阅读,47,浏览和编辑SAS数据集3打印数据集,基于数据集的报表从其内容来看大体有两类:一类是提供数据集的详细数据为主,在SAS中是采用Report窗口或用过程print或report另一类是只含各种分类的汇总信息,在SAS中是采用过程tabulate或与此联系的菜单窗口,48,浏览和编辑SAS数据集3打印数据集,49,浏览和编辑SAS数据集3打印数据集,PROCPRINTDATA=SAS-data-set;IDvariable;VARvariables;WHEREwhere-expression;SUMvariables;BYby-variables;PAGEBYby-variables;RUN;,50,浏览和编辑SAS数据集3打印数据集,p70最简打印并生成数据lonparp071noobsp072Varp074_1wherep074_2sump075by(sort)p076idp077pageby,p79title,footnotep80改titlep81_1加labelp81_2splitp84formatp86用定义format(也可用class为例)p88options,51,浏览和编辑SAS数据集3打印数据集Format的使用,若数据集形成时已为变量规定format,则在打印输出时自动运用这一format。在打印程序中使用format语句,可为变量临时设定使用的format。format语句的形式为,FORMATvariablesformat;,例formatdateyymmdd10.;,52,浏览和编辑SAS数据集3打印数据集Format的使用,FORMAT语句:,FORMATvariablesformat;,定义用户格式:,PROCFORMAT;VALUEformat-namerange1=labelrange2=label.;,53,浏览和编辑SAS数据集3打印数据集Label的使用,LABELvariable1=labelvariable2=label.;,Print选项:SPLIT=符号,Label语句:,54,浏览和编辑SAS数据集3打印数据集标题、脚注和选项,TITLEntext;,FOOTNOTEntext;,标题、脚注和选项:,OPTIONSoptions;,55,浏览和编辑SAS数据集3打印数据集系统相关的选项,与PRINT有关的一些系统选项CENTER|NOCENTERDATE|NODATENUMBER|NONUMBERLINESIZE=widthPAGESIZE=nPAGENO=n,定义方法OPTIONS语句OPTIONS窗口,56,浏览和编辑SAS数据集3打印数据集过程语句的选项,PROCPRINT选项;,PROCPRINT的一些选项:HEADING=v|hLABELSPLIT=符号WIDTH=Full|Min|U,57,prtto,浏览和编辑SAS数据集3打印数据集Printto的使用,procprinttoprint=文件名log=文件名new;过程步procprintto;,将打印结果和运行信息直接记入文件,filenamefileref文件名;,58,第四章生成SAS数据集,要求会用数据步输入简单的数据集会使用Import和Access窗口菜单系统,59,第四章生成SAS数据集,建立SAS数据集的各种途径,数据存于纸上需直接键入,数据存于文本文件,数据存于流行数据库文件中,3.3,60,第四章生成SAS数据集1使用数据步新建数据集,SAS的程序由两种程序步(Step)构成:数据步(DATASTEP):以(DATA)语句开始,创建和处理SAS数据集过程步(PROCSTEP):以(PROC)语句开始,用于处理SAS数据,61,看Imptdt1-Imptdt4不同格式文本本件,第四章生成SAS数据集1使用数据步新建数据集,要求:由以文本方式存放数据文件生成SAS数据集,62,第四章生成SAS数据集1使用数据步新建数据集,自文本数据文件生成SAS数据集的DATA步的一般形式:,DATASAS数据集名;变量属性设定语句;INFILE文件名FIRSTOBS=n1OBS=n2;INPUT语句;其它语句;RUN;,63,DATA步中设定变量属性的语句:,第四章生成SAS数据集1使用数据步新建数据集,LENGTH变量名长度.;,INFORMAT变量名输入格式.;,FORMAT变量名输出格式.;,LABEL变量名=字符串输入格式.;,Length还决定了变量在数据集中的次序,64,第四章生成SAS数据集1使用数据步新建数据集,INPUT语句,设定的格式:List:变量名Colunm:变量名始列-终列Formatted:指针变量名输入格式指针:n|+nNamed:变量名=始列-终列输入换行控制::不换行等待下一个Input语句:形成输出记录时输入也不换行,INPUT;,65,第四章生成SAS数据集1使用数据步新建数据集,在数据步输入中,一个input语句就从输入文件中读入新的一行按要求写入SAS记录。在数据步一轮结束或有output语句时写一行SAS记录。若输入行中字段数少于input语句中的变量数就输入下一行记录接着写。输入语句结束时输入行剩余的内容也就不用了。所以在输入语句中:保留输入行等待数据步中下一个input语句使用。但在数据步自动形成输出记录时输入行剩余的内容也清除了:除的功能外在形成输出记录时输入也不换输入行,INPUT;,66,P,INPUT语句-List格式(自由格式),第四章生成SAS数据集1使用数据步新建数据集,INPUT变量名变量名.;,源文件中字段件至少有一个空格或特定字符分隔字段只能按序输入缺失值必须用句点表示字符变量的值不能含有空格,长度一般不超过,67,第四章生成SAS数据集1使用数据步新建数据集,Imptdt1.dat分开、对齐p033_2Imptdt2.dat不分开、对齐p034Imptdt3.dat分开、不对齐Imptdt4.dat对齐、有空格p036Time.dat变量名逗号分开Imptdt5.dat有空格逗号分开,p33_1list(直接)p33_2文件(Imptdt1)p33_3部分观测p33_4list+informatp33_5format,informatlength次序(直接)Infile语句的选项delimiter=*dsdmissoverlrecl=,68,p034无空,INPUT语句Column格式,第四章生成SAS数据集1使用数据步新建数据集,INPUT变量名始列-终列变量名始列-终列.;,源文件中各变量所在位置必须是规则的每个变量按指定指定的始列终列读入字符变量的长度不受缺省值的限制(但cm,赋值语句的一般形式,第五章加工SAS数据集2用数据步加工-赋值语句,var=expression,var新建或修改的变量名expression由变量、SAS函数和四则运算(+,-,*,/,*)构成的表示式赋值语句将表示式的值赋给变量,100,fct132取整,fct134平均,求和,SAS函数共19类调用形式:,第

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论