SAS统计应用基础第三讲共4讲_第1页
SAS统计应用基础第三讲共4讲_第2页
SAS统计应用基础第三讲共4讲_第3页
SAS统计应用基础第三讲共4讲_第4页
SAS统计应用基础第三讲共4讲_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章数据管理入门,3.1SAS数据集的基本格式,3.1.1数据集的基本结构,一个SAS数据集就是一个数据文件,用来存放相应的变量设置和具体变量值,是一个标准的关系型数据库中的二维表格。表格中的每一行就是一条记录,也称为观测(observation)表格中每一列代表一个变量(variable)注意:在SAS中观测数和变量数没有限制。,描述部分(descriptorportion):存放变量的定义。包括数据集的名称、建立数据集的日期和时间、变量和观测的个数、各变量的具体属性及其他信息,如密码等,数据部分(dataportion):存放具体数值。按照描述部分对变量的定义,依次将数据排列为相应的格式。,数据集,3.1.2数据集的描述部分,1.数据集名称,在遵循相应操作系统的文件名规则的前提下,有如下规定:,必须由英文字母或下划线开始,名称中可包含数字、字母和下划线,长度可以是132个字符,对各类不同对象的命名均适用。如:逻辑库名、数据集名、数组名、宏名等,SAS7.0版以后,长度可以是18个字符,SAS6.12版以前,2.变量名与变量标签,变量名不能使用中文,如果需要使用中文对变量加以进一步说明,则可以使用变量标签(label)。每个变量可以有一个标签,用于对变量的具体含义作进一步的说明,长度限制在256个字符内。,3.变量的类型与长度,字符型:其值可取任意字符。,数值型:其值只能取数值。,时间型,日期型,实际上按照数值型变量的格式存储,变量,例如,日期型数值存储的都是从1960年1月1日到该日期的天数。,变量长度,数值型变量:SAS默认长度8位。8位的浮点存储方式对大多数应用已经足够。,字符型变量:SAS默认长度8位。不够用,可以对量的设定加以更改,最大长度可达32K。,3.1.3数据集的数据部分,没有太多特殊的地方。需要强调的是对缺失值的处理,对于数值型变量,缺失值用小数点表示。,对于字符型变量,缺失值用空字符表示。,分为直接输入方式和外部文件读入方式,3.2数据集的建立,3.2.1直接输入方式建立数据集,Datacase2_2;Inputxy;Cards;345678903567891023657745;,Datacase2_2;Inputxy;Cards;345678903567891023657745;,比较这两段程序,理解的含义,对于字符型变量,只需要在变量名后加上“$”表明其为字符型即可,如下面的数据步:,Datacase2_3;Inputxy$;Cards;123456789abc10“def”;,注意:对于字符型变量,在数据块中不需要加入单或双引号,否则会被当作字符串的一部分读入。,对于超过默认8位长度的字符,如果对相应变量不加长度定义,则系统会在读入时只读入前8位,而将后面的字符截掉。因此,可以用length语句定义变量的长度。Length语句一般应出现在变量定义之前,其格式为:,Length变量名$长度,Datacase2_3;Lengthy$20;Inputxy$;Cards;123456789abc10“def12334556678”;,注:去掉length语句后看运行结果。,3.2.2外部文件读入方式建立数据集,事先建立纯文本文件case2_2.txt,内容为:345678903567891023657745程序如下:Datacase2_2;Infilec:case2_2.txt;Inputxy;Run;,当数据量较大时,采用外部文件读入方式可以避免在程序中输入非常大的数据块,更有利于程序的阅读。,1、数据的格式化读入,3.2.3更灵活地建立数据集,FORMATvariables;Variables为希望指定输出格式的变量名称,随后的format用于指定具体的输出格式。最后面的default选项则用于指定为给定格式的变量的默认输出格式。,Datatemp;Formatx6.3y5.1;Inputxy;Cards;1122.22;Procprint;Run;,2、使用output语句,在默认情况下,数据步将所读入的数据存放在缓存中,在依次执行完全部语句后才将相应信息写成一条新的纪录,如果希望在一个执行周期中生成多条数据记录,则需要使用output语句强制输出一条新记录。,Datatemp;Inputxy;Z=x;output;Z=y;output;Cards;1122.22;Procprint;Run;,3.3数据的导入和导出,SAS为用户提供了完整的数据导入和导出功能,可以实现SAS数据集与Access、Excel、dbf等常见数据格式的无缝转换。,3.3.1使用向导实现数据的导入和导出,注意:数据导入和导出向导的界面几乎没有区别。,3.3.1使用向导实现数据的导入和导出,使用程序方式可以实现高效与自动化的需求。在程序方式中,数据的导入与导出分别用import与export过程来实现。,PROCEXPORTDATA=数据集名OUTFILE=“filename”TABLE=“tablename”;RUN;,1、“DATA”等号后为要导出的SAS数据集名称;2、“filename”为导出的数据集存为文件时的完整路径与文件名;3、“tablename”为导出的数据集存为表时的完整路径与表名;4、“identifier”为要导出的数据集存放的类型,当导入的是数据库中的一个表时,必须指定“DBMS=”这一选项,当导入的是单个文件时,可以指定也可以不指定“DBMS”这一选项,但必须指定“filename”中的文件扩展名;5、如果指定了REPLACE选项,PROCEXPORT过程就会替换原来已经存在的文件,否则不替换。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论