版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二讲 编程创建SAS数据集vData步的一般形式vData步的编译与执行v变量输入设定SAS程序的基本内容和结构l基本内容:指明供操作的数据、对数据进行何种加工、期望的输出结果l基本结构:数据步(Data step)语句、过程步(Proc step)语句vData步的一般形式SAS程序的书写规则l每个语句以关键词开始,分号结束(不能是中文状态分号)l语句可以在任意列开始和结束,一个语句可以写成多行,多个语句也可以写成一行l语句的词与词之间可以用一个或多个空格符或其他特殊字符隔开程序行数的添加: ToolsOptionsEnhanced Editor数据步的一般形式Data 数据集名; Inf
2、ile 文件名 ; Input ; Run; 编写程序读入数据“例1.txt”。vData步的一般形式数据步的一般形式Data 数据集名; Infile datalines(或cards) ; input ; datalines(或cards); 数据列 ;Run;无其他选项时Infile语句可以省略 编写程序读入数据“例2.txt”。vData步的一般形式v变量输入设定格式化输入模式l适用于字段固定格式源文件,以指针指定起始列,以输入格式决定结束列l一般形式:Input 指针控制 变量名 输入格式;n:绝对位置+n:相对位置指针默认起始位置为第一列,读入一个字段后指向下一列,依次读入各个字段
3、可缺省 编写程序读入数据“例3.txt”。 编写程序读入数据“例4.txt”。按列输入模式l适用于字段固定格式源文件l一般形式:Input 变量名 n1-n2;读入字段灵活,允许字符型变量中存在空格符与其他特殊符号,缺失数据无特殊占位要求没有设定输入格式,某些类型数据不能正确读入v变量输入设定 使用按列输入模式读入数据“例4.txt”。列举输入模式l适用于分隔符固定格式源文件,依次读入由分隔符隔开的各个字段l一般形式:Infile 文件名|Cards ;Length 变量名 长度;Input 变量名 ;Input 变量名:输入格式;默认长度为8,超过会截断可于input语句前解决变量长度超过8
4、的问题解决特殊格式的输入及变量长度超过8的问题 编写程序读入数据“例6.txt”。v变量输入设定分隔符为空格时可缺省 编写程序读入数据“例7.txt”。读入模式的混合使用l可针对数据特点对不同字段使用不同读入方式v变量输入设定l控制变量输入的关键词:l读入变量的原理:从指针位置(缺省为第1列)读入第一个字段直至 (1)达到规定列;(2)遇到分隔符;(3)达到规定长度(默认长度8、格式规定或Length语句规定) 读入格式由两种情况决定:(1)字符型默认()和数值型默认;(2)指定格式; 与变量无冒号分隔:指针达到格式指定长度与变量有冒号分隔:指针达到分隔符前一列 数据“例4.txt”的第一个变
5、量为身份证号,从中读取出生年月日产生一个新的变量。vData步的编译与执行创建数据集的描述部分扫描每个语句检查语法错误创建数据集的数据部分对源数据文件每条记录执行数据步数据步的编译阶段(Compilation phase)l检查程序的语法错误(词语、语法)l转换程序为机器码,供执行阶段使用l建立工作部件:输入缓冲器(Input Buffer)l建立工作部件:PDV(Program Data Vector)l确定数据集中变量的三个必须属性(Name,Type,Length)l建立数据集描述部分vData步的编译与执行SAS系统处理DATA步的粗流程_N_Error_vData步的编译与执行数据步
6、的执行阶段(Execution phase)PDV中外部变量初始为缺失值(数值:句号,字符:空格)输入原文件中每条记录至输入缓冲器,按Input语句读入PDV在数据步结束时缺省地将PDV内容作为一条记录写入新的数据集回到数据步开始,重复直至源文件最后一条记录读入外部文件时,数据步每次迭代开始系统会为每个变量置缺失值(除几种特殊情况);读入SAS数据集时,只在第一次执行时置缺失值,以后会保留其值直至新值写入vData步的编译与执行vData步的编译与执行常见错误的排除l拼写错误l遗漏分号l遗漏run语句l引号或括号不配对l选项无效有些能够被系统自动矫正 尝试排除下列程序中的错误例9_1,例9_2,例9_3由于引号不配对引起程序无法终止时,可通过提交:终止程序进程vData步的编译与执行Input语句的跟踪符号 已读过的数据行会在下一个Input语句或数据步下一个循环中被弃用 Input语句后加入一个:保留数据行供下一个Input语句使用;加入:保留数据行供下一个Input语句及下一个循环使用考虑程序“例10”的执行结果v实验任务l掌握数据步的一般形式与各种变量设定形式l了解数据步的编译与执行过程实验题 编写程序将数据“实验题1”、“实验题2”、“实验题3”、“实验题4”创建为SAS数据集,要求数据打印结果分别如下图1-4l掌握常见程序错误的排除方法 实验报告完成要求:(1)Wor
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2026学年毽子里的铜钱的教学设计
- 2026年博尔塔拉职业技术学院单招综合素质考试题库有完整答案详解
- 2026年南昌交通学院单招职业倾向性考试题库及答案详解(全优)
- 2026年南昌理工学院单招职业适应性考试题库含答案详解(研优卷)
- 2025-2026学年黄河颂教学设计教资
- 2025-2026学年自我保护教案中班
- 2026年内江卫生与健康职业学院单招职业适应性测试题库附答案详解(基础题)
- 2026年单招适应性考试题库(含答案详解)
- 2026年南京机电职业技术学院单招职业适应性测试题库附参考答案详解(突破训练)
- 2026年内蒙古机电职业技术学院单招职业适应性测试题库含答案详解(培优b卷)
- 儿科医生进修汇报
- 餐饮楼面管理制度细则
- 外研版五年级英语下册单词表
- 《木兰诗》历年中考古诗欣赏试题汇编(截至2024年)
- 第一单元第1课《辉煌成就》课件-七年级美术下册(人教版)
- 2025年春季学期三年级语文下册教学计划及教学进度表
- 板材加工项目可行性研究报告
- 2025年派出所教导员履职述职报告范文
- 《创新方法及技巧》课件
- 基本医疗保险异地就医备案个人承诺书【模板】
- 《固体废物处理与处置》大学笔记
评论
0/150
提交评论