sas实例分析.doc_第1页
sas实例分析.doc_第2页
sas实例分析.doc_第3页
sas实例分析.doc_第4页
sas实例分析.doc_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国统计网 为中国统计加油!因为专注 所以专业 课件 统计分析方法SAS实例精选程序及数据45例/*一、以下是象征性的一个数据实例。若能改用自己的数据来运行程序,则能举一反三地用活SAS*/TITLE xsq.dat;/*二、本书后面许多章节的程序例子虽然未能逐一列出,但大同小异,即只要按下列象征性的程序数十例进行稍加修改,则可派生出全书的程序例子。读者也可改用自己的程序和数据,然后模仿书中的统计分析方法,准能真正学活SAS。*/*程序2.1*/;DATA child;INPUT age n ;DATALINES;45 250 328 130 146 360 424 0PROC PRINT;PROC MEANS;VAR age ;PROC PLOT; PLOT n*age; RUN;/*程序2.2*/;DATA OLDER; /*注:读取的数据存入OLDER文件中,文件名长度为18个字符。若文件名缺省,则SAS自动提供一个文件名,但不显示*/ INPUT ID1 1-2 CASEID 3-5 NAME 6 SEX AGE 8-9 EDC 10 OCU1 11 OCU2 12 SAL1 13-15 SAL2 16-18 V1 19 V2 20 V3 21 V4 22 V5 23;LIST; /*显示每行的数据,以便核对。可省之*/CARD; /*告诉SAS,数据行从下一行开始读之*/110011160310150120212141100211654221801801121011030227023013012021310 ;PROC PRINT; /*若写,则显示观察值。可省。*/TITLE 老龄人社会保障抽样调查; /*TITLE 中的内容是标题名称*/PROC PLOT; /*绘制散点图*/PLOT EDC*OCU1=SEX;/*以性别1或性别2为图点的记号,画出教育水平与职业两变量值的 纵横交点,组成一幅散点图*/;PROC CHART; /*调用直方图、条形图程序*/VBAR OCU1; /*画出退休前职业的垂直条形图*/HBAR SEX; /*画出性别的水平条形图*/PROC FREQ; /*调用频次统计过程*/TABLES EDC; /*计算EDC的频次*/TABLES EDC*SAL1;/* 制作交互分类表*/PROC MEANS; /*调用MEANS过程,计算上述EDC、OCU1和SAL1各个变量的均值、观察值、和方差等9种参数*/ PROC SORT; /*调用SORT过程*/BY SEX EDC; /*按性别、教育年限排序*/PROC PRINT; /*有了此条语句方能显示排序结果*/PROC MEANS; /*再次调用MEANS过程,以便计算8种描述性统计量*/BY SEX EDC; /*按SEX、EDC变量值分组,计算描述性统计量*/RUN; /*微机SAS须有RUN命令。大、中、小型机中的SAS则不需RUN命令*/*程序3.1*/;DATA XSQ;INFILE XSQ.DAT;INPUT ID1 1-2 CASEID 3-5 N 6 SEX 7 AGE 8-9;IF SEX EQ 1 THEN DELETE;/*注:删去男性的数据*/LIST;DATA XSQ2; /*新的数据集名称为XSQ2*/SET XSQ; /*新的XSQ2数据集是从第一个数据集“XSQ”中复制的*/IF AGE50 & SEX=0 THEN DELETE;/*注:如果年龄小于50岁,而且,性别=0(误码)时则删去*/LIST;RUN;/*程序3.2*/;DATA OLDER;LABEL ID1=地区名称 EDC=老年人的教育水平 OCU1=退休前的职业OCU2=退休后的职业;INFILE OLDER.DAT;INPUT ID1 1-2 CASEID 3-5 NAME 6 SEX 7 AGE 8-9 EDC 10OCU1 11 OCU2 12;CARDS;PROC FORMAT;/* (执行FORMAT过程) */;VALUE SEXFMT 1=男 2=女;/*注:SEXFMT 是SEX的新名称。注意:VALUE是关键词,不能变*/;VALUE OCUFMT 1=工人 2=干部 3=商业服务人员 4=教师 5=科技人员; /*注:OCUFMT是OCU1的新名称)*/;PROC FREQ;FORMAT SEX SEXFMT.;/* 注:用SEXFMT的数值取代了原SEX的数值) */;TABLE SEX;/* 画出SEX=1或SEX=2的频次分布图) */;PROC MEANS;/* (调用MEANS统计过程) */;VAR SEX EDC OCU1;/*计算变量的描述性统计量。注意:VAR也是关键词 */;RUN; /*注:运行程序*/;/*程序3.3*/;DATA score;RETAIN count schi smath seng 0; /*将计数器COUNT 及schi等新变量预置为0*/;INFILE score.dat;INPUT chi math eng;LABLE chi=语文成绩 math=数学成绩 eng=英语成绩 schi=全班语文总分; COUNT=count+1;/*计算次数的 计数器先预置为o,然后逐次加1*/; SCHI=SUM(Schi,chi);/*语文成绩的累加*/; SMATH=SUM(Smath,math); /*数学成绩的累加*/; SENG=SUM(Seng ,eng); /*英语成绩的累加*/;list; /*列出数据*/PROC PRINT;/*显示统计结果*/;RUN;/*注: 倒数4,5,6三个语句,是对例15程序相应行的改写*/;/*例3.18*/;DATA EXAM;INPUT V1 V2 V3;IF 70=V1=80 THEN GO TO OK;V2=1;COUNT+1;RETURN;OK:SUMX+V1;SUMY+V2; /*SAS允许一行书写多个语句*/LIST;CARDS;75 83 9068 75 8090 100 75RPOC PRINT;RUN;/*例3.19:*/DATA OLDER;LABEL ID1=地区名称 CASEID=观察值编号 EDC=老年人的教育水平 OCU1=退休前的职业; /*注:在微机SAS中,标签用一对 (左撇号)括之*/INFILE OLDER.DAT;INPUT ID1 1-2 CASEID 3-5 SEX 7 AGE 8-9EDC 10 OCU1 11 OCU2 12;/*程序3.4,原程序3-14。本程序产生下述图3.3,原图3-14。*/; TITLE 北京市四区13个街道(居委会)数据分析;DATA SQ;INFILE S.dat;INPUT Id 1-2 CASEID 3-5 AGE 6-7 SEX 8 edc 9 wk 10 fm 11 V6f 12 V7f 13-14 v8f 15-16 V9f 17 V10A 18 V10B 19 V10C 20 V10D 21 vi 22-24 vo 25-27;IF AGE=0|SEX=0|FM=0|EDC=0|WK=0|V6F=0|V7F=0|V8F=0|V9F=0 THEN DELETE;IF vi=0|vo=0|v7f=0|v8f=0 then delete; AV=vi/v7f; VIO=VI-VO; AV8F=V8F/V7F;PROC FORMAT;VALUE vioF LOW-200=0 -200-100=1 -100-0=2 0-100=3 100-200=4 200-HIGH=5;VALUE avF LOW-60=0 60-70=1 70-80=2 80-90=3 90-100=4 100- HIGH=5;PROC FREQ;FORMAT AV AVF.;FORMAT VIO VIOF.; TABLE av vio;RUN; /*程序4.1*/;DATA L1; INPUT id 1-2 se $ 4 age 5-6 height 8-10 weight 12-14 .1; CARDS; 01 m19 173 672 02 m20 175 575 03 f19 160 540 04 m21 176 700 05 f20 158 585 ; c河北 5=福建 6=辽宁 7=四川 8=西藏;TITLE 1973年1975年我国部分省市男性死因分析;PROC UNIVARIATE DATA=VARC NORMAL; VAR v1;RUN;/*程序5.2,用PROC UNIVARIATE过程中的PLOT命令绘制正态概率图等。*/;DATA VARC;INPUT v1 1-6 v2 7-12 v3 13-18 v4 19-24 v5 25-29 v6 30-35 v7 38-42 v 43;LABEL v1=脑血管病 v2=心血管病 v3=癌症 v4 =呼吸系病 v5=动脉硬化性心脏病 v6=伤亡事故 v7 =传染病 v=省份名称 ;CARDS;136.97109.48 76.32 74.5255.23 46.47 24.651128.80 95.29 79.42 69.2052.18 28.31 26.912104.03 74.30140.66 71.7622.50 48.16 11.903101.41126.62 98.13 89.5155.48 40.38 50.514 58.76 61.74 91.09 81.5821.08 61.92 38.045 70.49109.64 72.47 81.0920.90 40.11 26.976 55.93148.51 56.25153.94 . 101.24 81.657 73.86 99.84 63.09153.38 . 54.23 93.068PROC FORMAT;VALUE vf 1=北京 2=天津 3=上海 4=河北 5=福建 6=辽宁 7=四川 8=西藏;FORMAT v vf.;TITLE 1973年1975年我国部分省市男性死因分析;PROC UNIVARIATE DATA=VARC PLOT; VAR v1;RUN;/*程序5.3,用PROC UNIVARIATE过程中的PLOT命令绘制正态概率图等。*/;/*程序6.1*/ DATA L1; INPUT id 1-2 se $ 4 age 5-6 height 8-10 weight 12-14 .1; put id sex age; /*显示 3个变量之值. */ put id= weight=; /*在等号后面显示变量值. */ put 学生代号是: id 身高= height 体重= weight; list; /*为显示观测值(OBS)之用.*/ list; CARDS; 01 m19 173 672 02 m20 175 575 03 f19 160 540 04 m21 176 700 05 f20 158 585 ; PROC print; RUN; /*程序6.2*/; DATA L2; INPUT id 1-2 sex $ 4 age 5-6 height 8-10 weight 12-14 .1; put 5 id= 9 id 14 时, 18 age= 23 age; /* 5表示在第5列显示.*/ put ; /*表示空出一行空白行.*/ put 1 sex/height 15-17; /*注:第01列显示sex值后跳到下行第 15-17显示height. */ list; CARDS; 01 m19 173 672 02 m20 175 575 03 f19 160 540 04 m21 176 700 05 f20 158 585 RUN; /* 程序6.3*/;DATA one;INPUT a b c;CARDS;12 23 3423 45 5634 45 5645 56 67TITLE one数据集; /*显示第一个数据集的标题。*/DATA two; /*预先为one的复制品起名为two*/SET one; /*数据集two是从数据集one中复制的。*/PROC PRINT DATA=two; /*显示数据集two的内容*/TITLE 第二个数据集;/*程序6.4*/; DATA one;INPUT a b c sex $; CARDS; 12 23 34 m 23 45 56 f 34 45 56 f 45 56 67 m PROC print; TITLE 数据集 one ; PROC sort; by sex; DATA two; set one; by sex; put a 4 first.sex= 18 last.sex=; PROC print DATA= two; TITLE 第二个数据集 ; /*程序6.5*/; DATA one;INPUT a b c sex $; CARDS; 12 23 34 m 23 45 56 f 34 45 56 f 45 56 67 m PROC print; TITLE 数据集TWO ; PROC sort; by sex; DATA _NULL_; set one; by sex; put A 4 first.sex= 18 last.sex=; PROC sort; by sex; /*先按sex排序. */; PROC print; by sex;/*再按sex分组显示. */ /* 例5程序产生图6-5. 注:图6-5比图6-4简练. */* 程序6.6. */; TITLE 大中城市社区服务调查分析;DATA xsq;INPUT id1 1-2 caseid 3-5 n 6 sex 7 age 8-9 edc 10 ocu1 11 ocu2 12 sal1 13-15 sal2 16-18 (v1 v5) (5*1.);DATALINES;110017179420991722222151100252695200780991132111002617052015017011321110035174520110180222221100362675201151681222311004226121009007031311110055257326200100113241100622752100461032131011007228910000000031120.11008526921112515011210;PROC SORT DATA=xsq OUT=new2 ; BY DESCending sal1 DESCending age;PROC PRINT DATA=new2;RUN;/* 程序6.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论