




免费预览已结束,剩余14页可下载查看
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1.SAS系统主要完成以数据为中心的四大功能,其中核心功能为:统计分析功能2.在SAS系统的组成模块中,能进行数据管理和数据加工、处理的模块BASE模块3.SAS显示管理系统窗口中能够提交当前运行的SAS程序执行过程的窗口为:PGM窗口4.如下一段SAS程序:DATA ;INPUT X ;CARDS:2 3 4 9 1 ;RUN;模块当运行程序以后SAS系统会产生SAS数据集( C )A. DATA B. NULL C. DATA1 D.程序错误5INPUT语句一般用来指定数据的读入方式,可以读取各种类型的数据包括字符型,现有如下的一段程序:DATA ONE;INPUT NAME $ SCORE;CARDS;Wanglin 85Zhang dong-feng 90;那么在第二个观测中读取到的NAME 为(B)A. Zhang dong-feng B. Zhang C. Zhang do D. Zhang dong6.假设变量X的值为5,有如下程序IF X5 THEN X=X+3;ELSE X=X-2;则执行程序以后变量X的值为( B)A. 5 B.3 C.8 D. 程序错误7DATA TEST;DO I=1 TO 3;PUT I= ;END;RUN;程序结果在LOG窗口输出形式为( A )A. I=1 I=2 I=3 B.I=2 I=3 I=4C. 不显示 D. I=3 I=2 I=18.假设变量X1=-10.253 X2=-5 则SIGN(X1)+ABS(X2)/INT(X1)的运算结果为( B)A.-4 B.-0.4 C. 4 D.0.5759.逻辑运算(51)|(42)&(72)的结果为:( 1 )10以下几个统计量在UNIVARIATE过程中能求得到得而在MEANS过程中无法求得的是( B ) A. mean B. var C. Q1 D.range11.SAS系统主要完成以数据为中心的四大功能,其中能够将Excel、Lotus、DBF、TXT等数据转化成SAS数据集属于 (数据管理功能 )12. SAS数据集是关系型结构,分成两部分:描述部分和 。 (数据部分)13.每一个SAS数据集都是采用两级命名法,第一级为库标记名,第二级为数据集名,两者用“.”隔开。在默认的情况下库标记为( Work)14.假设变量X的值为5,有如下程序IF X THEN Y=X;ELSE Y=X-2;则执行程序以后变量Y的值为( A )A. 5 B.3 C.8 D. 程序错误15.假设变量X1=9 X2=5.752 则MODX1,INT(X2)/SIGN(X2)的运算结果为( C )A.-4 B. 0.4 C. 4 D.-0.416.对于数值资料的描述性统计量,一般来说分成两种类型:一种是反映中心趋势;一种是反映离散和变异趋势,下列统计量中不是反映中心趋势的是( B )A. 分位数 B.全距(极差) C .众数 D. 中位数17. proc gplot data=tz;symbol i=none v=star;plot w * h;run;以上程序是用gplot过程绘制散点图的程序,结果显示在Graphic窗口中其中横轴和纵轴分别为 ( h,w) 18.建立新的数据库的命令各式为(LIBNAME 库名路径)19.根据下面这段程序DATA PARTS;INPUT NAME $ PARTA PARTB X1-X5;TEST=PARTA+PARTB;DROP PARTA PARTB;CARDS;Zhangsan 25 45 1 2 3 4 5 Lihua 27 53 5 4 3 2 1;Run;所建立的数据集PARTS包含几个变量( A )A. 7 B. 8 C .9 D. 620 INPUT语句一般用来指定数据的读入方式,可以读取各种类型的数据包括字符型,现有如下的一段程序:DATA ONE;INPUT NAME $ SCORE;CARDS;Wanglin 85 Zhandong 90;那么在所建立的数据集ONE的记录为( A )A. Wanglin 85 B. Zhandong 90 C. Zhandong 90 D.空表 Wanglin 8521. .对定量资料的常用统计指标主要有:一种是反应集中趋势的位置度量;一种是反映离散和变异趋势的编译度量,另一种是反应接近正态分布程度分布度量,下列统计量中不是位置度量的是( D )A. 中位数 B.均值 C .众数 D. 方差二、填空1SAS系统是由三十多个专用程序模块组成的大型集成应用软件系统,主要四大部分构成: SAS数据库部分、 SAS分析核心 、 SAS开发及呈现工具 和其他,其中能提供SAS数据库管理功能的模块是BASE模块。2.SAS系统中一般用于删除变量的语句是drop语句 它的语句格式是 drop 变量名列表 ;一般来说要保留的变量比较少时用 keep 语句,当要删除的变量比较少时用 keep语句。3.对于SAS数据集的排序一般是通过 sort 过程来实现的,当要对数据集进行降序排列时要在变量前加上 descending 。4SAS中线性回归分析是通过 reg 过程来实现的,当调用此过程时,语句的后面至少有一个 model 语句;在MODEL语句选项中进行残差分析的命令是 R 。5SAS(Statistical Analysis System)系统意为统计分析系统,该系统于1964年由北卡罗莱纳州立大学开始研制,现在已经形成了模块化、集成化的应用软件,具有完备的数据 数据访问 、 数据管理、 数据分析 和 数据呈现 功能。6.一般SAS程序分成两部分 数据步和 过程步,在 数据步中可以建立SAS数据集,并实现对SAS数据集的常规操作;在 过程步中可以实现对数据的统计描述和运算。7在SAS系统可以通过调用 corr过程来计算变量的相关系数。8.有一组名为YONGER.TXT的纯文本文件存放在c:sas目录中,内容如下:1 M 32 95.5 14.0 53.5 49.642 M 35 92.0 13.0 52.0 41.613 M 33 89.0 12.5 53.5 35.814 F 30 91.0 11.0 48.0 35.395 F 33 91.0 11.5 47.0 44.986 F 35 92.4 10.8 49.0 37.42以XL为名字建立路径为“d:test”的数据库,在此数据库建立名称为YOU的SAS数据集并且数据来源于yonger.txt中,最后在新建的数据集中将性别是M的记录另建为名为MALE的SAS数据集中。按照上述要求完成下列程序: Libname XL D:TEST;DATA XL.YOU; infile c:YONGER.TXT;INPUT ID X1 $ X2 X3 X4 X5 X6; DATA XL.MALE;SET xl.you ;IF X1=M THEN output ;RUN;9.下图是某班级计算机考试成绩的盒形图据此可知考试的平均成绩为 84.17 ,中位数为 89 ,上下四分位数分别为 94 ;和 76 。三、编程题1.有一大批糖果,现在从中随机的抽取16袋,称得重量如下:506 508 499 503 504 510 497 512514 505 493 496 506 502 509 496设每袋糖果都是近似得服从正态分布,求总体均值的置信水平为0.95的置信区间。data tg; input x ;cards;506 508 499 503 504 510 497 512 514 505 493 496 506 502 509 496;proc means data=tg clm (alpha=0.05可以不写,系统默认);var x; run;2. 假定初生婴儿的体重服从正态分布,随机的抽去12名新生婴儿,测其体重为;3100 2520 3000 3000 3600 31603560 3320 2880 2600 3400 2540试用SAS给出新生儿的体重方差的置信区间(置信度为95)。data weight;input tz ;cards;3100 2520 3000 3000 3600 31603560 3320 2880 2600 3400 2540; proc means data=weight;output out=ls css=ss n=n;data tci;set ls;df= n-1;xlchi=cinv(0.025,df);xuchi=cinv(0.975,df);lchi=ss/xlchi;uchi=ss/xuchi;proc print data=tci;var xlchi xuchi lchi uchi;run;3. 某车间用一台包装机包装葡萄糖,包的袋装糖中是一个随机变量,它服从正态分布,当机器正常运转时候,其均值是0.5公斤,标准差为0.015公斤。某日开工后为了检验包装机是否正常工作。随机的抽取它所包装的糖9袋,称得重量为(公斤):0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512问机器是否正常工作?()(即检验均值是否为0.5公斤)(用SAS编程运算)data bz;input x ;cards;0.497 0.506 0.518 0.524 0.498 0.511 0.520 0.515 0.512; proc means ;var x;output out=ls mean=xm n=n; data test;set ls;mu=0.5;sigma=0.015;u=sqrt(n)*abs(xm-mu)/sigma ;p=2*(1-probnorm(u);if p0.05 then index=0;else index=1;proc print data=test;var u p index;run;当程序运行结果INDEX=0时表示命题不成立,反之命题成立。4. 有6名儿童的健康资料已经WORD编写成名为CHILD.TXT的纯文本文件存放在c:sas目录中,内容如下:1 M 32 95.5 14.0 53.5 49.642 M 35 92.0 13.0 52.0 41.613 M 33 89.0 12.5 53.5 35.814 F 30 91.0 11.0 48.0 35.395 F 33 91.0 11.5 47.0 44.986 F 35 92.4 10.8 49.0 37.42这7列数据对应编号,性别,月龄,身高,体重,胸围和心象面积的观测值。以XL为名建立路径为“d:test”的数据库,在此数据库建立名称为CHILD的SAS数据集并且数据来源于CHILD.TXT中,最后在新建的数据集中将性别是M的记录另建为名为MALE的SAS数据集中。LIBNAME XL D:TEST;DATA XL.CHILD;INFILE c:CHILD.TXT;INPUT ID X1 $ X2 X3 X4 X5 X6;DATA XL.MALE;SET XL.CHILD;IF X1=M THEN OUTPUT;RUN;5.设某工厂一个车间生产的纽扣。其直径据经验服从N(,),其中5.2,为了判断其均值的置信区间,现在抽去容量为100的样本得到子样均值26.56,求均值的95,的置信区间。data ci;xbar=26.56;sigma=5.2;n=100;u=probit(0.975);delta=u*sigma/sqrt(n);lcl=xbar-delta;ucl=xbar+delta;proc print data=ci;var lcl xbar ucl;run;6. 对某一台包装机一段时间内生产的糖果抽取了10个样本进行观测,结果如下:20.53 20.69 19.45 19.36 19.0020.10 20.95 19.86 19.41 19.35已知这台机器生产的糖果的重量服从N(,),其中20求的水平为95的置信区间。用SAS编程将计算出的置信上限和下限分别赋值到名为CI的数据集中,并将结果打印到OUTPUT窗口中。data tg;input x ;y=(x-20)*2;cards;20.53 20.69 19.45 19.36 19.0020.10 20.95 19.86 19.41 19.35;proc means data=tg;var y;output out=temp mean=Ym n=n;data ci;set temp ;df=n;xlchi=cinv(0.025,df);xuchi=cinv(0.975,df);lchi=df*Ym/xuchi;uchi=df*Ym/xlchi;proc print data=ci;var lchi uchi;run;或:data tg;input x ;cards;20.53 20.69 19.45 19.36 19.0020.10 20.95 19.86 19.41 19.35;proc means data=tg;var x;output out=temp css=Ym n=n;data ci;set temp ;df=n;xlchi=cinv(0.025,df);xuchi=cinv(0.975,df);lchi=Ym/xuchi;uchi=Ym/xlchi;proc print data=ci;var lchi uchi;run;7.运用SAS编程完成以下问题:8名健康成年男子血液第一小时末红细胞沉降率(mm)分别为3,9,8,6,5,5,5,7和4,用SAS编程计算其均数和标准差。data a; input x ; cards; 3 9 8 6 5 5 5 7 4 ; run; proc means data=a; run; 8.下表为某邮购服务部的部分顾客记录姓名 性别 地区 日期 金额章文 男 华东 19960320 1099王国铭 男 华东 19960519 39童子敏 女 华北 19960105 986刘念新 男 东北 19971001 3581李思今 女 华北 19970404 659关昭 女 东北 19961105 358 赵霞 女 东北 19980906 2010用数据步把此数据输入到SAS 数据集;编程找出上题中男性顾客购买金额超过1000 的哪些人; 把上题数据拆分为包含姓名、性别、地区的一个数据集和包含姓名、日期、金额的一个数据集;用MERGE 和BY 合并上一步拆开的两个数据集。data record;input xm $ xb $ dq $ yyyymmdd8 cost;cards;章文 男 华东 19960320 1099王国铭 男 华东 19960519 39童子敏 女 华北 19960105 986刘念新 男 东北 19971001 3581;run;(2)data m;set record;if xb=男 and cost 1000 then output;run; (3)data x;set record ;keep xm $ xb $ dq $ ;run; data y;set record;keep xm $ yyyymmdd8 cost;run; (4) proc sort data=x;by xm;run; proc sort data=y;by xm; run; data xy;merge x y;by xm ;run;9对120个炉钢中的Si的含量进行检验,得到数据如下:0.86 0.78 0.83 0.84 0.77 0.84 0.81 0.84 0.81 0.81 0.80 0.810.79 0.74 0.82 0.78 0.82 0.78 0.81 0.80 0.81 0.74 0.87 0.780.82 0.75 0.78 0.79 0.80 0.85 0.81 0.78 0.87 0.74 0.81 0.710.77 0.88 0.78 0.82 0.77 0.76 0.78 0.85 0.77 0.73 0.77 0.780.77 0.81 0.71 0.79 0.95 0.77 0.78 0.78 0.81 0.81 0.79 0.870.80 0.83 0.77 0.65 0.76 0.64 0.82 0.78 0.80 0.75 0.82 0.820.84 0.80 0.79 0.80 0.90 0.77 0.82 0.81 0.79 0.75 0.82 0.830.79 0.90 0.86 0.80 0.76 0.85 0.78 0.81 0.83 0.77 0.75 0.780.82 0.82 0.78 0.84 0.73 0.85 0.83 0.84 0.81 0.82 0.81 0.850.83 0.84 0.89 0.82 0.81 0.85 0.86 0.84 0.82 0.78 0.82 0.78应用MEANS过程运算给出这组数据的描述统计量,样本均值,样本方差,标准差,标准误差;极差,变异系数,偏度系数,峰度系数等。将所得结果赋值给名为M的数据集。proc means data=si;var x;output out=result mean=x1 var=x2 std=x3 stderr=x4 range=x5 cv=x6 skewness=x7 kurtosis=x8;run;10用UNIVARIATE过程计算上题的63.1和35.2分位点.,并将所得值赋值给P数据集。proc univariate data=gang;var x;output out=p pctlpts=65.4 32.1pctlpre=P65_4 P32_1;run;11利用画图程序画出上题的频数直方图和累计频数直方图,以及它们的对应的百分比图。proc gchart data=gang;vbar x/type=percent;vbar x/type=cpercent;run;12某种元件的寿命X(以小时计)服从正态分布N(,),,未知。现在测得16只元件的寿命如下:159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命大于225(小时)。(置信水平为0.05)data yj;input x ;cards;159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170;proc means ;var x;output out=ls mean=xm css=ss n=n;data test;set ls;mu=225;s=sqrt(ss);tt=sqrt(n)*(xm-mu)/s;ta=tinv(0.05,n-1);if tt=ta then index=0;else index=1;proc print data=test;var index;run;13为了研究某种食品的营养价值,用大白鼠做实验,得到大白鼠的进食量X(克)和增加体重Y(克)之间的数据入下表:动物编号12345678910进食量X(克)820780720867690787934679639820增加体重量Y(克)165158130180134167186145120158运用REG过程作直线回归分析。data mouse; input x y; cards; 820 165 780 158 720 130 867 180 690 134 787 167 934 186 679 145 639 120 820 158 ; run; Proc reg data=mouse;Var x y;Model y=x;Run;14用SAS 数据步列出10000 以下的素数,写出程序。见作业15某克山病区测得11例克山病患者和13名健康人的血磷值(mmol/L)如下表所示,试求两组的平均血磷值和标准差。患者组0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11健康组0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.58 1.87title 克山病案例;data p9;do g= 1 to 2; input n ; do i= 1 to n; input x ; output ; end;end;cards;110.84 1.05 1.20 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11130.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.58 1.87;proc means;var x;by g;output out=M mean=junzhi std=bicha; run;1640名麻疹易感儿接种麻疹疫苗后一个月,血凝抑制抗体滴度见下表,计算平均滴度。抗体滴度 频数抗体滴度 频数抗体滴度 频数1:4 11:32 21:256 41:8 51:64 71:512 51:16 61:128 10data ex2;input x f;y=log(x);cards;4 1 32 2 256 4 8 5 64 7 512 5 16 6 128 10;proc means;var y;freq f;output out=ex2_1 mean=junzhi;data ex2_2;set ex2_1;g=exp(junzhi);proc print label;var g;label g=geometric mean value(g);run;17简述如何将一个文件名为fox.xls文件导入成相同名字SAS数据集。答:在程序窗口中启动File菜单,选“Import”,这时出现一个选择文件类型的画面,选中标准文件格式(Standard file format),并单击向下箭头打开一个下拉列表,从中选文件格式(例如:“Excel 5 or 7 Spreadsheets(*.xls)”),按Next 钮继续,出现一个选择文件名的画面,可以在文本框中直接输入Excel 文件的全路径名,或按Browse 钮从目录中选取文件。继续后出现选择目标位置的画面,这是要求输入一个结果数据集的名字和数据库位置,数据库已选WORK 我们可以不变,在数据集名处输入fox,按Finish 钮可以生成数据集WORK.fox。一、SAS系统组成SAS系统是由三十多个专用程序模块组成的大型集成应用软件系统,有四大部分构成: 1.SAS数据库部分 主要由BASE模块提供常见的数据库管理功能,所有其他模块必须与之结合起来使用。 2.SAS分析核心是SAS系统的灵魂,具有对数据进行分析与决策的功能,这部分主要有STAT、QC、ETS、IML、INSIGHT等模块。 3.SAS开发及呈现工具 主要有AF、EIS、GRAPH模块提供便捷的面向对象的开发工具。 4.SAS分布处理模式及数据仓库设计 主要有ACCESS、CONNECT、SHAPE、WA模块。 二、SAS系统的基本功能SAS系统主要完成以数据为中心的四大功能。1.数据管理功能 SAS系统可手工输入数据值,然后把数据组成SAS数据集;它能够方便地将流行的数据格式,如excel、lotus、dbf、txt等转换为SAS数据集。SAS系统提供完备的SAS语句和函数用于数据加工处理,并具有对数据进行编辑、整理、连接和更新等功能。2.基础统计计算功能 计算简单的描述统计量;对数据进行标准化处理、编程、计算有关统计量;生成并分析列联表;计算概率分布函数、分位数及产生随机数。3.报表生成和图形显示功能 绘制二维、三维的基本的统计量,如直方图、散点图、曲线图等。4.统计分析功能 SAS的核心功能。提供包括方差分析、相关与回归分析、属性数据分析、判别与聚类分析等统计分析过程。 三、SAS系统的模块组成 与统计分析和数据管理有关的SAS主要常用模块及功能为:1.BASE模块 进行数据管理和数据加工、处理。2.Stat模块 完整的统计分析模块,可对数据 进行单因素、多因素分析。3.Graph模块 可完成多种绘图功能4.Insight模块 进行数据探索性分析5.Iml模块 提供功能强大的矩阵运算,用户 可根据需要编写程序,完成特定的矩阵运算。用“分析家”计算统计量 1)启动“分析家” 选择主菜单“Solutions(解决方案)”“Analysis(分析)”“Analyst(分析家)”,打开“分析家”窗口。 选择主菜单“File(文件)”“按SAS名称打开”,打开“选择成员”对话框,选择数据集。 2)通过Summary Statistics菜单计算描述性统计量 选择主菜单“Statistics(统计)”“Descriptive(描述性统计)”“Summary Statistics(汇总统计量)”,打开“Summary Statistics”对话框,选择变量列表中分析变量,单击“Analysis”按钮,选定分析变量 单击“Statistics”按钮,打开“Summary Statistics:Statistics”对话框。对话框中列出可以计算的所有统计量。 3) 通过Distributions菜单计算描述性统计量 选择主菜单“Statistics(统计)”“Descriptive(描述性统计)”“Distributions(分布)”,打开“Distributions”对话框,选择变量列表中的分析变量,单击“Analysis”按钮。单击“OK”按钮,即可得到关于分析变量的矩统计量和基本统计测度。 用INSIGHT计算统计量 1)在INSIGHT中打开数据集 在菜单中选择“Solution(解决方案)”“Analysis(分析)”“Interactive Data Analysis(交互式数据分析)”,打开“SAS/INSIGHT Open”对话框,在对话框中选择数据集,单击“Open(打开)”按钮,即可在INSIGHT中打开数据窗口 2)选择菜单“Analyze(分析)”“Distribution (Y)(分布)”,打开“Distribution (Y)”对话框。在数据集的变量列表中,选择分析变量X、分组变量Y。(注意:分组变量就是那种可以区别不同种类的变量,例如地区编号、科目、组号等等,而分析变量一般是需要分析的数据,例如成绩,身高书目) 3)单击“Output(输出)”按钮,在打开的对话框中包含描述性统计量选项。 4) 选择选项矩统计量和分位数,取消默认的选项:“Box Plot/Mosaic Plot”和“Histogram/Bar Chart”,单击“OK”按钮,即可得到变量按分组的各种矩统计量(Moments)和分位数(Quantiles) *描述性统计选项:Moments 矩统计量 Quantiles分位数 Basic Confidence Intervals 基本置信区间 Tests for Location 位置检验 Frequency Counts 频数统计 Robust Measures of Scale 尺度的稳健估计 Tests for Normality 正态性检验 第117第1题(1)proc print data=sasuser.business noobs label; var company nation industry employs sales profits; label company=公司 nation=国家 industry=部门 employs=雇员数 sales=销售额 profits=利润;run;(2)proc sort data=sasuser.business; by nation indus
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年新能源分布式能源系统在城市综合体中的应用报告
- 企业合理化建议采纳实施与效果评估合同
- 2025电梯维修保养合作协议
- 2025年研究:新能源汽车电池回收产业人力资源配置与人才培养策略报告
- 2025年中国高级按摩椅行业市场全景分析及前景机遇研判报告
- 针对2025年教育平台互动教学工具优化与用户满意度分析报告
- 2025年面部美学考试试题及答案
- 2025网签版担保借款合同书
- 2025无线网络覆盖及设备供应合同模板
- 2025年智能医疗AI语音交互健康咨询系统开发可行性研究报告
- 4.2《遵守规则》教学设计 -2025-2026学年八年级道德与法治上册
- 人工智能+高质量发展文化旅游产业智能化升级研究报告
- 2025年自考专业(计算机网络)考试综合练习附参考答案详解(A卷)
- 集输工应急处置考核试卷及答案
- 2025年全国保密教育线上培训考试试题库附完整答案(必刷)
- 珠江医院护理面试题库及答案
- 流程管理某省市场营销MPR+LTC流程规划方案
- 2025年江苏省农垦集团有限公司招聘笔试备考及答案详解(新)
- 2025年济南市中考英语试题卷(含答案及解析)
- 2025年人教版一年级下册数学口算题卡(1000题)
- 化工厂实习安全培训课件
评论
0/150
提交评论