




已阅读5页,还剩55页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
.,数据采集与统计分析,主讲高洁,.,联系电话-mail:ezhun6669办公室地址:钱伟长楼203室,课程目的与主要内容,1.数据采集部分-介绍主要的试验设计方法,用尽可能少的试验点采集尽可能多的信息.2.统计分析部分-介绍常用的统计分析方法,从数据中根据需要有效地提取信息.3.SAS软件部分-学习操作SAS,应用SAS进行数据的实际分析.,统计数据处理分析方法的应用软件,预备篇:SAS统计分析软件入门,内容安排概述SAS操作方法SAS/INSIGHTSAS/分析员应用SAS编程,.,SAS(StatisticalAnalysisSystem),中文名“赛仕”,译为“统计分析系统”,概述,.,国际上公认的标准统计软件之一。公司卓著的业绩使之被评为“全美国人最乐意为之工作的100家公司”之一及最佳决策支持工具的供应商。发展1966年美国北卡罗莱纳州州立大学A.J.Barr1972年推出SAS72供大学使用版1976年成立SAS研究所(SASInstituteInc.),总部在美国北卡州凯瑞市现已是全球最大的私人软件公司和全球排名第九位的独立软件商。目前达到SAS9.2版本。,.,系统组成:三十几个模块,如BASE,GRAPH,ETS,FSP,AF,OR,IML,SHARE,QC,STAT,INSIGHT,ANALYST,ASSIST,CONNECT,CPE,LAB,EIS,WAREHOUSE,PCFileFormats,GIS,SPECTRAVIEW,SHARE*NET,R/3,OnlineTutor:SASProgramming,MDDBServer,ITServiceVisionClient,IntrNetComputeServices,EnterpriseReporter,MDDBServercommonproducts,EnterpriseMiner,AppDevStudio,IntegrationTechnologies等,.,功能包括:客户机/服务器计算、数据访问、数据存储及管理、应用开发、图形处理、数据分析、报告编制、质量控制、项目管理、计算机性能评估、运筹学方法、计量经济学与预测等,.,界面:三个基本窗口Editor编辑窗:在此编写SAS程序Log记录窗:记录程序运行过程中所做的内容,如所运行的数据情况、所调用的过程步、程序运行时间等(红色-错误绿色-警告兰色-正常)Output结果输出窗:统计分析的结果。Result窗口,Explorer窗口其他:keys窗、libname窗、options窗、var窗、dir窗(在command命令窗或命令行command=输入相应的命令可激活这些窗口),SAS会话窗口,.,程序编辑窗口,运行记录窗口,结果输出窗口,命令窗口,Results窗口,.,在命令窗口输入“keys”后情况,命令行,命令窗(条),.,常用的快捷键F4recall命令,用于editor窗,将前面提交的程序调回,可多次使用F5切换到editor窗;F6切换到log窗;F7切换到output窗F8submit命令Ctrl-E清除当前窗口的内容。editor窗被清除的内容不能用F4调回,.,SAS9.01中文界面的几个窗口,.,使用ToolsOptionsPreferences可修改界面显示,或输出文件的格式等。在命令窗输入num并回车,可在编辑窗口中加入行号。SAS文件的扩展名*.sd2SAS数据集(6.12版)(必须以字母开头,长度不超过8位);8.0以上版为*.sas7bdat;*.sasSAS程序文件*.loglog窗口输出*.lstSAS结果文件,.,SAS软件操作方法,三种操作方法:SAS/INSIGHT最为直观,便于步步深入。SAS/Analystapplication提供自动形成程序代码功能且在属性数据分析和功效函数计算方面比INSIGHT强。SAS编程功能最强,尤其是一些特殊或深入的统计分析功能只能通过编写程序来实现。,.,一、SAS/INSIGHT,调用SAS/INSIGHT有三种方法:1、可用菜单栏中的下拉菜单:SolutionsAnalysisInteractivedataanalysis;2、在命令行中键入INSIGHT命令;3、提交PROCINSIGHT语句或通过SAS/ASSIST.,.,SAS/INSIGHT的功能:,File:提供处理读入数据集、存储数据集、分析结果的表格和图形管理;Edit:提供对打开的数据集的变量、观测值进行增删、设定数据的显示格式和窗口管理等;Analyze:提供作图和分析功能,分析功能包括:分布拟合、线性模型(包括回归分析、方差分析等)、多变量分析;Table:提供显示分析结果的各种表的功能;Graphs:提供生成与分析有关的各种图形的功能;Curves:提供与分析有关的各种曲线的功能;Vars:提供由分析结果形成的新的变量的功能。,.,二、SAS/Analystapplication,调用SAS/分析员应用有两种方法:1、可用菜单栏中的下拉菜单:SolutionsAnalysisAnalyst;2、在命令行中键入Analyst命令.,.,SAS/分析员应用的功能:,File:有关数据文件的新建、读、写、转换、打印和传输等;Edit:关于修改选项的一些功能;View、Data:对已打开的数据集进行编辑和加工,如对数据集行列的增、删、改、排序、转置和对数据集的随机抽样等;Graphs:图形功能,主要包括直方图、盒形图、等高线图、三维散点图和曲面图等;Statistics:主要的统计分析功能,包括描述统计量的计算、列联表分析、假设检验、方差分析、回归分析、多变量分析和样本容量计算等。,.,三、SAS编程,SAS程序:由数据步(DATA)和一个或多个过程步(PROC)组成。数据步:组织数据;过程步:对已组织好的数据进行处理并输出处理结果。,.,SAS语句以一个关键词开始,以分号(;)结束;dataa;inputx;cards;323544565;procprint;run;,SAS程序的基本结构,数据步:创建数据,过程步:调用数据分析过程,或Lines或Datalines,.,运行编辑窗内程序点击图标按功能键“F8”在命令行(窗)键入“submit”在Run下拉菜单中选“submit”所激活窗口(Editor、Log、Output)内容的保存在命令行(窗)键入file“路径文件名”点击图标在file下拉菜单中选“save”或“saveas”只有编辑窗口(editor窗)才能打开文件,.,(一)SAS语言基础,dataa;inputx;cards;435465;procprint;run;,以关键词开始SAS语句;对于8.0以上SAS软件,这些关键词显示为蓝色;如果显示为红色,则可能的关键词无效或拼写错误,data;inputx;cards;435465;procprint;run;,.,1.所有SAS语句必须以“;”结束,dataa;inputx;cards;435465;procprint;run;,初学者最容易犯的错误就是不写分号。此时SAS将两个语句误认成一个语句(statement)。注意:(1)一个SAS语句可以写成两行或多行,如“dataa;”可写成dataa;(2)多个SAS语句可以写成简单的一行。如:“procprint;run;”,.,2.程序的结束,dataa;inputx;cards;435465;procprint;run;,.,3.数据集名与变量名,dataa;inputx;cards;435465;procprint;run;,数据集名称,变量名称,数据集名与变量名取名时可以是字母、下划线、数字,不能以数字开头,最多可以32个字符(SAS8.0以下软件的最大字符数为8个字符)字母可以大写、小写或大小写混合,因此Weight、weight、WEIgHT被SAS视为相同的变量。,.,4.变量的排列,dataa;inputx;cards;435465;procprint;run;,如果有多个变量,如Height、Weight、Age、Sex,Job则在SAS中排列为“inputHeightWeightAgeSexJob;”如果将以上变量用代号x1、x2、x3、x4、x5表示,则语句可写为:“inputx1x2x3x4x5;”或简写为:“inputx1-x5;”,.,5.输入数据的标识语句,dataa;inputx;cards;435465;procprint;run;,cards;或datalines;或lines;语句之后表示数据的输入即将开始。数据的变量名、变量的格式等在input语句中定义。数据输入结束,也必须采用分号结束。,.,(二)数据步,dataa;inputx;cards;435465;procprint;run;,数据分析前,数据集必须被读入。读入数据方法:1.直接创建;2.Infile和input语句创建;3.对1.、2.数据进行简单编辑,创建新的变量等。,.,1.直接创建数据集,datachild;/*建立临时数据集child.sd2,自动放在saswork子目录下*/inputidx1$x2x3x4x5x6;/*指明要输入的变量,$为字符型变量*/cards;/*标志数据区开始,数据之间以一个或几个空格分隔*/1m3295.514.053.549.642m3592.013.052.041.613m3389.012.553.535.81254m176168.053.582.0100.14255f3091.011.048.035.39256f3391.011.547.044.98521f178163.051.079.087.42;/*标志数据区结束,分号必须单独一行*/run;,.,SAS中的常用变量类型数值型:不需特殊定义字符型:定义方式变量名$日期型:多种形式如:变量名mmddyy6.实际记录为距1960/01/01的天数输入格式可以是:09100409/10/0409100409102004其它数据库中的逻辑型、备注型变量在SAS中均为字符型变量。日期型变量转进SAS后一般也变为字符型变量。,.,dataa1;inputidx1$x2x3x4;cards;1m3295.52m3592.013.03m3389.012.5;procprint;run;结果:Obsidx1x2x3x411m3295.52.023m3389.012.5,dataa1;inputidx1$x2x3;cards;1m3295.52m3592.013.03m3389.012.5;procprint;run;结果:Obsidx1x2x311m3295.522m3592.033m3389.0,SAS数据集创建时存在的问题,.,datachild;inputidx1$x2x3x4x5x6;cards;1m3295.514.053.549.642m35.13.052.041.613m3389.012.553.535.81254m176168.053.582.0100.14255f3091.011.048.035.39256f3391.011.547.044.98521f178163.051.079.087.42;procmeans;run;,缺失值的输入:以“.”表示,缺失值不进入分析,VariableNMeanStdDevMinimumMaximum-id7184.5714286194.96397711.0000000521.0000000 x2773.857142970.477960130.0000000178.0000000 x36116.250000038.241012089.0000000168.0000000 x4723.785714319.482593011.000000053.5000000 x5759.285714314.736171947.000000082.0000000 x6756.427142926.254044635.3900000100.1400000-,.,dataesr;inputx;/*每读入一个记录后,数据指针保持原位不换行,继续读下一条记录*/cards;39865573108104;procmeans;run;结果:NMeanStdDevMinimumMaximum-26.50000002.54057973.000000010.0000000-,不分行符的使用,.,如已存在一纯文本文件c:child.txt,内容如下:1m3295.514.053.549.642m3592.013.052.041.613m3389.012.553.535.81254m176168.053.582.0100.14255f3091.011.048.035.39256f3391.011.547.044.98521f178163.051.079.087.42可用infile直接读入:Datachild;Infilec:/child.txt;Inputidx1$x2x3x4x5x6;procprint;Run;,2.Infile和input语句创建数据,.,如从现有SAS文件“child”中读取数据,变成文件名为“school”的文件。dataschool;setchild;x=x3-x2;procprint;Run;,3.从现有SAS数据集中读取数据,.,前面所产生的文件都是临时文件,退出SAS后,这些文件将自动删除。为了将文件变成永久性数据集存储在磁盘上,可采用libname语句。libnameychf:/sasdata;dataych.student;setschool;run;,4.在磁盘上存储SAS数据集,用ych代表子目录“f:/sasdata”,可任意取名,但应与打算建立的文件名前的前缀相同,.,SAS数据集名称的表示方式:库关联名.数据集名永久数据集格式:libname库关联名“盘符:路径”;如:libnameychf:SASdata;ych为库关联名,代表路径f:SASdata;库关联名可任意取,一旦定义,只要不退出SAS,始终有效(因为libname命令为全局命令)。但路径必须实际存在。临时数据集:每次启动SAS时,会自动开辟一个临时存储区,其库关联名为WORK,代表sassaswork子目录。一旦退出sas,临时存储区数据集文件自动删除,称为临时数据集临时数据集的库关联名默认为work,均省略不写。如datachild;(实际为work.child),永久数据集和临时数据集,.,利用file下拉菜单中的import功能,可转入:文本型数据:空格分隔、逗号分隔、制表键分隔Dbase数据库(*.dbf)Excel数据库有的数据可通过粘贴的方法贴到Editor窗,然后采用input和cards等语句,直接生成sas数据集。,5.从其他数据集转入,.,.,.,.,输出数据:(与刚才正好相反),.,变量赋值:变量名=表达式;如x5=x4*0.5;x=x3-x2;teamgreen;缺失值赋值举例:age.;字符型变量:team;ifthen;else;如ifsex=1thent=f1+f2+f3;子集化:用keep或drop语句整理变量名表keep;drop;,6.修改SAS数据,.,.,SAS运算符举例演示,dataE21;inputN$x1x2x3;/*说明N是字符型变量,N后加$*/y=x1+x2;z=x1*x2;u=x1*3;/*用加,乘,乘方产生新变量*/cards;/*说明以下输入数据*/A1.12.63.8B4.55.76.0C7.68.29.7;/*空语句说明数据输入结束*/Procprint;/*有此打印语句则在output窗口有输出,否则只在explorerwork储存*/run;请看演示,.,datab1;setchild;ifid200thengroup=1;elsegroup=2;renameid=x0;keepidx1x2group;procprint;run;注:keepidx1x2group等价于dropx3-x6;,OBSX0X1X2GROUP11m32122m35133m3314254m17625255f3026256f3327521f1782,SAS数据集的整理举例,.,1.算术函数绝对值函数:ABS(x)平方根函数:SQRT(x)符号函数:SIGN(x)2.最大、最小值函数:MAX(范围)、MIN(范围)3.截取函数取整函数:INT(x)ROUND(x,舍入精度):按规定舍入精度取一近似值的函数.例ROUND(323.456,100)=300CEIL(x):取大于等于自变量的最小整数的函数.FLOOR(x):取小于等于自变量的最大整数的函数.,7.SAS函数,.,4.数学函数Exp(x)Log(x)Log2(x)Log10(x)Sin(x)Cos(x)Tan(x)Arsin(x)Arcos(x)Atan(x)5.分布函数泊松分布函数:POISSON(参数,x)二项分布函数:PROBBNML(p,n,x)标准正态分布:PROBNORM(x)t分布:PROBT(x,df)卡方分布:PROBCH(x,df)F分布:PROBF(x,ndf,ddf),.,6.分位数函数(其中alpha是事先规定的右侧尾端概率)标准正态分布分位数函数:PROBIT(1-alpha)t分布分位数函数:TINV(1-alpha,df)卡方分布分位数函数:CINV(1-alpha,df)F分布分位数函数:FINV(1-alpha,ndf,ddf,)7.随机数函数seed(每随意赋一个值可得到给定分布的随机变量抽样值)均匀分布随机数函数:UNIFORM(seed)或RANuni(seed)标准正态分布随机数函数:normal(seed)或RANnor(seed)均值为a方差为2的正态分布随机数函数:X=a+sqrt(2)*RANnor(seed),.,例1,DataA;a1=3;a2=-8;a3=14;a4=-27;X=MAX(ofa1-a4);Y=MIN(ofa1-a4);Fileprint;putXY;run;,例2,DataB;P=POISSON(1,3);Fileprint;putP;run;,.,例3,dataC;A=INT(323.456);B=ROUND(323.456,100);C=CEIL(-3.4);D=FLOOR(3.4);FILEprint;putABCD;run;,.,例4,datanorm;doseed=1to100;x=170+sqrt(30)*rannor(seed);/*x=均值为170,方差为30的正态分布随机数*/y=170+sqrt(30)*rannor(see
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 足部骨骼疾病康复-洞察及研究
- 土地综合治理技术服务协议
- 企业形象宣传推广专项合作协议
- 房东买房互助协议书范本
- 屠宰厂设备出售合同范本
- 室内软装修设计合同范本
- 安保外包合同解除协议书
- 小区地面车位租赁协议书
- 工地供土合同协议书模板
- 小区线路施工安全协议书
- 公安行政案件办理务实课件
- 房地产样板间装饰工程重点难点及措施
- 康复科护理金点子
- 工地油库安全管理办法
- 全球治理转型-洞察及研究
- 高等数学课程教学中遇到的问题及解决对策
- (高清版)DB32∕T 4001-2025 公共机构能耗定额及计算方法
- 电力物资打包方案(3篇)
- 2025至2030中国味精行业发展趋势分析与未来投资战略咨询研究报告
- 保险执业登记管理制度
- 你的样子就是教育的样子-一位校长对教师行为规范的深度思考建议收藏
评论
0/150
提交评论