实用统计方法教学课件全套电子教案汇总整本书课件最全教学教程完整版教案_第1页
实用统计方法教学课件全套电子教案汇总整本书课件最全教学教程完整版教案_第2页
实用统计方法教学课件全套电子教案汇总整本书课件最全教学教程完整版教案_第3页
实用统计方法教学课件全套电子教案汇总整本书课件最全教学教程完整版教案_第4页
实用统计方法教学课件全套电子教案汇总整本书课件最全教学教程完整版教案_第5页
已阅读5页,还剩666页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实用统计方法实用统计方法 2课程介绍课程介绍 统计方法是一种用于收集,表示(图解),分析和解释数据的方法.也可以说,统计方法就是从一大堆资料中提取有用信息的方法.“统计”常作为统计方法的缩写使用. “统计”在我们日常生活生活和工作中,特别是社会调查和科研工作中,是随时都可能迂到的问题.统计不仅是简单的把一堆数据数数个数,算算平均值,列成表格,而是要进行分析整理,给出一些更有意义的“统计量”.3课程介绍课程介绍 统计学是数据的科学,是对数据进行收集,整理,分析,并作出推断的一门科学.统计学是一门方法论的学科. 统计的重要性在于:它由单纯的综合分析转变为统计推断,可超越观测的时间,空间范围,由过去

2、推断未来,由局部推断总体. 统计方法在自然科学,社会科学各个领域都有广泛的应用. 4课程介绍课程介绍 统计方法包括的内容及一些应用统计方法包括的内容及一些应用:基本统计推断基本统计推断(估计和检验).统计预报统计预报(回归和时间序列分析回归和时间序列分析):高中成绩预报高考成绩; 用电量预报;气象预报; 虫情预报;地震预报; 火警预报; 财政收入的预测; 青少犯罪的预测.分类分类(聚类和判别聚类和判别):大气污染地区的分类; 医学上的临床诊断; 中医阴阳学说的研究 ; 服装的定型分类;含矿的诊断; 考古学中文物的分类; 红楼梦的研究; 企业经济效益的分类.数据结构的简化数据结构的简化(主分量主

3、分量,因子分析和典型相关因子分析和典型相关): 进一步可应用于预报与分类.方案设计方案设计(试验设计试验设计,抽样抽样),数量化理论等数量化理论等 5第一章 描述统计第二章 估计和检验第三章 方差分析与协方 差分析第四章 回归与回归诊断第五章 属 性数据分析第六,七章 聚类与判别第八,九,十章 多变量分析(主分量,因子分析和典型相关)第十一章 时间序列预报系统附录1 SAS系统入门本课程的内容6 教学方式教学方式: 授课与上机实习相结合.本课程的特点与教学方式本课程的特点本课程的特点是将实用统计方法的介绍与在计算机上实现这些方法的软件紧密地结合起来,不仅介绍每种统计方法的实际背景、统计思想、统

4、计模型和解题的思路,并结合实例介绍应用统计软件解决问题的步骤和计算结果的分析。本书不侧重严格的数学推导。 提供SAS系统(6.12版本)供大家使用.7 第一章 描述统计4统计的方法,通常包括描述统计和推断统计两方面。本章介绍描述统计,而以后几章介绍包括统计推断、统计预测等应用更广泛的推断统计。4描述统计是把观测数据本身包含的信息加以总结概括、整理简化。例如频数表、频率分布直方图及描述统计量的计算都属于描述性统计。8 第一章第一章 描述统计描述统计 1.1 描述统计量已知一组观测数据已知一组观测数据:x1,x2,xn.描述这组数据描述这组数据的特征量有的特征量有:描述取值位置的描述取值位置的特征

5、特征量量:均值均值,众数众数,中中位位数数,分位数分位数描述分散程度的特征量描述分散程度的特征量:方差方差,标准差标准差,标准误标准误, 四分位数四分位数,极差极差,四分位极差四分位极差.描述分布形状的特征量描述分布形状的特征量:偏度偏度,峰度峰度,分位数分位数9 第一章第一章 描述统计描述统计 1.2 用图表概括数据 (1) 频数表频数表 10 第一章第一章 描述统计描述统计 1.2 用图表概括数据(2) 直方图直方图(条形图条形图)11 第一章第一章 描述统计描述统计 1.2 用图表概括数据(3) 茎叶图及盒须图茎叶图及盒须图12 第一章第一章 描述统计描述统计 1.2 用图表概括数据(4

6、) 盒形盒形(须须)图图13 第一章第一章 描述统计描述统计 1.2 用图表概括数据(5) 正态概率图正态概率图14 附录1 SAS系统入门1. SAS 系统简介2. SAS系统对数据的管理3. SAS数据集的建立、浏览、编辑4. 用数据步生成SAS数据集5. 增改删数据集中的记录或变量6. 串接或并接SAS数据集7. 用PROC PRINT 制作列表报告8. SAS图形入门15 SAS系统4 SAS系统是用于数据分析与决策支持的大型4 集成式模块化软件系统。4 其早期的名称为统计分析系统-4 Statistical Analysis System(缩写为SAS) 4 在数据处理和统计分析领域

7、, SAS系统被誉为4 国际上的标准软件系统.16 SAS系统是用于决策支持 的大型集成信息系统4SAS系统主要完成以数据为中心的四大任务:4 数据访问-访问任何形式和来源的数据4 数据管理-将数据转变成可用形式4 (SAS/WA)4 数据呈现-使信息产生效用4 数据分析-获得有意义的信息(SAS/EM)17 SAS 系统介绍DATA18 SAS系统软件由模块构成4SAS系统是一个可由几个到二、三十个工具模块及面向行业的子系统组成的可伸缩系统。其模块按功能大体有四类:4 数据库部分:Base SAS, FSP, ACCESS,.4 分析核心:STAT, ETS, QC, OR, INSIGHT

8、, . . . 4 开发呈现工具:AF, EIS, GRAPH, . . . 4 分布处理与数据仓库:CONNECT, WA, .19 第一章 SAS 系统简介 1 使用系统运行一个简例4例.(中学生数据的简单分析)4 数据集SASUSER.CLASS中收集了19名中学生的年龄(AGE),性别(SEX),身高(HEIGHT)和体重( WEIGHT)的数据.4 . 试求年龄,身高,体重的平均值,最大值和最小值;4 . 分别求男女二组中学生身高的平均值和方差;4 . 试问男女中学生的平均体重是否有显蓍差异?(数据见练习题P2,SAS程序见BASE11.SAS)20第一章 SAS 系统简介 1 使用

9、系统运行一个简例4解题步骤解题步骤(用基本的编程方式用基本的编程方式):4 () 启动启动SAS系统系统(使用最简单的快捷方式使用最简单的快捷方式);4 () 告诉告诉SAS系统您要做什么系统您要做什么-在在 PROGRAM EDITOR窗窗口中口中 键入程序键入程序(BASE11.SAS):4 () SAS系统按要求完成分析计算系统按要求完成分析计算-提交程序(提交程序(SUBMIT);4 () 由由LOG 窗口查看程序执行的信息窗口查看程序执行的信息4 () 重调已提交的重调已提交的SAS程序(程序(RECALL),修改后再次提交修改后再次提交;4 () 在在OUTPUT 窗口查看运行结果

10、窗口查看运行结果;4 () 存储有用的信息存储有用的信息(SAS程序或计算结果程序或计算结果).(转到SAS系统运行BASE11.SAS)21第一章 SAS 系统简介 1 使用系统运行一个简例4解题步骤(用菜单系统SAS/INSIGHT或分析员应用):4 1.启动SAS系统=进入INSIGHT环境=打开CLASS数据集=Analyze=Multivariate(Ys)=选变量Age,Height,Weight4 =Output=在弹出窗口选Univariate=OK=OK,显示结果.4 2. 在分布窗口指定SEX(性别)为GROUP变量及变量Age,Height,Weight, 在Output

11、窗选Univariate= OK=OK.4 3. 启动SAS系统=进入分析员应用=打开CLASS数据集4=Statistics=Hypothesis Tests=Two-Sample t-test for Means4=指定分析变量(Weight)和分组变量(Sex)=OK,则显示结果.22启动SAS的方法:()在Windows桌面系统下双击AS图标第一章 SAS 系统简介 SAS 提供的基本运行环境-启动SAS()运行SAS系统目录下(例C:SAS)的可执行程序sas.exe ()从“运行“打开或从”资料管理器”双击某个已 有的SAS程序,也可启动SAS系统并调入该程序工作界面介绍23 第一

12、章 SAS系统简介 2 SAS 提供的基本运行环境-显示管理系统4SAS显示管理系统是用户和SAS系统交互会话的环境.包括众多的窗口(三个基本窗口:PROGRAM EDITOR窗口,LOG窗口OUTPUT窗口),命令.4发布显示管理命令有四种方式:4 在命令框直接键入命令;4 使用显示管理系统的下拉菜单(弹出菜单) ;4 使用工具栏。4 按功能键(命令显示功能键所表示的命令).24 第一章 SAS系统简介 2 SAS 提供的基本运行环境-显示管理系统4常用的其它窗口:4KEYS 查看及改变功能键的设置4LIBNAME 查看已存在的SAS数据库 4DIR 查看某个SAS数据库的内容4VAR 查看

13、SAS数据集的有关信息4OPTIONS 查看及改变SAS的系统设置4HELP 完整的帮助信息窗口25 第一章 SAS系统简介 SAS 提供的基本运行环境4SAS常用的交互式运行方式:44.用SAS提供的菜单系统实现各种任务4.用SAS编程实现各种任务.用SAS/ASSIST.用SAS桌面系统进菜单系统26第一章 SAS系统简介 SAS 提供的基本运行环境4进入SAS/ASSIST41.使用工具栏图标42.发命令ASSIST43.下拉菜单选 Globals=ASSIST进入SAS桌面系统 1. 发命令DESKTOP 2. 下拉菜单选 Globals =DesktopP00527第一章 SAS系统

14、简介 2 SAS 提供的基本运行环境-SAS菜单系统4SAS系统提供几个交互式地菜单系统用来完成各种分析任务.4 .SAS/INSIGHT软件4 .分析员应用(ANALYST)4 .市场研究应用(MARKET)4 .SAS/LAB软件4 .SAS/ETS软件的时间序列预报系统P00528第一章 SAS系统简介 2 SAS 提供的基本运行环境-应用工作界面4应用工作界面(AWS)4 SAS AWS是Windows环境下使用显示管理系统运行SAS系统的工作界面.4 SAS AWS的主窗口是标题为SAS的窗口4 SAS AWS还包括:4 .所有打开的SAS窗口(含最小化的窗口)4 .子窗口和对话框4

15、 .菜单条,工具栏,命令框,状态栏29第二章 SAS系统对数据的管理4SAS对数据的分析与呈现都是面对SAS数据集进行的4SAS数据集是一种SAS文件4SAS文件是由SAS系统创建和管理的有特殊结构的文件。包括SAS数据集和SAS目录册(CATALOG)等30第二章 SAS系统对数据的管理数据直接输入流行的数据库其它文件格式SAS数据集SAS应用程序31第二章 SAS系统对数据的管理1 SAS 数据集4 两种类型的数据对象:.SAS数据集(Data sets): 包含描述部分和数据部分 2. SAS数据视窗(Data View): 只含描述部分(变量名,属性,长度, 标签,输入输出格式,创建与

16、修改日期) Ass=D.Manag.=Utilities=Contents.=B & E= Dst Attr.32第二章 SAS系统对数据的管理1 SAS 数据集 - 描述部分33第二章 SAS系统对数据的管理1 SAS 数据集 - 数据部分VAR1VAR2. . . VARn观测 1123 aBc12Mar90观测 2456 XyZ01Jul97观测 312.34 12331Dec56观测 40.1234 Lm3n01jan80变 量34第二章 SAS系统对数据的管理2 SAS 数据库 - SAS 数据库 及其库标记4SAS数据集存储在SAS数据库中SAS数据库还存储其它SAS专用文

17、件4SAS数据库文件用两级命名方式定名: libname.SAS-filename4 (库标记.文件名)SAS数据集SAS数据库35第二章 SAS系统对数据的管理 2 SAS 数据库-永久库和临时库4SAS数据库有永久库和临时库两种:4临时库:名为WORK,系统自动指定4永久库:系统自动指定永久库的库标记为4 SASUSER,用户还可以规定其它4 永久库标记.4例如:Libname out a:;36第二章 SAS系统对数据的管理 2 SAS 数据库 - Windows下SAS数据库的设定4不同的主操作系统下SAS数据库文件以不同方式与主操作系统下的文件组织相联系4在Windows下每个SAS

18、数据库置于主机硬盘的某个子目录之中.4例: SASUSER: C:SASSASUSER WORK: C:SASSASWORK COURSE: C:COURSE连库 Libname 库名 目录1 目录237第二章 SAS系统对数据的管理 2 SAS 数据库 - Windows下SAS数据库的设定4.系统指定的库(设SAS系统在目录C:SAS下)4 SASUSER设置在 C:SASSASUSER4 WORK 设置在 C:SASSASWORK 4. LIBNAME语句4 使用LIBNAME语句可以指定SAS数据库的库标记4LIBNAME 库标记名 目录名 ;挘4例如: LIBNAME out a:;

19、挘4 LIBNAME course c:course ;看库38第二章 SAS系统对数据的管理 2 SAS 数据库 - Windows下SAS数据库的设定43. Libname窗口,DIR和VAR窗口4() 用工具栏中的图标进入库管理对话窗(或键入命令 Dlglib) 可浏览库内容或操作库文件或4()用LIBNAME命令进入Libname窗口4 用DIR 命令进入Dir窗口4 用VAR 命令进入Var窗口39第二章 SAS系统对数据的管理 2 SAS 数据库 - 浏览数据集4() 用工具栏中的图标进入库管理对话窗4 =选中数据集后点鼠标右键4 =在弹出菜单选 Open table view4(

20、) 在命令框发命令:FSV 数据集名4() 提交程序:proc print data=数据集名;run;40第三章 SAS数据集的建立、浏览、编辑建立SAS数据集的各种途径数据存于纸上需直接键入数据存于文本文件数据存于流行数据库文件中用VIEWTABLE FSEDIT FSVIEW编程:用DATA步用Import菜单用SAS/ACCESS41第三章 SAS数据集的建立、浏览、编辑 1 变量属性与输入、输出格式-变量的属性4数据集中变量的属性描述:4 变量名(Name):字母或下划线开始且不超过 8个字符或数字构成4 类型(Type):数值型、字符型4 长度(Length):缺省8字节( )4

21、标记(Label): 缺省40字节4 输入格式(Informat):$输入格式名w.d4 输出格式(Format): $输出格式名w.d 200必须可选42第三章 SAS数据集的建立、浏览、编辑 1 变量属性与输入、输出格式-缺失值4在数据集的一条记录的某个变量无数据时,称为缺失值(Missing Value)。4字符型变量的缺失值用空格符表示4数值型变量的缺失值用句号“ . ”表示NAME SEX POSITION AGESALARYAlex MA 35 1500Linda F 28 1400Simon MC 45 .43第三章 SAS数据集的建立、浏览、编辑 1 变量属性与输入、输出格式-

22、输入/输出格式4输入、输出格式的例子:12234.123412,234.1234$12,234.12348.2comma8.2dollar8.2输入数据输入格式实际存储 数据值12234.12输出格式8.2comma8.2dollar8.2输出数据12234.1212,234.12$12,234.12看转换:data _null_; x=put(today(), date7.); put x; run;44第三章 SAS数据集的建立、浏览、编辑 1 变量属性与输入、输出格式-日期的格式4日期输入、输出格式例:20OCT9720/10/971997/10/20DATE7.DDMMYY8.yymm

23、dd10.输入数据输入格式实际存储 数据值 13807输出格式date9.mmddyy6.yymmdd8.输出数据20OCT199710209797-10-2045第三章 SAS数据集的建立、浏览、编辑 1 变量属性与输入、输出格式4几种常用的输入、输出格式:w.d $w.COMMAw.dDOLLARw.dDATEw.MMDDYYw.标准的数字型格式 标准的字符型格式数字中嵌入逗号数字中嵌入逗号,前加$日期格式 日期格式 46第三章 SAS数据集的建立、浏览、编辑 1 变量属性与输入、输出格式4利用HELP查找SAS系统提供的输入、输出格式Help下拉菜单SAS System 目录: SAS

24、Language 索 引:SAS Informats and Formats - ContentsSAS Formatsand Informats从分类功能找从格式名找操作:VT 输入47第三章 SAS数据集的建立、浏览、编辑 2 创建SAS数据集-直接输入.键入命令:VT(viewtable)-表格方式输入或用SAS菜单系统-SAS/INSIGHT软件和分析员应用.逐条输入PROC FSEDIT NEW=SAS-data-set; RUN;.成批输入PROC FSVIEW NEW=SAS-data-set; RUN;.DATA步(见第四章)操作:看生成的数据集和sasuser.class48

25、第三章 SAS数据集的建立、浏览、编辑 3 浏览、修改SAS数据集1. 键入命令:VT 数据集(如:VT SASUSER.CLASS)或用SAS菜单系统-SAS/INSIGHT软件和分析员应用2. 逐行浏览 PROC FSEDIT DATA=SAS-data-set; RUN;.成批浏览 PROC FSVIEW DATA=SAS-data-set; RUN;4.用PRINT过程显示SAS数据集49第四章 用数据步生成SAS数据集 1 SAS程序的构成4SAS的程序由两种程序步(Step)构成:4数据步(DATA STEP):以DATA语句开始,用于创建和整理SAS数据集4过程步(PROC ST

26、EP): 以PROC语句开始,用于分析处理SAS数据4 SAS程序是由一个或若干个DATA步和PROC步组成的.504DATA步中设定变量属性的语句:4第四章 用数据步生成SAS数据集 在DATA步中规定变量属性LENGTH 变量名 长度 . . . ;INFORMAT 变量名 输入格式 . . .; FORMAT 变量名 输出格式 . . .; LABEL 变量名= 字符串输入格式 . . .;Length还决定了变量在数据集中的次序看testdata, testdt2, testdt3 不同格式文本本件51第四章 用数据步生成SAS数据集 直接输入数据生成SAS数据集4在DATA步直接输入

27、数据的4一般形式:4 DATA SAS-data-set ;4 变量属性设定语句;4 INPUT 语句;4 其它语句;4 CARDS;4 数据行;4 RUN;在DATA步直接输入数据的例子: data da1; input x y z; sum=x+y+z; cards; 1 3.1 5 3 2.3 7 6 3.4 6 ;看testdata, testdt2, testdt3 不同格式文本本件52第四章 用数据步生成SAS数据集 5 由文本数据文件生成SAS数据集4在DATA步由文本数据文件生成4SAS数据集的一般格式:DATA SAS-data-set ; 变量属性设定语句; INFILE

28、filename ; INPUT 语句; 其它语句;RUN;在DATA步由文本数据文件生成SAS数据集的例子: data da2; infile c:f1.txt; input x y z; mean=(x+y+z)/3; run;文本数据文件f1.txt的内容: 3.1 5 3 2.3 7 .53第五章 增改删数据集中的记录或变量1 读入其它SAS数据集4要增加、修改、删除SAS数据集中的观测或变量可在DATA步中加入各种语句来实现4 ()生成SAS数据集(由外部文件或直接输入)时,在INPUT语句之后加入;4 ()用SET语句读入已有SAS数据集再加入各种语句对读入数据集中的变量或观测进行

29、增改.4或用数据集选项实现.54第五章 增改删数据集中的记录或变量1 读入其它SAS数据集4增改删数据集中的记录或变量4 或在INPUT语句后 或用SET语句并加入其它SAS语句: 加入其它SAS语句 DATA new; . . . .; INPUT ; 其它 SAS 语句;RUN;DATA new; SET old; 其它 SAS 语句;RUN;操作, p04755第五章 增改删数据集中的记录或变量2 选择数据集的变量和观测-选择变量4在DATA 语句中用数据集选项DROP= 和 KEEP=4在SET 语句中用数据集选项DROP= 和 KEEP=4在DATA步中加入DROP语句和 KEEP语

30、句 4例: (1) data new(drop=x y); 4 (2) set old(keep=x y); 4 (3) data new; .4 drop x y;4 run; 操作:class, if 年龄,性别56第五章 增改删数据集中的记录或变量2 选择数据集的变量和观测-选择观测4用SAS语句4保留观测4 IF expression; (子集IF语句)4剔除观测4 IF expression THEN DELETE;操作57第五章 增改删数据集中的记录或变量2 选择数据集的变量和观测-选择观测4用数据集选项4在DATA 语句中用选项WHERE= 4在SET 语句中用选项WHERE=

31、4在SET 语句中用选项FIRSTOBS= 和/4 或OBS=4例: (1) data new(where=(sex=F); 4 (2) set old(where=(age13); 4 (3) set old(firstobs=6 obs=20) ;58第五章 增改删数据集中的记录或变量3 用SAS语句创建、赋值和修改4DATA步中常用的语句:4 设定变量属性的语句4 赋值语句4 条件语句4 循环语句4 转移语句4OUTPUT语句与PUT语句操作:class, W/H h inch - cm594赋值语句的一般形式4var 新建或修改的变量名expression 由变量、SAS函数和四则运算

32、 (+, -,*,/,*)构成的表示式4赋值语句将表示式的值赋给变量第五章 增改删数据集中的记录或变量3 用SAS语句创建、赋值和修改-赋值语句var = expression ;fct132 取整,fct134 平均,求和604SAS函数共19类4调用形式:4 函数名(变元 )4 函数名(OF 变量名列)4其中变元可以是常数、变量、函数或表示式4例:sqrt(x), probnorm(x), tinv(x,df)4 sum(of x1, x10-x20, x25)第五章 增改删数据集中的记录或变量 3 用SAS语句创建、赋值和修改-SAS函数(转到SAS系统运行BASE53_3.SAS)61

33、第五章 增改删数据集中的记录或变量 3 用SAS语句创建、赋值和修改-SAS函数4利用HELP查找SAS系统提供的各种函数Help下拉菜单SAS System 目录: SAS Language 索引:SAS Function - Contents从分类功能找从函数名找SAS Functions62第五章 增改删数据集中的记录或变量 3 用SAS语句创建、赋值和修改-SAS函数4 函函 数数 类类例例Arithmetic ABS, SQRT, DIMCharacter UPCASE, SUBSTR, TRIMDate and TimeTODAY, DAY, MONTH, MDYMathemati

34、cal LOG, EXP, GAMMANoncentrality CNONCT, FNONCT, TNONCTQuantile PROBIT, CINV, TINV, FINVProbability and Density PROBNORM, PROBT, POISSON,PDF,PDMRandom NumberRANUNI, RANNOR, RANEXPSample StatisticSUM, MEAN, STD, VAR, RANGESpecialPUT, INPUT, DIF, LAGTrigonometricSIN, TAN, ARCOSTruncationINT, CEIL, ROU

35、NDOthersZIPSTATE63第五章 增改删数据集中的记录或变量 3 用SAS语句创建、赋值和修改-SAS函数4测试函数功能的一个简单的程序:4 data _null_; y=sqrt(3); put y= ;run;p050 日期函数64第五章 增改删数据集中的记录或变量 3 用SAS语句创建、赋值和修改-SAS日期时间函数4SAS日期常数和函数:4直接作为数字型常数: ddMMMyyD (例如 : 12JAN96d )4一些操作日期的函数:DATE(), TODAY(), DATETIME(), TIME(),YEAR(SAS-date), QTR(SAS-date), MONTH(

36、SAS-date) DAY(SAS-date), HOUR(datetime|time), MINUTE(. . .),4MDY(month,day,year), HMS(hour,minute,second),4DHMS(date,hour,minute,second)书上例,p41开始654 条件语句IF 条件表达式条件表达式 THEN 可执行语句可执行语句;ELSE 可执行语句可执行语句 ;第五章 增改删数据集中的记录或变量 3 用SAS语句创建、赋值和修改-条件语句比较操作符:, GT, =EQ, LE, GE, NE, IN逻辑操作符: & AND, - OR, NOT.IF

37、 expression THEN DO; statements ; . . . END;ELSE DO; statements ; . . . END;66第五章 增改删数据集中的记录或变量 3 用SAS语句创建、赋值和修改-例子4(1) tatol=x+y+z; tatol=sum(x,y,z); tatol=sum(of x1-x6);4(2) if sex=F then y=100+y; 4 if upcase(dest)=LAX then y=x+z;4(3) if sum le 170 then delete;4(4) if upcase(dest)=LAX then do;4 y=

38、x+z; city=Dallas;4 end;4(5) length city $12;4(6) date=01jan97d;4 year=year(date); qtr=qtr(date);4 month=month(date); day=weekday(date); (参见BASE53.SAS)67第六章 串接或并接SAS数据集AB AB ABSAS 数据步数据步数据串接数据串接SAS 数据集数据集SAS 数据集数据集数据并接数据并接68DATA SAS-data-set ; SET SAS-data-set1 SAS-data-set2 . . . ;RUN;第六章 串接或并接SAS数据

39、集1 串接SAS数据集4用SET语句串接SAS数据集4(变量相同或变量不同的连接)p058 最简,p059 变量不同,p060 变量改名69第六章 串接或并接SAS数据集1 串接SAS数据集NUM VARA 1 A1 2 A2 5 A3DATA COMBINE; set A B;run;A:B:NUM VARA VARB 1 A1 2 A2 5 A3 3 B1 4 B2 6 B3 COMBINE:NUM VARB 3 B1 4 B2 6 B3(参见BASE61.SAS)70DATA SAS-data-set ; SET SAS-data-set1 SAS-data-set2 . . . ; B

40、Y Variables;RUN;第六章 串接或并接SAS数据集1 串接SAS数据集4用SET语句串接SAS数据集4(按BY变量的顺序交替连接数据集中观测)714NUM VARB4 3 B14 4 B24 6 B3第六章 串接或并接SAS数据集1 串接SAS数据集NUM VARA 1 A1 2 A2 5 A3DATA COMBINE; set A B; BY NUM;run;A:B:NUM VARA VARB 1 A1 2 A2 3 B1 4 B2 5 A3 6 B3 COMBINE:(参见BASE61.SAS)p06172第六章 串接或并接SAS数据集1 串接SAS数据集-SORT过程4用PR

41、OC SORT语句对SAS数据集排序4 (当用BY语句时,要求对每个数据集先用SORT过程按BY变量排好次序)PROC SORT DATA=SAS-dat-set1 OUT=SAS-dat-set2; BY by-variables;RUN;p063(比较有无by )73第六章 串接或并接SAS数据集2 并接SAS数据集 4用MERGE语句合并SAS数据集DATA SAS-data-set; MERGE SAS-data-set1 SAS-data-set2; BY by-variables;RUN:MERGE SAS-data-set1(In=var) SAS-data-set2(In=va

42、r);Set 258 内部变量, Set258_2 转为用户设定变量74第六章 串接或并接SAS数据集1 串接SAS数据集4 NUM VAR 1 C1 2 C2 2 C3 3 C4NUM VAR 2 D1 3 D2 3 D3data combine; set C D; by num;run;C:D:NUM VAR 1 C1 2 C2 2 C3 2 D1 3 C4 3 D2 3 D3COMBINE:(参见BASE61.SAS)75第六章 串接或并接SAS数据集2 并接SAS数据集4 NUM VARA 1 A1 2 A2 3 A3NUM VARB 1 B1 2 B2 4 B3DATA COMBIN

43、E; merge A B; by num;run;A:B:NUM VARA VARB 1 A1 B1 2 A2 B2 3 A3 4 B3COMBINE:(参见BASE62.SAS)p066 by+in, p067 by+in+rename76第六章 串接或并接SAS数据集2 并接SAS数据集4 NUM VARA 1 A1 2 A2 3 A3NUM VARB 2 B1 2 B2 3 B3DATA COMBINE; merge A B; by num;run;A:B:NUM VARA VARB 1 A1 2 A2 B1 2 A2 B2 3 A3 B3COMBINE:(参见BASE62.SAS)p0

44、7077PROC PRINT DATA=SAS-data-set;RUN;第七章 用PROC PRINT 制作列表报告1 产生列表报告 PROC PRINT语句的最简单形式:例:Proc print data=sasuser.class; run;P78第七章 用PROC PRINT 制作列表报告1 产生列表报告4PROC PRINT过程的一般形式:4PROC PRINT DATA=SAS-data-set ;4 ID variable;4 VAR variables;4 WHERE where-expression;4 SUM variables;4 BY by-variables;4 PA

45、GEBY by- variables;4RUN;79第七章 用PROC PRINT 制作列表报告1 产生列表报告 - 例子4(1) proc print data=class noobs;4 run;4(2) proc print data=class noobs;4 var name height weight;4 where age between 134 and 15;4 run;(3) proc sort data=class; by sex; proc print data=class; by sex; id name; run;(4) proc print data=class;

46、by sex; sum age; run; (参见BASE71.SAS)p079 title, p080 footnote80第七章 用PROC PRINT制作列表报告2 改进列表报告4TITLEn text ;FOOTNOTEn text ;标题、脚注和选项:OPTIONS options;p08881第七章 用PROC PRINT制作列表报告2 改进列表报告4与PRINT有关的一些系统选项4CENTER | NOCENTERDATE | NODATENUMBER | NONUMBERLINESIZE=widthPAGESIZE=nPAGENO=n定义方法OPTIONS 语句OPTIONS

47、窗口82第七章 用PROC PRINT制作列表报告2 改进列表报告PROC PRINT 选项选项;4PROC PRINT 的一些选项:4HEADING=v|h4LABEL4SPLIT=符号4WIDTH=Full|Min|Up081 label 临时设定,p082 split. 用cclass+opton label83第七章 用PROC PRINT制作列表报告2 改进列表报告4LABEL variable1=label4 variable2=label4 . . . . . . . . . .;Print 选项 : SPLIT=符号Label语句:例:proc print data=class

48、 split=#; label weight=weight#in#pounds; run;p084 用已有格式,p086 用定义格式84第七章 用PROC PRINT制作列表报告2 改进列表报告4FORMAT语句:FORMAT variables format ;定义用户格式:PROC FORMAT; VALUE format-name range1=label range2=label . . . . . ;85第七章 用PROC PRINT制作列表报告2 改进列表报告-综合例子4proc format;4 value group low-95=S 96-110=M 111-high=L;4

49、run;4option ps=40 ls=80;4proc print data=class split=* label;4 format weight group.;4 var name sex height weight ;4 title 中学生数据;4 footnote 1986;4 label name=First*name4 sex=Gender4 weight=Weight*in*group4 height =Height*in*inches;4 id name;4run; 4(转到SAS运行BASE72.sas)86第八章 SAS图形入门4Base SAS和SAS/GRAPH提供

50、了许多过程用于绘制图形(这里介绍高分辨图形): 散点图及连线图(PLOT过程或GPLOT过程) 图表(CHART过程或GCHART过程) 地图(MAP过程) 三维图形(three-dimensional graphics) 文本缩放及其它(text slides)87第八章 SAS图形入门1 散点图及连线图4用GOPTIONS语句指定图形设备:goptions dev=win;goptions dev=winprtm;goptions reset=all;p105 散点图88第八章 SAS图形入门1 散点图及连线图-过程4用GPLOT过程步绘制散点图及连线图:4例:绘制CLASS数据集中体重对

51、身高的散点图.4 Proc gplot data=class;4 plot weight*height;4 run;PROC GPLOT DATA=SAS-data-set ; PLOT vert-var *hor-var/options;RUN;p107 连线 v=square, p108 加色,线型,粗细89第八章 SAS图形入门1 散点图及连线图-SYMBOL语句4SYMBOL语句的作用4例: symbol c=red v=star I=join;SYMBOLn C= V= CV= I= CI= W= L= ; V=PLUS + STAR * SQUARE 方块 DIAMOND 菱形 T

52、RIANGLE NONEI=NONE JOIN SPLINE NEEDLE RLC=RED GREEN BLUE ORANGEp10990第八章 SAS图形入门1 散点图及连线图4怎样修改和控制坐标轴4HAXIS=Values|Axisn 水平轴的刻度VAXIS=Values|Axisn 垂直轴的刻度 CAXIS=Color 坐标轴的颜色CTEXT=Color 坐标轴字符的颜色4例:(1) plot y*x / haxis=10 to 100 by5 ctest=green;4 (2) plot y*x / vaxis=20 40 60 80 caxis=yellow;p11091第八章 SA

53、S图形入门1 散点图及连线图-标题和脚注图形中标题(Title)和脚注(Footnote)的选项:C=颜色H=高度及单位F=字体TITLEn 选项 内容;FOOTNOTEn 选项 内容;92第八章 SAS图形入门 2 条形图和圆饼图 4用GCHART过程步绘制各种条形图(柱状图)、圆饼图和星型图93第八章 SAS图形入门 2 条形图和圆饼图 PROC GCHART DATA=数据集名; 类型 变量名列/ 选项;RUN;类型:HBAR-水平条形图 PIE -饼图 VBAR -垂直条形图 STAR -星型图 BLOCK -立体柱状图 Proc GCHART的一般形式为:P94第八章 SAS图形入门

54、 2 条形图和圆饼图 - 常用选项 PROC GCHART DATA=数据集名; 类型 变量名列/ 选项;RUN;选项:DISCRET-指定分类方式MIDPOINT=列举值-指定分组中点SUMVAR=变量名-指定分析变量TYPE=FREQ|SUM|MEAN|PCT|CFREQ|CPCT -指定统计量(缺省为freq(无sumvar)或sum )GROUP=变量名-指定分组作图SUBGROUP=变量名-指定条形内的分组95第八章 SAS图形入门 2 条形图和圆饼图-综合例子4proc gchart data=salary;4 hbar jobcode;4 vbar jobcode / sumva

55、r=salary type=mean;4 pie jobcode / sumvar=salary type=sum;4 pie jobcode / sumvar=salary type=sum4 fill=x;4 block jobcode / type=mean4 sumvar=salary4 group=sex;4 run;4(转到SAS运行BASE92_1.sas)96更新SETINIT.SAS41. 密码未完全失效时在SAS Program窗中提交SETINIT.SAS文件执行即可;42. 密码完全失效时运行(设系统安装在C:SAS下)43.运行SASCORESETINT下的SIUPD

56、ATE.EXE,然后按屏幕提示的步骤更新密码.C:SASSAS -SYSIN a:setinit.sas -SETINIT97实用统计方法实用统计方法第二章第二章 估计和检验估计和检验第二章 估计和检验 2.1 基本统计概念98本节介绍统计的几个本节介绍统计的几个基本概念基本概念: :1. 1. 随机变量与概率分布随机变量与概率分布2. 2. 总体和样本总体和样本3. 参数和统计量参数和统计量4. 4. 参数估计和假设检验参数估计和假设检验5. 正态分布正态分布第二章 估计和检验 2.1 基本统计概念-总体99一一. 总体总体(母体母体 Population)研究的对象全体组成的集合研究的对象

57、全体组成的集合-总体总体研究对象的某些指标或特征研究对象的某些指标或特征(Variable) Var1, Var2, . . . ,Varm总体的分布:这些变量取什麽值,各占多大总体的分布:这些变量取什麽值,各占多大 比例比例总体分布的特征量总体分布的特征量: 均值均值,方差及其他方差及其他-参数参数 第二章 估计和检验 2.1 基本统计概念-样本100二二. . 样本样本( (子样子样 Sample ) 样本:取自总体的若干样本:取自总体的若干(有代表性有代表性)的个体的个体 Var1 Var2 .Varm Obs1 x11 x12 . x1m Obs2 x21 x22 . x2m . .

58、. . . . . . Obsn xn1 xn2 . Xnm 计算统计量计算统计量第二章第二章 估计和检验估计和检验 2.1 基本统计概念-统计量101三三. . 统计量统计量(Statistics) 子样子样 总体总体 描述描述 推断推断 统计量统计量-由样本运算而得到的量由样本运算而得到的量,比如:比如: 均值均值,中位数中位数,方差方差,标准差标准差, 变异系数变异系数,极差极差 偏度偏度,峰度等峰度等 统计量能集中样本某一方面的信息统计量能集中样本某一方面的信息.第二章第二章 估计和检验估计和检验 2.1 基本统计概念102总体(分布及其它特征)总体(分布及其它特征)抽样抽样样本(分布

59、样本(分布及其它特征及其它特征)计算统计量计算统计量统计统计量量描述描述推断推断四四. .统计的过程统计的过程第二章第二章 估计和检验估计和检验 2.1 基本统计概念 参数是总体的特征量。 统计量是由样本观测值计算而得到的。 统计量可用于估计总体的参数。103总体参数 样本统计量均值方差标准差sX2s第二章第二章 估计和检验估计和检验 2.1 基本统计概念-参数估计 总体的特征量(参数)用样本相应的特征量(统计量)来估计称为参数的点估计104X22s区间估计区间估计:以一定的置信度(概率)给出参数:以一定的置信度(概率)给出参数的范围。它是带有一定可靠度和精度的估计的范围。它是带有一定可靠度和

60、精度的估计. .P ab()= 1第二章 估计和检验 2.1 基本统计概念-假设检验的基本思想(法院判决的类比)105第二章 估计和检验 2.1基本统计概念- 假设检验的基本思想( 投钱币的例子)106第二章第二章 估计和检验估计和检验 2.1 基本统计概念-假设检验的基本思想( 投钱币的例子)10763 正正面面37 反反面面40 正面60 反反面面55 正正面面45 反反面面15 正正面面85 反反面面p-值值 = .27p-值值 .01p-值值 =10=0.27(p值值) P|正面正面-反面反面|=20=0.04(p值值) P|正面正面-反面反面|=260.01(p值值) p值是出现观测到的值比该值值是

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论