生物统计实验sasppt课件_第1页
生物统计实验sasppt课件_第2页
生物统计实验sasppt课件_第3页
生物统计实验sasppt课件_第4页
生物统计实验sasppt课件_第5页
已阅读5页,还剩80页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计与试验设计 实验课( SAS) 山东农业大学信息科学与工程学院数学系 陈 茂 学 1 SAS系统是用于数据分析与决策支持的大型集 成式模块化软件系统。 其早期的名称为统计分析系统 - Statistical Analysis System( 缩写为 SAS) 在数据处理和统计分析领域, SAS系统被誉为 国际上的标准软件系统。 第一章 SAS系统简介 2 1.1 SAS软件简史 早在 60年代,美国北卡罗来纳州 Raleigh 的 SAS软件有限公司开始研制统计分析系统 - SAS软件包。 1976年研制成功,并作为产品推向市 场。目前已被 120多个国家和地区的 29000多个机 构所采用,直接用户 300多万人。起初, SAS是建 立在 DOS环境下的。有适于不同机型的各种版本。 在 WINDOWS出现不久, SAS公司就研制出 WINDOWS 环境下运行的 SAS系统。 3 1.2 SAS软件的结构 SAS软件是模块式结构,整个系统有 30多个模块组成。 SAS/BASE-基础核心模块。 SAS/STAT-常用和多元统计分析模块。 SAS/IML-矩阵运算模块。 SAS/ETS-时间序列预测模块。 SAS/QC-工业生产质量控制和实验设计模块。 SAS/ASSIST-处理一般简单问题模块。 SAS/INSIGHT-交互式统计分析模块。 SAS/OR-运筹学模块。 SAS/AA-Analyst application分析员应用模块。 4 1.3 SAS软件的功能 功能十分强大,包括客户机与服务器之间的 信息交换和计算、数据访问、数据存储和管理、 数据报告和分析、质量控制和项目管理、图形处 理和实验设计、应用开发。 5 1.4 进入 SAS系统的方法和标志 在 WIN95或 WIN98下(假设已经装好 SAS), 直 接调用 SAS快捷键或选择 “ 开始 ” -“ 程序 ” - “ The SAS System” 即可进入 SAS系统。 进入 SAS后,屏幕出现两个窗口,即 LOG( 记 录)、 PROGRAM EDITER( 程序编辑器,简写 PGM) 窗口,通过菜单条 “ Window” 或 “ Globals” 选项 可以进入 OUTPUT( 输出)窗口。 6 SAS6.12界面 7 SAS8.2界面 8 SAS9.0界面 9 菜单中的几个子菜单 1 文件 子菜单 10 2 编辑 子菜单 11 3 查看 子菜单 12 4 工具 子菜单 13 5 运行 子菜单 14 5 解决方案 子菜单 15 6 帮助 子菜单 16 2.1 SAS过程与 SAS程序 SAS过程 (SAS PROCEDURE)是 SAS研制者为解决特定 问题而编写的、经过编译的 SAS程序,以 “ .DLL” 为 其扩展名,存储在 SAS各 子目录下,供用户调用。 SAS程序 (SAS PROGRAM)是 SAS用户运用 SAS语言编 写的一段程序。其目的是为了将用户的数据告诉 SAS 系统调用特定的 SAS过程完成某项任务。 第二章 用 SAS需 了解的几个基本概念 17 2.2 SAS文件与 SAS数据集 SAS文件是由 SAS系统创建和管理的有特殊 结构的文件。如:在程序编辑窗口,输入 n行数据存盘得 到的文件。 SAS数据集是 SAS文件的一种,其扩展名为 .SD2。 产生 SAS数据集的主要方法有: 1 PGM窗口运行一段 SAS程序( SAS数据步)来产生。 2 用 VIEWTABLE界面输入并存储的方式来产生。 3 其他方式( SAS/INSIGHT, SAS/AA,转换等)。 18 2.3 SAS程序结构 SAS程序包括: 1 SAS数据步( SAS DATA STEP)。 作用是建立 SAS数据集。 2 SAS过程步( SAS PROCEDURE STEP)。 作用是激活 SAS过程。 例如:调查并测得 8名 14-16岁中学生有关指标 的数据如下,写一段 SAS程序,分析男女生体重均 值之间的差异是否显著。 19 DATA students; INPUT name$ sex$ age weight height; CARDS; Wang M 14 40 150 Zhang M 16 42 170 Li F 15 44 149 Tang M 15 38 162 Liu F 14 47 162 Chen F 16 52 168 Zhu M 14 45 158 Jia F 16 45 167 ; PROC TTEST; CLASS sex; VAR weight; run; 从 “ DADA” 到独占一行的 “ ;” 为 SAS数据步 ; 从 “ PROC” 到 “ RUN; ” 为 SAS过程步。 students-产生 SAS数据集的名字; INPUT-产生 5个变量;( $-字符型) CARDS-表明各变量的具体取值; TTEST-t检验; CLASS-以性别 sex变量为分组变量; VAR-指明分析的变量(如 weight); RUN-表明程序的结束。 20 程序运行结果 (6.12) 21 程序运行结果 (SAS 9.0): 22 2.4 SAS程序的产生办法 1 在 PGM窗口直接编写 SAS程序。 2 利用 VIEWTABLE建立好 SAS数据集后,借助部分非 编程 SAS模块自动产生 SAS程序 (如 SAS/AA)。 3 直接调用由 SAS软件应用开发者编好的 SAS程序。 2.5 SAS程序的运行 在 PGM窗口内有了 SAS程序后,只需按一下工具拦 中的小人像图标, SAS系统就开始执行操作,完成指 定的任务。如果程序有错,错误信息显示在 LOG窗口 内。如果程序正确,计算结果显示在 OUTPUT窗口内。 23 第三章 SAS语言 3.1 SAS程序设计概述 SAS程序 分:数据( DATA)步和过程( PROC)步。 DATA步的基本语句有 DATA,INPUT,CARDS,. 3.2 SAS常量、变量、函数、表达式和数组 3.2.1 常量 数值、字符、日期、时间常量。 如:数值常量, 1024, -10, 1.5E23 字符常量, “JAC”, “1232” 3.2.2 变量 如 x,xy,x1,abc;x$,name$, 24 3.2.3 函数 (1) 算术函数:绝对值 ABS( ),平方根 SQRT( ),. (2) 截取函数:取整 INT( ),舍入 ROUND( ), (3) 数学函数: EXP( ),LOG( ),LOG2( ),LOG10( ) (4) 三角函数: SIN( ),COS( ),TAN( ),ARSIN( ) (5) 字符函数:字符串长度 LENGTH( ),取子字符串 SUBSTR( ),如 SUBSTR(“ABCDEF”,2,3)=“BCD” (6) 日期与时间函数: DATE( ),TIME( ),YEAR( ), 25 (7) 随机函数: UNIFORM( )、 RANUNI( )均匀分布 NORMAL( )、 RANNOR( )正态分布 RANEXP( )指数分布 RANBIN( )二项分布, RANPOI( ) 普松分布, . (8) 概率分布函数: P(或 GT, =或 GE, 语句 1; OTHERWISE 语句 ; END; 多分支 结构: IF THEN 语句 ; ELSE 语句 ; 3.4.3 分支结构 GOTO 标号;(标号 OK:y=x+20;) IF THEN GOTO 标号; 32 3.4.4 DO循环结构 DATA test; ARRAY x(10) t1-t10; INPUT t1-t10; SUM=0; DO I=1 to 10; sum=sum+x(I); END; CARDS; 1 2 3 4 5 6 7 8 9 10 ; PROC PRINT; RUN; DO 循环变量 =初值 TO 终值 BY 步长 ; SAS语句; END; 例: 33 3.5 数据预处理 3.5.1 产生新变量 DATA one;INPUT x y; x2=x*x; x3=x*x*x; z=x/y*100; yp=LOG(y); CARDS; 1 232 3 234 2 223 4 354 ; PROC PRINT;RUN; 34 3.5.2 修改变量 例如: x=x-100;y=LOG(y); 3.5.3 删除变量 例如: DATA one; INPUT x1 x2 x3 y; DROP x2 x3; CARDS; 1 2 3 40 2 4 5 80 3 5 7 83 ; PROC PRINT; RUN; 35 4.1 完全随机化设计 例 1 夏玉米硼肥肥效试验。处理 A 施硼肥 ;处理 B 不施 硼肥 ;完全随机化设计 ,各重复 5次 ,小区产量结果如下 : A39, 37.6, 44.3, 42.4, 44.1 B33.9, 35.9, 39.1, 33.5, 38.1 试分析两处理平均产量间有无显著差异。 第四章 两均值检验及统计量计算 DATA tem; INPUT g$ n; DO i=1 to n; INPUT x; OUTPUT; END; CARDS; A 5 39.0 37.6 44.3 42.4 44.1 B 5 33.9 35.9 39.1 33.5 38.1 ; PROC TTEST; CLASS g; VAR x; RUN; 36 37 例 2 为鉴定某小麦新品系 A的生产能力,以当地的优良 小麦品种 B为对照,两两组成一对分别种植于相邻的两 个小区上,重复 8次,试验结果如下: A21 20 18 17 16 17 19 20 B15 17 15 16 16 16 17 19 试分析两种子产量之间有无显著差异。 程序如下: 4.2 配对设计 38 DATA tem; INPUT x1 x2; d=x1-x2; CARDS; 21 15 20 17 18 15 17 16 16 16 17 16 19 17 20 19 ; PROC MEANS MEAN STDERR T PRT MAXDEC=4; VAR d; RUN; 39 例 3 某班 31个学生,某门课程的考试成绩如下: 25 45 50 54 55 61 64 68 72 75 75 78 79 81 83 84 84 84 85 86 86 86 87 89 89 89 90 91 91 92 100 4.3 统计量的计算 计算均值、方差、标准差、变异系数、中位数、极差。 data ex3; input x ; cards; 25 45 50 54 55 61 64 68 72 75 75 78 79 81 83 84 84 84 85 86 86 86 87 89 89 89 90 91 91 92 100 ; proc means mean var std cv median range maxdec=2; var x; run; quit; 解 SAS程序: 40 data ex3; input x ; cards; 25 45 50 54 55 61 64 68 72 75 75 78 79 81 83 84 84 84 85 86 86 86 87 89 89 89 90 91 91 92 100 ; proc means mean var std cv median range maxdec=2; var x; run; quit; 输出结果 : 41 例 1设有 5个品种的单因素完全随机化设计,各重复 4 次,小区产量结果如下,试进行方差分析。 品种 重 复 1 2 3 4 A1 A2 A3 A4 A5 24 30 28 26 27 24 21 26 31 28 25 30 32 33 33 28 21 22 16 21 5.1 单因素完全随机化设计的方差分析 第五章 方差分析 42 DATA one; INPUT a$ n; DO i=1 TO n; INPUT y; OUTPUT; END; CARDS; A1 4 24 30 28 26 A2 4 27 24 21 26 A3 4 31 28 25 30 A4 4 32 33 33 28 A5 4 21 22 16 21 ; PROC ANOVA; CLASS a; MODEL y=a; MEANS a /LSD ALPHA=0.05; RUN; QUIT; 43 方差分析结果 44 多重比较结果 45 例 2 有 6个大豆品种的比较试验,随机区组设计, 4个区组,试验结果如下表。试进行方差分析。 品 种 区 组 1 2 3 4 A1 A2 A3 A4 A5 A6 58 54 50 49 42 38 41 36 32 36 29 35 46 45 43 46 35 31 34 34 44 42 36 38 5.2 单因素随机区组设计的方差分析 46 DATA two; DO a=A1,A2,A3,A4,A5,A6 ; DO b=1 to 4;INPUT y; OUTPUT; END; END; CARDS; 58 54 50 49 42 38 41 36 32 36 29 35 46 45 43 46 35 31 34 34 44 42 36 38 ; PROC ANOVA; CLASS a b; MODEL y=a b; MEANS a /TUKEY; RUN; 47 方差分析结果 48 多重比较结果 49 例 3:玉米试验。 A施肥期:前期 A1 , 后期 A2 。 B施肥量: B1N5 ; B2N10 ; B3N15 。 设置 5个区组,试验结果如下,进行方差分析。 处理 区 组 1 2 3 4 5 A1B1 A1B2 A1B3 A2B1 A2B2 A2B3 50 59 45 52 58 60 53 58 62 55 64 66 67 71 63 55 60 56 62 45 71 65 75 78 80 55 59 58 63 60 5.3 多因素随机区组设计的方差分析 50 DATA ex3; DO a=A1,A2; DO b=B1,B2,B3; DO c=1 to 5; INPUT y; OUTPUT; END; END; END; CARDS; 50 59 45 52 58 60 53 58 62 55 64 66 67 71 63 55 60 56 62 45 71 65 75 78 80 55 59 58 63 60 ; PROC ANOVA;CLASS a b c; MODEL y=a b c a*b; MEANS a b a*b/LSD; RUN; 51 方差分析结果 52 A因素多重比较结果 53 B因素多重比较结果 54 例 4 A、 B、 C、 D、 E 五个水稻品种试验的拉丁 方设计。试验设计及试验结果如下表。试进行方差 分析。 行 列 1 2 3 4 5 1 2 3 4 5 D 37 A 38 C 38 B 44 E 38 B 48 E 40 D 36 C 32 A 35 C 27 B 32 A 32 E 30 D 26 E 28 D 37 B 43 A 38 C 41 A 34 C 30 E 27 D 30 B 41 5.4 拉丁方设计的方差分析 55 DATA ex4; DO r=1 TO 5; DO c=1 TO 5; INPUT t$ y; OUTPUT; END; END; CARDS; D 37 A 38 C 38 B 44 E 38 B 48 E 40 D 36 C 32 A 35 C 27 B 32 A 32 E 30 D 26 E 28 D 37 B 43 A 38 C 41 A 34 C 30 E 27 D 30 B 41 ; PROC ANOVA;CLASS r c t; MODEL y=r c t; MEANS t/LSD; RUN; 56 方差分析结果 57 处理的多重比较结果 58 第六章 相关与回归分析 6.1 相关系数的计算 例 1 某物质在凝固时放出的热量 y( 卡 /克)与此物 质中 4种化学成分( %) x1,x2,x3,x4有关 ,求这 5个变 量间的相关系数。数据与程序如下: 59 DATA hald; INPUT x1 x2 x3 x4 y; CARDS; 7 26 6 60 78.5 1 29 15 52 74.3 11 56 8 20 104.3 11 31 8 47 87.6 7 52 6 33 95.9 11 55 9 22 109.2 3 71 17 6 102.7 1 31 22 44 72.5 2 54 18 22 93.1 21 47 4 26 115.9 1 40 23 34 83.8 11 66 9 12 113.3 10 68 8 12 109.4 ; PROC CORR; VAR x1-x4 y; RUN; 60 相关分析结果 61 例 2 某植物的苗龄 x(d)与株高的试验数据如下,求 x与 y 的直线回归方程。 6.2 简单线性回归 苗龄 x(d) 5 10 15 20 25 30 35 株高 y(cm) 2 5 9 14 19 25 33其 SAS程序如下: DATA two; INPUT x y; CARDS; 5 2 10 5 15 9 20 14 25 19 30 25 35 33 ; PROC REG; MODEL y=x; RUN; 62 方差分析与参数估计 63 如果输出预测值, 在 MODEL 语句后加 /p PROC REG; MODEL y=x/P; RUN; PROC GPLOT ; PLOT 纵轴变量名 *横轴变量名; SYMBOL V=符号 CV=颜色 I=NONE 其他图形选项; RUN; 用 GPLOT过程作图 其中:符号 散点符号; I=NONE 散点间不连线; I=RL表示线性回归( RQ、 RC是二、三次回归) 64 PROC GPLOT; PLOT y*x; SYMBOL V=star I=RL CV=orange CI=blue; RUN; 其中: CV、 CL 分别表示点的符号和回归线的颜色 上例作 y关于 x的回归和散点图。程序如下: 65 66 6.3 曲线回归 例 3 苹果叶面积 y(cm2)生长量与前期间隔天数 x(d)的数 据如下表,求 x与 y的指数曲线回归方程。 x 0 5 10 15 20 25 30 y 5.7 43.7 76.7 102.3 183.4 225.1 344.2 其 SAS程序如下: DATA three;INPUT x y; yp=LOG(y); CARDS; 0 5.7 5 43.7 10 76.7 15 102.3 20 183.4 25 225.1 30 344.2 ; PROC REG; MODEL yp=x; RUN; 67 输出结果: 指数方程: y=e2.6594*e0.1175 x=14.2877e0.1175 x 68 在例 1中,建立 y与 x1,x2,x3,x4的多元线性回归方程。 (数据步) PROC REG; MODEL y=x1 x2 x3 x4; RUN; 6.4 多元线性回归 69 输出结果 70 采用逐步回归方法筛选自变量 ,建立 y与 x1,x2,x3,x4 的多元线性回归方程。程序如下: PROC REG; MODEL y=x1 x2 x3 x4/SELECTION=STEPWISE; RUN; 注意:在 REG过程中,可以有多个 MODEL语句。 71 引入、剔除变量显著性水平的选择 在 MODEL 语句中的选项 “ SELECTION=方法 ” 后 面加入选项。 1 引入变量显著性水平 STEPWISE法用: SLE=水平值,缺省值为 0.15. 2 剔除变量显著性水平 STEPWISE法用: SLS=水平值,缺省值为 0.15. 72 DATA hald; INPUT x1 x2 x3 x4 y; CARDS; 7 26 6 60 78.5 1 29 15 52 74.3 11 56 8 20 104.3 11 31 8 47 87.6 7 52 6 33 95.9 11 55 9 22 109.2 3 71 17 6 102.7 1 31 22 44 72.5 2 54 18 22 93.1 21 47 4 26 115.9 1 40 23 34 83.8 11 66 9 12 113.3 10 68 8 12 109.4 ; PROC REG; MODEL y=x1 x2 x3 x4/SELECTION=STEPWISE SLE=0.1 SLS=0.1; RUN; 73 逐步回归分析结果 74 75 76 7.1.1 离散型分布的检验 例 1 研究大豆蛋白质型类的遗传,蛋白质型类 A与蛋白 质型类 B杂交第一代( F1)为 AB,当 F1自交得 F2共分离 成 A型类为 24, AB型类为 35, B型类为 21,问这种现象 是否符合孟德尔 1: 2: 1的遗传分离定律。 7.1 适合性检验 第七章 非参数统计 解: SAS程序如下: 77 data ex1; input f$ y ; cards; A 24 AB 35 B 21 ; proc freq; weight y; tables f/nocum testp=(25 50 25); run; quit; 输出结果 : 78 7.1.2 连续型分布的检验 检验是否服从正态分布。 例 2 对 100名女生测定血清总蛋白含量 (g/L), 数据如下 : 74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.5 79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.0 75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.0 73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.5 75.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 70.4 68.0 70.4 72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.3 73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.7 67.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.7 75.8 73.5 75.0 73.5 73.5 73.5 72.7 81.6 70.3 74.3 73.5 79.5 70.4 76.5 72.7 77.2 84.3 75

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论