SAS — 统计分析系统.ppt_第1页
SAS — 统计分析系统.ppt_第2页
SAS — 统计分析系统.ppt_第3页
SAS — 统计分析系统.ppt_第4页
SAS — 统计分析系统.ppt_第5页
免费预览已结束,剩余118页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

SAS 统计分析系统StatisticalAnalysisSystem 公共卫生学院信息数据处理教学实验室 SAS软件简介 1966年美国NorthCarolina大学的两位生物统计学研究生开始研制SAS系统 直至1976年成立了SAS软件研究所 正式推出了SAS软件 1985年推出微机版SAS SAS是用于决策支持的大型集成信息系统 软件系统最早的功能限于统计分析 现在统计分析功能也仍是它的重要组成部分和核心功能 SAS现在的最新版本为9 0版 大小约为1GB 在数据处理和统计分析领域 SAS系统被誉为国际上的标准软件系统 并在96 97年度被评选为建立数据库的首选产品 堪称统计软件界的巨无霸 经过多年的发展 SAS已经被全世界120多个国家和地区的近三万家机构所采用 直接用户超过三百万人 遍及金融 医药卫生 生产 运输 通讯 政府和教育科研等领域 由于SAS系统是从大型机上的系统发展而来 在设计上也是完全针对专业用户进行设计 因此操作以SAS语言编程为主 另外也有非编程方式的菜单系统 但人机对话的界面不太友好 学习SAS软件时 需要用户有基本的统计学知识 对所选用的统计方法有较清楚的了解 没有统计学基础知识要掌握SAS软件较为困难 第一节SAS软件的使用基础 一 SAS的启动和退出启动SAS双击桌面SAS图标开始菜单程序TheSasSystemTheSasSystemforWindowsV 直接双击SAS应用程序退出SAS标题栏关闭按钮菜单栏FileExit在命令框键入 Bye 或 Endsas 标题栏 菜单栏 工具栏PROGRAMEDITOR程序编辑窗口LOG运行过程日志窗口OUTPUT结果输出窗口SAS常用功能键 二 SAS的工作窗口 例 一组体检资料 包括姓名 性别 年龄 身高 体重 要求分性别计算身高 体重的均数 标准差 最大值 最小值 姓名性别年龄身高体重ZHANGLINF47156 347 1ZHAOHUAM38172 461 5WANGQANGM41169 264 5LIULIF52158 253 6SHIDONGF39160 148 0KONGYINGM29174 164 6LILINGF37152 342 2GUANFENM32166 260 2MIAOQINGM26180 374 3NIUHUAM31178 280 2TANGJIEF35169 260 8GAOJUNM24176 073 3SUNHONGF27158 349 9 三 SAS程序构成 DATAAA1 INPUTNAME SEXAGEHEIGHTWEIGHT CARDS ZHANGLIN247156 347 1ZHAOHUA138172 461 5WANGQANG141169 264 5LIULI252158 253 6SHIDONG239160 148 0KONGYING129174 164 6LILING237152 342 2GUANFEN132166 260 2MIAOQING126180 374 3NIUHUA131178 280 2TANGJIE235169 260 8GAOJUN224176 073 3SUNHONG227158 349 9 PROCMEANS CLASSSEX VARHEIGHTWEIGHT RUN 数据步 过程步 DATASTEP 数据步 以DATA语句开始将数据读入SAS系统 建立SAS数据集PROCEDURESTEP 过程步 以PROC语句开始调用各种已编好的过程处理和分析数据RUN 结束 整个程序的最后必须要有RUN语句结束 表示要执行以上全部任务 1 必须在PGM窗口 SAS语句书写格式自由 每个语句以 结束 可以在一行中写几个语句或一个语句写在几行中 不区分字母大小写 2 运行SAS程序工具栏执行按钮功能键 F8 Submit 菜单栏LocalsSubmit命令框键入 Submit 命令自动激活OUTPUT窗口 出现程序运行结果 四 SAS程序编写 运行 调试 保存 3 调试SAS程序没出现结果窗口 或结果不理想时 激活LOG窗口 F6 查看运行过程及出错信息黑色文字 源程序及运行情况蓝色文字 程序运行情况说明信息红色文字 出错信息绿色文字 警告信息激活PGM窗口 F5 调回SAS程序 F4 修改错误后重新发送 4 保存SAS程序或其他窗口内容 激活相应窗口常用工具栏存盘按钮菜单栏FileSave 或Saveas 命令框输入File命令可以分别保存程序 运行结果 日志 5 打开已保存的程序 结果等只能在PGM窗口常用工具栏打开按钮菜单栏FileOpen命令框输入Include命令可打开以前保存的程序 运行结果 日志等文件及其他文本格式的文件 第二节SAS数据集 SAS数据集 SASDataset 数据值被安排在一个矩阵式的表格结构中每一行数据表示一个观测 Observation 每一列数据表示一个变量 Variable 变量命名 1 8个字符 第1个字符必须是字母 后面可以是字母 数字和下划线变量类型 数值型 字符型和日期时间型字符型变量名后加 表示 日期型 16OCT98 D 时间型 9 25 30 T变量缺失值 用 表示 一 SAS数据集的种类 临时SAS数据集不保存 一旦退出SAS就消失 数据集名称为1个单词 如DATAAA 永久SAS数据集保存在用户指定的文件夹里 数据集名称为2个单词 中间用 分开 也称二级名 如DATANEW AA LIBNAMENEW D MYDATA DATANEW AA 在数据集的二级名称NEW AA中 第1个词NEW是库标记 代表用户指定的保存SAS数据文件的位置 前面要用LIBNAME语句指定它代表的文件夹和位置 第2个词AA是保存的SAS数据集的文件名 执行这个过程的结果将会在D MYDATA文件夹中产生1个永久SAS数据文件AA SD2SD2是自动产生的SAS数据文件默认扩展名 二 创建SAS数据集 1 在PGM窗口创建数据集DATAAA 命名将要创建的数据集名INPUTX1 X4 描述数据集中的变量名CARDS 以下开始是数据247156 347 1138172 461 5 数据结束INPUTXY 连续读数据不换行INPUTNAME AGE 字符型变量名加 2 在VIEWTABLE窗口创建数据集 菜单栏GlobalsManageOpentables打开VIEWTABLE窗口直接输入数据保存数据 FileSave 或Saveas 在Tables右边框中输入数据集名称在Path右边框中选默认位置 sas saswork 建立临时数据集用户指定位置可以建立永久数据集 3 用分析员模块创建数据集 菜单栏GlobalsAnalyzeSta tisticalAnalysis打开Analyze 分析员 窗口直接输入数据保存数据 FileSaveLibrary 库标记名 代表要保存文件的位置 选Work可以建临时数据集 TableName 数据集文件名Description 可以对文件进行描述 4 由其它类型数据文件转换成SAS数据集 菜单栏FileimportSAS可以直接与下列格式文件互相转换dBASE FoxBASEFile dbf Excel4 0 5 0File xls Lotus1 3 4File wk1 3 4 DelimitedFile 空格分隔TabDelimitedFile txt 制表符分隔CommaSeparatedVelues csv 逗号分隔 注意 VisualFoxpro的数据表 dbf 在VFP系统中通过菜单栏文件导出类型选dBASE FoxBASE Excel5 0 DelimitedFile均可以Excel97 2000 2002的文件 xls 在Excel系统中通过菜单栏文件另存为保存类型选Excel5 0 4 0 xls 或逗号分隔 csv 制表符分隔 txt 均可以Excel文件中要求第1行是变量名 另外 在写字板 记事簿 Word或Excel中的数据也可以直接采用复制 粘贴的方式 通过PGM窗口创建SAS数据集 通过菜单栏FileExport也可以把SAS数据集转换成相应的其它类型数据文件 5 从已有的SAS数据集中创建新数据集 DATAA1 子集 SETAA 原数据集 1 选择部分变量 列 保留部分变量 KEEPDATAA1 SETAA KEEPX1X2 去掉部分变量 DROPDATAA1 SETAA DROPX3X4 赋值新的变量Y X3 X4 LY LOG Y 常用SAS函数 LOG x 以e为底的自然对数LOG10 x 以10为底的常用对数EXP x 以e为底的反对数SQRT x 平方根ABS x 绝对值INT x 取整数 不四舍五入 MOD x y 取x y的余数SIN x 正弦COS x 余弦三角函数 x是弧度 TAN x 正切 2 选择部分观测 行 建子集语句 IFDATAA1 SETAA IFSEX 1 DATAA1 SETAA IFAGE 40 IFX1 3 不等于 IFSEX 1ANDAGE 60IFAGE 20ANDAGE40 3 数据集连接纵向连接A1DATAAA SETA1A2 A2要求A1和A2中的变量相同A1中有10行 A2中有15行 则AA有25行 横向合并A1A2DATAAA MERGEA1A2 BYNum 匹配合并时 要求A1和A2中必须有1个相同的变量 且排列顺序也相同 作为标识变量用BY语句指定 4 数据集转置 行列互换 PROCTRANSPOSE BYG VARX1 X4 OBSX1X2X3123456789 OBS Name Col1Col2Col3X1147X2258X3369 选择项有 OUT 新数据集名 缺省按DATAn自动命名 PREFIX 新变量名前缀 缺省按Coln自动命名 NAME 为原变量名列命名 缺省自动命名为 Name 第三节统计描述 一 定量资料的统计描述简单描述 MEANS过程输出样本含量 均数 标准差 最小值 最大值 N Mean StdDev Minimum Maximum 详细描述 UNIVARIATE过程输出更多指标 样本含量 均数 标准差 最小值 最大值 方差 标准误 中位数 四分位数间距 常用百分位数 众数 平方和 离均差平方和等 可以作正态性检验另外还显示原数据中的部分极端值 PROCMEANS CLASSSEX VARHEIGHTWEIGHT RUN CLASS指定分组变量 可以不写 VAR指定需要分析的变量 不写即分析全部变量 MAXDEC n指定计算结果保留小数位数 默认2位 可加的选项有 标准误 StdErr 方差 Var 总和 Sum 平方和 USS 离均差平方和 CSS 全距 Range 变异系数 CV 偏度系数 Skewness 峰度系数 Kurtosis 可信区间 CLM 等还可以计算总体均数 0的t检验 T Prt 不加任何选项时 自动输出5项结果 N Mean StdDev Minimum Maximum MEANS过程 频数表资料 DATAAA2 INPUTXF CARDS 2 552 7102 9123 1233 3243 5223 7173 974 13 PROCMEANSNMEANSTDSTDERRCLM VARX FREQF RUN 数据步中 X是组中值 F是频数过程步中 VARX 指定分析变量是XFREQF 指定F是频数 计算几何均数 DATAAA3 INPUTXF Y LOG10 X CARDS 41851663226471281025645125 PROCMEANS VARY FREQF OUTPUTOUT CMEAN M 输出临时数据集C 变量M 均数 新建数据集B2 取自C 求反对数G 10M 输出过程步 输出几何均数G PROCSORT BYSEX PROCUNIVARIATE BYSEX VARHEIGHTWEIGHT RUN BY指定分组变量 可以不写 SORT用BY之前必须先按分组变量排序加选项NORMAL可以作正态性检验 W 在已知资料不服从正态分布时或对资料的分布类型不确定时可以用UNIVARIATE过程作探索性分析 UNIVARIATE过程 Moments样本含量N7频数之和SumWgts7均数Mean53 55714 XSum374 9标准差StdDev10 46564方差Variance109 5295偏度系数Skewness1 246峰度系数Kurtosis1 376 X2USS20735 75CSS657 1771变异系数CV19 54106标准误StdMean3 955638 0的t检验T Mean 013 53944Pr T 0 0001非0变量个数Num 07 0变量个数Num 07符号检验M Sign 3 5Pr M 0 0156符号秩和检验SgnRank14Pr S 0 0156正态性检验W Normal0 900687Pr W0 3488 Quantiles Def 5 P100100 Max73 3P9999 73 3P7575 Q360 8P9595 73 3M50 Med49 9P9090 73 3P2525 Q147 1P1010 42 2P00 Min42 2P55 42 2P11 42 2全距Range31 1四分位数间距Q3 Q113 7众数Mode42 2 极端值ExtremesLowestObsHighestObs最小序号最大序号42 2 4 48 3 47 1 1 49 9 7 48 3 53 6 2 49 9 7 60 8 5 53 6 2 73 3 6 定量资料统计描述 非编程方式 分析员模块 1 打开分析员窗口菜单栏GlobalsAnalyzeStatisticalAnalysis 2 打开SAS数据集菜单栏FileOpenbySASname 3 作简单统计分析菜单栏StatisticsDescriptiveSummaryStatistics在Analysis窗口选入要分析的变量在Classification窗口选入分组变量用Statistics可以选更多的统计分析结果用Variables可以对变量有更多的选择方式选OK完成 二 定性资料统计描述 FREQ过程可以产生频数表和n维列联表PROCFREQ TABLESA RUN TABLES指定要分析的定性变量TABLESA产生一维频数表TABLESA B产生二维列联表 A是行B是列 TABLESA B C产生三维列联表 A是分层 B是行 C是列 TABLESA BC 产生A B A C两个二维表TABLESX1 X3产生X1 X2 X3三个一维表TABLES X1 X4 Y产生X1 YX2 YX3 YX4 Y四个二维表 如描述以下三个定性变量 258人 A文化程度 1 文盲2 初中以下3 高中4 大学 B工作强度 1 轻2 中3 重 C月收入 1 3002 300 3 500 4 1000 DATAAA4 INPUTABC CARDS 323414413 PROCFREQ TABLESABC PROCFREQ TABLESA B PROCFREQ TABLESA B C PROCFREQ TABLESA BC RUN 一维频数表CumulativeCumulativeAFrequencyPercentFrequencyPercent频数构成比累计频数累计构成比27830 27830 238532 916363 249536 8258100 0 二维频数表A 4Frequency Percent CRowPct ColPct 1 2 3 4 Total 1 0 6 37 26 69B 0 00 6 32 38 95 27 37 72 63 0 00 8 70 53 62 37 68 75 00 67 27 81 25 2 0 2 18 6 26 0 00 2 11 18 95 6 32 27 37 0 00 7 69 69 23 23 08 25 00 32 73 18 75 Total085532950 008 4257 8933 68100 00 频数构成比行构成比列构成比 定性资料统计描述 非编程方式 分析员模块 菜单栏GlobalsAnalyzeStatisticalAnalysis菜单栏FileOpenbySASname作一维频数表菜单栏StatisticsDescriptiveFreguencycounts把变量选入Frequencies窗口 OK作二维频数表菜单栏StatisticsTableAnalysis分别把变量选入Row Column Strata窗口 OK用Tables可以选每个格中出现更多的结果 三 定量资料频数表 先用MEANS过程找出最大值和最小值MIN 2 5MAX 5 71RANGE 3 21确定组距 I 0 3 和第一组段的下限 L 2 5 然后用数据步分组赋值新的变量 Y INT X L I I L用FREQ过程作频数表 DATAAA SETAA5 Y INT X 2 5 0 3 0 3 2 5 PROCFREQ TABLESY RUN 定量资料作直方图PROCGCHART VBARX LEVELS 11SPACE 0 RUN GCHART过程作图VBAR作纵向条图 HBAR作横向条图常用选项有 LEVELS分组的数目WIDTH指定竖条的宽度 以字符宽度为单位SPACE指定竖条之间的距离 直方图 0MIDPOINTS 2 65TO5 65BY0 3指定组中值 直方图 非编程方式 分析员模块 菜单栏GlobalsAnalyzeStatisticalAnalysis菜单栏FileOpenbySASname菜单栏GraphsHistogram把变量选入Analysis窗口 OK用Display可以增加更多的选项 第四节定量资料假设检验 一 样本均数与总体均数比较以往新生儿出生体重平均为3000g 某医院对产妇开展孕期保健指导后 测得15名新生儿出生体重如下 问开展孕期保健指导后对新生儿体重是否有影响 280034002900275030003100460039002350350026003700380029503200 样本均数与总体均数比较用MEANS过程 DATAAA6 INPUTX Y X 3000 CARDS 280034002900275030003100460039002350350026003700380029503200 PROCMEANSMEANSTDSTDERRTPRT VARY RUN 结果MeanStdDevStdErrorTProb T 236 67586 60151 461 560 1405P 0 05 不拒绝H0 尚不能认为开展孕期保健指导对新生儿体重有影响 二 配对设计t检验 为了比较新旧两个测声计的测定效果 随机选定10个场地 在每地同时用新旧两个测声计测量数据如下 问新旧两个测声计的测量结果是否不同 场地12345678910旧 87657495655563886154新 86667795605362855955 配对设计t检验用MEANS过程 DATAAA7 INPUTX1X2 Y X1 X2 CARDS 8786656674779595656055536362888561595455 PROCMEANSMEANSTDSTDERRTPRT VARY RUN 结果MeanStdDevStdErrorTProb T 0 902 280 721 250 2440P 0 05 不拒绝H0 尚不能认为新旧两个测声计的测定结果有差别 三 两样本均数比较 试比较克山病人与健康人的血磷值 mmol L 是否不同 克山病人0 841 051 201 201 391 531 671 801 872 072 11健康人0 540 640 640 750 760 811 161 201 341 351 481 561 87 两样本均数比较用TTEST过程 DATAAA8 INPUTX IF N 11THENG 1 ELSEG 0 CARDS 0 841 051 201 201 391 531 671 801 872 072 110 540 640 640 750 760 811 161 201 341 351 481 561 87 PROCTTEST CLASSG VARX RUN 在TTEST过程中 分类变量G只能是两分类 条件语句IF THEN ELSE IF后面是条件的表达式 如果满足条件就执行THEN后面操作 否则 不满足条件 就执行ELSE后面的操作 ELSE可选 IFX4 0THENX4 IFCJ2ANDX5 1THENY 1 ELSEY 2 N 是SAS数据步中自定义的变量 它的值表示观测的序号 IF N 11THENG 1 ELSEG 0 也可用G N 11 赋值分组变量G 前11个观测G 0 超过11时G 1 t检验结果 1 GNMeanStdDevStdError1111 520 42180 12722131 080 42210 1171 2 Variances方差TDFProb T Unequal不齐2 523921 40 0196Equal齐2 523722 00 0193 3 ForH0 Variancesareequal 方差齐性检验F 1 00DF 12 10 Prob F 1 00结论 P 0 05 拒绝H0 接受H1 可以认为两组人群血磷值不同 克山病人血磷值较高 两大样本均数比较时 如只有均数标准差 而无原始数据时 无法直接调用SAS软件中的某个过程进行分析 只能在数据步中按照计算公式编写程序完成 调查健康人群红细胞数 1012 L 资料如下 男性360人 均数466 02 标准差57 46 女性255人 均数417 80 标准差29 10 试比较男女红细胞数有无差别 DATABB INPUTN1X1S1N2X2S2 SE SQRT S1 S1 N1 S2 S2 N2 U ABS X1 X2 SE P1 1 PROBNORM U P 2 P1 U ROUND U 0 001 P ROUND P 0 00001 IFP 0 0001THENP 0 0001 FILEPRINT PUT 2 10U 25P CARDS 360466 0257 46255417 8029 10 RUN 定量资料假设检验 非编程方式 分析员模块 菜单栏GlobalsAnalyzeStatisticalAnalysis菜单栏FileOpenbySASname 1 样本均数与总体均数比较菜单栏StatisticsHypothesisTastsOne Samplet testforMeans往Variable窗口选入变量 Mean窗口输入 OK 和 己知时可选One Samplez testforMeansMean窗口输入 StdDev窗口输入 2 配对t检验菜单栏StatisticsHypothesisTastsTwo SamplePairedt testforMeans分别选入第一组和第二组变量 OK 3 两样本均数比较t检验菜单栏StatisticsHypothesisTastsTwo Samplet testforMeans往Dependent窗口选入要分析的变量往Group窗口选入分类变量 OK 四 单因素方差分析 用于完全随机设计 成组设计 资料例 比较三组人群载脂蛋白测定值有无差别 单因素方差分析用ANOVA过程 DATAAA9 INPUTX IF N 20THENG 3 ELSEG 2 CARDS 85 7105 2109 596 0115 295 3 PROCMEANS CLASSG VARX PROCANOVA CLASSG MODELX G MEANSG SNK RUN 在SNK后面加HOVTEST可以作方差齐性检验 AnalysisofVarianceProcedureDependentVariable XSourceDFSumofSquaresMeanSquareFValuePr F变异来源自由度SSMSFPModel模型22384 025505051192 012752535 850 0077Error误差275497 83616162203 62356154Total总297881 86166667R SquareR2C V RootMSESy xXMean0 30247012 9351914 26967279110 31666667SourceDFAnovaSSMeanSquareFValuePr F变异来源自由度SSMSFPG组间22384 025505051192 012752535 850 0077P 0 01 拒绝H0 接受H1 可以认为三组人群载脂蛋白不同 Student Newman Keulstestforvariable X均数间两两比较q检验 SNK法 Meanswiththesameletterarenotsignificantlydifferent 相同字母表示的均数无显著性差别SNKGroupingMeanNGA122 800103B105 455111BB102 38992第三组高于前两组 即健康人的载脂蛋白高于两组病人 单因素方差分析时 如只有各组的均数 标准差 而无原始数据时 无法直接调用SAS软件中的某个过程进行分析 只能在数据步中按照计算公式编写程序完成 例 研究不同季节人体肾上腺皮质3 HSD活性变化 DATAAA INPUTKXX DOI 1TOK INPUTNXS OUTPUT SS1 XX X XX X N SS2 S S N 1 NN N END SS1 SS1 K 1 SS2 SS2 NN K F SS1 SS2 P 1 PROBF F K 1 NN K F ROUND F 0 001 P ROUND p 0 00001 IFP 0 0001THENP 0 0001 FILEPRINT PUT 2 10F 25P CARDS 40 6867 总均数 420 780 13400 690 22320 680 14360 580 20 RUN 五 两因素方差分析 用于随机区组设计 配伍组设计 资料例 取同品系同体重24只小鼠分为8组 每组3只小鼠来自同一窝 分别用A B C三种营养素喂养 问三周后所增体重有无差别 两因素方差分析用ANOVA过程 DATAAA10 DOI 1TO3 DOJ 1TO8 INPUTX OUTPUT END END CARDS 50 147 853 163 571 241 461 942 258 248 553 864 268 445 753 039 864 562 458 672 579 338 451 246 2 PROCMEANS CLASSI VARX PROCANOVA CLASSIJ MODELX IJ RUN AnalysisofVarianceProcedureDependentVariable XSourceDFSumofSquaresMeanSquareFValuePr FModel模型92521 29375280 1437511 520 0001Error误差14340 5425024 32446Total总232861 83625R SquareC V RootMSEXMean0 8810068 8605144 9319838155 6625SourceDFAnovaSSMeanSquareFValuePr FI处理间2144 917572 458752 980 0836J区组间72376 37625339 4823213 960 0001处理间P 0 05 不拒绝H0 尚不能认为三种营养素喂养小鼠增重有差别 区组间P 0 01 拒绝H0 接受H1 可以认为8组小鼠体重增加有差别 循环语句 在数据步的执行中反复地执行某一部分语句 DO循环变量 初值TO终值BY增值 END 增量 1时可省略 DATAB1 DATAB2 DOI 1TO10 DOI 1TO10BY2 S I S I OUTPUT OUTPUT END END PROCPRINT PROCPRINT RUN RUN 循环语句可以嵌套 多重循环 如打印乘法表 1 1 1DATABB 2 1 22 2 4DOI 1TO9 3 1 33 2 63 3 9DOJ 1TOI 4 1 44 2 84 3 124 4 16X I J 5 1 55 2 105 3 15 OUTPUT 6 1 66 2 126 3 18 END 7 1 77 2 147 3 21 END 8 1 88 2 168 3 24 PROCPRINT 9 1 99 2 189 3 27 RUN 单因素方差分析的数据也可以用双重循环语句编写 在各组样本含量不等时 加缺失值 补满 DATABB DOI 1TO11 DOJ 1TO3 INPUTX OUTPUT END END CARDS 85 796144105 2124 5117109 5105 11109676 4109115 295 310395 311012311095 2127106 599121125 6120115100 159111 PROCANOVA CLASSJ MODELX J RUN 六 三因素方差分析 用于拉丁方设计资料例 比较动物对不同药物和用药次序的反应拉丁方设计要求三因素水平数相同 因有四种药物A B C D 故取4只动物 反复用药4次 DATAAA11 DOCX 1TO4 DODW 1TO4 INPUTYW X OUTPUT END END CARDS A75B29C27D42B45D71A81C53C25A71D80B23D47C31B48A87 PROCANOVA CLASSCXDWYW MODELX CXDWYW MEANSYW SNK RUN DependentVariable XSourceDFSumofSquaresMeanSquareFValuePr FModel96396 5625710 72924 020 0521Error61059 8750176 6458Total157456 4375R SquareC V RootMSEXMean0 85785825 4674313 2908176352 1875SourceDFAnovaSSMeanSquareFValuePr FCX3773 1875257 72921 460 3167DW3270 6875090 22920 510 6894YW35352 687501784 229210 100 0092四种药物之间PB C 而动物之间和用药次序均无影响 七 析因试验设计的方差分析 可以分析各因素之间的交互作用 例 用新 旧两法分别提取某食品中甲 乙两种化合物 观察回收率有无差别 包括方法间 化合物间及方法与化合物间交互作用 DATAAA12 DOA 1TO2 DOB 1TO2 DOI 1TO4 INPUTX OUTPUT END END END CARDS 52484444848890885244402647645245 PROCANOVA CLASSAB MODELX ABA B RUN DependentVariable XSourceDFSumofSquaresMeanSquareFValuePr FModel35309 001769 6733 390 0001Error12636 0053 00Total155945 00R SquareC V RootMSEXMean0 89301912 828397 2856 75SourceDFAnovaSSMeanSquareFValuePr FA11764 001764 0033 280 0001B12704 002704 0051 020 0001A B1841 00841 0015 870 0018不同方法 不同化合物间均有差别 且交互作用也有统计学意义 新法高于旧法 乙物高于甲物 以新法 乙物为最佳组合 八 交叉试验设计的方差分析 研究新药催醒宁对麻醉剂的作用 将6只大鼠配成3对 随机决定每对中1只接受处理的顺序 催醒宁或生理盐水 等动物完全清醒3天后将实验组和对照组动物互换 同法重复试验一次 结果如下 Y药物组D对照组 DATAAA13 DOCX 1TO2 DODW 1TO6 INPUTYW X OUTPUT END END CARDS Y15D31Y17D30D25Y5D27Y25D28Y14Y18D26 PROCANOVA CLASSCXDWYW MODELX CXDWYW RUN DependentVariable XSourceDFSumofSquaresMeanSquareFValuePr FModel7621 583388 79765 850 0535Error460 666715 1667Total11682 2500R SquareC V RootMSEXMean0 91107917 905473 894421 75SourceDFAnovaSSMeanSquareFValuePr FCX118 7518 751 240 3285DW5158 7531 752 090 2470YW1444 08444 0829 280 0057药物间P 0 01 拒绝H0 接受H1 可以认为实验组与对照组不同 催醒宁有效 方差分析 非编程方式 分析员模块 菜单栏GlobalsAnalyzeStatisticalAnalysis菜单栏FileOpenbySASname 1 单因素方差分析菜单栏StatisticsANOVAOne wayANOVA变量X选入Dependent窗口 分组G选入Independent窗口 2 两因素 三因素及交叉设计的方差分析菜单栏StatisticsANOVAFactorialANOVA变量X选入Dependent窗口 分组选入Independent窗口 需要作均数间两两比较时选Means 在ComparisonMathod窗口中选两两比较的方法 在MainEffacts窗口选中分组变量 AddOKOK析因设计的方差分析 交互作用分析选Model 在StandardModels窗口中选Two way 两因素 或Three way 三因素 第五节定性资料假设检验 一 样本率与总体率比较没有SAS过程可以直接调用 可以按照二项分布或Poisson分布的概率函数在数据步中编程计算 己知某药治愈率为60 某医生随机抽取10名病人试用此药加VC同服 结果有8人治愈 问加服VC是否有增效作用 该题己知 0 6 n 10 x 8 求n 8的概率 可以用二项分布函数PROBBNML n x DATABB Q PROBBNML 0 6 10 7 P 1 Q PROCPRINT RUN 结果 OBSQP10 832710 16729P 0 05 不拒绝H0 尚不能认为VC有增效作用 1 二项分布直接概率法 2 Poisson分布直接概率法 国家规定饮用水中大肠菌数平均不得超过3个 L 现从某水源地抽取水样1L测得大肠菌4个 问该水源是否符合饮用水条件 该资料服从Poisson分布 己知 3 求X 3的概率 可以用Poisson分布函数POISSON x 求得 DATABB Q POISSON 3 3 P 1 Q PROCPRINT RUN 结果 OBSQP10 647230 35277P 0 05 不拒绝H0 尚不能认为细菌数超标 3 大样本正态近似法 u检验 一般胃溃疡患者中有20 会发生胃出血症状 某医院观察65岁以上溃疡病人304例 有96人发生胃出血 问老年胃溃疡患者是否容易出血 己知 0 2 n 304 x 96 可以用u检验 DATABB INPUTPNX S SQRT P 1 P N U ABS X N P S P1 1 PROBNORM U P 2 P1 U ROUND U 0 001 P ROUND P 0 00001 IFP 0 0001THENP 0 0001 FILEPRINT PUT 2 10u 25P CARDS 0 230496 RUN 结果 u 5 047P 0 0001 二 样本率之间比较 2检验 用两种药物治疗十二肠溃疡疗效比较 DATABB DOI 1TO2 DOJ 1TO2 INPUTF OUTPUT END END CARDS 5484420 PROCFREQ TABLESI J CHISQ WEIGHTF RUN WEIGHT语句指明变量F是频数加选项EXACT可以对 2 2表作Fisher确切概率EXPECTED可以显示每个格子的理论值CMH可以计算队列研究和病例对照研究的RR值NOROW NOCUL NOPERCENT不显示相应百分数NOPRINT不显示表格 只显示计算的统计量 2检验用FREQ过程加CHISQ选项 STATISTICSFORTABLEOFIBYJStatistic统计量DFValueProbChi Square 216 1330 013LikelihoodRatioChi Square似然比 216 3040 012ContinuityAdj Chi Square校正 215 1180 024Mantel HaenszelChi SquareMH 216 0840 014Fisher sExactTest确切概率 Left 0 997 Right 0 011 2 Tail 0 018PhiCoefficient Phi系数 0 221ContingencyCoefficient 列联系数 0 215Cramer sV 克莱姆系数 0 221SampleSize 126 由原始数据计算 如258人资料 三个定性变量A文化程度 1 文盲2 初中以下3 高中4 大学 B工作强度 1 轻2 中3 重 C月收入 1 3002 300 3 500 4 1000 试分析文化程度与月收入之间的关系DATAAA4 INPUTABC CARDS 323414413 PROCFREQ TABLESA C CHISQ RUN 三 配对定性资料的 2检验 用甲乙两种血清学方法检查鼻咽癌患者血清410份 问两法的检出率有无差别 DATABB DOI 1TO2 DOJ 1TO2 INPUTF OUTPUT END END CARDS 261873131 PROCFREQ TABLESI J AGREE WEIGHTF RUN AGREE选项作定性资料的一致性检验 计算 2和Kappa统计量 Kappa0 75很满意 配对四格表资料计算McNemar s 2统计量配对R C表 方表 计算Bowker对称性检验QB统计量 QB近似服从DF R R 1 2的 2分布 当P 0 05 拒绝H0时 结论为不服从对称分布 结果 McNemar sTestStatistic 26 576DF 1Prob 0 001SimpleKappaCoefficient95 ConfidenceBoundsKappa 0 182ASE 0 0510 0830 281SampleSize 410P 0 01 拒绝H0 接受H1 可以认为甲 乙两法的检出率不同 甲法检出率高于乙法 Kappa值的假设检验 H0 Kappa 0u Kappa ASE 0 182 0 051 3 57P 0 01拒绝H0 接受H1 虽然可以认为甲 乙两法有一致性 但一致的程度很差 两种方法检查冠心病人心室壁收缩运动的符合情况 结果 TestofSymmetry 对称性检验 Statistic 2 856DF 3Prob 0 414KappaCoefficients 一致性检验 StatisticValueASE95 ConfidenceBoundsSimpleKappa0 6810 0500 5830 779WeightedKappa0 6610 0560 5520 771SampleSize 147对称性检验 P 0 05 不拒绝H0 认为该资料服从对称分布 一致性检验 u Kappa Ase 13 6 P 0 01 可以认为两种方法检查结果具有一致性 且一致性程度比较高 2检验 非编程方式 分析员模块 菜单栏GlobalsAnalyzeStatisticalAnalysis在右面窗口内输入3列数据 A列输入行变量 B列输入列变量代码 C列输入相应的频数 或打开己有的SAS数据集菜单栏StatisticsTableAnalysis把变量A选入Row B选入Column C选入Cellcounts 打开Statistics窗口Chi sqareStatistics计算 2统计量Measuresofassociation计算行列变量的关联性统计量Mantel HaenszelStatistics队列研究和病例对照研究RR值MeasuresofAgreement一致性检验选中所要的项目OKOK 第六节秩和检验 1 配对设计资料UNIVARIATE过程可以作符号检验和符号秩和检验例 8名男性服某药前后精液中精子浓度 万 ml 变化 DATAAA14 INPUTX1X2 D X1 X2 CARDS 60006602200056005900370044005000600063006500120026000180058002200 PROCUNIVARIATE VARD RUN MomentsN8SumWgts8Mean7017 5Sum56140StdDev8746 372Variance76499021Skewness1 39594Kurtosis1 066563USS9 2946E8CSS5 3549E8CV124 6366StdMean3092 309T Mean 02 26934Pr T 0 0575Num 08Num 06M Sign 符号检验2Pr M 0 2891SgnRank符号秩和检验15Pr S 0 0391 2 成组设计资料 成组设计资料秩和检验用NPAR1WAY过程两组比较时 可作Wilcoxon法计算u值多组比较时 可作Kruskal Wallis法计算 2值例 试比较两组工人的血铅值有无差别 铅作业组 0 820 870 971 211 642 082 13非铅作业组 0 240 240 290 330 440 580 630 720 871 01 DATAAA15 INPUTX G N 8 CARDS 0 820 870 971 211 642 082 130 240 240 290 330 440 580 630 720 871 01 PROCNPAR1WAYWILCOXON CLASSG VARX RUN 加选项ANOVA可以同时作方差分析MEDIAN可以作中位数检验 WilcoxonScores RankSums forVariableXClassifiedbyVariableGSumofExpectedStdDevMeanGNScoresUnderH0UnderH0Score秩和理论秩和标准差平均秩和1793 563 010 2313 3601059 590 0

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论