版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
SAS—统计分析系统StatisticalAnalysisSystem公共卫生学院信息数据处理教学实验室SAS—统计分析系统公共卫生学院信息数据处理教学实验室SAS软件简介1966年美国NorthCarolina大学的两位生物统计学研究生开始研制SAS系统,直至1976年成立了SAS软件研究所,正式推出了SAS软件,1985年推出微机版SAS。SAS是用于决策支持的大型集成信息系统,软件系统最早的功能限于统计分析,现在统计分析功能也仍是它的重要组成部分和核心功能。SAS现在的最新版本为9.0版,大小约为1GB。
SAS软件简介1966年美国NorthCarolina大学在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,并在96~97年度被评选为建立数据库的首选产品,堪称统计软件界的巨无霸。经过多年的发展,SAS已经被全世界120多个国家和地区的近三万家机构所采用,直接用户超过三百万人,遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系由于SAS系统是从大型机上的系统发展而来,在设计上也是完全针对专业用户进行设计,因此操作以SAS语言编程为主,另外也有非编程方式的菜单系统,但人机对话的界面不太友好。学习SAS软件时,需要用户有基本的统计学知识,对所选用的统计方法有较清楚的了解,没有统计学基础知识要掌握SAS软件较为困难。由于SAS系统是从大型机上的系统发展而来,在设计上也是完全针第一节SAS软件的使用基础一、SAS的启动和退出
启动SAS双击桌面SAS图标开始菜单程序TheSasSystemTheSasSystemforWindowsV*.*直接双击SAS应用程序退出SAS标题栏关闭按钮菜单栏FileExit在命令框键入“Bye”或“Endsas”第一节SAS软件的使用基础一、SAS的启动和退出标题栏、菜单栏、工具栏PROGRAMEDITOR程序编辑窗口LOG 运行过程日志窗口 OUTPUT结果输出窗口SAS常用功能键
三个窗口间切换F4RECALL(调回程序)F5PGM(程序)F8SUBMIT(发送程序)F6LOG(日志)F1HELP(帮助)F7OUTPUT(结果)F9KEYS(功能键列表)二、SAS的工作窗口标题栏、菜单栏、工具栏三个窗口间切换F4RECAL例:一组体检资料,包括姓名、性别、年龄、身高、体重,要求分性别计算身高、体重的均数、标准差、最大值、最小值。姓名性别年龄身高体重ZHANGLINF47156.347.1ZHAOHUAM38172.461.5WANGQANGM41169.264.5LIULIF52158.253.6SHIDONGF39160.148.0KONGYINGM29174.164.6LILINGF37152.342.2GUANFENM32166.260.2MIAOQINGM26180.374.3NIUHUAM31178.280.2TANGJIEF35169.260.8GAOJUNM24176.073.3SUNHONGF27158.349.9三、SAS程序构成例:一组体检资料,包括姓名、性别、年龄、身高、体重,要求分性DATAAA1;INPUTNAME$SEXAGEHEIGHTWEIGHT;CARDS;
ZHANGLIN247156.347.1ZHAOHUA138172.461.5WANGQANG141169.264.5LIULI252158.253.6SHIDONG239160.148.0KONGYING129174.164.6LILING237152.342.2GUANFEN132166.260.2MIAOQING126180.374.3NIUHUA131178.280.2TANGJIE235169.260.8GAOJUN224176.073.3SUNHONG227158.349.9
;PROCMEANS;CLASSSEX;VARHEIGHTWEIGHT;RUN;数据步过程步DATAAA1;数据步过程步DATASTEP(数据步)以DATA语句开始将数据读入SAS系统,建立SAS数据集PROCEDURESTEP(过程步)以PROC语句开始调用各种已编好的过程处理和分析数据RUN
(结束)
整个程序的最后必须要有RUN语句结束,表示要执行以上全部任务。DATASTEP(数据步)1.必须在PGM窗口。SAS语句书写格式自由,每个语句以“;”结束,可以在一行中写几个语句或一个语句写在几行中,不区分字母大小写。
2.运行SAS程序工具栏执行按钮功能键“F8”(Submit
)菜单栏LocalsSubmit命令框键入“Submit”命令自动激活OUTPUT窗口,出现程序运行结果四、SAS程序编写、运行、调试、保存1.必须在PGM窗口。SAS语句书写格式自由,每个语句以“3.调试SAS程序
没出现结果窗口,或结果不理想时。激活LOG窗口(F6)查看运行过程及出错信息黑色文字:源程序及运行情况蓝色文字:程序运行情况说明信息红色文字:出错信息绿色文字:警告信息激活PGM窗口(F5)调回SAS程序(F4)修改错误后重新发送3.调试SAS程序4.保存SAS程序或其他窗口内容
激活相应窗口常用工具栏存盘按钮菜单栏FileSave(或Saveas)命令框输入File命令可以分别保存程序、运行结果、日志5.打开已保存的程序、结果等
只能在PGM窗口常用工具栏打开按钮菜单栏FileOpen命令框输入Include命令可打开以前保存的程序、运行结果、日志等文件及其他文本格式的文件。4.保存SAS程序或其他窗口内容激活相应窗口5.第二节SAS数据集SAS数据集(SASDataset)
数据值被安排在一个矩阵式的表格结构中每一行数据表示一个观测(Observation)每一列数据表示一个变量(Variable)变量命名:1~8个字符,第1个字符必须是字母,后面可以是字母、数字和下划线变量类型:数值型、字符型和日期时间型字符型变量名后加“$”表示,日期型:'16OCT98'
D,时间型:'9:25:30'T变量缺失值:用“.”表示第二节SAS数据集SAS数据集(SASDataset)一、SAS数据集的种类临时SAS数据集不保存,一旦退出SAS就消失。数据集名称为1个单词,如DATAAA;永久SAS数据集保存在用户指定的文件夹里。数据集名称为2个单词,中间用“.”分开,也称二级名,如DATANEW.AA;一、SAS数据集的种类临时SAS数据集
LIBNAMENEW‘D:\MYDATA’;DATANEW.AA;在数据集的二级名称NEW.AA中;第1个词NEW是库标记,代表用户指定的保存SAS数据文件的位置,前面要用LIBNAME语句指定它代表的文件夹和位置。第2个词AA是保存的SAS数据集的文件名。执行这个过程的结果将会在D:\MYDATA文件夹中产生1个永久SAS数据文件AA.SD2SD2是自动产生的SAS数据文件默认扩展名LIBNAMENEW‘D:\MYDATA’;二、创建SAS数据集
1.在PGM窗口创建数据集
DATAAA;命名将要创建的数据集名
INPUTX1-X4;描述数据集中的变量名
CARDS;
以下开始是数据247156.347.1138172.461.5……;数据结束
INPUTXY@@;连续读数据不换行INPUTNAME$AGE;字符型变量名加$二、创建SAS数据集1.在PGM窗口创建数据集2.在VIEWTABLE窗口创建数据集菜单栏GlobalsManageOpentables打开VIEWTABLE窗口直接输入数据保存数据:FileSave(或Saveas)在Tables右边框中输入数据集名称在Path右边框中选默认位置*:\sas\saswork\建立临时数据集用户指定位置可以建立永久数据集2.在VIEWTABLE窗口创建数据集菜单栏Globals3.用分析员模块创建数据集菜单栏GlobalsAnalyzeSta-tisticalAnalysis打开Analyze(分析员)窗口直接输入数据保存数据:FileSaveLibrary:库标记名(代表要保存文件的位置,选Work可以建临时数据集)TableName:数据集文件名Description:可以对文件进行描述3.用分析员模块创建数据集菜单栏Glob4.由其它类型数据文件转换成SAS数据集菜单栏Fileimport
SAS可以直接与下列格式文件互相转换dBASE/FoxBASEFile(*.dbf)Excel4.0/5.0File(*.xls)Lotus1/3/4File(*.wk1/3/4)DelimitedFile(*.*)空格分隔TabDelimitedFile(*.txt)制表符分隔CommaSeparatedVelues(*.csv)逗号分隔4.由其它类型数据文件转换成SAS数据集菜单栏
注意:VisualFoxpro的数据表(*.dbf)在VFP系统中通过菜单栏文件导出类型选dBASE、FoxBASE、Excel5.0、DelimitedFile均可以Excel97/2000/2002的文件(*.xls)在Excel系统中通过菜单栏文件另存为保存类型选Excel5.0/4.0(*.xls)或逗号分隔(*.csv)制表符分隔(*.txt)均可以Excel文件中要求第1行是变量名注意:另外:在写字板、记事簿、Word或Excel中的数据也可以直接采用复制、粘贴的方式,通过PGM窗口创建SAS数据集。通过菜单栏FileExport也可以把SAS数据集转换成相应的其它类型数据文件另外:5.从已有的SAS数据集中创建新数据集DATAA1(子集);SETAA(原数据集);(1)选择部分变量(列)保留部分变量:KEEPDATAA1;SETAA;KEEPX1X2;去掉部分变量:DROPDATAA1;SETAA;DROPX3X4;赋值新的变量Y=X3+X4;LY=LOG(Y);5.从已有的SAS数据集中创建新数据集DA常用SAS函数:LOG(x)以e为底的自然对数LOG10(x)以10为底的常用对数EXP(x)以e为底的反对数SQRT(x)平方根ABS(x)绝对值INT(x)取整数(不四舍五入)MOD(x,y)取x/y的余数SIN(x)正弦COS(x)余弦三角函数(x是弧度)TAN(x)正切常用SAS函数:(2)选择部分观测(行)
建子集语句:IFDATAA1;SETAA;IFSEX=1;DATAA1;SETAA;IFAGE>40;
IFX1^=3(不等于)IFSEX=1ANDAGE>60IFAGE>20ANDAGE<=40IFAGE<21ORAGE>40(2)选择部分观测(行)(3)数据集连接纵向连接A1DATAAA;SETA1A2;A2要求A1和A2中的变量相同A1中有10行,A2中有15行,则AA有25行。横向合并A1A2DATAAA;MERGEA1A2;BYNum;匹配合并时,要求A1和A2中必须有1个相同的变量,且排列顺序也相同,作为标识变量用BY语句指定。(3)数据集连接(4)数据集转置(行列互换)PROCTRANSPOSE;BYG;VARX1-X4;OBSX1X2X3123456789OBS_Name_Col1Col2Col3X1147X2258X3369选择项有:OUT=新数据集名(缺省按DATAn自动命名)PREFIX=新变量名前缀(缺省按Coln自动命名)NAME=为原变量名列命名(缺省自动命名为_Name_)(4)数据集转置(行列互换)OBSX1X2第三节统计描述一、定量资料的统计描述简单描述:MEANS过程输出样本含量、均数、标准差、最小值、最大值(N、Mean、StdDev、Minimum、Maximum)详细描述:UNIVARIATE过程输出更多指标:样本含量、均数、标准差、最小值、最大值、方差、标准误、中位数、四分位数间距、常用百分位数、众数、平方和、离均差平方和等,可以作正态性检验另外还显示原数据中的部分极端值第三节统计描述一、定量资料的统计描述PROCMEANS;CLASSSEX;
VARHEIGHTWEIGHT;RUN;CLASS指定分组变量(可以不写)VAR指定需要分析的变量(不写即分析全部变量)MAXDEC=n指定计算结果保留小数位数(默认2位)可加的选项有:标准误(StdErr)、方差(Var)、总和(Sum)、平方和(USS)、离均差平方和(CSS)、全距(Range)、变异系数(CV)、偏度系数(Skewness)、峰度系数(Kurtosis)、可信区间(CLM)等还可以计算总体均数=0的t检验(T、Prt)不加任何选项时,自动输出5项结果:N、Mean、StdDev、Minimum、MaximumMEANS过程PROCMEANS;CLASSSEX;MEAN频数表资料:X-f2.4-52.6-102.8-123.0-233.2-243.4-223.6-173.8-74.0-3DATAAA2;INPUTXF@@;CARDS;2.552.7102.9123.1233.3243.5223.7173.974.13;PROCMEANSNMEANSTDSTDERRCLM;VARX;FREQF;RUN;数据步中:X是组中值,F是频数过程步中:VARX;指定分析变量是XFREQF;指定F是频数频数表资料:X-f2.4-52.6-102.8-123计算几何均数滴度人数1:411:851:1661:3221:6471:128101:25641:5125合计40DATAAA3;INPUTXF@@;Y=LOG10(X);CARDS;41851663226471281025645125;PROCMEANS;VARY;FREQF;OUTPUTOUT=CMEAN=M;&DATAB2;SET
C;G=10**M;#PROCPRINTDATA=B2;VARG;*RUN;&输出临时数据集C,变量M=均数,#新建数据集B2,取自C,求反对数G=10M*输出过程步,输出几何均数G计算几何均数滴度人数1:411:851:1661PROCSORT;BYSEX;PROCUNIVARIATE;BYSEX;VARHEIGHTWEIGHT;RUN;BY指定分组变量(可以不写)SORT用BY之前必须先按分组变量排序加选项NORMAL
可以作正态性检验(W)
在已知资料不服从正态分布时或对资料的分布类型不确定时可以用UNIVARIATE过程作探索性分析。
UNIVARIATE过程PROCSORT;BYSEX;UNIVARIATE过Moments样本含量N7频数之和SumWgts7均数Mean53.55714ΣXSum374.9标准差StdDev10.46564方差Variance109.5295偏度系数Skewness1.246峰度系数Kurtosis1.376ΣX2USS20735.75CSS657.1771变异系数CV19.54106标准误StdMean3.955638μ=0的t检验T:Mean=013.53944Pr>|T|0.0001非0变量个数Num^=07>0变量个数Num>07符号检验M(Sign)3.5Pr>=|M|0.0156符号秩和检验SgnRank14Pr>=|S|0.0156正态性检验W:Normal0.900687Pr<W0.3488MomentsQuantiles(Def=5)P100100%Max73.3P9999%73.3P7575%Q360.8P9595%73.3M50%Med49.9P9090%73.3P2525%Q147.1P1010%42.2P00%Min42.2P55%42.2
P11%42.2全距Range31.1四分位数间距Q3-Q113.7众数Mode42.2
Quantiles(Def=5)极端值ExtremesLowestObsHighestObs
最小序号最大序号
42.2(4)48(3)47.1(1)49.9(7)48(3)53.6(2)49.9(7)60.8(5)53.6(2)73.3(6)极端值Extremes定量资料统计描述——非编程方式(分析员模块)(1)打开分析员窗口菜单栏GlobalsAnalyzeStatisticalAnalysis
(2)打开SAS数据集菜单栏FileOpen
bySASname(3)作简单统计分析菜单栏StatisticsDescriptiveSummaryStatistics在Analysis窗口选入要分析的变量在Classification窗口选入分组变量用Statistics可以选更多的统计分析结果用Variables可以对变量有更多的选择方式选OK完成定量资料统计描述——非编程方式(分析员模块)(1)打开分析二、定性资料统计描述FREQ过程可以产生频数表和n维列联表PROCFREQ;TABLESA;RUN;TABLES指定要分析的定性变量TABLESA产生一维频数表TABLESA*B产生二维列联表(A是行B是列)TABLESA*B*C产生三维列联表(A是分层,B是行,C是列)TABLESA*(BC)产生A*B、A*C两个二维表TABLESX1-X3产生X1、X2、X3三个一维表TABLES(X1-X4)*Y产生X1*YX2*YX3*YX4*Y四个二维表二、定性资料统计描述FREQ过程可以产生频数表和n如描述以下三个定性变量(258人)A文化程度(1=文盲2=初中以下3=高中4=大学)B工作强度(1=轻2=中3=重)C月收入(1=<3002=300-3=500-4=1000-)DATAAA4;INPUTABC@@;CARDS;323414413……;PROCFREQ;TABLESABC;PROCFREQ;TABLESA*B;PROCFREQ;TABLESA*B*C;PROCFREQ;TABLESA*(BC);RUN;如描述以下三个定性变量(258人)一维频数表
CumulativeCumulativeAFrequencyPercentFrequencyPercent频数构成比累计频数累计构成比27830.27830.238532.916363.249536.8258100.0一维频数表
二维频数表A=4Frequency|Percent|CRowPct|ColPct|1|2|3|4|Total---------+--------+---------+---------+--------+1|0|6|37|26|69B|0.00|6.32|38.95|27.37|72.63|0.00|8.70|53.62|37.68||.|75.00|67.27|81.25|---------+--------+---------+---------+--------+2|0|2|18|6|26|0.00|2.11|18.95|6.32|27.37|0.00|7.69|69.23|23.08||.|25.00|32.73|18.75|---------+--------+---------+---------+--------+Total085532950.008.4257.8933.68100.00
频数构成比行构成比列构成比二维频数表A=4定性资料统计描述——非编程方式(分析员模块)菜单栏GlobalsAnalyzeStatisticalAnalysis
菜单栏FileOpen
bySASname作一维频数表菜单栏StatisticsDescriptiveFreguencycounts把变量选入Frequencies窗口,OK作二维频数表菜单栏StatisticsTableAnalysis分别把变量选入Row、Column、Strata窗口,OK
用Tables可以选每个格中出现更多的结果定性资料统计描述——非编程方式(分析员模块)菜单栏三、定量资料频数表先用MEANS过程找出最大值和最小值MIN=2.5MAX=5.71RANGE=3.21确定组距(I=0.3)和第一组段的下限(L=2.5)然后用数据步分组赋值新的变量:Y=INT((X-L)/I)*I+L用FREQ过程作频数表:DATAAA;SETAA5;Y=INT((X-2.5)/0.3)*0.3+2.5;PROCFREQ;TABLESY;RUN;三、定量资料频数表先用MEANS过程找出最大值和最小值定量资料作直方图PROCGCHART;
VBARX/LEVELS=11SPACE=0;RUN;
GCHART过程作图VBAR作纵向条图;HBAR作横向条图常用选项有:LEVELS分组的数目WIDTH指定竖条的宽度,以字符宽度为单位SPACE指定竖条之间的距离,直方图=0MIDPOINTS=2.65TO5.65BY0.3指定组中值定量资料作直方图直方图——非编程方式(分析员模块)菜单栏GlobalsAnalyzeStatisticalAnalysis菜单栏FileOpen
bySASname菜单栏GraphsHistogram把变量选入Analysis窗口,OK
用Display可以增加更多的选项直方图——非编程方式(分析员模块)菜单栏Globa第四节定量资料假设检验一、样本均数与总体均数比较以往新生儿出生体重平均为3000g,某医院对产妇开展孕期保健指导后,测得15名新生儿出生体重如下,问开展孕期保健指导后对新生儿体重是否有影响?280034002900275030003100460039002350350026003700380029503200第四节定量资料假设检验一、样本均数与总体均数比较样本均数与总体均数比较用MEANS过程DATAAA6;INPUTX@@;Y=X-3000;CARDS;280034002900275030003100460039002350350026003700380029503200;PROCMEANSMEANSTDSTDERRTPRT;VARY;RUN;结果MeanStdDevStdErrorTProb>|T|236.67586.60151.461.560.1405P>0.05,不拒绝H0,尚不能认为开展孕期保健指导对新生儿体重有影响。样本均数与总体均数比较用MEANS过程DATAAA6;二、配对设计t检验为了比较新旧两个测声计的测定效果,随机选定10个场地,在每地同时用新旧两个测声计测量数据如下,问新旧两个测声计的测量结果是否不同?场地12345678910旧:87657495655563886154新:86667795605362855955二、配对设计t检验为了比较新旧两个测声计的测定效果,随机配对设计t检验用MEANS过程DATAAA7;INPUTX1X2@@;Y=X1-X2;CARDS;8786656674779595656055536362888561595455;PROCMEANSMEANSTDSTDERRTPRT;VARY;RUN;结果MeanStdDevStdErrorTProb>|T|0.902.280.721.250.2440P>0.05,不拒绝H0,尚不能认为新旧两个测声计的测定结果有差别。配对设计t检验用MEANS过程DATAAA7;INP三、两样本均数比较试比较克山病人与健康人的血磷值(mmol/L)是否不同?克山病人0.841.051.201.201.391.531.671.801.872.072.11健康人0.540.640.640.750.760.811.161.201.341.351.481.561.87三、两样本均数比较试比较克山病人与健康人的血磷值(mmol/两样本均数比较用TTEST过程DATAAA8;INPUTX@@;IF_N_>11THENG=1;ELSEG=0;CARDS;0.841.051.201.201.391.531.671.801.872.072.110.540.640.640.750.760.811.161.201.341.351.481.561.87;PROCTTEST;CLASSG;VARX;RUN;在TTEST过程中,分类变量G只能是两分类。两样本均数比较用TTEST过程DATAAA8;INPU条件语句IF–THEN/ELSEIF后面是条件的表达式,如果满足条件就执行THEN后面操作,否则(不满足条件),就执行ELSE后面的操作(ELSE可选)。IFX4=0THENX4=.;IFCJ<60THENS+1;IFX4>2ANDX5=1THENY=1;ELSEY=2;_N_是SAS数据步中自定义的变量,它的值表示观测的序号。IF_N_>11THENG=1;ELSEG=0;
也可用G=(_N_>11);赋值分组变量G:前11个观测G=0,超过11时G=1。条件语句IF–THEN/ELSEIF后面是条t检验结果(1)GNMeanStdDevStdError1111.520.42180.12722131.080.42210.1171(2)Variances方差TDFProb>|T|Unequal不齐2.523921.40.0196Equal齐2.523722.00.0193(3)ForH0:Variancesareequal,方差齐性检验
F'=1.00DF=(12,10)Prob>F'=1.00结论:P<0.05,拒绝H0,接受H1,可以认为两组人群血磷值不同,克山病人血磷值较高。t检验结果两大样本均数比较时,如只有均数标准差,而无原始数据时,无法直接调用SAS软件中的某个过程进行分析,只能在数据步中按照计算公式编写程序完成。调查健康人群红细胞数(1012/L)资料如下:男性360人,均数466.02,标准差57.46;女性255人,均数417.80,标准差29.10。试比较男女红细胞数有无差别?两大样本均数比较时,如只有均数标准差,而无原始数据时,无法直DATABB;INPUTN1X1S1N2X2S2;SE=SQRT(S1*S1/N1+S2*S2/N2);U=ABS(X1-X2)/SE;P1=1-PROBNORM(U);P=2*P1;U=ROUND(U,0.001);P=ROUND(P,0.00001);IFP<0.0001THENP=0.0001;FILEPRINT;PUT#2@10U=@25P=;CARDS;360466.0257.46255417.8029.10;RUN;DATABB;定量资料假设检验——非编程方式(分析员模块)菜单栏GlobalsAnalyzeStatisticalAnalysis
菜单栏FileOpen
bySASname(1)样本均数与总体均数比较菜单栏StatisticsHypothesisTastsOne-Samplet-testforMeans往Variable窗口选入变量,Mean窗口输入μ,OKμ和σ己知时可选One-Samplez-testforMeansMean窗口输入μ,StdDev窗口输入σ。定量资料假设检验——非编程方式(分析员模块)菜单栏(2)配对t检验菜单栏
StatisticsHypothesisTastsTwo-SamplePairedt-testforMeans
分别选入第一组和第二组变量,OK(3)两样本均数比较t检验菜单栏StatisticsHypothesisTastsTwo-Samplet-testforMeans往Dependent窗口选入要分析的变量往Group窗口选入分类变量,OK(2)配对t检验四、单因素方差分析用于完全随机设计(成组设计)资料例:比较三组人群载脂蛋白测定值有无差别?糖尿病IGT异常健康人85.796.0144.0105.2124.5117.0109.5105.1110.096.076.4109.0115.295.3103.095.3110.0123.0110.095.2127.0106.599.0121.0125.6120.0115.0100.0159.0111.0四、单因素方差分析用于完全随机设计(成组设计)资料糖尿病IG单因素方差分析用ANOVA过程DATAAA9;INPUTX@@;IF_N_<12THENG=1;ELSEIF_N_>20THENG=3;ELSEG=2;CARDS;85.7105.2109.596.0115.295.3……;PROCMEANS;CLASSG;VARX;PROCANOVA;CLASSG;MODELX=G;MEANSG/SNK;RUN;在SNK后面加HOVTEST可以作方差齐性检验单因素方差分析用ANOVA过程DATAAA9;INPUAnalysisofVarianceProcedureDependentVariable:XSourceDFSumofSquaresMeanSquareFValuePr>F变异来源自由度SSMSFPModel模型22384.025505051192.012752535.850.0077Error误差275497.83616162203.62356154Total总297881.86166667R-SquareR2
C.V.RootMSESy.xXMean0.30247012.9351914.26967279110.31666667SourceDFAnovaSSMeanSquareFValuePr>F变异来源自由度SSMSFPG组间22384.025505051192.012752535.850.0077P<0.01,拒绝H0,接受H1,可以认为三组人群载脂蛋白不同。AnalysisofVarianceProcedureStudent-Newman-Keulstestforvariable:X
均数间两两比较q检验(SNK法)Meanswiththesameletterarenotsignificantlydifferent.相同字母表示的均数无显著性差别SNKGroupingMeanNGA122.800103B105.455111BB102.38992第三组高于前两组,即健康人的载脂蛋白高于两组病人。Student-Newman-Keulstestfor单因素方差分析时,如只有各组的均数、标准差,而无原始数据时,无法直接调用SAS软件中的某个过程进行分析,只能在数据步中按照计算公式编写程序完成。例:研究不同季节人体肾上腺皮质3β-HSD活性变化季节NMeansStd春季420.780.13夏季400.690.22秋季320.680.14冬季360.580.20单因素方差分析时,如只有各组的均数、标准差,而无原始数据时,DATAAA;INPUTKXX@;DOI=1TOK;INPUTNXS@@;OUTPUT;SS1+(XX-X)*(XX-X)*N;SS2+S*S*(N-1);NN+N;END;SS1=SS1/(K-1);SS2=SS2/(NN-K);F=SS1/SS2;P=1-PROBF(F,K-1,NN-K);F=ROUND(F,0.001);P=ROUND(p,0.00001);IFP<0.0001THENP=0.0001;FILEPRINT;PUT#2@10F=@25P=;CARDS;40.6867(总均数)420.780.13400.690.22320.680.14360.580.20;RUN;DATAAA;INPUTKXX@;五、两因素方差分析用于随机区组设计(配伍组设计)资料例:取同品系同体重24只小鼠分为8组,每组3只小鼠来自同一窝,分别用A、B、C三种营养素喂养,问三周后所增体重有无差别。区组ABC150.158.264.5247.848.562.4353.153.858.6463.564.272.5571.268.479.3641.445.738.4761.953.051.2842.239.846.2五、两因素方差分析用于随机区组设计(配伍组设计)资料区组AB两因素方差分析用ANOVA过程DATAAA10;
DOI=1TO3;DOJ=1TO8;INPUTX@@;OUTPUT;
END;END;CARDS;50.147.853.163.571.241.461.942.258.248.553.864.268.445.753.039.864.562.458.672.579.338.451.246.2;PROCMEANS;CLASSI;VARX;PROCANOVA;CLASSIJ;MODELX=IJ;RUN;两因素方差分析用ANOVA过程DATAAA10;AnalysisofVarianceProcedureDependentVariable:XSourceDFSumofSquaresMeanSquareFValuePr>FModel模型92521.29375280.1437511.520.0001Error误差14340.5425024.32446Total总232861.83625R-Square
C.V.RootMSEXMean0.8810068.8605144.9319838155.6625
SourceDFAnovaSSMeanSquareFValuePr>FI处理间2144.917572.458752.980.0836J区组间72376.37625339.4823213.960.0001处理间P>0.05,不拒绝H0,尚不能认为三种营养素喂养小鼠增重有差别;区组间P<0.01,拒绝H0,接受H1,可以认为8组小鼠体重增加有差别。AnalysisofVarianceProcedure循环语句
在数据步的执行中反复地执行某一部分语句。DO循环变量=初值TO终值BY增值;END;增量=1时可省略。DATAB1;DATAB2;
DOI=1TO10;
DO
I=1TO10BY2;S+I;S+I;OUTPUT;OUTPUT;
END;
END;PROCPRINT;PROCPRINT;RUN;RUN;循环语句在数据步的执行中反复地执行某一部分语句。循环语句可以嵌套(多重循环)如打印乘法表:
1*1=1DATABB;2*1=22*2=4DOI=1TO9;3*1=33*2=63*3=9DOJ=1TOI;4*1=44*2=84*3=124*4=16X=I*J;5*1=55*2=105*3=15……OUTPUT;6*1=66*2=126*3=18……END;7*1=77*2=147*3=21……END;8*1=88*2=168*3=24……PROCPRINT;9*1=99*2=189*3=27……RUN;循环语句可以嵌套(多重循环)单因素方差分析的数据也可以用双重循环语句编写,在各组样本含量不等时,加缺失值“.”补满。糖尿病IGT异常健康人85.796.0144.0105.2124.5117.0109.5105.1110.096.076.4109.0115.295.3103.095.3110.0123.0110.095.2127.0106.599.0121.0125.6120.0115.0100.0159.0111.0DATABB;DOI=1TO11;DOJ=1TO3;INPUTX@@;OUTPUT;END;END;CARDS;85.796144105.2124.5117109.5105.11109676.4109115.295.310395.311012311095.2127106.599121125.6120115100.159111..;PROCANOVA;CLASSJ;MODELX=J;RUN;单因素方差分析的数据也可以用双重循环语句编写,在各组样本含量六、三因素方差分析用于拉丁方设计资料例:比较动物对不同药物和用药次序的反应拉丁方设计要求三因素水平数相同,因有四种药物A、B、C、D,故取4只动物,反复用药4次。动物编号用药次序1234ⅠA75B29C27D42ⅡB45D71A81C53ⅢC25A71D80B23ⅣD47C31B48A87六、三因素方差分析用于拉丁方设计资料动物用药次序1234ⅠADATAAA11;DOCX=1TO4;DODW=1TO4;INPUTYW$X@@;OUTPUT;END;END;CARDS;A75B29C27D42B45D71A81C53C25A71D80B23D47C31B48A87;PROCANOVA;CLASSCXDWYW;MODELX=CXDWYW;MEANSYW/SNK;RUN;DATAAA11;DependentVariable:XSourceDFSumofSquaresMeanSquareFValuePr>FModel96396.5625710.72924.020.0521Error61059.8750176.6458Total157456.4375R-SquareC.V.RootMSEXMean0.85785825.4674313.2908176352.1875SourceDFAnovaSSMeanSquareFValuePr>FCX3773.1875257.72921.460.3167DW3270.6875090.22920.510.6894YW35352.687501784.229210.100.0092四种药物之间P<0.01,拒绝H0,接受H1,可以认为动物对四种药物的反应不同,A>B、C。而动物之间和用药次序均无影响。DependentVariable:X七、析因试验设计的方差分析可以分析各因素之间的交互作用。例:用新、旧两法分别提取某食品中甲、乙两种化合物,观察回收率有无差别(包括方法间、化合物间及方法与化合物间交互作用)。新法(A1)旧法(A2)甲物(B1)乙物(B2)甲物(B1)乙物(B2)52845247488844644490405244882645合计188350162208七、析因试验设计的方差分析可以分析各因素之间的交互作用。新法DATAAA12;DOA=1TO2;DOB=1TO2;DOI=1TO4;INPUTX@@;OUTPUT;END;END;END;CARDS;52484444848890885244402647645245;PROCANOVA;CLASSAB;MODELX=ABA*B;RUN;DATAAA12;DependentVariable:XSourceDFSumofSquaresMeanSquareFValuePr>FModel35309.001769.6733.390.0001Error12636.0053.00Total155945.00R-SquareC.V.RootMSEXMean0.89301912.828397.2856.75SourceDFAnovaSSMeanSquareFValuePr>FA11764.001764.0033.280.0001B12704.002704.0051.020.0001A*B1841.00841.0015.870.0018不同方法、不同化合物间均有差别,且交互作用也有统计学意义。新法高于旧法,乙物高于甲物,以新法+乙物为最佳组合。DependentVariable:X八、交叉试验设计的方差分析研究新药催醒宁对麻醉剂的作用,将6只大鼠配成3对,随机决定每对中1只接受处理的顺序(催醒宁或生理盐水),等动物完全清醒3天后将实验组和对照组动物互换,同法重复试验一次。结果如下:(Y药物组D对照组)动物编号123456第1次Y15D31Y
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年澄江市教育体育系统公开招聘毕业生备考题库及参考答案详解一套
- 2026年丽水爱尔眼科招聘这些岗位在等你备考题库及完整答案详解
- 2025年图们市安置委培生招聘员额制工作人员备考题库完整参考答案详解
- 2026年韶山旅游发展集团招聘中层管理人员备考题库及一套答案详解
- 枞阳县投资发展有限公司2025年公开招聘工作人员备考题库及一套参考答案详解
- 2026年黄淮学院招聘高层次人才备考题库及答案详解(新)
- 2026年西安市灞桥区中医医院脑病科康复治疗师招聘备考题库及完整答案详解
- 云南大学附属医院开展2026年校园招聘的备考题库及答案详解一套
- 2026年成都市双流区公兴幼儿园招聘备考题库参考答案详解
- 2025年图们市事业单位公开招聘急需紧缺人员备考题库及答案详解(新)
- 2024年江苏省海洋知识竞赛备考试题库(含答案)
- 水电厂电气自动化监控系统功能分析
- 晋中学院机械设计制造及其自动化专业大一2018-2019学年机械制图与计算机绘图模拟题
- DB11T 381-2023 既有居住建筑节能改造技术规程
- 计算机应用数学基础 教学 作者 王学军 计算机应用数学课件 第10章 图论
- DF6205电能量采集装置用户手册-2
- 万科集团财务管理制度手册
- 零序CT验收专题知识专家讲座
- 水利水电工程建设参建各方安全生产职责
- 电梯整机安装质量检查记录
- 火力发电厂厂用电监控管理系统(ECMS)培训
评论
0/150
提交评论