




已阅读5页,还剩36页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
基本统计(描述)过程,MEANS过程SUMMARY过程UNIVARIATE过程FREQ过程PLOT过程(略),集中趋势的描述指标,算术均数:适合单峰和基本对称的分布中位数:适用于任意分布类型截尾均数:数据中有极端值,用截尾均数更好几何均数:适用于原始数据分布不对称,但经过对数转换后呈对称分布的资料众数(Mode):样本数据中出现频次最大的那个数字调和均数(H):较少使用,观察值x倒数之均数的倒数,常用于完成的工作量相等而所用时间不同,求平均速度的情况,全距大体了解数据的分布范围,用于预备性检查方差和标准差适用于正态分布百分位数如中位数(P50)、四分位数(P25、P50、P75)四分位间距即P75-P25,适用于任意分布类型,不受极端值影响变异系数(CV)S/,适用于测量尺度相差太大或数据量纲不同时,比较两组数据离散程度的大小,离散趋势的描述指标,SAS默认的关键词(部分):,均数,方差,标准差,标准误,离均差平方和(SS),变异系数,一、MEANS过程,对计量资料进行统计描述主要可通过MEANS过程和SUMMARY过程实现。这两者功能大致相同,略有差异。MEANS过程没有输出中位数、四分位数和众数的功能,SUMMARY过程则没有输出偏度系数和峰度系数。,格式:PROCMEANS;主语句;分析变量;分组变量RUN;选择项:1、DATA=数据集名-用于指定分析数据集,否则,使用当前数据集2、统计量用于指定需要输出的统计量,包括:N,MEAN,STD,STDERR,MIN,MAX,SUM,CV,t,P等18个。说明:1.默认状态下则不分组计算所有的变量。3.默认状态下输出的统计量为N,MEAN,STD,MIN,MAX。,例2-110年间某医院因心肌梗塞死亡的病例数的数据如表2.1,试作分析。,表2.1某医院心肌梗塞死亡的病例数,程序21,dataex2_1;inputnoxyz;cards;154540502490463935154544450545475492463264854525749949178480452095664936105394927;procmeansmeanstdstderrcvminmax;varxyz;run;,procmeans后面的meanstdstdercvminmax称为选择项,它们分别表示要求计算和输出均数,标准差,标准误,变异系数,最小值和最大值。如procmeans后面的选择项全部缺省,则输出均数,标准差,最小值和最大值。Varxyz;表示所统计的变量是x,y和z。如var语句缺省,则统计所有的数值型变量。,输出结果见下图:,变异系数CV=S/MEAN*100%,例2-2:,变量:2个(分组变量,血压变量)观察:4个,程序2_2:Dataex2_2(drop=obs);dogroup=1to4;doobs=1to4;inputbp;output;end;end;Cards;14513515514012011512011811512012312410098105103;Procmeansnmeanstdstderrtprt;classgroup;Run;,调用MEANS过程,要求计算每组的样本量、均数、标准差、标准误及做单样本t检验输出t和相应的p值。,Class语句指定分组变量group,默认状态下的t检验,检验假设H0:=0t=(mean-)/se,结果如下:,二、SUMMARY过程,格式:PROCSUMMARY;主语句;分析变量;分组变量;RUN;SUMMARY过程的用法与MEANS基本相同。不同点在于:1、在选择项中,SUMMARY过程中可以用MEDIAN、QUARTILE、MODE来输出中位数、四分位数和众数。2、默认状态只输出n,在选择项中如缺少print,则不显示3、SUMMARY过程可以使用OUTPUT语句,把输出的结果存入一个数据集中。,程序2_3:Dataex2_2(drop=obs);dogroup=1to4;doobs=1to4;inputbp;output;end;end;Cards;14513515514012011512011811512012312410098105103;Procsummarynmeanstdmedianprint;classgroup;varbp;Run;,如缺少此选择项则不显示计算结果,三、univariate过程,在SAS软件BASE模块中的统计描述除了means和summary过程外,还可以用univariate过程对一个或多个变量进行更详细的统计描述。,格式:Procunivariate;;频数变量;分组变量;;,选择项说明:1、DATA=数据集名。指定分析的数据集,如缺省则分析当前数据集。2、统计量的选择用于指定需要输出的统计量,包括:NMEANSTDMEANMEDIALMODESKEWENSSKURYOSISNORMALP90P95RANGVARSTDSTDMEANMINMAXPLOT等统计量,其他语句说明:1、var语句:指定分析一个或多个变量,省略则分析指定数据集中所有变量。2、freq语句:指定一个频数变量。3、by语句:指定一个分组变量,用by语句指定的分组变量需用sort过程排序。4、outputout=语句:将计算的统计量输出到指定的数据集中。,例2-3观察了12名健康男子血液第一小时末红细胞沉降率分别为:3,9,8,6,5,5,7,3,10,8,10,4mm,试计算其均数。,程序2_4dataex2_4;inputx;cards;39865573108104;procunivariatedata=ex2_4normalplot;run;,指定分析ex2_4数据集,输出各类描述统计指标,正态性检验,输出百分位数Px,异常值分析,茎叶图和箱式图,表2.2100名健康女大学生血清总蛋白含量,例2_4如下面这个例子已经列成了频数分布表。在数据输入时应按变量值及频数分布读入数据。100名健康女大学生血清总蛋白含量(g/l)的频数分布表如表2-2所示,试作univariate分析:,程序2_5dataex2_5;inputxf;cards;6536756987111732575247710797816830851;procunivariatedata=ex2_5normalplot;varx;freqf;/*指定f为频数变量*/run;,对分析变量x做正态性检验及做图,程序中在input语句中读入x及f两个变量的数值,x为血清总蛋白含量的组中值,f为频数。Varx;说明分析变量为x,freqf;说明频数变量为f。例如,最前面的两个数字x=65,f=3说明有3个65。,部分输出结果:,基本统计量,t检验及秩和检验,输出百分位数Px,异常值分析,茎叶图,P75分位数,P50分位数,P25分位数,正态概率图(PP图),箱式图,例2_5某地13人接种疫苗后抗体滴度(稀释度)为1:20,1:20,1:40,1:40,1:40,1:80,1:80,1:80,1:80,1:80,1:80,1:160,1:320。试求其几何均数。几何均数的计算公式为:,程序2_6,dataex2_6;inputxf;y=log10(x);cards;20240380616013201;procmeans;freqf;vary;outputout=outmeanmean=logmean;procprintdata=outmean;datageomean;setoutmean;g=10*logmean;procprintdata=geomean;varg;run;,对变量x取对数,新变量名为y,调用means过程计算y的均数,将计算的结果输出到outmean数据集均数的变量名为logmean,创建一个新的数据集geomean取反对数,命名为g,首先建立数据集ex2_6。数据以频数分布表形式输入,x为变量值,f为频数。然后产生变量值x的常用对数的对数值y。用procmeans求y的均数,freqf;及vary;指定了频数变量为f及求均数的变量为y。至此我们已经可以求出y的均数。此均数必须再取反对数才能得到几何均数。由于SAS过程中没有直接求几何均数的程序,我们必须再对对数值的均数y取反对数。但如何对y取反对数却存在一个问题。因为计算反对数必须在建立数据集时进行。为此我们要另外建立一个包含均数y这个变量的数据集。,如果在means过程中加上以下语句:outputout=outmeanmean=logmean;就可以把means过程统计分析的结果放入数据集outmean。该数据集中包括y的均数放在变量logmean中。以下的print语句打印出此数据集,其中包括变量logmean,即y的均数。Procprintdata=outmean;Run;OBS_TYPE_FREQ_LOGMEAN10131.81047,由于要取反对数,必须另外建立数据步,为此又用数据步datageomean建立数据集goemean。该数据集通过调用已有的数据集outmean来建立。为此用set语句。Setoutmean;这时已从outmean数据集中得到数据。即可用outmean中的变量logmean求反对数来得到几何均数g,我们知道g=10*logmean,最后的结果不难得出。,Outmean数据集,几何均数,四、FREQ过程,分类变量的统计描述主要是计算率和构成比,常用的是FREQ过程。FREQ过程可以产生一维或多维频数表。,格式:PROCFREQ;TABLES/;WEIGHT;RUN;,TABLES语句中的选择项说明:1、out=数据集指定将频数表作为数据集输出3、每个单元格输出的内容,默认值为输出频数、行百分比、列百分比和总百分比。(norownocolnopercent等)2、对二维或多维表作假设检验(pearson卡方、分层卡方、精确概率检验等),例2_5以例2_4为例输出频数表程序2_7Procfreqdata=ex2_5;Tablesx;Weightf;Run;,频数表,指定权重变量,例2_6:抽样调查了某地120名18-35岁健康居民的血清铁蛋白含量(mol/L),结果如下:试编制频数表。7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52,程序2_7:Dataex2_7;INPUTx;gr=2;x0=gr*INT(x/gr)+gr/2;CARDS;7.428.6523.0221.6121.3121.469.9722.7314.9420.1821.6223.0720.388.4017.3229.6419.6921.6923.9017.4519.0820.5224.1423.7718.3623.0424.2224.1321.5311.0918.8918.2623.2917.6715.3818.6114.2717.4022.5517.5516.1017.9820.1321.0014.5619.8919.8217.4814.8918.3719.5017.0818.1226.0211.3413.8110.2515.9415.8318.5424.5219.2626.1316.9918.8918.4620.8717.5113.1211.7517.4021.3617.1413.7712.5020.4020.3019.3823.1112.6723.0224.3625.6119.5314.7714.3724.7512.7317.2519.0916.7917.1919.3219.5919.1215.3121.7519.4715.5110.8627.8121.6516.3220.7522.1113.1717.5519.2612.6518.4819.8323.1219.2219.2216.7227.9011.7424.6614.1816.52;Procfreqdata=ex2_7;Tablesx0/out=f1;Run;,例2:一个2*2表datat_2;dose
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 阜阳安全员c证考试题库及答案解析
- 航空装备安全题库及答案解析
- 猫的微课教学课件
- 劳动课洗杯子教学课件
- 工厂采购部工作总结与计划
- 员工奖惩管理办法
- 培训学校企业文化培训
- 运动时间和空间课件
- 甜甜的爱班本课程小班
- 动脉粥样硬化护理个案
- 建筑与小区海绵城市建设技术规范
- 中国腹腔镜胃癌根治手术质量控制专家共识
- 公司质量培训计划方案
- 离散数学概论第2版田秋红习题答案
- 2024年辽宁省成考(专升本)大学政治考试真题含解析
- 供应商审计培训课件
- 国家临床版3.0手术操作编码(ICD-9-CM3)
- 发展汉语初级综合1:第3课课件
- 2021人工智能训练师职业技能标准(职业编码:4-04-05-05)
- 第二十章-颅内和椎管内血管性疾病
- 质保金支付申请表
评论
0/150
提交评论