




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
关于计数资料的统计推断,最为常用的是FREQ过程。FREQ过程可以用于两个目的:一是描述分析,产生频数表和列联表,可简洁地描述数据;二是统计推断,产生各种统计量,可分析变量间的关系。该过程主要由下列语句控制:PROCFREQTABLESrequest(s);WEIGHTvariable;该过程PROCFREQ语句是必需的,其它语句都是可选的。,3计数资料的统计推断,1,PPT学习交流,PROCFREQ;这里的options常用的有Data=SAS-data-set,指定输入数据集名,若省略,则用最近建立的数据集。,2,PPT学习交流,2.TABLESrequest(s);TABLES语句是该过程中非常重要的一条语句。在一个PROCFREQ过程中,可以有任意多个tables语句;如果没有tables语句,FREQ对数据集中的每个变量都生成一个单向频数表;如果tables语句没有任何说明选项(options),FREQ对tables语句中规定的变量的每个水平将计算频数、累计频数、占总频数的百分数及累计百分数。,3,PPT学习交流,在TABLES语句中,用request(s)指定制表要求。这里,可以是用*连接起来的一个变量或多个变量。在一个TABLES语句中可以给出任意多个制表要求。例如:。Tablesa;对指定变量a产生一个单向频数表;。Tablesa*b;产生以b为列、a为行的二维列联表;。Tablesa*b*c;产生以c列、b为行、a为分层的三维列联表。这里,按照a的不同取值形成b*c的不同列联表。Tablesa*(bc);等价于tablesa*ba*c;。Tables(ab)*(cd);等价于tablesa*ca*db*cb*d;。Tables(abc)*d;等价于tablesa*db*dc*d;,4,PPT学习交流,2)在TABLES语句的斜杠(/)后面可以使用如下选项:CHISQ:要求进行卡方检验(Chi-SquareTest)。Fisher:要求对大于22的表进行Fisher的精确检验;ALPHA=p:确定置信区间的水平是100(1-p)%的置信区间,默认p=0.05;ALL:要求所有由CHISQ、MEASURES和CMH选项给出的检验和度量;NOCOL、NOROW、NOPERCENT、NOFREQ最为常用的选项是CHISQ和FISHER。,5,PPT学习交流,3.WEIGHTvariable;通常每个观测对频数计数的贡献都是1,但当出现WEIGHT语句时,每个观测对频数计数的贡献为这个观测对应的权数变量的值。如果资料是最原始的形式,通常情况下不需要此语句;。如果资料是以频数的形式出现,则需要该语句。,Dataa;Inputrowcolf;Cards;1174125121562219;Run;,四格表资料,建立SAS数据集,行变量row,列变量col,行列交叉对应的频数f,6,PPT学习交流,rowcolFrequency|Percent|RowPct|ColPct|1|2|Total-+-+-+1|1|1|2|25.00|25.00|50.00|50.00|50.00|50.00|50.00|-+-+-+2|1|1|2|25.00|25.00|50.00|50.00|50.00|50.00|50.00|-+-+-+Total22450.0050.00100.00,rowcolFrequency|Percent|RowPct|ColPct|1|2|Total-+-+-+1|74|51|125|37.00|25.50|62.50|59.20|40.80|56.92|72.86|-+-+-+2|56|19|75|28.00|9.50|37.50|74.67|25.33|43.08|27.14|-+-+-+Total1307020065.0035.00100.00,Procfreqdata=a;Tablesrow*col;Weightf;Run;产生结果如下:,Procfreqdata=a;Tablesrow*col;Run;产生结果如下:,无weight语句,可见,有无weight语句对结果产生很大的差异,对于该资料,由于是频数资料,因此一定要加上weight语句。,7,PPT学习交流,例4-9:频数表的编制某年某地149名成人脉博资料(次/分)的测定数据如下:试作频数表。586468728181686372947965947983715875656868839168737256536070686560796273888070638373686765103746470947957537583586967867969817575745768687177709554686648757089104795971679577685960729777867787755583687557937456797266687961608579589768797271885471946860837480717152637378867084827261688894728475839681为了编制频数表并作频数分析,首先需要建立一个数据集,将所有的数据进行分组,然后在此基础上调用相应的SAS过程(FREQ过程)来达到我们的目的。下面给出相应的程序:,8,PPT学习交流,建立SAS数据集Dataex49;Inputx;Cards;586468728181686372947965947983715875656868839168737256536070686560796273888070638373686765103746470947957537583586967867969817575745768687177709554686648757089104795971679577685960729777867787755583687557937456797266687961608579589768797271885471946860837480717152637378867084827261688894728475839681;Run;,9,PPT学习交流,Dataex491;Setex49;grp=int(x-45)/5)*5+45;Run;,int()取整函数int(1.7)=1int(5.2)=5int(0.4)=0,确定起始分组和组距:组距:5,起始分组:45-50grp=int(x-45)/5)*5+45;语句将每一个脉搏值进行分组,例如脉搏82,被分入grp=int(82-45)/5)*5+45=int(7.4)*5+45=80,即80-85组内。,提示:该资料还可以用前面学过的格式实现频数分组。建立格式之后,在FREQ过程中对原始变量x应用分组格式即可。,利用表达式对数据进行分组,10,PPT学习交流,分组频数百分比累积频数累积百分比CumulativeCumulativeGrpFrequencyPercentFrequencyPercent-4510.6710.675053.3664.0355128.051812.0860138.723120.81652718.125838.93702919.468758.39752315.4411073.83801610.7412684.568596.0413590.609074.7014295.309553.3614798.6610021.34149100.00,Procfreqdata=ex491;Tablesgrp;Run;,对分组变量grp进行频数分析,产生以下结果:,11,PPT学习交流,Procgchartdata=ex491;/*调用gchart过程*/vbarx/space=0/*生成直方图,直条间无空隙*/midpoints=47.5to102.5by5;/*直条对应的组中值*/Run;,如果要将上面的频数表以频数图的形式表达出来,可以使用如下程序:,关于gchart过程,感兴趣的同学可以在SAS命令框里输入“helpgchart”并回车得到帮助。,12,PPT学习交流,13,PPT学习交流,例4-10.用抗凝剂与不用抗凝剂治疗急性心肌梗塞的疗效比较,结果如下表:,请比较两种治疗方法的生存情况是否相同?,14,PPT学习交流,DATAex410;INPUTg1g2f;CARDS;1174125121562219;,PROCFREQDATA=ex410;TABLESg1*g2/chisqFisher;WEIGHTf;RUN;,首先建立需要的SAS数据集,调用FREQ过程,g1*g2要求生成二维表,chisq选项要求做卡方检验,fisher选项要求做fisher精确检验(注意对于四格表该选项可以省略);由于是频数资料,因此加上weight语句并给出频数变量f。,15,PPT学习交流,g1(行变量)g2(列变量)Frequency|Percent|RowPct|ColPct|1|2|Total-+-+-+1|74|51|125|37.00|25.50|62.50|59.20|40.80|56.92|72.86|-+-+-+2|56|19|75|28.00|9.50|37.50|74.67|25.33|43.08|27.14|-+-+-+Total1307020065.0035.00100.00,频数百分比行百分比列百分比,每一个格子中四个数据的含义,16,PPT学习交流,StatisticsforTableofg1byg2统计量自由度统计量的值p值StatisticDFValueProb-Chi-Square14.92890.0264LikelihoodRatioChi-Square15.05290.0246ContinuityAdj.Chi-Square14.27250.0387Mantel-HaenszelChi-Square14.90430.0268PhiCoefficient-0.1570ContingencyCoefficient0.1551CramersV-0.1570,Chisq选项,Chi-Square:普通卡方检验LikelihoodRatioChi-Square:似然比卡方检验ContinuityAdj.Chi-Square:校正卡方检验Mantel-HaenszelChi-Square:Mantel-Haenszel卡方检验PhiCoefficient:Phi系数ContingencyCoefficient:残联系数CramersV:克莱姆系数,WARNING:25%ofthecellshaveexpectedcountslessthan5.Chi-Squaremaynotbeavalidtest.,如果有超过1/4格子的理论数小于5,SAS会打印警告。,17,PPT学习交流,Fisher精确检验FishersExactTest-Cell(1,1)Frequency(F)74Left-sidedPr=F0.9918TableProbability(P)0.0103Two-sidedPr=P0.032
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 肿瘤免疫治疗护理
- 2025年职业病培训
- 画册制作广告公司
- 写毕业论文遇到的困难
- 八年级数学教学论文
- 化工电气安装培训
- 常规超声检查配合规范
- 幼儿园老师幸福感培训
- 直播人事培训方案
- 幕墙加工培训课件模板
- 呼吸科肺炎护理查房
- 产科质量控制体系专题汇报
- 2025-2030年中国成人纸尿裤行业市场深度分析及发展前景与投资机会研究报告
- 2025-2030中国动物狂犬病疫苗行业发展现状及趋势前景分析报告
- 2025年云南省中考语文试卷真题
- 文具店创业计划书文具店创业准备计划书范文
- 2025年山西烟草专卖局考试题库带答案分析试卷及答案
- 银川永宁县社区工作者招聘笔试真题2024
- 浙江省强基联盟2024-2025学年高二下学期5月联考试题 物理 PDF版含解析
- 企业政策宣讲活动方案
- 自来水考试试题大题及答案
评论
0/150
提交评论